Ejercicios
Con la misma base de datos ozone
de R comprueba si el resto de variables tienen datos atípicos
data <- read.csv("ozone.csv") # import data
Estudio Univariante
boxplot(data$Pressure_height)
###Los valores atípicos son:
outlier_values <- boxplot.stats(data$Pressure_height)$out # outlier values.
out_ind <- which(data$Pressure_height %in% c(outlier_values))
###Los valores extremos son:
extreme_values <- boxplot.stats(data$Pressure_height,coef=3)$out # extreme values.
ext_ind <- which(data$Pressure_height %in% c(extreme_values))
Estudio Bivariante
par(mfrow=c(1, 2))
boxplot(data$Pressure_height ~ data$Month, main="Pressure Height across months")
boxplot(data$Pressure_height ~ data$Day_of_week, main="Pressure Height for days of week")
dev.off()
Función outliers()
La función propia outliers()
proporciona datos atípicos, modifica la función para detectar datos extremos y aplícala a las distintas variables de la base de datos ozone
, luego piensa que harías
PreviousDetección y tratamiento de duplicadosNextEjemplo de detección y tratamiento de atípicos y duplicados
Last updated