Ejercicios

Con la misma base de datos ozone de R comprueba si el resto de variables tienen datos atípicos

data <- read.csv("ozone.csv")  # import data

Estudio Univariante

boxplot(data$Pressure_height)

###Los valores atípicos son:

outlier_values <- boxplot.stats(data$Pressure_height)$out  # outlier values.

out_ind <- which(data$Pressure_height %in% c(outlier_values))



###Los valores extremos son:
extreme_values <- boxplot.stats(data$Pressure_height,coef=3)$out  # extreme values.

ext_ind <- which(data$Pressure_height %in% c(extreme_values))

Estudio Bivariante

par(mfrow=c(1, 2))
boxplot(data$Pressure_height ~ data$Month, main="Pressure Height across months") 

boxplot(data$Pressure_height ~ data$Day_of_week, main="Pressure Height for days of week")  

dev.off()

Función outliers()

La función propia outliers() proporciona datos atípicos, modifica la función para detectar datos extremos y aplícala a las distintas variables de la base de datos ozone, luego piensa que harías

Last updated