Detección de datos atípicos y su tratamiento (automatización)
Si tenemos que comprobar varias variables de una misma base de datos podermos pensar en automatizar el proceso mediante el uso de alguna función propia.
Y para usarla sería como una función cualquiera de R:
source("Outliers.R")outliers("data$Pressure_height")# Aplicar la función a múltiples variables numéricas o enterasnumeric_integer_vars <-names(which(sapply(data, is.numeric) |sapply(data, is.integer)))outliers_results <-lapply(paste0("data$", numeric_integer_vars), outliers)
Piensa cuidadosamente si quitar o no los datos atípicos de tu base de datos. Un dato atípico no es un dato que se va de la media sino un dato que realmente es incorrecto.