
Ejemplo de detección y tratamiento de atípicos y duplicados
datos<-read.csv("CEREALES.csv")
str(datos)
summary(datos)
##Convertimos VARIEDAD en factor
datos$VARIEDAD<-factor(datos$VARIEDAD)
str(datos)
table(datos$VARIEDAD)boxplot(datos)


datos<-read.csv("CEREALES.csv")
str(datos)
summary(datos)
##Convertimos VARIEDAD en factor
datos$VARIEDAD<-factor(datos$VARIEDAD)
str(datos)
table(datos$VARIEDAD)boxplot(datos)

par(mfrow=c(1, 2))
boxplot(datos$MANGANESO,main="MANGANESO")
boxplot(datos$MANGANESO~datos$VARIEDAD,main="MANGANESO~VARIEDAD")
dev.off()
##Primero lo comprobamos
extreme_values <- boxplot.stats(datos$MANGANESO,coef=3)$out
ext_ind <- which(datos$MANGANESO %in% c(extreme_values))
extreme_values
##Después con la función propia outliers (con la definición de extremo) los borramos
outliers("datos$MANGANESO")
summary(datos$MANGANESO)