Ejercicio - Tipos de datos missing
Last updated
Last updated
Estos datos ejemplifican un escenario en donde se seleccionan candidatos a un empleo, y los candidatos completan un test de IQ, durante su entrevista de trabajo y posteriormente un supervisor evalua su rendimiento después de un periodo de 6 meses. En el ejemplo hay 4 columnas de Rendimiento, una que sería la completa y otras tres que se han borrado los datos considerando los 3 tipos de datos missing que hemos estudiado (MCAR, MAR, MNAR).
Averigua a qué columna corresponde los datos MCAR, MAR y MNAR y explica por qué. Después cambia el nombre de las columnas por Rendimiento_MCAR, Rendimiento_MAR y Rendimiento_MNAR
.
Compara la media entre las 3 variables de Rendimiento_MCAR, Rendimiento_MAR y Rendimiento_MNAR
con Rendimiento_completo
. ¿Qué observas?
Si calculamos los coeficientes de correlación y una regresión simple de cada una de las 3 variables Rendimiento_MCAR, Rendimiento_MAR y Rendimiento_MNAR
para predecir el IQ
. ¿Qué diferencias observas en comparación con Rendimiento_completo
?
Haz un gráfico para ver como se ajusta la recta de regresión en cada uno de los casos.
Imputa por la media y por el modelo de regresión simple las tres variables rendimiento y compara los resultados.