Ejercicio 3.2: Imputación de datos perdidos (simple)
Con la misma base de datos del ejercicio 3.1, realiza la imputación de todas las variables siguiendo los siguientes pasos
Las variables definidas como MCAR con <5% de datos faltantes, ¿Cómo las imputarías? Ejecútalo.
Realiza la imputación de las variables MAR/MNAR sabiendo los siguiente:
La variable
hours_study_weekestá relacionada congpayexam_score, pero sus datos NA están sompletos sólo para la variableexam_score. Lo puedes comprobar con:
ggplot(data = data, aes (x = hours_study_week , y =gpa )) + geom_miss_point() ggplot(data = data, aes (x = hours_study_week , y =exam_score )) + geom_miss_point() vis_miss(select(data,hours_study_week,gpa,exam_score),cluster=TRUE) + theme(axis.text.x = element_text(angle = 90))La variable
exam_scoreestá relacionada congpayhours_study_week, pero sus datos NA están sompletos sólo para la variablehours_study_week. Comprueba esta afirmación y realiza la imputación que consideres.La variable
attendance_pctestá relacionada congpayexam_score, pero sus datos NA están completos sólo para la variableexam_score. Comprueba esta afirmación y realiza la imputación que consideres.La variable
gpaestá relacionada conhours_study_weekyexam_score, pero sus datos NA no están completos para ninguna de esas dos variables. ¿Qué harías? Realiza la imputación que consideres
Last updated