Estudio y Depuración de Datos
  • Declaración de autoría
  • Tema 1: Análisis Exploratorio de Datos
    • Tipos de variables
      • Ejercicio: Tipos de Datos
        • Resultados
    • Codificación y Transformación
      • Ejercicio: Codificación y Transformación
        • Resultados
    • Descriptivos, Gráficos y Tablas
      • Ejercicio: Gráficos y Tablas
        • Resultados
    • Ejemplo de un análisis descriptivo básico para detectar errores e incongruencias
    • PRACTICA 1
      • Resultados
  • Tema 2: Control de integridad de los datos
    • Introducción a los datos atípicos
      • Ejercicios
        • Resultados
    • Detección y tratamiento de datos atípicos (univariante)
    • Detección y tratamiento de datos atípicos (bivariante)
      • Ejercicio I
        • Resultados
    • Detección de datos atípicos y su tratamiento (automatización)
      • Ejercicio I - automatización
        • Resultados
    • Detección y tratamiento de datos atípicos (multivariante)
      • Ejercicio II
        • Resultados
    • Detección y tratamiento de duplicados
      • Ejercicio
        • Reusltados
    • Ejemplo de detección y tratamiento de atípicos y duplicados
      • Resultados
    • PRACTICA 2
      • Resultados
  • Tema 3: Valores Perdidos
    • Detección de datos perdidos
      • Ejercicios
    • Tratamiento de datos perdidos (Imputación Simple)
      • Ejercicio - Epidemia Ébola
        • Resultados
      • Ejercicio - Tipos de datos missing
        • Resultados
    • Tratamiento de datos perdidos (Imputación Múltiple con MICE)
      • Ejercicio - MICE
        • Resultados
    • PRACTICA 3
      • Resultados
    • PRÁCTICA GRUPAL
  • Bibliografía
    • 📚Bibliografía
Powered by GitBook
On this page
  1. Tema 3: Valores Perdidos
  2. Tratamiento de datos perdidos (Imputación Múltiple con MICE)

Ejercicio - MICE

PreviousTratamiento de datos perdidos (Imputación Múltiple con MICE)NextResultados

Last updated 1 month ago

La siguiente base de datos perteneciente al paquete mice nhanes contine 25 observaciones y 4 variables:age group (3 categorías) , body mass index, hypertension (1:No, 2: Sí) y cholesterol (mg/dL).

#Carga la base de datos
library(mice)
data<-nhanes

Realiza los siguientes pasos:

  1. Inspecciona si las variables están bien declaradas

  2. Inspecciona si las variables numéricas tienen datos atípicos

  3. Visualiza y cuantifica los datos missing. ¿Qué observas?

  4. Inspecciona el patrón de datos missing. ¿Qué observas? ¿Cuántas observaciones hay con todos las variables missing? ¿Y con 3 de las 4 variables?

  5. Haz una imputación múltiple para rellenar los datos missing, después:

    1. ¿Qué métodos has usado para cada variable?

    2. Guarda los datos completos de alguna de las bases de datos imputadas

    3. Visualiza las imputaciones. ¿Cómo visualizarías la variable cualitativa?

  6. Ajusta un modelo de regresión lineal para predecir el colesterol en función de las demás variables y calcula el R2R^2R2. Comenta los resultados.