Estudio y Depuración de Datos
  • Declaración de autoría
  • Tema 1: Análisis Exploratorio de Datos
    • Tipos de variables
      • Ejercicio: Tipos de Datos
        • Resultados
    • Codificación y Transformación
      • Ejercicio: Codificación y Transformación
        • Resultados
    • Descriptivos, Gráficos y Tablas
      • Ejercicio: Gráficos y Tablas
        • Resultados
    • Ejemplo de un análisis descriptivo básico para detectar errores e incongruencias
    • PRACTICA 1
      • Resultados
  • Tema 2: Control de integridad de los datos
    • Introducción a los datos atípicos
      • Ejercicios
        • Resultados
    • Detección y tratamiento de datos atípicos (univariante)
    • Detección y tratamiento de datos atípicos (bivariante)
      • Ejercicio I
        • Resultados
    • Detección de datos atípicos y su tratamiento (automatización)
      • Ejercicio I - automatización
        • Resultados
    • Detección y tratamiento de datos atípicos (multivariante)
      • Ejercicio II
        • Resultados
    • Detección y tratamiento de duplicados
      • Ejercicio
        • Reusltados
    • Ejemplo de detección y tratamiento de atípicos y duplicados
      • Resultados
    • PRACTICA 2
      • Resultados
  • Tema 3: Valores Perdidos
    • Detección de datos perdidos
      • Ejercicios
    • Tratamiento de datos perdidos (Imputación Simple)
      • Ejercicio - Epidemia Ébola
        • Resultados
      • Ejercicio - Tipos de datos missing
        • Resultados
    • Tratamiento de datos perdidos (Imputación Múltiple con MICE)
      • Ejercicio - MICE
        • Resultados
    • PRACTICA 3
      • Resultados
    • PRÁCTICA GRUPAL
  • Bibliografía
    • 📚Bibliografía
Powered by GitBook
On this page
  1. Tema 1: Análisis Exploratorio de Datos
  2. Codificación y Transformación

Ejercicio: Codificación y Transformación

PreviousCodificación y TransformaciónNextResultados

Last updated 4 months ago

En la base de datos estres.csv se incluye información sobre los niveles de estrés de un grupo de trabajadores y trabajadoras, así como otras variables de interés.

Lo primero, genera un documento quarto:

Recuerda ponerle bien la cabecera

Después lee el fichero

datos<-read.csv("estres.csv", header = T, sep = "\t")

Realiza las siguientes actividades en R:

  1. Clasifica las variables en cuantitativas y cualitativas

  2. Examina la estructura de los datos (str) ¿Cómo son los tipos de variables? ¿Cambiarías alguna?

  3. ¿Hay algún NA? Utiliza any(is.na(datos))

  4. ¿Qué ID tiene la persona con mejor sueldo? Utiliza which()

  5. ¿Cuántos trabajadores tienen un nivel de estrés mayor de 5? Utiliza length()

  6. ¿Cuántos trabajadores tienen estrés mayor de 5 y además una carga física > 3?

  7. Nos hemos equivocado en la introducción de datos y para todos los valores 2 de carga física, queríamos haber puesto un 3. Recodifica esta variable incluyendo este cambio. Recuerda recodificar en una nueva variable. Utiliza if_else()del paquete dplyr

  8. Crea una nueva variable llamada expo_total que se obtenga como suma de los valores de exposición en carga física, carga psíquica y ruido.

  9. Categoriza la variable estres en otra nueva variable que llamaremos estres_grupo que incluya tres categorías: bajo: 1 a 2; medio: 3 a 7; alto; 8 a 10. ¿Cuántas personas hay en cada categoría de la nueva variable. Utiliza cut() y breaks()

  10. Gurda la base de datos corregida. Usa write.csv() y llamala estres_corregido.csv

5KB
estres.csv