馃搳
Depuraci贸n de Datos - TFG Estadistica
  • Declaraci贸n de autor铆a
  • Tema 1: An谩lisis Exploratorio de Datos
    • Tipos de variables
      • Ejercicios
    • Codificaci贸n y Transformaci贸n
      • Ejercicios
    • Gr谩ficos y Tablas
      • Ejercicios
    • Ejemplo de un an谩lisis descriptivo b谩sico para detectar errores e incongruencias
  • Tema 2: Control de integridad de los datos
    • Detecci贸n y tratamiento de datos at铆picos
      • Ejercicios
    • Detecci贸n de datos at铆picos y su tratamiento (automatizaci贸n)
    • Detecci贸n y tratamiento de duplicados
    • Ejercicios
    • Ejemplo de detecci贸n y tratamiento de at铆picos y duplicados
    • Detecci贸n de datos at铆picos de forma Multivariante
  • Tema 3: Valores perdidos
    • Detecci贸n de datos perdidos
    • Tratamiento de datos perdidos
    • PRACTICA 3
  • Tema 4: Evaluaci贸n de las hip贸tesis de partida para el an谩lisis de datos
    • Pruebas de Normalidad
      • Ejercicios
  • Bibliograf铆a
    • 馃摎Bibliograf铆a
Powered by GitBook
On this page
  1. Tema 2: Control de integridad de los datos
  2. Detecci贸n y tratamiento de datos at铆picos

Ejercicios

Con los siguientes datos de la base de datos implementada en R cars:

cars_original <- cars[1:30, ]  # original data
outliers <- data.frame(speed=c(19,19,20,20,20), dist=c(190, 186, 210, 220, 218))  # introduce outliers.
cars_outliers <- rbind(cars_original, outliers)  # data with outliers.

Ajusta una recta de regresi贸n para los datos originales y los datos despu茅s de introducir los outliers para explicar la distancia (variable dist) con la velocidad (variable speed) y demuestra las diferencias mediante un gr谩fico.

PreviousDetecci贸n y tratamiento de datos at铆picosNextDetecci贸n de datos at铆picos y su tratamiento (automatizaci贸n)