Tarea2 Analisis de Datos
Tarea2 Analisis de Datos
Tarea2 Analisis de Datos
Informe Académico
1. Cuadro Sinóptico
Figura 1
Primera ventana de Bienvenida Knime
2
Figura 2
Creando Proyecto, Definición Nombre
Figura 3
Carga Datos Train ( estos son los datos descargados de Dataset de Titanic
Figura 4
Carga de datos de Test (Dataset)
Figura 5
Incluir Nodo Concatenar Train - Test
Figura 6
Nodo Duplicate Row Filter
Nota: Imagen de Software Knime-Licencia 2024 – Quitamos los datos Duplicados limpiando la data-Selecionamos que variables incluir o excluir
6
Figura 7
Nodo Missing Value
Nota: Imagen de Software Knime-Licencia 2024 – En esta imagen podemos ver ciertos signos en rojo son valores faltantes para ello debemos
aplicar el nodo missing value para determinar estos valores faltantes
Figura 8
Nodo Missing Value Aplicado
Desarrollo de Actividad
Nota: Imagen de Software Knime-Licencia 2024 – Nodo Aplicado Box Plot Evidencia de atipicos
Una vez procesado el nodo de valores atípicos no enseña que los valores atípicos están en (Age)
edad, Numero de Hermanos (SibSp) y Numero de Padres (Parch)
Excluida (tarifa embarque)
Box plot valores atípicos (edad,sibsp(numero de hermanas) parch (numero de padres)
valores incorrectos (valores por edad mayores de 150 ejemplo)
8
Figura 2
Elección de Variable a eliminar datos atípicos
Nota: Imagen de Software Knime-Licencia 2024 – Nodo Aplicado Box Plot Evidencia de atipicos
Una vez aplicado el nodo tenemos como resultante sin valores atípicos excluyendo Age, sibSp, Parch
9
Figura 1
Nodo Statics
En este escogeremos una variable para hallar medidas de tendencia central (media, mediana, moda)
y medidas de dispersión (varianza y desviación estándar). Incluir gráficos de barras, histogramas,
gráficos de dispersión podemos excluir las variables o incluirlas
Variable (Age)
o Histograma
Figura 1
Histograma
Figura 2
Histograma
Figura 1
Nodo Scatter Plot Observamos que encontramos relación de las variables entre el
ticket y los id de los pasajeros
Figura 2
Nodo Scatter Plot -Variable Sex y Age
Figura 3
Nodo Scatter Plot -Variable Sex y Age
Figura 4
Nodo Scatter Plot – Sobrevivientes -Edad
Edad – Ticket (No podemos determinar en las variables edad y ticket ninguna relación
Figura 5
Nodo Scatter Plot -Edad y Ticket
Figura 6
Menu Bar Chart -Selecion de variables y exclusión
Figura 7
Menu Bar Chart - Survived – Class y Age.Grafica
Referencias Bibliográficas
https://bibliotecavirtual.unad.edu.co/login?url=https://search.ebscohost.com/login.aspx?
direct=true&db=nlebk&AN=2600876&lang=es&site=eds-
live&scope=site&ebv=EB&ppid=pp_I Cap 1 y 2
David Julian. (2016). Designing Machine Learning Systems with Python. Packt Publishing.
https://bibliotecavirtual.unad.edu.co/login?url=https://search.ebscohost.com/login.aspx?
direct=true&db=nlebk&AN=1218065&lang=es&site=eds-
live&scope=site&ebv=EB&ppid=pp_Cover. Cap 3
Educación a Distancia.
https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48460 Cap 2, 3 y 4