Tarea2 Analisis de Datos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 18

1

Informe Académico

1. Cuadro Sinóptico

1. Después de realizar la respetiva instalación del Software https://www.knime.com/ y


descargar la dataset https://www.kaggle.com/datasets/rahulsah06/titanic . Iniciamos con la
creación de nuestro Proyecto

Figura 1
Primera ventana de Bienvenida Knime
2

Nota: Imagen de Software Knime-Licencia 2024

Figura 2
Creando Proyecto, Definición Nombre

Nota: Imagen de Software Knime-Licencia 2024


3

Figura 3
Carga Datos Train ( estos son los datos descargados de Dataset de Titanic

Nota: Imagen de Software Knime-Licencia 2024


4

Figura 4
Carga de datos de Test (Dataset)

Nota: Imagen de Software Knime-Licencia 2024


5

Figura 5
Incluir Nodo Concatenar Train - Test

Nota: Imagen de Software Knime-Licencia 2024

Figura 6
Nodo Duplicate Row Filter

Nota: Imagen de Software Knime-Licencia 2024 – Quitamos los datos Duplicados limpiando la data-Selecionamos que variables incluir o excluir
6

Figura 7
Nodo Missing Value

Nota: Imagen de Software Knime-Licencia 2024 – En esta imagen podemos ver ciertos signos en rojo son valores faltantes para ello debemos
aplicar el nodo missing value para determinar estos valores faltantes

Figura 8
Nodo Missing Value Aplicado

Nota: Imagen de Software Knime-Licencia 2024 – Nodo Aplicado


7

Desarrollo de Actividad

1. Paso Eliminación de valores atípicos


Figura 1
Box Plot

Nota: Imagen de Software Knime-Licencia 2024 – Nodo Aplicado Box Plot Evidencia de atipicos

Una vez procesado el nodo de valores atípicos no enseña que los valores atípicos están en (Age)
edad, Numero de Hermanos (SibSp) y Numero de Padres (Parch)
 Excluida (tarifa embarque)
 Box plot valores atípicos (edad,sibsp(numero de hermanas) parch (numero de padres)
valores incorrectos (valores por edad mayores de 150 ejemplo)
8

Figura 2
Elección de Variable a eliminar datos atípicos

Nota: Imagen de Software Knime-Licencia 2024 – Nodo Aplicado Box Plot Evidencia de atipicos

Una vez aplicado el nodo tenemos como resultante sin valores atípicos excluyendo Age, sibSp, Parch
9

2. Paso Análisis univariante

Figura 1
Nodo Statics

Nota: Imagen de Software Knime-Licencia 2024 –

En este escogeremos una variable para hallar medidas de tendencia central (media, mediana, moda)
y medidas de dispersión (varianza y desviación estándar). Incluir gráficos de barras, histogramas,
gráficos de dispersión podemos excluir las variables o incluirlas

 Variable (Age)
o Histograma
Figura 1
Histograma

Nota: Imagen de Software Knime-Licencia 2024


10

Figura 2
Histograma

Nota: Imagen de Software Knime-Licencia 2024


11

o Medidas de Tendencia central y Medidas de Dispersión


Figura 1
Medidas de Tendencia central y Medidas de Dispersión

Nota: Imagen de Software Knime-Licencia 2024


12

3. Paso Análisis bivariante y multivariante

o Interacion entre Variable PassengerID – Ticket

Figura 1
Nodo Scatter Plot Observamos que encontramos relación de las variables entre el
ticket y los id de los pasajeros

Nota: Imagen de Software Knime-Licencia 2024


13

o Sexo – Edad (Variable relación a la edad de acuerdo al Sexo Femenino o Masculino )

Figura 2
Nodo Scatter Plot -Variable Sex y Age

Nota: Imagen de Software Knime-Licencia 2024


14

o Edad – Clase Observamos la relación de dependencia de la edad con la clase que se


encontraban registradas, el punto mas alto es la edad de 80 años en Clase 1

Figura 3
Nodo Scatter Plot -Variable Sex y Age

Nota: Imagen de Software Knime-Licencia 2024


15

o Relación Edad Sobrevivientes (Podemos observar en la grafica que en promedio 1


persona por edad fue Sobreviente, la edad mas alta fue 80 años

Figura 4
Nodo Scatter Plot – Sobrevivientes -Edad

Nota: Imagen de Software Knime-Licencia 2024


16

 Edad – Ticket (No podemos determinar en las variables edad y ticket ninguna relación

Figura 5
Nodo Scatter Plot -Edad y Ticket

Nota: Imagen de Software Knime-Licencia 2024


17

 Promedio de Survived – Class y Age Usando Nodo Bar Chart

Figura 6
Menu Bar Chart -Selecion de variables y exclusión

Nota: Imagen de Software Knime-Licencia 2024

Figura 7
Menu Bar Chart - Survived – Class y Age.Grafica

Nota: Imagen de Software Knime-Licencia 2024


18

Referencias Bibliográficas

Carlos Véliz. (2020). Aprendizaje automático. Introducción al aprendizaje profundo. El Fondo

Editorial de la Pontificia Universidad Católica del Perú.

https://bibliotecavirtual.unad.edu.co/login?url=https://search.ebscohost.com/login.aspx?

direct=true&db=nlebk&AN=2600876&lang=es&site=eds-

live&scope=site&ebv=EB&ppid=pp_I Cap 1 y 2

David Julian. (2016). Designing Machine Learning Systems with Python. Packt Publishing.

https://bibliotecavirtual.unad.edu.co/login?url=https://search.ebscohost.com/login.aspx?

direct=true&db=nlebk&AN=1218065&lang=es&site=eds-

live&scope=site&ebv=EB&ppid=pp_Cover. Cap 3

Garriga Trillo, A. J. (2009). Introducción al análisis de datos. UNED - Universidad Nacional de

Educación a Distancia.

https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48460 Cap 2, 3 y 4

También podría gustarte