¡Te damos la bienvenida a Scribd!

0% encontró este documento útil (0 votos)

12 vistas

00 Presentación

Cargado por

Este capítulo introduce Pandas, una herramienta fundamental para el preprocesamiento de datos en Python. Explica que el preprocesamiento de datos, como la limpieza de datos, es una actividad importante antes del machine learning. También cubre NumPy, Matplotlib y la metodología de ciencia de datos.

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

00 Presentación

Cargado por

jorge alarcon

0% encontró este documento útil (0 votos)

12 vistas17 páginas

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

0% encontró este documento útil (0 votos)

12 vistas17 páginas

00 Presentación

Cargado por

jorge alarcon

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

Saltar a página

Está en la página 1de 17

Buscar dentro del documento

PYTHON FUNDAMENTALS

FOR DATA SCIENCE

Capítulo 4: Preprocesamiento de datos en Python
OBJETIVOS
• Utilizar la librería Pandas.
• Aplicar el preprocesamiento de datos, previo a llevar a cabo
actividades de machine learning.
AGENDA
1. El Data Scientist.
2. Metodología Data Science.
3. NumPy.
4. Pandas.
5. Matplotlib.
1. EL DATA SCIENTIST
- Es sexy ser un Científico de Datos -
1. EL DATA SCIENTIST
- Competencias de un Científico de Datos -
1. EL DATA SCIENTIST
- Existen muchos Roles -

Fuente: kdnuggets
1. EL DATA SCIENTIST
- Sueldos Promedio (EEUU) -

Fuente: kdnuggets
2. METODOLOGÍA DATA SCIENCE

Fuente: Kaldero (2018). Data Science for Executives.

3. NUMPY
•Una de las librerías principales de Data Science en
Python.

•Prerrequisito para Pandas.

•Procesamiento de datos y operaciones de algebra lineal.

• Array
• Matrices
4. PANDAS

•Fundamental para la •Construido encima de

exploración de datos. NumPy.

•Soporte para diversas •Se crea una especie de hoja

de cálculo en memoria
fuentes de datos.
llamada DataFrame.

Tareas:
- Limpieza de datos.
- Ingeniería de datos.
- Aplicar funciones a los datos.
- Creación de otras estructuras.
5. MATPLOTLIB
• Fundamental para la visualización de Produce los siguientes tipos de
datos gráficos:
• Integración con Pandas y otras librerías
como Seaborn • Líneas
• Barras
• Histogramas
• Scatterplot
• Piechart
• Boxplots
LABORATORIO Nº 1: PANDAS
Al finalizar el laboratorio, el alumno logrará:

• Aplicar los fundamentos de NumPy.

• Aplicar los fundamentos de Pandas.
LABORATORIO Nº 2: TITANIC
Al finalizar el laboratorio, el alumno logrará:

• Analizar la exploración de datos.

• Aplicar limpieza de datos.
• Aplicar transformaciones de datos.
• Aplicar estadísticas a los datos.
• Aplicar visualizaciones de datos.
TAREA Nº 5: PANDAS
• Resolver los ejercicios en el Notebook Jupyter compartido.
• Enviar por Notebook Jupyter al correo del instructor.
RESUMEN
En este capítulo, usted aprendió:

• Que Pandas es una herramienta fundamental para diversas tareas de

preprocesamiento de datos, como lo es la limpieza de datos.
• Que el preprocesamiento de datos supone una actividad importante
previa al machine learning.
BIBLIOGRAFÍA
• Python. Python for beginners.
https://www.python.org/doc/

• Scikit-learn. Biblioteca de aprendizaje automático.

https://scikit-learn.org/stable/

• TensorFlow. Crea modelos de aprendizaje automático.

https://www.tensorflow.org/?hl=es-419

• Kaggle. Comunidad de científicos de datos del aprendizaje automático.

https://www.kaggle.com/

También podría gustarte

Machine Learning Con Python Aprendizaje Supervisado
Documento114 páginas
Machine Learning Con Python Aprendizaje Supervisado
kaiser key
100% (1)
Ansión, Juan - El Árbol y El Bosque en La Sociedad Andina
Documento124 páginas
Ansión, Juan - El Árbol y El Bosque en La Sociedad Andina
GariGalindo
Aún no hay calificaciones
Programación Con Python para El Tratamiento de Los Datos
Documento4 páginas
Programación Con Python para El Tratamiento de Los Datos
gino
Aún no hay calificaciones
Visualizaciones Python - SEE - Dia 1
Documento23 páginas
Visualizaciones Python - SEE - Dia 1
andrea yubaille
100% (1)
Libreria Pandas
Documento27 páginas
Libreria Pandas
DiegoAsqui
100% (1)
taller_Bigdaa_python_Spark
Documento3 páginas
taller_Bigdaa_python_Spark
nokiaverde23
Aún no hay calificaciones
Python Fundamentals
Documento2 páginas
Python Fundamentals
Intelcom Intelcom
Aún no hay calificaciones
01 - Librerias para La Ciencia de Datos
Documento12 páginas
01 - Librerias para La Ciencia de Datos
Patricio Aguilera Escalona
Aún no hay calificaciones
Inteligencia Artificial: Grupo #5
Documento18 páginas
Inteligencia Artificial: Grupo #5
WhilmarMolina
Aún no hay calificaciones
Libreria de Pandas
Documento5 páginas
Libreria de Pandas
kein
Aún no hay calificaciones
Sección 1 - Getting Started With Panda
Documento118 páginas
Sección 1 - Getting Started With Panda
sadaro80
Aún no hay calificaciones
1.intro Python Pandas
Documento24 páginas
1.intro Python Pandas
Santiago Ruiz P
Aún no hay calificaciones
Modulo 2 - Josue Caycho
Documento13 páginas
Modulo 2 - Josue Caycho
Oncología Cds
Aún no hay calificaciones
Analisis Datos Python
Documento29 páginas
Analisis Datos Python
smith anton
Aún no hay calificaciones
Gestión Analítica de Datos Chapter 2
Documento50 páginas
Gestión Analítica de Datos Chapter 2
Carlos Encalada
Aún no hay calificaciones
Cartilla Digital DVMLCD
Documento5 páginas
Cartilla Digital DVMLCD
Israel Omar Leon Magne
Aún no hay calificaciones
Librerias Ia
Documento30 páginas
Librerias Ia
Michael Urrego
100% (1)
Actividad - 1 - Diplomado Data Science PDF
Documento2 páginas
Actividad - 1 - Diplomado Data Science PDF
FranciscaMayorga
Aún no hay calificaciones
Herramientas de Ciencia de Datos
Documento2 páginas
Herramientas de Ciencia de Datos
rojasperezjoaquinli
Aún no hay calificaciones
Python y Ciencia de Datos Online (Brochure)
Documento8 páginas
Python y Ciencia de Datos Online (Brochure)
agga2003
Aún no hay calificaciones
Proyecto Final - Introducción A La Ciencia de Los Datos
Documento6 páginas
Proyecto Final - Introducción A La Ciencia de Los Datos
Jean Carlos Estévez Solís
Aún no hay calificaciones
Python Fundamentals For Data Science
Documento3 páginas
Python Fundamentals For Data Science
Ahab Ishamel
Aún no hay calificaciones
Guia Practica4 Santiago Herrería
Documento17 páginas
Guia Practica4 Santiago Herrería
Santiago Herrería Bastidas
Aún no hay calificaciones
Practica4 EdwinCardenas
Documento15 páginas
Practica4 EdwinCardenas
Santiago Herrería Bastidas
Aún no hay calificaciones
AA IA Librerias Tafur
Documento19 páginas
AA IA Librerias Tafur
Mauricio Tafur
Aún no hay calificaciones
Temario de python orientado a la física
Documento1 página
Temario de python orientado a la física
moisesarias877
Aún no hay calificaciones
1 Fundamentos
Documento11 páginas
1 Fundamentos
sanchezis
Aún no hay calificaciones
Módulo 2. Introducción A Python
Documento26 páginas
Módulo 2. Introducción A Python
Facundo Aybar
Aún no hay calificaciones
Brochure Detallado - DEP
Documento8 páginas
Brochure Detallado - DEP
leo rojas
Aún no hay calificaciones
EV - 1 - Mapa Mental
Documento9 páginas
EV - 1 - Mapa Mental
arturo23cja
Aún no hay calificaciones
Nh Spark Python 2020
Documento137 páginas
Nh Spark Python 2020
nokiaverde23
Aún no hay calificaciones
CONTENIDOS PRACTICAS SIG-2021 - Ing AMBIENTAL
Documento45 páginas
CONTENIDOS PRACTICAS SIG-2021 - Ing AMBIENTAL
Laryza Alanya
Aún no hay calificaciones
Python Data Visualization
Documento2 páginas
Python Data Visualization
ccuyure
Aún no hay calificaciones
C Programacion Phyton
Documento3 páginas
C Programacion Phyton
Mauricio Mora Mendoza
Aún no hay calificaciones
Dash y Plotly - Dashboards Interactivos Con Python-Protegido
Documento65 páginas
Dash y Plotly - Dashboards Interactivos Con Python-Protegido
Rubens
0% (1)
2 2 Pandas
Documento17 páginas
2 2 Pandas
Kelvin Mendez Lopez
Aún no hay calificaciones
CRONOGRAMA 14s
Documento12 páginas
CRONOGRAMA 14s
danielx4rm
Aún no hay calificaciones
Curso de Programacion Python
Documento6 páginas
Curso de Programacion Python
sergiohdz3004
Aún no hay calificaciones
C-programacion-phyton
Documento4 páginas
C-programacion-phyton
pablo montenegro
Aún no hay calificaciones
Modulo - 5 - AplicacionWebdeCienciadedatos
Documento58 páginas
Modulo - 5 - AplicacionWebdeCienciadedatos
Irving Conde
Aún no hay calificaciones
Carrera Data Scientist
Documento9 páginas
Carrera Data Scientist
ezequiel
100% (1)
Bati Equipo 4
Documento4 páginas
Bati Equipo 4
Karla Leticia Vega Solorio
Aún no hay calificaciones
Phyton
Documento1 página
Phyton
John Doe
Aún no hay calificaciones
Trabajo de Investigacion de Librerias
Documento7 páginas
Trabajo de Investigacion de Librerias
You Brandonls Robladillo Tica
Aún no hay calificaciones
Brochure Bootcamp
Documento8 páginas
Brochure Bootcamp
Armando Castillo
Aún no hay calificaciones
Temario Python Intermedio - BCRP
Documento2 páginas
Temario Python Intermedio - BCRP
Juan Juan
Aún no hay calificaciones
Syl - Especialización en Power BI
Documento6 páginas
Syl - Especialización en Power BI
jkdiro.social
Aún no hay calificaciones
Parte4 Pandas
Documento36 páginas
Parte4 Pandas
Ruben Fernandez
Aún no hay calificaciones
HI Sem 12-2023-1
Documento53 páginas
HI Sem 12-2023-1
Jeancarlo Torres
Aún no hay calificaciones
A1 Erj
Documento3 páginas
A1 Erj
Elihu Ramirez
Aún no hay calificaciones
Machine Learning Con Python Aprendizaje Supervisado (Spanish Edition) (Ligdimar González (González, Ligdimar) )
Documento119 páginas
Machine Learning Con Python Aprendizaje Supervisado (Spanish Edition) (Ligdimar González (González, Ligdimar) )
vicopihue
Aún no hay calificaciones
Syllabus Taller 02
Documento2 páginas
Syllabus Taller 02
Bat Far
Aún no hay calificaciones
Curso Programacion Python Con Arcgis PDF
Documento2 páginas
Curso Programacion Python Con Arcgis PDF
Longino Montaño
Aún no hay calificaciones
Profesion Analista de Datos 1
Documento9 páginas
Profesion Analista de Datos 1
Marcos Hernandez
Aún no hay calificaciones
Ciclo 07-GB01-GESTIÓN - DE - BASE - DE - DATOS
Documento3 páginas
Ciclo 07-GB01-GESTIÓN - DE - BASE - DE - DATOS
freyde.benavides
Aún no hay calificaciones
Python Data Analytics Developer
Documento3 páginas
Python Data Analytics Developer
Ahab Ishamel
Aún no hay calificaciones
Bbva Open4u Ebook Herramientas Visualizacion Datos PDF
Documento26 páginas
Bbva Open4u Ebook Herramientas Visualizacion Datos PDF
Miguel Moya
Aún no hay calificaciones
Clase 1
Documento36 páginas
Clase 1
Adrian Pedraza Aquije
Aún no hay calificaciones
Robladillo Tica
Documento18 páginas
Robladillo Tica
You Brandonls Robladillo Tica
Aún no hay calificaciones
Python NLP Developer
Documento2 páginas
Python NLP Developer
ccuyure
Aún no hay calificaciones
Fundamentos de Programación y Bases de Datos
De Everand
Fundamentos de Programación y Bases de Datos
Ángel Arias
Aún no hay calificaciones
Diagramas P, T y H - Xy Metanol Agua
Documento21 páginas
Diagramas P, T y H - Xy Metanol Agua
Alejandro Fuentes
Aún no hay calificaciones
Orden
Documento7 páginas
Orden
Nancy Ester Ardiano Velásquez
Aún no hay calificaciones
Ensayo Tobacco FernandoAragon
Documento5 páginas
Ensayo Tobacco FernandoAragon
Fer Aragon
Aún no hay calificaciones
Carta de Consentimiento Informado CENAPRECE
Documento1 página
Carta de Consentimiento Informado CENAPRECE
Cinthia Sanchez
Aún no hay calificaciones
PLAN DE ESTUDIO 2019-Lab
Documento7 páginas
PLAN DE ESTUDIO 2019-Lab
Cielo Ramirez
Aún no hay calificaciones
Ecogreen DataSheet PDF
Documento1 página
Ecogreen DataSheet PDF
Johnny R Tacuri G
Aún no hay calificaciones
Números Cuánticos 1
Documento5 páginas
Números Cuánticos 1
CristianLeónArias
Aún no hay calificaciones
Av Po3 TP1
Documento4 páginas
Av Po3 TP1
Valentina Mastrorilli
Aún no hay calificaciones
Gestión - Entrevista Al Gerente General de Tabernero
Documento1 página
Gestión - Entrevista Al Gerente General de Tabernero
Anonymous 48dxLi8
Aún no hay calificaciones
F-09-GH-Formato de Acta de Capacitacion Investigación de AT SST
Documento2 páginas
F-09-GH-Formato de Acta de Capacitacion Investigación de AT SST
clara rosa parra
Aún no hay calificaciones
Determinacion Genetica Del Sexo y Sexaje de Embriones
Documento18 páginas
Determinacion Genetica Del Sexo y Sexaje de Embriones
jaluska001
Aún no hay calificaciones
Tarea 1 de Getión de Conflictos y Mediación
Documento8 páginas
Tarea 1 de Getión de Conflictos y Mediación
Jennipher Cerda Cruz
Aún no hay calificaciones
Tomo I Instrumental2
Documento263 páginas
Tomo I Instrumental2
Jaqui Lopez Gonzalez
Aún no hay calificaciones
2012.el Patrimonio Cultural Conceptos Basicos Garcia Cuetos Maria Pilar 90 99
Documento10 páginas
2012.el Patrimonio Cultural Conceptos Basicos Garcia Cuetos Maria Pilar 90 99
LuisNicolás R Escobar
Aún no hay calificaciones
Presentacion General Polyuprotec
Documento44 páginas
Presentacion General Polyuprotec
Elkin Olivo
Aún no hay calificaciones
Alimentacion de Niño DW 1 A 3 Años
Documento3 páginas
Alimentacion de Niño DW 1 A 3 Años
TRIUNFO
Aún no hay calificaciones
Guia 9 Mat Funciones
Documento12 páginas
Guia 9 Mat Funciones
Miguel Angel
Aún no hay calificaciones
Ciencia Tecnología y Sociedad
Documento9 páginas
Ciencia Tecnología y Sociedad
Sandy Acevedo
Aún no hay calificaciones
Historia de La Pasta
Documento22 páginas
Historia de La Pasta
Catalina Martinez
Aún no hay calificaciones
Indicador de Capacitacion de Personal
Documento2 páginas
Indicador de Capacitacion de Personal
Lay Torrez
Aún no hay calificaciones
Documento Monografia Filosofia
Documento6 páginas
Documento Monografia Filosofia
karinacastiglione.04
Aún no hay calificaciones
Tarea 6
Documento5 páginas
Tarea 6
cs2228778
Aún no hay calificaciones
Según Las Reglas Básicas Del Mercado Abierto para La Ejecución de Órdenes Existe Una Que Nos Indica Que
Documento3 páginas
Según Las Reglas Básicas Del Mercado Abierto para La Ejecución de Órdenes Existe Una Que Nos Indica Que
mas
Aún no hay calificaciones
Final de Saybolt - 1
Documento25 páginas
Final de Saybolt - 1
Jefferson Eras
Aún no hay calificaciones
Resumen Capitulo Dos Economía Politica de P. Nikitin
Documento6 páginas
Resumen Capitulo Dos Economía Politica de P. Nikitin
alejandra casallas
100% (3)
Características de La Información
Documento2 páginas
Características de La Información
Familia Salazar Carrillo
Aún no hay calificaciones
PBIU en La Fobias
Documento2 páginas
PBIU en La Fobias
Danay
Aún no hay calificaciones
Guion Intypedia 006
Documento6 páginas
Guion Intypedia 006
Zoro Zoe
Aún no hay calificaciones
SP2427 Guias
Documento54 páginas
SP2427 Guias
Cecilia
Aún no hay calificaciones