0% encontró este documento útil (0 votos)
62 vistas7 páginas

Python

Este documento presenta un curso sobre Python para ciencia de datos y big data. El curso consta de 9 capítulos que cubren temas como la gestión y visualización de datos con Python, machine learning, PySpark y MapReduce. Cada capítulo incluye varias lecciones y ejercicios prácticos sobre los conceptos tratados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
62 vistas7 páginas

Python

Este documento presenta un curso sobre Python para ciencia de datos y big data. El curso consta de 9 capítulos que cubren temas como la gestión y visualización de datos con Python, machine learning, PySpark y MapReduce. Cada capítulo incluye varias lecciones y ejercicios prácticos sobre los conceptos tratados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 7

 Bienvenida

Python para data science y big data esencial(En curso)


52 segundos

Guardar Python para data science y big data esencial


 1. Introducción a Python para data science y big data

Evaluación de las necesidades de big data (En curso)


4 minutos 58 segundos

Guardar Evaluación de las necesidades de big data

Instalar Jupyter Notebook


5 minutos 16 segundos

Guardar Instalar Jupyter Notebook

Instalar PySpark(En curso)


5 minutos 17 segundos

Guardar Instalar PySpark

Evaluar la eficiencia del código(En curso)


4 minutos 55 segundos

Guardar Evaluar la eficiencia del código

Test de capítulo
5 preguntas

 2. Gestión de datos en Python

Introducción al Pandas(En curso)


6 minutos 55 segundos

Guardar Introducción al Pandas

Filtrar datos en Python


5 minutos 37 segundos

Guardar Filtrar datos en Python

Transformaciones de la base de datos(En curso)


6 minutos 52 segundos
Guardar Transformaciones de la base de datos

Groupby: obtener información esencial(En curso)


7 minutos 7 segundos

Guardar Groupby: obtener información esencial

Tratar datos duplicados y perdidos(En curso)


5 minutos 29 segundos

Guardar Tratar datos duplicados y perdidos

Introducción a la librería Numpy(En curso)


7 minutos 13 segundos

Guardar Introducción a la librería Numpy

Test de capítulo
10 preguntas

 3. Gestión de datos avanzada

Correlaciones. Entender las relaciones entre las variables (En curso)


4 minutos 38 segundos

Guardar Correlaciones. Entender las relaciones entre las variables

Test de la Chi-Cuadrado(En curso)


7 minutos 37 segundos

Guardar Test de la Chi-Cuadrado

Análisis de datos extremos(En curso)


5 minutos 27 segundos

Guardar Análisis de datos extremos

Principios de las bases de datos relacionales(En curso)


3 minutos 39 segundos

Guardar Principios de las bases de datos relacionales

Transformar un dataframe en una base de datos relacional (En curso)


4 minutos 30 segundos
Guardar Transformar un dataframe en una base de datos relacional

Joins. Trabajar con bases de datos relacionales(En curso)


5 minutos 20 segundos

Guardar Joins. Trabajar con bases de datos relacionales

Paralelizar loops en Python(Visto)


4 minutos 0 segundos

Guardar Paralelizar loops en Python

Test de capítulo
11 preguntas

 4. Visualización de datos en Matplotlib

Introducción al Matplotlib(En curso)


3 minutos 34 segundos

Guardar Introducción al Matplotlib

Modificar elementos del gráfico en Matplotlib


4 minutos 5 segundos

Guardar Modificar elementos del gráfico en Matplotlib

Etiquetas y leyendas en Matplotlib(En curso)


5 minutos 25 segundos

Guardar Etiquetas y leyendas en Matplotlib

Gráficos para series temporales en Matplotlib


4 minutos 58 segundos

Guardar Gráficos para series temporales en Matplotlib

Histogramas y box plots en Matplotlib(En curso)


5 minutos 11 segundos

Guardar Histogramas y box plots en Matplotlib

Nubes de puntos y mapas de calor en Matplotlib(En curso)


6 minutos 38 segundos

Guardar Nubes de puntos y mapas de calor en Matplotlib


Introducción al Plotly. Visualización interactiva(En curso)
6 minutos 43 segundos

Guardar Introducción al Plotly. Visualización interactiva

Gráficos avanzados con Plotly(En curso)


7 minutos 31 segundos

Guardar Gráficos avanzados con Plotly

Visualización de Mapas con Plotly


6 minutos 38 segundos

Guardar Visualización de Mapas con Plotly

Test de capítulo
9 preguntas

 5. Machine Learning esencial: Clustering

Necesidades de Machine Learning: clustering y modelización


4 minutos 51 segundos

Guardar Necesidades de Machine Learning: clustering y modelización

Preparar los datos para Machine Learning(En curso)


5 minutos 4 segundos

Guardar Preparar los datos para Machine Learning

K-Means, el algoritmo de clustering(En curso)


5 minutos 44 segundos

Guardar K-Means, el algoritmo de clustering

El algoritmo hierarchical clustering(En curso)


5 minutos 39 segundos

Guardar El algoritmo hierarchical clustering

Test de capítulo
6 preguntas

 6. Machine Learning esencial. Modelización


Regresión lineal(En curso)
7 minutos 57 segundos

Guardar Regresión lineal

Regresión logística(En curso)


7 minutos 10 segundos

Guardar Regresión logística

Naives Bayes Classifier(En curso)


7 minutos 27 segundos

Guardar Naives Bayes Classifier

Árboles de clasificación y regresión(En curso)


7 minutos 5 segundos

Guardar Árboles de clasificación y regresión

Random forest
4 minutos 59 segundos

Guardar Random forest

Support vector machine


4 minutos 19 segundos

Guardar Support vector machine

K-Nearest Neighbours(Visto)
5 minutos 10 segundos

Guardar K-Nearest Neighbours

Test de capítulo
12 preguntas

 7. Trabajar con PySpark

Introducción a PySpark
8 minutos 21 segundos

Guardar Introducción a PySpark


Sintaxis en PySpark. Qué necesitamos saber(En curso)
4 minutos 1 segundos

Guardar Sintaxis en PySpark. Qué necesitamos saber

Qué son los RDD (Resilient Distributed Databases) (En curso)


4 minutos 27 segundos

Guardar Qué son los RDD (Resilient Distributed Databases)

Funciones lambda
5 minutos 11 segundos

Guardar Funciones lambda

Dataframes en PySpark(En curso)


8 minutos 43 segundos

Guardar Dataframes en PySpark

Transformaciones básicas en PySpark(En curso)


5 minutos 16 segundos

Guardar Transformaciones básicas en PySpark

Acciones básicas en PySpark


3 minutos 13 segundos

Guardar Acciones básicas en PySpark

Operaciones numéricas con RDD(En curso)


3 minutos 43 segundos

Guardar Operaciones numéricas con RDD

Test de capítulo
8 preguntas

 8. PySpark avanzado

Joins en PySpark(En curso)


3 minutos 10 segundos

Guardar Joins en PySpark


Acumuladores. Cómo detectar patrones en nuestros datos (En curso)
3 minutos 32 segundos

Guardar Acumuladores. Cómo detectar patrones en nuestros datos

Cómo construir funciones map(En curso)


3 minutos 48 segundos

Guardar Cómo construir funciones map

Cómo construir funciones reduce(En curso)


4 minutos 32 segundos

Guardar Cómo construir funciones reduce

Ejemplos básicos de MapReduce en PySpark(En curso)


5 minutos 18 segundos

Guardar Ejemplos básicos de MapReduce en PySpark

Test de capítulo
5 preguntas

 9. Desafío y solución: MapReduce

Desafío: MapReduce aplicado con PySpark(En curso)


1 minutos 35 segundos

Guardar Desafío: MapReduce aplicado con PySpark

Resolución de los ejercicios de MapReduce(En curso)


8 minutos 24 segundos

Guardar Resolución de los ejercicios de MapReduce

También podría gustarte