0% encontró este documento útil (0 votos)
28 vistas

Intro Machine Learning Python

Este documento presenta una introducción a la librería scikit-learn en Python para aprendizaje automático. Explica que scikit-learn permite realizar aprendizaje supervisado y no supervisado usando algoritmos como regresión, clasificación y clustering. También describe cómo instalar las herramientas necesarias como Python, Jupyter Notebook, Pandas, NumPy y Matplotlib, y cómo cargar y particionar datos para entrenar modelos de regresión y validar sus predicciones mediante gráficas.

Cargado por

Gabriel Elías
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
28 vistas

Intro Machine Learning Python

Este documento presenta una introducción a la librería scikit-learn en Python para aprendizaje automático. Explica que scikit-learn permite realizar aprendizaje supervisado y no supervisado usando algoritmos como regresión, clasificación y clustering. También describe cómo instalar las herramientas necesarias como Python, Jupyter Notebook, Pandas, NumPy y Matplotlib, y cómo cargar y particionar datos para entrenar modelos de regresión y validar sus predicciones mediante gráficas.

Cargado por

Gabriel Elías
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 24

Intro Machine Learning Python

Gabriel Elías Chanchí G. Ph.D.


Universidad de Cartagena
Librería scikit-learn
• Es una librería para aprendizaje automático de software
libre.
• Cuenta con licencia de software libre tipo BSD.
• Permite la ejecución de algoritmos de aprendizaje
supervisado y aprendizaje no supervisado.
• Trabaja en conjunto con otras librerías de Python tales
como: Pandas, numpy, matplotlib.
• ¿Por qué aprender la librería scikit-learn?
Algoritmos soportados
• Aprendizaje supervisado
– Clasificación
– Regresión
• Aprendizaje no supervisado
– Clustering

• ¿Cúales vamos a abordar?


– Regresión
– Opcionalmente (Clasificación, Clustering)
Tecnologías a utilizar
• Python 3.7 o 3.8
• Jupyter Notebook
• Pandas
• numpy
• matplotlib
• seaborn
Instalación de las herramientas
• pip3 install numpy
• pip3 install Pandas
• pip3 install scikit-learn
• pip3 install jupyter
Cargando los datos con Pandas
• Se parte de la idea que se cuenta con un archivo .csv con
los datos.
Cargando datos con Pandas
• Usando la función read_csv
Cargando los datos con Pandas
• Imprimiendo las primeras n lineas del dataframe
Cargando los datos con Pandas
• Imprimiendo el tamaño del dataframe
Cargando datos con Pandas
• Obteniendo columnas del dataframe: X, Y
Cargando datos con Pandas
• Obteniendo un elemento del dataframe, fila 3, columna “x”
Cargando datos con Pandas
• Recorriendo el dataframe con un ciclo.
Partiendo los datos para entrenamiento y prueba
• Se convierte el Dataframe a arreglos numpy
Partiendo los datos para entrenamiento y prueba
• Se parten los datos en entrenamiento y validación
Entrenamiento del modelo
• Se entrena el modelo y se obtienen los datos de los
coeficientes y el intercepto
Obteniendo predicciones con el modelo
• Se obtienen las predicciones mediante el conjunto de
prueba.
Validación del modelo
• Validación del modelo
Todo Junto
Gráfico de los datos originales
• Graficando X_train, Y_train
Graficando los datos originales
• Graficando los datos Y_test vs Y_predict
Graficando los datos originales
• Graficando los datos de entrenamiento con la regresión
Graficando los datos originales
• Graficando el total de los datos con la regresión
Graficando los datos originales
• Cambiando el color a las gráficas
Generando ecuación de regresión
• Obteniendo la ecuación

También podría gustarte