0% encontró este documento útil (0 votos)
96 vistas

Python For Machine Learning 6-10

Este documento habla sobre cómo Python es un lenguaje de programación popular y potente para aprendizaje automático, y presenta varias bibliotecas de Python útiles para esta tarea como Numpy, SciPy, Matplotlib, Pandas y scikit-learn. Scikit-learn es una biblioteca gratuita que incluye la mayoría de los algoritmos de aprendizaje automático y permite implementar modelos con pocas líneas de código.

Cargado por

jaroldane1000
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
96 vistas

Python For Machine Learning 6-10

Este documento habla sobre cómo Python es un lenguaje de programación popular y potente para aprendizaje automático, y presenta varias bibliotecas de Python útiles para esta tarea como Numpy, SciPy, Matplotlib, Pandas y scikit-learn. Scikit-learn es una biblioteca gratuita que incluye la mayoría de los algoritmos de aprendizaje automático y permite implementar modelos con pocas líneas de código.

Cargado por

jaroldane1000
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 3

Python para aprendizaje automático (6:10)

En este vídeo, hablaremos sobre cómo utilizar Python para machine learning.

Así que empecemos.

Python es un lenguaje de programación de propósito general popular y potente que surgió


recientemente como el idioma preferido entre los científicos de datos.

Pueden escribir su algoritmo de machine learning usando Python, y funciona muy bien.

Sin embargo, hay muchos módulos y bibliotecas ya implementados en Python que pueden
hacer su vida mucho más fácil.

Tratamos de introducir paquetes de Python en este curso y usarlos en los laboratorios para
dar una mejor experiencia.

El primer paquete es Numpy, una biblioteca de matemática para trabajar con arreglos de
n-dimensiones en Python.

Esta te permite realizar cálculos de forma eficiente y eficaz.

Es mejor que Python regular debido a sus increíbles capacidades.

Por ejemplo, para trabajar con arreglos, diccionarios, funciones, tipos de datos, y trabajar
con imágenes, necesitas conocer Numpy.

SciPy es una colección de algoritmos numéricos y herramientas de dominio especifico,


incluyendo procesamiento de señal, optimización, estadísticas y mucho más.

SciPy es una buena biblioteca para la computación científica y de alto rendimiento.

Matplotlib es un paquete muy popular que proporciona trazado 2D, así como trazado 3D.

El conocimiento básico acerca de estos 3 paquetes, que están construidos sobre Python,
es un buen activo para los científicos de datos que quieran trabajar con problemas del
mundo real.

Si no está familiarizado con estos paquetes, le recomiendo que tome el curso "Análisis de
datos con Python" primero.

Este curso cubre la mayoría de los temas útiles en estos paquetes.


La biblioteca Pandas es una biblioteca de Python de muy alto nivel que proporciona
estructuras de datos de alto rendimiento, fáciles de utilizar.

Tiene muchas funciones para la importación, manipulación y análisis de datos.

En particular, ofrece estructuras de datos y operaciones para la manipulación de tablas


numéricas y series de tiempo.

scikit-learn es una colección de algoritmos y herramientas para machine learning, que es


nuestro objetivo aquí, y que aprenderás a utilizar en el presente curso. Como vamos a
utilizar scikit-learn en los laboratorios, permítanme explicar más acerca de este y
mostrarte por qué es tan popular entre los científicos de datos.

SciKit-learn es una biblioteca gratuita de machine learning para el lenguaje de


programación Python.

Tiene la mayoría de los algoritmos de clasificación, regresión y agrupamiento, y está


diseñada para trabajar con las bibliotecas numéricas y científicas de Python, NumPy y
SciPy.

Además, incluye una documentación muy buena.

Encima de eso, la implementación de modelos de machine learning con scikit-learn es


realmente fácil, con unas pocas líneas de código Python.

La mayoría de las tareas que se deben realizar en un pipeline de machine learning se


implementan ya en scikit-learn, incluyendo, preprocesamiento de datos, selección de
características, extracción de características, división de entrenamiento/prueba,
definición de los algoritmos, modelos de ajuste, parámetros de ajuste, predicción,
evaluación y exportación del modelo.

Déjenme mostrarles un ejemplo de cómo scikit-learn luce cuando se utiliza esta


biblioteca.

No tienes que entender el código por ahora, pero sólo ve lo fácil que puedes construir un
modelo con sólo unas pocas líneas de código.

Básicamente, los algoritmos de machine learning se benefician de la estandarización del


conjunto de datos.

Si hay algunos valores atípicos, o campos de escalas diferentes en su conjunto de datos,


tiene que arreglarlos.
El paquete de preprocesamiento de scikit-learn proporciona varias funciones comunes de
utilidad y las clases de transformación para cambiar los vectores de características en
bruto en una forma adecuada de vector para modelado. Hay que dividir el conjunto de
datos en conjuntos de entrenamiento y pruebas para entrenar su modelo, y luego probar la
precisión del modelo por separado.

El Scikit-learn puede dividir arreglos o matrices en subconjuntos aleatorios de


entrenamiento y pruebas para ti, en una línea de código. Entonces, puedes configurar tu
algoritmo.

Por ejemplo, puede crear un clasificador utilizando un algoritmo de clasificación de vector


de soporte.

Llamamos a nuestra instancia de estimador 'clf', e inicializamos sus parámetros.

Ahora, puedes entrenar tu modelo con el conjunto de entrenamiento.

Al pasar nuestro conjunto de entrenamiento al método 'fit', el modelo 'clf' aprende a


clasificar casos desconocidos.

A continuación, podemos utilizar nuestro conjunto de pruebas para ejecutar predicciones.

Y, el resultado nos dice cuál es la clase de cada valor desconocido.

Además, puede utilizar distintas métricas para evaluar la precisión del modelo, por
ejemplo, utilizando una matriz de confusión (confusion_matrix) para mostrar los
resultados. Y finalmente, guarda el modelo.

Puedes encontrar todos o algunos de estos términos de machine learning confusos, pero
no te preocupes, vamos a hablar de todos estos temas en los siguientes vídeos.

El punto más importante para recordar es que todo el proceso de una tarea de Machine
Learning se puede hacer simplemente en unas pocas líneas de código, utilizando
scikit-learn.

Por favor, observe que, aunque es posible, no sería tan fácil si quisiera hacer todo esto
utilizando los paquetes Numpy o Scipy.

Y, por supuesto, necesita mucha más programación si se utiliza Python puro para
implementar todas estas tareas

¡Gracias por ver!

También podría gustarte