Resumen Ampliado Introduction ML Python
Resumen Ampliado Introduction ML Python
por Andreas C. Müller y Sarah Guido. El enfoque central del libro es proporcionar una
introducción accesible, práctica y detallada al campo del *machine learning* (aprendizaje
automático) utilizando Python y la biblioteca scikit-learn.
1. Introducción
El capítulo expone la motivación para utilizar machine learning frente a los sistemas
basados en reglas rígidas, destacando su adaptabilidad y la capacidad de generalizar. Se
introduce la diferencia entre aprendizaje supervisado (con datos etiquetados) e no
supervisado (sin etiquetas). También se destaca la importancia de Python como
herramienta preferida por su ecosistema de bibliotecas (NumPy, SciPy, pandas, matplotlib,
Jupyter y scikit-learn).
2. Aprendizaje Supervisado
Explora técnicas para encontrar patrones sin etiquetas previas. Se abordan los desafíos de
evaluar estos modelos. Se tratan:
- Escalado y transformación de datos (estandarización, normalización)
- Reducción de dimensionalidad (PCA, NMF)
- Aprendizaje de manifolds (t-SNE)
- Técnicas de agrupamiento: k-Means, Clustering Jerárquico, DBSCAN
Se analiza cómo estas técnicas ayudan en la compresión de datos, mejora del rendimiento
de modelos supervisados y descubrimiento de estructuras ocultas.
Se explica cómo estructurar flujos de trabajo completos con scikit-learn usando Pipelines:
- Encadenamiento de transformaciones y modelos
- Selección de parámetros dentro de un pipeline
- Grid Search integrado a pipelines
- Comparación de múltiples modelos en un solo pipeline