Resumen: Introduction to Machine Learning with Python
Este libro, escrito por Andreas C. Müller y Sarah Guido, ofrece una introducción práctica al
aprendizaje automático utilizando Python y la biblioteca scikit-learn. Está dirigido a
científicos de datos y desarrolladores que desean aplicar técnicas de machine learning en
problemas reales sin necesidad de conocimientos avanzados en matemáticas.
El texto está organizado en ocho capítulos:
1. Introducción: Explica qué es el aprendizaje automático, sus aplicaciones, diferencias entre
aprendizaje supervisado y no supervisado, y cómo Python y scikit-learn simplifican su
implementación.
2. Aprendizaje Supervisado: Detalla algoritmos como k-vecinos más cercanos, modelos
lineales, Naive Bayes, árboles de decisión, máquinas de vectores soporte (SVM) y redes
neuronales. Introduce conceptos clave como sobreajuste, subajuste y generalización.
3. Aprendizaje No Supervisado y Preprocesamiento: Trata sobre reducción de
dimensionalidad (PCA, NMF), aprendizaje de manifolds (t-SNE), y técnicas de clustering
como k-means, DBSCAN y agrupamiento jerárquico.
4. Representación de Datos e Ingeniería de Características: Expone cómo preparar y
transformar los datos para mejorar el rendimiento de los modelos mediante codificación,
binning, polinomios, transformaciones no lineales y selección de características.
5. Evaluación y Mejora de Modelos: Introduce la validación cruzada, búsqueda de
hiperparámetros con grid search, y métricas de evaluación para clasificación y regresión.
6. Cadenas de Algoritmos y Pipelines: Enseña cómo construir flujos de trabajo reutilizables
combinando preprocesamiento y modelos mediante pipelines, integrando búsqueda de
parámetros.
7. Trabajo con Datos de Texto: Presenta el análisis de sentimientos, bolsa de palabras, TF-
IDF, n-gramas, lematización y modelado de temas (LDA) aplicado a textos.
8. Conclusión: Describe cómo llevar un prototipo a producción, evaluación de sistemas,
estimadores personalizados y temas avanzados como redes neuronales, sistemas de
recomendación y escalado de datos.
El libro es práctico, orientado a resultados, con muchos ejemplos en código Python
ejecutables en Jupyter Notebook. Destaca por su claridad, enfoque aplicado y por facilitar la
comprensión de conceptos complejos sin requerir una formación matemática avanzada.