Clase 1 - Machine Learning
Clase 1 - Machine Learning
Libros
Introdución a
Machine Learning
https://systechinfo.com/the-cost-vs-benefit-of-the-cloud/
https://www.grandviewresearch.com/industry-analysis/cloud-computing-industry
Desarrollar modelos es cada vez más barato en hardware
Negocios basados en datos
Netflix - Recommender System
Netflix Prize
100,480,507 ratings
480,189 users
17,770 movies
Spotify
Airbnb - Experiencia diferenciadora
Mercado Libre - Recommendation System
Google Personalization
Google Search
- Penalize websites based on content, metrics, Google collects data of search
black-hat link building, and with no expertise, queries, advertisement (ads) clicks,
authority or trust (medical purposes) websites visits, to predict which ads
- Rank results translating search queries into are most likely to be clicked by a user.
relevant websites and mobile-friendly user
experience. Connects users/buyers with
- Identify search intent by considering advertisers/company based on how
language and personal search history, much is the investment and the return
rewarding websites with well-constructed on terms of clicks, visits, etc.
content.
Google Personalization
Entonces ¿será que la
información en internet se
encuentra filtrada para que usted
la pueda encontrar?
Data maturity level
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Type & maturity level of analytics
Brief history about ML & AI
Brief history about ML & AI.
Brief history about ML & AI.
json files
Optimization
Scalability
Roles in Machine Learning Projects
Data Engineer Data Scientist Machine learning
Se utilizan todos los datos disponibles para entrenar el modelo, por lo que requiere más capacidad
computacional.
Una vez entrenado el modelo se pone en producción para que responda en base a lo aprendido, sin
tener la capacidad de aprender. Aplica lo que ya aprendió.
Para entrenar el modelo se utilizan secuencias de datos, individualmente o en pequeños grupos (aka:
mini-batch), por lo que la capacidad de cómputo requerida es menor.
Una vez puesto el modelo en producción puede aprender a través de un flujo continuo de datos, por lo
que sus respuestas deben cambiar a medida que fluyen los datos.
Instance based learning
Y = f (X)
En la práctica, la mayoría de los casos de aprendizaje automático se utiliza aprendizaje
supervisado.
En este tipo de aprendizaje tenemos variables input (x), llamadas features o covariables, y
una variable output (Y), también conocida como target.
● El algoritmo en este caso tiene que tener la capacidad de interpretar los inputs y
transformarlos de la mejor forma posible en el output que buscamos.
● El objetivo es aproximar la función de manera que cuando tengamos nuevos datos
pueda predecir la variable de salida.
● Se llama aprendizaje supervisado porque conozco el valor real de la variable de
salida (Y).
● Puedo supervisar el funcionamiento de mi algoritmo, generando las correcciones
necesarias hasta llegar a un resultado aceptable.
Supervised Learning
Los problemas de aprendizaje supervisado se pueden
catalogar en dos grupos:
❏ Clasificación
❏ La variable target corresponde a una categoría.
❏ Ej: Fraude / No Fraude, Enfermo / Sano, Compra /
No compra, Perro / Gato / Pájaro
❏ Algorithm: Logistic Regression, Decision Tree,
Random Forest, Support Vector Machines.
❏ Regresión
❏ La variable target corresponde a una variable
numérica o real.
❏ Ej: Ganancias del próximo mes, valor de una
propiedad.
❏ Algorithm: Linear Regression, Ridge Regression,
Lasso Regression, Elastic Net Regression
Unsupervised Learning
En este tipo de aprendizaje solo tenemos variables input (x) y no se tiene una
variable target.