0% encontró este documento útil (0 votos)
93 vistas80 páginas

00 Intro

Este documento presenta la introducción a un curso de machine learning. Cubre temas como artificial intelligence, machine learning, por qué machine learning es fascinante, detalles del curso como el instructor, prerequisitos, información general, libros de texto, sistemas de calificación y contenido del curso.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
93 vistas80 páginas

00 Intro

Este documento presenta la introducción a un curso de machine learning. Cubre temas como artificial intelligence, machine learning, por qué machine learning es fascinante, detalles del curso como el instructor, prerequisitos, información general, libros de texto, sistemas de calificación y contenido del curso.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 80

Temas

1. Detalles del curso


2. Artificial Intelligence (AI)
3. ¿Por qué Machine learning (ML) es alucinante?

CSC 411: 01-Introducción


El Equipo

Instructor:
Paul Cardenas Lizana ([email protected])

Oficina:
Horas: Viernes 15:00 a 20:00

TAs:

● Miguel Sanchez
● Alex Valle
Pre-requisitos

● Algebra Lineal: manipulaciones y propiedades de vector/matriz


● Cálculo diferencial: PDE
● Probabilidad: distribuciones comunes; Regla de Bayes
● Estadísticas: mean, average, median, mode, máximo likelihood
● A First Course in Probability by Sheldon Ross

https://www.vocabulary.com/articles/chooseyourwords/mean-median-average/
Información del curso

Clases: Viernes de 15:00 a 18:00


Labs y tutoriales: Viernes de 18:00 a 20:00
Clase Sitio web:

La clase utiliza piazza para anuncios y discusiones

La web será un buen lugar para interactuar, preguntar, discutir con el


instructor, TAs y tus compañeros
CSC 411: 01-Introducción
Textbooks

“Pattern Recognition and Machine Learning” by Christopher Bishop (2006)

Otros Textbooks:
● “An Introduction to Statistical Learning” by G. James et al.
● “Learning from Data: A Short Course” by Malik Magdon-Ismail
● “Machine Learning: a Probabilistic Perspective” by K. Murphy
● “Information Theory, Inference, and Learning Algorithms” by D. Mackay
● “Introduction to Machine Learning”, 2nd edition, 2010 by E. Alpaydin.
Cursos populares online

1. [CS229] Machine Learning -- Andrew Ng

2. https://www.cs.cmu.edu/~awm/tutorials.html

3. https://www.edx.org/course/machine-learning-gtx-cs7641x-1

4. http://www.cs.cmu.edu/~ninamf/courses/601sp15/lectures.shtml

5. https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs1156x-0
Sistema de Calificación: F

Asignaciones (25%): Final (50%):


● 4 prácticas para la casa ● Nota maxima de 20
● Programación en Matlab/Python, ● Centrado en la segunda parte del
ampliar código curso
● Vale 50% de la nota del curso
● Derivaciones en lápiz y papel
● Vale 25% de la nota del curso Projecto:
● Puede reemplazar PC3 y PC4.
Parcial (25%):
● Examen 2 horas
● Nota maxima de 20
● Vale 25% de la nota del curso
Contenido del Curso en forma general

1. ¿Qué es aprendizaje?
2. ¿Se puede Aprender?
3. ¿Cómo hacerlo?
4. ¿Cómo hacerlo BIEN?
5. Principios generales
6. Técnicas avanzadas de ML
7. Otros paradigmas de aprendizaje
Calendario Academico - 2018
Sobre las prácticas
1. Colaboración en las tareas no está permitido. Cada estudiante es responsable de
su propio trabajo. Discusión de tareas deberá ser limitado a aclaración de
conceptos, y no deberá involucrar compartición de pseudocódigo, código, o
resultados.
2. Las tareas se entregan comenzando la clase/lab en la debida fecha.
3. No se dará extensión de tiempo a menos de situaciones especial como
emergencias médicas probado por Certificado Médico o de presentación en
congreso aprobado por el instructor por lo menos una semana antes de la fecha
límite.
4. Competencia entre ML algoritmos. se dará algunos datos para entrenar un
sistema ML, y tú tratarás de desarrollar el mejor método. Determinaremos qué
sistema ML funciona mejor en prueba de datos invisibles y será el ganador
Contenido
1 Introduction
Lab00: Review on Probability
2 Linear Regression
3 Linear Classification Lab01: Gradient Descent and KNN
4 Logistic Regression Lab02: K-NN and Decision Trees
5 Non-parametric Methods Lab03: Naive Bayes
6 Decision Trees Lab04: Neural Networks
7 Multi-class Classification Lab05: Clustering
8 Probabilistic Classifiers LAb06: PCA
9 Exam Parcial Lab07: SVM
10 Neural Networks
11 Clustering
12 Mixture of Gaussians
13 PCA-Autoencoders
14 Support Vector Machines
15 Kernels
16 Ensemble Methods
17 Reinforcement Learning
18 Exam Final
cual es el hype de Machine learning?

Top 10 emerging jobs on LinkedIn and their growth from 2012 to 2017
Donde trabajan los “machine learning engineers”
Insight Fellows Program

https://www.insightdatascience.com/
Donde esta los $$$ de ML?
AI is the new electricity-- Andrew Ng
Que se dice de Machine learning?

● “A breakthrough in machine learning would be worth TEN Microsofts ”


(Bill Gates, Chairman, Microsoft)
● “Machine learning is the next Internet” (Tony Tether, Director, DARPA )
● “Machine learning is the hot new thing” (John Hennessy, President,
Stanford)
● “Web rankings today are mostly a matter of machine learning” (Prabhakar
Raghavan , Dir. Research, Yahoo)
● “Machine learning is going to result in a real revolution” (Greg
Papadopoulos, CTO, Sun)
● “Machine learning is today’s discontinuity” (Jerry Yang, CEO, Yahoo)
habilidades para el lab
Si deseas obtener un salario grueso, No hay vuelta que
darle, es necesario
1. Saber Probabilidad y Estadística, Matemáticas Aplicadas y Algoritmos de ML

2. Tener una comprensión firme de Probabilidades y las Estadísticas para aprender y


comprender los algoritmos. Entender Naive Bayes, Gaussian Mixture Models, Hidden
Markov Models, matrices de confusión, curvas receiver-operator, p-values, etc.

3. Entender temas como el descenso de gradiente, la optimización convexa, multiplicadores de


Lagrange, la programación no lineal, las ecuaciones en derivadas parciales, las sumas, etc.

4. Dominar las técnicas y algoritmos de ML, como k-NN, Naive Bayes, SVM y Decision
Forests.
Cursos complementarios online

1. Introduction to Probability and Data


2. Fundamentals of Quantitative Modelling
3. Bayesian Statistics: Techniques and Models
4. Decision Tree: Theory, Application and Modelling using R
5. Combinatorics and Probability
¿Cuál es la diferencia entre la inteligencia artificial, el machine
learning y el deep learning?

1. Inteligencia Artificial es la inteligencia humana


exhibida por Máquinas.
2. Machine Learning: un enfoque para lograr la
inteligencia artificial.
3. Deep Learning: una técnica para implementar el
machine learning.

https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/
AI vs Machine Learning

1. La inteligencia artificial es el estudio de agentes que perciben el mundo que les


rodea, hacen planes y toman decisiones para alcanzar sus objetivos. Sus
fundamentos incluyen las matemáticas, la lógica, la filosofía, la probabilidad, la
lingüística, la neurociencia y la teoría de la decisión. Muchos campos están dentro
de la inteligencia artificial, como la visión artificial, la robótica, el machine learning y
el procesamiento del lenguaje natural (NPL)

2. Machine learning es un subcampo de la inteligencia artificial. Su objetivo es


permitir que las computadoras aprendan por sí mismas. El algoritmo de ML le
permite identificar patrones en datos observados, crear modelos que expliquen el
mundo y predecir cosas sin tener reglas y modelos explícitos preprogramados.
When Will AI Exceed Human Performance?
Evidence from AI Experts

Un informe reciente del Future of Humanity Institute


encuestó a un panel de expertos en IA sobre el futuro y
descubrió que “los expertos creen que hay un 50% de
probabilidades de que la IA supere a los humanos en
todas las tareas en 45 años" (Grace et al, 2017) .

https://arxiv.org/pdf/1705.08807.pdf

Imagen publicada en 2005.

Ahora, el 2018, cuántos de estos carteles


podrían permanecer en la pared?
¿Cómo podemos hacer que un robot cocine?
¿Cómo podemos resolver un problema específico?
Como mecatrónicos podemos escribir un programa que codifica un conjunto
de reglas que son útiles para resolverlo
¿Qué es Machine learning?
¿Cómo podemos resolver un problema específico?
● Como mecatrónicos podemos escribir un programa que codifica un conjunto de
reglas que son útiles para resolverlo
● En muchos casos es muy difícil especificar las reglas,
e.g. Dada las imagenes determinar si hay un gato
Escribir las reglas para identificar a un gato
Usando las reglas, quien no es un gato?

(A) (B) (C)


Definir es difícil; Reconocer es más sencillo

Es difícil dar una definición matemática completa de un gato.


Incluso un niño puede distinguir entre un gato y un objeto. El
niño ha aprendido de datos.
¿Qué es Machine learning?

1. ¿Cómo podemos resolver un problema específico?


● Como mecatrónicos podemos escribir un programa que codifica un conjunto
de reglas que son útiles para resolverlo
● En muchos casos es muy difícil especificar las reglas, e.g. Dada una imagen
determinar si hay un gato en el imagen.
2. Sistemas de aprendizaje no son directamente programados para resolver un
problema, en su lugar, se desarrollar un programa propio basado en:
● Ejemplos de cómo debería ser/comportarse
● De experiencia a base de prueba y error tratando de resolver el problema
3. Diferente al estándar CS:
● Querer implementar una función desconocida, solamente teniendo acceso a
muestras (ejemplos) de entrada y salida (training samples)
Aprendizaje simplemente quiere decir incorporar información de los training
samples al sistema
Tareas que requieren ML: ¿Qué hace que un número sea 2?

The MNIST
database
Tareas que se benefician de ML: ¡Leer el menu en Taiwan!

CSC 411: 01-Introducción


Tareas que se benefician de ML: ¡Cocinar!

People imitate the


movement of the
human,
but we imitate the
goal!

https://www.youtube.com/watch?v=KQ8BkBUMH1E

CSC 411: 01-Introducción


Por qué utilizar ML?

1. Es difícil escribir programas para resolver problemas como reconocimiento


de un dígito escrito a mano
● ¿Qué distingue a un 2 de un 7?
● ¿Cómo resuelve esto nuestro cerebro?
2. En lugar de escribir un programa, recogemos ejemplos que especifican la
salida correcta para un entrada dada (learn the goal!)
3. El algoritmo ML entonces toma esos ejemplos y produce un programa que
hace el trabajo
● El programa producido por el algoritmo de aprendizaje puede ser muy
diferente de un programa típico escrito manualmente. Y puede contener
millones de números.
● Si lo hacemos bien, el programa funciona para nuevos casos como
también para los casos donde fueron entrenados.
ML es muy útil en muchas tareas

1. Clasificación: Determinar en qué categoría el ejemplo pertenece


Ejemplos de Clasificación

¿Qué dígito es?


Ejemplos de Clasificación

¿Es un perro?
Ejemplos de Clasificación

Y este es ...
Ejemplos de Clasificación

¿Pasaré el curso?
Reconocimiento de monedas de máquinas
vendedoras

25
1
Masa Masa
1
50
50
10
10

Diametro Diametro
Reconocimiento de monedas de máquinas
vendedoras

Masa

Diametro
Ejemplos de Clasificación

¿Tengo diabetes, cancer, etc?


ML es muy útil en muchas tareas
1. Clasificación: Determinar la categoría discreta del ejemplo
2. Reconocimiento de patrones: Reconocimiento de voz y facial, etc.
Ejemplos de Reconocimiento de patrones
Ejemplos de Reconocimiento de patrones

https://photomath.net/en/
ML es muy útil en muchas tareas
1. Clasificación: Determinar la categoría discreta del ejemplo
2. Reconocimiento de patrones: Reconocimiento de voz y facial, etc.
3. Sistemas de Recomendación: datos ruidosos, pagos comerciales (e.g.,
Amazon, Netflix).

CSC 411: 01-Introducción Ene 11, 2016


Ejemplos de Sistemas de Recomendación

CSC 411: 01-Introducción Ene 11, 2016


Ejemplos de sistemas de Recomendación

CSC 411: 01-Introducción Ene 11, 2016


Ejemplos de sistemas de Recomendación
ML es muy útil en muchas tareas
1. Clasificación: Determinar la categoría discreta del ejemplo
2. Reconocimiento de patrones: Reconocimiento de voz y facial, etc.
3. Sistemas de Recomendación: datos ruidosos, pagos comerciales (e.g.,
Amazon, Netflix)
4. Recuperación información: Encontrar documentos o imágenes con
contenido similar

CSC 411: 01-Introducción


Ejemplos de Recuperación de Información

CSC 411: 01-Introducción


Ejemplos de Recuperación de Información

CSC 411: 01-Introducción


Ejemplos de Recuperación de Información
ML es muy útil en muchas tareas
1. Clasificación: Determinar la categoría discreta del ejemplo
2. Reconocimiento de patrones: Reconocimiento de voz y facial, etc.
3. Sistemas de Recomendación: datos ruidosos, pagos comerciales (e.g.,
Amazon, Netflix)
4. Recuperación de información: Encontrar documentos o imágenes con
contenido similar
5. Computer Vision: Detección, segmentación, estimación de profundidad, flujo
óptico, etc.
Computer Vision
Computer Vision
Computer Vision
ML es muy útil en muchas tareas
1. Clasificación: Determinar la categoría discreta del ejemplo
2. Reconocimiento de patrones: Reconocimiento de voz y facial, etc.
3. Sistemas de Recomendación: datos ruidosos, pagos comerciales (e.g.,
Amazon, Netflix)
4. Recuperación de información: Encontrar documentos o imágenes con
contenido similar
5. Computer Vision: Detección, segmentación, estimación de profundidad,
flujo óptico, etc.
6. Robótica: la percepción, la planificación, etc.
Conducción Autónoma
Robots voladores
ML es muy útil en muchas tareas
1. Clasificación: Determinar la categoría discreta del ejemplo
2. Reconocimiento de patrones: Reconocimiento de voz y facial, etc.
3. Sistemas de Recomendación: datos ruidosos, pagos comerciales (e.g.,
Amazon, Netflix)
4. Recuperación de información: Encontrar documentos o imágenes con
contenido similar
5. Computer Vision: Detección, segmentación, estimación de profundidad,
flujo óptico, etc.
6. Robótica: la percepción, la planificación, etc.
7. Aprender a jugar juegos
ML es muy útil en muchas tareas

5. Reconociendo anomalías y detección de fraudes: secuencias insólitas en las


tarjetas de crédito, situación de pánico en un aeropuerto
6. Filtración de correo no deseado,: el spam se adapta, así que debemos
adaptarnos también
7. Y mucho más...
Aprendizaje Humano
Tipos de aprendizaje

Supervisado: La salida correcta es conocida para cada entrada


Aprender a predecir la salida cuando se da un vector de entrada
Clasificación: 1 de N clases (reconocimiento de voz, reconocimiento de objetos,
diagnóstico médico)
Regresión: valor real de salida (predicción de precios de mercado, rating de
clientes)
No supervisado
Crear una representación interna de la entrada y captura de regularidades en
la estructuras de datos
Ejemplos: formar árboles; extraer características
¿Cómo sabemos si una representación es buena?
Reforzado
Aprender la acción para maximizar el premio
No hay mucha información en la señal del premio
El premio a menudo es dado con retrazo
Tipos de aprendizaje
Supervised learning Unsupervised learning
● Linear classifiers ● Clustering
● Support vector machines ● Dimensionality reduction
● Neural networks and deep
Reinforcement learning
learning
● Markov decision processes
● Nearest neighbor classifiers
● Value iteration
● Probabilistic classifiers
● Q learning
● Decision trees
● Policy search
● Ensemble models
Ejemplos de cada uno
ML vs Data Mining

1. La minería de datos: Típicamente utiliza técnicas muy simple de ML en bases


de datos que son muy grandes porque las computadoras son también lentas
cuando hacen cosas más interesante con diez mil millones de datos.
2. Previamente usado con un sentido negativo- Cualquier procedimiento
estadístico para buscar todo tipo de relaciones en los datos hasta encontrar
uno.
3. Ahora las líneas son difusas: muchos problemas ML involucrar millones de
datos.
4. Aun los problemas de AI (e.g., reconocimiento facial, robot navegación)
todavía pertenecen al dominio de ML
ML vs Estadística

1. ML usa teoría de estadística para construir modelos.


2. Mucho del descubrimiento en ML son cosas que los estadísticos ya sabían; a
menudo disfrazada/usadas por diferencias en terminología.
3. Pero el énfasis es muy diferente:
a. En estadística: Probar que un procedimiento de estimación (relativamente
sencillo) es imparcial (unbias).
b. En ML: Demostración de que un algoritmo complijo produce resultados
impresionantes en una tarea específica.
4. Podemos ver el ML como aplicación de técnicas computacionales a
problemas estadísticos. Pero va más allá de problemas estadísticos típicos y
tiene diferente objetivos (velocidad vs. exactitud).
Terminologia (Robert Tibshirani)

ML ESTADÍSTICA
1. Network, grafico 1. Modelo
2. Pesos 2. Parametros
3. Aprendizaje 3. Fitting (Ajuste)
4. Generalización 4. Prueba de performancia
5. Aprendizaje supervisado 5. Regresión/Clasificación
6. Aprendizaje no supervisado 6. Estimación de densidad, clustering
7. Grants: $ 1.000.000 7. Grants: $ 50,000
El corazón de un problema de ML

Asumimos que
1. Existe un patrón en los datos.
2. No podemos especificarlo matemáticamente.
3. Pero tenemos los datos. (ir con cuidado)
Case Study: ¿Qué nota obtendre en este curso MT-616?

1. Datos: (entrada) notas de semestres anteriores y tus notas en tus cursos


previos
2. Procesamiento de datos:
a. Dividir la data en training set y test set
b. Determinar la representación de las características de entrada y salida
3. Escoger la forma del modelo: regresión lineal
4. Decidir cómo evaluar el rendimiento del sistema: Función objetivo escoger los
parámetros del modelo que optimizan el rendimiento
5. Evaluar el test set: Generalización
Aprendiendo a dar rating de películas

1. ¿Podemos predecir cómo un espectador calificaría una película?

2. Premio de $ 1 millón por una mera mejora del 10% en el sistema


de recomendación dado por Netflix.

3. ¿Por qué? Para que Netflix pueda hacer mejores recomendaciones


de películas y obtener más rentas.
Ratings anteriores reflejan futuros ratings
1. Podemos asumir que el gusto del espectador y el contenido del video genera el
rating de la película.
2. No hay una fórmula mágica para predecir el rating.
3. Pero Netflix tiene datos, la tarea sería aprender a identificar las “categorías” de
películas y las gustos del espectador
Ratings anteriores reflejan futuros ratings

Un patrón existe que no es


conocido, pero tenemos datos
para aprender

Vector = ??
Aprobación de crédito bancario
1. Utilizando el salario, la deuda, los años trabajando, etc., la
pregunta es si le deberá aprobar un crédito bancario.
2. No hay fórmula mágica.
3. Los bancos tienen muchos datos sobre
a. información del cliente: salario, deuda, etc.
b. Y si han dejado de pagar su crédito .
Planteando el problema de aprendizaje

• Conjunto de posible instancias X (inputs)


• Conjunto de posible etiquetas Y (outputs)

Función objetivo (Desconocido) F : X →Y

Dataset D =

X, Y y D están dados por el problema de aprendizaje.


El objetivo F es fijo pero desconocido.

Aprendemos la función F de los datos D


Planteando el problema de aprendizaje

1. Comenzar con un conjunto de hipótesis candidatas H que se cree que


probablemente represente F.
H = {h1, h2,. . . ,} se llama conjunto de hipótesis o modelo
2. Seleccione una hipótesis g de H. La forma de hacer esto se llama algoritmo de
aprendizaje.
3. Use g para nuevos valores, esperando que g ≈ f.

X, Y y D están dados por el problema de aprendizaje.


El objetivo F es fijo pero desconocido.

Nosotros elegimos H y el algoritmo de aprendizaje


El setup del aprendizaje
Función objetivo
(Desconocido)
f : X→Y

Training examples
(x1 , y1 ), ... , ( xN , yN )

Algoritmo
de Hipótesis Final
Aprendizaje g≈f

Set de Hipótesis
H
Los 2 componentes de la solución al problema de aprendizaje

Función objetivo Función ideal de aprobación de


● Set de hipótesis (Desconocido)
crédito bancario

H = {h1, h2,. . . ,} g∈H f : X→Y


Registros de clientes del banco
● El algoritmo de aprendizaje Training Examples
(x1 , y1 ), ... , ( xN , yN )

Algoritmo Hipotesis Final


de
A ambos se los conoce como el Modelo g≈f
Aprendizaje
de Aprendizaje. Fórmula final de aprobación de
crédito
Set de Hipotesis
H

Set de fórmulas candidatas

También podría gustarte