Aprendizaje Automatico Con Python PDF

Este documento presenta una introducción al aprendizaje automático (AA). Explica que el AA es una subárea de la inteligencia artificial que permite a los algoritmos mejorar automáticamente en una tarea a través de la experiencia. Luego, describe algunas aplicaciones comunes del AA como el procesamiento de lenguaje natural, detección de spam, reconocimiento de imágenes y sistemas de recomendación. Finalmente, resume los conceptos básicos del AA supervisado y no supervisado usando ejemplos en Python.

Cargado por

Jorge Eliecer Loaiza

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

995 vistas24 páginas

Aprendizaje Automatico Con Python PDF

Cargado por

Jorge Eliecer Loaiza

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 24

Raúl Garreta

Tryolabs / Fing Udelar

@raulgarreta
 ¿Qué es Aprendizaje Automático (AA) ?
 ¿Qué se puede hacer con AA?
 Herramientas de AA en Python
 Ejemplos
 Subárea dentro de Inteligencia
Artificial.
 Estudia algoritmos que tienen la
capacidad de aprender a realizar una
tarea automáticamente.
 Mejoran su performance con la
experiencia.
 Permiten resolver tareas complejas,
cuya solución es muy difícil o
imposible de realizar manualmente.
 Aprendizaje como aspecto
fundamental en la Inteligencia.
 Procesamiento de Lenguaje Natural

 Spam Filtering
 Visión Artificial
 Reconocimiento de Rostros

 OCR
 Jugadores Artificiales

 Data Mining
 Sistemas de Recomendación

 Y mucho, mucho más…

 Mejorar en una tarea T
 Respecto a una medida de performance P
 Basándose en la experiencia E
 Supervisado
 Clasificación
▪ Árboles de decisión
▪ Naive Bayes
▪ SVM
▪ …
 Regresión
▪ Redes Neuronales
▪ …

 No Supervisado
 Clustering
▪ KNN
▪ SOM

 Por Refuerzos
 Temporal Difference
 T: clasificar mails en Spam / No Spam
 P: porcentaje de mails correctamente
clasificados
 E: ver una muestra de mails clasificados
manualmente por el usuario como Spam / No
Spam
 ¿Qué es lo que se aprende y cómo se modela?
 V: Mail-> {Spam, No Spam}
 V(m1) = Spam, si m1 es mail de spam
 V(m2) = No Spam, si m2 es mail de interés
 V = f(aparece la palabra “viagra”, el remitente está
en mi lista de contactos?, #que aparece la palabra
“compre”, …)
 f = función lineal? Función polinomial de 2do
grado? Red neuronal? Árbol de Decisión? …
 ¿Con qué algoritmo se aprende?
 Esto muchas veces depende de la
representación/modelo que se va a utilizar
 Si modelo con una Red Neuronal -> puedo
utilizar Backpropagation
 Si modelo con un Árbol de Decisión -> puedo
utilizar ID3
 Si utilizo un modelo probabilístico -> estimar las
probabilidades contando frecuencias.
 …
 Qué tipo de entrenamiento se utiliza?
 Supervisado: tengo ejemplos etiquetados,
una base de mails ya clasificados como spam
/ no spam.
 Utilizo esta base como conjunto de
entrenamiento.
 Puedo particionar en entrenamiento / testeo
para aprender y testear respectivamente.
Ejemplo: 70% para entrenamiento, 30%
testeo
 Feature Selection: cual es el input del algoritmo,
como represento un ejemplo, cuales son las
características importantes a considerar para
clasificar.
 Medidas de Performance: ¿cómo sé si el sistema
realmente funciona bien? ¿cómo sé si el sistema
mejora si realizo modificaciones?
 Train set / Testing set
 Precision, Recall, Medida F
 Matriz de Confusión
 Hay muchas opciones:
 Orange http://orange.biolab.si/
 NLTK http://nltk.org/
 Mlpy http://mlpy.sourceforge.net/
 Pyml http://pyml.sourceforge.net/
 Pybrain http://pybrain.org/
 Scikit-learn http://scikit-learn.org/
 ¿Cómo implementar nuestro spam filter en
Python en 6 pasos sencillos?
 Utilizaremos Scikit-learn
Necesitamos recolectar ejemplos de entrenamiento.
Mails etiquetados como spam / ham
Exportar mis mails de mi cuenta de gmail
messages
ham
ham1.txt
ham2.txt
...
spam
spam1.txt
spam2.txt
...
data_samples =
load_files(container_path='/path/to/messages',
shuffle=True)
SPLIT_PERC = 0.6
train_size = int(len(data_samples.data)*SPLIT_PERC)
data_train = data_samples.data[:train_size]
data_test = data_samples.data[train_size:]

y_train = data_samples.target[:train_size]
y_test = data_samples.target[train_size:]
vectorizer = TfidfVectorizer(sublinear_tf=True,
strip_accents='ascii')

x_train = vectorizer.fit_transform(data_train)

x_test = vectorizer.transform(data_test)
classifier = MultinomialNB()

classifier.fit(x_train, y_train)
pred = classifier.predict(x_test)

metrics.precision_score(y_test, pred)

metrics.recall_score(y_test, pred)

metrics.f1_score(y_test, pred)

metrics.confusion_matrix(y_test, pred)
 Web:
 Scikit-learn
http://scikit-learn.org/stable/auto_examples
 Streamhacker.com

 Libros:
 NLTK book, NLTK cookbook
 Machine Learning, Tom Mitchel

 Cursos:
 Udelar
http://www.fing.edu.uy/inco/cursos/aprendaut/

 Stanford University
https://www.coursera.org/course/ml

 Washington University
https://www.coursera.org/course/machlearning
¿Preguntas?

También podría gustarte

Práctica - 02 Básico - Auto Increible
Aún no hay calificaciones
Práctica - 02 Básico - Auto Increible
13 páginas
Bucle For en Python
Aún no hay calificaciones
Bucle For en Python
7 páginas
Ejercicios de Sistemas Expertos Basados en Reglas de Produccion
Aún no hay calificaciones
Ejercicios de Sistemas Expertos Basados en Reglas de Produccion
4 páginas
Clase 16 - Proyectos de Control Industrial
Aún no hay calificaciones
Clase 16 - Proyectos de Control Industrial
31 páginas
Aprendizaje Supervisado
Aún no hay calificaciones
Aprendizaje Supervisado
6 páginas
Practica de Opencv 01.
Aún no hay calificaciones
Practica de Opencv 01.
2 páginas
Servicio Tecnico 14 Impresoras
Aún no hay calificaciones
Servicio Tecnico 14 Impresoras
28 páginas
Tensor Flow
Aún no hay calificaciones
Tensor Flow
20 páginas
TFG Maria Soria Gomez
Aún no hay calificaciones
TFG Maria Soria Gomez
86 páginas
EstructurasdeDatosC J.villalobos
Aún no hay calificaciones
EstructurasdeDatosC J.villalobos
399 páginas
Diseño y Validación de Modelos para Sistemas de Recomendación PDF
Aún no hay calificaciones
Diseño y Validación de Modelos para Sistemas de Recomendación PDF
258 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
12 páginas
Maquinas de Turing
100% (2)
Maquinas de Turing
76 páginas
Club Commodore 03
Aún no hay calificaciones
Club Commodore 03
20 páginas
Programa de Cálculo de Cargas Térmicas para Calefacción Por La Opción Simplificada Del DB He 1 Del Cte y Su Certificación Legal Mediante Las Fichas Justificativas
Aún no hay calificaciones
Programa de Cálculo de Cargas Térmicas para Calefacción Por La Opción Simplificada Del DB He 1 Del Cte y Su Certificación Legal Mediante Las Fichas Justificativas
370 páginas
Algoritmos de Regresión
0% (1)
Algoritmos de Regresión
16 páginas
Análisis de Algoritmos
Aún no hay calificaciones
Análisis de Algoritmos
13 páginas
CPDL y Fpga
100% (1)
CPDL y Fpga
8 páginas
Maquinas de Turing EXAMEN
Aún no hay calificaciones
Maquinas de Turing EXAMEN
43 páginas
Tanenbaum, Andrew S. - Organizacion de Computadoras - Un Enfoque Estructurado (7ma. Ed. - 2000) - Opt
Aún no hay calificaciones
Tanenbaum, Andrew S. - Organizacion de Computadoras - Un Enfoque Estructurado (7ma. Ed. - 2000) - Opt
348 páginas
Manual Programacion C
Aún no hay calificaciones
Manual Programacion C
151 páginas
Java FX Topicos Avanzados de Programacion
Aún no hay calificaciones
Java FX Topicos Avanzados de Programacion
11 páginas
C para Ingeniera y Ciencias by Bronson Gary J 970686590x PDF
Aún no hay calificaciones
C para Ingeniera y Ciencias by Bronson Gary J 970686590x PDF
4 páginas
1 Principios Fundamentales de Computación Cuántica Autor Vicente Moret Bonillo
Aún no hay calificaciones
1 Principios Fundamentales de Computación Cuántica Autor Vicente Moret Bonillo
181 páginas
Practica3 Auto Increible
Aún no hay calificaciones
Practica3 Auto Increible
4 páginas
Redes Neuronales
100% (6)
Redes Neuronales
11 páginas
Aprende Python Quintero14mayV5
Aún no hay calificaciones
Aprende Python Quintero14mayV5
214 páginas
Manual de Programación Básica
Aún no hay calificaciones
Manual de Programación Básica
44 páginas
Digital Systems - Sistemas Digitales - de Las Puertas Lógicas Al Procesador - Coursera
Aún no hay calificaciones
Digital Systems - Sistemas Digitales - de Las Puertas Lógicas Al Procesador - Coursera
11 páginas
Instalacion y Configuracion de Postfix y Dovecot en Ubuntu
Aún no hay calificaciones
Instalacion y Configuracion de Postfix y Dovecot en Ubuntu
9 páginas
Deeplearning PDF
Aún no hay calificaciones
Deeplearning PDF
145 páginas
Libro Arquitectura Java JPA (Domain Driven Design)
100% (1)
Libro Arquitectura Java JPA (Domain Driven Design)
3 páginas
Microcontroladores II - PIC16F877A - Assembler
Aún no hay calificaciones
Microcontroladores II - PIC16F877A - Assembler
24 páginas
Redes Neuronales
100% (1)
Redes Neuronales
22 páginas
Algoritmos de Aprendizaje Automático de Uso Común
Aún no hay calificaciones
Algoritmos de Aprendizaje Automático de Uso Común
32 páginas
Contador de Votos
Aún no hay calificaciones
Contador de Votos
7 páginas
Mini Tenis
Aún no hay calificaciones
Mini Tenis
49 páginas
La Board y Sus Partes
Aún no hay calificaciones
La Board y Sus Partes
84 páginas
Practica Opencv 02
100% (1)
Practica Opencv 02
12 páginas
Detección de Intrusiones Con SNORT
Aún no hay calificaciones
Detección de Intrusiones Con SNORT
7 páginas
Tensor Flow
100% (1)
Tensor Flow
14 páginas
Gráficos 02
100% (1)
Gráficos 02
53 páginas
CD - M5 Examen
Aún no hay calificaciones
CD - M5 Examen
4 páginas
Control Ancho de Banda Con PCQ
Aún no hay calificaciones
Control Ancho de Banda Con PCQ
20 páginas
Ejercicio Fuzzy
Aún no hay calificaciones
Ejercicio Fuzzy
4 páginas
Fpga
Aún no hay calificaciones
Fpga
43 páginas
Tutorial JFLAP Parte 1
Aún no hay calificaciones
Tutorial JFLAP Parte 1
7 páginas
Proyecto ABET
Aún no hay calificaciones
Proyecto ABET
20 páginas
Guardiola - Clasificador de Textos Mediante Técnicas de Aprendizaje Automático
Aún no hay calificaciones
Guardiola - Clasificador de Textos Mediante Técnicas de Aprendizaje Automático
49 páginas
Intro ML
Aún no hay calificaciones
Intro ML
56 páginas
Aprendizaje Automatico - Parte 1
Aún no hay calificaciones
Aprendizaje Automatico - Parte 1
88 páginas
Presentación Machine Learning
Aún no hay calificaciones
Presentación Machine Learning
20 páginas
Clase 1 - Clasificación de Los Sistemas de Machine Learning
Aún no hay calificaciones
Clase 1 - Clasificación de Los Sistemas de Machine Learning
45 páginas
UD7 - Repaso Final
Aún no hay calificaciones
UD7 - Repaso Final
23 páginas
Curso Machine Learning Modulo 1
100% (1)
Curso Machine Learning Modulo 1
122 páginas
Clase 0
Aún no hay calificaciones
Clase 0
42 páginas
Análisis Comparativo de Técnicas de Machine Learning
Aún no hay calificaciones
Análisis Comparativo de Técnicas de Machine Learning
7 páginas
Tarea 2 Iic1005
Aún no hay calificaciones
Tarea 2 Iic1005
9 páginas
Modulo4 Qué Es El Machine Learning V2
Aún no hay calificaciones
Modulo4 Qué Es El Machine Learning V2
9 páginas
Separata 2
Aún no hay calificaciones
Separata 2
9 páginas
228183-Tecnólogo en Gestión de Redes de Datos-V2
Aún no hay calificaciones
228183-Tecnólogo en Gestión de Redes de Datos-V2
67 páginas
GFPI-G-029 Guía Desarrollo Curricular Por Modulos
100% (1)
GFPI-G-029 Guía Desarrollo Curricular Por Modulos
36 páginas
Instalación Sobre Windows
Aún no hay calificaciones
Instalación Sobre Windows
8 páginas
Tabla Resultados Algoritmos Convex Hull
Aún no hay calificaciones
Tabla Resultados Algoritmos Convex Hull
2 páginas
Ejercicios Modelado de Problemas de PL - MaeSist - 2016
0% (2)
Ejercicios Modelado de Problemas de PL - MaeSist - 2016
11 páginas
Practica 5 Control 2
Aún no hay calificaciones
Practica 5 Control 2
14 páginas
Circularidad y Revolución Cibernética
Aún no hay calificaciones
Circularidad y Revolución Cibernética
3 páginas
Los Lenguajes Del Ser
Aún no hay calificaciones
Los Lenguajes Del Ser
9 páginas
Rtyrtyrtyrty
Aún no hay calificaciones
Rtyrtyrtyrty
4 páginas
TALLER 6 Programa y Plan Auditoria
Aún no hay calificaciones
TALLER 6 Programa y Plan Auditoria
2 páginas
Control Analogo - Tarea 3-2
Aún no hay calificaciones
Control Analogo - Tarea 3-2
17 páginas
02 Logística Taller Comunicación 2020 I
Aún no hay calificaciones
02 Logística Taller Comunicación 2020 I
32 páginas
Comunicación Verbal y No Verbal
Aún no hay calificaciones
Comunicación Verbal y No Verbal
1 página
Lab 9 Procesos
Aún no hay calificaciones
Lab 9 Procesos
13 páginas
Lab10 Controlcascada
Aún no hay calificaciones
Lab10 Controlcascada
15 páginas
05 Sesion 5 La Ejecución de La Calidad ISO
Aún no hay calificaciones
05 Sesion 5 La Ejecución de La Calidad ISO
39 páginas
Cuaderno de Informes 1
Aún no hay calificaciones
Cuaderno de Informes 1
10 páginas
Formato de Silabo Propuesto - Inteligencia Artificial1
Aún no hay calificaciones
Formato de Silabo Propuesto - Inteligencia Artificial1
6 páginas
Informe Minedu Marzo-Abril Aprendo en Casa
100% (2)
Informe Minedu Marzo-Abril Aprendo en Casa
12 páginas
Reseña Sobre Croft y Cruse Linguistica Cognitiva
Aún no hay calificaciones
Reseña Sobre Croft y Cruse Linguistica Cognitiva
8 páginas
1.-Deep Learning
Aún no hay calificaciones
1.-Deep Learning
61 páginas
Ejercicios de Inventarios Presentacion
Aún no hay calificaciones
Ejercicios de Inventarios Presentacion
61 páginas
Diseño y Ajuste de Controladores Pid
50% (2)
Diseño y Ajuste de Controladores Pid
132 páginas
Tarea 3-Análisis de La Comunicación No Verbal en Cortometraje
88% (16)
Tarea 3-Análisis de La Comunicación No Verbal en Cortometraje
16 páginas
L6. La Cultura de La Cibernetica PDF
100% (1)
L6. La Cultura de La Cibernetica PDF
129 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
21 páginas
Mapa Mental Inteligencia Artificial
67% (3)
Mapa Mental Inteligencia Artificial
1 página
Examen Tercero
Aún no hay calificaciones
Examen Tercero
2 páginas
Operadores Logicos
Aún no hay calificaciones
Operadores Logicos
10 páginas
Inteligencia Artificial
Aún no hay calificaciones
Inteligencia Artificial
12 páginas
Bloque 3 - Lectura Base 1
Aún no hay calificaciones
Bloque 3 - Lectura Base 1
40 páginas
Desarrollo Categorizacion PDF
Aún no hay calificaciones
Desarrollo Categorizacion PDF
16 páginas
Uveg R4 U3
Aún no hay calificaciones
Uveg R4 U3
6 páginas
Perspectivas Teoria Ecologica
Aún no hay calificaciones
Perspectivas Teoria Ecologica
116 páginas