0% encontró este documento útil (0 votos)
75 vistas

Machine Learning

Este documento describe el aprendizaje automático y sus diferentes tipos como el aprendizaje supervisado, no supervisado y reforzado. También cubre conceptos como clasificación, regresión, reducción de dimensionalidad y software como Weka, R y Python.

Cargado por

Edwin Diaz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
75 vistas

Machine Learning

Este documento describe el aprendizaje automático y sus diferentes tipos como el aprendizaje supervisado, no supervisado y reforzado. También cubre conceptos como clasificación, regresión, reducción de dimensionalidad y software como Weka, R y Python.

Cargado por

Edwin Diaz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 61

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/338518406

Machine Learning para Todos

Conference Paper · January 2019


DOI: 10.13140/RG.2.2.13786.70086

CITATIONS READS

0 1,298

1 author:

Aldo Ramiro Valdez Alvarado


Universidad Mayor de San Andres
32 PUBLICATIONS   1 CITATION   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Blockchain en Bolivia View project

Machine Learning View project

All content following this page was uploaded by Aldo Ramiro Valdez Alvarado on 10 January 2020.

The user has requested enhancement of the downloaded file.


Machine
Learning para
Todos
Aldo Valdez Alvarado
Puno - 2019
Índice
1 Definición del ML

2 Tipos de Aprendizaje Automático

3 Aprendizaje Supervisado

4 Aprendizaje No Supervisado

5
Aprendizaje Reforzado

6 Software de ML

7 Ecosistema del ML
Google Trends…
1 Definición del ML
En 1959, el científico de la
IBM Arthur Samuel escribió
un programa para jugar
damas, para mejorarlo hizo
que el programa jugara
consigo mismo miles de
veces, el programa era capaz
de mejorar su rendimiento a
través de la experiencia, el
programa aprendió y nació el
Machine Learning.
El aprendizaje automático o
Machine Learning es un
método científico que nos
permite usar los ordenadores
y otros dispositivos con
capacidad computacional
para que aprendan a extraer
los patrones y relaciones que
hay en nuestros datos por sí
solos. Esos patrones se
pueden usar luego para
predecir comportamientos
y en la toma de decisiones.
El Aprendizaje Automático es un
campo en la Inteligencia Artificial,
donde las máquinas pueden
"aprender" de sí mismas, sin ser
explícitamente programadas por
los seres humanos. Analizando
datos pasados llamados "datos de
entrenamiento", el modelo de
Aprendizaje Automático forma
patrones y usa estos patrones
para aprender y hacer
predicciones futuras.
"Se dice que un programa de computadora
aprende de la experiencia E con respecto a
alguna clase de tareas T y la medida de
rendimiento P, si su rendimiento en tareas en
T, medido por P, mejora con la experiencia E.

Mitchell, 1997
Estadística

Biología Visualización

Machine
Ingeniería
Learning Economía

Procesamiento Bases de
de Señales
Datos
2 Tipos de Aprendizaje
Automático
Aprendizaje Aprendizaje No Aprendizaje
Supervisado Supervisado Reforzado
• Modelos • Modelos • Un enfoque de la
Predictivos. Descriptivos. IA
• La máquina • La máquina • Aprendizaje
aprende entiende los datos. basado en los
explícitamente. • La evaluación es hallazgos.
• Predice el futuro a cualitativa o • La máquina
partir de datos indirecta. aprende a como
históricos. • No realiza actuar en un
• Resuelve predicciones, determinado
problemas de encuentra algo entorno.
clasificación y específico. • Maximiza los
regresión. hallazgos.
Dado un conjunto de datos
de entrenamiento: los
elementos, casos o instancias
En el aprendizaje no
supervisado, se aprende un
modelo a partir de un
conjunto de datos no
etiquetados.
En el aprendizaje
supervisado, se aprende un
modelo a partir de un
conjunto de datos
etiquetados.
3 Aprendizaje
Supervisado
En este tipo de aprendizaje, la máquina aprende de un
conjunto de casos previamente etiquetados por un experto
o de forma semi – automática basándose en los datos, es
decir, para un conjunto de datos de entrada conocemos de
antemano los datos correctos de salida. En el aprendizaje
supervisado, el objetivo es aprender una forma de mapear
las entradas en salidas, cuyos valores correctos son
proporcionados por un supervisor.
Clasificación

Característica 2

Característica 1
Clasificación

Característica 2

Característica 1
Límite de la decisión
Clasificación
Clasificación no lineal

Algoritmos: SVM, árboles de decisión, redes neuronales,


K – nearest neighbors, naive bayes, entre otros.
Regresión
Regresión
Regresión
Regresión

Algoritmos: Regresión Lineal, Regresión Logística.


Aplicaciones
• Reconocimiento de Voz.
• Detección de fraude en tarjetas de crédito.
• Detectar SPAM en un correo.
• Predicciones de la bolsa de valores.
• Detección de enfermedades.
4 Aprendizaje No
Supervisado
El aprendizaje no supervisado es aquél que no requiere de
ningún etiquetado previo de los casos, se basa en los
datos tal y como los recibe y su objetivo es determinar
relaciones de similitud, diferencia o asociación. En el
aprendizaje no supervisado para un conjunto de datos de
entrada, no conocemos de antemano los datos de salida.
El objetivo del aprendizaje no supervisado es encontrar las
regularidades o patrones en la entrada.
Clústering

Se buscan aquellos elementos que son similares entre sí y


distintas de las demás para formar agrupaciones de los
datos llamadas clusters.
Clústering
Clústering

Algoritmos: K-means, gaussian mixtures, clustering


jerárquico, spectral clustering, entre otros.
Reducción de la Dimensionalidad
Se trata de reducir el número de variables de una
colección de datos, a partir de técnicas de asociación,
correlación, consistencia en variables de tipo continúo.
Aplicaciones
5 Aprendizaje Reforzado
En algunas aplicaciones, la salida del sistema es una
secuencia de acciones. En tal caso, una sola acción no es
importante; lo importante es la política que es la secuencia
de acciones correctas para alcanzar la meta, es decir, una
acción es buena si es parte de una buena política. En tal
caso, el programa de aprendizaje automático debe ser
capaz de evaluar la bondad de las políticas y aprender de
secuencias de buenas acciones pasadas para poder
generar una política.
Algoritmos
• Programación dinámica.
• Qlearning.
• SARSA.
Aplicaciones
• Aprender a jugar diferentes Juegos.
• El sistema de navegación de un robot, por ejemplo,
coches autónomos.
• Compresión de imágenes.
6 Software de ML
GNU - GPL

GNU - GPL
Licencia Código
Abierto BSD
WEKA
• Está disponible libremente bajo la licencia GNU – GPL.
• Es muy portable, implementado en Java y puede correr
en casi cualquier plataforma.
• Es fácil de utilizar por un principiante gracias a
su interfaz gráfica de usuario.
• Weka soporta varias tareas estándar de minería de
datos, especialmente, preprocesamiento de
datos, clustering, clasificación, regresión, visualización,
y selección.
R
• R es un sistema para análisis estadísticos y gráficos.
• R tiene una naturaleza doble de programa y lenguaje
de programación.
• R se distribuye gratuitamente bajo los términos de la
GNU – GPL.
• R es un lenguaje Orientado a Objetos, interpretado,
con una sintaxis muy simple e intuitiva.
• R no es tan fácil de aprender como Python.
PYTHON
• Es software libre y gratuito con licencia BSD.
• Es multiplataforma, es un lenguaje de programación de
alto nivel e interpretado, es multiparadigma.
• Su filosofía de diseño enfatiza la simplicidad y
legibilidad de código.
• Posee un núcleo de lenguaje relativamente pequeño,
con el apoyo de magníficas librerías como: NumPy,
SciPy, Scikit-learn, Pandas, IPython, Matplotlib y otras.
Anaconda® es un administrador de paquetes, un
administrador de entornos, una distribución de Python y
una colección de más de 1,000 paquetes de código
abierto. Es de código abierto y fácil de instalar, y ofrece
soporte gratuito a través de su comunidad.
8 Ecosistema del ML
La Inteligencia Artificial es la ciencia de construir máquinas que…

… piensen como … piensen


humanos racionalmente

… actúen como … actúen


humanos racionalmente

Inteligencia
Artificial
Big Data
• Actualmente existen almacenados
+2.7 Zetabytes, se esperan 35
Zetabytes para 2020
• En 2012 la información digital
alcanzó a nivel mundial 2.837
exabytes. Puestos en DVDs, la torre
sería de 400.000 Kms, más que la
distancia de la Tierra a la Luna
• Google procesa más de 24
Petabytes/día, información
equivalente a varios miles de veces
la biblioteca del congreso de USA
Frecuencia a Diferentes
Crecimiento Exactitud de
la que se formatos y
exponencial los datos y
genera los estructuras
de datos del cálculo
datos de los datos
Data
Science

La ciencia de datos (Data Science) es la ciencia


computacional de la extracción de conocimientos
significativos a partir de datos brutos y luego la
comunicación efectiva de esos conocimientos para generar
valor. (Pierson, 2017)
Lo que la sociedad piensa Lo que mis amigos Lo que mis familiares
que hago piensan que hago piensan que hago

Lo que otros programadores Lo que yo pienso que Lo que realmente hago


piensan que hago hago
Aldo Ramiro Valdez Alvarado
Licenciado en Informática
Máster en Dirección Estrategica en Tecnologías de la Información
Máster(c) en Business Intelligence y Big Data
Docente Titular de la Carrera de Informática de la UMSA
Docente de Postgrado en la UMSA y otras Universidades
Ex - Coordinador del Postgrado en Informática UMSA
Conferencista Nacional e Internacional

http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820
arvaldez@umsa.bo
aldo_valdez@hotmail.com

View publication stats

También podría gustarte