Machine Learning
Machine Learning
net/publication/338518406
CITATIONS READS
0 1,298
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Aldo Ramiro Valdez Alvarado on 10 January 2020.
3 Aprendizaje Supervisado
4 Aprendizaje No Supervisado
5
Aprendizaje Reforzado
6 Software de ML
7 Ecosistema del ML
Google Trends…
1 Definición del ML
En 1959, el científico de la
IBM Arthur Samuel escribió
un programa para jugar
damas, para mejorarlo hizo
que el programa jugara
consigo mismo miles de
veces, el programa era capaz
de mejorar su rendimiento a
través de la experiencia, el
programa aprendió y nació el
Machine Learning.
El aprendizaje automático o
Machine Learning es un
método científico que nos
permite usar los ordenadores
y otros dispositivos con
capacidad computacional
para que aprendan a extraer
los patrones y relaciones que
hay en nuestros datos por sí
solos. Esos patrones se
pueden usar luego para
predecir comportamientos
y en la toma de decisiones.
El Aprendizaje Automático es un
campo en la Inteligencia Artificial,
donde las máquinas pueden
"aprender" de sí mismas, sin ser
explícitamente programadas por
los seres humanos. Analizando
datos pasados llamados "datos de
entrenamiento", el modelo de
Aprendizaje Automático forma
patrones y usa estos patrones
para aprender y hacer
predicciones futuras.
"Se dice que un programa de computadora
aprende de la experiencia E con respecto a
alguna clase de tareas T y la medida de
rendimiento P, si su rendimiento en tareas en
T, medido por P, mejora con la experiencia E.
“
Mitchell, 1997
Estadística
Biología Visualización
Machine
Ingeniería
Learning Economía
Procesamiento Bases de
de Señales
Datos
2 Tipos de Aprendizaje
Automático
Aprendizaje Aprendizaje No Aprendizaje
Supervisado Supervisado Reforzado
• Modelos • Modelos • Un enfoque de la
Predictivos. Descriptivos. IA
• La máquina • La máquina • Aprendizaje
aprende entiende los datos. basado en los
explícitamente. • La evaluación es hallazgos.
• Predice el futuro a cualitativa o • La máquina
partir de datos indirecta. aprende a como
históricos. • No realiza actuar en un
• Resuelve predicciones, determinado
problemas de encuentra algo entorno.
clasificación y específico. • Maximiza los
regresión. hallazgos.
Dado un conjunto de datos
de entrenamiento: los
elementos, casos o instancias
En el aprendizaje no
supervisado, se aprende un
modelo a partir de un
conjunto de datos no
etiquetados.
En el aprendizaje
supervisado, se aprende un
modelo a partir de un
conjunto de datos
etiquetados.
3 Aprendizaje
Supervisado
En este tipo de aprendizaje, la máquina aprende de un
conjunto de casos previamente etiquetados por un experto
o de forma semi – automática basándose en los datos, es
decir, para un conjunto de datos de entrada conocemos de
antemano los datos correctos de salida. En el aprendizaje
supervisado, el objetivo es aprender una forma de mapear
las entradas en salidas, cuyos valores correctos son
proporcionados por un supervisor.
Clasificación
Característica 2
Característica 1
Clasificación
Característica 2
Característica 1
Límite de la decisión
Clasificación
Clasificación no lineal
GNU - GPL
Licencia Código
Abierto BSD
WEKA
• Está disponible libremente bajo la licencia GNU – GPL.
• Es muy portable, implementado en Java y puede correr
en casi cualquier plataforma.
• Es fácil de utilizar por un principiante gracias a
su interfaz gráfica de usuario.
• Weka soporta varias tareas estándar de minería de
datos, especialmente, preprocesamiento de
datos, clustering, clasificación, regresión, visualización,
y selección.
R
• R es un sistema para análisis estadísticos y gráficos.
• R tiene una naturaleza doble de programa y lenguaje
de programación.
• R se distribuye gratuitamente bajo los términos de la
GNU – GPL.
• R es un lenguaje Orientado a Objetos, interpretado,
con una sintaxis muy simple e intuitiva.
• R no es tan fácil de aprender como Python.
PYTHON
• Es software libre y gratuito con licencia BSD.
• Es multiplataforma, es un lenguaje de programación de
alto nivel e interpretado, es multiparadigma.
• Su filosofía de diseño enfatiza la simplicidad y
legibilidad de código.
• Posee un núcleo de lenguaje relativamente pequeño,
con el apoyo de magníficas librerías como: NumPy,
SciPy, Scikit-learn, Pandas, IPython, Matplotlib y otras.
Anaconda® es un administrador de paquetes, un
administrador de entornos, una distribución de Python y
una colección de más de 1,000 paquetes de código
abierto. Es de código abierto y fácil de instalar, y ofrece
soporte gratuito a través de su comunidad.
8 Ecosistema del ML
La Inteligencia Artificial es la ciencia de construir máquinas que…
Inteligencia
Artificial
Big Data
• Actualmente existen almacenados
+2.7 Zetabytes, se esperan 35
Zetabytes para 2020
• En 2012 la información digital
alcanzó a nivel mundial 2.837
exabytes. Puestos en DVDs, la torre
sería de 400.000 Kms, más que la
distancia de la Tierra a la Luna
• Google procesa más de 24
Petabytes/día, información
equivalente a varios miles de veces
la biblioteca del congreso de USA
Frecuencia a Diferentes
Crecimiento Exactitud de
la que se formatos y
exponencial los datos y
genera los estructuras
de datos del cálculo
datos de los datos
Data
Science
http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820
arvaldez@umsa.bo
aldo_valdez@hotmail.com