0% encontró este documento útil (0 votos)
47 vistas19 páginas

Sesion1 Machine Learning

Este documento presenta una introducción a machine learning. Explica que machine learning consiste en extraer conocimientos y patrones de datos. Describe tres métodos principales: aprendizaje supervisado, no supervisado y por refuerzo. También cubre temas como organización de datos, lenguajes de programación útiles como Python y paquetes como Scikit-learn, NumPy y Pandas.

Cargado por

josue Ruiz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
47 vistas19 páginas

Sesion1 Machine Learning

Este documento presenta una introducción a machine learning. Explica que machine learning consiste en extraer conocimientos y patrones de datos. Describe tres métodos principales: aprendizaje supervisado, no supervisado y por refuerzo. También cubre temas como organización de datos, lenguajes de programación útiles como Python y paquetes como Scikit-learn, NumPy y Pandas.

Cargado por

josue Ruiz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 19

MACHINE L E A R N IN G

AM AC IÓN Y AP LICA C IONES


IONE S , L ENGUA JES D E P ROGR
SESIÓN 1: DEFINIC
CRUZ
PHD. WILLIAM RODRÍGUEZ
TICA
MAESTRÍA EN BIOESTADÍS
ELTRÁN
UNIVERSIDAD MANUELA B
2023
¿QUÉ ES MACHINE LEARNING?
• El aprendizaje automático (Machine Learning) consiste en extraer conocimientos, patrones o
comportamientos de una colección de datos. Es un campo de investigación transversal a la estadística,
la inteligencia artificial y la informática (Andreas C. Muller & Sarah Guido).
¿POR QUÉ MACHINE LEARNING?
• Desarrollar códigos <<manuales>> aumenta la posibilidad de error y exhibe
dos desventajas:

La lógica requerida
El diseño de los
reduce la
códigos requiere de
reutilización del
un humano experto.
código.
MÉTODOS DE MACHINE LEARNING
Aprendizaje supervisado

Aprendizaje no supervisado

Aprendizaje por refuerzo


APRENDIZAJE SUPERVISADO
Datos de entrada

2, 4, 6, 8,
10, 12 Número par

Etiqueta

¿14?
Números pares
APRENDIZAJE NO SUPERVISADO
Datos de entrada 1, 3, 19, 99,
101, 555,
1, 3, 26,19, 9543
100, 555, 101,
99, 12
232, 326, 9543 12, 26, 100,
232, 326
Identifica un patrón
APRENDIZAJE REFORZADO
ORGANIZACIÓN DE LA INFORMACIÓN
• Es necesario o aconsejable organizar los datos en una tabla (arreglo) cada fila puede representar
los datos a estudiar, por ejemplo la edad de un cliente o la descripción de una imagen diagnóstico
de un tumor codificada por la escala de grises de cada pixel.
• Cada entidad o fila se conoce como muestra (o punto de datos) en el aprendizaje automático,
mientras que las columnas -las propiedades que describen estas entidades –se denominan
características.
• Precaución: Ningún algoritmo de ML podrá hacer una predicción sobre datos de los que no tiene
información. Por ejemplo, si la única característica que tiene de un paciente es su apellido, ningún
algoritmo podrá estipular su sexo (Andreas C. Müller & Sarah Guido).
CONOCER EL PROBLEMA Y SUS DATOS
• ¿Qué pregunta o preguntas intento responder? ¿Los datos recopilados pueden
responder a dichas preguntas?
• ¿Los datos suministrados son suficientes para representar el problema en ML?
• ¿Qué características de los datos he extraído y permitirán hacer las predicciones
correctas?
• ¿De que forma puedo constatar que los resultados que arroja el algoritmo son correctos
LENGUAJES DE
PROGRAMACIÓN PARA ML

Parámetros de comparación

Velocidad Aprendizaje Costo

Comunidad Producción
PAQUETES ÚTILES DE PYTHON
Scikit-learn
matplotlib Ipython Jupyter NumPy
SciPy
https://scikit-learn.org/stable/user_guide.html
Plataforma Resaltador
cruzada de sintaxis

SPYDER
Soporte en
Consola
varios
interactiva
idiomas

Visor de
Explorador documentación,
de variables de gráficos y
datos
SPYDER
Explorador: variables, archivos
y ayuda.

Editor

Consola
NumPy Matriz renglón

Paquete de Python enfocado en Matriz columna


operaciones de álgebra lineal donde
es esencial el diseño de arreglos o Matrices de m x n dimensiones
matrices de n-dimensiones.
pa
nd Cargar Modelar
as
Dato
s
Manipular Preparar
DataFrame
• Estructura fundamental de la librería PANDAS, los DataFrame son esenciales en
Machine Learning supervisado, dado que permiten el etiquetado de datos, limitado a
matrices tridimensionales.
• Los DataFrame constan de tres componentes los datos, el índice(filas) y las
columnas.
NumPy Vs Pandas
• En NumPy no es posible el etiquetado de datos. Sin embargo, es posible construir
matrices de n-dimensiones.
• Pandas permite el etiquetado de datos, donde el arreglo 1D se denomina serie y
cuyas columnas son etiquetadas con los números naturales excluyendo el cero.
• En Pandas los arreglos bidimensionales son denominados DataFrame, las columnas
son etiquetadas con los números naturales y las filas son etiquetadas con el alfabeto.
• En pandas los arreglos 3D son denominados paneles o cubos.
Creando un DataFrame
• Lo primero es importar pandas, por lo que se debe digitar la siguiente instrucción:
import pandas as pd.
• Dado que nuestro principal interés es Machine Learning, solo nos concentramos en la
creación de dataframe, las series o paneles pueden ser abordadas de forma
autónoma dependiendo de las necesidades del investigador.
Bibliografía
• Andreas C. Müller & Sarah Guido, Introduction to Machine Learning with Python,
Dawn Schanafelt, first edition (2016).
• Rudolph Rusell, Machine Learning (2018).
• https://numpy.org/Links to an external site.
• https://aprendeconalf.es/docencia/python/manual/pandas/

También podría gustarte