Especialización enAnalytics con
Python
SESIÓN X
Docente: Arnaldo Eduardo Alvarado Vallejos
Reglas de Juego
Se requiere puntualidad para un mejor desarrollo del curso.
Para una mayor concentración mantener silenciado el micrófono durante la
sesión.
Las preguntas se realizarán a través del chat y en caso de que lo requieran
podrán activar el micrófono.
Realizar las actividades y/o tareas encomendadas en los plazos determinados.
Identificarse en la sala Zoom con el primer nombre y primer apellido.
Contenido – Módulo 12
• Diferencias entre los conceptos de Big Data, IA, Machine Learning yDS.
• ¿Qué es Data Science? Casos de uso, entregables y aplicaciones principales.
• Desarrollo y despliegue de algoritmos de machine learning en la industria.
• Etapas en el diseño de modelos de Machine Learning.
• Casos de uso y aplicaciones en distintos sectores.
Veamos los principales términos
Veamos los principales términos
El mundo se transforma tecnológicamente y nosotros requerimos estar interconectados…
Por cada minuto que transcurre, se generan grandes cantidades de datos ….
Explosión del acceso a la
información
La cuota de mercado de smartphones
alcanzó más del 50% en el 2016, sin
embargo se ralentiza , dando origen a
una nueva tecnología IoT.
Volumen de Información
El volúmen total de datos en el mundo se
duplica cada 18meses.
Y con esto, el volumen y la velocidad de procesamiento tuvieron un crecimiento
acelerado…
Capacidad y Costos de
Almacenamiento
La capacidad de almacenamiento crece en
forma exponencial, y su costo desciende al
mismo ritmo, almacenar 1GB en 1980 costaba
$10MM y hoy apenas 10 centavos de dólar.
Capacidad de Procesamiento
La capacidad de ejecutar instrucciones
por segundo por cada $ 1000 de
procesador se ha multiplicado por 300
desde el 2000.
Veamos los principales términos
Veamos los principales términos
Tipos de aprendizaje automático
Algunos algoritmos de Machine Learning
Capa de Capa Capa de
entrada oculta salida
No
Traf. Churner
Entrada 1 1 Offnet
1 >2h
Churner
2 Edad
Entrada 2
Salida <45
2 1 No
Factu Churner
Entrada 3 3 … >120
… m
Churner
Entrada n n
Regresión Redes Neuronales Árbol de Decisión
“Un modelo es una “Los modelos son “A un modelo no se le exige absoluta
representación simplificada de errados pero útiles” veracidad, sino utilidad de acuerdo a
la realidad” los objetivos para los que fue creado”
Veamos los principales términos
Deep Learning
“No sé cómo hacer que esta computadora entienda lo que sé. Tal vez pueda crear su propia estructura y
descifrar los datos para sí mismo”.
El deep learning es un tipo de machine learning que entrena a una computadora para que realice tareas como las
hacemos los seres humanos, como el reconocimiento del habla, la identificación de imágenes o hacer predicciones.
Reconocimiento de imágenes, videos, audios y demás …
Yen los asistentes virtuales o chatbots …
Etapas en el diseño de modelos de machine learning
Flujo de trabajo del Aprendizaje Automático
ESTADO INGRESOS Construcción Inferencia
REEMBOLSO FRAUDE
ID CIVIL ANUALES
1 SI SOLTERO S/ 1,000 NO Algoritmo de
2 SI CASADO S/ 5,000 NO Aprendizaje
Entrenar
3 NO CASADO S/ 3,500 SI
4 SI VIUDO S/ 4,500 NO
Generar
5 NO SOLTERO S/ 2,000 NO
el
6 NO SOLTERO S/ 1,500 SI Modelo
Datos de Entrenamiento
REEMBOLSO
ESTADO INGRESOS
FRAUDE
Modelo
ID CIVIL ANUALES Nuevos
7 SI SOLTERO S/ 4,000 NO Individuos
8 SI CASADO S/ 5,500 NO
9 NO CASADO S/ 6,500 SI Aplicar
el
Tabla de Validación Modelo
10
Evaluar
Tipos de
Tópico Clasificación Predicción Asociación
Métodos
Algoritmos Supervisado • Regresión Logistica. • Regresión Lineal.
a Utilizar • Redes Neuronales. • Regresión Penalizadas.
• Decisión Tree. • ARIMA (series de tiempo).
• Random Forest. • Redes Neuronales Recurrentes
• K-NN. (LSTM).
• XGBoost
No Supervisado • K-Means. • Collaborative Filtering (Recomendación).
• PAM. • Apriori
• CLARA, CLARANS.
• Redes Neuronales.
Evaluación Supervisado. • Matriz de Confusión. • Indicadores:
de Modelos • Indicadores de: • Error Absoluto (Valor
• Accuracy, Predicho – Valor
Precision, Recall, Observado).
• ROC. • Error Abosoluto al
Cuadrado.
• Error Absoluto Relativo.
• Distribución del Error:
debe tender a una
distribución normal
(media=0).
No Supervisado. • Elbow. • Indicadores:
• Silhouette Analysis. • Soporte: % de veces que aparece el (x,y)..
• Confianza: soporte (x,y)/soporte (x).
• Lift: soporte(x,y)/(soporte(x).soporte(y)).
Aplicaciones • Segmentación de • Pronósticos de Ventas. • Armado de Combos/Paquetes para
Mercados. • Falla de Equipos. comercialización.
• Reconocimiento de • Recomendación de Items.
Imágenes.
• Agrupación de
documentos por
categorías.
Casos de uso y aplicaciones en distintos sectores
PREDICTOR PRICING PERSONALIZACIÓN PREDICCIÓN
INGRESOS PRODUCTOS OFERTAS FRAUDES
PREDICCIÓN OPTIMIZACIÓN PERSONALIZACIÓN ANALISIS TEXTUAL
CHURN LOCACIÓN ACCIONES CONTEXTUAL
PREDICCIÓN
SEGMENTACIÓN CLONES DE IDENTIFICACION
PROVISIONES
CLIENTES CLIENTES EMPLEADO 360°
PREDICTOR INGRESOS
1 2
Á quién lepodemos Bancarizados o No
predecir el ingreso? Bancarizados?
4
3
Porqué es
importante? Impacto!
PRICING PRODUCTOS
1 2
Cuál es la relación
Elasticidad? entre p y q?
4
3
Se decide el Pricing
del producto. Caso: Tipo Cambio
PREDICTOR DE FRAUDES
Se intenta realizar Mientras llega al La trx se revisa, y se tiene
1 una trx! 2 Banco, Peligro! que tomar una decisión.
3
Reputación/Imagen 6 Impacto en el Negocio! 5 Decisión! 4
PREDICTOR CHURN
1 2 3
Definición Churn Segmentos Churn? Desbalance Muestra
5
4
Todos valen lo Retención de
mismo? Clientes
IDENTIFICACIÓN EMPLEADO 360°
1 2 3
Adquisición del Training Motivación
Talento
5
4
Retención del
Promociones
Talento
PERSONALIZACIÓN OFERTAS
Tenemos muchas ofertas! Definimos afinidades o similitudes.
1 2
3 De acuerdo a lo anterior
recomendamos si
queremos dar algo que
normalmente consume o
dándole una nueva
experiencia de usuario.
MARKET BASKET ANALYSIS
SEGMENTACIÓN DE CLIENTES
❑ Arnaldo Eduardo Alvarado Vallejos
[email protected]
951611996
https://www.linkedin.com/in/arnaldoalvaradovallejos/