ISILSesion1 IntroduccionPredictiveAnalytics PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 41

DIPLOMADO

BUSINESS INTELLIGENCE & ANALYTICS

CURSO: ANALITICA DE DATOS & DATA MINING SESIÓN 01


JORGE RODRIGUEZ
Estudios

Máster Europeo en Dirección de Marketing y Gestión Comercial (EOI España)


Ingeniero Estadístico (UNI)
Certified Data Analyst Training: Using Pig, Hive, And Impala With Hadoop (Cloudera)
Big Data Fundamentals Bootcamp (IBM)
Data Scientist’s Toolbox (Johns Hopkins University)
Marketing Digital (IAB España & Google)
Certified Data Miner Training (SAS)
Diplomado Gestión de Proyectos y CRM (UPC)

Docencia

Universidad Ricardo Palma


Universidad Autónoma
ESAN
ISIL
CTIC-UNI, INICTEL-UNI
Universidad Marcelino Champagnat
Universidad Agraria La Molina

Experiencia Profesional

Sub Gerente Comunidad Analytics CoE Big Data – Banco de Crédito del Perú
Jefe de Inteligencia de Negocios y Analítica Digital – El Comercio
Consultor de Soluciones Analíticas y Negocios Online – Strategic Solutions
Líder de Inteligencia de Negocios – Banco Falabella
Experto Data Mining - Telefónica
MoneyBall: El por qué de la Inteligencia Analítica
Contenido

1 Situación actual

2 Niveles de Analytics

3 Metodología

4 Plataforma y Herramientas

5 Anexos
Vivimos en un mundo…

• Nuevas capacidades para medir,


INSTRUMENTADO permitiendo ver el estado o condición
exacto de todo.

• Las personas, los sistemas y los objetos


INTERCONECTADO pueden comunicarse e interactuar unos con
otros en formas completamente nuevas.

• Los procesos y las cosas pueden


responder a los cambios con rapidez y
INTELIGENTE precisión optimizando los acontecimientos
futuros.

Fuente: IBM
Evolución de la tecnología

User Generated
Content
Social Network BIG DATA
Exabytes
User Click Stream Mobile Web Sentiment

External
Web Logs Dynamic Pricing WEB Demographics
Petabytes
Business Data Feeds
Offer History A/B Testing

Offer Details CRM Affiliate Networks HD Video


Terabytes
Segmentation Search Marketing Speech to Text

Behavioral Targeting Product/


Purchase
Detail ERP Customer Touches Service Logs
Gigabytes
Purchase Payment
Record Record Support Contacts Dynamic Funnels SMS/MMS

Implementación de nuevas tecnologías

Fuente: Teradata
Diferenciarse de la competencia.
Estadísticas

Fuente: IBM
Business Analytics: La importancia de los datos
Business Analytics es el top of mind para los
líderes de negocios…
La visibilidad en el análisis puede ayudar a los líderes empresariales a tomar decisiones con
mayor precisión, objetiva y económicamente en los diferentes sectores de negocios como el
financiero, retail, telecom, gobierno, educación, salud inclusive los deportes.

Analytics Descripción
Descriptive reporting Resumir y comparar los datos operativos y/o financieros en las variables de
(hindsight) negocios claves dentro de los plazos definidos. Estos se utilizan principalmente
para crear lagging indicators.
Retrospective analytics Analizar una o más fuentes de datos internas para descubrir información útil. Se
(insight) utiliza para crear lagging indicators, parámetros de referencia e insights.
Predictive analytics Los modelos matemáticos se aplican a múltiples fuentes de datos internos y
(foresight) externos para predecir eventos futuros. Se utiliza para crear leading indicators y
focalizarnos en las áreas críticas del negocio.
Tendencias y perturbaciones en el análisis
predictivo

Los clientes han perdido la


confianza en las compañías

La tecnología esta cambiando


la manera de interactuar de los
clientes

✓ Tiempo
✓ Localización
Las expectativas del cliente han
✓ Experiencias
✓ Personalizado cambiado
✓ Información

Las organizaciones tienen que


redescubrir a sus clientes
Contenido

1 Situación actual

2 Niveles de Analytics

3 Metodología

4 Plataforma y Herramientas

5 Anexos
Niveles de Analytics
Preguntas de Negocio
Contenido

1 Situación actual

2 Niveles de Analytics

3 Metodología

4 Plataforma y Herramientas

5 Anexos
Metodología CRISP-DM

• CRoss-Industry Standard Process for Data Mining.

• Metodología para el proceso de la Minería de Datos.

• Valida el proceso, dispone de modelos de referencia (plantillas),


ayuda a planear y administrar proyectos.

• Sin propietario. Desarrollado por algunos líderes de la industria:


IBM, SAS, SPSS/ISL, NCR, Daimler-Benz, OHRA.

• Alienta la inter-operatividad de herramientas.

• Neutral para la Industria y para la herramienta.

• Enfocado al negocio y al análisis técnico.


Metodología CRISP-DM: Visión General
Metodología CRISP-DM: Fases

Evaluación Despliegue
Conocimiento Conocimiento Preparación
Modelamiento y Análisis de o
del Negocio de los Datos de los Datos
Resultados Implementación

Determinación de Objetivos Recolección de datos Selección de datos Selección de la técnica de Evaluación de los Desarrollo del plan
de Negocio iniciales Razonamiento para la modelado resultados Desarrollo del plan
Background Lista de datos a solicitar inclusión/exclusión Técnicas de modelado Evaluación de los resultados
Objetivos de negocio Presunciones del modelado Data Mining en lo que Plan de supervisión y
Criterios de éxito de negocio Descripción de los datos Limpieza de datos concierne a criterios de éxito mantenimiento
Reporte de descripción de Informe de la limpieza de Generación de la prueba de de negocio Supervisión y plan de
Evaluación de la Situación los datos los datos diseño Modelos aprobados mantenimiento
Inventario de recursos Prueba de diseño
Requerimientos, Exploración de datos Construcción de datos Proceso de revisión Informe final del producto
presunciones y restricciones Reporte de exploración de Atributos derivados Construcción del modelo Revisión del proceso Informe final
Riesgos y contingencias los datos Registros derivados Ajuste de parámetros Presentación final
Costos y beneficios Modelos Determinación de los
Verificar la calidad de los Integración de datos Descripciones del modelo próximos pasos Revisión del proyecto
Determinación de los datos Combinación de datos Lista de posibles acciones Documentación de la
Objetivos Data Mining Informe de calidad de datos Evaluación del modelo Decisión experiencia
Objetivos Data Mining Formateo de datos Evaluación de modelos
Criterios de éxito Data Datos reformateados Revisión del ajuste de
Mining parámetros

Producir el Plan del


Proyecto
Plan del proyecto
Evaluación inicial de
herramientas y técnicas
Metodología SEMMA

Es una metodología propuesta por SAS que significa:


• (Sample, Explore, Modify, Model, Assess)
• Muestrea, Explora, Modifica, Modela, Evalúa
Metodología SEMMA: Fases
Muestreo
• Extrae muestras desde la población, para aplicar el análisis.
• Selecciona una muestra representativa del problema en estudio.
• Muestreo aleatorio simple. Muestreo aleatorio con reposición.
• Establece un nivel de confianza para la muestra.

Exploración
• Para simplificar el problema y optimizar la eficiencia del modelo.
• Usa herramientas de visualización y técnicas de estadísticas descriptiva.
• Determina las variables explicativas (entradas al modelo)

Modificación
• Formatea los datos, para ser utilizado por el modelo.

Modelamiento
• Establece una relación [variables explicativas y variables objetivo]
• Trabaja con un nivel de confianza determinado.
• Las técnicas son: análisis discriminante, métodos de agrupamiento, y análisis de regresión, redes
neuronales, técnicas adaptativas, lógica fuzzy, árboles de decisión, reglas de asociación y computación
evolutiva.

Evaluación
• Valora los resultados mediante el análisis de bondad del modelo.
• Contrasta con otros métodos estadísticos o con nuevas muestras.
Metodología de Berry y Linoff
Comparación de metodologías
Traducir problema de
Conocimiento del
negocio en problema
negocio
de minería

Muestreo
Conocimiento de los
datos
Seleccionar datos Exploración

Arreglar problema de
datos
Preparación de datos Modificación
Transformar datos

Construir modelo Modelamiento


Modelamiento
Evaluar modelo Evaluación

Evaluación SEMMA
(objetivos del negocio)

Puesta en operación Despliegue

CRISP
Evaluar resultados

Berry y Linoff
Contenido

1 Situación actual

2 Niveles de Analytics

3 Metodología

4 Plataforma y Herramientas

5 Anexos
Plataforma analítica

Plataforma Integral de Apoyo a la Toma de Decisiones Objetivos de Negocios


Cada
solución Segmentación
cubre las Perfil y Valor Incrementar
expectativas Base de
Clientes

Cross Sell y Incrementar


Up Sell
Avg. Ticket

ETL BI Analytics
Data Stage BO SAS Miner Retención Cliente
Oracle Micro Strategy IBM SPSS Valioso
QlikView Rapid Miner
Manejo y Reducción
▪ Extracción ▪ Estructura ▪ Optimización Optimización de de Costos de
▪ Transformación ▪ Presentación ▪ Pronósticos Campañas Campañas
▪ Carga ▪ Distribución ▪ Análisis estadístico
Análisis y Incrementar
Optimización de Lealtad
Canales
Datos Información Conocimiento

Tangible a Tangible al
Tecnología Negocio
Técnicas
Analíticas
Herramientas: Posicionamiento
Business Intelligence and Analytics Platforms Advanced Analytics Platforms
Business Intelligence and Analytics Platforms Data Science and Machine Learning Platforms
Contenido

1 Situación actual

2 Niveles de Analytics

3 Metodología

4 Plataforma y Herramientas

5 Anexos
http://www.kdnuggets.com/
http://www.analyticsconosur.com
https://www.analyticsvidhya.com/

https://www.analyticsvidhya.com/
https://www.kaggle.com/
https://www.datasciencecentral.com/
Algunas conclusiones…
• Analizar se ha convertido en una
necesidad para competir.

• Da soporte a la toma de decisiones.

• El análisis predictivo es una ventaja


competitiva.
✓ Pegado al negocio.
✓ Ahorro de costos
✓ Aumento de ingresos
✓ Rentabiliza los datos y la inversión en IT

• Hay múltiples aplicaciones en todos los


sectores.

• Permite incorporar al cuadro de mando


indicadores predictivos (KPP’s).
“El requisito del éxito es la prontitud en las decisiones”
Sir Francis Bacon
Dale a un hombre un pescado y lo alimentarás por un
día; enséñale a un hombre a pescar y lo alimentarás
para toda la vida.
¿Conoces a tus clientes?

También podría gustarte