Solucion Caso Practico
Solucion Caso Practico
Solucion Caso Practico
Software.
SOLUCIÓN DE
CASO PRÁCTICO
TI016 - Business Intelligence y Gestión Documental
“Metodología CRISP-DM”
Ing. Omar Orlando Orrala Palacios
25-5-2019
Solución de caso práctico MDEISW - TI016
Introducción
CRISP-DM inicia como un proyecto a mediados de 1997 con el auspicio de la Comisión Europea,
Uno de los patrocinadores más importantes es Daimler Chrysler, ahora parte de SPSS.
CRISP-DM, cuyas siglas en ingles son: Cross-Industry Standard Process for Data Mining, es un
método cuyo objetivo fue el de diseñar una metodología estándar para el modelamiento de
proyectos de minería de datos o Data Mining; completamente flexible e independiente del tipo de
industria, permite un proceso de desarrollo rápido, barato, administrable y confiable y sin límites
en el tamaño del proyecto.
Como metodología, incluye descripciones de las fases normales de un proyecto, las tareas
necesarias en cada fase y una explicación de las relaciones entre las tareas.
Como modelo de proceso, CRISP-DM ofrece un resumen del ciclo vital de minería de datos que
integran 6 fases:
1. Comprensión del negocio
2. Comprensión de los datos
3. Preparación de los datos
4. Modelado
5. Evaluación
6. Implementación
El primer paso de CRISP-DM consistió en la comprensión del negocio, que desde una perspectiva
de investigación, consultado de José Supo, (2016), manifestó que esta fase, se basa en conocer la
línea de investigación del proyecto, el propósito u objetivo específico en estudio, siendo en
investigación científica los objetivos operativos.
En concordancia con Jackson, (2002), el primer paso consiste en el ENTENDIMIENTO DE
NEGOCIOS, que se enfocó en concebir los objetivos y requisitos del proyecto de una perspectiva
empresarial, para luego convertir este conocimiento en la definición del problema de minería de
datos, y en un plan preliminar diseñado para lograr los objetivos.
De manera global desde el punto de vista del negocio las acciones realizadas consistieron en:
En esta fase, el modelo se presentó bastante depurado y con una buena calidad desde la
perspectiva del análisis de datos. Antes de seguir con el paso de divulgación del modelo fue
necesario evaluarlo nuevamente tomando en consideración los diferentes pasos que se ejecutaron
para la consecución del mismo. Con esto se aseguró que el modelo realmente cumplió en
satisfacer las necesidades y objetivos planteados por el negocio. Una forma de determinar esto
fue verificando si existía algún requerimiento importante del negocio que no había sido cubierto
completamente por el modelo. Luego de que fue validado el modelo se procedió con la toma de
la decisión del uso de los resultados obtenidos por el mismo. Aun así, siempre se podrá
perfeccionar el modelo.
• Plan de implementación.
• Plan de monitoreo y mantención.
• Informe final.
• Revisión del proyecto.
Conclusiones
La metodología CRISP-DM resulta ser concordante con el nivel investigativo, ya que sus seis
pasos pueden adaptarse a las líneas de investigación, y es compatible con el método científico:
✓ Dentro de las bases exploratoria, lo relacionamos con la comprensión del negocio.
✓ En lo descriptivo, relacional, lo relacionamos con la comprensión de los datos.
✓ En lo explicativo, realizamos la selección de variables, estamos anta la preparación de los
datos.
✓ En lo predictivo, se crea un modelo donde debemos encontrar la mayor capacidad de
predicción.
✓ En su aplicativo, evaluamos el modelo y su utilización, encontrando siempre posible el
mejoramiento de la capacidad predictiva del modelo con los tomadores de decisiones.
Bibliografía
Jackson, J. (2002). Data Mining; A Conceptual Overview. Communications of the Association
for Information Systems, 8, 267-296. https://doi.org/10.17705/1CAIS.00819
José Supo. (2016). Metodología CRISP-DM y la Investigación Científica - YouTube.
Recuperado de https://www.youtube.com/watch?v=7Op6EJVaZF4