Caso Practico Ti016 Business Intelligence y Gestion Documental PDF Free

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

1

CASO PRÁCTICO

BUSINESS INTELLIGENCE Y GESTION DOCUMENTAL

NOMBRE:

FRANKLIN AURELIO BARRERA CELY

Desarrollo del caso práctico Business Intelligence y Gestion Documental –TI016

UNIVERSIDAD INTERNACIONAL IBEROAMERICANA, UNINI

MASTER DIRECCION Y ADMINISTRACION DE EMPRESAS

*Doctor:

Roberto Fabiano Fernández

COLOMBIA

2020
2

Contenido
INTRODUCCION...........................................................................................................................2
1.- ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para cumplir el primer paso de
la metodología CRIS-DM?..............................................................................................................3
2.- ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para comprender la naturaleza
de los datos involucrados en el negocio?.........................................................................................4
3.- Explique el proceso utilizado para acometer la preparación de los datos en la organización....4
4.- Mencione que etapa le sigue a la preparación de los datos y de qué modo fue realizada por el
equipo de trabajo..............................................................................................................................4
5.- ¿Cuáles fueron los algoritmos utilizados?..................................................................................5
6.- ¿De qué forma se logró garantizar la fase de evaluación en el proyecto?..................................5
7.- Explique brevemente la fase de implementación del proyecto..................................................5
CONCLUSIONES...........................................................................................................................7
BIBLIOGRAFIA.............................................................................................................................8
3

INTRODUCCION

El fin de este desarrollo del caso práctico ¨Aplicación de Minería de Datos para la detección de
Anomalías: Un caso de Estudio¨ (cravero leal & Sepulveda Cuevas, 2009) de la materia
“Business Intelligence y Gestion Documental”.

Actualmente los volúmenes de información que se están manejando en minería de datos se usan
para investigación y esta a su vez para el conocimiento en la toma de decisiones estratégicas que
las empresas pueden tomar.

(Castillo Arias, 2010) “término utilizado para describir el exceso de información disponible la
misma que a pesar de que sea importante no ha sido conjugada para el usuario saturando la
capacidad de uso y análisis de la información”.

Como metodología incluye descripciones de las fases normales de un Proyecto las tareas
necesarias en cada fase y una explicación de las relaciones entre las tareas.

Como modelo de proceso, CRISP-DM ofrece un resumen del ciclo vital de minería de datos,
contiene 6 fases con flechas que indican las dependencias más importantes y frecuentes entre
fases. (IBM, 1994-2012).

En esta época gracias a la minería de datos se generan grandes volúmenes que se utilizan para
información que nos permiten tomar decisión estratégica para las organizaciones gracias al
internet que a creada el concepto de Infoxicación.

Este término surge de la unión de las palabras Información e Intoxicación ya en resumen los
datos están por encima de la capacidad de capturarlos almacenarlos y analizarlos sin la ayuda de
herramientas informáticas.

Son varios modelos de procesos que han sido propuestos para el desarrollo de proyectos de Data
Mining tales como SEMMA (simple, explore, modify, model,assess).DMAMC
(definir,medir,analizar,mejorar,controlar) o CRISP-DM (cross industry standard process for data
mining) (oldemarrodriguez.com)
4

1.- ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para cumplir el primer
paso de la metodología CRIS-DM?

Precisar y entender el objetivo de la empresa, por medio de varias reuniones con la Gerencia, y
área administrativa de la oficina de fraude, que presentaron al equipo del proyecto los problemas
hallados en la oficina.

Balance de la situación actual y, los problemas detectados en las oficinas de fraudes, que esto nos
permitiría poder detectar posibles irregularidades.

Distribucion de personal para la revisión de los medidores

Ofrecimiento de técnicas de clustering para detectar anomalías

En cada revisión se escoge cualquier ruta (subsector) obteniendo una verificación completa.

2.- ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para comprender la
naturaleza de los datos involucrados en el negocio?

Incluir y observar el modelo de base de datos relacional del sistema de información de la


empresa, en particular las corporaciones que tienen conexión con el desarrollo de facturación, ya
que allí se encuentra información importante respecto a consumos.

Reunión con el grupo de expertos de la empresa, es de condición importante para verificar la


información de la base de datos que permita determinar periodos asociados.

3.- Explique el proceso utilizado para acometer la preparación de los datos en la


organización.

 Crear un depósito de Datos que encierre información importante con el objetivo de


hacer un Data Mart.
 Uso de utilización ETL para sostener el almacén de datos.
5

 Realizar una inspección histórica con el personal técnico.


 Implantación de nuevas estructuras, como la creación de nuevos campos a partir de otros
existentes y registros nuevos.

Este ciclo se desarrolló un almacén de datos los cuales se encargan de mantener la base de datos
transaccionales por medio de un crecimiento de origen de datos con antelación específicamente
llamado ETL.

4.- Mencione que etapa le sigue a la preparación de los datos y de qué modo fue realizada
por el equipo de trabajo.

La planificación de los datos fue en la segunda fase; de gran consideración, concentrarse con
personal experto de la empresa, chequear punto de gran significación como documentación,
nombres de atributos y el diccionario de datos, entre otros, lo cual nos permite así cargar los
datos en el data mart por medio de ETL diseñado para tal fin.

5.- ¿Cuáles fueron los algoritmos utilizados?

 K-means: es un algoritmo clasificado como método de particionado y recolocación, el


método de las k-medias es hasta ahora el más utilizado en las aplicaciones científicas e
industriales ya que representa cada uno de los clúster por la media(ponderada) de sus
puntos es decir por su centroide.
 COBWEB: es un algoritmo de clustering jerárquico que se identifica ya que utiliza
aprendizaje incremental realizando agrupaciones durante la ejecución del algoritmo se
forma un árbol donde las hojas representan los segmentos y el nodo de raíz engloba por
completos el conjunto de datos de entrada.
 EM: es un modelo que se distingue como Finite Mixture Models el cual se puede utilizar
para segmentar conjuntos de datos dentro de la clasificación de la sección 2.
6

6.- ¿De qué forma se logró garantizar la fase de evaluación en el proyecto?

Con el desarrollo de varias configuraciones capaces de las tecnologías, esto dependiendo de las
características de los datos obtenidos. Concluido con el algoritmo EM que fue el más idóneo para
cumplir el fin de detección de anomalías.

Con el COBWEB se pudo generar gran variedad de clústeres contrarrestando los resultados con
los datos preparados pudieron notar que gran cantidad de clusters tenían pocos registros al final
de las diferentes pruebas en los parámetros lograron obtener, se hicieron nuevas pruebas pero
ninguna ofreció un numero de clusters menos.

7.- Explique brevemente la fase de implementación del proyecto.

 Conocimiento del negocio


 Comprensión de los datos
 Organización de los datos
 Balance
 Demostración

En la etapa final, se implementa el modelo arrojado por el algoritmo EM y se ejecutó el sistema


de detección de anomalías que permitió obtener listas posibles de fraudes, esto por medio del
análisis que a su vez conlleva a una realización más fácil del trabajo a la oficina de fraudes de la
empresa.

De acuerdo a estas apreciaciones la oficina de fraude sabrá con precisión que cliente estaría
cometiendo fraude ya que al contar con el sistema de anomalías que predice los datos e
información que tiene la empresa sobre sus clientes, ya el personal de fraude no tiene que
escoger al azar un subsector sino mismo el sistema lo conecta automáticamente con el
contraventor.
7

CONCLUSIONES

La minería de datos es una herramienta clave muy importante en el entorno empresarial


altamente competitivo de hoy en día, que nos permite dominar acciones o decisiones tácticas o
estratégicas para las empresas teniendo en cuenta la gran cantidad de datos históricos lo cual nos
permite ver o detectar información de conjuntos grandes de datos, de la manera más asertiva
posible siendo su objetivo encontrar patrones, tendencias económicas, comportamientos del
consumo, investigación de la industria, análisis de información geográfica o reglas que explican
el comportamiento de los datos.
8

BIBLIOGRAFIA

http://www.sc.ehu.es/jiwdocoj/remis/docs/GarreAdis05.pdf

https://www.funiber.org/servicio-formacion-continua/ti/business-intelligence-y-gestion-
documental

https://www.kyoceradocumentsolutions.es/es/smarter-workspaces/business-
challenges/procesos/la-mineria-de-datos-como-herramienta-estrategica.html

https://www.ibm.com/support/knowledgecenter/es/SS3RA7_15.0.0/com.ibm.spss.crispdm.help/c
risp_select_data.htm

http://normasapa.net/2017-edicion-6/

También podría gustarte