Tesis de Inteligencia de Negocios PDF
Tesis de Inteligencia de Negocios PDF
Tesis de Inteligencia de Negocios PDF
PRESENTA:
PAMELA GUTIRREZ MELNDEZ
DIRECTORES DE TESIS:
DR. FERNANDO VZQUEZ TORRES
DR. JAVIER GARCA GARCA
MXICO, D.F.
2012
Agradecimientos
INDICE GENERAL
GLOSARIO ...................................................................................... i
RESUMEN ...................................................................................... ii
ABSTRACT.................................................................................... iii
INTRODUCCIN............................................................................ iv
Captulo I
1.1
Historia.............................................................................................................................................1
1.2
1.3
1.3.1.
Componentes .............................................................................................................................8
1.3.1.1.
Fuentes de Datos....................................................................................................................8
1.3.1.2.
ETL ........................................................................................................................................10
1.3.1.3.
1.3.1.4.
KPI.........................................................................................................................................14
1.3.1.5.
Cubo .....................................................................................................................................15
1.3.1.6.
1.3.1.7.
Presentacin .........................................................................................................................20
1.4
PYME ..............................................................................................................................................22
1.4.1.
Competitividad .........................................................................................................................22
1.4.2.
Productividad ...........................................................................................................................23
Captulo II
2.1
2.1.1.
2.1.2.
2.2
Metodologas existentes................................................................................................................31
2.2.1.
CRISP-DM..................................................................................................................................31
2.2.2.
2.2.3.
METODOLOGIAS AGILES...........................................................................................................38
2.2.4.
2.2.5.
METODOLOGIA INMON............................................................................................................46
2.2.6.
X-Warehousing .........................................................................................................................49
2.2.7.
2.2.8.
Comparativa .............................................................................................................................50
2.3
Herramientas BI OS........................................................................................................................52
2.3.1.
2.3.2.
2.3.3.
OpenI (03).................................................................................................................................54
2.3.4.
2.3.5.
CloverETL (05)...........................................................................................................................55
2.3.6.
2.3.7.
2.3.8.
2.3.10.
2.3.11.
2.4
Herramientas BI Propietarias.........................................................................................................58
2.4.1.
2.4.2.
2.4.3.
Cognos (14)...............................................................................................................................59
2.4.4.
2.4.5.
2.5
2.6
FCE .................................................................................................................................................62
Captulo III
3.1
Negocio ..........................................................................................................................................66
3.1.1.
3.1.1.1.
Misin ...................................................................................................................................67
3.1.1.2.
Visin ....................................................................................................................................67
3.1.1.3.
Objetivos ..............................................................................................................................67
3.1.1.4.
Metas....................................................................................................................................67
3.1.1.5.
3.1.2.
3.1.3.
3.1.4.
KPI.............................................................................................................................................68
3.1.5.
3.2
Planeacin......................................................................................................................................69
3.2.1.
Alcance .....................................................................................................................................69
3.2.2.
Actividades ...............................................................................................................................69
3.2.3.
Recursos ...................................................................................................................................69
3.2.4.
Riesgos......................................................................................................................................70
3.2.5.
Plan ...........................................................................................................................................70
3.3
Desarrollo.......................................................................................................................................70
3.3.1.
3.3.1.1.
Seleccin Herramientas........................................................................................................71
3.3.1.2.
Instalacin ............................................................................................................................71
3.3.2.
3.3.2.1.
3.3.2.2.
HLDM ....................................................................................................................................72
3.3.2.3.
MLDM ...................................................................................................................................72
3.3.2.4.
LLDM.....................................................................................................................................72
3.3.2.5.
Construccin.........................................................................................................................72
3.3.3.
Datos ........................................................................................................................................73
3.3.3.1.
3.3.3.2.
3.3.3.3.
Pruebas .................................................................................................................................74
3.3.3.4.
3.3.4.
Minera .....................................................................................................................................74
3.3.4.1.
3.3.4.2.
3.3.4.3.
3.3.5.
3.3.5.1.
3.3.5.2.
Indicadores ...........................................................................................................................75
3.3.5.3.
Cubos ....................................................................................................................................75
3.3.6.
Presentacin .............................................................................................................................76
3.3.6.1.
Reportes ...............................................................................................................................76
3.3.6.2.
Dashboards...........................................................................................................................76
3.3.6.3.
ScoreCards ............................................................................................................................76
3.4
Validacin ......................................................................................................................................76
3.5
Implementacin .............................................................................................................................77
Captulo IV
4.1
Negocio ..........................................................................................................................................78
4.1.1.
4.1.1.1.
Misin ...................................................................................................................................78
4.1.1.2.
Visin ....................................................................................................................................79
4.1.1.3.
Objetivos ..............................................................................................................................79
4.1.1.4.
Metas....................................................................................................................................79
4.1.1.5.
4.1.2.
4.1.3.
4.1.4.
KPI.............................................................................................................................................81
4.1.5.
4.2
Planeacin......................................................................................................................................82
4.2.1.
Alcance .....................................................................................................................................82
4.2.2.
Actividades ...............................................................................................................................82
4.2.3.
Recursos ...................................................................................................................................82
4.2.4.
4.2.5.
Riesgos......................................................................................................................................84
4.2.6.
Plan ...........................................................................................................................................84
4.3
Desarrollo.......................................................................................................................................84
4.3.1.
4.3.1.1.
Seleccin Herramientas........................................................................................................85
4.3.1.1.1.
Jaspersoft .............................................................................................................................85
4.3.1.1.2.
SpagoBI .................................................................................................................................85
4.3.1.1.3.
OpenI ....................................................................................................................................86
4.3.1.1.4.
Microstrategy .......................................................................................................................86
4.3.1.2.
Instalacin ............................................................................................................................86
4.3.1.2.1.
Jaspersoft .............................................................................................................................86
4.3.1.2.2.
SpagoBI .................................................................................................................................95
4.3.1.2.3.
Microstrategy .......................................................................................................................95
4.3.2.
4.3.2.1.
4.3.2.2.
HLDM ..................................................................................................................................103
4.3.2.3.
MLDM .................................................................................................................................103
4.3.2.4.
LLDM...................................................................................................................................104
4.3.2.5.
Construccin.......................................................................................................................106
4.3.3.
Datos ......................................................................................................................................107
4.3.3.1.
4.3.3.2.
4.3.4.
4.3.5.
Presentacin ...........................................................................................................................114
CONCLUSIONES........................................................................ 117
ANEXO I. RapidMiner ................................................................ 119
BIBLIOGRAFA .......................................................................... 124
GLOSARIO
PyME.
Productividad.
Competitividad.
Dato.
Informacin.
Conocimiento.
OLAP.
Procesamiento
analtico
en
lnea,
permite
utilizar
estructuras
ROLAP.
MOLAP.
HOLAP.
KDD.
XML.
RESUMEN
En este trabajo de tesis podremos encontrar la propuesta de una metodologa para la
implementacin de soluciones de inteligencia de negocios enfocada en PyMEs. Esta
metodologa se realizo en base a la investigacin realizada en la que se documentaron
diversas metodologas como CRISP-DM X-Warehousing.
Con la finalidad de tener una mejor referencia y justificacin de este trabajo, se hace un repaso
de cmo afecta la inteligencia de negocios la productividad y competitividad en las PyMEs. As
mismo se hace un recuento de los beneficios que puede traer para las PyMEs la inteligencia
de negocios. Se documentan diversas metodologas de inteligencia de negocios que se utilizan
de referencia para la metodologa propuesta en este trabajo de tesis. Recopilamos informacin
bsica de diversas herramientas de inteligencia de negocios que se encuentran en el mercado
siendo propietarias y de tipo Open Source.
As mismo se hace una pequea muestra del uso de otro tipo de herramientas open source
para la inteligencia de negocios enfocadas en la parte de minera de datos como lo es
rapidminer.
ii
ABSTRACT
In this thesis work we find the proposal of a methodology for the implementation of business
intelligence solutions focused on SMEs. This methodology was performed based on research
conducted in the various methodologies that were documented as CRISP-DM or XWarehousing.
Throughout this work, we first find an overview of the history of business intelligence has
evolved allowing us to know how this type of solution. Following this we can know the state of
the art business intelligence for the documentation of the work that has been done in the field of
information management. Mention is also made of the main concepts related to business
intelligence in order to understand the rest of this paper. Also as part of the context of this work
are listed SMEs and the main concepts that are relevant to this thesis, such as productivity and
competitiveness.
In order to have a better reference and justification of this work, there is a review of how
intelligence affects business productivity and competitiveness of SMEs. It also takes account of
the benefits it can bring to SMEs business intelligence. Documented various business
intelligence methodologies that are used as a reference for the methodology proposed in this
thesis. We collect basic information on various business intelligence tools that are in the market
to be proprietary and Open Source.
Finally in this work we can find the implementation of this methodology on a SME dedicated to
sell fast food. We can observe the use of different tools as SpagoBI, Jaspersoft and
Microstrategy. Also we can read about the usage of another tool of data mining called
RapidMiner.
iii
INTRODUCCIN
La inteligencia de negocios es una solucin que permite a las empresas acceder a informacin
que les permite tomar decisiones, esta informacin generalmente proviene de diversas fuentes
por lo que la solucin de inteligencia de negocios se encarga de integrarla y transformarla para
almacenarla en una estructura especial conocida como Data Warehouse. El Data Warehouse
cumple con ciertas caractersticas para su construccin contando principalmente con 2 tipos de
elementos, las tablas de hechos y las dimensiones. Este tipo de modelado nos facilita el usar
herramientas multidimensionales que nos permiten hacer el cruce de los hechos con diversas
dimensiones que les den un sentido real para el negocio. El resultado de una solucin de
inteligencia de negocios generalmente lo vemos de manera visible por medio de herramientas
web que nos permiten visualizar los reportes que se generen con la informacin obtenida de la
solucin.
Este tipo de soluciones es muy popular para empresas de gran tamao, sin embargo y debido
a que gran parte de las empresas que existen en Mxico son PyMEs. Este trabajo de tesis
busca ofrecer a este amplio mercado una metodologa que les permita integrar prcticas de
inteligencia de negocios.
Proporcionar a las PyMEs una metodologa que les permita la integracin de una
solucin de inteligencia de negocios que sea adecuada a su nivel de madurez, con lo
cual buscamos que la implementacin sea amigable para que sean aceptados los
cambios por los empleados de la empresa de una manera ms transparente.
Permitir que estas empresas al tener a su alcance este tipo de metodologas y por lo
tanto este tipo de soluciones, sean capaces de incrementar su productividad lo que las
llevara a ser ms competitivas.
Otro de los puntos que hace que este tipo de soluciones se ven inalcanzables para las PyMEs,
son los costos que implica el construir una solucin de este tipo. Es por esto que este trabajo
de tesis incorpora la mencin de diversas herramientas de tipo Open Source como una opcin
para tener accesible herramientas que permiten el desarrollo y explotacin de una solucin de
inteligencia de negocios.
iv
Historia
Desde este punto y hasta la dcada de los 60s la Inteligencia de Negocios comienza a tomar
un rumbo dentro de las Tecnologas de Informacin es con el surgimiento del concepto de los
Sistemas de Soporte a Decisiones, que provee a los usuarios con un acceso sencillo a
modelos de decisin con la finalidad de apoyar las tareas de toma de decisiones (Benki &
Papastathopoulos, 2009). As mismo a finales de esta dcada surge un concepto principal para
la evolucin de la Inteligencia de negocios, surge el concepto de base de datos.
En la dcada de los 80s Ralph Kimball y Bill Inmon crean el concepto de DataWarehouse,
proporcionando una visin del concepto muy completa y la cual se sigue considerando como
base en los desarrollos de Inteligencia de Negocios. En esta misma dcada surgieron las
primeras aplicaciones de reporto, sin embargo tanto las aplicaciones de base de datos como de
reporteo no permitan la independencia del usuario final por la complejidad en su manejo. A
finales de esta dcada se formaliza el concepto de Inteligencia de Negocios por Howard
Dresner quien considera el BI como un conjunto de metodologas cuyo principal objetivo es
aumentar la eficiencia de las empresas. De esta misma manera durante esta dcada existe una
evolucin de los sistemas surgiendo los sistemas de Informacin Ejecutivos.
Para la dcada de los 90s contando con un poco ms de claridad sobre lo que consista la
Inteligencia de Negocios, lo que provoca un surgimiento desmedido de herramientas de BI que
hacan que el acceso a la informacin fuera ms sencillo. Para entonces ya se identifican
Sistemas de BI como parte de la evolucin.
En Mxico ha existido una tendencia por generar una gran cantidad de consultores de calidad
especializados en Inteligencia de Negocios, principalmente expertos en ciertas herramientas de
BI, aunque tambin hay expertos en ciertas fases de la Inteligencia de Negocios como puede
ser el front-end, ETL, definicin y administracin.
I-1. Historia BI
En el ao de 2007 (Watson & Wixom, 2007) consideraron que el marco del BI se conformaba
principalmente por 2 actividades:
1. Datawarehousing
2. BI
Entre los beneficios que resaltaban la reduccin de inversin en infraestructura debido a que se
eliminaban los datos redundantes y los datos duplicados, haciendo la explotacin de la
informacin ms eficiente, permitiendo la estrategia de negocios.
1. Se pretende hacer ms amigable el front-end para los usuarios, y que este llegue a
ms usuarios cada vez, sin que estos requieran de alguna capacitacin.
2. Tambin se busca no solo apoyar la toma de decisiones en niveles estratgicos, sino
que se incluyan los procesos del BI en procesos operativos lo que tambin impactara
en toda la empresa, esto bajo un esquema de tiempo real, entregando informacin
oportuna y relevante a cada usuario dependiendo de sus necesidades reales.
3. Aprovechando los beneficios del BI ciertas empresas lo pueden utilizar como una
oportunidad para obtener ingresos ofreciendo mantener y administrar toda la
infraestructura de BI para ofrecer como servicio la entrega de la informacin necesaria
por los clientes.
4. Aprovechar la integracin de los datos para la implementacin de motores de
bsqueda potentes que permita a los usuarios realizar bsquedas sobre temas de la
empresa y obtener resultados tan acertados como si realizaran la bsqueda en su
motor de bsqueda predilecto.
5. Siguiendo el avance de la tecnologa hay que explotar los tems mviles como son los
Smartphone y los ipads, para que los usuarios tengan en cualquier momento un
resumen de la informacin que realmente les sea til.
Por otro lado, Diego Arenas en su artculo Predicciones BI 2010-2012 indica las siguientes
tendencias:
Existir una tendencia por realizar proyectos de BI pequeos que tengan un gran
impacto en poco tiempo,
Para el mercado de las PyMEs se sabe que estas requieren estructuras sencillas de
Inteligencia de Negocios a bajo costo y que no les requieran hardware y software adicional. Es
por esto que se tiene la opcin de ofrecer una mezcla conceptos con la finalidad de generar
una solucin integral que cubra sus necesidades, apoyndose en el uso de herramientas Open
Source. Basndose en arquitecturas ROLAP, herramientas ETL y el modelado y anlisis de
procesos (Grabova, Darmont, Chauchat, & Zolotaryova, 2010).
Existe otro estudio, con una arquitectura similar al anterior, enfocado en aplicar Inteligencia de
Negocios con agentes con el objetivo de reducir los costos de una solucin de Inteligencia de
Negocios. En uno de estos estudios (Feng, Li, Gao, Liu, & Xu, 2010) la arquitectura del sistema
propuesto se divide en tres niveles:
As mismo existen otros trabajos (Li, Li, & Zhu, 2010) enfocados en el minado del conocimiento
con la finalidad de dar soporte a la toma de decisiones. De acuerdo a este trabajo, proponen un
marco basado en Extenics (una nueva disciplina enfocada en el trato de problemas
contradictorios formulando un modelo, analizndolos en objetos, las caractersticas y las
mtricas relacionadas) y la administracin de conocimiento que consiste en 6 pasos:
1. Coleccin de informacin
2. Expresar todo el conocimiento e informacin en elementos de materia y son
almacenados en la base de elementos bsicos
3. Se elige un elemento materia como punto de partida
4. Se calcula el siguiente elemento de materia
5. Se hace un ciclo hasta considerar todos los elementos materia
6. Se valida las relaciones realizadas
La toma de decisiones requiere de informacin comprensible y conocimiento. De acuerdo a
este artculo se puede construir un cubo de informacin que contenga integrada la informacin
de la fuente de datos al cual se le pueda aplicar el mtodo de extensin que nos permita
generar estrategias que resolvern los problemas contradictorios.
Existe otro estudio (Li, Zhu, & Pan, 2010) que se basa en la combinacin de Extenics y la
minera de datos y cuyo objetivo es cultivar conocimiento en las PyMEs. El mtodo de siembra
del conocimiento consiste en identificar el problema, para posteriormente identificar el
conocimiento relativo a este problema.
1. Distribuir la informacin sobre el problema de negocio y las condiciones bajo las cuales
se establece el objetivo.
2. Agregar informacin o conocimiento relacionado a problemas en la plataforma.
3. Conectar informacin o conocimiento por elemento, caractersticas y mtricas.
4. Evaluar el conocimiento clasificado para seleccionar el conocimiento factible para
transformaciones.
5. Recibe entregables
6. Validar que se puedan tomar decisiones y resolver problemas
Proponen un rbol de conocimiento para almacenar el conocimiento generado por el cultivo de
conocimiento por medio de un algoritmo propuesto. Este algoritmo localiza el problema con sus
elementos base para despus recolectar informacin y conocimiento resultado del proceso de
minera de datos. Se selecciona el conocimiento como semilla y se cultiva como elementos
base. Entonces se evala si el rbol de conocimiento crecer o si es necesario ms
conocimiento mediante interaccin humana. Es un proceso iterativo hasta cubrir las
necesidades de los tomadores de decisiones.
En otro estudio (Xie, 2009) se propone un modelo que este enfocado en la mejora del
conocimiento. Este modelo de administracin de conocimiento est basado en minera de
datos. El modelo inicia con la preparacin de los datos, para esto primero se debe definir el
tema que se trabajar, esto para poder establecer los requerimientos y propsitos que cubrir
la minera de datos y finalmente se define el problema que se quiere resolver. Se seleccionan
las fuentes de datos de acuerdo a los requerimientos, se procesan los datos integrndolos y
transformndolos. Hace uso de diversas tcnicas de minado de datos como son redes
neuronales, rboles de decisin, modelos lgicos, clasificacin y anlisis cluster entre otros
modelos estadsticos.
1.
2.
3.
4.
5.
6.
Adquisicin de conocimiento
Almacenamiento del conocimiento
Concentracin y compartimento del conocimiento
Aplicacin e innovacin del conocimiento
Recuperacin del conocimiento
Evaluacin del desempeo del conocimiento
Para que esta propuesta funcione tambin se deben implementar ciertas estrategias que
permitan un buen funcionamiento de la administracin del conocimiento. Por ejemplo menciona
la importancia de tener una buena administracin de personal puesto que el personal es quien
mantendr el conocimiento en constante actualizacin y estos deben estar acostumbrados a
cooperar con sus compaeros. La plataforma debe ser de fcil uso proporcionando informacin
en tiempo real. Es necesario mantener motivados a los empleados por lo que recomienda la
implementacin de un sistema de reconocimiento y castigo para motivar a los empleados en la
proteccin intelectual as como reducir la perdida de talentos. Se debe regular el proceso de
aprendizaje de los empleados.
Inteligencia de Negocios
I-2. Contexto BI
1.1.1. Componentes
En esta seccin se hace mencin de los componentes bsicos que conforman una solucin de
inteligencia de negocios con la finalidad de tener una mejor comprensin de este trabajo de
tesis.
1.1.1.1.
Fuentes de Datos
Las fuentes de datos son aquellas que contienen los datos en su mayor nivel de detalle,
generalmente vienen directamente de la operacin diaria del negocio pero puede tener
diferentes presentaciones. Estas conservan la informacin que el cliente considera relevante
segn lo que ha definido pudiendo apoyarse o no de Tecnologas de Informacin. Por lo tanto
las fuentes de datos se pueden clasificar en 2 grupos:
Fuentes de Datos Estructuradas. Son aquellas fuentes de informacin que tienen cierto
orden y son fcilmente manipuladas para todo el proceso de BI.
8
As podemos decir que las fuentes de datos que pueden existir son:
Fuente
Descripcin
Ilustracin
pueden
estructurados
ser
no
estructurados.
Hojas de clculo
Son
hojas
que
pueden
que
permite
Bases
de
Datos
Transaccionales
OLTP
de
manera
eficiente
en
inserciones actualizaciones y
borrados
de
registros.
Generalmente
son
de
Datos
de
Aplicaciones Especializadas
Las
bases
de
datos
Pueden
servir
como
fuente de informacin.
MDX
MDX
Las fuentes de datos listadas anteriormente solo son algunas de las existentes, siendo estas
las ms comunes. Como podemos ver dependiendo de la complejidad que conlleve los
procesos de negocio puede que este requiera de diversas fuentes de datos, adems de que lo
ideal para cualquier desarrollo sera que estas fuentes de datos se encontraran bien
documentadas para poder trabajar sobre ellas, aunque en la vida real, es poco comn
encontrar fuentes de datos documentadas.
As mismo existe la posibilidad de que no se utilicen todas las fuentes de datos existentes, tal
vez exista redundancia de datos y solo se deba usar alguna fuente de datos o tal vez el
alcance del desarrollo no haga necesario que se utilicen todas las fuentes. Sin embargo es
necesario realizar un buen anlisis de las necesidades de informacin del negocio para hacer
la mejor seleccin de las fuentes de informacin y poder cubrir las necesidades de los usuarios
finales.
Estas fuentes de informacin son de suma importancia porque no solo nos proporcionaran los
datos necesarios para cubrir las necesidades de informacin de los usuarios finales, sino que
tambin nos ayudara a comenzar a modelar nuestro destino de dicha informacin que
principalmente seria una bodega de datos.
Para las fuentes de informacin debiera existir un experto sobre la temtica que trate cierto
grupo de entidades presentes en la fuente de informacin. Esto nos permitir encontrar un
sentido a la arquitectura de las fuentes de datos en dimensiones y hechos, para proceder a
modelar el destino y poder trabajar sobre las transformaciones necesarias y sus mapeos
correspondientes con el destino diseado.
1.1.1.2.
ETL
Todo el proceso ETL se ajusta a los requerimientos definidos por el usuario final quien es el
que expresa que preguntas quiere responder con la informacin y quien nos puede indicar de
donde viene esta informacin y probablemente en qu condiciones debiera cumplir estos datos
para ser informacin para ellos.
10
La extraccin de datos consiste en realizar una copia de los datos mediante una seleccin de lo
requerido. Se pueden extraer tablas completas, ciertos campos, archivos completos, ciertos
campos, ciertos registros, etctera dependiendo de los requerimientos establecidos. Estas
extracciones se hacen sobre las fuentes de informacin con las que se cuente y que hayan
sido seleccionadas para alimentar la bodega de datos.
La transformacin es la fase del proceso que implica un mayor esfuerzo pues es en esta fase
en la que se hace la limpieza de los datos para cumplan con los requisitos especificados antes
de iniciar el proceso.
Entre las principales transformaciones que se pueden hacer son cambios en los tipos de datos,
obtener nuevas columnas de las existentes, manejo de los nulos, entre muchas otras. Esta fase
del proceso es la que nos permitir llevar los datos de las fuentes de tal manera que estos
cumplan con los requisitos necesarios para poder llegar a la siguiente fase del proceso y no se
generen errores que lleven a la perdida de datos permitindonos entregar datos de calidad
para los usuarios finales.
Esta fase de proceso debe poder garantizar que la informacin sea correcta, consistente,
completa y no ambigua.
La carga de los datos consiste en insertar los datos transformados y que son considerados
datos de calidad en nuestra bodega de datos. Esta carga generalmente se debe realizar en
11
cierto orden, puesto que la bodega de datos pudiera contener ciertas restricciones que si no se
cumplen durante la carga el proceso fallara y no se podra hacer la carga.
1.1.1.3.
Bodegas de Datos
1. Coleccin de datos que estn orientados a temas, integrados, no voltiles y que varan
en el tiempo y cuya finalidad es servir de soporte en la toma de decisiones. Estos datos
contienen granularidad de los datos corporativos. (Inmon, 2002)
2. Es el conglomerado de datos organizacionales en reas de desarrollo y presentacin,
donde dichos datos provienen de la operacin y son manipulados para el anlisis que
el usuario final requiera. (Kimball & Ross, 2002)
De acuerdo con estas definiciones sabemos que el Data Warehouse debiera contener las
principales reas del negocio las cuales de preferencia deberan estar identificadas en el
modelo de negocio. Generalmente estas reas son comunes y pueden ser:
Clientes
Productos
Transaccin o actividad
Polticas
Quejas
Cuenta
Para cada una de dichas reas se debe identificar las tablas de dimensin y las tablas de
hechos. Las tablas de dimensin son aquellas tablas que contienen atributos de los datos, que
nos permiten darle sentido a los datos numricos, por ejemplo Clientes, Productos. Las tablas
de hechos contienen datos con los que se pueden hacer operaciones matemticas por ejemplo
Ventas.
12
13
1.1.1.4.
KPI
Para poder entender lo que son los KPI (Key Performance Indicators) primeramente debemos
comprender lo que es una mtrica. Una mtrica es una medida numrica que representa una
parte de los datos del negocio en relacin a una o varias dimensiones a travs de sus
jerarquas.
Entonces un KPI es una mtrica que est ligada a los objetivos de la empresa y normalmente
se presentan en forma de porcentajes y tienen la finalidad de facilitar al usuario de negocio el
identificar si estn funcionando los planes (Gonzalez, 2006).
Los KPI al ser los determinantes del xito o fracaso del negocio requieren una atencin
especial y constante para monitorear los avances de la empresa y tomar decisiones inmediatas
que corrijan el rumbo del negocio hacia lo establecido en los objetivos.
Para facilitar su lectura, los KPIs son presentados mediante ScoreCards, y estn dirigidos a los
altos mandos de las organizaciones.
14
Segn (Parmenter, 2010) existen principalmente 4 tipos de mtricas con las cuales se debiera
seguir la regla 10/80/10 que establece que el negocio debe contar con:
1. 10 IRC. Indicadores Clave de Resultado que Reflejan los resultados histricos y sirven
para mostrar el crecimiento de la empresa hasta el da de hoy. Ejemplo: Satisfaccin
del cliente, Tasa de retorno de capital.
2. 80
a. IP. Son los que indican al personal que es lo que debe hacer y miden el
performance del negocio, permitiendo la alineacin con la estrategia de la
empresa. Ejemplo: Quejas recibidas de clientes selectos, Entregas demoradas
a clientes selectos
b. IR. Muestran que es lo que se ha hecho, muestran resultados concretos.
Ventas diarias, cobranzas realizadas en la semana.
3. 10 KPI. Reflejan el performance inmediato del negocio y las acciones que hay que
llevar a cabo para poder cumplir con los objetivos establecidos. Ejemplo: Renuncias de
Empleados.
Para la definicin de KPIs se debe buscar que estos cumplan con 7 caractersticas:
1. Mtricas no financieras
2. Requieran ser medidas constantemente
3. Son dirigidas para los altos mandos
4. Claramente indica que accin debe ser tomada
5. Se identifica claramente a los responsables de cada KPI
6. Tienen un impacto significativo
7. Impulsa a tomar acciones apropiadas
1.1.1.5.
Cubo
Un cubo de datos permite a los datos ser modelados y vistos en diferentes dimensiones para lo
cual es necesario que trabaje bajo un modelo multidimensional, basado en dimensiones y
hechos. En otras palabras un cubo procesa la informacin de acuerdo a un diseo especfico
que empata con los requisitos de informacin determinado de tal manera que nos permite ver
de acuerdo a las necesidades establecidas, por ejemplo podemos ver las ventas por empleado
por producto durante el mes de Septiembre, de esta manera mezclamos 3 dimensiones y un
hecho.
15
I-8. Cubo
Esta organizacin de los datos nos permitir conocer la productividad de los empleados segn
las ventas que realice de cada producto para identificar si los empleados no estn siendo
productivos y tomar medidas, identificar que empleado es ms productivo y proporcionarle un
bono o un reconocimiento a su esfuerzo.
Los cubos se manejan bajo un esquema OLAP (Online Analytical Processing), que a diferencia
del esquema OLTP (Online Transaction Processing), su principal objetivo es optimizar el tiempo
de las consultas que se realizan sobre una base de datos. De este existen dos versiones:
1.1.1.6.
Minera de Datos
(Knowledge Discovery from data) y est conformado de diversas fases entre las cuales
encontramos a la minera de datos.
16
1. Limpieza de Datos
2. Integracin de Datos
3. Seleccin de Datos
4. Transformacin de Datos
5. Minera de Datos
a. Definicin de objetivos
b. Recoleccin de datos e integracin
c.
Anlisis de exploracin
d. Seleccin de atributos
e. Desarrollo del modelo y validacin
f.
Prediccin e interpretacin
6. Evaluacin de Patrones
7. Presentacin del conocimiento
17
Para que este proceso se lleve a cabo con xito se requiere de un gran compromiso por parte
de los expertos en el dominio de los datos y los mineros de datos. Mientras que el experto en el
dominio de los datos responde todas las posibles dudas que le puedan surgir al minero de
datos, el minero de datos hace uso de mtodos matemticos que nos lleven a un aprendizaje
inductivo a partir de los datos (Luis Paulo Vieira Braga, 2009).
Para lograr cumplir con estos enfoques existen diversos algoritmos que permiten llegar a los
modelos deseados, por mencionar algunos tenemos C4.5, K-Means, Support Vector Machines,
A priori, EM, PageRank, AdaBoost, KNN, Naives Bayes.
El proceso puede ser mediante un aprendizaje guiado en el cual existe una previa clasificacin
de los datos o aprendizaje no supervisado en el cual no existe ninguna clase de clasificacin
de los datos (Vercellis, 2009).
Una aportacin importante en este campo se dio a partir de un estudio enfocado en las tareas
de marketing (Kumar Kar, Kumar, & Kumar De, 2010), en el cual se hace un resumen breve de
como algunas tareas de Minera de datos ayudan a mejorar el resultado de los esfuerzos de
mercadotecnia. El estudio menciona lo siguiente:
Clustering. Se agrupan los datos en clases de acuerdo a sus similitudes, esta tcnica
puede ser utilizada para segmentar un mercado.
19
1.1.1.7.
Presentacin
La finalidad de tener un Data Warehouse es el que llegue informacin al usuario final para que
pueda tomar las decisiones pertinentes para mejorar el negocio, por lo tanto existen varias
maneras de presentar esta informacin de manera que sea fcil su lectura.
Scorecards. Son usados para alinear las operaciones con la estrategia del negocio.
Este tipo de presentacin de la informacin contiene principalmente los KPI y est
dirigido a los altos mandos. Este tipo de herramienta como lo especifica un artculo
sobre PyMEs japonesas (Aoki & Hasebe, 2012), es importante para monitorear el
funcionamiento
de
una
estrategia
dichas
estrategias
se
deben
evaluar
Identificar problema
Validacin (este paso puede hacer que se repita nuevamente todo el proceso)
I-11. Scorecards
20
Fuente: http://adpu.wordpress.com
I-12. Dashboard
Presentacin
Descripcin
Archivos
archivos
Ilustracin
de
algn
tipo,
21
Presentacin
Descripcin
Ilustracin
Web
Mvil
Existen
herramientas
que
las
aplicaciones
mviles necesarias.
PYME
Las PyMEs son empresas de pequeo tamao en cuanto a los ingresos que generan y los
empleados con los que cuentan. Este es un concepto que se tiene considerado en el mundo
aunque se difiere entre pases entre los rangos que permiten clasificar a una empresa como
PyME.
1.1.2. Competitividad
Precio
Diferenciacin
Innovacin
Desarrollo Tecnolgico
Productividad
22
ndice IMD
Metodologa CAN
I-13. Competitividad
1.1.3. Productividad
La baja productividad puede causar una alteracin en los costos de operacin y propiciar
merma en las utilidades.
Es necesario identificar mtricas que nos permitan tener un control sobre la productividad de la
empresa, para tomar las decisiones adecuadas que nos permitan incrementar la productividad.
Un ejemplo de estos indicadores es:
23
Secundarios: tiempo
Primarios: produccin
Secundarios: dinero
Existe un bajo aprovechamiento de la productividad del capital humano, por lo que se sabe que
el nivel de productividad de empleados y obreros en Mxico es de 50 a 60%. Incluso se han
encontrado grupos con una productividad que no rebasa el 50%.
Actualizaciones
Apoyos gubernamentales
Capacitacin
24
Captulo II
Marco de Referencia
Entorno PYME
Esta seccin tiene por objetivo mostrar hechos relacionados a las PyMEs como lo son datos
que demuestran cmo se afecta de manera positiva la competitividad y productividad de une
PyME al emplear soluciones de BI. Se realizo la documentacin de diversos estudios que
guardan una relacin con este tema.
En Mxico el 99% de las empresas estn identificadas como MiPymes, estas representan una
enorme fuente de empleo, sin embargo el esquema nacional no est diseado para el
desarrollo de este tipo de empresas.
25
Fuente: Inegi
Se sabe que las Pymes en Mxico no emplean la tecnologa por lo que comenzar a hacerlo
podra representar una enorme ventaja competitiva. Actualmente solo 25% de las empresas
PYME utilizan internet y lo utilizan con fines de bsqueda de informacin, solo el 10% cuenta
con una pgina web.
Adems de esto segn algunos estudios (Li, Li, & Zhu, 2010) de los principales problemas de
las PyMEs es que no cuentan con empleados con los suficientes conocimientos y habilidades
para tomar decisiones de manera correcta cuando los problemas ocurren. Generalmente las
PyMEs dedicadas a la consultora, son empresas que cuentan con personal especializado en
alguna materia, por las PyMEs en este giro cuentan con personal calificado, aunque no
siempre calificado para la toma de decisiones estratgicas.
Algunos de los puntos que pueden ayudar a mejorar la competitividad de las empresas es que
ests identifiquen bien los sectores de oportunidad y que se establezcan en una ubicacin
fsica que les permita sobresalir teniendo perfectamente identificado el nicho de mercado al
cual se van a dirigir y de ser posible formar una cadena de valor.
Estn establecidas las siguientes caractersticas que tienen las PyME en China sobre la toma
de decisiones (Zhao & Yao, 2012):
Otro de los puntos importantes para mantener la competitividad de una empresa est en la
capacitacin de sus miembros. Esto se debe no solo a la especializacin de los empleados
sino a que estos se ven motivados a partir de estas capacitaciones lo que los incita a ser ms
creativos y disfrutan ms sus labores. El apoyarse en las tecnologas para aumentar la
productividad de sus miembros tambin es una buena opcin,
La Inteligencia de negocios tiene como principal materia prima los datos de una empresa por lo
cual podemos asegurar que cualquier empresa que cuente con datos sin importar en qu forma
estos estn organizados, pueden implementar una solucin de inteligencia de negocios que les
permita visualizar escenarios, realizar pronsticos y por lo tanto tomar decisiones.
De acuerdo a un artculo de Andrs de Alcazar el considera que una empresa PyME puede
beneficiarse inicialmente de cuatro soluciones propias de la inteligencia de negocios (Del
Alcazar, 2010):
1. Reporteo Avanzado
2. Anlisis de datos
27
3. Cuadros de Mando
4. Minera de datos
Ariadna Cruz menciona que el invertir en soluciones BI representa para una PyME un aumento
en su competitividad puesto que este tipo de soluciones le permite tener la informacin de
manera accesible y completa de todo el negocio, esto enriquecido con las posibilidades que
ofrece la inteligencia de negocios como es el anlisis de los datos, la minera de datos,
Reporting avanzado o cuadros de mando, representa un gran aporte para la toma de
decisiones dentro del negocio (Cruz, 2010).
Como conclusin de estudio realizado por (Benki & Papastathopoulos, 2009), se confirma que
la implementacin de herramientas como los DSS ha tenido un impacto positivo en las
utilidades de las PyMEs permitindoles crecer mientras ms exploten este tipo de
herramientas. Para que las PyMEs sobrevivan al ambiente cambiante, es necesario que sean
capaces de utilizar sistemas que les faciliten la combinacin de datos, utilizar modelos
sofisticados de anlisis y herramientas.
La informacin con la que se pueda contar nos podra proporcionar respuestas a ciertas
interrogantes relacionadas con la productividad, lo que nos llevara a la toma de decisiones
dirigidas a aumentar las utilidades de la compaa mediante la reduccin de la improductividad
de los recursos humanos de la empresa.
Segn una entrevista realizada en algunas PyMEs, se encontr que las empresas utilizan la
inteligencia de negocios de manera fragmentada, espontanea y de manera aislada por algunos
individuos. No existe una formalizacin del almacenamiento de los datos, las empresas se
basan principalmente en el conocimiento tcito y no cuentan con criterios de seleccin
definidos. Es por esto que los proyectos de implementacin de inteligencia de negocios en
empresas PyME es necesario que busquen la optimizacin de los procesos que utilicen de
inteligencia de negocios y que los tiempos y costos no sean elevados (Sadok & Lesca, 2009).
Con la tecnologa idnea se lleva a la PyME por el camino del desarrollo, evolucionando esta
de tal manera que pueda incrementar su competitividad. Adems se ha demostrado que es
necesario que las PyME cuenten adems del capital necesario, con el conocimiento necesario
para explotar las herramientas que se decida adquirir.
28
1. Accesibilidad de la informacin
2. Apoyo en la toma de decisiones
3. Orientacin al usuario final
De acuerdo a un estudio realizado en empresas PyMEs alemanas, se identificaron tres
principales beneficios al implementar una solucin de inteligencia de negocios (Scholz,
Schieder, Kurze, Gkuchowski, & Boehringer, 2010):
1. Existe una mejora en el soporte de los datos, debido a que se reducen los esfuerzos
por analizar y reportear los datos.
2. Se mejora la toma de decisiones, esto porque el anlisis de los datos se puede hacer
de manera ms precisa al contar con ms datos disponibles.
3. Se logra generar ahorros de personal y costos, por medio de la disminucin de los
esfuerzos.
Considero que este tipo de beneficios tambin se pueden ver con la implementacin de
soluciones de inteligencia de negocios en las PyMEs Mexicanas, debido a que se estaran
atacando los mismos problemas de falta de integracin de la informacin, lo que facilitar el
reporteo de los datos y su correspondiente anlisis.
En las Pymes podemos encontrar ciertas particularidades que tal vez en proyectos de
implementacin sobre empresas grandes no encontraramos como lo es que la probabilidad de
que no se cuente con un sistema de informacin lo que represente un reto para la integracin
de los datos, el que no tengan totalmente definido su proceso de toma de decisiones de
manera estructurada.
Existe un estudio (Aversano, Grasso, & Tortorella, 2011) que afirma que las necesidades de
informacin vienen de diferentes niveles de toma de decisiones. Uno de estos niveles busca el
soporte a la operacin y el otro est enfocado a un nivel ms alto considerando las tareas del
manejo de la empresa.
As mismo puede que cuenten con mucho conocimiento tcito construido a travs de la
experiencia, lo cual complica la transferencia del conocimiento y su explotacin (Sadok &
Lesca, 2009).
29
La cantidad de datos que pueda manejar una PYME puede permitir que se puedan analizar en
ms del 20% lo que permite contar con un mejor anlisis, as mismo el volumen de informacin
que pueden manejar les permite utilizar en conjunto con otro tipo de soluciones como son
Cloud Computing o en su defecto existen herramientas que tratan de minimizar el impacto de la
infraestructura necesaria para la implementacin de soluciones de este tipo.
Debido a las condiciones del mercado en la actualidad en la que todo sucede en poco tiempo,
es necesario que las Pymes cuenten con informacin relevante que les permita seguir el ritmo
que marca el mercado actual, permitindoles competir frente a cualquier tipo de empresa
mejorando su toma de decisiones apoyados por una solucin de Inteligencia de negocios.
Las herramientas que el mercado de BI ofrece en el mercado permiten hacer las mediciones
necesarias para cada negocio, de manera rpida lo que permite tomar acciones inmediatas
cuando as es requerido. Adems que permiten tener un amplio conocimiento de todos los
aspectos del negocio contando con visiones estratgicas y operativas, esto con la finalidad de
tomar decisiones ms efectivas y de calidad en cualquier nivel de la empresa.
Samuel Benarroch cita las siguientes ventajas del uso de inteligencia de negocios:
El estudio realizado por (Benki & Papastathopoulos, 2009) arrojo que la implementacin de
herramientas como los DSS est asociada con las utilidades que puede generar una PyME.
30
El que una PyME pueda tomar mejores decisiones le permitir le traer entre otras ventajas las
siguientes (Zhao & Yao, 2012):
Para poder ofrecer a una solucin que se adapte a sus necesidades reales, por lo que Lesca
propone en 2003 un modelo llamado VAS-IC, en el cual se identifican los siguientes pasos
(Sadok & Lesca, 2009):
Metodologas existentes
2.1.3. CRISP-DM
La metodologa CRISP (Cross Industry Standard Process for Data Mining) fue desarrollada con
la finalidad de asegurar el xito de los proyecto de Minera de Datos. Esta metodologa esta
descrita en un modelo de un proceso jerrquico yendo de lo general a lo particular.
31
Los proyectos de minera de datos siguen un ciclo de vida de acuerdo al cual existe la
definicin de un modelo de referencia, en este modelo se pueden identificar las fases y tareas
requeridas, sin embargo las relaciones entre estos elementos puede variar de acuerdo a los
objetivos y necesidades que pueda presentar cada proyecto.
32
Fase
Tarea
Salida
del
Situacin actual
que
Determinar
Objetivos
realmente
cliente,
quiere
descubrir
importantes
el
factores
que
negocio.
puedan
influenciar el proyecto.
Evaluar
Situacin.
Recursos,
restricciones,
Inventario
recursos.
Requerimientos,
Supuestos
Restricciones.
de
Riesgos
Contingencias
Entendimiento del negocio
Determinar
objetivos
Minera
de
de
Terminologa
Costos y beneficios
Objetivos de minera
Datos.
de datos
del
Desarrollar
el
Criterios de xito de
minera de datos
Proyecto.
plan
Evaluacin inicial de
de
herramientas
lograr
tcnicas
los
objetivos
de
Reporte
de
recoleccin de datos
recursos mencionados en la
fase anterior se inicia la
recoleccin de los datos.
Entendimiento de los Datos
Reporte
de
descripcin de datos
por
medio
Reporte
de
exploracin de datos
de
sentencias, visualizaciones o
33
Fase
Tarea
Salida
reportes.
Verificar
calidad
datos.
Se
de
los
realiza
la
Reporte de calidad
de datos
verificacin y validacin de la
informacin
de
los
datos
obtenidos
Conjunto de datos. Sern
Conjunto de datos
Descripcin
del
conjunto de datos
Seleccin
de
los
datos.
usados en el anlisis de
acuerdo a su relevancia para
cumplir
los
objetivos
de
minera de datos.
Limpiar
Preparacin de los datos
datos.
Elevar
la
Reporte de limpieza
de datos
Atributos derivados
de
Generacin
atributos
derivados
registros.
de
registros
Combinar datos
Datos reformateados
de tablas o registros.
Formatear
datos.
Modificaciones
que
no
sintcticas
modifican
su
tcnica
de
Tcnica de modelado
Evaluacin
significado.
Seleccionar
modelado.
Modelado
los
criterios
minera
de
xito
de
determinados
de
datos
en
modelo
fases
anteriores.
Revisin
de
parmetros
de
configuracin
Evaluacin
del
Evaluacin
de
los
resultados de minera
modelo
de datos respecto a
cumple
con
los
34
Fase
Tarea
Salida
Modelos aprobados
Listado de posibles
profundidad en bsqueda de
factores importantes
Determinar
pasos
siguientes.
Se
debe
determinar si despus de
acciones
Decisiones
Plan
de
Implementacin. Estrategia
para
llevar
cabo
la
monitoreo
de
implementacin
implementacin.
Plan
de
mantenimiento.
Estrategia
Plan de monitoreo y
mantenimiento
datos.
Produccin
final.
Un
del
documento
resuma los
minera
reporte
de
que
resultados
datos
Reporte final
Presentacin
Documentacin
de
la
del
proyecto.
Lecciones aprendidas
de
experiencias
Para cubrir la fase 1 se deben realizar ciertas tareas especficas. La primera tarea a realizar
ser conocer las necesidades de informacin del usuario para el logro de sus objetivos, para lo
cual se pueden utilizar diversas tcnicas. La siguiente tarea es desmenuzar lo obtenido en la
tarea de conocimiento de las necesidades de informacin con la finalidad de identificar los
indicadores y las dimensiones que le den sentido a dichos indicadores. En el manual de
referencia se ejemplifica como sigue:
La siguiente actividad es generar un modelo conceptual que represente de manera visual los
hallazgos mencionados. Para esta metodologa se propone utilizar rectngulos y elipses, los
rectngulos a la izquierda representaran las dimensiones, la elipse deber indicar el proceso en
cuestin y los rectngulos a la derecha se especifican los indicadores.
Una vez que se cuenta con el modelo conceptual se pasa a la fase 2 ANALISIS DE LOS OLTP,
en dicha fase la primer tarea a realizar ser conformar los indicadores, esto se hace mediante
la definicin de las frmulas y conceptos que permitan obtener los indicadores. Por lo que para
conformar los indicadores es necesario conocer que elementos o hechos nos permitirn hacer
los clculos y conocer qu tipo de operacin es necesario realizar a dichos hechos para
obtener el valor del indicador.
Despus de este mapeo existe otra tarea que es necesario realizar, esta tarea es el nivel de
granularidad y consiste en definir los campos que formaran parte de las dimensiones, esto se
realiza con el apoyo del usuario puesto que ser este el que defina dichos campos as como
ser quien nos proporcione una explicacin de los campos lo que nos permitir formar un
diccionario de datos o en su defecto nos podremos apoyar de uno ya existente para realizar
esta tarea.
36
Seguidamente se definen las Tablas de Hechos que contendrn principalmente los valores que
necesarios para determinar los indicadores, estas tablas debern tener un nombre
representativo, se deben verificar las llaves primarias, por cada campo que guarde valores de
hechos tendr su correspondiente indicador.
Finalmente la ltima tarea de esta fase consiste en hacer las relaciones indicadas en el modelo
conceptual, es decir relacionar Dimensiones con hechos,
Warehouse, el cual se debe construir despus de obtener el Modelo Lgico usndolo como
gua para la construccin.
La primera tarea es la Carga Inicial, para lo cual nos debemos apoyar de los procesos ETL que
nos permitirn garantizar la calidad de los datos. Para hacer una carga correcta, primero se
debern poblar las dimensiones siguiendo su orden en la jerarqua (de lo general a lo
particular) para despus cargar las tablas de hechos.
Despus de haber realizado la primera carga se debe de proceder a hacer la siguiente tarea la
cual consiste en establecer la arquitectura necesaria para poder actualizar el Data Warehouse,
para lo cual se debe continuar con actividades de limpieza de datos.
37
II-6. HEFESTO
Valores:
El primer principio est enfocado en enfatizar que el xito del proyecto depende de las
personas por lo que es importante mantenerlas motivadas.
38
El tercer principio habla sobre la colaboracin que debe de existir entre el cliente y TI
sin ser tan rigurosos con lo establecido en el contrato buscando siempre la
colaboracin y no el atacarse.
El cuarto principio menciona que los desarrollos se deben adaptar a los cambios, no
tomar los planes como una imposicin sino ms bien como una gua.
Principios:
39
Estos valores y principios pueden ser usados para un proyecto de Business Intelligence. Por
ejemplo la metodologia Scrum que esta enfocada a la administracion de proyectos que busca
elevar la productividad del equipo participante en dichos proyectos.
40
A lo largo de todo el desarrollo debe estar presente el lider de proyecto por parte del equipo
SCRUM quien se encargara de asegurarse de que se logren los objetivos, ayudando al equipo
SCRUM a eliminar obstaculos, protege al equipo. A demas de que se hace un seguimiento
diario en reuniones de 15 minutos, en las cuales se determina que se hizo, que se hara y que
problemas existen.
Asi este tipo de metodologias pueden ser ampliamente adaptabas para proyectos de Business
Intelligence. Es asi como encontramos otra metodologia agil desarrollada por GoodData un
empresa que ofreece solucione BI en web, los cuales describen su metodologia agil como
sigue:
Ericka Chickowski nos muestra 6 pasos para convertir nuestros proyectos de Business
Intelligence en agiles (Chickowski, 2009):
41
La razn de ser de los proyectos de Business Intelligence y de muchos otros, es el negocio, por
lo tanto uno de los puntos importantes es tener claro que las necesidades del negocio son las
que nos guiaran a lo largo de todo el proyecto. En general se contempla que el ciclo de vida
dimensional del negocio se puede expresar en trminos de lo que se muestra en la siguiente
ilustracin:
1. PM
El primer paso es la planeacin de proyectos, esto como una buena prctica usada en
prcticamente la mayora de los proyectos de TI. Esta planeacin contempla los siguientes
puntos:
Evaluacin de preparacin.
o
42
Relacin TI-Negocio
Definicin del alcance. Se establecen los lmites que existirn alrededor del proyecto.
Este alcance es definido en conjunto por TI y el negocio.
Recursos. Se refiere al equipo de trabajo que participara en el proyecto y que debe estar
conformado tanto por personas de TI como por personas del negocio.
Recursos Humanos
TI
Negocio
o
patrocinador
le
delega
responsabilidades.
o
Usuario
Analista de sistemas
Experto en el rea
PM
Arquitecto tcnico
Modelador de datos
Administrador de datos
Diseador de staging
Se deben identificar todas las actividades que se deben realizar y se debe dar un seguimiento
al proyecto mnimo a la llegada de cada hito del proyecto, para obtener el visto bueno del
cliente. Contemplados estos puntos se debe cuidar mucho el que se desarrolle de acuerdo a
este plan y que este plan se mantenga. Esto se logra mediante los planes de comunicacin y
cuidando los posibles cambios que puedan ser requeridos a lo largo del proyecto, para que
estos no se salgan de nuestro control.
Para poder obtener los requerimientos del negocio debemos planear el cmo obtendremos
dichos requerimientos. Existen 2 tcnicas principales para la recoleccin de requerimientos:
Las entrevistas
43
Con la finalidad de obtener informacin de que es lo que hacen, como lo hacen y porque lo
hacen y poder relacionar estas respuestas con los datos.
Para lograr este punto con xito se debe seleccionar a las personas correctas para fungir como
entrevistadoras, las cuales debern ir acompaadas de una tercera persona que les apoye en
la toma de notas y que aporte otra visin de lo que se pueda generar en la entrevista.
Tambin se debe realizar una seleccin de los representantes del negocio con los que se
agendar una cita de preparacin para obtener los requerimientos del negocio.
Diseo de la arquitectura
Es la definicin de los planos que nos permitirn contar con un diseo integral que tome en
cuenta los aspectos tcnicos y elementos del Data Warehouse. Estos elementos son
representados por medio de modelos que van en diferentes niveles de detalle mostrando los
requerimientos inmediatos. Este diseo sigue 8 pasos:
44
f.
d. Requerir prototipos.
e. Seleccionar producto, instalar prueba y negociar.
4. Ciclo de vida del track de datos
Modelado dimensional
Se documenta el modelo
Diseo fsico
45
Esta parte implica el diseo y desarrollo del proceso de ETL. Para este proceso primero se
deben trabajar las dimensiones. Este proceso generalmente se divide en 2 secciones: las
dimensione y los hechos.
generar
las
vistas
que
los
usuarios
accedern,
mediante
Bill Inmon es considerado el padre del concepto Data Warehouse, el menciona que un Data
Warehouse debe cumplir con las siguientes caractersticas:
La metodologa que Bill Inmon propone es iterativa la cual sigue un esquema contrario al
clsico de desarrollo de sistemas ya que lo primero con lo que se trabaja son datos, estos se
integran para ser probados y programar de acuerdo a ellos para analizar los resultados y de
46
II-11. Implementaciones
Descomposicin funcional
Diagrama de contexto
47
c.
Pseudocdigo
El Modelo de Datos del Data Warehouse. Los modelos anteriores nos debern entregar la
definicin de los sujetos a los que estar orientado el Data Warehouse. Debe venir en 3
perspectivas y son explicadas en la siguiente tabla:
Modelo
Descripcin
d. Una vez que se tiene conocimiento de este modelo se deben tomar ciertas
decisiones sobre el diseo del Data Warehouse. Entre estas decisiones tenemos
las siguientes:
Granularidad
Particiones
Minera de Datos
48
f.
2. Integracin de datos. Implica el implementar procesos ETL que nos permitan extraer la
informacin de los ambientes transacciones para cargarlo dentro del Data Warehouse.
Esto puede implicar un cambio en la tecnologa, seleccin de los datos que residirn en
el Data Warehouse, cambios de llaves en los objetos, formato de los datos,
sumarizaciones, estandarizacin de nomenclaturas,
3. Pruebas. Se hacen pruebas al respecto de la implementacin del Data Warehouse. Se
realizan los ajustes necesarios para poder obtener los resultados esperados en nuestro
Data Warehouse.
4. Programacin. Se hacen las programaciones necesarias para que se ejecuten ciertos
procesos, para que exista la posibilidad de paralelismo, se administra la Meta Data,
ndices, particiones, monitoreo, etc.
5. Diseo DSS. Se trabaja sobre un esquema multidimensional para poder generar la
informacin que realmente soporte la toma de decisiones.
6. Anlisis. El tomador de decisiones analiza la informacin obtenida a partir del DSS.
7. Requerimientos. A partir del anlisis de los datos obtenidos el tomador de decisiones
llegue al entendimiento de los requerimientos que tiene su negocio para mejorar.
A grandes rasgos esta es la metodologa que Bill Inmon propone y que forma parte del marco
de referencia de este trabajo de investigacin.
2.1.8. X-Warehousing
Para esta metodologa sus creadores generaron una herramienta en Java que est dividida en
dos mdulos:
Por lo tanto en base a lo modelado que est relacionado con lo definido por el usuario, se
procede a homogenizar los documentos XML mediante su comparacin con un rbol de
atributos.
Esta metodologa est enfocada en negocios basados en Web (Pesaran Behbahani, 2012). Se
basa en el uso de estructuras y modelos de minera de datos para cumplir con el objetivo de
medir la eficiencia de la mercadotecnia aplicada al negocio para poder generar clientes
recurrentes.
2.1.10.
Comparativa
METODOLOGIA
ENFOQUE
CARACTERISTICA
CRISP DM
Minera de
Visin de Negocio
Datos
RESUMEN
1. Entendimiento del negocio
2. Entendimiento de los datos
3. Preparacin de los datos
4. Modelado
50
METODOLOGIA
ENFOQUE
CARACTERISTICA
RESUMEN
5. Evaluacin
6. Implementacin
HEFESTO 2.0
DWH
Construccin
de
DWH
1. Anlisis de requerimientos
2. Anlisis OLTP
3. Modelo lgico DWH
4. Integracin de datos
Metodologas
Software
Desarrollo
Agiles
BI
Soluciones de BI
de
de
tareas
(desarrolladores)
3. Ciclo de desarrollo
a. ETL
b. Modelo
c.
Presentacin
d. Publicacin
KIMBALL
DWH
Diseo de DWH
instalacin
de
herramientas
5. Modelado dimensional
6. Diseo fsico
7. Especificaciones
herramienta
analtica
8. Desarrollo herramienta analtica
9. rea de Staging
10. Desarrollo
11. Mantenimiento
INMON
DWH
Conceptos de DWH
1. Implementacin DWH
2. Integracin de Datos
3. Pruebas
4. Programacin sobre datos
5. Diseo DSS
6. Anlisis resultados
7. Entendimiento
X-Warehousing
DWH
Cubos
Modelado
Conceptual
Multidimensional
1. Modelado
conceptual
multidimensional
2. rboles de atributos
3. Funciones de combinacin
4. Homogenizacin de documentos
51
METODOLOGIA
ENFOQUE
CARACTERISTICA
RESUMEN
XML
EBAF
Minera de
Aplicacin Minera
Conversion
Datos
de
Model
Datos
para
medir la eficiencia
a. Conciencia
de mercadotecnia
b. Contacto
c.
Compromiso
d. Conversin
e. Recurrencia
Tabla 6. Comparativa de Metodologas
Herramientas BI OS
Esta seccin tiene por objetivo recopilar algunas de las herramientas de Inteligencia de tipo
open source que se encuentran en el mercado con la finalidad de mostrar que el mercado de
herramientas open source es lo suficientemente amplio para competir con el mercado
propietario.
2.1.11.
Jaspersoft (01)
Es una plataforma de Business Intelligence que est destinada para generar soluciones en
empresas pequeas y medianas. Esta plataforma cuenta con herramientas que permiten hacer
el desarrollo completo de una solucin de BI, partiendo desde la extraccin de la informacin
de las fuentes de datos para ser almacenadas en un repositorio de datos, para que
posteriormente estos sean explotados con herramientas de anlisis para que finalmente sean
visualizados por los usuarios de negocio en diferentes niveles. Para lograr esto la plataforma
cuenta con las siguientes herramientas:
Jaspersoft ETL.
Jaspersoft OLAP
Esta herramienta permite hacer anlisis multidimensional sobre los datos. Lo que permite
obtener una mejora en la respuesta de las consultas de dicha informacin debido a las
agregaciones que son almacenadas en la metadata del servidor OLAP.
52
JaspersoftReport Server
iReports Designer
Herramienta que permite disear reportes que pueden contener imgenes, sub-reportes,
grficas y matrices.
Fuente: Jaspersoft
2.1.12.
Pentaho (02)
Es una suite de Business Intelligence pionera ofrece servicios crticos como calendarizacin
seguridad, integracin, navegacin por contenido y provee las siguientes funcionalidades:
Data Integration
Reporting
Analysis
Dashboard
Data Mining
53
Fuente: Pentaho
II-13. Pentaho
2.1.13.
OpenI (03)
Es una aplicacin de cdigo abierto para soluciones Business Intelligence a la medida. Esta
desarrollado en J2EE y puede trabajar con datos OLAP o bases de datos relacionales.
Actuamente
es
un
plugin
que
trabaja
junto
con
Pentaho
para
visualizar
datos
2.1.14.
SpagoBI (04)
Es una plataforma de cdigo abierto que cubre todas las areas analticas de Business
Intelligence. SpagoBI ofrece lo siguiente:
Reporting
OLAP
Chart
Dashboard
KPI
Cockpits
GEO/GIS
Data Mining
QuerybyExample
54
Smart Filter
Accesibility Reporting
RT Console
Dossier
ETL
Office
Fuente: SpagoBI
II-14. SpagoBI
2.1.15.
CloverETL (05)
Cuenta con una interfaz grfica que facilita tanto el desarrollo como la administracin de las
soluciones. Tambin ofrece diversas ediciones que buscan ajustarse a los presupuestos y
necesidades existentes.
2.1.16.
Palo (06)
55
Fuente: Palo
2.1.17.
PocOLAP (07)
Es una solucin ligera para datamining. Provee una interfaz web, y visibilidad de hoja de
clculo que permite un uso ms amigable de la herramienta. Su objetivo es ser una
herramienta amigable, su desarrollo est realizado en Java.
2.1.18.
KNIME (08)
De acuerdo a un estudio realizado por (Chen, Ye, Williams, & Xu, 2007), est fue una de las
herramientas mejor evaluadas. Es una plataforma que permite a integracin, procesamiento,
anlisis y exploracin de datos por medio de una interfaz amigable. Cuenta con diversas
versiones enfocadas a diferentes necesidades de anlisis de los datos.
56
2.1.19.
AlphaMiner (09)
De acuerdo a un estudio realizado por (Chen, Ye, Williams, & Xu, 2007), est fue una de las
herramientas mejor evaluadas. Es una plataforma de minera de datos considerada totalmente
enfocada al mercado de las PyMEs. Cuenta con una herramienta para la construccin de
casos, tiene la opcin de extender las capacidades de la herramienta mediante plug-ins, y
cuenta con funciones poderosas de minado de datos.
Fuente: AlphaMiner
2.1.20.
Weka (10)
De acuerdo a un estudio realizado por (Chen, Ye, Williams, & Xu, 2007), est fue una de las
herramientas mejor evaluadas. Es una coleccin de algoritmos de minera de datos, permite el
pre.procesamiento de los datos, clasificacin, regresin, clustering, reglas de asociacin y la
visualizacin.
Fuente: Weka
2.1.21.
De acuerdo a un estudio realizado por (Chen, Ye, Williams, & Xu, 2007), est fue una de las
herramientas mejor evaluadas. En aquel entonces era conocida como YALE, es una plataforma
de minera de datos considerada
57
anlisis de datos y el reporteo de los resultados. Cuenta con una interfaz grfica, tiene un
repositorio para el manejo de procesos, datos y metadatos.
Fuente: RapidMiner
Herramientas BI Propietarias
Esta seccin tiene por objetivo el mostrar algunas de las herramientas propietarias de
inteligencia de negocios que se encuentran disponibles en el mercado. Las herramientas
enlistadas tienen ya una larga trayectoria y son reconocidas mundialmente.
2.1.22.
Oracle BI (12)
Fuente: OracleBI
II-20. Oracle BI
2.1.23.
MicroStrategy (13)
58
Es una plataforma que ofrece productos que ayudan a las empresas a soportar las
necesidades cambiantes del negocio para grupos de trabajo y aplicaciones departamentales de
BI, facilita la migracin de aplicaciones Bi departamentales a una arquitectura empresarial. Su
principal virtud es la capacidad que tiene para visualizar los datos de manera atractiva, es una
herramienta que se ve lmitada por no contar con elementos que permitan transformar datos.
Esta totalmente enfocada en la presentacin de los mismos.
Fuente: Microstrategy
II-21. Microstrategy
2.1.24.
Cognos (14)
59
Fuente: COGNOS
II-22. COGNOS
2.1.25.
Microsoft (15)
60
Fuente: Microsoft
2.1.26.
QlikView (16)
Mejores prcticas
Las mejores prcticas son aquellas que les han funcionado a otras empresas y que es casi un
hecho que te funcionaran a ti. En cuanto a lo relacionado con soluciones de Business
Intelligence tenemos las siguientes mejores prcticas:
61
3. La calidad de los datos es fundamental por lo que debe de existir toda una
infraestructura que garantice la exactitud, calidad y velocidad de disponibilidad de los
datos.
4. Se deben usar los KPI para alinear al negocio y TI
5. Seguir la regla de tener pocos KPI que definan el estado del negocio.
6. Asegurarse de que exista un diccionario de datos o en su caso generar uno.
7. Los procesos de Business Intelligence deben estar fuertemente relacionados con los
KPIs que sean definidos.
8. Monitoreo constante de la solucin de Business Intelligence para asegurar el
cumplimiento de los objetivos.
9. Debe existir la flexibilidad y se debe de contar con un gobierno para asegurar la
transformacin de los datos en informacin.
10. Guardar planes de consulta en los cuales tengamos un registro de los tiempos de las
ejecuciones realizadas de manera que podamos medir el rendimiento del Data
Warehouse.
11. Se debern guardar los errores ocurridos durante el proceso de ETL en tablas
especiales para dicho fin.
Se debe de contar con modularidad en los procesos con la finalidad de que estos no tengan
duraciones excesivas y que se acaben los recursos antes de que otros procesos puedan ser
ejecutados.
Costos.
Tiempo
Usuarios
Recursos Humanos
Hardware
Servicios
FCE
Hay algunos aspectos que se deben tomar muy en cuenta cuando se realiza la implementacin
de una solucin de Business Intelligence. Entre estos tenemos (Yeoh & Koronios, 2009):
62
1. Un fuerte compromiso del equipo de trabajo (TI y negocio) y una buena administracin
de proyectos, as mismo se considera importante que el patrocinador del proyecto
pertenezca al negocio propiamente y no a TI.
2. Visin clara y un caso de negocios bien establecido, debe existir una alineacin con la
estrategia del negocio.
3. Nunca se debe perder el foco sobre los requerimientos del negocio y sus procesos,
recordemos que lo que se busca es soportar la toma de decisiones, pero no podremos
soportar dicha toma de decisiones si no se conocen los requerimientos del negocio y
los procesos que generan dichos requerimientos.
4. Se debe tener como un objetivo alcanzar niveles aceptables de ROI. Es uno de los
puntos ms delicados y generalmente es uno de los puntos que nos permiten vender la
idea de implementar una solucin de Business Intelligence por lo que se debe cuidar
que se logre cumplir con dicha promesa.
8. Se debe contar con la posibilidad de escalar las soluciones por lo que nuestro esquema
de trabajo debe ser flexible que nos permita dirigir al negocio a donde lo requiere.
9. Para que las soluciones de Business Intelligence tengan xito, los datos deben contar
con calidad para que estos puedan ser integrados sin problemas y se logren los
resultados esperados.
63
Captulo III
Propuesta
de
Solucin
Metodologa
Propuesta Pyme-PyC
La metodologa propuesta en este trabajo de tesis pretende entre otras cosas ajustarse a la
realidad de las PyMEs. Es por esto que siguiendo lo indicado en un artculo (Gameiro, 2011),
se establece que de acuerdo al nivel de madurez de la empresa es el requerimiento de
decisiones, por lo que a mayor nivel de madurez se requiere una mejor toma de decisiones.
Segn el estudio realizado por Sadok y Lesca, existen 7 condiciones necesarias de aceptacin
para una buena implementacin de una solucin de inteligencia de negocios (Sadok & Lesca,
2009):
64
1. Beneficio
a. Utilidad = Ventas del mes Costos del mes
b. Margen de Utilidad = (Ventas del mes / Costo del mes)*100
2. Productividad
a. ROA = beneficios / activos
De acuerdo a la experiencia de un consultor plasmada en un artculo (Williamw & Williams,
2003), para que la implementacin de una solucin de inteligencia de negocios realmente
aporte valor al negocio es necesario que este impacte en los procesos operativos a partir de
proporcionar informacin al rea administrativa. De tal manera que al hacer esto se mejoren
tanto los procesos administrativos como operativos.
Segn el artculo recomienda que se realice mediante un esquema en el cual se contemple la
ingeniera de procesos para entender a la perfeccin la manera en la que la Inteligencia de
Negocios va a interactuar para generar el valor deseado.
Tambin es importante involucrar al personal en los cambios que sean necesarios para
implementar una solucin de BI. De acuerdo a un estudio (Laumer, Maier, Weitzel, & Eckhardt,
2012) se deben de considerar como principales variables en el xito de la implementacin de
un sistema: la salud, la satisfaccin con el empleo, el compromiso con la empresa y las
intenciones de cambiar de empleo. Todas estas variables son dependientes entre s puesto
que los empleados frente a un nuevo sistema de informacin pueden ver afectada su salud lo
65
que a su vez puede afectar la satisfaccin del empleado ante su trabajo afectando el
compromiso con la organizacin vindose afectadas las intenciones de cambio de empleo.
De acuerdo a una evaluacin de los servicios de informacin (Lee, Ko, & Jeong, 2009),
menciona que se debe considerar la eficiencia y efectividad del sistema. Consideran
conveniente la evaluacin de la calidad del sistema y la informacin, el uso, la satisfaccin del
usuario, el impacto. Las conclusiones de esta evaluacin dicen que la calidad en la
informacin, el sistema y el servicio fomentaran el uso del sistema. Tambin establecen que a
mayor madurez en el uso de las TI mayor ser el uso.
Tomando como referencia todos estos antecedentes, en este trabajo de tesis se propone que
de acuerdo a un nivel de madurez en el manejo de la informacin es la recomendacin que se
hace sobre la metodologa que se propone y detalla a continuacin.
La metodologa propuesta est dividida en 5 fases:
Negocio
Planeacin
Desarrollo
Validacin
Implementacin
Fases de la Metodologa
Negocio
Planeacin
Desarrollo
Modelado
Datos
Cubos
Minera de Datos
Presentacin
Validacin
Implementacin
Bajo
No cuenta con
sistemas
de
informacin
Medio
Cuenta
con
sistemas
de
informacin
Ok
-
Ok
Ok
Alto
Cuenta
con
sistemas
de
informacin y un
Data Warehouse
Ok
Ok
OK
OK
Tablas pivote
OK
OK
OK
OK
OK
Web
OK
OK
OK
OK
OK
OK
Web
OK
OK
Negocio
El principal objetivo de esta seccin es tener un conocimiento del negocio y en el caso de ser
necesario trabajar a la par con los expertos del negocio para establecer los conceptos
principales que ayudaran a la empresa a dar claridad sobre su rumbo para poder establecer las
66
estrategias que le permitan dirigirse a los objetivos que se planteen, as como definir las
mtricas necesarias que apoyen en la determinacin del cumplimiento de dichos objetivos.
La planeacin estratgica permite que las empresas puedan definir claramente quienes son, a
donde se quiere ir y como llegar.
3.1.1.1.
Misin
3.1.1.2.
Visin
Ya que sabemos la misin de la empresa, se puede establecer su visin. La visin es una vista
al futuro de lo que esperamos lograr con la empresa, el crecimiento que esperamos que esta
tenga, todo descrito en un pequeo prrafo. Esta definicin ser crucial para la definicin de los
cmo que guiarn a la empresa.
3.1.1.3.
Objetivos
A partir de la visin se pueden definir los objetivos que servirn de base para hacer que la
visin de la empresa se vuelva una realidad, Los objetivos se definen en frases cortas que se
escriben de manera infinitiva. Son descritos de manera genrica y su finalidad es meramente
de gua y para tener plasmado el camino que se debe seguir para cumplir la visin, de esta
manera se pueden consultar cada que sea necesario.
3.1.1.4.
Metas
Las metas estn relacionadas con los objetivos, son frases cortas que complementan los
objetivos incluyendo valores numricos que faciliten la medicin del cumplimiento de los
objetivos por medio del cumplimiento de las metas. Las metas son ms especficas que los
objetivos.
67
3.1.1.5.
Los factores crticos de xito son aquellos que forzosamente deben o no presentarse para el
cumplimiento de las metas y por ende para el logro de los objetivos definidos.
Los procesos de negocio son las actividades de la empresa que guardan cierta relacin y que
requieren de un insumo para poder generar algn resultado. La definicin de los procesos de
negocio es de gran utilidad para la definicin de estrategias y para generar las mejoras
necesarias para la operacin de la empresa.
El conocer los procesos de negocio nos dar claridad en cules son las necesidades de
informacin que se requieren en la empresa, lo cual tambin permitir que se definan las
fuentes de informacin necesarias para la construccin de una solucin de inteligencia de
negocios.
Las necesidades estn relacionadas con los insumos que alimentan a los procesos de negocio
para el logro de los objetivos planteados por la empresa.
3.1.4. KPI
Los indicadores de desempeo clave (KPI), permiten medir el estado en el que se encuentra la
empresa, para determinar si se estn logrando los objetivos definidos. Este indicador es
esencial para la toma de decisiones y para poder hacer ajustes en las estrategias ejecutadas
para estar en un proceso de mejora continua.
Una vez que ya se cuenta con el conocimiento del negocio se procede a realizar una lista de
prioridades de los indicadores de desempeo clave, para de esta manera tener claro el orden
en el cual se trazara la solucin de inteligencia de negocios, de tal manera que se pueda
segmentar la solucin con la finalidad de poder hacer un desarrollo gil.
68
Planeacin
En esta seccin se definirn los aspectos relacionados con la planeacin para el desarrollo de
la solucin de inteligencia de negocios. Esto tomando en cuenta algunos de los aspectos ms
relevantes que propone la metodologa de administracin de proyectos PMI.
Est fase de la metodologa es recomendada para aquellas empresas cuyo nivel de madurez
es medio o alto, esto debido a que es a partir de estos niveles que es recomendable invertir
tiempo en organizar los proyectos que se presenten. Cuando una empresa tiene un nivel de
madurez bajo, tal vez no sea tan recomendable la inversin del tiempo en la planeacin del
desarrollo de la solucin debido a su baja complejidad.
3.1.6. Alcance
Primeramente se definir el alcance del proyecto, estableciendo que aspectos estarn incluidos
en el desarrollo, tratando de delimitar de manera adecuada el proyecto para evitar
problemticas innecesarias. En este apartado se debern incluir los entregables que se
comprometern.
3.1.7. Actividades
Una vez definidos los entregables se deben definir las actividades que se deben realizar para
poder generar dichos entregables, estas actividades debern incluir una cronologa que permita
conocer los tiempos que son requeridos para realizar cada actividad, tomando en cuenta que
es recomendable establecer a lo ms 5 das en las actividades de lo contrario una actividad
con ms de 5 das deber ser segmentada. De la misma manera las actividades debern tener
el indicador de precedencia para conocer las dependencias que existan entre las actividades.
3.1.8. Recursos
Ya que estn definidas las actividades se deben definir los recursos que necesitamos para la
ejecucin de dichas actividades. De esta manera debemos designar responsables para las
actividades as como roles y responsables para gestin del proyecto. Tambin se debe
especificar que recursos materiales se requieren, as como los recursos tcnicos necesarios.
3.1.9. Riesgos
Es necesario identificar los riesgos que puedan interferir con el cumplimiento de los tiempos
establecidos para las actividades definidas, estos riesgos tienen que ser evaluados para
determinar las probabilidades de que ocurran y el impacto que puede tener sobre el proyecto.
As mismo se debe asignar un responsable para cada riesgo as como establecer actividades
que permitan mitigar los riesgos identificados.
3.1.10.
Plan
Desarrollo
Ya que se cuenta con un plan para la ejecucin de las actividades necesarias para desarrollar
una solucin de Inteligencia de negocios. Se precede con la ejecucin de dichas actividades
que en grandes rasgos se describirn en los siguientes apartados.
De acuerdo al nivel de madurez de la empresa, sern las tareas que se recomienda que se
ejecuten. En el caso de un nivel de madurez bajo, solo se requiere del modelado de la
informacin, siendo esta presentada en hojas de clculo, con lo cual se puede jugar con la
informacin a travs de tablas dinmicas. En el caso de un nivel de madurez medio, es
recomendable la dar un paso ms despus del modelado, es decir se recomienda la
construccin del Data Warehouse, as mismo es recomendable implementar cubos que
permitan un manejo de la informacin multidimensional, la presentacin de estos resultados se
recomienda que sean en web. En el caso de un nivel de madurez alto, se recomienda la
implementacin de minera de datos como un paso ms delante de la creacin de cubos,
recomendndose la presentacin en web.
3.1.11.
Preparacin Tcnica
Se debe realizar una preparacin de los ambientes para poder iniciar con la ejecucin de las
actividades designadas durante la planeacin, pero para lograr esa preparacin se debe
realizar un anlisis de las herramientas que sean ms adecuadas para el desarrollo de la
solucin de Inteligencia de Negocios de acuerdo a los volmenes de informacin y a la
capacidad de compra que se tenga.
70
3.1.11.1.
Seleccin Herramientas
se cuenta con un
presupuesto muy reducido se puede considerar el utilizar herramientas open source. Cuando
se recurre a herramientas open source es necesario hacer una buena seleccin pues no todas
las herramientas disponibles son adecuadas (Gameiro, 2011).
Se debe generar el documento que refleje las ventajas y desventajas de usar la herramienta
seleccionada y debe contener las firmas aceptacin que sirva de respaldo. As mismo este
documento deber contener los requisitos de hardware y software para la instalacin as como
una gua para la instalacin.
3.1.11.2.
Instalacin
En primera instancia se deben cubrir los requerimientos de hardware, por lo que se deben
realizar las compras necesarias para cumplir con dichos requerimientos. Ya que se cuentan
con los requerimientos de hardware se procede con la instalacin de los pre-requisitos para
que funcione adecuadamente la herramienta para finalmente realizar la instalacin de la
herramienta.
3.1.12.
Modelado DWH
En este punto de la metodologa busca que se logre generar un grfico con 3 niveles diferentes
de detalle, con la finalidad de generar las tablas con las restricciones y relaciones necesarias
para construir el datawarehouse. Estos niveles nos permiten conocer los componentes de
manera general y con un gran detalle los objetos que forman parte del datawarehouse.
3.1.12.1.
3.1.12.2.
HLDM
Una vez que se han revisado las fuentes de datos y se han documentado, se procede con el
modelado del DataWarehouse. En primera instancia se realiza el modelado de datos de alto
nivel, en el cual se vera de manera genrica las entidades que formarn parte del modelo y sus
relaciones. Este modelado se basar en las conclusiones obtenidas durante el anlisis de las
fuentes de datos.
3.1.12.3.
MLDM
Ya que se cuenta con el modelado de datos de alto nivel, se procede a detallarlo de tal manera
que las entidades se ampli su descripcin a travs de atributos, por lo que el modelo de datos
de medio nivel, contendr las entidades, sus atributos correspondientes y las relaciones entre
dichas entidades.
3.1.12.4.
LLDM
Como ultima parte del modelado de datos, se debe construir el modelo de datos de bajo nivel.
En este modelo se representan los atributos de las entidades con todas sus caractersticas.
Prcticamente este modelo de datos nos permitir visualizar la estructura que tendrn las
tablas requeridas para la construccin del DataWarehouse.
3.1.12.5.
Construccin
Finalmente se generan los scripts con la estructura del DataWarehouse para construirlo con el
manejador de base de datos seleccionado en la fase de preparacin tcnica, tomando en
cuenta la sintaxis que utilice dicha herramienta.
Como documentacin en este punto se deber generar el diccionario de datos que permita
tener el entendimiento del objetivo que se persigue con cada tabla y cules son sus
caractersticas principales.
72
3.1.13.
Datos
El objetivo de esta seccin es trabajar con los datos analizndolos para disear y desarrollar el
proceso ETL el cual terminara poblando el datawarehouse. Esta seccin es una de las bases
para los siguientes pasos de la metodologa pues la salida de este paso ser el datawarehouse
poblado el cual es una entrada para el resto de los procesos.
3.1.13.1.
Anlisis de datos
En este punto se parte del anlisis de la fuente de datos para conocer el origen de los datos y
comenzar a analizar y planear las transformaciones que son necesarias para que se inserten
en el DataWarehouse.
Se realizan los mapeos necesarios entre las fuentes de datos y las tablas finales contenidas en
el DataWarehouse para tener una visin clara del destino que tendr cada dato que ser
utilizado.
3.1.13.2.
Ya que se cuenta con el conocimiento del origen y destino de los datos se procede con el
desarrollo del proceso ETL, el cual se recomienda tenga bien identificadas estas partes.
Se recomienda primeramente hacer una extraccin de los datos sin mayores transformaciones
e insertarla en una base de datos de paso (staging area). Ya que se tenga la copia fiel de los
datos extrados en la base de datos de paso, se proceder a realizar las transformaciones
necesarias para lo cual nos podremos apoyar de tantas tablas temporales como consideremos
necesario. Ya que se tienen los datos como los queremos, se introducen en el DWH.
Se debe tomar en cuenta que un ETL cuya finalidad sea la de poblar dimensiones deber
considerar la actualizacin de dichas dimensiones y la insercin de nuevos registros, esto es
recomendable para tener siempre los datos disponibles aunque el proceso ETL falle. En el
caso de poblar una tabla de hechos generalmente solo se realizan inserciones de los nuevos
registros.
Se debe tomar en cuenta la creacin de un proceso ETL para la poblacin histrica de las
tablas de hechos del DataWarehouse y otro proceso ETL para las cargas peridicas que se
vayan a realizar.
73
Se deben documentar estos procesos para saber el camino que siguen los datos y las
transformaciones que se le hacen a los datos.
3.1.13.3.
Pruebas
Ya que se cuenta con los procesos ETL se realizan las pruebas necesarias para comprobar
que funcionan adecuadamente. Una vez que se han probado y se valida que funcionan
adecuadamente se considera que estn listos para ser usados en un ambiente productivo.
3.1.13.4.
3.1.14.
Minera
3.1.14.1.
Esta seleccin depender del problema que se busque atacar ya que la informacin que se
utilice para estos fines deber ser puntual para obtener los mejores resultados.
3.1.14.2.
3.1.14.3.
Evaluar resultados
74
Una vez obtenidos los modelos de datos es necesaria su revisin con el personal experto para
determinar que modelos se acercan ms a la realidad de la empresa, de manera tal que se
puedan tomar la totalidad de los datos para generar los reportes necesarios para la toma de
decisiones.
3.1.15.
Cubo MOLAP
Para poder tener un anlisis de los datos ms potente y significativo es importante explotar el
DataWarehouse con herramienta de anlisis multidimensional, para lo cual se generan cubos
de informacin que permiten tener los datos lineales del DataWarehouse en un esquema
multidimensional lo que permite generar consultas ms enriquecedoras para la toma de
decisiones.
3.1.15.1.
Dimensiones y Jerarquas
Dentro de un modelo multidimensional uno de los puntos importantes a desarrollar son las
dimensiones y las jerarquas involucradas en el modelo.
Las dimensiones son los elementos cualitativos que permitirn evaluar la informacin. Son
aquellos elementos que le dan sentido a los hechos. Las jerarquas es la manera en la que se
puede navegar a travs de la informacin.
Dentro del modelo multidimensional es importante definir de manera correcta las dimensiones y
sus jerarquas para poder consultar los indicadores necesarios en distintos niveles de
agregacin.
3.1.15.2.
Indicadores
Los Indicadores son las mtricas utilizadas en el modelo multidimensional y son todos aquellos
elementos que nos permiten hacer mediciones de manera cuantitativa.
Estos indicadores surgen a partir de las tablas de hechos del DataWarehouse y consiste en
todos aquellos datos numricos, estos son conocidos como indicadores base. Estos
indicadores base permiten realizar los clculos necesarios para generar los Indicadores
principales de rendimiento, los cuales son claves para la toma de decisiones.
3.1.15.3.
Cubos
75
Finalmente se genera la estructura que uniendo las dimensiones y los indicadores mediante un
esquema de estrella, formar un cubo. Una vez formada esta estructura se podrn realizar las
consultas multidimensionales que enriquecern los reportes que se puedan generar para la
toma de decisiones.
3.1.16.
Presentacin
El usuario final podr explotar el DataWarehouse a partir de los reportes que se le presenten
los cuales generalmente se presentan en formato web. Existen tres maneras de presentar el
resultado del proceso de inteligencia de negocios al usuario final.
3.1.16.1.
Reportes
3.1.16.2.
Dashboards
3.1.16.3.
ScoreCards
Validacin
76
Una vez que el usuario indica que la informacin es correcta se procede con la
implementacin, en caso contrario se hacen los ajustes necesarios para hacer las correcciones
necesarias.
Es recomendable hacer validaciones entre cada bloque del proceso de desarrollo para facilitar
el proceso de validacin y que este no sea tan pesado al final del desarrollo de la solucin.
Implementacin
Con el visto bueno del usuario, se puede continuar con la implementacin de la solucin en un
ambiente productivo. Una vez implementado es recomendable monitorearlo y dar soporte a la
solucin hasta que esta funcione de manera estable.
77
Captulo IV
Negocio
Dominos Pizza es una empresa internacional que surge en Michigan en 1960, cuenta con
tiendas propias y franquicias. Este trabajo est enfocado en una franquicia.
Este sistema les genera reportes genricos que no representan un gran apoyo para el gerente
y su toma de decisiones, puesto que no estn diseados para cubrir las necesidades de
informacin requeridas para el cumplimiento de los objetivos de la empresa.
As mismo a pesar de que el sistema les permite tener informacin sobre el desempeo de sus
empleados, no explota esta informacin debido al no tan conveniente diseo de los reportes
actuales, los cuales adems son en formato texto lo que dificulta ms su utilizacin.
Debido a esto la empresa tampoco cuenta con un sistema que les proporcione real ventaja
competitiva como lo podra ser la implementacin de la Minera de Datos y en general a una
solucin integral de BI, al ser sus reportes tan planos y a la falta de procesos que le permitan
explotar de una mejor manera su informacin, pierde cierta competitividad.
Como podemos observar actualmente la empresa Dominos funge como una empresa
tradicional la cual no utiliza todas las tecnologas de informacin que se encuentran hoy
disponibles en el mercado y que estn al alcance de cualquier empresa.
El nivel de madurez con el que cuenta esta empresa es medio, por lo que las
implementaciones que se presentan van de acuerdo a este nivel de madurez. Se hace mencin
de opciones de implementacin para los otros niveles de madurez en el ANEXO I y ANEXO II.
4.1.1.1.
Misin
78
Gente Excepcional sirviendo la mejor pizza del mundo. Es la misin presentada en la tienda,
sin embargo no expresa en su totalidad los productos y servicios que ofrece la empresa, por lo
que se trabajo una nueva misin interna que permitiera conocer un poco mejor a la empresa.
Somos una empresa dedicada a la preparacin y venta de productos de comida rpida como
son pizzas, botanas y postres as como bebidas, contando con servicio de restaurant o de
entrega a domicilio.
4.1.1.2.
Visin
La visin con la que trabaja la empresa es Ser el mejor operador del sistema Dominos Pizza
con el mejor talento humano.
4.1.1.3.
Objetivos
4.1.1.4.
Metas
Siguiendo los objetivos planteados, se definieron las siguientes metas, que nos permitirn
lograr los objetivos establecidos.
4.1.1.5.
Para que la empresa considere que las acciones que planea ejecutar en el futuro prximo
podemos decir que ser de acuerdo a los resultados que tenga a partir de la toma de
decisiones que puede realizar.
79
Por lo tanto uno de los principales Criterios ser que el gerente de la tienda sea capaz de tomar
decisiones a partir de los reportes que se generen con el desarrollo de este proyecto.
Otro criterio ser el cumplimiento de los objetivos de acuerdo a la informacin generada por las
necesidades de informacin identificadas a partir de los objetivos definidos por la empresa.
Los factores crticos de xito son aquellos que forzosamente deben o no presentarse para el
cumplimiento de las metas y por ende para el logro de los objetivos definidos.
Se registran los empleados a su llegada, cuando llega un cliente registran la orden la cual es
pasada a la lnea de produccin donde se prepara la pizza y finalmente esta en entregada.
Cuando ha finalizado el turno del empleado este debe registrar su salida, as mismo al final del
da se hace un proceso de cierre con el cual se actualizan los inventarios y se generan los
reportes en texto plano.
IV-1. Proceso
80
En el proceso de produccin podremos analizar los tiempos de cada empleado para medir su
productividad y establecer estrategias que permitan tomar las decisiones correspondientes que
permita que los empleados sean ms productivos.
Para poder tener las bases necesarias para la toma de decisiones ser necesario contar con
cierta informacin que nos sirva de gua para la adecuada toma de decisiones.
Para esto es necesario contar con la informacin proveniente principalmente del sistema de
venta que se utiliza actualmente que nos proporcionara la informacin de las ventas y la
informacin relacionada al desempeo de los empleados. Tambin se podr extraer la
informacin de los clientes para poder dar un seguimiento a estos y poder mejorar el servicio al
cliente.
4.1.4. KPI
Ventas
Productividad
Servicio al Cliente
Se definieron tres objetivos, por lo que es necesario fijar prioridades para poder cubrirlos
progresivamente de tal manera de que se logre se cumplan en tiempo y forma.
Planeacin
4.1.6. Alcance
4.1.7. Actividades
Actividades
Descripcin
Anlisis
Diseo
Desarrollo
Pruebas
4.1.8. Recursos
Actualmente para el desarrollo de este proyecto se cuenta con ciertos recursos, los cuales se
detallan en la Tabla 9. Recursos.
Concepto
Detalle
Personal:
Fuentes de Datos:
POS
Hardware:
82
Software:
Jaspersoft
SpagoBI
OpenI
Microstrategy
Tabla 9. Recursos
Para poder llevar a cabo el proyecto que deber estar alineado a los objetivos del negocio se
han establecido los siguientes requerimientos:
Hardware. Se debe contar con el hardware que cubra con los requerimientos mnimos
de las herramientas seleccionadas.
Comunicacin. Se debe mantener una estrecha comunicacin entre los expertos del
negocio y los implementadores de BI
Para cumplir en los objetivos establecidos por el negocio en tiempo y forma, se definieron los
siguientes supuestos:
Hardware
Software
Red
As mismo se definieron las siguientes restricciones, que permiten acotar el alcance del
proyecto, estas restricciones son:
83
4.1.10.
Riesgos
Se han identificado ciertos riesgos para los cuales se han definido ciertas acciones que
mitiguen o en su defecto minimicen las probabilidades de que sucedan. A continuacin se
muestra un listado de dichos riesgos:
Riesgo
Probabilidad
Accin
Media
colaboradores
Responsable
colaboradores
Negocio, Consultor
con
anticipacin
Fallas en conexiones
Media
Comunicar fallas al
Negocio
departamento
Red)
datos
de
(Proveedor
solucin
Fallas
Equipo
Hardware
Baja
Se
de
debern
hacer
respaldos semanales
desarrollo
de
avances
Negocio
(Proveedor
HW), Consultor
se
deber contar
Fallas
con
instalaciones
Media
Se deber contactar
configuraciones
Consultor
de
SW
correspondientes
realizar
la
investigacin
necesaria.
4.1.11.
Plan
Actividades
S1
S2
S3
S4
S5
S6
S7
S8
S9
S10
S11
S12
S13
S14
S15
Anlisis
Diseo
Desarrollo
Pruebas
Desarrollo
84
S16
4.1.12.
Preparacin Tcnica
4.1.12.1.
Seleccin Herramientas
El desarrollo de esta solucin se har sobre el Sistema operativo Windows Server 2003, con el
cual ya cuenta la franquicia debido a que al adquirir dichas franquicias les proporcionan
equipos con este sistema operativo por lo que la franquicia no realizara una inversin adicional.
Como motor de base de datos se trabajara con SQL Server 2008 edicin express que es
gratuita por lo que la empresa no tendr que realizar un desembolso econmico con esta
herramienta, adems de que los volmenes de informacin que maneja hacen que esta
herramienta sea adecuada.
4.1.12.1.1.
Jaspersoft
Jasper Server
Jasper iReports
Jasper ETL
4.1.12.1.2.
SpagoBI
Herramienta Open Source que ofrece todo una suite de BI, entre los componentes que incluye
son:
85
Existen disponibles para su descarga las herramientas Server, Meta y Studio. Las cuales
pueden trabajar para sistemas Linux y Windows. En el caso de Windows contiene archivos
ejecutables que realizan el inicio del Servidor y abre la herramienta Studio donde se puede
genera el modelo de metadata.
4.1.12.1.3.
OpenI
Al inicio del desarrollo de este trabajo OpenI se conoca como una herramienta que ofreca una
suite completa para el desarrollo de soluciones de BI, sin embargo en la actualidad ya solo se
conserva un plug-in que funciona junto con la herramienta Pentaho. Es por eso que no fue
posible realizar las pruebas necesarias con dicha herramienta.
4.1.12.1.4.
Microstrategy
4.1.12.2.
Instalacin
4.1.12.2.1.
Jaspersoft
86
http://jasperforge.org/projects/jasperserver
En la siguiente pantalla veremos el acurdo de licencia que para continuar se debe de aceptar.
Se presiona siguiente para pasar a la siguiente pantalla.
87
En la siguiente pantalla observaremos la ruta en la que se har la instalacin, una vez definida
esta ruta daremos click en el botn de siguiente.
En la pantalla siguiente podremos elegir si queremos que se instale Tomcat o si ya existe una
instalacin de Tomcat. Seleccionamos la instalacin incluida seleccionamos siguiente.
88
89
90
IV-11. iReport
91
Comienza la instalacin y la barra de progreso nos ira indicando el avance de dicha instalacin.
92
Una vez completada la instalacion nos dara la opcion para registrar el producto, iniciar el
servidor y ayudar para mejorar la herramienta.
Con esto finaliza la instalacin del servidor web de servicios de Jaspersoft. Para instalar
JasperETL se debe descargar el instalador de la siguiente pgina:
http://jasperforge.org/projects/jasperetl
Esta herramienta no hay necesidad de instalarla, ya que solo basta con descomprimir el
archivo comprimido que se descarga y utilizar el ejecutable que viene incluido en los archivos.
Es necesario que aceptemos los trminos de la licencia de la herramienta.
93
Nos dar la opcin de unirnos a la comunidad Talend, que son los que desarrollan toda la
documentacin relacionada a las herramientas de Jaspersoft.
94
4.1.12.2.2.
SpagoBI
Para poder trabajar con SpagoBI es necesario descargar principalmente dos de sus
herramientas principales:
1. SpagoBI Server
(http://forge.ow2.org/project/download.php?group_id=204&file_id=18088)
2. SpagoBI Studio
(http://forge.ow2.org/project/download.php?group_id=204&file_id=18084)
3. SpagoBI Meta
(http://forge.ow2.org/project/download.php?group_id=204&file_id=18082)
4.1.12.2.3.
Microstrategy
Microstrategy
ofrece
de
manera
gratuita
una
suite
de
reporteo
95
Una vez descargada es necesario descomprimir el archivo en formato .zip y ejecutar el archivo
.exe contenido en la carpeta donde se descomprimi el archivo descargado.
Nos mostrar la licencia del software, la cual tendremos que aceptar para poder continuar con
la instalacin.
96
Se introduce la informacin del cliente que se usar para la configuracin del servidor y en
donde se debe introducir la clave de licencia proporcionada.
97
98
Se nos indica que una vez finalizada la instalacin es necesario que la herramienta sea
activada de lo contrario una vez pasados 30 das naturales la herramienta se bloquear.
Se selecciona el modo en el que ser utilizada la herramienta, en este caso se utilizo para
pruebas sin embargo existen otros escenarios bajo los cuales se puede utilizar.
99
100
101
4.1.13.
Modelado DWH
4.1.13.1.
La principal fuente de informacin con la que contamos es la base de datos del sistema POS
que utiliza la pizzera en sus operaciones diarias. Esta base de datos se encuentra en SQL
Server, y para su anlisis ha sido cargada en SQL Server 2008 express edition.
Para comenzar con el anlisis de estos datos se nos proporciono un respaldo de la base de
datos, la cual fue restaurada en el laboratorio. Visualizando el contenido de dicha base de
datos pudimos observar que existen muchos objetos que no son necesarios para cumplir con
los objetivos planteados.
Se realiz una revisin de cada una de las tablas en bsqueda de datos que nos pudieran ser
tiles en el logro de los objetivos planteados. Estos objetos estn relacionados con lo siguiente:
Productos
Clientes
Empleados
Ordenes
102
4.1.13.2.
HLDM
Con conocimiento de esto se pudo generar lo que podemos observar en la ilustracin IV-30.
HLDM, el modelo de datos de alto nivel que muestra principalmente los elementos involucrados
en la generacin de informacin.
IV-30. HLDM
4.1.13.3.
MLDM
Una vez que se tuvo identificados los principales elementos que se debieran involucrar, se
procedi a determinar aquellos atributos correspondientes a las entidades identificadas que son
tiles para responder a las interrogantes planteadas.
En la ilustracin IV-31. MLDM, podemos observar el modelo de datos de medio nivel, el cual
es una extensin del HLDM. En este diagrama podemos ver los atributos que fueron
identificados en la base de datos del sistema POS y que se consideran de gran importancia.
103
IV-31. MLDM
4.1.13.4.
LLDM
EMPLEADO
TIPO DE
CAMPO
DESCRIPCION
DATO
TAMAO
EMPLEADO_ID
Numrico
EMPLEADO_NOM
alfabtico
20
TIENDA
CAMPO
DESCRIPCION
TIPO DE DATO
TAMAO
TIENDA_ID
Identificador de tienda
Numrico
TIENDA_NOM
Nombre de tienda
alfabtico
15
TIENDA_DIR
Direccin de tienda
alfabtico
50
TIENDA_TEL
Telfono tienda
Numrico
10
TIENDA_FA
Fecha de apertura
fecha
ORDEN DETALLE
CAMPO
DESCRIPCION
TIPO DE
DATO
TAMAO
ORDEN_DTL_ID
numrico
15
104
ORDEN DETALLE
CAMPO
DESCRIPCION
TIPO DE
DATO
TAMAO
ORDEN_ID
Identificador de orden
numrico
10
ORDEN_DTL_LINE
Lnea de orden
numrico
PRODUCTO_ID
Identificador de producto
numrico
STATUS_ID
Status de lnea
numrico
ORDEN_DTL_CAN
Cantidad
numrico
9,2
ORDEN_DTL_PRE
Precio
numrico
9,2
ORDEN_DTL_DES
Descuento
numrico
9,2
ORDEN_DTL_IMP
Impuestos
numrico
9,2
ORDEN_DTL_VTA
Venta
numrico
9,2
ORDEN CABECERA
TIPO DE
CAMPO
DESCRIPCION
DATO
TAMAO
ORDEN_ID
Identificador de orden
numrico
10
CLIENTE_ID
Identificador de cliente
numrico
TIENDA_ID
Identificador de tienda
numrico
EMPLEADO_ID_M
numrico
EMPLEADO_ID_E
numrico
TIPO_ID
numrico
STATUS_ID
numrico
ORDEN_PRE
Precio de orden
numrico
9,2
ORDEN_DES
Descuento de orden
numrico
9,2
ORDEN_IMP
Impuesto de orden
numrico
9,2
ORDEN_VTA
VENTA
numrico
9,2
ORDEN_FEC
Fecha y Hora
date time
ORDEN_TTO
numrico
10
ORDEN_TPR
numrico
10
ORDEN_TDE
numrico
10
ORDEN_TEN
numrico
10
PRODUCTO
CAMPO
DESCRIPCION
TIPO DE DATO
TAMAO
PRODUCTO_ID
numrico
PRODUCTO_DESC
alfanumrico
20
PRODUCTO_TAM
alfanumrico
10
PRODUCTO_CAT
alfanumrico
10
105
CLIENTE
CAMPO
DESCRIPCION
TIPO DE DATO
TAMAO
CLIENTE_ID
Numrico
CLIENTE_NOMBRE
Alfabtico
50
CLIENTE_DIRECCION
Alfanumrico
50
CLIENTE_TELEFONO
Numrica
10
4.1.13.5.
Construccin
De acuerdo a las necesidades del negocio se realizaron dos modelaros principales siguiendo
esquemas de estrella con la finalidad de que las consultas sean lo ms optimizadas posibles.
Estos modelados se hicieron tomando en cuenta las necesidades de informacin que se
analizaron del negocio.
En primera instancia tenemos la cabecera de las rdenes como tabla de hechos en la cual
tenemos las principales mtricas te tiempos en los que se despacho una orden as cono las
ventas. Estas mtricas se pueden analizar por una jerarqua de tiempo, por empleado, por
cliente, tipo de orden, estatus de la orden,
106
El otro modelado est enfocado en el detalle de las ordenes como tabla de hechos en la cual
las principales mtricas que se tienen son las ventas, la diferencia con la cabecera de ordenes
es que el detalle nos permite hacer el cruce con la dimensin de productos por lo que podemos
analizar las ventas por producto, adems de las dimensiones de cliente, empleado y tiempo.
4.1.14.
Datos
4.1.14.1.
Anlisis de datos
Dentro de la exploracin de los datos encontramos que para poder medir la productividad de
los empleados contamos con el registro de los tiempos que se manejan en la toma de rdenes
y la entrega de dichas ordenes.
Para cada orden se registran la fecha y hora en la que se registra la orden, el tiempo que tomo
registrar la orden, el tiempo de entrega, tiempo que pasa la orden en estantes, tiempos de
preparacin.
Con estos registros se puede medir los tiempos efectivos de los empleados en cuanto al
servicio que ofrecen, as mismo estos datos se pueden relacionar con las ventas para saber de
los empleados que menos venden que tiempos de servicio tienen registrados. En la ilustracin
107
IV-34. Anlisis de datos, podemos observar una ejemplificacin de los datos con los que se
cuenta. Con estos datos podemos definir estrategias que nos permitan motivar a nuestros
empleados de tal manera que estos se vuelvan ms productivos, as como evaluar otras
posibles causas de la baja productividad e implementar acciones correctivas.
Los datos relacionados con las ventas contamos con las rdenes, el cliente relacionado, la
venta total, el impuesto asociado y la venta sin impuesto. As mismo estos datos se pueden
relacionar con los tiempos de sus ordenes correspondientes para determinar si el servicio fue
proporcionado en los tiempos mnimos requeridos, as mismo podemos identificar los clientes
que nos han generado un mayor nmero de ventas as como sus hbitos de consumo para
poder determinar ofertas especiales para estos clientes. Los datos que podemos visualizar
sobre esta temtica los vemos en la ilustracin IV-35. Anlisis de datos - .
108
4.1.14.2.
Con la finalidad de poblar el DWH construido se diseo y construyo un proceso de ETL. Para lo
cual se utilizo la herramienta Jaspersoft ETL. Para utilizar dicha herramienta se configuro la
conexin a un repositorio y se cre el proyecto correspondiente.
Una vez contando con el proyecto se crearon las conexiones a las bases de datos
correspondientes. De acuerdo a la arquitectura definida para el proceso ETL, se crean las
conexiones a la fuente de datos POS, a la base de datos de staging en la que se realizan las
transformaciones necesarias y finalmente la base de datos DWH, la cual contiene los datos finales.
Ya que se tenan las conexiones se importa la metadata de las tablas correspondientes para poder
crear los procesos ETL. Para iniciar con las transformaciones se crean los jobs necesarios.
Siguiendo la arquitectura definida, en primera instancia se extrajeron los datos de la fuente de
datos POS a la base de datos STG sin realizar mayores transformaciones. Con los datos en la
base de datos de staging, se realizan las transformaciones necesarias para ajustarse al modelado
de datos del DWH.
Ya que se tienen los datos con el formato adecuado para ser insertados en el DWH, son insertados
de tal manera que el DWH es poblado con la informacin correspondiente.
SpagoBI no tiene una herramienta propia para ETL, se basa en el mismo motor que utiliza
Jaspersoft por lo que el desarrollo del proceso ETL solo se realizo con Jaspersoft, Microstrategy es
109
una herramienta enfocada a trabajar con un DataWarehouse ya construido por lo que no cuenta
con una aplicacin para la construccin de procesos ETL.
4.1.15.
Modelo multidimensional
Hechos que consiste en todos aquellos campos del DataWarehouse que representen un
valor cuantitativo de los datos, es decir aquellos datos numricos referentes al negocio.
110
Atributos que consiste en todos aquellos campos del DataWarehouse que representan un
valor cualitativo que permite dar mayor significado a los hechos, permitiendo hacer un
anlisis de los hechos por sus diversos atributos.
Estos elementos son la base de un modelo multidimensional ya que permiten generar los
elementos de siguiente nivel utilizados en los modelos multidimensionales utilizados por
Microstrategy. A partir de los elementos base, podemos construir los elementos necesarios en la
generacin de reportes.
111
Los hechos permiten la creacin de mtricas, los cuales son valores calculados a partir de los
hechos obtenidos directamente del DataWarehouse.
112
Con esto se construyen los elementos bsicos del modelo multidimensional que permite la
generacin de los reportes.
113
4.1.16.
Presentacin
Una vez generado el modelo multidimensional es posible generar los reportes necesarios mediante
la utilizacin de sus elementos. En este caso se generaron tres reportes.
Uno de ellos mostraba principalmente al empleado que genera el mayor nmero de ventas, esto
sirve de indicador para poder conocer que es lo que motiva a este empleado para generar dichos
resultados e incentivarlo a continuar con el mismo o mayor nivel de productividad.
114
As mismo se genero un reporte para conocer que empleado es el que le toma ms tiempo
completar una orden, esto nos da la visibilidad de conocer que empleados estn siendo menos
productivos para poder realizar una investigacin sobre los porqu y atender las causas que
generen que dichos empleados produzcan por encima del promedio establecido.
Finalmente se gener un reporte que nos de la visibilidad para conocer cul de nuestros productos
es el ms exitoso, esto nos permitir establecer estrategias que permitan que se le ofrezca a los
clientes promociones adecuadas a este habito de consumo, lo que implica un aumento en las
ventas.
115
Contando con estos tres reportes se pudo generar un reporte tipo resumen que engloba estos tres
resultados.
IV-46. Dashboard
116
CONCLUSIONES
Para la realizacin de este trabajo se realizo una investigacin en la que se logro integrar la
informacin de 34 fuentes, que se consideraron compatibles con este trabajo de tesis, permitiendo
enriquecer este trabajo. La metodologa presentada en este trabajo, toma en cuenta los contenidos
de estas fuentes para tratar de cubrir los hallazgos actuales de las PyMEs.
La metodologa propuesta abarca todos los puntos conocidos de la inteligencia de negocios para
ser aplicados, engloba aspectos de negocio, un poco de administracin de proyectos y los tres
puntos medulares de la inteligencia de negocios que son la construccin de un DataWarehouse, la
construccin de los procesos ETL que permiten poblar el DataWarehouse, los procesos de anlisis
como son cubos de informacin y minera de datos y la explotacin de dicha informacin por medio
de reportes, los cuales permitirn a los usuarios finales tomar las decisiones necesarias para
alcanzar los objetivos establecidos durante la familiarizacin con el negocio.
No es necesario estar casado con una sola herramienta en el desarrollo de este trabajo al final del
da se trabajo en conjunto una herramienta libre y una herramienta propietaria demostrando que
estos universos no estn peleados.
117
De las herramientas opensource elegidas para el desarrollo de este trabajo, puedo concluir que la
ms avanzada es Jaspersoft. Ha alcanzado altos niveles de manejabilidad, le faltan mejoras en
aspectos de anlisis de los datos pero no dudo que en un futuro no tan lejano evolucione a tal
grado que se facilite la explotacin de dicho aspecto.
SpagoBI, va por buen camino, sin embargo aun le falto mucho que madurar y tiene varias reas de
oportunidad a ser explotadas, comparte varios desarrollos con Jaspersoft entre ellos la herramienta
de ETL y el Studio para la generacin de reportes. Adems de eso hace falta documentacin ms
clara para poder desarrollar con dicha herramienta. No se logra hacer una instalacin muy
adecuada del servidor y las herramientas no mandan mensajes de errores claros.
OpenI no fue posible su instalacin y no se pudo probar realmente la herramienta debido a que en
la pgina ya solo est disponible un plug-in que trabaja con Pentaho.
118
ANEXO I. RapidMiner
Es recomendable que una PyME se apoye de tecnologa Open Source para construir soluciones lo
suficientemente confiables para poder manipular y explotar la informacin. Por ejemplo la
herramienta Rapidminer cuenta con una instalacin bastante sencilla, tiene un amplio catalogo con
diversos procesos que permiten el desarrollo e implementacin de minera de datos.
Cuando el nivel de madurez de una empresa PyME es muy bajo, la recomendacin que se hace
para que pueda iniciar a introducir prcticas de inteligencia de negocios sera:
Se debe guardar un registro de los productos y/o servicios que ofrezca la empresa.
Conforme vaya transcurriendo el tiempo y sea necesario conservar una clasificacin de
productos, se podrn construir jerarquas.
Si es posible, se debe de guardar un registro de los clientes con los que se cuenta,
asignndoles un identificador nico. Conforme vaya transcurriendo el tiempo y sea
necesario conservar una clasificacin de clientes, se podrn construir jerarquas.
RapidMiner cuenta con un operador que nos permite pivotear la informacin para su consulta.
119
Cuando el nivel de madurez con el que cuenta la empresa es alto, es mayor el beneficio de
utilizar mtodos de minera de datos que nos permitan hacer anlisis ms avanzado de la
informacin.
Esta aplicacin cuenta con diversas herramientas para la aplicacin de la minera de datos, en el
caso que podemos ver en la imagen IV-49 - Naives Nayes, se clasifico el desempeo de los
empleados con el uso del algoritmo Naives Bayes. Se hace una lectura a una tabla de SQL Server
y se clasifican los atributos como ID, label, regular y finalmente se ejecuta el algoritmo en cuestin.
120
Una vez que termina el procesamiento de la informacin, nos muestra los resultados, en este caso
tenemos que existe un 63.6% de que el desempeo de los empleados sea excelente contra un
36.4%. Y nos da la opcin de ver la densidad del desempeo de acuerdo a los atributos regulares
establecidos que fueron: Venta, Tiempo de ejecucin, Nmero de rdenes levantadas.
121
IV-50 Resultados
Existe una opcin adicional para obtener mayor informacin para el minado de datos. Esta opcin
consiste en acudir a pginas web que nos permitan extraer informacin para el minado de datos. El
objetivo del ejercicio realizado era obtener las pginas que cumplieran con cierto patrn. En este
caso se hizo mediante la url, indicndole una pgina como base y de acuerdo a las ligas que
tuviera referenciadas tomara en cuenta aquellas que tuvieran la palabra IJBIDM y las
almacenara.
122
Cuando el proceso termina, regresa los resultados como se puede observar en la pantalla de la
imagen IV-52 - Resultados Minado Web. As mismo debera almacenar en una carpeta que se
haya definido previamente los archivos en el formato que nosotros elegimos que puede ser html o
xml.
123
BIBLIOGRAFA
(s.f.). Obtenido de http://www.jaspersoft.com/
(s.f.).
Obtenido
de
http://www.oracle.com/us/solutions/business-analytics/business-
intelligence/enterprise-edition/overview/index.html
124
Aoki, M., & Hasebe, M. (2012). Significance of Learning Process in BSC Introducing Process in
Japanese Small and Medium Enterprises. Tohoku Management - Accounting Research
Group.
Aversano, L., Grasso, C., & Tortorella, M. (2011). Evolving Enterprise Information System in Small
and Medium Enterprise: an opportunistic approach and a case study. IEEE Conference on
Commerce and Enterprise Computing.
Benki, C., & Papastathopoulos, A. (2009). The Impact of Structured, Unstructured and Integrated
Decision Support Systems on SME Economic Performance. An Empirical Study. 3rd
International Conference on Communications and information technology.
Boussaid, O., Ben Messaoud, R., Choquet, R., & Anthoard, S. (2006). X-warehousing: an XMLbased approach for warehousing complex data. 10th East-European Conference on
Advances in Databases and Information Systems.
Bruhn, M., Karlan, D., & Schoar, A. (2012). The Impact of Consulting Services on Small and
Medium Enterprises: Evidence from Randomized Trial in Mxico. Department of Economics
Yale University.
Chen, X., Ye, Y., Williams, G., & Xu, X. (2007). A survey of open source data mining systems.
International conference on Emerging technologies in knowledge discovery and data
mining.
Chickowski,
E.
(25
de
08
de
2009).
smartertechnology.
http://www.smartertechnology.com/c/a/Technology-For-Change/Six-Steps-to-Agile-BI/1/.
Recuperado el 2010
125
Feng, Y., Li, X.-x., Gao, C., Liu, Y., & Xu, H.-y. (2010). Design of the Low-cost Business Intelligence
System Based on Multi-agent. International Conference of Information Science and
Management Engineering.
Fu, R., Xu, C., Song, M., & Xin, Z. (2008). Research on the Organizational Decision Support
System for Small & Medium-Size Enterprise Based on Agent. International Symposiums on
Information Processing.
Gameiro, C. (2011). Implementation of Business Intelligence tools using Open Source Approach.
Workshop on Open Source and Design of Communication.
Gonzalez, T. (2006). Dashboard Design: Key Performance Indicators and Metrics. Choosing the
right
data
to
display.
http://www.brightpointinc.com/Articles.asp?File=Dashboard%20Design%20Metrics%20and
%20KPIs.htm.
Obtenido
de
http://www.brightpointinc.com/Articles.asp?File=Dashboard%20Design%20Metrics%20and
%20KPIs.htm
Grabova, O., Darmont, J., Chauchat, J.-H., & Zolotaryova, I. (2010). Business Intelligence for Small
and Middle-Sized Entreprises. ACM SIGMOD Record, 39.
Infante,
L.
(2009).
Business
Intelligence
Latin
America.
http://www.bi-
la.com/profiles/blogs/metodologia-agil-introduccion.
Kimball, R., & Ross, M. (2002). The Data Warehouse Toolkit. Wiley.
Kumar Kar, A., Kumar, A., & Kumar De, S. (2010). A Study On Using Business Intelligence For
Improving Marketing Efforts. Business Intelligence Journal.
Laumer, S., Maier, C., Weitzel, T., & Eckhardt, A. (2012). The Implementation of Large-scale
Information Systems in Small and Medium-Sized Enterprises A Case Study of Work-and
Health-related Consequences. 45th Hawaii International Conference on System Sciences.
126
Lee, C., Ko, I., & Jeong, C. (2009). Evaluating the Effectiveness of Information Service for SMEs on
Information Orientation and Firm Performance. 42nd Hawaii International Conference on
System Sciences.
Li, H., Li, X., & Zhu, Z. (2010). Knowledge Mining for Intelligent Decision Making in Small and
Middle Business. Third International Symposium on Intelligent Information Technology and
Security Informatics.
Li, X., Zhu, Z., & Pan, X. (2010). Knowledge cultivating for intelligent decision making in small &
middle businesses. International Conference on Computational Science.
Luis Paulo Vieira Braga, L. I. (2009). Introduccin a la Minera de Datos. Editora E-papers.
Parmenter, D. (2010). Key Performance Indicators Developing, Implementing, and Using Winning
KPIs. Wiley. Recuperado el 2010, de Gestiopolis.
Sadok, M., & Lesca, H. (2009). A Business Intelligence Model for SMEs Based on Tacit Knowledge.
7.
Scholz, P., Schieder, C., Kurze, C., Gkuchowski, P., & Boehringer, M. (2010). Benefits and
Challenges of Business Intelligence Adoption in Small And Medium-Sized Enterprises. 18th
European Conference on Information Systems.
Vercellis, C. (2009). Business Intelligence Data Mining and Optimization for Decision Making. Wiley.
Watson, H. J., & Wixom, B. H. (2007). The Current State of Business Inetelligence. IT SYSTEMS
PERSPECTIVES.
Williamw, N., & Williams, S. (2003). The Business Value of Business Intelligence. Business
Intelligence Journal.
127
Yeoh, W., & Koronios, A. (2009). Critical Success Factors forBusiness Inteliigence Systems.
Journal of Computer Information Systems.
Zhao, Y., & Yao, Y. (2012). Bridging Theories and Practices: An Evaluation Framework of Small
and Medium Sized Enterprises' (SMEs) Decision-making in China. Fifth International Joint
Conference on Computational Sciences and Optimization.
128