Tesis Data Warehouse
Tesis Data Warehouse
Tesis Data Warehouse
TESIS
AUTOR:
LIMA PER
2015
DEDICATORIA
-i-
AGRADECIMIENTOS
A DIOS:
Por ser mi creador, el motor de mi vida, por no haber dejado que me rinda en ningn
momento e iluminarme para salir adelante, porque todo lo que tengo, lo que puedo y lo
que recibo es regalo que l me ha dado.
A MIS PADRES:
A m madre, Sra. Marina Vsquez Balczar, por apoyarme siempre y estar junto a m
cuando la necesita, adems por sus sabios consejos que hacen que sea una excelente
madre.
A m padre, Sr. Merardo Castaeda Aguilar, por ser el mejor del mundo y que con la
inmensidad de su gran amor guan mi camino.
A MIS HERMANOS:
Luis y Csar, por el apoyo brindado, por su comprensin y cario.
A MI TUTOR:
Al Dr. Javier Gamboa Cruzado, por ser la persona que ha tenido la gran tarea de dirigir,
explicar y revisar cada una de las hojas de esta tesis de graduacin.
.
ALBERTO CASTAEDA VSQUEZ
-ii-
RESUMEN
Castaeda V. Alberto
[email protected]
La presente investigacin trata sobre la mejora de un proceso de negocios,
especficamente sobre el pobre desempeo del Proceso de Toma de Decisiones del rea
de Admisin de la Universidad Autnoma del Per, en lo que corresponde a: Porcentaje
de exactitud de informacin, tiempo en realizar los reportes, porcentaje de malas
decisiones tomadas, nmero de reportes solicitados por ciclo, comprensin de los
reportes, utilizando Business Intelligence.
Para darle una solucin al problema se propone realizar un Business Intelligence
que nos permite almacenar slo la informacin requerida e ir eliminando aquellos datos
que obstaculizan la labor del anlisis y entregando la informacin que se requiera en
la forma ms apropiada, facilitando as el proceso de gestin de la misma.
Business Intelligence surge con la promesa del manejo y control de la informacin,
asegura una vista nica de los datos, que pueden provenir de diversas fuentes.
Existen diferentes herramientas BI tanto software libre como propietario, para esta
solucin de la Universidad se us software con licencia y despus de un anlisis en
cuanto a herramientas de este tipo se utiliz SQL Server 2014.
-iii-
ABSTRACT
This research is about improving a business process, specifically on the poor performance
of the Decision Making Process Area Admission of the University of Peru, which
corresponds to: Percentage of accuracy of information, time to complete reports,
percentage of bad decisions, number of requested per cycle, understanding reports reports
using Business Intelligence
To give a solution to problem intends to undertake a Business Intelligence that
allows us to store only the information required e go eliminating those data impeding the
work of the analysis and delivering the information required in the most appropriate form,
thus facilitating the management process thereof.
Business Intelligence arises with the promise of the handling and control of the
information, assure a unique view of the data, which may come from various sources.
There are different tools BI both free software as owner, for this solution by the
University will be used licensed software and after an analysis as regards tools of this type
was used SQL Server 2014.
-iv-
INTRODUCCIN
-v-
-vi-
NDICE
DEDICATORIA ..................................................................................................................... i
AGRADECIMIENTOS .........................................................................................................ii
RESUMEN ...........................................................................................................................iii
ABSTRACT.......................................................................................................................... iv
INTRODUCCIN ................................................................................................................. v
NDICE ................................................................................................................................ vii
NDICE DE FIGURAS ........................................................................................................ xi
NDICE DE TABLAS ........................................................................................................ xiv
CAPTULO I
PLANTEAMIENTO METODOLGICO
1.1
1.2
1.3
1.4
OBJETIVOS DE LA INVESTIGACIN
1.4.1 Objetivo General............................................................................................... 8
1.4.2 Objetivos Especficos ....................................................................................... 8
1.5
HIPTESIS ................................................................................................................ 8
1.6
VARIABLES E INDICADORES
1.6.1 Variables ........................................................................................................... 8
1.6.2 Indicadores........................................................................................................ 9
1.7
LIMITACIONES DE LA INVESTIGACIN....................................................... 10
1.8
1.9
TCNICAS
INSTRUMENTOS
PARA
RECOLECCIN
DE
INFORMACIN ...................................................................................................... 12
-vii-
CAPTULO II
MARCO REFERENCIAL
2.1
2.2
MARCO TERICO................................................................................................. 20
CAPTULO III
DESARROLLO DE BUSINESS INTELLIGENCE
3.1
GENERALIDADES ................................................................................................. 40
3.2
ESTUDIO DE FACTIBILIDAD
3.2.1 Factibilidad Tcnica ....................................................................................... 40
3.2.2 Factibilidad Operativa .................................................................................... 41
3.2.3 Factibilidad Econmica .................................................................................. 41
3.3
3.4
3.5
3.6
3.7
MODELO DIMENSIONAL
3.7.1 Seleccin del Business Intelligence .................................................................. 65
3.7.2 Antigedad de la Data ....................................................................................... 65
-viii-
DISEO FSICO
3.8.1 Trasladar el Modelo Dimensional al Modelo Fsico ........................................ 77
3.8.2 Sentencias SQL para crear el modelo ............................................................... 80
3.9
CAPTULO IV
ANLISIS DE RESULTADOS Y CONTRASTACIN DE LA HIPTESIS
4.1
POBLACIN Y MUESTRA
4.1.1 Poblacin ......................................................................................................... 118
4.1.2 Muestra ............................................................................................................ 118
4.2
-ix-
4.3
4.4
CAPTULO V
CONCLUSIONES Y RECOMENDACIONES
5.1
5.2
-x-
NDICE DE FIGURAS
Figura 01.Ubicacin de la Universidad Autnoma del Per. ................................................ 3
Figura 02. Flujograma del Proceso Transaccional en el rea de Admisin de la
Universidad Autnoma del Per. .......................................................................... 4
Figura 03. Flujograma del Proceso de Toma de Decisiones para el Jefe del rea de
Admisin de la Universidad Autnoma del Per. (AS-IS) ................................... 5
Figura 04. Inteligencia de Negocios (antes y despus). ....................................................... 21
Figura 05. Componentes de la Arquitectura de Inteligencia de Negocios. .......................... 21
Figura 06. Estructura de los datos de un Data Warehouse. ................................................. 24
Figura 07. Estructura de los datos de un Datamart. ............................................................. 25
Figura 08. Esquema del modelo estrella. ............................................................................. 26
Figura 09. Ejemplo de Drill-Up y Drill-Down. ................................................................... 31
Figura 10. Ciclo de vida del Business Intelligence. ............................................................. 38
Figura 11. Universidad Autnoma del Per. ....................................................................... 43
Figura 12. Organigrama de la Universidad Autnoma del Per.......................................... 44
Figura 13. Servicio de Educacin de la Universidad Autnoma del Per. .......................... 45
Figura 14. Stakeholders Internos y Externos. ...................................................................... 47
Figura 15. Cadena de Valor de la Universidad Autnoma del Per Educacin
Universitaria. ....................................................................................................... 48
Figura 16. Identificacin de Procesos de Negocios Transaccionales de la Cadena de Valor
Educacin Universitaria. .................................................................................. 49
Figura 17. Procesos de Negocio Transaccionales de la Universidad Autnoma del Per
Educacin Universitaria. ..................................................................................... 50
Figura 18. Diagrama de Contexto. ....................................................................................... 51
Figura 19. Flujograma del Proceso Propuesto de Toma de Decisiones (TO-BE). ............. 51
Figura 20. Cronograma de Actividades. .............................................................................. 53
Figura 21. Servidor HP ProLiant DL380 G7. ...................................................................... 54
Figura 22. Pcs de Usuarios. ................................................................................................ 55
Figura 23. Diseo de la Arquitectura Tecnolgica de la UAP. ........................................... 61
Figura 24. Back Room. ........................................................................................................ 62
Figura 25. Front Room......................................................................................................... 63
Figura 26. Mapeo de datos Postulante_dim. ........................................................................ 66
Figura 27. Mapeo de datos Nivel_Academico_dim. ........................................................... 66
-xi-
-xiii-
NDICE DE TABLAS
Tabla 01. Datos actuales de los indicadores. ......................................................................... 6
Tabla 02. Diferencias entre las bases de datos transaccionales y los almacenes de datos. .. 23
Tabla 03. Diferencia entre Esquema de Estrella y Esquema de Copo de Nieve. ................ 27
Tabla 04. Ventajas y Desventajas de Tipo de Almacenamiento. ......................................... 30
Tabla 05. Comparativa de herramientas de Inteligencia de Negocios. ................................ 32
Tabla 06. Recursos de TI. .................................................................................................... 40
Tabla 07. Presupuesto. ......................................................................................................... 41
Tabla 08. Equipo de Trabajo................................................................................................ 53
Tabla 09. Funciones Especficas del Equipo de Trabajo. .................................................... 54
Tabla 10. Especificaciones Tcnicas del Servidor HP ProLiant DL380 G7. ...................... 54
Tabla 11. Especificaciones Tcnicas de las Pcs de Usuarios. ............................................ 55
Tabla 12. Modelo Dimensional Postulante. ......................................................................... 77
Tabla 13. Modelo Dimensional Colegio. ............................................................................. 77
Tabla 14. Modelo Dimensional Nivel Acadmico. ............................................................. 77
Tabla 15. Modelo Dimensional Zona. ................................................................................. 78
Tabla 16. Modelo Dimensional Tiempo. ............................................................................. 78
Tabla 17. Modelo Dimensional Admisin. .......................................................................... 78
Tabla 18. Cantidad de postulantes e ingresantes por facultad y escuela. .......................... 108
Tabla 19. Cantidad de postulantes, ingresantes y monto por Modalidad. ......................... 108
Tabla 19. Cantidad de postulantes e ingresantes por distrito y sexo. ................................ 109
Tabla 20. Cantidad de postulantes, ingresantes y monto por tipo de colegio. ................... 110
Tabla 22. Resultados de Post-Prueba (Gc) y Post-Prueba (Ge) para los KPI1, KPI2, KPI3,
KPI4, KPI5. ........................................................................................................ 117
Tabla 23. Promedio de los indicadores de la Post-Prueba (Gc) y Post-Prueba (Ge). ........ 122
Tabla 24. Resultados de Post-Prueba (Gc) y Post-Prueba (Ge) para el KPI1. ................. 123
Tabla 25. Resultados de Post-Prueba (Gc) y Post-Prueba (Ge) para el KPI2. .................. 125
Tabla 26. Resultados de Post-Prueba (Gc) y Post-Prueba (Ge) para el KPI3. .................. 127
Tabla 27. Resultados de Post-Prueba (Gc) y Post-Prueba (Ge) para el KPI4. .................. 129
-xiv-
CAPTULO I
PLANTEAMIENTO
METODOLGICO
1.1
A. Castaeda
A. Castaeda
Es por ello que se desarrolla una solucin de Business Intelligence para el rea de
Admisin, que cada da son ms complejos y su gestin se convierte ms difcil por
diversas razones.
La Investigacin, se realiza en la Universidad Autnoma del Per, ubicada en la
Antigua Panamericana Sur Km 16.3 Mz A Lote 6 Urb. La Concordia, Villa El
Salvador, Lima Per. (Ver Figura 01).
-3-
-4A. Castaeda
Figura 02. Flujograma del Proceso Transaccional en el rea de Admisin de la Universidad Autnoma del Per.
A. Castaeda
Figura 03. Flujograma del Proceso de Toma de Decisiones para el Jefe del rea de
Admisin de la Universidad Autnoma del Per. (AS-IS)
-5-
A. Castaeda
INDICADORES
DATOS DE POST-PRUEBA(GC)
(Promedio)
46,68%
25,63 Minutos
20,33%
4 reportes/ciclo
Difcil
A. Castaeda
JUSTIFICACIN E IMPORTANCIA
-7-
A. Castaeda
1.4
OBJETIVOS DE LA INVESTIGACIN
1.4.1 Objetivo General
Desarrollar Business Intelligence, basado en la Metodologa de Ralph Kimball, para
mejorar el Proceso de Toma de Decisiones en el rea de Admisin de la Universidad
Autnoma del Per.
1.4.2 Objetivos Especficos
a) Realizar un diagnstico de la naturaleza del negocio.
b) Identificar los requerimientos de anlisis de informacin del Proceso de Admisin
de la Universidad Autnoma del Per.
c) Analizar las diferentes fuentes de informacin para determinar la creacin del
modelo de base de datos multidimensional.
d) Realizar de manera eficiente el Proceso de ETL (Extraccin, Transformacin y
Carga de Datos).
e) Elaborar cubos, reportes e indicadores que sea fcil de generar, mantener y
desplegar para la toma de decisiones en el rea de Admisin.
1.5
HIPTESIS
VARIABLES E INDICADORES
1.6.1 Variables
A) Variable Independiente: Business Intelligence.
B) Variable Dependiente: Proceso de Toma de Decisiones en el rea de Admisin
de la Universidad Autnoma del Per.
-8-
A. Castaeda
1.6.2 Indicadores
A. Conceptualizacin
Variable Independiente: Business Intelligence.
Indicador: Presencia Ausencia
Descripcin: Cuando es No, es porque no existe el Business Intelligence en la
Universidad Autnoma del Per y an nos encontramos en la situacin actual del
problema. Cuando es SI, es cuando se aplic el Business Intelligence en la
Universidad Autnoma del Per, esperando obtener mejores resultados.
Indicadores
Porcentaje
de
Descripcin
exactitud
de
la Es el porcentaje de exactitud de la
informacin
Porcentaje
de
malas
tomadas
el Jefe de Admisin.
B. Operacionalizacin
Variable Independiente: Business Intelligence.
Indicador
ndice
Presencia- Ausencia
No , S
-9-
A. Castaeda
ndice
Unidad de Medida
Unidad de
Observacin
Porcentaje
exactitud
de
de
[40 - 55]
la
datos
informacin
Tiempo en realizar
[20 - 30]
Minutos
[10 - 30]
Reloj
los reportes
Porcentaje
malas
de
decisiones
de
malas
de Jefe de Admisin
decisiones tomadas.
tomadas
Nmero
de
[3 - 5]
reportes solicitados
de
solicitados /ciclo
por ciclo
Comprensin
de
los reportes
1.7
Fcil, Normal,
Jefe de Admisin
Difcil
LIMITACIONES DE LA INVESTIGACIN
La presente investigacin no cuenta con mucho acceso a la informacin sobre el
Proceso de Toma de Decisiones en el rea de Admisin de la Universidad
Autnoma del Per.
El tiempo para la limpieza de la base de datos del rea de Admisin.
1.8
DISEO DE LA INVESTIGACIN
Ge
O1
Gc
--
O2
-10-
A. Castaeda
Dnde:
Descripcin:
Se trata de la confrontacin de forma intencional de un grupo Ge conformado por las
personas que toman decisiones en el proceso de Admisin en la Universidad Autnoma del
Per, al que le aplic un estmulo Business Intelligence (X), luego del cual se le aplica una
prueba posterior a los indicadores de la variable dependiente (O1). A un segundo grupo
(Gc), tambin conformado intencionalmente por las personas que toman decisiones en el
proceso de Admisin en la Universidad Autnoma del Per, al que no se le administra
estmulo alguno, sirviendo slo como grupo de control; en forma simultnea se le aplica
una prueba a los indicadores de la variable dependiente (O2), se espera que los valores O1
sean mejores que los valores O2.
Los dos grupos estn constituidos de forma intencional pero representadas estadsticamente
tanto en ausencia como en presencia del Business Intelligence propuesto.
-11-
1.9
TCNICAS
A. Castaeda
INSTRUMENTOS
PARA
RECOLECCIN
DE
INFORMACIN
A) Tcnicas e Instrumentos de la Investigacin de Campo
TCNICAS
INSTRUMENTOS
1. Observacin Directa
Jefe de Admisin
Reporte de Admisin
2. Realizacin de Entrevistas
Estructurada
Formato de entrevistas
Dirigidas
Grabaciones
3. Aplicacin de Cuestionarios
Abierto
Cuestionario(documento)
Cerrado
B) Tcnicas e Instrumentos de la Investigacin Experimental
TCNICAS
INSTRUMENTOS
Fichas de Benchmarking
Impresiones
Revistas
Fotocopias
Tesis
Computadora
Monografas: Virtuales
Libreta de apuntes
-12-
CAPTULO II
MARCO REFERENCIAL
2.1
A. Castaeda
ANTECEDENTES DE LA INVESTIGACIN
A. Tesis
1) Autores: Gabriela Paola Basantes Espinoza.
Daniel Eduardo Lpez Galarza.
Ttulo: Estudio de la Aplicacin de Inteligencia de Negocios en los Procesos Acadmicos
Caso de Estudio Universidad Politcnica Salesiana.
Resumen:
La presente tesis: Estudio de la aplicacin de Inteligencia de Negocios en los Procesos
Acadmicos. Caso de estudio: Universidad Politcnica Salesiana, es creada como apoyo a
la toma de decisiones de la Universidad Politcnica Salesiana a travs de una aplicacin
web, la construccin de la aplicacin implica la implantacin de un Data Warehouse de los
Procesos acadmicos.
Inicialmente, y dentro del alcance del proyecto de la tesis, dicha construccin se encuentra
comprendida dentro del mismo. Este trabajo es fundamental para el Proceso de desarrollo
de aplicaciones en el rea de inteligencia de negocios de la universidad.
El objetivo principal es proveer una aplicacin software del tipo de inteligencia de
negocios, que brinde el soporte a las necesidades de informacin como apoyo en la
generacin de conocimiento para la universidad ya que esta mueve un mercado altamente
competitiva donde cubrir las necesidades es primordial; siendo directamente proporcional a
la capacidad de la universidad de crear, capturar, manejar y generar conocimiento e
incorporar las mejores prcticas , con el fin de aadir valor a cada eslabn de su
productividad.
Fue desarrollado en un ambiente Web por medio de ASP.net para la vinculacin de los
Servicios de Anlisis y Servicios de Reportes cuenta con una interfaz amigable y dinmica
que ayuda al usuario un fcil entendimiento y manejo del mismo permitiendo as su fcil
capacitacin del rea acadmica.
-14-
A. Castaeda
-15-
A. Castaeda
B. Libros
3) Autor: Jonathan David Nima Ramos.
Ttulo: Soluciones de Inteligencia de Negocios a su alcance: Fundamentos y Casos de
Aplicacin.
Resumen:
El presente libro presenta las ventajas significativas de utilizar sistemas de inteligencia de
negocios teniendo como base fundamental las bodegas de datos; detalla los pasos
necesarios para disear un Data Warehouse que es la herramienta fundamental de los
sistemas de procesamiento analtico y concluye con un caso de aplicacin desarrollado por
el autor que afianza los conceptos explicados.
El principal problema dentro de una empresa es que existen muchos datos y muy poca
informacin. Eso significa un alto volumen de datos y necesidades de respuesta rpida que
exige un anlisis complejo con consultas imposibles de prever y un ambiente de negocio en
cambio constante.
El soporte a las decisiones en el modelo tradicional ha generado un impacto negativo sobre
los sistemas operacionales y los analistas de negocios se vuelven PROGRAMADORES,
originando que las reglas de negocio no sean compartidas y los datos no estn disponibles.
En lugar de construir sistemas para el apoyo del negocio, se dedican muchas veces slo a
resolver problemas operacionales del mismo y operar sus sistemas con ms eficiencia,
soportando ms usuarios concurrentes, sin pensar en los sistemas y datos como importantes
activos de la empresa que podran ayudarla a ser ms competitiva en el mercado mediante
la explotacin de los mismos.
Es importante acotar la importancia de la forma en que se visualizacin los datos pues es
una gran ayuda para las personas que toman las decisiones en la Organizacin tener
reportes que engloben informacin relevante, consistente y fcil de entender.
-16-
A. Castaeda
-17-
A. Castaeda
C. Artculos
5) Autores: Luis Fuentes Tapia.
Ricardo Valdivia Pinto.
Ttulo: Incorporacin de Elementos de Inteligencia de Negocios en el Proceso de
Admisin y Matrcula de una Universidad Chilena.
Resumen:
El presente artculo describe un Proceso orientado a la incorporacin de elementos de
Inteligencia de Negocios (Business Intelligence) en la Universidad de Tarapac (UTA),
Arica, Chile. Con este fin, se implement un Data Mart (DM) centrado en el rea de
Admisin y Matrcula de la Vicerrectora Acadmica.
Su desarrollo requiri de la realizacin de actividades tales como la obtencin de los
requerimientos del negocio, la investigacin del indicador clave de rendimiento (KPI) del
rea, el anlisis de las distintas fuentes de informacin interna y el desarrollo de un
modelado Dimensional basado en el esquema estrella de Kimball.
Para la correcta implementacin e integracin de este repositorio de datos se debi realizar
un Proceso de extraccin, transformacin y carga (ETL) a partir de dos fuentes de datos.
La creacin de este DM permiti que los usuarios de la Vicerrectora Acadmica pudieran
visualizar la informacin que requeran a travs de herramientas de procesamiento analtico
en lnea (OLAP).
Complementndose, adems, con herramientas para la generacin de reportes y
herramientas para la creacin de dashboards.
La integracin de estos elementos conform una plataforma de inteligencia de negocios,
que permite dar soporte a los requerimientos de informacin y anlisis asociados al
Proceso de admisin y matrcula.
Finalmente, se espera que el Proceso de toma de decisiones del rea de admisin mejore
con el uso de esta herramienta BI. Los usuarios asociados a Procesos de toma de decisiones
podrn contar con una herramienta que mejora la visualizacin y anlisis de la informacin
ms relevante.
-18-
A. Castaeda
-19-
2.2
A. Castaeda
MARCO TERICO
A) Inteligencia de Negocios
Es el Proceso mediante el cual las organizaciones segmentan, unifican, jerarquizan y
definen contextos sobre la informacin, con la finalidad de identificar la informacin ms
relevante y representativa para la organizacin.
Inteligencia de Negocios es una disciplina que, junto con sus correspondientes
herramientas, hacen centro en el anlisis de la informacin para la correcta toma de
decisiones que le permita a la organizacin cumplir con los objetivos de negocios.1
1
2
Nima, J., Soluciones de Inteligencia de Negocios: Fundamentos y Casos de Aplicacin, Ed.Eumed, 2009, p. 84.
dem, p. 128.
-20-
A. Castaeda
Curto, J., Introduccin al Business Intelligence, Ed. UOC, 2010, pp. 24-26.
-21-
A. Castaeda
dem, p. 50.
dem, p. 54.
-22-
A. Castaeda
para lograrlo (Proceso ETL). El tiempo que ocupa realizar todo este Proceso, representa
entre el 60% y el 80% de un proyecto de inteligencia de negocios. El Proceso ETL se
divide en 5 subprocesos:
Extraccin: Este procedimiento consiste en realizar la recuperacin de los datos
fsicamente de las distintas fuentes de informacin.
Limpieza: Permite la recuperacin de los datos en bruto y comprobacin de su calidad,
eliminando los duplicados y, cuando sea posible, corrigiendo los valores errneos y
completando los datos inexistentes.
Transformacin: Este Proceso se encarga de realizar la recuperacin de los datos
limpios y de alta calidad en las distintas etapas del anlisis. El resultado es la obtencin
de datos limpios, consistentes, sumarizados y tiles.
Integracin: Este Proceso consiste en verificar si los datos que ingresan en el Data
Warehouse son consistentes con las definiciones y formatos. Si es as, los integra en los
modelos de las distintas reas de negocios que hemos definido en el mismo. Estos
Procesos pueden ser complejos.
Actualizacin: Este Proceso es el que nos permite aadir los nuevos datos al Data
Warehouse.6
PARMETROS
Propsito
BASE DE DATOS
Operaciones
diarias.
TRANSACCIONAL
Soporte
a las aplicaciones.
ALMACN DE DATOS
Recuperacin
de
informacin,
informes, anlisis y minera de datos.
Tipo De Datos
Datos de funcionamiento de
la organizacin.
Caractersticas
de los Datos.
Datos de funcionamiento,
cambiantes, internos.
Modelo de Datos
Datos normalizados.
Basantes, G. et al., Estudio de la Aplicacin de Inteligencia de Negocios en los Procesos Acadmicos, 2010, p. 40.
-23-
Nmero y Tipo
de Usuarios
Acceso
A. Castaeda
-24-
A. Castaeda
Datamart
Un Datamart es una base de datos departamental, especializada en el almacenamiento de
los datos de un rea de negocios especfica. Se caracteriza por disponer la estructura
ptima de datos para analizar la informacin al detalle desde todas las perspectivas que
afecten a los Procesos de un departamento. Un Datamart puede ser alimentado desde los
datos de un Data Warehouse o integrar por s mismo un compendio de distintas fuentes de
informacin.
Un Datamart es considerado un elemento de un Data Warehouse, pero con informacin de
un rea en especfico de la organizacin.10
http://www.usmp.edu.pe/publicaciones/boletin/fia/info46/sistemas/articulo6.htm.
Campos, M., Data Warehouse del Registro Acadmico de la Universidad Centroamericana, 2006, pp. 30-32.
10
dem, p. 36.
9
-25-
A. Castaeda
Esquema de Estrella
Para facilitar el anlisis, el Datamart organiza los datos en una estructura llamada
Esquema de Estrella. Esta estructura est compuesta por una tabla central (tabla de
hechos) y un conjunto de tablas organizadas alrededor de sta (tabla de dimensiones).
En las puntas de la estrella se encuentran las tablas de dimensin que contiene los
atributos de las aperturas que interesan al negocio que se pueden utilizar como criterios de
filtro y son relativamente pequeas. Cada tabla de dimensin se vincula con la tabla de
hechos por un identificador.12
11
12
dem, p. 38.
Fuentes, L. et al., Incorporacin de Inteligencia de Negocios, en Art. Sist. de Informacin Cientfica (2010) pp. 383-394.
-26-
A. Castaeda
Copo de Nieve
Almacenamiento
Aumenta el espacio
Ahorra el espacio
Consultas
Mejora el rendimiento
Cantidad de Tablas
Menor
Mayor
13
14
dem, p. 40.
Curto, J., Introduccin al Business Intelligence, Ed. UOC, 2010, pp. 180-190.
-27-
A. Castaeda
Dimensin
Las dimensiones son las que organizan los datos en funcin de un rea de inters para
los usuarios, cada dimensin describe un aspecto del negocio y proporciona el acceso
intuitivo y simple a datos, una dimensin provee al usuario de un gran nmero de
combinaciones e intersecciones.
Las tablas de dimensiones son las compaeras de las tablas de hechos, cada dimensin se
define por su clave primaria que sirve para mantener la integridad referencial en la tabla
de hechos a la que se relaciona. Un cubo requiere que se defina al menos una dimensin
en su empresa.
Medidas
Las medidas dentro de la construccin de un Datamart son los valores de datos que se
analizan. Estas medidas pueden ser cuantitativas o numricas, dentro de la tabla de hechos,
permitiendo analizarlos ya que estos valores son la base de las cuales el usuario puede
realizar clculos.
Las medidas representan los valores que son analizados, como por ejemplo: cantidad de
pacientes admitidos o llamadas efectuadas.15
Sistemas OLTP
Estos tipos de sistemas de Procesamiento Transaccional en Lnea son los sistemas
operacionales que capturan las transacciones de los Procesos de una empresa, y las
persisten en estructuras relacionales llamadas base de datos.
Caractersticas de OLTP
Realizar transacciones en tiempo real del Proceso de un negocio.
Estos sistemas son los responsables del mantenimiento de los datos, ya sea agregando,
realizando, actualizaciones o bien eliminndolos.
Las estructuras de datos deben estar depuradas para validar la entrada de los mismos, y
rechazarlos si no cumplen con determinadas reglas.16
15
16
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Cutro_trabajo_adsc_DAD_2010.pdf.
Juipa, N. et al., Diseo e Implementacin de Inteligencia de Negocios FIIS, en Art. Int. de Negocios (2011) pp. 1-20.
-28-
A. Castaeda
Sistemas OLAP
Los sistemas de Procesamiento Analtico en Lnea proporcionan una alternativa a los
sistemas transaccionales, ofreciendo una visin de los datos orientada hacia el anlisis y
una rpida y flexible navegacin de estos.
Caractersticas de OLAP
Los cubos de OLAP almacenan varios niveles de datos conformados por estructuras
altamente optimizadas que responden a las expectativas de negocios de la empresa.
Los sistemas OLAP estn preparado para realizar informes complejos de una manera
simple.
Los usuarios pueden cambiar fcilmente las filas, las columnas, y las pginas en
informes de OLAP, pudiendo leer la informacin de la manera que se crea ms
conveniente para el anlisis.
17
18
Basantes, G. et al., Estudio de la Aplicacin de Inteligencia de Negocios en los Procesos Acadmicos, 2010, p. 80.
dem, p. 90.
-29-
A. Castaeda
VENTAJAS
DESVENTAJAS
Duplica el almacenamiento de
datos
(ocupa
ms
espacio).
Tiempo de Latencia.
ROLAP
El
tiempo
de
consultas es mayor.
respuesta
conjuntos de datos.
Buen tiempo de respuesta slo para
HOLAP informacin sumarizada.
19
http://www.usmp.edu.pe/publicaciones/boletin/fia/info46/sistemas/articulo6.htm.
-30-
A. Castaeda
Nima, J., Soluciones de Inteligencia de Negocios: Fundamentos y Casos de Aplicacin, Ed.Eumed, 2009, p. 99.
http://msdn.microsoft.com/es-es/library/ms141026.aspx.
-31-
Caractersticas de la Herramienta
Forma
parte
de
una
plataforma
Si
No
Si
Si
Si
No
Si
Si
No
Si
Si
No
Si
No
Si
Si
Si
Si
No
Si
Si
No
Si
Si
Si
Si
No
Si
-32-
datos?
Permite cargas desde ficheros Excel,
XML y planos?
Requiere una fcil instalacin de la
herramienta?
La plataforma posee una herramienta
de
explotacin,
herramientas
de
-32-
A. Castaeda
A. Castaeda
-33-
A. Castaeda
sino de un Proceso que involucre varias etapas donde se obtenga ms informacin sobre el
aspirante, por ejemplo su estado de salud, sus valores y sus actitudes. 22
Elementos fundamentales de la Gestin del rea de Admisin:
http://www.uv.mx/universidad/doctosofi/nme/proc-admis.htm.
Campos, M., Data Warehouse del Registro Acadmico de la Universidad Centroamericana, 2006, pp. 120-122.
-34-
A. Castaeda
Definicin de los Requerimientos del Negocio: Para que el Data Warehouse tenga xito,
deben entenderse los negocios y requerimientos de los usuarios finales. Las tcnicas
utilizadas para obtener los requerimientos analticos difieren significativamente de las
utilizadas tradicionalmente. Los diseadores de Data Warehouse deben entender los
factores claves que guan el negocio para determinar efectivamente los requerimientos, y
as traducirlos en las propuestas de diseo.24
Nima, J., Soluciones de Inteligencia de Negocios: Fundamentos y Casos de Aplicacin, Ed.Eumed, 2009, p. 91.
-35-
A. Castaeda
operacionales. Se inicia construyendo una matriz que representa los puntos o Procesos
claves del negocio y su dimensionalidad. Partiendo de esto se dirigir un anlisis ms
detallado de los datos en los sistemas operacionales ms relevantes. A partir de este
anlisis y junto con el entendimiento de los requerimientos obtenidos, se desarrolla un
modelo dimensional. Este modelo identifica la granularidad de la tabla de hechos (fact
table), las dimensiones asociadas, los atributos, jerarquas y datos. El diseo lgico de la
base de datos es completado con las estructuras de las tablas y las relaciones entre stas
(llaves primarias y forneas). Este grupo de actividades concluye con el desarrollo del
mapeo de datos, desde las fuentes de origen hacia las fuentes destino.
Diseo Fsico: El diseo fsico de la base de datos se enfoca en definir las estructuras
fsicas necesarias para soportar su diseo lgico. Los elementos principales de este Proceso
incluyen: definir los estndares de nombres y configurar el medio ambiente de la base de
datos. Las estrategias preliminares de indexamiento y particionamiento son tambin
determinadas.
Diseo y Desarrollo del Data Staging: Este Proceso es, tpicamente, la tarea de Data
Warehousing ms subestimada. El Proceso de data staging tiene tres pasos principales:
extraccin, transformacin y carga (ETL).
El Proceso de extraccin siempre expone problemas relacionados con la calidad de los
datos, estas inconsistencias se han encontrado ocultas dentro de los sistemas operacionales.
La calidad de los datos tiene un impacto significativo en la credibilidad del Data
Warehouse, por eso se necesita tratar estos problemas durante el Proceso del data staging.
Se necesita disear y construir dos Procesos de carga, uno para la poblacin inicial del
Data Warehouse y el otro para las cargas regulares e incrementales.
-36-
A. Castaeda
Administracin del Proyecto: Asegura que las actividades del ciclo de vida dimensional
se mantengan en la va correcta y en sintona. Las actividades de la administracin del
proyecto ocurren a travs de todo el ciclo de vida. Estas actividades se enfocan en
monitorear el estado de los proyectos, llevar un control de errores y un control de cambios
para preservar los objetivos del proyecto. Finalmente, la administracin del proyecto,
incluye el desarrollo de un plan de comunicacin, que se centra tanto en el negocio como
en la organizacin de los sistemas de informacin.25
25
Nima, J., Soluciones de Inteligencia de Negocios: Fundamentos y Casos de Aplicacin, Ed.Eumed, 2009, pp. 100-110.
-37-
A. Castaeda
-38-
CAPTULO III
DESARROLLO DE BUSINESS
INTELLIGENCE
3.1
A. Castaeda
GENERALIDADES
3.2
ESTUDIO DE FACTIBILIDAD
3.2.1 Factibilidad Tcnica
La Factibilidad Tcnica consisti en realizar una evaluacin de la tecnologa
existente en la organizacin, este estudio estuvo destinado a recolectar informacin
sobre los componentes tcnicos que posee la organizacin y la posibilidad de hacer
uso de los mismos en el desarrollo e implementacin del sistema propuesto y de ser
necesario, los requerimientos tecnolgicos que deben ser adquiridos para el
desarrollo y puesta en marcha del sistema.
En tal caso, los recursos tecnolgicos requeridos para el desarrollo e implementacin
del Business Intelligence son:
A. Castaeda
PRECIO
UNITARIO
(S/.)
CANTIDAD
TOTAL
(S/.)
Persona
3,500.00
3,500.00
Papel
Millar
20.00
40.00
Lapicero
Global
0.50
10
5.00
Informacin de Internet
Global
50.00
400.00
Flder
Global
0.50
15
7.50
Engrapador
Global
10.00
10.00
CONCEPTO
1. Recursos Humanos
Alberto Castaeda Vsquez
2. Recursos Materiales
-41-
A. Castaeda
CDs
Global
1.50
10
15.00
Copias
Global
1000
0.10
100.00
Perforador
Global
10.00
10.00
Fster
Global
0.30
15
4.50
Global
1.50
100
150.00
Computadora
Global
3,000.00
3,000.00
Global
150.00
150.00
USB
Global
20.00
20.00
Scanner
Global
50.00
50.00
Windows 7 Professional
Global
5.00
5.00
Global
5.00
5.00
Global
5.00
5.00
Global
5.00
5.00
Minitab
Global
5.00
5.00
Global
5.00
5.00
Otros gastos
Global
200.00
200.00
3. Recursos Tcnicos
Movilidad
Hardware
continuo
Software
9,492.00
Total
3.3
-42-
A. Castaeda
-43-
-44-
A. Castaeda
-45-
A. Castaeda
Competidores:
Universidad Cientfica del Sur, UNTECS, UPIG, Universidad Ricardo Palma.
Clientes:
Personas que han terminado la secundaria, por segunda profesin, por
convalidacin, por traslado externo, por centro pre.
-46-
-47A. Castaeda
Cadena de Valor
-48-48-
A. Castaeda
Figura 15. Cadena de Valor de la Universidad Autnoma del Per Educacin Universitaria.
-49-
Procesos de Negocio
-49-
A. Castaeda
Figura 16. Identificacin de Procesos de Negocios Transaccionales de la Cadena de Valor Educacin Universitaria.
A. Castaeda
-50-
A. Castaeda
-51-
A. Castaeda
-52-
A. Castaeda
Castaeda
Vsquez, Alberto
Cargo
Business Executive
Sponsor
Experto en Procesos
de Negocios
Gerente de
Proyectos
Especialista de
Datos
Funcin
Tiene a su cargo el soporte gerencial del
proyecto.
Experto en el Dominio permite al Equipo de
Desarrollo aprender sobre el negocio para el
cual est siendo construida la aplicacin.
Tiene a su cargo la planificacin del
proyecto, a lo largo de todo el ciclo de vida.
Verificar los requerimientos del usuario
mediante casos de prueba.
-53-
A. Castaeda
Funciones Especficas:
Tabla 09. Funciones Especficas del Equipo de Trabajo.
Nombre
Castaeda Vsquez,
Alberto
Cargo
Funcin
Lder Tecnolgico
Analista Dimensional
Experto en ETL
Experto en Cubos
Especialista en Datos
Memoria, estndar
12 GB
Ranuras de memoria
18 ranuras DIMM
Tipo de memoria
PC3-10600R (RDIMM)
Ranuras de expansin
Controlador de red
A. Castaeda
Controlador de almacenamiento
Software de gestin
Pcs de Usuarios:
Sistema operativo
Chipset
Factor de forma
Microtorre
|Memoria
Memoria,
estndar
Ranuras de
4 DIMM
memoria
Almacenamiento de datos
Descripcin del
disco duro
Grficos
Grficos
Puertos
10 USB 2.0
-55-
A. Castaeda
1 en serie
1 teclado PS/2
1 mouse PS/2
1 VGA
1 conector para micrfono/audfono
1 entrada de lnea
1 salida de lnea
1 RJ-45
Dispositivos multimedia
Cdec de audio Realtek ALC261, altavoz interno y puertos para
Audio
Alimentacin
B) Software
Software
Fundamento
Base de datos
Cubos
Permite realizar procesamiento analtico
y minera de datos.
Aplicacin
Permite
el
desarrollo
mediante
tabular.
-56-
A. Castaeda
Descripcin
Presupuesto Establecido
Recursos Humanos
La planificacin se ha basado en la
utilizacin de personas especficas, pero
estas personas no estn disponibles.
Error en la contratacin
Implementacin de tecnologas
3.4
Gerente de Marketing
Pilar Llerena
Jefe de Admisin
Raquel Navarrete
Asistente de Admisin
Oliver Bayona
Promotor Educativo
Rocio Limaco
Promotor Educativo
Cristina Suarez
Promotor Educativo
-57-
A. Castaeda
B) Entrevista
ENTREVISTA PERSONAL - REA DE ADMISIN
Entrevistada: Pilar Llerena
Cargo: Jefe de Admisin
1. Quines son sus clientes?
Mis clientes potenciales son los interesados en estudiar una carrera superior en cualquiera
de las 5 carreras que ofrecemos: Administracin, Derecho, Psicologa, Ing. de Sistemas y
Contabilidad, y de acuerdo a las modalidades de ingreso: Pre autnoma, examen de
admisin, examen extraordinario y tu primera opcin. Especialmente son los alumnos que
han terminado su 5to ao de secundaria.
2. En qu consiste t trabajo en el rea?
La funcin principal es la de brindar informacin precisa y pertinente acerca de los
beneficios de estudiar en nuestra Universidad.
3. Cules son los objetivos del rea?
El objetivo principal es de captar la mayor cantidad de postulantes inscritos segn las
modalidades de ingreso.
4. Qu retos se tienen que cumplir en el rea?
El reto es cumplir con las metas propuestas por la direccin de Marketing y que cada
postulante sea matriculado en la carrera de su eleccin de acuerdo a las vacantes que
tenemos disponibles.
5. Qu decisiones se toman en el Proceso de Admisin?
Cada postulante debe cumplir con los requisitos exigidos para su postulacin, para ser
considerado alumno de la Universidad. Cerrar las inscripciones en el plazo de fecha.
6. Tu sistema de informacin actual te ayuda a tomar decisiones?
En trminos de registro de postulantes, el sistema si me ayuda a obtener la informacin que
necesito para la inscripcin de cada postulante, y luego procesarla para un reporte final a
gerencia.
7. Qu es lo que requieres en el sistema de informacin para que te ayude en el
Proceso de Toma de Decisiones del rea de Admisin?
Para que el sistema de bsqueda sea ms gil, se podra implementar un registro histrico
de los postulantes segn su modalidad de ingreso por ejemplo, los postulantes que se
inscriben a la Pre Autnoma y no ingresan se les cambia su modalidad por examen de
admisin, pero el sistema no contabiliza todo su historial de ingreso, solamente el ltimo
-58-
A. Castaeda
registro. Tambin, que se pueda tener estadsticas por nombres de los colegios que
provienen los postulantes. Agregar un canal de inscripcin ms, es decir, se pueda realizar
una inscripcin va internet y los pagos On-line o que acepten otras formas de pago, no
slo en efectivo sino con tarjetas de crdito.
8. Tienes algn problema o dificultad en el proceso de Admisin?
El problema del rea de Admisin son las vacantes limitadas que tenemos para cada
carrera.
9. Cules son las limitaciones del sistema de informacin?
Las limitaciones se presentan cuando queremos hacer reportes estadsticos por postulantes
inscritos en cada admisin, el sistema no filtra comparaciones con periodos anteriores de
cada modalidad de ingreso. Por ejemplo, cuando se necesita saber el total de inscritos por
cada PRE, no hay un histrico de los postulantes que se inscriben por cada fecha de inicio
de la PRE.
Postulantes
Se requiere conocer la cantidad de postulantes por sexo y el monto segn las
inscripciones por periodo acadmico.
Nivel Acadmico
Se requiere conocer la cantidad de postulantes por Escuela (Administracin, Ing. de
Sistemas, Psicologa, Contabilidad, Derecho) y el monto segn las inscripciones
por Escuela.
-59-
A. Castaeda
Modalidad
Se requiere conocer la cantidad de postulantes por modalidad (Examen Ordinario,
Examen Extraordinario, Centro Pre, tu primera opcin) y el monto.
Colegio
Se requiere conocer la cantidad de postulantes segn el tipo de colegio.
Zona
Se requiere conocer la cantidad de postulantes segn su distrito.
Tiempo
Se requiere mostrar la informacin por aos, semestres, meses.
3.4.3 Requerimientos
A) Requerimientos de Negocio:
B) Requerimientos de Stakeholder:
C) Requerimientos de la Solucin:
Requerimientos Funcionales:
Requerimientos no Funcionales:
3.5
A. Castaeda
-61-
A. Castaeda
PERADMISION
PROVINCIA
PERTIPOCOLEGIO
PERFACULTAD
PERSONA
PERCARRERA
PERMODALIDAD
DISTRITO
PERCOLEGIO
Limpiar
Concatenar Apellidos y
nombres
Postulante_dim
Tiempo_dim
Nivel_Academico_dim
Zona_dim
Colegio_dim
-62-
Metadatos
Modalidad_dim
A. Castaeda
B) FRONTROOM
Postulante_dim
Tiempo_dim
Nivel_Academico_dim
Modalidad_dim
Zona_dim
Colegio_dim
Admision_facts
-63-
3.6
A. Castaeda
Base de Datos
Poblamiento de datos
Cubos OLAP
Reportes
Reportes
Reportes Web
-64-
3.7
A. Castaeda
MODELO DIMENSIONAL
3.7.1 Seleccin del Business Intelligence
Para el desarrollo de la construccin del Business Intelligence se sigue la
Metodologa estudiada de Ralph Kimball, dado que establece claros procesos para
todo el ciclo del desarrollo del proyecto y garantiza la calidad y eficiencia de la
solucin de inteligencia de negocios.
El modelo utilizado para soportar el Business Intelligence se bas en un esquema
estrella. En general, un esquema estrella est constituido por un conjunto de tablas
que representan dimensiones y una tabla de hechos. Las dimensiones sirven para
detallar los valores que se encuentran asociados a la tabla de hechos que registran las
medidas o los estados sobre un acontecimiento o una situacin.
3.7.2 Antigedad de la Data
La antigedad que tiene el funcionamiento de la Base de Datos es de 5 aos.
3.7.3 Calidad de la Data
La data a travs del tiempo se ha ido mejorando y actualmente contamos con una
base de datos consistente que es eficaz en la hora de hacer nuestros reportes o
consultas.
3.7.4 Definir las Dimensiones
DIMENSIONES
TIEMPO_DIM
DESCRIPCIN
Contiene la informacin de los periodos que existe
en el ao, los semestres y meses.
de la Universidad.
POSTULANTE_DIM
MODALIDAD_DIM
ZONA_DIM
COLEGIO_DIM
-65-
A. Castaeda
POSTULANTE_DIM
NIVEL_ACADEMICO_DIM
-66-
A. Castaeda
MODALIDAD_DIM
TIEMPO_DIM
-67-
A. Castaeda
ZONA_DIM
COLEGIO_DIM
A. Castaeda
CLAVE PRIMARIA
TIEMPO_DIM
TiempoKey(PK)
NIVEL_ACADEMICO_DIM
NivelAcademicoKey(PK)
POSTULANTE_DIM
PostulanteKey(PK)
MODALIDAD_DIM
ModalidadKey(PK)
ZONA_DIM
ZonaKey(PK)
COLEGIO_DIM
ColegioKey(PK)
DIMENSIN TIEMPO_DIM
Contiene el ao, semestre y mes en el periodo de Admisin
Nivel
Nivel 1
Nivel 2
Nivel 3
Atributos
Ao
Semestre
Mes
DIMENSIN POSTULANTE_DIM
Contiene los datos del postulante y sexo.
Nivel
Nivel 1
Nivel 2
Nivel 2
Atributos
PostulanteID
Postulante
Sexo
DIMENSIN MODALIDAD_DIM
Contiene las modalidades de ingreso en la parte de Admisin.
Nivel
Nivel 1
Nivel 2
Atributos
ModalidadID
Modalidad
-69-
A. Castaeda
DIMENSIN ZONA_DIM
Contiene las provincias y sus distritos que provienen los postulantes.
Nivel
Nivel 1
Nivel 2
Nivel 3
Atributos
ZonaID
Provincia
Distrito
DIMENSIN NIVEL_ACADEMICO_DIM
Contiene la descripcin de las Facultades y sus Escuelas de la Universidad.
Nivel
Nivel 1
Nivel 2
Nivel 3
Atributos
NivelAcademicoID
Facultad
Escuela
DIMENSIN COLEGIO_DIM
Contiene el tipo de colegio y sus colegios que provienen los postulantes.
Nivel
Nivel 1
Nivel 2
Nivel 3
Atributos
ColegioID
TipoColegio
Colegio
DIMENSIN TIEMPO_DIM
Nombre
Atributo
Contenido
Formato
Descripcin
TiempoKey
Ninguno
Fecha
Datetime
Ninguno
Ao
Contiene el ao.
Nmero entero
Ninguno
Semestre
Cadena
Caracteres
de Ninguno
Mes
Cadena
Caracteres
de Ninguno
-70-
A. Castaeda
DIMENSIN POSTULANTE_DIM
Contenido
Nombre
Atributo
PostulanteKey
Postulante
Sexo
PostulanteID
Descripcin
Formato
Numero entero
Cadena
Caracteres
Cadena
Caracteres
Cadena
Caracteres
Valor por
defecto
Ninguno
de Ninguno
de Ninguno
de Ninguno
DIMENSIN COLEGIO_DIM
Contenido
Nombre
Atributo
ColegioKey
ColegioID
Colegio
TipoColegio
Descripcin
Valor por
defecto
Formato
Numero entero
Ninguno
Numero entero
Ninguno
Cadena
de Ninguno
caracteres
Cadena
de Ninguno
caracteres
DIMENSIN NIVEL_ACADEMICO_DIM
Contenido
Nombre
Atributo
Descripcin
NivelAcademicoKey Llave
primaria
de
la
dimensin Nivel Acadmico.
NivelAcademicoID
Contiene el cdigo de la
Escuela.
Facultad
Contiene la descripcin de la
Facultad
Escuela
Contiene la descripcin de la
Escuela
-71-
Formato
Valor por
defecto
Numero entero
Ninguno
Numero entero
Ninguno
Cadena
caracteres
Cadena
caracteres
de Ninguno
de Ninguno
A. Castaeda
DIMENSIN MODALIDAD_DIM
Contenido
Nombre Atributo
Descripcin
ModalidadKey
Llave
primaria
Formato
de
la Numero entero
Valor por
defecto
Ninguno
de Numero entero
Ninguno
dimensin modalidad.
ModalidadID
Contigo
el
cdigo
modalidad.
Modalidad
de Ninguno
caracteres
DIMENSIN ZONA_DIM
Contenido
Nombre Atributo
Descripcin
ZonaKey
Llave
de
la Numero entero
Valor por
defecto
Ninguno
cdigo
de Numero entero
Ninguno
primaria
Formato
dimensin zona.
ZonaID
Contigo
el
distrito.
Distrito
que
vive
de Ninguno
el caracteres
postulante.
Provincia
de Ninguno
-72-
A. Castaeda
DIMENSIN TIEMPO_DIM
Nombre del nivel
TiempoKey
Fecha
Ao
Semestre
Mes
Descripcin
Llave Primaria
SI
NO
NO
NO
NO
DIMENSIN POSTULANTE_DIM
Nombre del nivel
PostulanteKey
Postulante
PostulanteID
Sexo
Descripcin
Llave Primaria
SI
NO
NO
NO
DIMENSIN NIVEL_ACADEMICO_DIM
Nombre del nivel
Descripcin
Llave
Primaria
NivelAcademicoKey
SI
academico.
NivelAcademicoID
NO
Facultad
NO
Escuela
NO
DIMENSIN ZONA_DIM
Nombre del nivel
Descripcin
Llave Primaria
ZonaKey
SI
ZonaID
NO
Provincia
Contiene
la
descripcin
de
la
NO
provincia.
Distrito
-73-
NO
DIMENSIN MODALIDAD_DIM
Nombre del nivel
A. Castaeda
Descripcin
de
Llave Primaria
ModalidadKey
Llave primaria
modalidad.
la
dimensin
SI
ModalidadID
NO
Modalidad
NO
DIMENSIN COLEGIO_DIM
Nombre del nivel
Descripcin
Llave Primaria
ColegioKey
SI
Colegioid
NO
Colegio
NO
TipoColegio
NO
Postulante_dim
ADMISION_FACTS
TiempoKey(FK)
NivelAcademicoKey (FK)
ModalidadKey(FK)
PostulanteKey(FK)
ZonaKey(FK)
ColegioKey(FK)
Cantidad_postulantes
Monto
Cantidad_ingresantes
Tiempo_dim
Modalidad_dim
m
A. Castaeda
Descripcin
Llave Primaria
Si
TIEMPO_DIM
Si
Si
Si
Si
Si
3.7.12 Definir las claves primarias y las relaciones entre tabla de hecho y dimensiones.
Colegio_DIM
Tiempo_DIM
ColegioKey(PK)
ModalidadKey(PK)
TiempoKey(PK)
NIVEL_ACADEMICO_DIM
NivelAcademicoKey (PK)
Modalidad_DIM
ADMISION_FACTS
TiempoKey(FK)
NivelAcademicoKey(FK)
ModalidadKey(FK)
PostulanteKey(FK)
ColegioKey(PK)
ZonaKey(FK)
Postulante_DIM
PostulanteKey(PK)
Zona_DIM
ZonaKey(PK)
-75-
-76A. Castaeda
3.8
A. Castaeda
DISEO FSICO
POSTULANTE_DIM
Columna
Tipo de dato
Permitir
Nulos
No
PK
PostulanteKey
int
Si
Postulante
Varchar(200)
No
No
PostulanteID
Char(10)
No
No
Sexo
Char(1)
No
No
Permitir
Nulos
PK
COLEGIO_DIM
Columna
Tipo de dato
ColegioKey
Int
No
Si
ColegioID
Int
No
No
Colegio
Nvarchar(150)
No
No
TipoColegio
Nvarchar(150)
No
No
NIVEL_
ACADEMICO_DIM
Columna
Tipo de dato
Permitir
Nulos
PK
NivelAcademicoKey
Int
No
Si
NivelAcademicoID
Int
No
No
Facultad
Nvarchar(150)
No
No
Escuela
Nvarchar(150)
No
No
-77-
A. Castaeda
Tabla
ZONA_DIM
Columna
Tipo de dato
Permitir Nulos
PK
ZonaKey
Int
No
Si
ZonaID
Int
No
No
Distrito
Nvarchar(150)
No
No
Provincia
Nvarchar(150)
No
No
Tipo de dato
Permitir Nulos
PK
Tabla
TIEMPO_DIM
Columna
TiempoKey
Int
No
Si
Fecha
Datetime
No
No
Semestre
Varchar(15)
No
No
Ao
Int
No
No
Mes
Nvarchar(30)
No
No
Columna
Tipo de dato
Permitir
PK
Nulos
ADMISION_FACTS
PostulanteKey
Int
No
Si
NivelAcademicoKey
Int
No
Si
ModalidadKey
Int
No
Si
ColegioKey
Int
No
Si
TiempoKey
Int
No
Si
ZonaKey
Int
No
Si
Cantidad_postulantes
Int
No
No
Monto
Float
No
No
Cantidad_ingresantes
Int
No
No
-78-
-79-
-79-
A. Castaeda
A. Castaeda
******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE TABLE [dbo].[ADMISION_FACTS](
[NivelAcademicoKey] [int] NOT NULL,
[ColegioKey] [int] NOT NULL,
[PostulanteKey] [int] NOT NULL,
[ModalidadKey] [int] NOT NULL,
[TiempoKey] [int] NOT NULL,
[ZonaKey] [int] NOT NULL,
[Cantidad_postulantes] [int] NOT NULL,
[Monto] [float] NOT NULL,
[Cantidad_ingresantes] [int] NOT NULL,
CONSTRAINT [PK_ADMISION_FACTS] PRIMARY KEY CLUSTERED
(
[NivelAcademicoKey] ASC,
[ColegioKey] ASC,
[PostulanteKey] ASC,
[ModalidadKey] ASC,
[TiempoKey] ASC,
[ZonaKey] ASC
)WITH
(PAD_INDEX
OFF,
STATISTICS_NORECOMPUTE
OFF,
-80-
/****** Object:
A. Castaeda
Table [dbo].[COLEGIO_DIM]
******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE TABLE [dbo].[COLEGIO_DIM](
[ColegioKey] [int] IDENTITY(1,1) NOT NULL,
[ColegioID] [int] NOT NULL,
[Colegio] [nvarchar](150) NOT NULL,
[TipoColegio] [nvarchar](150) NULL,
CONSTRAINT [PK_COLEGIO_DIM] PRIMARY KEY CLUSTERED
(
[ColegioKey] ASC
)WITH
(PAD_INDEX
OFF,
STATISTICS_NORECOMPUTE
OFF,
******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE TABLE [dbo].[MODALIDAD_DIM](
[ModalidadKey] [int] IDENTITY(1,1) NOT NULL,
[ModalidadID] [int] NOT NULL,
[Modalidad] [nvarchar](150) NOT NULL,
CONSTRAINT
[PK__TIEMPO_I__2E6FF8607F60ED59]
CLUSTERED
(
[ModalidadKey] ASC
-81-
PRIMARY
KEY
)WITH
(PAD_INDEX
OFF,
A. Castaeda
STATISTICS_NORECOMPUTE
OFF,
12:57:20 ******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE TABLE [dbo].[NIVEL_ACADEMICO_DIM](
[NivelAcademicoKey] [int] IDENTITY(1,1) NOT NULL,
[NivelAcademicoID] [int] NOT NULL,
[Escuela] [nvarchar](150) NOT NULL,
[Facultad] [nvarchar](150) NOT NULL,
CONSTRAINT
[PK__ESCUELA___D0D534670AD2A005]
PRIMARY
KEY
CLUSTERED
(
[NivelAcademicoKey] ASC
)WITH
(PAD_INDEX
OFF,
STATISTICS_NORECOMPUTE
OFF,
A. Castaeda
[PK__POSTULAN__55433F9407020F21]
PRIMARY
KEY
CLUSTERED
(
[PostulanteKey] ASC
)WITH
(PAD_INDEX
OFF,
STATISTICS_NORECOMPUTE
OFF,
Table [dbo].[TIEMPO_DIM]
******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
SET ANSI_PADDING ON
GO
CREATE TABLE [dbo].[TIEMPO_DIM](
[TiempoKey] [int] IDENTITY(1,1) NOT NULL,
[Semestre] [varchar](2) NOT NULL,
[Mes] [nvarchar](30) NOT NULL,
[Ao] [int] NOT NULL,
[Fecha] [datetime] NOT NULL,
CONSTRAINT [PK__TIEMPO_F__CCA2B0B703317E3D] PRIMARY KEY
CLUSTERED
(
[TiempoKey] ASC
-83-
)WITH
(PAD_INDEX
OFF,
A. Castaeda
STATISTICS_NORECOMPUTE
OFF,
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE TABLE [dbo].[ZONA_DIM](
[ZonaKey] [int] IDENTITY(1,1) NOT NULL,
[ZonaID] [int] NOT NULL,
[Distrito] [nvarchar](150) NOT NULL,
[Provincia] [nvarchar](150) NOT NULL,
CONSTRAINT [PK_ZONA_DIM] PRIMARY KEY CLUSTERED
(
[ZonaKey] ASC
)WITH
(PAD_INDEX
OFF,
STATISTICS_NORECOMPUTE
OFF,
CONSTRAINT
TABLE
[dbo].[ADMISION_FACTS]
[FK_ADMISION_FACTS_ NIVEL_ACADEMICO_DIM]
GO
-84-
CHECK
CONSTRAINT
A. Castaeda
CONSTRAINT
TABLE
[dbo].[ADMISION_FACTS]
CHECK
CONSTRAINT
[FK_ADMISION_FACTS_COLEGIO_DIM1]
GO
ALTER TABLE [dbo].[ADMISION_FACTS]
CONSTRAINT
TABLE
[dbo].[ADMISION_FACTS]
CHECK
CONSTRAINT
[FK_ADMISION_FACTS_MODALIDAD_DIM]
GO
ALTER TABLE [dbo].[ADMISION_FACTS]
CONSTRAINT
TABLE
[dbo].[ADMISION_FACTS]
CHECK
CONSTRAINT
[FK_ADMISION_FACTS_POSTULANTE_DIM]
GO
ALTER TABLE [dbo].[ADMISION_FACTS]
CONSTRAINT
TABLE
[dbo].[ADMISION_FACTS]
CHECK
CONSTRAINT
[FK_ADMISION_FACTS_TIEMPO_DIM]
GO
ALTER TABLE [dbo].[ADMISION_FACTS]
-85-
CONSTRAINT
ALTER
TABLE
A. Castaeda
[dbo].[ADMISION_FACTS]
CHECK
CONSTRAINT
[FK_ADMISION_FACTS_ZONA_DIM]
GO
/* Creacion de Indices */
CREATE INDEX IDX_PostulanteID
on Postulante_Dim(PostulanteID)
CREATE INDEX IDX_Nivel_Academico
on NIVEL_ACADEMICO_DIM (Facultad, Escuela)
CREATE INDEX IDX_Colegio
on Colegio_Dim(TipoColegio, Colegio)
CREATE INDEX IDX_Modalidad
on Modalidad_Dim(Modalidad)
CREATE INDEX IDX_Tiempo
on Tiempo_Dim(Semestre,Ao,Mes,Dia)
CREATE INDEX IDX_Zona
on Zona_Dim(Provincia, Distrito)
3.9
La herramienta ETL que se us es Integration Services del entorno de SQL Server Data
Tools para lo cual se desarrolla los paquetes para la extraccin, transformacin y carga de
los datos con origen en el OLTP y con destino en el OLAP.
Ingreso al Entorno del SQL Server Integration Services:
Para comenzar nuestro trabajo en la creacin de paquetes ETL, hacer clic en SQL Server
Data Tools y crear un nuevo proyecto.
-86-
A. Castaeda
Luego aparece el entorno de desarrollo de Microsoft Visual Studio para generar un nuevo
proyecto, seleccionar la opcin Archivo/Nuevo/Proyecto.
-87-
A. Castaeda
Administracin de Conexiones:
Lo primero es realizar la conexin de la base de datos de origen PROYECTOBI de la cual
se va extraer la data y crear la conexin de la base de datos de destino PROYECTO_UA.
Verificar en el explorador de soluciones que se haya creado la conexin correcta.
-88-
A. Castaeda
A. Castaeda
-90-
A. Castaeda
-92-
/* Comando SQL */
TRUNCATETABLE ADMISION_FACTS
DELETE ADMISION_FACTS
DELETEFROM MODALIDAD_DIM
DBCC CHECKIDENT('MODALIDAD_DIM', reseed, 0)
DELETEFROM NIVEL_ACADEMICO_DIM
DBCC CHECKIDENT('NIVEL_ACADEMICO_DIM', reseed, 0)
DELETEFROM POSTULANTE_DIM
DBCC CHECKIDENT('POSTULANTE_DIM', reseed, 0)
DELETEFROM TIEMPO_DIM
DBCC CHECKIDENT('TIEMPO_DIM', reseed, 0)
DELETEFROM ZONA_DIM
DBCC CHECKIDENT('ZONA_DIM', reseed, 0)
DELETEFROM COLEGIO_DIM
DBCC CHECKIDENT('COLEGIO_DIM', reseed, 0)
A. Castaeda
-90-
A. Castaeda
' +
NIVEL_ACADEMICO_DIM
Comando SQL:
select a.nUniOrgCodigo, a.cUniOrgNombre, b.nUniFacudescrip from PerCarrera a
inner join PerFacultad b on a.nUniFacultad=b.nUnifacultad
where nIntTipo='1026'
and nUniOrgCodigo in (91015,91016,91017,91018,91019)
ZONA_DIM
Comando SQL:
SELECT a.idDistrito,a.cdistrito ,b.cprovincia FROM DISTRITO a inner join provincia b
on a.idprovincia=b.idprovincia
A. Castaeda
TIEMPO_DIM
Comando SQL:
select distinct pa.dperadmfecha as FECHA,
Datename(month, pa.dPerAdmFecha) AS MES,DatePart(yy, pa.dPerAdmFecha) AS AO,
CASE WHEN datepart(month,pa.dPerAdmFecha) between 1 and 6 THEN 'semestre '+'I'
WHEN datepart(month,pa.dPerAdmFecha) between 7 and 12 THEN 'semestre '+'II'
END AS SEMESTRE from PerAdmision pa WHERE pa.dPerAdmFecha IS NOT NULL
MODALIDAD_DIM
Comando SQL:
SELECT DISTINCT modalidad, intDescrip
FROM PerModalidad
where modalidad in (40,89,10,20)
COLEGIO_DIM
Comando SQL:
select a.cColegioCodigo,a.descripcion,b.pertiponomre from PerColegio a
inner join pertipocolegio b on a.pertipocolegio=b.pertipocolegio
-94-
A. Castaeda
A. Castaeda
GROUP BY
PROYECTO_UA.dbo.POSTULANTE_DIM.postulanteKey,
PROYECTO_UA.dbo.ZONA_DIM.ZonaKey,
PROYECTO_UA.dbo.MODALIDAD_DIM.ModalidadKey,
PROYECTO_UA.dbo.NIVEL_ACADEMICO_dim.NivelAcademicoKey,
PROYECTO_UA.dbo.TIEMPO_DIM.TiempoKey,
PROYECTO_UA.DBO.COLEGIO_DIM.ColegioKey,
PROYECTO_UA.dbo.POSTULANTE_DIM.PostulanteID
-96-
-97-
A. Castaeda
A. Castaeda
A. Castaeda
A. Castaeda
A. Castaeda
B) Crear el Cubo
En el explorador de soluciones, clic derecho sobre Cubos, y clic en Nuevo Cubo.
En la pgina de bienvenida Clic Siguiente y usar tablas existentes.
Seleccionar tabla de grupo de medida.
A. Castaeda
A. Castaeda
-103-
A. Castaeda
-104-
A. Castaeda
-105-
A. Castaeda
Crear KPI:
Los KPI constituyen un conjunto de mtricas enfocadas en medir aquellos aspectos de
performance organizacional que impactan en mayor forma en el xito actual y futuro de la
empresa.
-106-
A. Castaeda
A. Castaeda
Figura 71. Herramienta de Aplicacin para el Usuario: Microsoft Office Excel 2010.
Tabla 18. Cantidad de postulantes e ingresantes por facultad y escuela.
Facultad
Facultad de Humanidades
DERECHO
PSICOLOGIA
Facultad de Ciencias De Gestin
ADMINISTRACION
CONTABILIDAD
INGENIERIA DE SISTEMAS
Total general
Cantidad ingresantes
2121
1235
886
3647
1360
797
1490
5768
Cantidad postulantes
3295
1895
1400
5892
2153
1267
2472
9187
Cantidad postulantes
3365
534
4793
495
9187
-108-
Cantidad ingresantes
2166
335
3002
265
5768
Monto
504750
80100
718950
74250
1378050
A. Castaeda
Cantidad
ingresantes
F
M
19
24
16
22
9
7
226
241
8
5
15
36
14
12
31
25
12
19
20
21
151
259
24
63
75
192
39
27
10
8
22
25
31
20
11
3
22
71
23
47
17
37
Cantidad
postulantes
F
M
34
40
28
28
13
14
348
391
8
10
29
62
27
26
51
36
24
29
30
30
242
388
52
97
127
272
68
43
13
10
36
36
41
34
12
5
32
111
53
62
38
60
Total cantidad
ingresantes
Total cantidad
postulantes
43
38
16
467
13
51
26
56
31
41
410
87
267
66
18
47
51
14
93
70
54
74
56
27
739
18
91
53
87
53
60
630
149
399
111
23
72
75
17
143
115
98
22
22
34
33
44
67
460
23
744
58
748
33
1109
75
1204
81
1857
108
6
5
33
9
5
49
11
8
45
13
9
58
15
10
82
24
17
103
213
139
402
356
125
368
325
210
741
530
183
613
569
264
770
855
393
1354
280
2378
490
3390
528
3989
791
5198
770
5768
1319
9187
-109-
A. Castaeda
Cantidad Ingresantes
704
462
219
243
242
126
116
875
536
241
295
339
142
197
1189
729
334
395
460
214
246
1312
802
358
444
510
231
279
1688
1012
475
537
676
317
359
5768
Cantidad Postulantes
1225
814
383
431
411
209
202
1501
940
419
521
561
242
319
1796
1116
506
610
680
306
374
2009
1212
553
659
797
369
428
2656
1536
704
832
1120
518
602
9187
-110-
Monto
183750
122100
57450
64650
61650
31350
30300
225150
141000
62850
78150
84150
36300
47850
269400
167400
75900
91500
102000
45900
56100
301350
181800
82950
98850
119550
55350
64200
398400
230400
105600
124800
168000
77700
90300
1378050
A. Castaeda
43%
57%
FACULDAD DE
HUMANIDADES
INGENIERIA DE
SISTEMAS
CONTABILIDAD
ADMINISTRACION
PSICOLOGIA
DERECHO
3000
2500
2000
1500
1000
500
0
Cantidad Ingresantes
Cantidad Postulantes
FACULTAD DE CIENCIAS
DE GESTIN
A. Castaeda
-112-
A. Castaeda
-113-
A. Castaeda
3.12 IMPLEMENTACIN
La implementacin representa la convergencia de la tecnologa, los datos y las
aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio.
Hay varios factores extras que aseguran el correcto funcionamiento de todas estas
piezas, entre ellos se encuentran la capacitacin, el soporte tcnico, la comunicacin.
Todas estas tareas deben ser tenidas en cuenta antes de que cualquier usuario pueda
tener acceso al Business Intelligence.
Plan de Implementacin.- El plan de implementacin considera las siguientes
actividades:
1. Capacitacin del sistema a los usuarios que disponga la UAP, los mismos que
luego podrn capacitar a los usuarios de las diferentes oficinas involucradas.
2. Capacitacin tcnica de la herramienta al personal de Sistemas, con el propsito
que puedan dar el soporte informtico a los usuarios y el mantenimiento posterior del
mismo.
3. Verificacin Final de los datos antes de inicio de la operacin.
Reportes Generados desde Aplicativo Web
Para que el Jefe de Admisin pueda tomar decisiones se ha creado un Aplicativo
Web en el cual podr generar reportes analticos.
-114-
A. Castaeda
A. Castaeda
-116-
A. Castaeda
CAPTULO IV
ANLISIS DE RESULTADOS
Y CONTRASTACIN
DE LA HIPTESIS
-117-
4.1
A. Castaeda
POBLACIN Y MUESTRA
4.1.1 Poblacin
Se identifica como unidad de anlisis a las personas que toman decisiones sobre el
rea de Admisin en la Universidad Autnoma del Per.
N=indeterminado
4.1.2 Muestra
Para muestra de investigacin se tomar una muestra con un valor de 30, ya que es
un valor adecuado, estndar y se utilizan en varios procesos de investigacin.26
n=30 Tomas de Decisiones.
4.2
NIVEL DE CONFIANZA
El nivel de confianza ser de 95%, es decir, se tiene un margen de error de 5%.
4.3
-118-
E) Modelo Dimensional
Antigedad de la Data.
Calidad de la Data.
Definicin de dimensiones.
Determinar la granularidad.
Definicin de medidas.
F) Diseo Fsico
Gestionar cubos.
Crear y cargar cubos.
Personalizar cubos: crear jerarquas, KPI, etc.
A. Castaeda
A. Castaeda
J) Implementacin
K) Mantenimiento y Crecimiento
-120-
-121-
-117-
KP5:Comprensin de
los reportes
Post-Prueba Post-Prueba
(Gc)
(Ge)
Difcil
Normal
Normal
Normal
Difcil
Fcil
Normal
Fcil
Fcil
Fcil
Normal
Fcil
Difcil
Normal
Difcil
Normal
Normal
Fcil
Normal
Fcil
Fcil
Normal
Difcil
Fcil
Difcil
Fcil
Normal
Normal
Fcil
Normal
Normal
Fcil
Normal
Normal
Difcil
Fcil
Fcil
Normal
Fcil
Normal
Normal
Normal
Difcil
Fcil
Difcil
Normal
Difcil
Normal
Normal
Fcil
Normal
Normal
Normal
Fcil
Normal
Fcil
Difcil
Normal
Fcil
Fcil
A. Castaeda
Nmero
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Tabla 22. Resultados de Post-Prueba (Gc) y Post-Prueba (Ge) para los KPI1, KPI2, KPI3, KPI4, KPI5.
A. Castaeda
Post-Prueba (Ge)
Indicador
Porcentaje de exactitud de
Comentario
(Media: X 1)
(Media: X 2)
46,68%
85,06%
25,63 min.
4,47 min.
20,337%
2,86%
4 reportes/ciclo
14 reportes/ciclo
la informacin
Porcentaje
de
malas
decisiones tomadas
Nmero
de
reportes
de
los
-------
reportes
--------
contrastado.
Indicado
Cualitativo
En las siguientes tablas se muestra los resultados de la Post-Prueba (Gc) y PostPrueba (Ge). Adems se resalta los valores de los KPIs medidos, en la Post-Prueba
(Ge), que son mejores (menores o mayores) que los KPIs promedio en la Post-Prueba
(Ge) (fondo verde), los que son menores que la meta planteada (fondo azul), y los
que son menores que los KPIs promedio en la Post-Prueba (Gc) (fondo rojo).
Se realiza, a continuacin, un anlisis detallado de los datos de cada de una de las
tablas.
-122-
A. Castaeda
Promedio
Meta Planteada
N mayor a Promedio
% mayor a Promedio
Post-Prueba (Gc)
42,6
50,45
46,99
51,58
47,55
41,39
48,31
44,67
54,63
48,13
53,45
52,14
45,70
49,32
51,55
43,56
42,76
41,34
48,31
46,11
50,15
51,24
52,89
46,34
46,89
51,45
53,36
54,52
42,37
47,53
46,68
Post-Prueba (Ge)
82,46
82,46
82,46
89,90
89,90
89,90
88,12
88,12
88,12
84,90
84,90
84,90
87,60
87,60
87,60
80,80
80,80
80,80
84,70
84,70
84,70
88,50
88,50
88,50
89,10
89,10
89,10
81,40
81,40
81,40
80,40
80,40
80,40
81,60
81,60
81,60
86,60
86,60
86,60
88,60
88,60
88,60
81,50
81,50
81,50
87,40
87,40
87,40
83,70
83,70
83,70
89,00
89,00
89,00
87,13
87,13
87,13
80,30
80,30
80,30
86,90
86,90
86,90
82,50
82,50
82,50
86,00
86,00
86,00
81,00
81,00
81,00
82,12
82,12
82,12
84,40
84,40
84,40
83,20
83,20
83,20
88,90
88,90
88,90
89,20
89,20
89,20
84,00
84,00
84,00
85,06
87
15
11
30
50,00
36,67
100,00
-123-
A. Castaeda
80
82
84
86
88
90
0,80
0,034
M edia
Desv .E st.
V arianza
A simetra
Kurtosis
N
85,064
3,161
9,992
-0,03777
-1,50603
30
M nimo
1er cuartil
M ediana
3er cuartil
M ximo
80,300
81,990
84,800
88,215
89,900
86,245
87,338
2,517
4,249
Mediana
83
84
85
86
87
-124-
A. Castaeda
Promedio
Meta Planteada
N menor a Promedio
% menor a Promedio
Post-Prueba
(Gc)
23
24
24
28
24
25
24
25
23
24
25
22
24
26
27
22
23
28
29
29
28
30
27
28
24
27
23
26
28
29
25,63
4
3
5
3
5
4
3
5
4
5
5
3
6
5
4
3
6
5
5
4
5
4
6
5
5
3
5
4
5
5
13
43,33
Post-Prueba (Ge)
4
3
5
3
5
4
3
5
4
5
5
3
6
5
4
3
6
5
5
4
5
4
6
5
5
3
5
4
5
5
4,47
5,00
13
43,33
4
3
5
3
5
4
3
5
4
5
5
3
6
5
4
3
6
5
5
4
5
4
6
5
5
3
5
4
5
5
30
100
El 43,33% de los tiempos en realizar los reportes en la Post-Prueba (Ge) fueron menores
que su tiempo promedio.
El 43,33% de los tiempos en realizar los reportes en la Post-Prueba (Ge) fueron menores
que la meta planteada.
El 100% de los tiempos en realizar los reportes en la Post-Prueba (Ge) fueron menores
que el tiempo promedio en la Post-Prueba (Gc).
-125-
A. Castaeda
1,97
0,005
M edia
Desv .E st.
V arianza
A simetra
Kurtosis
N
4,4667
0,9371
0,8782
-0,300900
-0,817363
30
M nimo
1er cuartil
M ediana
3er cuartil
M ximo
3,0000
4,0000
5,0000
5,0000
6,0000
4,8166
5,0000
0,7463
1,2598
Media
Mediana
4,00
4,25
4,50
4,75
5,00
-126-
A. Castaeda
Promedio
Meta Planteada
N menor a Promedio
% menor a Promedio
Post-Prueba (Gc)
29,71
10,41
13,24
15,93
26,23
22,3
18,59
12,02
19,26
20,2
21,82
19,74
21,2
11,52
12,69
15,94
25,99
26,62
16,71
29,83
15,35
20,02
21,01
23,66
10,04
24,62
27,1
24,97
29,48
23,91
20,337
Post-Prueba (Ge)
4,7
2,2
2,4
4,7
3,6
2,5
4,1
1,6
2,7
4,31
3,7
1,7
2,2
2,5
4,8
3,7
1,4
0,8
1,6
3,1
1,9
3,6
1,8
3,5
1,6
2,3
2,8
4,6
4,5
0,98
2,86
4
17
23
56,67
76,67
4,7
2,2
2,4
4,7
3,6
2,5
4,1
1,6
2,7
4,31
3,7
1,7
2,2
2,5
4,8
3,7
1,4
0,8
1,6
3,1
1,9
3,6
1,8
3,5
1,6
2,3
2,8
4,6
4,5
0,98
4,7
2,2
2,4
4,7
3,6
2,5
4,1
1,6
2,7
4,31
3,7
1,7
2,2
2,5
4,8
3,7
1,4
0,8
1,6
3,1
1,9
3,6
1,8
3,5
1,6
2,3
2,8
4,6
4,5
0,98
30
100
-127-
A. Castaeda
0,56
0,138
M edia
Desv .E st.
V arianza
A simetra
Kurtosis
N
2,8630
1,2122
1,4694
0,14936
-1,19521
30
M nimo
1er cuartil
M ediana
3er cuartil
M ximo
0,8000
1,7750
2,6000
3,8000
4,8000
3,3156
3,6000
0,9654
1,6296
Media
Mediana
2,0
2,4
2,8
3,2
3,6
-128-
A. Castaeda
Promedio
Meta Planteada
N mayor a Promedio
% mayor a Promedio
Post-Prueba (Gc)
4
5
4
3
3
3
4
3
3
4
4
3
5
5
4
4
5
3
5
5
4
4
5
3
3
3
4
4
3
3
4
Post-Prueba (Ge)
15
15
12
12
15
15
15
15
13
13
15
15
16
16
16
16
12
12
14
14
12
12
15
15
12
12
13
13
15
15
15
15
13
13
12
12
15
15
13
13
15
15
12
12
15
15
12
12
14
14
15
15
15
15
13
13
15
15
14
14
14
14
15
16
30
50,00
53,33
100,0
15
12
15
15
13
15
16
16
12
14
12
15
12
13
15
15
13
12
15
13
15
12
15
12
14
15
15
13
15
14
A. Castaeda
12
13
14
15
16
2,16
0,005
M edia
Desv .E st.
V arianza
A simetra
Kurtosis
N
13,933
1,363
1,857
-0,30966
-1,43279
30
M nimo
1er cuartil
M ediana
3er cuartil
M ximo
12,000
12,750
14,500
15,000
16,000
14,442
15,000
1,085
1,832
Media
Mediana
13,0
13,5
14,0
14,5
15,0
-130-
A. Castaeda
1
Dif
Valor
Estado
Fcil
Normal
Difcil
10
Dif
Nor Nor
11 12
Fac Dif
13 14 15 16 17
Dif Nor Fac Nor Nor
18
Dif
19
Fac
20
Fac
21
Nor
23
Dif
28
Nor
29
Dif
30
Fac
22
Dif
24 25 26 27
Dif Nor Nor Nor
Frecuencia
7
9
14
Estado
Comprensible
No comprensible
Frecuencia
7
23
El 47% de las veces de comprensin de los reportes fue catalogada como difcil por el
Jefe de Admisin.
Slo el 23% de las veces de comprensin de los reportes fue catalogada como fcil por
el Jefe de Admisin.
Se determina que slo el 23% de las veces de comprensin de los reportes es
comprensible.
Se determina que slo el 77% de las veces de comprensin de los reportes es no
comprensible.
-131-
A. Castaeda
Valor
Estado
Fcil
Normal
Difcil
10
Nor
Nor Fac
11
12
13
14
15
16
17
18
19
Fac Fac
Fac
Fac
Fac
Fac Nor
21
22
23
24
26
27
28
29
30
Dif
Nor Fac
Fac
Fac
Dif
Nor
25
20
Frecuencia
16
12
2
Estado
Comprensible
No comprensible
Frecuencia
18
12
Slo el 7% de las veces de comprensin de los reportes fue catalogada como difcil por
el Jefe de Admisin.
Ahora el 53% de las veces de comprensin de los reportes fue catalogada como fcil por
el Jefe de Admisin.
Se determina que slo el 60% de las veces de comprensin de los reportes es
comprensible.
Se determina que slo el 40% de las veces de comprensin de los reportes es no
comprensible.
4.4
CONTRASTACIN DE LA HIPTESIS
-132-
A. Castaeda
Post-Prueba (Gc)
(%)
42,6
50,45 46,99
53,45 52,14 45,70 49,32 51,55 43,56 42,76 41,34 48,31 46,11
50,15 51,24 52,89 46,34 46,89 51,45 53,36 54,52 42,37 47,53
Post-Prueba (Ge)
(%)
82,46
87,60
81,40
80,40
81,50
80,30
86,90
82,12
84,00
Solucin:
a) Planteamiento de la hiptesis:
1 = Media del porcentaje de exactitud de la informacin en la Post-Prueba (Gc).
2 = Media del porcentaje de exactitud de la informacin en la Post-Prueba (Ge).
Ho: 1 2
Ha: 1< 2
-133-
A. Castaeda
b) Criterios de Decisin:
Grfica de distribucin
T; df=58
0,4
Densidad
0,3
0,2
0,1
0,05
0,0
-1,672
0
X
Figura 84. Ingreso de datos para realizar la prueba t a dos muestras del KPI1.
-134-
A. Castaeda
Post-Prueba (Ge)
48,24
85,06
4,01
3,16
30
30
Media( X )
Desviacin Estndar(S)
Observaciones(n)
Diferencia hipottica de las medias
-36,821
t calculado: tc
-39,51
p-valor(dos colas)
0,000
-1,672
d) Decisin estadstica:
Puesto que el valor-p =0,000 < =0,05, los resultados proporcionan suficiente
evidencia para rechazar la hiptesis nula (Ho), y la hiptesis alterna (Ha) es cierta.
La prueba result ser significativa.
Post-Prueba (Gc)
(min)
Post-Prueba (Ge)
(min)
23
24
24
28
24
25
24
25
23
24
25
22
24
26
27
22
23
28
29
29
28
30
27
28
24
27
23
26
28
29
-135-
A. Castaeda
Solucin:
a) Planteamiento de la hiptesis:
1 = Media del tiempo en realizar los reportes en la Post-Prueba (Gc).
2 = Media del tiempo en realizar los reportes en la Post-Prueba (Ge).
Ho: 1 2
Ha: 1> 2
b) Criterios de Decisin:
Grfica de distribucin
T; df=58
0,4
Densidad
0,3
0,2
0,1
0,05
0,0
0
X
1,672
A. Castaeda
Post-Prueba (Gc)
Post-Prueba (Ge)
25,63
4,467
2,36
0,937
30
30
Media( X )
Desviacin Estndar(S)
Observaciones(n)
Diferencia hipottica de las medias
21,167
t calculado: tc
45,72
p-valor(dos colas)
0,000
-1,672
d) Decisin estadstica:
Puesto que el valor-p =0,000 < =0,05, los resultados proporcionan suficiente
evidencia para rechazar la hiptesis nula (Ho), y la hiptesis alterna (Ha) es cierta.
La prueba result ser significativa.
Post-Prueba (Gc)
(%)
29,71
21,82 19,74
Post-Prueba (Ge)
(%)
21,2
22,3
20,2
27,1
4,70
2,20
2,40
4,70
3,60
2,50
4,10
1,60
2,70
4,31
3,70
1,70
2,20
2,50
4,80
3,70
1,40
0,80
1,60
3,10
1,90
3,60
1,80
3,50
1,60
2,30
2,80
4,60
4,50
0,98
-137-
A. Castaeda
Solucin:
a) Planteamiento de la hiptesis:
1 = Media del porcentaje de malas decisiones tomadas en la Post-Prueba (Gc).
2 = Media del porcentaje de malas decisiones tomadas en la Post-Prueba (Ge).
Ho: 1 2
Ha: 1> 2
b) Criterios de Decisin
Grfica de distribucin
T; df=58
0,4
Densidad
0,3
0,2
0,1
0,05
0,0
0
X
1,672
-138-
A. Castaeda
Post-Prueba (Gc)
Post-Prueba (Ge)
20,34
2,36
5,95
1,21
30
30
Media( X )
Desviacin Estndar(S)
Observaciones(n)
Diferencia hipottica de las medias
17,47
t calculado: tc
15,77
p-valor(dos colas)
0,000
1,672
d) Decisin estadstica:
Puesto que el valor-p =0,000 < =0,05, los resultados proporcionan suficiente
evidencia para rechazar la hiptesis nula (Ho), y la hiptesis alterna (Ha) es cierta.
La prueba result ser significativa.
Post-Prueba (Gc)
(Reporte/ciclo)
Post-Prueba (Ge)
(Reporte/ciclo)
15
12
15
15
13
15
16
16
12
14
12
15
12
13
15
15
13
12
15
13
15
12
15
12
14
15
15
13
15
14
-139-
A. Castaeda
Solucin:
a) Planteamiento de la hiptesis:
1 = Media del nmero de reportes solicitados por ciclo en la Post-Prueba (Gc).
2 = Media del nmero de reportes solicitados por ciclo en la Post-Prueba (Ge).
Ho: 1 2
Ha: 1 < 2
b) Criterios de Decisin
Grfica de distribucin
T; df=58
0,4
Densidad
0,3
0,2
0,1
0,05
0,0
-1,672
0
X
-140-
A. Castaeda
Post-Prueba (Gc)
Post-Prueba (Ge)
3,833
13,93
0,791
1,36
30
30
Media( X )
Desviacin Estndar(S)
Observaciones(n)
Diferencia hipottica de las medias
-10,100
t calculado: tc
-35,10
p-valor(una cola)
0,000
1,672
d) Decisin estadstica:
Puesto que el valor-p =0,000 < =0,05, los resultados proporcionan suficiente
evidencia para rechazar la hiptesis nula (Ho), y la hiptesis alterna (Ha) es cierta.
La prueba result ser significativa.
-141-
CAPTULO V
CONCLUSIONES Y
RECOMENDACIONES
5.1
A. Castaeda
CONCLUSIONES
-143-
5.2
A. Castaeda
RECOMENDACIONES
-144-
REFERENCIAS BIBLIOGRFICAS
Tesis:
1.
2.
Libros:
1.
2.
Artculos Cientficos:
1.
2.
Internet:
1.
Disponible
en:
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Cutro_trabajo_adsc
_DAD_2010.pdf
-145-
2.
en:
http://www.usmp.edu.pe/publicaciones/boletin/fia/info46/sistemas/articulo6.htm
3.
SQL Server Integration Services. [en lnea]. [Consultado 12 mayo 2013]. Disponible
en: http://msdn.microsoft.com/es-es/library/ms141026.aspx
-146-
APNDICES
APNDICE I: MATRIZ DE CONSISTENCIA
TTULO: Desarrollo de Business Intelligence, basado en la Metodologa de Ralph Kimball, para mejorar el Proceso de Toma de
Decisiones en el rea de Admisin de la Universidad Autnoma del Per.
PROBLEMA
-147-
De
qu
manera
el
desarrollo de
Business
Intelligence,
basado en la
Metodologa
de
Ralph
Kimball,
influir
el
Proceso
de
Toma
de
Decisiones en
el rea de
Admisin de
la Universidad
Autnoma del
Per?.
OBJETIVO
GENERAL
Desarrollar
un Business
Intelligence,
basado en la
Metodologa
de
Ralph
Kimball, para
mejorar
el
Proceso de
Toma
de
Decisiones
en el rea de
Admisin de
la
Universidad
Autnoma
del Per.
HIPTESIS
Si se desarrolla
Business
Intelligence,
utilizando
la
Metodologa de
Ralph Kimball,
entonces
mejorar
el
Proceso
de
Tomas
de
Decisiones en
el rea de
Admisin de la
Universidad
Autnoma del
Per.
VARIABLES
INDICADOR(ES)
NDICES
UNIDADES DE
OBSERVACIN
TIPO DE
Variable
INVESTIGACIN
Independiente
Presencia -
Business
Ausencia
No, Si
---------------------
Intelligence
Aplicada
NIVEL DE
INVESTIGACIN
Variable
Dependiente
Proceso de
Toma de
Decisiones del
rea de
Admisin en la
Universidad
Autnoma del
Per.
Porcentaje de
exactitud de
la
informacin.
Descriptiva
[65 - 85]
Reportes
Correlacional
MTODOS DE
INVESTIGACIN
Campo
Tiempo
realizar
reportes.
-149-
en
los
[1 - 3]
Reloj
Experimental
Documental
..CONTINUACIN
UNIVERSO
Porcentaje de
malas
decisiones
tomadas.
Jefe de Admisin
[30 - 50]
-148-
n=30 Tomas de
Nmero
de
reportes
solicitados
por ciclo.
Jefe de Admisin
Decisiones
[3 - 7]
TIPO DE
MUESTREO
Intencional
(No Aleatorio)
Comprensin
de
los
reportes.
-150-
Fcil,
Normal,
Difcil
Jefe de Admisin
Cargo: .
Objetivos:
Determinar los factores que inciden en el correcto uso de la informacin y la Toma de
Decisiones.
1.
2.
C) No sabe
3.
B) No
B) Oracle
C) Sql 2008 R2
D) Access
E) Excel
B) De 5 a 7 aos
C) Ms de 7 aos
B) Open Source
A) Si
B) No
C) No sabe
6. Cuentan con herramientas para generar reportes de manera que la informacin pueda ser
procesada de diferentes maneras?
A) Si
B) No
C) No sabe
7.
Cree usted que la Universidad cuenta con herramientas especializadas para la mejor
B) No
C) No sabe
B) Web
C) Intranet
D) Otras
B) No
B) No
C) No sabe
-150-
GLOSARIO DE TRMINOS
A
Analysis Services: permite disear, crear y visualizar modelos de minera de datos que se
construyen a partir de otros orgenes de datos mediante el uso de una gran variedad de
algoritmos de minera de datos estndar del sector.
B
Base de Datos: Conjunto de datos almacenados de forma tal que su acceso sea rpido y
sencillo. En trminos informticos, se refiere a un programa que maneja una serie de datos
relacionados entre s.
Base de Datos Multidimensional: Base de Datos diseada para procesamiento analtico
on-line (OLAP). Estructurada como un hipercubo con un eje por dimensin.
Business Intelligence: Conjunto de estrategias y herramientas enfocadas a la administracin
y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o
empresa.
C
Campo: Unidad bsica de introduccin de datos de un registro.
Consulta: Consulta a una Base de Datos para obtener cierta informacin requerida.
Requerimiento de la informacin almacenada en un Data Warehouse. En una Base de Datos
Relacional, el query o consulta es una sentencia SELECT de SQL, pasada desde la
aplicacin de acceso a los datos (tpicamente en la mquina cliente del usuario final).
Cubo: Almacenamiento lgico para una Base de Datos OLAP, combinan todas las
dimensiones y todas las mtricas dentro de un modelo conceptual, son manipulados por los
usuarios para tener acceso a sus datos.
D
Data Mart: Conjunto de hechos y datos organizados para soporte decisional basados en la
necesidad de un rea o departamento especfico. Los datos son orientados a satisfacer las
necesidades particulares de un departamento dado, teniendo sentido solo para el personal de
ese departamento y sus datos no tienen por qu tener las mismas fuentes que los de otro
Data Mart.
-160-
E
ETL: Extraccin, transformacin y carga de datos de una Base de Datos fuente al Data
Warehouse.
-161-
G
Granularidad: Es la definicin de lo que esta tabla representa
Granularidad de la Tabla de Hechos: La granularidad es definida tpicamente, como el
mnimo nivel de detalle almacenado en las dimensiones asociadas con la tabla de hechos.
M
Metadato: Consiste en informacin sobre los datos del DW. Que incluye Semntica de los
datos y su ubicacin en el DW, informacin sobre frecuencias de carga, reglas de
transformacin, etc.
Mtrica: son columnas numricas y cuantificables de la tabla de hechos. Las mtricas
tpicamente representan los valores que son analizados.
Modelo Dimensional: Contiene la misma informacin que un Modelo E/R, sin embargo,
los datos son empaquetados en un formato simtrico, en el cual las metas principales son
entendimiento por parte de los usuarios y rendimiento de consultas.
N
Normalizar: es realizar un tratamiento sobre su estructura de manera que sta se ajuste de
forma idnea al esquema de bases de datos relacionales.
O
OLAP Multidimensional: Base de Datos que almacena y manipula los datos en
estructuras especiales llamadas matrices multidimensionales.
OLAP Relacional: Un conjunto de interfaces de usuarios y aplicaciones que dan a una
Base de Datos relacional un sabor dimensional.
-162-
P
Procesamiento Analtico en Lnea (OLAP): Es la actividad general de consultar y
presentar datos textuales y numricos desde los Data Warehouse.
Proceso de Negocio: Un grupo coherente de actividades del negocio.
Programa de Carga y Transformacin de Datos: Proceso mediante el cual se extraen
los datos de diferentes fuentes, que luego de una estandarizacin y revisin de la calidad
de los mismos son llevados al Data Warehouse.
R
Registro: Una fila en una tabla relacional.
Reporte: Informe que se emite o presenta con base en la realizacin de una actividad
o tarea.
Reporte Estadstico/Analtico: Reporte que permite realizar anlisis a partir de las
estadsticas presentadas en l.
ROLAP: OLAP Relacional. Base de Datos Relacional que, almacena los datos en
un Sistema de Gestin de Bases de Datos relacional extendido, y transforma operaciones
sobre datos multidimensionales en operaciones relacionales en SQL.
S
Servidor: Ordenador que suministra servicios a otros ordenadores.
Servidor Analtico: Servidor en la cual los datos del Data Warehouse son organizados
y almacenados para: optimizacin de consultas, generacin de reportes y anlisis OLAP.
Sistema Administrador de Bases de Datos (DBMS): Una aplicacin cuyo
nico propsito es almacenar, recuperar y modificar datos de una manera altamente
estructurada. Los datos en un DBMS usualmente son compartidos por una variedad de
aplicaciones.
Sistema Administrador de Bases de Datos Relacionales (RDBMS): Sistema
Administrador de Bases de Datos basado en el modelo relacional que soporta la gama
completa del estndar SQL. Utiliza una serie de tablas relacionadas con filas y
columnas para organizar y almacenar datos.
-163-
T
Tabla: Coleccin de filas (registros) que tienen asociadas columnas (campos).
Tabla de Dimensin: Una tabla en un modelo dimensional con una sola llave primaria
y columnas de atributos descriptivos.
Tabla de Hechos: En un diagrama estrella (modelo dimensional), es la tabla central
con mtricas de rendimiento numricas que son caracterizadas por una llave compuesta,
cuyos elementos son cada uno, una llave fornea sacada de una tabla de dimensin.
Tabla Origen: Tabla de la cual provienen datos que utiliza un Data Warehouse.
Tiempo
de
Vida
til:
Duracin
estimada
que
un
objeto
puede
tener
-164-
U
Usuario de Negocio: Usuarios de un sistema, cuya funcin es la creacin de consultas
e informes as como el anlisis de la informacin de su Empresa u Organizacin.
Usuario Final: Persona que manipular de manera directa un sistema o aplicacin.
-165-