Tesis Bach Sosa Jáuregui Víctor Darío

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 64

INSTITUTO CIENTÍFICO Y TECNOLÓGICO DEL EJÉRCITO

ESCUELA DE POSTGRADO

MAESTRÍA EN GESTIÓN E INNOVACIÓN TECNOLÓGICA

TESIS

Modelo de Data Mart para Empresas Inmobiliarias.

CASO: Inmobiliaria Alegría S.R.L.

Autor:

Víctor Darío Sosa Jáuregui

LIMA-PERÚ

2017
DEDICATORIA

Para mi Arya Sofía,

la inspiración y razón

de mis esfuerzos académicos

y de muchos más…

2
AGRADECIMIENTO

A mi esposa Vanessa,

fuente de inagotable de motivación y paciencia

de cada uno de mis proyectos de vida.

A mi madre, familia y amigos,

que se enorgullecen de mi trabajo.

A mis docentes,

que inspiraron este trabajo.

3
CONTENIDO

DEDICATORIA ........................................................................................................................ 2

AGRADECIMIENTO ............................................................................................................... 3

CONTENIDO ............................................................................................................................ 4

RESUMEN ................................................................................................................................ 8

ABSTRACT............................................................................................................................... 9

LISTA DE TABLAS ............................................................................................................... 10

LISTA DE FIGURAS.............................................................................................................. 11

INTRODUCCIÓN ................................................................................................................... 14

CAPÍTULO I: PLANTEAMIENTO DEL ESTUDIO............................................................. 15

1.1. Descripción de la realidad problemática. .............................................................. 15

1.1. Formulación del problema..................................................................................... 15

1.1.1. Problema principal .............................................................................................15

1.1.2. Problemas específicos........................................................................................16

1.2. Objetivos................................................................................................................ 16

1.2.1. Objetivo principal ..............................................................................................16

1.2.2. Objetivos específicos .........................................................................................16

1.3. Justificación e Importancia de la investigación..................................................... 16

1.4. Delimitación de la investigación ........................................................................... 17

1.4.1. Delimitación Espacial ........................................................................................17

1.4.2. Delimitación temporal .......................................................................................17

1.4.3. Delimitación Social............................................................................................17

1.4.4. Delimitación conceptual ....................................................................................17

4
1.5. Limitaciones .......................................................................................................... 17

CAPÍTULO II: MARCO TEÓRICO ....................................................................................... 18

2.1. Antecedentes.......................................................................................................... 18

2.2. Bases teóricas o teoría sustantiva. ......................................................................... 22

2.2.1. Sistema de Gestión de Bases de Datos ..............................................................22

2.2.2. Almacenes de datos............................................................................................23

2.2.3. Minería de datos.................................................................................................25

2.2.4. Análisis de datos y OLAP..................................................................................27

2.3. Glosario de términos.............................................................................................. 28

2.3.1. Inmobiliaria........................................................................................................29

2.3.2. Data Mart ...........................................................................................................29

2.3.3. Data Warehouse .................................................................................................29

2.3.4. OLAP (procesamiento analítico en línea)..........................................................29

2.3.5. SQL (Structured Query Language)....................................................................29

2.3.6. KPI (Key Performance Indicator)......................................................................29

2.3.7. DDL (Data Definition Language)......................................................................30

2.3.8. DML (Data Manipulation Language) ................................................................30

2.3.9. ETL (Extract, Transform and Load) ..................................................................30

2.4. Formulación de las hipótesis. ................................................................................ 30

2.4.1. Hipótesis Global o principal ..............................................................................30

2.4.2. Hipótesis Específicas .........................................................................................31

2.5. Identificación y clasificación de las variables. ...................................................... 31

5
2.6. Operacionalización de variables. ........................................................................... 31

CAPÍTULO III: METODOLOGÍA DE LA INVESTIGACIÓN ............................................ 32

3.1. Tipo, Diseño y Nivel de la investigación. ............................................................. 32

3.2. Población y muestra............................................................................................... 32

3.2.1. Población............................................................................................................32

3.2.2. Muestra ..............................................................................................................32

3.3. Técnicas e Instrumentos de Recolección de datos................................................. 32

3.4. Procesamiento de los datos.................................................................................... 32

CAPÍTULO IV: IMPLEMENTACIÓN DE LA PROPUESTA.............................................. 33

4.1. Especificación de los requisitos estratégicos......................................................... 33

4.2. Descripción de las fuentes de datos de origen....................................................... 33

4.2.1. Descripción de Tablas........................................................................................34

4.2.2. Esquema de Base de Datos Relacional ..............................................................35

4.3. Diseño del Data Mart............................................................................................. 35

4.5. Modelo físico y script DDL................................................................................... 37

4.6. Proceso ETL .......................................................................................................... 39

4.6.1. Criterios adoptados y lógica de transformación.................................................39

4.7. Detalles del proceso ETL ...................................................................................... 40

4.7.1. Proceso de ETL de la Tabla Cliente ..................................................................42

4.7.2. Proceso de ETL de la Tabla Empleado..............................................................43

4.7.3. Proceso de ETL de la Tabla Fecha ....................................................................45

4.7.4. Proceso de ETL de la Tabla Propiedades ..........................................................46

6
4.7.5. Proceso de ETL de la Tabla Visitas...................................................................47

4.8. Carga y análisis del proceso ETL .......................................................................... 50

4.8.1. Carga y Ejecución de la tabla Clientes ..............................................................50

4.8.2. Carga y Ejecución de la tabla Empleados..........................................................51

4.8.3. Carga y Ejecución de la tabla Fecha ..................................................................51

4.8.4. Carga y Ejecución de la tabla Propiedad ...........................................................52

4.8.5. Carga y Ejecución de la tabla Visitas ................................................................52

4.9. Exploración de Datos............................................................................................. 53

4.9.1. Descripción de la Etapa .....................................................................................53

4.9.2. Indicadores obtenidos y validación de estos ......................................................54

CAPÍTULO V: ANÁLISIS Y PRESENTACIÓN DE RESULTADOS ................................. 57

5.1. Presentación, análisis e interpretación de Resultados. .......................................... 57

5.2. Contrastación de hipótesis. .................................................................................... 57

5.3. Discusión de los resultados.................................................................................... 58

CONCLUSIONES ................................................................................................................... 59

RECOMENDACIONES.......................................................................................................... 60

REFERENCIAS....................................................................................................................... 61

ANEXOS ................................................................................................................................. 63

1. MATRIZ DE CONSISTENCIA............................................................................ 63

2. TABLA DE TOMA DE TIEMPOS ...................................................................... 64

7
RESUMEN

La Inteligencia de Negocios BI (Business Intelligence) es una herramienta bajo la cual

diferentes tipos de organizaciones, pueden soportar la toma de decisiones basadas en

información precisa y oportuna; garantizando la generación del conocimiento necesario que

permita escoger la alternativa que sea más conveniente para el éxito de la empresa.

La investigación comienza con la definición y aplicaciones de BI; además se muestran trabajos

relevantes en algunas de las herramientas para hacer BI, como son Data Warehouse (Bodega

de Datos), Olap (Cubos Procesamiento Analítico en Línea), Balance Scorecard (Cuadro de

Mando) y Data Mining (Minería de Datos). (Rosado Gomez, 2010)

El presente trabajo abarcara la elaboración de un Data Mart y su procesamiento OlAP para una

empresa del rubro inmobiliario.

PALABRAS CLAVE: Data Mart, ETL, OLAP, Inmobiliaria

8
ABSTRACT

Business Intelligence BI is a tool, below different kind organizations, supports decisions

making processes, based in an exact and accurate information; guarantying the production of

the needed knowledge that lets to choose the most appropiate option for the company success.

The investigation begins with the BI definition and applications; by addition shows definitions

and relevant BI investigations tools, like Data Warehouse, Olap, Balance Scorecard and Data

Mining. (Rosado Gomez, 2010)

The present work includes the development of a Data Mart and its processing OlAP for a real

estate company.

KEYWORDS: Data Mart, ETL , OLAP, real estate company

9
LISTA DE TABLAS

Tabla 1: Identificación y clasificación de las variables ...........................................................31

Tabla 2: Requerimientos y dimensiones del Data Mart...........................................................37

10
LISTA DE FIGURAS

Figura 1: Sistemas de Gestión de Bases de Datos ...................................................................23

Figura 2: Almacenes de Datos .................................................................................................24

Figura 3: Proceso de creación de Almacenes de Datos ...........................................................25

Figura 4: Data Mining..............................................................................................................27

Figura 5: Arquitectura de Business Intelligence......................................................................28

Figura 6: Esquema de Base de Datos de la Inmobiliaria Alegría S.R.L..................................35

Figura 7: Modelo Estrella de Base de Datos de la Inmobiliaria Alegría S.R.L.......................36

Figura 8: KPI Número de Visitas y sus dimenciones ..............................................................36

Figura 9: Dimensión Cliente del Data Mart.............................................................................39

Figura 10: Dimensión Empleado del Data Mart ......................................................................39

Figura 11: Dimensión Propiedad del Data Mart ......................................................................40

Figura 12: Dimensión Fecha del Data Mart.............................................................................40

Figura 13: Configuración de conexión a la Base de Datos......................................................41

Figura 14: Captura de pantalla de la selección de tablas de la Base de Datos.........................41

Figura 15: Configuración de conexión a la Base de Datos Multidimensional ........................41

Figura 16: Selección de tablas de la Base de Datos Multidimensional ...................................42

Figura 17: Diagrama ETL de la Tabla Cliente.........................................................................42

Figura 18: Mapeo de la Tabla Cliente......................................................................................42

Figura 19: Ordenamiento de la Tabla Dimensional Cliente ....................................................43

Figura 20: Muestreo de la Tabla Dimensional Cliente ............................................................43

Figura 21: Mapeo de la Tabla Dimensional Cliente ................................................................43

Figura 22: Diagrama ETL de la Tabla Empleado....................................................................43

Figura 23: Mapeo de la Tabla Empleado.................................................................................44

Figura 24: Ordenamiento de la Tabla Dimensional Empleado................................................44

11
Figura 25: Muestreo de la Tabla Dimensional Empleado .......................................................44

Figura 26: Mapeo de la Tabla Dimensional Empleado ...........................................................44

Figura 27: Diagrama ETL de la Tabla Fecha...........................................................................45

Figura 28: Mapeo de la Tabla Fecha........................................................................................45

Figura 29: Ordenamiento de la Tabla Dimensional Fecha ......................................................45

Figura 30: Muestreo de la Tabla Dimensional Fecha ..............................................................45

Figura 31: Mapeo de la Tabla Dimensional Fecha ..................................................................46

Figura 32: Diagrama ETL de la Tabla Propiedades.................................................................46

Figura 33: Mapeo de la Tabla Propiedades..............................................................................46

Figura 34: Ordenamiento de la Tabla Dimensional Propiedades ............................................47

Figura 35: Muestreo de la Tabla Dimensional Propiedades ....................................................47

Figura 36: Mapeo de la Tabla Dimensional Propiedades ........................................................47

Figura 37: Diagrama ETL de la Tabla Visitas .........................................................................48

Figura 38: Mapeo de la Tabla Visitas ......................................................................................48

Figura 39: Agregar filas a la Tabla Dimensional Visitas.........................................................49

Figura 40: Ordenamiento de la Tabla Dimensional Visitas.....................................................49

Figura 41: Muestreo de la Tabla Dimensional Visitas.............................................................49

Figura 42: Mapeo de la Tabla Dimensional Visitas.................................................................50

Figura 43: Carga de la Tabla Dimensional Clientes ................................................................50

Figura 44: Ejecución de la Tabla Dimensional Clientes..........................................................50

Figura 45: Carga de la Tabla Dimensional Empleados ...........................................................51

Figura 46: Ejecución de la Tabla Dimensional Empleados .....................................................51

Figura 47: Carga de la Tabla Dimensional Fecha....................................................................51

Figura 48: Ejecución de la Tabla Dimensional Fecha .............................................................51

Figura 49: Carga de la Tabla Dimensional Propiedad .............................................................52

12
Figura 50: Ejecución de la Tabla Dimensional Propiedad.......................................................52

Figura 51: Carga de la Tabla Dimensional Visitas ..................................................................52

Figura 52: Ejecución de la Tabla Dimensional Visitas............................................................53

Figura 53: Conexión Tableau a la base de datos multidimensional.........................................53

Figura 54: Dimensión Fecha/Empleado/Ciudad......................................................................54

Figura 55: Dimensión Fecha/TipoCliente/Ciudad ...................................................................55

Figura 56: Dimensión Tiempo/TipoPropiedad/Ciudad ...........................................................56

Figura 57: Comparativa de tiempos entre lo Actual y el Data Mart ........................................57

13
INTRODUCCIÓN

El rubro inmobiliario en la ciudad del Cusco viene teniendo un gran auge en estos últimos años

gracias al desarrollo e impulso financiero que vive nuestro país. De la mano con la gran

demanda de viviendas y edificios para los diferentes tipos de interesados, constituyen un gran

manejo de flujo de información económica, administrativa y geográfica.

Las inmobiliarias pasan a tener que ofrecer productos del rubro, de acuerdo a las necesidades

de los usuarios manejando: precios, tipo de inmueble y su ubicación.

Por las razones antes expuestas y con la finalidad de tener un apoyo al área de ventas de las

inmobiliarias; éstas optan por tener software que les permitan tener el control, búsqueda y

monitoreo de sus diferentes bienes inmuebles. Es así que, el manejo de un volumen de

información, muchas veces en papel, del área de ventas no hace eficiente ni en tiempo ni en

recursos, brindar servicios de calidad al usuario final.

Para lograr lo anterior, el presente trabajo incluye: el uso de tecnología basada la generación

de un Data Mart para empresas inmobiliarias, así como metodología de desarrollo del mismo

y la generación de cubos OLAP, para este caso el área de ventas de la Inmobiliaria Alegría de

la Ciudad del Cusco.

14
CAPÍTULO I: PLANTEAMIENTO DEL ESTUDIO

1.1. Descripción de la realidad problemática.

La empresa inmobiliaria “Inmobiliaria Alegría S.R.L.”, es una empresa ubicada en la

ciudad del Cusco, Perú y dedicada a la venta de terrenos, casas y departamentos, cuenta

con una gran variedad de propiedades en la ciudad del Cusco de diversos tipos, precios,

dimensiones y ubicaciones.

La empresa es pequeña y viene operando hace dos años, pero ha ido aumentando su

cartera de clientes y lista de propiedades gracias a la gran demanda de bienes inmuebles

en esta ciudad. Para mejorar las ventas que realizan y mantener la satisfacción de sus

clientes la inmobiliaria registra las visitas que se realizan a cada inmueble en las que

participan un empleado encargado de la inmobiliaria y el cliente interesado.

Los clientes que visitan un inmueble son considerados clientes potenciales y es

importante evaluar este margen para determinar cuánta afluencia de clientes tiene la

empresa

Actualmente busca direccionar sus estrategias de publicidad de mejor manera. Para

esto requerirá de la evaluación de indicadores como el número de visitantes que tienen,

considerándose como estadísticas necesarias para determinar con cuántos clientes

potenciales cuentan desde su creación.

1.1. Formulación del problema.

1.1.1. Problema principal

¿De qué manera el desarrollo de un Data Mart influye en la toma de decisiones

en el área de ventas de la Inmobiliaria?

15
1.1.2. Problemas específicos

● Identificar la información relevante para el desarrollo de la investigación

● Desarrollar el modelo de Data Mart

● Verificar el grado de influencia entre el Data Mart y la toma de

decisiones para el área de ventas.

1.2. Objetivos.

1.2.1. Objetivo principal

Establecer de qué manera el desarrollo de un Data Mart influye en la toma de

decisiones en el área de ventas de la Inmobiliaria Alegría S.R.L.

1.2.2. Objetivos específicos

● Identificar los requerimientos de análisis de información para el área de

Ventas.

● Elaborar un modelo de base de datos multidimensional que permita el

análisis y explotación de la información identificada.

● Construir el Data Mart para mostrar la información que se necesita para

poder tomar decisiones estratégicas en el área de ventas.

1.3. Justificación e Importancia de la investigación

En la actualidad las empresas del rubro inmobiliario necesitan la información oportuna

y pertinente; y mostrada además de un a manera gráfica para su entendimiento.

16
1.4. Delimitación de la investigación

1.4.1. Delimitación Espacial

Esta investigación se realizará en la Inmobiliaria Alegría S.R.L, ubicado en

Prolongación Av. de la cultura 427 San Sebastián – Cusco – Perú.

1.4.2. Delimitación temporal

Esta investigación tendrá una duración de aproximadamente 4 meses.

Comenzará en Septiembre del 2017 y finalizará en Diciembre del 2017.

1.4.3. Delimitación Social

El grupo social objeto de estudio es el personal de la empresa Inmobiliaria

Alegría S.R.L y sus clientes.

1.4.4. Delimitación conceptual

La investigación estará enmarcada en el área de la Inteligencia de negocios.

1.5. Limitaciones

● Al ser una empresa relativamente nueva; se desarrollará la investigación de data

de aproximadamente 2 años.

● Al poseer información sensible; se enmascara la información de los usuarios y

de los inmuebles.

17
CAPÍTULO II: MARCO TEÓRICO

2.1. Antecedentes.

Tesis 1: Solución integral para explotar eficientemente la información de los

contactos con los clientes utilizando Data Mart en Telefónica del Perú

Autor: Gamarra Ramirez, Alejandro Javier

El trabajo muestra el proceso seguido para el desarrollo de un Data Mart cuyo objetivo

será facilitar la información de los contactos con el cliente de Telefónica del Perú a

todos los usuarios internos de la empresa y proporcionar las herramientas necesarias

que ayuden a la correcta explotación y uso eficiente de la misma. La presencia de este

Data Mart contribuirá a comprender, aún mejor, cuáles son las necesidades reales del

cliente y contribuir a la satisfacción de las mismas

La tesis realizada pone de manifiesto la gran utilidad que tiene la metodología

propuesta por Gill Harjinder y Rao Prakash, la cual es muy flexible y ayuda a realizar

eficazmente este tipo de proyectos. Para la implementación del Data Mart se

seleccionó SQL Server como motor de base de datos, Analysis Services para la

construcción de cubos multidimensionales, Reporting Services para la elaboración de

reportes y Macromedia Dreamweaver para la creación del Sitio Web de consultas

online de los contactos de los clientes.

Palabras Claves: Data Mart, contactos, metodología, SQL, Sitio Web, consultas online

(Ramirez, 2011)

Tesis 2: Aplicativo Data Mart y la agilización de la toma de decisiones en el

Departamento de Farmacia del Hospital Eleazar Guzmán Barrón – Nuevo

Chimbote

Autor: Angeles Pacheco, Vicente Miguel

18
El aplicativo Data Mart permitirá agilizar el proceso de toma de decisiones en del

departamento de farmacia de dicho hospital, a través de herramientas y tecnologías de

inteligencia de negocios, que convertirán datos en información útil.

El aplicativo Data Mart será desarrollado bajo la realización de cada uno de las etapas

de la metodología de Ralph Kimball, siento ésta metodología la más ajustada para esta

investigación.

El aplicativo propuesto muestra todos los requerimientos y necesidades del área de

farmacia, asegurándose que el proceso de toma de decisiones sea de manera oportuna

y eficaz. (Angeles Pacheco, 2015)

Tesis 3: Desarrollo de un Data Mart para mejorar la toma de decisiones en el área

de ventas de la corporación Furukawa

Autor: Durand Mendoza, Alex Jesús

A lo largo de los últimos años, cada vez más organizaciones han visto la necesidad y la

utilidad de usar soluciones Business Intelligence para la toma de decisiones.

Tradicionalmente, estas herramientas eran utilizadas de forma exclusiva por grandes

organizaciones y multinacionales de los sectores de gran consumo, banca y

telecomunicaciones.

Conforme han ido avanzando los años se ha ido abriendo el uso a empresas de todos

los sectores productivos y comerciales, así como a las Administraciones Públicas, que

han visto en su uso, una gran manera de optimizar y mejorar el servicio a sus

ciudadanos.

De forma paralela, dentro de las propias organizaciones que ya usaban Business

Intelligence se ha ido extendiendo su uso a un mayor número de personas.

De ser tecnologías y soluciones reservadas a analistas y personal de dirección se ha ido

extendiendo su uso a todas aquellas personas que manejan información y toman

19
decisiones en las compañías que, en la práctica, son un porcentaje muy alto de las

mismas.

Tesis 4: Propuesta de un Data Mart para mejorar el proceso de toma de decisiones

en la Empresa Cresko, 2016

Autor: Arroyo Raymundo, Hector Esteban

El área comercial de la empresa Cresko S.A. es la que más tiempo emplea en la

elaboración de reportes por su grado de dificultad, ocasionando muchas veces una

entrega tardía disminuyendo la capacidad de decisión. En otras ocasiones el reporte

entregado no cuenta con la información requerida porque el sistema actual no brinda

las facilidades ya que es un sistema transaccional.

La metodología usada fue sintagma holístico y enfoque mixto, con tipo de investigación

proyectiva no experimental, la unidad de análisis fue el área comercial de la empresa

Cresko S.A. a la cual se aplicaron los instrumentos de recolección de datos para conocer

la situación actual de la obtención de información y la toma de decisiones, luego de

haber aplicado las encuestas y entrevistas, se realizó la triangulación de resultados y

diagnóstico final, los resultados obtenidos indican que el proceso de toma de decisiones

es regular, esto se debe a que calidad de la información de los reportes no satisfacen lo

necesitado para poder decidir, del mismo modo la disponibilidad de la información

tampoco es la que se espera. Luego de realizar la investigación, los resultados indican

que se debe implementar técnicas de inteligencia de negocio (BI), y mediante un Data

Mart mostrar un tablero de control con indicadores para el área comercial, así como

también disponer de reportes mediante tablas dinámicas y elaborar un reporte gerencial

cada periodo según la necesidad de los ejecutivos de la empresa. (Raymundo, 2017)

20
Tesis 5: Data Mart de información académica en la toma de decisiones en la

Universidad Nacional de Ucayali

Autor: Claros Claros, Reynaldo

La toma de decisiones dentro de las organizaciones se ha hecho indispensable en cada

una de las etapas en las que esta se desarrolla. Por tal motivo es importante adoptar las

tecnologías que permiten realizar este proceso de toma de decisiones mucho más

eficiente y eficaz.

La tecnología de Business intelligence ayuda enormemente este proceso, en cual es

reflejado en esta investigación con el desarrollo de un Data Mart académico, que prevea

información relevante, precisa y oportuna para los tomadores de decisiones en el ámbito

académico. Como metodología de implementación se ha utilizado el Business

intelligence ROADMAP. (Shaku), que comprende de 16 pasos en los cuales se recogen

las actividades a realizar para llevar un proyecto de Business intelligence.

Los resultados de la presente investigación, el Data Mart académico da soporte de

información académica ayudando a mejorar la toma de decisiones en el ámbito

académico de la Universidad Nacional de Ucayali. El Data Mart de información

académico está dirigido a usuarios que hacen uso de indicadores e información

relacionada en el ámbito académico, dentro de las consideraciones de esta investigación

se listan: Decanos, Jefes de departamentos, Directores de escuelas, Oficinas de

información académica, Oficinas de estadísticas y otros interesados (Claros, 2015)

Tesis 6: Análisis, diseño e implementación de un Data Mart para el área de

mantenimiento y logística de una empresa de transporte público de pasajeros

Autor: Zambrano Alarcón, Jaime Alexander

21
El trabajo de tesis implementa un Data Mart para el apoyo al proceso de toma de

decisiones del área de mantenimiento y logística de una empresa de transporte público

de pasajeros.

Las empresas de transporte público de pasajeros son un tipo de empresa que maneja

una gran cantidad de información día a día. Sin embargo, muchas de ellas no saben

cómo administrarlo adecuadamente, debido a que sus sistemas actuales no soportan el

manejo adecuado de grandes volúmenes de información. Así, las empresas de

transporte público tienen el problema de utilizar su información para emplearla en la

toma de decisiones. (Zambrano A, 2011)

2.2. Bases teóricas o teoría sustantiva.

2.2.1. Sistema de Gestión de Bases de Datos

Un sistema gestor de bases de datos (SGBD) consiste en una colección de datos

interrelacionados y un conjunto de programas para acceder a dichos datos. La

colección de datos, normalmente denominada base de datos, contiene

información relevante para una empresa. (Silberschatz, Korth, & Sudarshan,

2007)

El objetivo principal de un SGBD es proporcionar una forma de almacenar y

recuperar la información de una base de datos de manera quesea tanto práctica

como eficiente. Los sistemas de bases de datos se diseñan para gestionar grandes

cantidades de información. La gestión de los datos implica tanto la definición

de estructuras para almacenar la información como la provisión de mecanismos

para la manipulación de la información. Además, los sistemas de bases de datos

deben garantizar la fiabilidad de la información almacenada, a pesar de las

caídas del sistema o de los intentos de acceso no autorizados. Si los datos van a

22
ser compartidos entre diferentes usuarios, el sistema debe evitar posibles

resultados anómalos.

Figura 1: Sistemas de Gestión de Bases de Datos

Fuente: Recuperado del Libro Sistemas de Información Geográfica un libro libre de Víctor
Olaya

2.2.2. Almacenes de datos

Las grandes empresas tienen presencia en muchos lugares, cada uno de los

cuales puede generar un gran volumen de datos. Por ejemplo, las cadenas de

tiendas minoristas poseen centenares o millares de tiendas, mientras que las

compañías de seguros pueden tener datos de millares de oficinas locales.

(Silberschatz, Korth, & Sudarshan, 2007)

Además, las organizaciones grandes tienen una estructura compleja de

organización interna y, por tanto, puede que los diferentes datos se hallen en

ubicaciones, sistemas operativos o bajo esquemas diferentes. Por ejemplo,

puede que los datos de los problemas de fabricación y los datos sobre las quejas

de los clientes estén almacenados en diferentes sistemas de bases de datos. Los

23
encargados de adoptar las decisiones empresariales necesitan tener acceso a la

información de todos esos orígenes. La formulación de consultas a cada uno de

los orígenes es a la vez engorrosa e ineficiente. Además, puede que los orígenes

de datos sólo almacenen los datos actuales, mientras que es posible que los

encargados de adoptar las decisiones empresariales necesiten tener acceso

también a datos anteriores, por ejemplo, información sobre la manera en que se

han modificado las pautas de compra el año pasado puede resultar de gran

importancia. Los almacenes de datos proporcionan una solución a estos

problemas.

Figura 2: Almacenes de Datos

Fuente: Blog Amigos para siempre, http://ayudahispano-3000.blogspot.pe

Los almacenes de datos (data warehouses) son depósitos (o archivos) de

información reunida de varios orígenes, almacenada bajo un esquema unificado

en un solo sitio. Una vez reunida, los datos se almacenan mucho tiempo, lo que

permite el acceso a datos históricos. Así, los almacenes de datos proporcionan a

los usuarios una sola interfaz consolidada con los datos, por lo que las consultas

24
de ayuda a la toma de decisiones resultan más fáciles de escribir. Además, al

tener acceso a la información para la ayuda de la toma de decisiones desde un

almacén de datos, el encargado de adoptar las decisiones sea segura que los

sistemas de procesamiento en línea de las transacciones no se vean afectados

por la carga de trabajo de la ayuda de la toma de decisiones.

Figura 3: Proceso de creación de Almacenes de Datos

Fuente: Recuperado del Blog Amigos para siempre, http://ayudahispano-3000.blogspot.pe

2.2.3. Minería de datos

El término minería de datos (data mining) hace referencia vagamente al proceso

de análisis semiautomático de bases de datos de gran tamaño para hallar

estructuras útiles. (Silberschatz, Korth, & Sudarshan, 2007)

Al igual que la búsqueda de conocimiento en la inteligencia artificial (también

denominada aprendizaje de la máquina), o el análisis estadístico, la minería de

datos intenta descubrir reglas y estructuras a partir de los datos. No obstante, la

minería de datos se diferencia del aprendizaje de la máquina y de la estadística

en que trata con grandes volúmenes de datos, almacenados sobre todo en disco.

25
Es decir, la minería de datos trata de la “búsqueda de conocimiento en las bases

de datos”. Algunos tipos de conocimiento descubiertos a partir de una base de

datos pueden representarse por un conjunto de reglas.

Otros tipos de conocimiento se representan por ecuaciones que relacionan entre

sí diferentes variables, o mediante otros mecanismos de predicción de

resultados cuando se conocen los valores de algunas variables.

Hay gran variedad de tipos posibles de estructuras que pueden resultar útiles, y

se emplean diferentes técnicas para hallar tipos diferentes de estructuras. Se

estudiarán unos cuantos ejemplos de estructuras y se verá el modo en que

pueden obtenerse de manera automática de las bases de datos.

Suele haber una parte manual en la minería de datos, que consiste en el pre-

procesamiento de los datos hasta una forma aceptable para los algoritmos, y en

el pos-procesamiento de las estructuras descubiertas para hallar otras nuevas

que puedan resultar útiles. También puede haber más de un tipo de estructura

que se pueda descubrir a partir de una base de datos dada, y puede que se

necesite la interacción manual para escoger los tipos de estructuras útiles. Por

este motivo, la minería de datos es realmente un proceso semiautomático en la

vida real. No obstante, la descripción que sigue se centrará en el aspecto

automático de la minería.

26
Figura 4: Data Mining

Fuente: Recuperado del sitio https://www.predictiveanalyticstoday.com

2.2.4. Análisis de datos y OLAP

El área de procesamiento analítico en línea (Online Analytical Processing,

OLAP) trata de las herramientas y de las técnicas para el análisis de datos que

pueden dar respuestas casi instantáneas a las consultas de datos resumidos, aún

cuando la base de datos sea extremadamente grande. (Silberschatz, Korth, &

Sudarshan, 2007)

Aunque es mejor dejar el análisis estadístico complejo a los paquetes

estadísticos las bases de datos deben soportar las formas sencillas, utilizadas

frecuentemente, de análisis estadístico. Dado que los datos almacenados en las

bases de datos suelen ser de gran volumen, hay que resumirlos de algún modo

si hay que obtener información que puedan utilizar los usuarios. Las

herramientas OLAP soportan el análisis interactivo de la información de

resumen. Se han desarrollado varias extensiones de SQL para soportar las

herramientas OLAP.

27
Hay muchas tareas utilizadas con frecuencia que no pueden realizarse

empleando las facilidades básicas de agregación y agrupamiento e SQL. Entre

los ejemplos se hallan la búsqueda de percentiles, las distribuciones

acumulativas o los agregados sobre ventanas deslizantes de datos ordenados

secuencialmente. Recientemente se han propuesto varias extensiones de SQL

para soportar estas tareas y se han implementado en productos como Oracle y

DB2 de IBM.

Figura 5: Arquitectura de Business Intelligence

Fuente: Recuperado del sitio https://www.predictiveanalyticstoday.com

2.3. Glosario de términos.

Según la Real Academia de la Lengua Española, (Conesa Caralt & Curto Díaz, 2010),

(Elmasri & Navathe, 2011) y (Molina, Ullman, & Widom, 2009) se tiene los siguientes

términos:

28
2.3.1. Inmobiliaria

Empresa o sociedad que se dedica a construir, arrendar, vender y administrar

viviendas.

2.3.2. Data Mart

Es una base de datos departamental, especializada en el almacenamiento de los

datos de un área de negocio específica.

2.3.3. Data Warehouse

Es una base de datos corporativa que se caracteriza por integrar y depurar

información de una o más fuentes distintas, para luego procesarla permitiendo

su análisis desde infinidad de perspectivas y con grandes velocidades de

respuesta.

2.3.4. OLAP (procesamiento analítico en línea)

Permite a los usuarios extraer fácilmente y de forma selectiva datos y verlos

desde diferentes puntos de vista.

2.3.5. SQL (Structured Query Language)

Es un lenguaje de programación estándar e interactivo para la obtención de

información desde una base de datos y para actualizarla.

2.3.6. KPI (Key Performance Indicator)

Un KPI, conocido también como indicador clave o medidor de desempeño o

indicador clave de rendimiento, es una medida del nivel del desempeño de un

proceso. El valor del indicador está directamente relacionado con un objetivo

fijado de antemano y normalmente se expresa en valores porcentuales.

29
2.3.7. DDL (Data Definition Language)

Un lenguaje de base de datos o lenguaje de definición de datos, DDL por sus

siglas en inglés) es un lenguaje proporcionado por el sistema de gestión de base

de datos que permite a los programadores de la misma llevar a cabo las tareas

de definición de las estructuras que almacenarán los datos, así como de los

procedimientos o funciones que permitan consultarlos.

2.3.8. DML (Data Manipulation Language)

Lenguaje de Manipulación de Datos (DML) es un lenguaje proporcionado por

los sistemas gestores de bases de datos que permite a los usuarios de la misma

llevar a cabo las tareas de consulta o modificación de los datos contenidos en

las Bases de Datos del Sistema Gestor de Bases de Datos.

2.3.9. ETL (Extract, Transform and Load)

“Extraer, Transformar y Cargar”, (frecuentemente abreviado ETL) es el proceso

que permite a las organizaciones mover datos desde múltiples fuentes,

reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data

warehouse para analizar, o en otro sistema operacional para apoyar un proceso

de negocio.

2.4. Formulación de las hipótesis.

2.4.1. Hipótesis Global o principal

Se podrá mejorar la toma de decisiones con la implementación de un Data Mart

para la empresa inmobiliaria Alegria SRL.

30
2.4.2. Hipótesis Específicas

● Se podrá reducir el tiempo en la elaboración de reportes.

● Se podrá reducir el tiempo en la búsqueda de información personalizada.

2.5. Identificación y clasificación de las variables.

Variable Definición Definición Indicadores Escala de


conceptual operacional Medición
Modelo Data Base de datos Repositorio de datos Eficiencia
Mart especializada en el perteneciente al área
almacenamiento de Mantenibilidad
datos del área
Usabilidad

Proceso de Es el proceso que Es un proceso racional Tiempo en la Razón


Toma de se realiza para que se da al presentarse elaboración de
Decisiones seleccionar una distintas alternativas, reportes
acción analizando
para la solución de seleccionando e Tiempo en la
un problema implementando la que búsqueda de
específico. más se adecue al información
objetivo estratégico. personalizada

Tabla 1: Identificación y clasificación de las variables

2.6. Operacionalización de variables.

● Variable Dependiente: Proceso de Toma de Decisiones

● Variable Independiente: Modelo Data Mart

31
CAPÍTULO III: METODOLOGÍA DE LA INVESTIGACIÓN

3.1. Tipo, Diseño y Nivel de la investigación.

Según (Hernández Sampieri, Fernández Collado, & Baptista Lucio, 2014) se tiene:

● Tipo: Correlacional

● Nivel: Explicativo

● Diseño: No experimental

3.2. Población y muestra.

3.2.1. Población

Empresas Inmobiliarias de la Ciudad del Cusco

3.2.2. Muestra

Empresas Inmobiliarias del Distrito de San Sebastián

Caso: Inmobiliaria Alegría SRL

3.3. Técnicas e Instrumentos de Recolección de datos.

La técnica de verificación será una lista de cotejo.

3.4. Procesamiento de los datos

Se hará un análisis estadístico para determinar la mejora del área de ventas de la

inmobiliaria Alegría S.R.L.

32
CAPÍTULO IV: IMPLEMENTACIÓN DE LA PROPUESTA

4.1. Especificación de los requisitos estratégicos

La empresa desea resolver los siguientes requerimientos:

Evolución de afluencia de clientes (clientes potenciales):

 Requerimiento 1 (RE1): Se desea hacer un seguimiento de las visitas

comparando los años y meses desde la primera visita. De esta manera se puede

determinar la afluencia de clientes potenciales de la inmobiliaria desde su

creación a la actualidad con la finalidad de determinar sus estrategias publicitarias

por épocas del año.

 Requerimiento 2 (RE2): Se desea también observar las variaciones en las visitas

para las distintas ciudades a las que pertenecen las propiedades. De esta manera

se puede determinar que ciudades presentan mayor demanda en bienes inmuebles

y dirigir estrategias de búsqueda de adquisición de propiedades a esas zonas.

 Requerimiento 3 (RE3): Se desea también observar visitas realizadas por

empleado para así medir la productividad de sus empleados.

 Requerimiento 4 (RE4): Por último, es importante también comparar las

cantidades de vistas realizadas por tipo de clientes para determinar la clase de

clientes potenciales de la empresa. Estos tipos son básicamente dos, Personas

Naturales y Jurídicas. De acuerdo a esta información se pueden dirigir estrategias

publicitarias más exclusivas y personales.

4.2. Descripción de las fuentes de datos de origen

La inmobiliaria cuenta con la siguiente estructura de Base de datos relacional

desarrollada en MySQL.

33
4.2.1. Descripción de Tablas

A continuación, se describen las tablas que componen la base de datos de

inmuebles y visitas de la empresa.

 TCliente (IdTCliente, dni, nombres, fechaIngreso, tipo, dirección)

Contiene información sobre los clientes de la inmobiliaria registrando

tanto a aquellos que realizaron una compra o visitaron un inmueble para

su adquisición.

 TPropietario (IdTPropietario, dni_propietario, nombres, tipo,

dirección, ciudad)

Contiene información sobre los propietarios de los inmuebles que posee

la inmobiliaria.

 TEmpleado (IdTEmpleado, dni_empleado, nombres, cargo)

Contiene información sobre los empleados de la inmobiliaria, que son

las personas que efectúan las visitas a los inmuebles.

 TVenta (IdTVenta, fecha, tipo, montoFinal, idTCliente, idTPropiedad)

Contiene información sobre las ventas realizadas por la inmobiliaria que

relaciona la propiedad vendida y el cliente al cual se le está vendiendo

el inmueble.

 TPropiedad (IdTPropiedad, dirección, ciudad, tamaño, tipo, precio,

fechaincripcion, fechacese, idTPropietario)

Contiene información sobre las propiedades con las que cuenta el

inmueble relacionada también a un propietario.

 TVisita (IdTVisita, fecha, informe, idTEmpleado, idTPropiedad)

Contiene información sobre las visitas que se realizan a las propiedades

antes de que estas sean adquiridas por el cliente.

34
4.2.2. Esquema de Base de Datos Relacional

Figura 6: Esquema de Base de Datos de la Inmobiliaria Alegría S.R.L.

4.3. Diseño del Data Mart

El siguiente es un esquema conceptual, modelo estrella (Kimball, 2011), diseñado a

partir de los requerimientos indicados por la inmobiliaria en cuanto a las visitas.

Se definieron 4 dimensiones: DAD_Fecha, DAD_Empleado, DAD_Clientes de las que

extraeremos el tipo y DAD_Propiedades de las que se tomara la ciudad a la que

pertenece el inmueble. La dimensión filtro denominada FAD_Visitas guarda el número

de visitas realizadas lo que representa el KPI.

35
Figura 7: Modelo Estrella de Base de Datos de la Inmobiliaria Alegría S.R.L.

4.4. Justificación del modelo

En atención a los requerimientos de la empresa planteados en el punto 4.1 de la

presente tesis; todos giran en torno a la cantidad de visitas que se realizan llegando a

la necesidad de determinar la cantidad de visitas tomando 3 dimensiones.

Cantidad de Visitas:

Lo importante es analizar la cantidad de visitas realizadas por fecha (año, mes),

propiedad (ciudad en la que está ubicada) y cliente (tipo de cliente que realiza la visita).

Figura 8: KPI Número de Visitas y sus dimenciones

36
Requerimiento y RE1 RE2 RE3 RE4
Dimensiones
Cliente X X
Empleado X X
Propiedad X X
Fecha X

Tabla 2: Requerimientos y dimensiones del Data Mart

4.5. Modelo físico y script DDL

El script correspondiente al modelo multidimensional es el siguiente:

SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0;


SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0;
SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='TRADITIONAL,ALLOW_INVALID_DATES';

CREATE SCHEMA IF NOT EXISTS `BDInmobiliariaAlegria_M` DEFAULT CHARACTER SET utf8


COLLATE utf8_general_ci ;
USE `BDInmobiliariaAlegria_M` ;

-- -----------------------------------------------------
-- Table `BDInmobiliariaAlegria_M`.`DAD_Clientes`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `BDInmobiliariaAlegria_M`.`DAD_Clientes` (
`idDAD_Clientes` INT NOT NULL ,
`idTCliente` INT NULL ,
`dni` VARCHAR(8) NULL ,
`tipo` VARCHAR(30) NULL ,
PRIMARY KEY (`idDAD_Clientes`) )

ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `BDInmobiliariaAlegria_M`.`DAD_Propiedades`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `BDInmobiliariaAlegria_M`.`DAD_Propiedades` (
`idDAD_Propiedades` INT NOT NULL ,
`idTPropiedad` INT NULL ,
`ciudad` VARCHAR(45) NULL ,
`tipo` VARCHAR(45) NULL ,
PRIMARY KEY (`idDAD_Propiedades`) )
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `BDInmobiliariaAlegria_M`.`DAD_Fecha`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `BDInmobiliariaAlegria_M`.`DAD_Fecha` (
`idDAD_Fecha` INT NOT NULL ,
`semana` INT NULL ,
`mes` INT NULL ,
`anio` INT NULL ,

37
PRIMARY KEY (`idDAD_Fecha`) )
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `BDInmobiliariaAlegria_M`.`DAD_Empleado`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `BDInmobiliariaAlegria_M`.`DAD_Empleado` (
`idDAD_Empleado` INT NOT NULL ,
`idTEmpleado` INT NULL ,
`nombre` VARCHAR(100) NULL ,
`cargo` VARCHAR(45) NULL ,
PRIMARY KEY (`idDAD_Empleado`) )
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `BDInmobiliariaAlegria_M`.`FAD_Visitas`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `BDInmobiliariaAlegria_M`.`FAD_Visitas` (
`id_AD_Visitas` INT NOT NULL AUTO_INCREMENT ,
`idTCliente` INT NULL ,
`idTPropiedad` INT NULL ,
`idFecha` INT NULL ,
`nrovisitas` INT NULL ,
`idTEmpleado` INT NULL ,
PRIMARY KEY (`id_AD_Visitas`) ,
INDEX `idTCliente_idx` (`idTCliente` ASC) ,
INDEX `idTPropiedad_idx` (`idTPropiedad` ASC) ,
INDEX `idFecha_idx` (`idFecha` ASC) ,
INDEX `idTEmpleado_idx` (`idTEmpleado` ASC) ,
CONSTRAINT `idTCliente`
FOREIGN KEY (`idTCliente` )
REFERENCES `BDInmobiliariaAlegria_M`.`DAD_Clientes` (`idDAD_Clientes` )
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `idTPropiedad`
FOREIGN KEY (`idTPropiedad` )
REFERENCES `BDInmobiliariaAlegria_M`.`DAD_Propiedades` (`idDAD_Propiedades` )
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `idFecha`
FOREIGN KEY (`idFecha` )
REFERENCES `BDInmobiliariaAlegria_M`.`DAD_Fecha` (`idDAD_Fecha` )
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `idTEmpleado`
FOREIGN KEY (`idTEmpleado` )
REFERENCES `BDInmobiliariaAlegria_M`.`DAD_Empleado` (`idDAD_Empleado` )
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;

USE `BDInmobiliariaAlegria_M` ;
SET SQL_MODE=@OLD_SQL_MODE;
SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS;
SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS;

38
4.6. Proceso ETL

La herramienta utilizada en el proceso ETL fue Talend Open Studio Versión 6.4.1

4.6.1. Criterios adoptados y lógica de transformación

 Dimensión Cliente:

Figura 9: Dimensión Cliente del Data Mart

 Dimensión Empleado:

Figura 10: Dimensión Empleado del Data Mart

 Dimensión Propiedad

39
Figura 11: Dimensión Propiedad del Data Mart

 Dimensión Fecha

Figura 12: Dimensión Fecha del Data Mart

4.7. Detalles del proceso ETL

 Conexión a la base de datos operacional

40
Figura 13: Configuración de conexión a la Base de Datos

 Selección de Tablas

Figura 14: Captura de pantalla de la selección de tablas de la Base de Datos

 Conexión a la base de datos multidimensional

Figura 15: Configuración de conexión a la Base de Datos Multidimensional

41
 Selección de Tablas

Figura 16: Selección de tablas de la Base de Datos Multidimensional

4.7.1. Proceso de ETL de la Tabla Cliente

 Diagrama

Figura 17: Diagrama ETL de la Tabla Cliente

 Mapeo

Figura 18: Mapeo de la Tabla Cliente

 Ordenamiento

42
Figura 19: Ordenamiento de la Tabla Dimensional Cliente

 Muestreo

Figura 20: Muestreo de la Tabla Dimensional Cliente

 Mapeo

Figura 21: Mapeo de la Tabla Dimensional Cliente

4.7.2. Proceso de ETL de la Tabla Empleado

 Diagrama

Figura 22: Diagrama ETL de la Tabla Empleado

 Mapeo

43
Figura 23: Mapeo de la Tabla Empleado

 Ordenamiento

Figura 24: Ordenamiento de la Tabla Dimensional Empleado

 Muestreo

Figura 25: Muestreo de la Tabla Dimensional Empleado

 Mapeo

Figura 26: Mapeo de la Tabla Dimensional Empleado

44
4.7.3. Proceso de ETL de la Tabla Fecha

 Diagrama

Figura 27: Diagrama ETL de la Tabla Fecha

 Mapeo

Figura 28: Mapeo de la Tabla Fecha

 Ordenamiento

Figura 29: Ordenamiento de la Tabla Dimensional Fecha

 Muestreo

Figura 30: Muestreo de la Tabla Dimensional Fecha

45
 Mapeo

Figura 31: Mapeo de la Tabla Dimensional Fecha

4.7.4. Proceso de ETL de la Tabla Propiedades

 Diagrama

Figura 32: Diagrama ETL de la Tabla Propiedades

 Mapeo

Figura 33: Mapeo de la Tabla Propiedades

46
 Ordenamiento

Figura 34: Ordenamiento de la Tabla Dimensional Propiedades

 Muestreo

Figura 35: Muestreo de la Tabla Dimensional Propiedades

 Mapeo

Figura 36: Mapeo de la Tabla Dimensional Propiedades

4.7.5. Proceso de ETL de la Tabla Visitas

 Diagrama

47
Figura 37: Diagrama ETL de la Tabla Visitas

 Mapeo

Figura 38: Mapeo de la Tabla Visitas

48
 Agregar Filas

Figura 39: Agregar filas a la Tabla Dimensional Visitas

 Ordenamiento

Figura 40: Ordenamiento de la Tabla Dimensional Visitas

 Muestreo

Figura 41: Muestreo de la Tabla Dimensional Visitas

49
 Mapeo

Figura 42: Mapeo de la Tabla Dimensional Visitas

4.8. Carga y análisis del proceso ETL

4.8.1. Carga y Ejecución de la tabla Clientes

Figura 43: Carga de la Tabla Dimensional Clientes

Figura 44: Ejecución de la Tabla Dimensional Clientes

50
4.8.2. Carga y Ejecución de la tabla Empleados

Figura 45: Carga de la Tabla Dimensional Empleados

Figura 46: Ejecución de la Tabla Dimensional Empleados

4.8.3. Carga y Ejecución de la tabla Fecha

Figura 47: Carga de la Tabla Dimensional Fecha

Figura 48: Ejecución de la Tabla Dimensional Fecha

51
4.8.4. Carga y Ejecución de la tabla Propiedad

Figura 49: Carga de la Tabla Dimensional Propiedad

Figura 50: Ejecución de la Tabla Dimensional Propiedad

4.8.5. Carga y Ejecución de la tabla Visitas

Figura 51: Carga de la Tabla Dimensional Visitas

52
Figura 52: Ejecución de la Tabla Dimensional Visitas

4.9. Exploración de Datos

4.9.1. Descripción de la Etapa

Para la preparación de los cubos multidimensionales OLAP se utilizará la

herramienta Tableau Desktop 10.4.

Se conectará a la base de datos MySQL BDInmobiliariaAlegria_M como se

muestra en la figura:

Figura 53: Conexión Tableau a la base de datos multidimensional

53
4.9.2. Indicadores obtenidos y validación de estos

 La dimensión Fecha/Empleado/Ciudad

Figura 54: Dimensión Fecha/Empleado/Ciudad

54
 La dimensión Fecha/TipoCliente/Ciudad

Figura 55: Dimensión Fecha/TipoCliente/Ciudad

55
 La dimensión Tiempo/TipoPropiedad/Ciudad

Figura 56: Dimensión Tiempo/TipoPropiedad/Ciudad

56
CAPÍTULO V: ANÁLISIS Y PRESENTACIÓN DE RESULTADOS

5.1. Presentación, análisis e interpretación de Resultados.

De acuerdo a la hipótesis general se debe de mejorar la toma de decisiones; y con las

hipótesis específicas, se tiene:

 Se podrá reducir el tiempo en la elaboración de reportes.

Para este indicador se usó la ficha de recolección de datos y se registraron las

muestras de tiempo en la búsqueda de información personalizada de la

inmobiliaria antes de la implementación del Data Mart

 Se podrá reducir el tiempo en la búsqueda de información personalizada.

Para este indicador se usó la ficha de recolección de datos y se registraron las

muestras de tiempo en la búsqueda de información personalizada de la

inmobiliaria antes de la implementación del Data Mart.

5.2. Contrastación de hipótesis.

Se tomó como instrumento la tabla de recolección de tiempos según (Angeles Pacheco,

2015); de los resultados se obtienen la siguiente gráfica:

1600 1500

1400

1200

1000
825
800 675
600

400

200

0
Tiempo

Actual Data Mart Impacto

Figura 57: Comparativa de tiempos entre lo Actual y el Data Mart

57
Lo que indica que existe una mejora casi el 50 % de tiempo entre el tema del tiempo

en la elaboración de reportes y búsqueda de información personalizada.

5.3. Discusión de los resultados.

De lo antes viso se cumple las hipótesis específicas y por tanto la hipótesis general;

concluyendo que el Data Mart es una propuesta de solución.

58
CONCLUSIONES

 Se desarrolló el modelo multidimensional de la base de datos de la Inmobiliaria Alegría.

 Se desarrolló el proceso ETL para la elaboración del Data Mart de la Inmobiliaria

Alegría de los últimos 2 años.

 Se elaboró y recopiló información de tiempos en la elaboración de reportes y búsqueda

de información personalizada la métrica de mejora de tiempo.

 El tiempo en la elaboración de reportes administrativos antes de la implementación del

Data Mart fue de 1500 minutos (100%), en comparación con el Data Mart fue de 825

minutos (55.75%), lo cual determina una reducción notable de 675 minutos (44.25%)

en la elaboración de reportes de ventas.

59
RECOMENDACIONES

 Monitorear la confiabilidad de las operaciones diarias en el sistema de ventas, ya que

esa base de datos transaccional sirve para alimentar juntos con los ETL la base de datos

del Data Mart y se la data no es confiable (calidad) el Data Mart no mostrará

información objetiva.

 Realizar los ETL en un horario no laborable, porque si no es así, es posible que los

usuarios perciban ralentización de la actividad del servidor debido a la carga de proceso.

Si el ETL incluye una gran cantidad de datos, planifique la hora de inicio de forma que

los usuarios resulten mínimamente afectados.

 Tener en cuenta hacer un plan de replicación de base de datos (backup) para

salvaguardar los datos transaccionales y por consiguiente la fuente de alimentación del

Data Mart.

60
REFERENCIAS

Berson, A., & Smith, S. J. (1997). Data warehousing, data mining, and OLAP. McGraw-Hill.

Bowen, J. (2012). Getting Started with Talend Open Studio for Data Integration. Packt

Publishing Ltd.

Claros, R. C. (2015). Data Mart de información académica en la toma de decisiones en la

Universidad Nacional de Ucayali. Ucayali: Universidad Nacional de Ucayali.

Conesa Caralt, J., & Curto Díaz, J. (2010). Introducción al Business Intelligence. España:

UNIVERSITAT OBERTA DE CATALUNYA.

D'Agostino, M., Gabbay, D. M., Hähnle, R., & Posegga, J. (2013). Handbook of tableau

methods. Springer Science & Business Media.

Elmasri, & Navathe. (2011). Fundamentals of Database Systems. Addison Wesley.

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de

la investigación. Mexico: McGraw-Hill.

Kimball, R. &. (2011). The data warehouse toolkit: the complete guide to dimensional

modeling.

Molina, G., Ullman, & Widom. (2009). Database Systems: The Complete Book. Prentice Hall.

Pacheco, V. A. (2015). Aplicativo Data Mart y la agilización de la toma de decisiones en el

Departamento de Farmacia del Hospital Eleazar Guzmán Barrón - Nuevo Chimbote.

Chimbote: Universidad César vallejo.

Ramirez, A. G. (2011). Solución integral para explotar eficientemente la información de los

contactos con los clientes utilizando Data Mart en Telefónica del Perú. Lima:

Universidad Nacional Mayor de San Marcos.

Raymundo, H. A. (2017). Propuesta de un Data Mart para mejorar el proceso de toma de

decisiones en la Empresa Cresko, 2016. Lima: Universidad Privada Norber Wiener.

61
Silberschatz, A., Korth, H. F., & Sudarshan, S. (2007). Fundamentos de diseño de bases de

datos. McGraw-Hill: Mexico.

Zambrano A, J. A. (2011). Análisis, diseño e implementación de un Data Mart para el área de

mantenimiento y logística de una empresa de transporte público de pasajeros. Lima:

Pontificia Universidad Católica del Perú.

62
ANEXOS
1. MATRIZ DE CONSISTENCIA

Problema Objetivo Hipótesis. Variables Metodología


Formulación del problema. Objetivo principal Hipótesis Global o principal Para demostrar y comprobar la Tipo, Diseño y Nivel de la
hipótesis anteriormente formulada, investigación.
Problema principal Establecer de qué manera el  Se podrá mejorar la toma de la operacionalizamos, determinando
¿De qué manera el desarrollo desarrollo de un Data Mart decisiones con la las variables e indicadores que a  Tipo: Correlacional
de un Data Mart influye en la influye en la toma de decisiones implementación de un Data continuación se mencionan:  Nivel: Explicativo
toma de decisiones en el área en el área de ventas de la Mart para la empresa  Diseño: No experimental
de ventas de la Inmobiliaria? Inmobiliaria Alegría S.R.L. inmobiliaria Alegría SRL. Variable = Variable Dependiente
Proceso de Toma de Decisiones
Problemas específicos Objetivos específicos Hipótesis Específicas Técnica de verificación:
 Identificar la información ● Identificar los Variable = Variable Independiente Lista de cotejo.
relevante para el desarrollo de requerimientos de análisis de  Se podrá reducir el tiempo en Modelo Data Mart
la investigación información para el área de la elaboración de reportes. Procesamiento de los datos
 Desarrollar el modelo de Data Ventas.  Se podrá reducir el tiempo en Indicadores:
Mart ● Elaborar un modelo de la búsqueda de información Variable = Variable Independiente Se hará un análisis estadístico
 Verificar el grado de base de datos multidimensional personalizada. Eficiencia para determinar la mejora del
influencia entre el Data Mart que permita el análisis y Mantenibilidad área de ventas de la
y la toma de decisiones para el explotación de la información Usabilidad inmobiliaria Alegría S.R.L.
área de venta identificada. Tiempo en la
● Construir el Data Mart elaboración de
para mostrar la información que reportes
se necesita para poder tomar
decisiones estratégicas en el área Variable = Variable Dependiente
de ventas. Tiempo en la
búsqueda de
información
personalizada

Escala de Medición:
Razón

63
2. TABLA DE TOMA DE TIEMPOS

Nº Item Fecha Base de Datos Nº Item Fecha Data Mart


(segundos) (segundos)
1. 1)
2. 2)
3. 3)
4. 4)
5. 5)
6. 6)
7. 7)
8. 8)
9. 9)
10. 10)
11. 11)
12. 12)
13. 13)
14. 14)
15. 15)
16. 16)
17. 17)
18. 18)
19. 19)
20. 20)
21. 21)
22. 22)
23. 23)
24. 24)
25. 25)

64

También podría gustarte