Almacenes de Datos Parte 2
Almacenes de Datos Parte 2
Almacenes de Datos Parte 2
Cuarto Semestre
Licenciado en Administración
MTI Milton Carlos González
Guerrero
[email protected]
Ejercicio
Esto molesto al dueño y quiere una respuesta clara y verídica por parte
del encargado del departamento (CXP).
Ejercicio
https://www.tiobe.com/tiobe-index/
Ambiente On Premise: Suite
Anaconda con Jupyter
Método 1 cuando vas a hacer todo sin tener Internet
Instalar Python
https://www.python.org/
Ir a la página web de python y darle clic en descargas – downloads.
Dar clic en Download Python + la versión.
Instalar Python
Comenzará a descargarse. Al descargarse, buscamos el
archivo, lo seleccionamos, damos clic con el botón
derecho y seleccionamos ejecutar como administrador. Elegimos Install Now.
Instalar Python
Te dirá que la instalación fue
Empezará a instalarse. exitosa. Damos clic en close.
Instalar Python
En la barra de estado de Windows Se abrirá una pantalla negra y
damos clic en la lupa y buscamos escribirnos python –versión, en donde
“cmd” y abrimos. aparecerá la versión instalada.
Entorno de Desarrollo Integrado (IDE)
• Eclipse + Pydev
• Pycharm
• Sublime Text
• Vim
• GNU/Emacs
• Atom/Atom-IDE
• Spyder
• Thonny
Anaconda
• https://www.anaconda.com/
Instalando anaconda
Esperamos a que se descargue el Se abrirá el instalador, le damos clic en
programa. Next.
Archivo IPYNB
• IPython Notebook
Librería
Las librerías de programación son conjuntos de
archivos de código que se utilizan para
desarrollar software. Su objetivo es facilitar la
programación, al proporcionar funcionalidades
comunes, que ya han sido resueltas previamente
por otros programadores.
JigSawPlanet AD 09
https://www.jigsawplanet.com/?rc=play&pid=33374dd06006
Pandas
Librería de código abierto dentro de los
desarrolladores de Python, y sobre todo dentro
del ámbito de Data Science y Machine Learning,
ya que ofrece unas estructuras muy poderosas y
flexibles que facilitan la manipulación y
tratamiento de datos.
Dado que vivimos en un mundo en el que los datos son de muy distintas categorías, Pandas se realizó con
el objetivo de poder tratar con el mayor número posible de casuísticas entre tipos de datos. Es muy
simple cargar datos desde diferentes tipos de archivos (csv, json, html, etc.), así como guardarlos.
A continuación, se mostrará un ejemplo de cómo cargar datos desde un .txt:
Ejecutar por primera
vez en Jupyter
Cuando ejecutes por primera vez
en Jupyter aparecerá esta
pantalla. Le das Run.
Elegir la
opción de
propiedades.
Instalación
GD Obtener Datos
Get Data Tablas de Excel, PDF, Base de datos, Fuentes WEB. Servicio en Línea, etc.
DP Preparación de Datos
Data Preparation De la información obtenida – Limpiar y organizar en Query Editor
DM Modelado de Datos
Data Modeling Crear estructuras de (modelos) que permitan relacionar datos.
DV Visualización de Datos
Data Visualization Representación de datos en forma de gráficos, matrices y otras visualizaciones.
DR Reporteo de Datos
Data Reporting Estructura y formato de visualizaciones y elementos que darán lugar al reporte
Consideraciones
• Pueden existir proyectos en donde una o más fases no sean necesarios. Ejemplo:
Una tabla con la estructura adecuada pudiera ser que no requiera preparación ni
modelado de datos
GD DP DM DV DR
• Las fases no son secuenciales, son iterativas. En cada reporte que realicemos
vamos a estar pasando de una fase a otra, sin importar su frecuencia de uso, ni
orden.
GD DR DV DM …
Escenario de Cuentas por
Pagar
El Duende Tremendín SA de CV
Filtros
Rango de fecha
Tipo de plazo de
de aplicación de
proveedor
orden de pago
Nombre
Cuenta Bancaria
Proveedor
Tabla
Campos a contener:
• Clave OP
• Fecha Aplicación
• Fecha Vencimiento
• Fecha Pago
• Diferencia entre Fecha Vencimiento y Fecha Pago
• Número Proveedor
• Nombre Proveedor
• Plazo
• Total
• Pagado
• Pago
• Cuenta Bancaria
Indicadores
Los indicadores a tomar en cuenta son:
• Número de Proveedor
• Proveedores con RFC Genérico
• Proveedores sin RFC Genérico
• Proveedores sin Teléfono 1
• Proveedores sin Teléfono 2
• Proveedores sin Celular
• Proveedores sin Correo Electrónico
• Conteo de órdenes de pago
• Conteo de Pagos
• Pagos realizados a tiempo
• Pagos realizados a destiempo
• Promedio de Plazo
• Promedio de Pagos
• Promedio de OP
• Total importe Pagos
Cuadro de Mando
Gráficos a realizar:
Importe de Importe de
pagos por pagos por plazo
cuenta bancaria a tiempo
Importe de Importe de
órdenes de pagos por plazo
pago por plazo a destiempo
¡GRACIAS!
“Doy gracias a mis estudiantes que me hacen feliz, ustedes son
los encantadores jardineros que hacen florecer mi alma”.
(Margaret Fuller / Milton Carlos)