Almacenes de Datos Parte 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 68

Almacenes de Datos

Cuarto Semestre
Licenciado en Administración
MTI Milton Carlos González
Guerrero
[email protected]
Ejercicio

Se le pide al encargado de cuentas por pagar que haga un análisis de las


carteras de cuenta por pagar, específicamente de las órdenes de pago
generadas en el primer semestre del año 2022 con sus respectivo pagos
por transferencia bancaria.

Esto porque el dueño de la empresa se enfrentó con la sorpresa de que


varios proveedores habían decidido ya no venderles e incluso unos
limitaron o cortaron el crédito que les daban.

Esto molesto al dueño y quiere una respuesta clara y verídica por parte
del encargado del departamento (CXP).
Ejercicio

Para eso, el encargado de CXP tiene que obtener la información del


sistema donde se registran las operaciones para poder cargarla en
Power BI y generar los escenarios correspondientes solicitados por el
dueño de la empresa y encontrar el motivo del actuar de los proveedores.

El know-how de como hacer los indicadores lo tiene el encargado de


CXP, sin embargo la información se la puede dar sistemas a través de
archivos planos separados por coma.
Ejercicio

El encargo de sistemas solicita al de CXP que mande una relación de como


quiere los archivos para que se los pueda proveer.

1. El encargado de CXP tiene que (primer parcial):


Generar el modelo entidad – relación.
Generar el modelo relacional.
2. Para que el de sistemas pueda:
Generar los archivos con la información solicitada.
3. Al final el encargado de CXP pueda (segundo parcial):
Realizar el proceso de ETL (Python).
Realizar los escenarios.
Ejercicio

El encargado de cuentas por pagar se da cuenta que el tiempo lo tiene


limitado y si se pone a hacerlo en Excel tardará mucho tiempo y es un
trabajo que le estarán solicitando constantemente y será horas, días,
semanas de inversión de tiempo.

Le gustaría saber si hay alguna forma de procesar el almacén de datos


que será proveído por el encargado de sistemas.

Es aquí donde ponemos manos a la obra.


Ingeniería de
Datos
Fase 3
Python
• Python es un lenguaje de programación potente y fácil de aprender.
• Apareció en 1991 creado por Guido van Rossum.
• El nombre del lenguaje proviene de la afición de su creador por los humoristas
británicos Monty Python.
• Tiene estructuras de datos de alto nivel eficientes y un simple pero efectivo sistema
de programación orientado a objetos.
• La elegante sintaxis de Python y su tipado dinámico, junto a su naturaleza
interpretada lo convierten en un lenguaje ideal para scripting y desarrollo rápido de
aplicaciones en muchas áreas, para la mayoría de plataformas.
Lenguaje más popular

https://www.tiobe.com/tiobe-index/
Ambiente On Premise: Suite
Anaconda con Jupyter
Método 1 cuando vas a hacer todo sin tener Internet
Instalar Python

https://www.python.org/
Ir a la página web de python y darle clic en descargas – downloads.
Dar clic en Download Python + la versión.
Instalar Python
Comenzará a descargarse. Al descargarse, buscamos el
archivo, lo seleccionamos, damos clic con el botón
derecho y seleccionamos ejecutar como administrador. Elegimos Install Now.
Instalar Python
Te dirá que la instalación fue
Empezará a instalarse. exitosa. Damos clic en close.
Instalar Python
En la barra de estado de Windows Se abrirá una pantalla negra y
damos clic en la lupa y buscamos escribirnos python –versión, en donde
“cmd” y abrimos. aparecerá la versión instalada.
Entorno de Desarrollo Integrado (IDE)

• Es una aplicación informática que proporciona servicios integrales


para facilitarle al desarrollador o programador el desarrollo de
software.
• Aunque existen muchos entornos de desarrollo para Python,
usaremos la distribución anaconda y el entorno Jupyter.
• Aunque el estudiante tiene la libertad de usar cualquier otro que le
agrade.
Entorno de
Desarrollo
Integrado
(IDE)
Entornos de programación para
Python
Entornos de desarrollo para Python

• Eclipse + Pydev
• Pycharm
• Sublime Text
• Vim
• GNU/Emacs
• Atom/Atom-IDE
• Spyder
• Thonny
Anaconda

• Es una distribución libre y abierta​ de los lenguajes


Python y R, utilizada en ciencia de datos, y aprendizaje
automático (machine learning). Esto incluye procesamiento
de grandes volúmenes de información, análisis predictivo y
cómputos científicos. Está orientado a simplificar el
despliegue y administración de los paquetes de software.

• La distribución Anaconda es utilizada por 6 millones de


usuarios e incluye más de 250 paquetes de ciencia de datos
válidos para Windows, Linux y MacOS.
Instalando ambiente anaconda

• https://www.anaconda.com/
Instalando anaconda
Esperamos a que se descargue el Se abrirá el instalador, le damos clic en
programa. Next.

Una vez descargado, lo buscamos, lo


seleccionamos y le damos clic con el
botón derecho de mouse, seleccionando
ejecutar como administrador.
Instalando anaconda
Aceptamos el acuerdo de licencia dando Seleccionamos el tipo de instalación Just
clic en I Agree. Me y luego damos clic en Next.
Instalando anaconda
Dejamos por default la ubicación de Así deberán estar las opciones
donde instalará el programa y damos clic seleccionadas y luego damos Install.
en Next.
Instalando anaconda
Empezará la instalación. Hay que ser Al estar completado “Completed”, damos
pacientes porque puede llevar varios clic en Next.
minutos.
Instalando anaconda
Damos clic en siguiente. Deseleccionamos los check box y damos
Finish y con eso habremos terminado.
Instalando anaconda
En la computadora, en la barra de estado Aparecerá la imagen de Anaconda
de Windows, buscamos Anaconda. diciendo que se está inicializando.
Así lucirá Anaconda
Nos vamos a Enviroments, verificando que
esté seleccionado installed, buscamos
pandas para ver si está instalado.
Menti 12 AD
https://www.mentimeter.com/app/folder/1821272
Jupyter
Minimizamos anaconda y nos vamos a la Aparecerá la siguiente pantalla para
barra de estado y ahora buscamos el IDE indicar que se está ejecutando jupyter y
Jupyter. Abrimos. abrirá el navegador para que lo puedas
usar.
Así lucirá la pantalla de Jupyter
Jupyter
El Proyecto Jupyter es una organización sin ánimo de lucro creada
para "desarrollar software de código abierto, estándares abiertos y
servicios para computación interactiva en docenas de lenguajes de
programación". Creado en 2014 por Fernando Pérez, el proyecto
Jupyter soporta entornos de ejecución en varias docenas de
lenguajes de programación.

El nombre del proyecto Jupyter es una referencia a los tres


lenguajes de programación principales soportados por Jupyter, que
son Julia, Python y R, y también un homenaje a los cuadernos de
Galileo que registran el descubrimiento de los satélites de Júpiter.
El proyecto Jupyter ha desarrollado y respaldado los productos de
computación interactiva Jupyter Notebook, JupyterHub y
JupyterLab.
Nos ubicamos en la carpeta en donde
están las interfaces
Jupyter
Nos vamos a New y seleccionamos en la A partir de aquí ya podemos interactuar
sección de Notebook -> Python 3 con nuestros archivos.
(ipykernel).
Ambiente On Cloud: Suite
Google Colab con Jupyter
Método 2 cuando no quieres instalar nada en tu computadora y todo lo
quieres hacer desde Internet
Google Colab
Colaboratory, o "Colab" para abreviar, es https://colab.research.google.com/
un producto de Google Research. Permite
a cualquier usuario escribir y ejecutar
código arbitrario de Python en el
navegador.

Es especialmente adecuado para tareas


de aprendizaje automático, análisis de
datos y educación.

Desde un punto de vista más técnico,


Colab es un servicio de cuaderno alojado
de Jupyter que no requiere configuración
y que ofrece acceso sin coste adicional a
recursos informáticos.
• Un archivo con la extensión .ipynb es un archivo de Jupyter Notebook que
contiene todo el contenido de Notebook creado con la sesión de la aplicación
web de Jupyter Notebook.

Archivo IPYNB
• IPython Notebook
Librería
Las librerías de programación son conjuntos de
archivos de código que se utilizan para
desarrollar software. Su objetivo es facilitar la
programación, al proporcionar funcionalidades
comunes, que ya han sido resueltas previamente
por otros programadores.

JigSawPlanet AD 09
https://www.jigsawplanet.com/?rc=play&pid=33374dd06006
Pandas
Librería de código abierto dentro de los
desarrolladores de Python, y sobre todo dentro
del ámbito de Data Science y Machine Learning,
ya que ofrece unas estructuras muy poderosas y
flexibles que facilitan la manipulación y
tratamiento de datos.

Creada por Wes McKinney, que es un


desarrollador y empresario de software
estadounidense que creció en Akron, Ohio. Es
autor del famoso libro “Python por Data Analysis”.
Estructuras de Pandas
Pandas surgió como necesidad de aunar en una Las dos estructuras de datos principales dentro
única librería todo lo necesario para que un del paquete Pandas son:
analista de datos pudiese tener en una misma
Series: array unidimensional etiquetado capaz de
herramienta todas las funcionalidades que
almacenar cualquier tipo de dato.
necesitaba en su día a día, como son: cargar
datos, modelar, analizar, manipular y prepararlos. DataFrame: estructura bidimensional con
columnas que pueden ser también de cualquier
tipo. Estas columnas son a su vez Series.
Cargar archivo en Pandas

Dado que vivimos en un mundo en el que los datos son de muy distintas categorías, Pandas se realizó con
el objetivo de poder tratar con el mayor número posible de casuísticas entre tipos de datos. Es muy
simple cargar datos desde diferentes tipos de archivos (csv, json, html, etc.), así como guardarlos.
A continuación, se mostrará un ejemplo de cómo cargar datos desde un .txt:
Ejecutar por primera
vez en Jupyter
Cuando ejecutes por primera vez
en Jupyter aparecerá esta
pantalla. Le das Run.

Esto solo te aparecerá la primera


vez.
Menti 13 AD
https://www.mentimeter.com/app/folder/1821272
Menti 14 AD
https://www.mentimeter.com/app/folder/1821272
Menti 15 AD
https://www.mentimeter.com/app/folder/1821272
Menti 16 AD
https://www.mentimeter.com/app/folder/1821272
Ingeniería de datos
usando Python y
Visualización de Datos
Fase 4
¿Qué es Power
BI?
Es una herramienta de visualización
de datos creada por Microsoft.

Funciones o propósitos principales:


➢ Transformación y extracción de
datos valiosos.
➢ Crear dashboards interactivos
con BI (Business Intelligence).
➢ Información y toma de decisiones
en cualquier momento.
➢ Power BI no es otro Excel: Ambos se complementan.
¿Qué no es ➢ Power BI no es especializado para informáticos: Es

Power BI? para cualquiera.


Instalación

Ir al explorador de archivos de tu máquina y darle botón derecho en la


parte del equipo.

Elegir la
opción de
propiedades.
Instalación

• Verificar el tipo de Sistema Operativo que se tiene.


Instalación

Entrar al siguiente link: https://powerbi.microsoft.com/es-es/desktop/


Elegir “Consulte las opciones de descarga e idiomas disponibles”
Instalación

Elegir el idioma y seleccionar descargar:


Instalación

• Al haber selecciona el idioma de nuestra preferencia nos indicará si queremos el


instalador de 64 bit o 32 bit. Seleccionar según el tipo de sistema que tengamos
en nuestro equipo y dar NEXT.
Instalación
El archivo se empezará a
descargar:
Instalación
• Ir a la carpeta en donde
se descargó el archivo,
darle clic con el botón
derecho y seleccionar
ejecutar como
administrador.
Elegir el idioma. Darle siguiente.
Aceptar los términos de licencia. Dar siguiente aceptando la ruta de instalación.
Damos clic en instalar. Se empezará a instalar el Power BI.
• Te notificará que la
instalación ha sido
completada y le damos
finalizar.
Fases del Power BI

GD Obtener Datos
Get Data Tablas de Excel, PDF, Base de datos, Fuentes WEB. Servicio en Línea, etc.

DP Preparación de Datos
Data Preparation De la información obtenida – Limpiar y organizar en Query Editor

DM Modelado de Datos
Data Modeling Crear estructuras de (modelos) que permitan relacionar datos.

DV Visualización de Datos
Data Visualization Representación de datos en forma de gráficos, matrices y otras visualizaciones.

DR Reporteo de Datos
Data Reporting Estructura y formato de visualizaciones y elementos que darán lugar al reporte
Consideraciones

• Pueden existir proyectos en donde una o más fases no sean necesarios. Ejemplo:
Una tabla con la estructura adecuada pudiera ser que no requiera preparación ni
modelado de datos

GD DP DM DV DR

• Las fases no son secuenciales, son iterativas. En cada reporte que realicemos
vamos a estar pasando de una fase a otra, sin importar su frecuencia de uso, ni
orden.

GD DR DV DM …
Escenario de Cuentas por
Pagar
El Duende Tremendín SA de CV
Filtros

En todos los escenarios los filtros deben ser:

Rango de fecha
Tipo de plazo de
de aplicación de
proveedor
orden de pago

Nombre
Cuenta Bancaria
Proveedor
Tabla
Campos a contener:
• Clave OP
• Fecha Aplicación
• Fecha Vencimiento
• Fecha Pago
• Diferencia entre Fecha Vencimiento y Fecha Pago
• Número Proveedor
• Nombre Proveedor
• Plazo
• Total
• Pagado
• Pago
• Cuenta Bancaria
Indicadores
Los indicadores a tomar en cuenta son:
• Número de Proveedor
• Proveedores con RFC Genérico
• Proveedores sin RFC Genérico
• Proveedores sin Teléfono 1
• Proveedores sin Teléfono 2
• Proveedores sin Celular
• Proveedores sin Correo Electrónico
• Conteo de órdenes de pago
• Conteo de Pagos
• Pagos realizados a tiempo
• Pagos realizados a destiempo
• Promedio de Plazo
• Promedio de Pagos
• Promedio de OP
• Total importe Pagos
Cuadro de Mando

Gráficos a realizar:

Importe de Importe de
pagos por pagos por plazo
cuenta bancaria a tiempo

Importe de Importe de
órdenes de pagos por plazo
pago por plazo a destiempo
¡GRACIAS!
“Doy gracias a mis estudiantes que me hacen feliz, ustedes son
los encantadores jardineros que hacen florecer mi alma”.
(Margaret Fuller / Milton Carlos)

También podría gustarte