0% encontró este documento útil (0 votos)

114 vistas

Challenge Data Analytics Con Python

Este documento describe un desafío de análisis de datos con Python. El objetivo es crear un proyecto que consuma datos de tres fuentes para popular una base de datos SQL con información cultural sobre bibliotecas, museos y salas de cine argentinos. Se detallan los requisitos funcionales y técnicos, incluyendo la obtención y procesamiento de datos, la creación de tablas en la base de datos PostgreSQL y la actualización periódica de los datos. Los criterios de evaluación incluyen buenas prácticas de codificación, coment

Cargado por

Leandro Gabriel Kategora

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

114 vistas

Challenge Data Analytics Con Python

Cargado por

Leandro Gabriel Kategora

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 4

Challenge Data Analytics - Python

¡Te damos la bienvenida al Challenge de Data Analytics con Python!

🚀
En este documento podrás ver todos los detalles del proyecto que deberás realizar
para ingresar a la aceleración.

¿Estás list@? ¡Empecemos! 🏁

Objetivo 👈
Para resolver este challenge, deberás crear un proyecto que consuma datos desde
3 fuentes distintas para popular una base de datos SQL con información cultural
sobre bibliotecas, museos y salas de cines argentinos.

Requerimientos funcionales 🔎
Tu proyecto deberá cumplir con una serie de requerimientos funcionales que giran
en torno a cuatro ejes centrales: los archivos fuente, el procesamiento de datos, la
creación de tablas en la base de datos y la actualización de la base de datos.
Veamos cada uno de ellos en detalle.

Archivos fuente
Los archivos fuentes serán utilizados en tu proyecto para obtener de ellos todo lo
necesario para popular la base de datos. El proyecto deberá:

● Obtener los 3 archivos de fuente utilizando la librería requests y

almacenarse en forma local (Ten en cuenta que las urls pueden cambiar en
un futuro):
o Datos Argentina - Museos
o Datos Argentina - Salas de Cine
o Datos Argentina - Bibliotecas Populares

● Organizar los archivos en rutas siguiendo la siguiente estructura:

“categoría\año-mes\categoria-dia-mes-año.csv”
○ Por ejemplo: “museos\2021-noviembre\museos-03-11-2021”
○ Si el archivo existe debe reemplazarse. La fecha de la nomenclatura
es la fecha de descarga.

Procesamiento de datos
El procesamiento de datos permitirá a nuestro proyecto transformar los datos de los
archivos fuente en la información que va a nutrir la base de datos. Para esto, el
proyecto deberá:
● Normalizar toda la información de Museos, Salas de Cine y Bibliotecas
Populares, para crear una única tabla que contenga:
o cod_localidad
o id_provincia
o id_departamento
o categoría
o provincia
o localidad
o nombre
o domicilio
o código postal
o número de teléfono
o mail
o web

● Procesar los datos conjuntos para poder generar una tabla con la siguiente
información:
o Cantidad de registros totales por categoría
o Cantidad de registros totales por fuente
o Cantidad de registros por provincia y categoría
● Procesar la información de cines para poder crear una tabla que contenga:
o Provincia
o Cantidad de pantallas
o Cantidad de butacas
o Cantidad de espacios INCAA

Creación de tablas en la Base de datos

Para disponibilizar la información obtenida y procesada en los pasos previos, tu

proyecto deberá tener una base de datos que cumpla con los siguientes requisitos:

● La base de datos debe ser PostgreSQL

● Se deben crear los scripts .sql para la creación de las tablas.
● Se debe crear un script .py que ejecute los scripts .sql para facilitar el deploy.
● Los datos de la conexión deben poder configurarse fácilmente para facilitar
el deploy en un nuevo ambiente de ser necesario.

Actualización de la base de datos

Luego de normalizar la información y generar las demás tablas, las mismas se
deben actualizar en la base de datos. Para eso, es importante tener en cuenta que:

● Todos los registros existentes deben ser reemplazados por la nueva

información.
● Dentro de cada tabla debe indicarse en una columna adicional la fecha de
carga.
● Los registros para los cuales la fuente no brinda información deben cargarse
como nulos.

Requerimientos técnicos 🔧
Tu aplicación deberá cumplir con una serie de requerimientos técnicos que giran en
torno a 7 ejes centrales. Veamos cada uno de ellos en detalle.

Ejecución
La descarga, procesamiento y actualización de la información en la base de datos
se debe poder ejecutar desde un archivo .py

Deploy
El proyecto debe poder deployarse en forma sencilla siguiendo un readme, que al
menos contenga las instrucciones para:

● Utilizarse creando un entorno virtual (venv)

● Instalar las dependencias necesarias con pip.

● Configurar la conexión a la base de datos.

Configuración
Las configuraciones necesarias para que el proyecto se ejecute deben poder
configurarse desde un archivo. env, .ini o similar con la librería Python-decouple.

Logs
El programa debe crear logs oportunos sobre la ejecución del mismo con la librería
Logging.

Bases de datos
Se deben dejar disponibles los scripts de creación de las tablas utilizadas.

Conexión a la base de datos

● Los datos se deben almacenar en una base PostgreSQL
● La conexión a la base de datos se debe implementar con la librería y ORM
SQLalchemy.
● Se recomienda ver la funcionalidad de pandas dataframe.to_sql

Herramientas para el procesamiento de datos

Utilizar la librería Pandas para procesar todos los datos que sean necesarios.
Criterios a evaluar ☑️
A la hora de evaluar tu challenge, tendremos en cuenta una serie de criterios que
nos permitirán analizar con mayor detalle el producto alcanzado. Estos son:

● Implementación de buenas prácticas de codificación y estilo de código

(según PEP8).
● Comentarios oportunos y docstrings descriptivos.
● Manejo de excepciones preciso, no azaroso.
● La estructura del proyecto debe ser limpia y ordenada.
● El código deberá estar modularizado en componentes reutilizables e
independientes.

También podría gustarte

Tarea Fin de Curso
0% (1)
Tarea Fin de Curso
2 páginas
Modelo ACM Oliver Puente Dizalo
Aún no hay calificaciones
Modelo ACM Oliver Puente Dizalo
7 páginas
Informe Tecnico de Proyeccion UTI-Estado Situacional de Computadoras Por Area - 2021
Aún no hay calificaciones
Informe Tecnico de Proyeccion UTI-Estado Situacional de Computadoras Por Area - 2021
11 páginas
Clase 03 - Guión de Clase
Aún no hay calificaciones
Clase 03 - Guión de Clase
10 páginas
Codigo
Aún no hay calificaciones
Codigo
3 páginas
Clase 3 - Introducción A La Programación Python (Parte II)
Aún no hay calificaciones
Clase 3 - Introducción A La Programación Python (Parte II)
39 páginas
Utilitarios
100% (1)
Utilitarios
3 páginas
Lista de Precios A Publico Octubre 2023
Aún no hay calificaciones
Lista de Precios A Publico Octubre 2023
6 páginas
8 - Plan de Prueba 2 - 2
Aún no hay calificaciones
8 - Plan de Prueba 2 - 2
34 páginas
Taller Big Data
100% (1)
Taller Big Data
6 páginas
3 - Ciclo de Desarrollo de Software 2 - 2 (01-03)
Aún no hay calificaciones
3 - Ciclo de Desarrollo de Software 2 - 2 (01-03)
9 páginas
Clase 01 - Conceptos Generales - Sintaxis y Variables
Aún no hay calificaciones
Clase 01 - Conceptos Generales - Sintaxis y Variables
70 páginas
Challenge Backend - Java Spring Boot (API)
Aún no hay calificaciones
Challenge Backend - Java Spring Boot (API)
4 páginas
Python QT
100% (1)
Python QT
13 páginas
Análisis de Sentimientos Con Python (Parte 1)
Aún no hay calificaciones
Análisis de Sentimientos Con Python (Parte 1)
5 páginas
Robot Structural Avanzado
Aún no hay calificaciones
Robot Structural Avanzado
1 página
Proyecto Individual Evaluado Por Pares - Propuesta de Proyecto
Aún no hay calificaciones
Proyecto Individual Evaluado Por Pares - Propuesta de Proyecto
5 páginas
Ejemplo Etabs
Aún no hay calificaciones
Ejemplo Etabs
15 páginas
Buyer Persona-SketchLab-2
Aún no hay calificaciones
Buyer Persona-SketchLab-2
26 páginas
Curso Virtual Diseño de Edificaciones de Concreto Reforzado Utilizando Cype
Aún no hay calificaciones
Curso Virtual Diseño de Edificaciones de Concreto Reforzado Utilizando Cype
4 páginas
Manual
50% (2)
Manual
522 páginas
DISEÑO DE BOX-COULVERT DE 2.0 X 1 07 de Octubre
Aún no hay calificaciones
DISEÑO DE BOX-COULVERT DE 2.0 X 1 07 de Octubre
5 páginas
Capitulo1 Introduccion
Aún no hay calificaciones
Capitulo1 Introduccion
17 páginas
Apuntes de Concreto Armado
Aún no hay calificaciones
Apuntes de Concreto Armado
5 páginas
LTS-18-02-0440 (RCB-Analysis)
Aún no hay calificaciones
LTS-18-02-0440 (RCB-Analysis)
10 páginas
Manual de PSPP
Aún no hay calificaciones
Manual de PSPP
15 páginas
Manual User RPL HP 50g Segunda Edicion
100% (3)
Manual User RPL HP 50g Segunda Edicion
197 páginas
Libro Arquitectura Java JPA (Domain Driven Design)
100% (1)
Libro Arquitectura Java JPA (Domain Driven Design)
3 páginas
QA2 Concepto de Casos de Pruebas
Aún no hay calificaciones
QA2 Concepto de Casos de Pruebas
24 páginas
2 - Viga en Voladizo en Abaqus - En.es
Aún no hay calificaciones
2 - Viga en Voladizo en Abaqus - En.es
50 páginas
MATRIZ EXCEL Entrevistas 3
Aún no hay calificaciones
MATRIZ EXCEL Entrevistas 3
14 páginas
Manual Sobre El Diseño de Un Sistema Distribuido - Uso Router - Tres Zonas Geograficas Distantes Usando Packet Tracer 7.3
Aún no hay calificaciones
Manual Sobre El Diseño de Un Sistema Distribuido - Uso Router - Tres Zonas Geograficas Distantes Usando Packet Tracer 7.3
74 páginas
Clase 1 - ¿Qué Es El Testing
Aún no hay calificaciones
Clase 1 - ¿Qué Es El Testing
86 páginas
Seminarrcb Pan
Aún no hay calificaciones
Seminarrcb Pan
54 páginas
Guía de Referencia de Pandas
Aún no hay calificaciones
Guía de Referencia de Pandas
2 páginas
Manual LNXSG SistemasUNI PDF
Aún no hay calificaciones
Manual LNXSG SistemasUNI PDF
107 páginas
Escanear Discos Duros Dañados
Aún no hay calificaciones
Escanear Discos Duros Dañados
10 páginas
35 - Master Test Plan y Release Test Plan
Aún no hay calificaciones
35 - Master Test Plan y Release Test Plan
16 páginas
7 - Plan de Prueba 1 - 2
100% (1)
7 - Plan de Prueba 1 - 2
27 páginas
Plantilla Excel para El Control Horario y Fichaje
Aún no hay calificaciones
Plantilla Excel para El Control Horario y Fichaje
14 páginas
Prospectiva de La Tecnología en La Construcción de Edificaciones
Aún no hay calificaciones
Prospectiva de La Tecnología en La Construcción de Edificaciones
74 páginas
Las Herramientas de Big Data
Aún no hay calificaciones
Las Herramientas de Big Data
5 páginas
Programa de Gobierno Didier Blanco - Ibagué Es Mia - Alcaldía de Ibagué Elecciones 2023 Web2
0% (1)
Programa de Gobierno Didier Blanco - Ibagué Es Mia - Alcaldía de Ibagué Elecciones 2023 Web2
33 páginas
Catalago de Royal Prestige
Aún no hay calificaciones
Catalago de Royal Prestige
33 páginas
Estructurasvi 1
Aún no hay calificaciones
Estructurasvi 1
42 páginas
Base de Datos
50% (2)
Base de Datos
32 páginas
Tutorial 4 Plantilla de Base de Datos Excel El Tío Tech
Aún no hay calificaciones
Tutorial 4 Plantilla de Base de Datos Excel El Tío Tech
9 páginas
c5 Redes Neuronales
Aún no hay calificaciones
c5 Redes Neuronales
28 páginas
Plan de Medios Volkswagen Espol
100% (1)
Plan de Medios Volkswagen Espol
46 páginas
BrochureRevitPuentes
100% (1)
BrochureRevitPuentes
5 páginas
05 Modelado de Sólidos
Aún no hay calificaciones
05 Modelado de Sólidos
26 páginas
Taller Mongo DB
Aún no hay calificaciones
Taller Mongo DB
25 páginas
Proyecto Kardex SQLite
Aún no hay calificaciones
Proyecto Kardex SQLite
2 páginas
Taller 1.2 Python
Aún no hay calificaciones
Taller 1.2 Python
3 páginas
Obligatorio Big Data
Aún no hay calificaciones
Obligatorio Big Data
23 páginas
CV Augusto Makin-1
Aún no hay calificaciones
CV Augusto Makin-1
2 páginas
Laboratorio #3 - Python Avanzado
Aún no hay calificaciones
Laboratorio #3 - Python Avanzado
16 páginas
Actividad 2
Aún no hay calificaciones
Actividad 2
26 páginas
Examen2 2023
Aún no hay calificaciones
Examen2 2023
2 páginas
Obligatorio Big Data
Aún no hay calificaciones
Obligatorio Big Data
23 páginas
Prueba - Python para El Análisis de Datos
100% (1)
Prueba - Python para El Análisis de Datos
3 páginas
Enviar Mensajes de WhatsApp Con Python - Analytics Lane
Aún no hay calificaciones
Enviar Mensajes de WhatsApp Con Python - Analytics Lane
15 páginas
Catalogo Love 1-9-2021
Aún no hay calificaciones
Catalogo Love 1-9-2021
100 páginas
Error Al Crear Foreign Key en MySQL Workbench - Stack Overflow en Español
Aún no hay calificaciones
Error Al Crear Foreign Key en MySQL Workbench - Stack Overflow en Español
3 páginas
Cómo Hacer Un CV Harvard Curriculum Vitae
Aún no hay calificaciones
Cómo Hacer Un CV Harvard Curriculum Vitae
3 páginas
Combinar Dos Columnas de Texto en DataFrame en Pandas - Delft Stack
Aún no hay calificaciones
Combinar Dos Columnas de Texto en DataFrame en Pandas - Delft Stack
5 páginas
Funciones Matematicas para Data Science e Inteligencia Artificial
Aún no hay calificaciones
Funciones Matematicas para Data Science e Inteligencia Artificial
62 páginas
Entel One Funcionalidades
Aún no hay calificaciones
Entel One Funcionalidades
5 páginas
Exposición SQLite
Aún no hay calificaciones
Exposición SQLite
8 páginas
Caso 1 Personal Candidate - Selección - Monday
Aún no hay calificaciones
Caso 1 Personal Candidate - Selección - Monday
9 páginas
Evidencia 3 Documento Paralelo Clases de Documentos
Aún no hay calificaciones
Evidencia 3 Documento Paralelo Clases de Documentos
3 páginas
DFD y Diccionario de Datos.
Aún no hay calificaciones
DFD y Diccionario de Datos.
22 páginas
Ejemplo de JPA (Java Persistence API)
Aún no hay calificaciones
Ejemplo de JPA (Java Persistence API)
10 páginas
Guia 1
Aún no hay calificaciones
Guia 1
8 páginas
Repta 5 Ejemplo1
Aún no hay calificaciones
Repta 5 Ejemplo1
2 páginas
Formulario de Registro de Asignaturas Ing. de Sistemas P51
Aún no hay calificaciones
Formulario de Registro de Asignaturas Ing. de Sistemas P51
8 páginas
Tecnologia e Informatic1
Aún no hay calificaciones
Tecnologia e Informatic1
16 páginas
¿Cómo Se Accede A Una Base de Datos SQL en WinCC Flexible o WinCC (TIA Portal) Con ..
Aún no hay calificaciones
¿Cómo Se Accede A Una Base de Datos SQL en WinCC Flexible o WinCC (TIA Portal) Con ..
10 páginas
Díaz Vílchez Joseph Alfredo
Aún no hay calificaciones
Díaz Vílchez Joseph Alfredo
57 páginas
Cuestionario Unidad 3
Aún no hay calificaciones
Cuestionario Unidad 3
6 páginas
Entrevista A Un Administrador de Base de Datos
Aún no hay calificaciones
Entrevista A Un Administrador de Base de Datos
5 páginas
Cotizacion Sistema StarConta - Jaime
Aún no hay calificaciones
Cotizacion Sistema StarConta - Jaime
2 páginas
Informátiva Forense
Aún no hay calificaciones
Informátiva Forense
9 páginas
Comandos para SOM T7
Aún no hay calificaciones
Comandos para SOM T7
3 páginas
Práctica 7
Aún no hay calificaciones
Práctica 7
19 páginas
Procedimiento de Respaldo y Recuperacion de Datos
100% (1)
Procedimiento de Respaldo y Recuperacion de Datos
5 páginas
Procesos y Procesadores en Sistemas Distribuidos
Aún no hay calificaciones
Procesos y Procesadores en Sistemas Distribuidos
14 páginas
Examen para Sistemas Distribuidos
Aún no hay calificaciones
Examen para Sistemas Distribuidos
19 páginas
EJERCICIO 1 TERMINADO
Aún no hay calificaciones
EJERCICIO 1 TERMINADO
3 páginas
Persistencia de Datos
Aún no hay calificaciones
Persistencia de Datos
16 páginas
Las Buenas Prácticas de La Seguridad de La Información
Aún no hay calificaciones
Las Buenas Prácticas de La Seguridad de La Información
4 páginas
MYSQL v PostgreSQL
Aún no hay calificaciones
MYSQL v PostgreSQL
8 páginas
Test3 Analítica Digital
Aún no hay calificaciones
Test3 Analítica Digital
5 páginas
Webinar Gratuito: Nikto para Pentesting
Aún no hay calificaciones
Webinar Gratuito: Nikto para Pentesting
10 páginas
Actividad1 Levantamiento Diseno Logico Red Datos
Aún no hay calificaciones
Actividad1 Levantamiento Diseno Logico Red Datos
3 páginas
INFORME XXXX 2023 MINEDU VMGI PRONIED OGAD UABAS CEPM
Aún no hay calificaciones
INFORME XXXX 2023 MINEDU VMGI PRONIED OGAD UABAS CEPM
19 páginas