DP 900
DP 900
DP 900
Inicio
Identificación de los formatos de datos.
Datos estructurados.
Se ajustan a un esquema fijo, todos los datos tienen los mismos campos o
prepiedades.
Datos semiestructurados.
Datos no estructurados
Documentos, imágenes, audio, video.
Almacenes de datos.
Usados para almacenar detalles de entidades, eventos u otra info de distinto
tipo.
JSON
Notación de objetos de JavaScript.
XML
BLOB
DP-900 1
Objeto binario grande. Datos binarios sin formato que las apps
deben interpretar. Imágenes, vídeo, audio y documentos.
Parquet: En columnas
Bases de datos.
Relacionales(SQL).
No relacionales(NoSQL.
Roles de trabajo:
Ingenieros de datos.
Analistas de datos.
Roles:
DP-900 2
Ingenieros: Infraestructura, integran datos, limpieza, transfieren y
transforman.
Servicios de datos:
Azure SQL:
Azure SQL Edge: motor optimizado para IoT, datos de serie temporal de
streaming
Contenedores de Blobs(binarios).
Tablas:
DP-900 3
Pipelines: AD factory.
SQL:
Azure Databricks:
HDInsight de Azure:
Microsoft Purview.
Datos relacionales:
SQL:
CREATE.
ALTER-
DROP.
RENAME.
DP-900 4
DCL: Lenguaje de control de datos.
Para administradores.
GRANT.
DENEGAR.
REVOKE.
SELECT.
INSERT.
UPDATE.
DELETE.
Descripción de objetos.
Blobs en bloques. Bloques de hasta 100 MB, 4,7 GB en total. Objetos que
cambian con poca frecuencia.
DP-900 5
Explorador de tablas de Azure.
Divide en particiones.
MongoDB
PostgreSQL:
Gran escalabilidad.
Table:
Cassandra:
Almacenamiento en familia de columnas.
Apache Gremlin:
DP-900 6
Lagos de datos: Datos de alto rendimiento, Spark o Hadoop, enfoque de
esquema en lectura semiestructurado o combinación con estructurados o no
estructurados.
Programas de Azure:
Diferencias:
Proveniente de:
DP-900 7
Azure IoT Hub.
Apache Kafka.
Recibido por:
Desktop:
Nube: + Limitado
Multidimensional.
Modelado analítico.
Visualización:
DP-900 8