0% encontró este documento útil (0 votos)

23 vistas28 páginas

Big Data Con Apache Spark y Python: de Cero A Experto

Cargado por

Luis Angel Alfonso Zamora

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

23 vistas28 páginas

Big Data Con Apache Spark y Python: de Cero A Experto

Cargado por

Luis Angel Alfonso Zamora

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 28

01/11/2022

Big Data con Apache Spark 3 y

Python: de cero a experto

Introducción a Apache Spark

1
01/11/2022

Apache Spark

Spark es una solución Big Data de código abierto. Desarrollado por el laboratorio RAD de UC Berkeley
(2009).
Se ha convertido en una herramienta
de referencia en el campo del Big Data.

Apache Spark vs MapReduce

Más fácil y rápida que Hadoop MapReduce.

Diferencias:
• Spark mucho más rápido al almacenar en caché los datos en la memoria vs MapReduce en
el disco duro (más lectura y escritura )
• Spark optimizado para un mejor paralelismo, utilización CPU e inicio más rápido
• Spark tiene modelo de programación funcional más rico
• Spark es especialmente útil para algoritmos iterativos

2
01/11/2022

Cómo se Spark en un clúster

Componentes de Spark

Spark contiene un ecosistema de herramientas muy completo.

3
01/11/2022

PySpark

PySpark es una biblioteca Spark escrita en Python para ejecutar la aplicación Python usando las
capacidades de Apache Spark.
Ventajas de PySpark:
• Fácil de aprender
• Amplio conjunto de librerías para ML y DS
• Gran apoyo de la comunidad

Arquitectura de PySpark

Apache Spark funciona en una arquitectura maestro-esclavo. Las operaciones se ejecutan en los
trabajadores, y el Cluster Manager administra los recursos.

4
01/11/2022

Tipos de administradores de clústeres

Spark admite los siguientes administradores de clústeres:

• Standalone : administrador de clúster simple
• Apache Mesos : es un administrador de clústeres que puede ejecutar también Hadoop
MapReduce y PySpark.
• Hadoop YARN : el administrador de recursos en Hadoop 2
• Kubernetes: para automatizar la implementación y administración de aplicaciones en
contenedores.

Instalación de Apache Spark

5
01/11/2022

Pasos para instalar Spark (1)

1. Descarga Spark de https://spark.apache.org/downloads.html

2. Modifica el log4j.properties.template pon en log4j.rootCategory=ERROR en vez de INFO.
3. Instala Anaconda de https://www.anaconda.com/
4. Descarga winutils.exe. Es un binario de Hadoop para Windows - del repositorio de GitHub de
https://github.com/steveloughran/winutils/ . Vaya a la versión de Hadoop correspondiente con la
distribución de Spark y busque winutils.exe en /bin.

1 4

Pasos para instalar Spark (2)

1. Si no tienes Java o la versión de Java es 7.x o menos, descargue e instale Java desde Oracle
https://www.oracle.com/java/technologies/downloads/
2. Descomprime Spark en C:\spark
3. Añade el winutils.exe descargado a una carpeta de winutils en C:. Debe quedar así:
C:\winutils\bin\winutils.exe.
4. Desde cmd ejecuta: “cd C:\winutils\bin” y después: winutils.exe chmod 777 \tmp\hive
5. Añade las variables de entorno:
• HADOOP_HOME -> C:\winutils
• SPARK_HOME -> C:\spark
• JAVA_HOME -> C:\jdk
• Path -> %SPARK_HOME%\bin
• Path -> %JAVA_HOME%\bin

6
01/11/2022

Validación de la instalación de Spark

1. Desde el prompt de Anaconda ejecuta: “cd C:\spark” y después “pyspark”. Deberías ver algo como
lo de la imagen 1.
2. Desde jupyter notebook instala findspark con “pip install findspark” y ejecuta el siguiente código.
import findspark
findspark.init()
import pyspark
sc = pyspark.SparkContext(appName="myAppName")
sc

1 2

RDDs de Apache Spark

7
01/11/2022

Apache Spark RDDs

Los RDD son los componentes básicos de cualquier aplicación Spark. RDD significa:
• Resiliente: es tolerante a fallos y es capaz de reconstruir datos en caso de fallo.
• Distribuido: los datos se distribuyen entre los múltiples nodos de un clúster.
• Conjunto de datos: colección de datos particionados con valores.

Operaciones en RDDs

Con los RDD, puede realizar dos tipos de operaciones:

• Transformaciones: estas operaciones se aplican para crear un nuevo RDD.
• Acciones: estas operaciones se aplican en un RDD para indicarle a Apache Spark que aplique el
cálculo y devuelva el resultado al controlador.

8
01/11/2022

DataFrames en Apache Spark

Introducción a DataFrames

Los DataFrames son de naturaleza tabular. Permiten varios formatos dentro de una misma tabla
(heterogéneos), mientras que cada variable suele tener valores con un único formato (homogéneos).
Similares a las tablas SQL o a las hojas de calculo.

9
01/11/2022

Ventajas de los DataFrames

Algunas de las ventajas de trabajar con Dataframes en Spark son:

• Capacidad de procesar una gran cantidad de datos estructurados o semiestructurados
• Fácil manejo de datos e imputación de valores faltantes
• Múltiples formatos como fuentes de datos
• Compatibilidad con múltiples lenguajes

Características de los DataFrames

Los DataFrames de Spark se caracterizan por: ser distribuidos, evaluación perezosa, inmutabilidad y
tolerancia a fallos.

10
01/11/2022

Fuentes de datos de DataFrames

Los marcos de datos en Pyspark se pueden crear de varias formas: a través de archivos, utilizando RDDs
o a través de bases de datos.

Funciones avanzadas de Spark

11
01/11/2022

Funciones avanzadas

Spark contiene numerosas funciones avanzadas para optimizar su rendimiento y realizar

transformaciones complejas en los datos. Algunas de ellas son: las expresiones de selectExpr(), UDF,
cache ( ), etc

Optimización del rendimiento

Una de las técnicas de optimización son los métodos cache() y persist(). Estos métodos se usan para
almacenar un calculo intermedio de un RDD, DataFrame y Dataset para que puedan reutilizarse en
acciones posteriores.

1 2

12
01/11/2022

Analítica avanzada con Spark

Funciones para analítica de datos

Para poder entrenar un modelo o realizar análisis estadísticos con nuestros datos son necesarias las
siguientes funciones y tareas:
• Generar una sesión de Spark
• Importar los datos y generar un esquema correcto
• Métodos para inspeccionar datos
• Transformación de datos y de columnas
• Lidiar con los valores faltantes
• Ejecutar consultas
• Visualización de datos

13
01/11/2022

Visualización de datos

PySpark es compatible con numerosas librerías de

visualización de datos de Python como seaborn,
matplotlib, bokehn, etc

Machine Learning con Spark

14
01/11/2022

Spark Machine Learning

Machine Learning: es la construcción de algoritmos que pueden aprender de los datos y hacer
predicciones sobre ellos.
Spark MLlib se usa para realizar aprendizaje automático en Apache Spark. MLlib consta de algoritmos y
funciones habituales.

Herramientas Spark Machine Learning

Herramientas de MLlib:
• spark.mllib contiene la API original construida sobre RDD
• spark.ml proporciona una API de nivel superior construida sobre DataFrames para construcción
de pipelines de ML. La API de ML principal.

Fuente: https://www.r-bloggers.com/

15
01/11/2022

Componentes Spark Machine Learning

Spark MLlib proporciona las siguientes herramientas:

• Algoritmos ML: Incluyen algoritmos de aprendizaje comunes como clasificación, regresión,
agrupamiento y filtrado colaborativo.
• Caracterización: Incluye: extracción, transformación,
reducción de dimensionalidad y selección de características.
• Pipelines: son herramientas para construir modelos de ML en
etapas.
• Persistencia: permite guardar y cargar algoritmos, modelos
y pipelines.
• Utilidades: para álgebra lineal, estadística y manejo de datos.

Proceso de Machine Learning

Fuente: https://www.r-bloggers.com/

16
01/11/2022

Ingeniería de características con Spark

Las técnicas de preprocesamiento de datos más utilizadas en los enfoques de Spark son las siguientes
• VectorAssembler
• Agrupamiento
• Escalado y normalización
• Trabajar con características categóricas
• Transformadores de datos de texto
• Manipulación de funciones
• PCA

Ingeniería de características con Spark

• Vector Asembler: Se utiliza básicamente para concatenar todas las características en un solo vector que se
puede pasar al estimador o al algoritmo ML
• Agrupamiento: es el método más sencillo para convertir las variables continuas en variables categóricas. Se
puede realizar con la clase Bucketizer.
• Escalado y normalización: es otra tarea común en variables continuas. Permite que los datos tengan una
distribución normal.
• MinMaxScaler y StandardScaler: estandarizan las características con una media cero y una desviación estándar
de 1.
• StringIndexer : para convertir características categóricas en
numéricas.

17
01/11/2022

Pipelines en PySpark

En los Pipelines (canalizaciones) las diferentes etapas del trabajo de aprendizaje automático se pueden
agrupar como una sola entidad y se pueden considerar como un flujo de trabajo ininterrumpido.
Cada etapa es un Transformador . Se ejecutan en secuencia y los datos de entrada se transforman
mientras pasan por cada etapa.

Apache Spark Koalas

18
01/11/2022

Introducción a Koalas

Koalas proporciona un reemplazo directo de Pandas, lo que permite un escalado eficiente a cientos de
nodos para la ciencia de datos y el Machine Learning.
Pandas no se escala a Big data.
PySpark DataFrame es más compatible con SQL y Koalas DataFrame está más cerca de Python

Koalas y PySpark DataFrames

Koalas y PySpark DataFrames son diferentes. Koalas DataFrames sigue la estructura de Pandas e
implementa un índice. El PySpark DataFrame es más compatible con las tablas en las bases de datos
relacionales y no tiene índices.
Koalas traduce las API de pandas al plan
lógico de Spark SQL.

19
01/11/2022

Ejemplo: Ingeniería de características con Koalas

En ciencia de datos a menudo se necesita la función de get_dummies( ) de pandas para codificar

variables categóricas como variables ficticias (numéricas).
Gracias a Koalas se puede hacer esto en Spark con solo unos pocos ajustes.

Pandas

Koalas

Ejemplo: Ingeniería de características con Koalas

En ciencia de datos a menudo se necesita trabajar con datos de tiempo. Pandas permite trabajar con
este tipo de datos de forma fácil, en PySpark es más complicado.

Pandas

Koalas

20
01/11/2022

Spark Streaming

Fundamentos Spark Streaming

PySpark Streaming es un sistema escalable y tolerante a fallos que sigue el paradigma de lotes RDD.
Opera en intervalos de lotes, recibiendo un flujo de datos de entrada continuo de fuentes como
Apache Flume , Kinesis, Kafka, sockets TCP, etc.
Spark Engine se encarga de procesarlos.

21
01/11/2022

Funcionamiento Spark Streaming

Spark Streaming recibe datos de varias fuentes y los agrupa en pequeños lotes (Dstreams) en un
intervalo de tiempo. El usuario puede definir el intervalo. Cada lote de entrada forma un RDD y se
procesa mediante trabajos de Spark para crear otros RDD.

Ejemplo: contar palabras

22
01/11/2022

Modos de salida

Spark usa varios modos de salida para almacenar los datos:

• Modo completo (Complete): toda la tabla se almacenará

• Modo de adición (Append): solo las nuevas filas del último proceso se alamcenará. Solo para
las consultas en las que no se espera que cambien las filas existentes.
• Modo de actualización (Update): solo las filas que se actualizaron desde el último proceso se
almacenarán. Este modo solo genera las filas que han cambiado desde el último proceso.Si la
consulta no contiene agregaciones, será equivalente al modo append.

Complete,
Append,
Update

Tipos de transformaciones

Para tolerancia a fallos los datos recibidos se copian en dos nodos y hay también un mecanismo
llamado checkpointing.
Las transformaciones se pueden agrupar en :
• sin estado: no depende de los datos
de lotes anteriores.
• con estado: utilizan datos
de lotes anteriores

23
01/11/2022

Capacidades de Spark Streaming

Databricks

24
01/11/2022

Introducción a Databricks

Databricks es la plataforma analítica de datos basada en Apache Spark desarrollada por los precursores de
Spark. Permite analítica avanzada, Big Data y ML de forma sencilla y colaborativa.
Disponible como servicio cloud en Azure, AWS y GCP.

Características de Databricks

Permite auto-escalar y dimensionar entornos de Spark de forma sencilla. Facilita los despliegues y se acelera la
instalación y configuración de los entornos.

25
01/11/2022

Arquitectura de Databricks

Databricks Community

Databricks community es la versión gratuita. Permite usar un pequeño clúster con recursos limitados y
notebooks no colaborativos. La versión de pago aumenta las capacidades.

26
01/11/2022

Terminología

Términos importantes que debemos conocer:

1. Workspaces
2. Notebooks
3. Librerías
4. Tablas
5. Clusters
6. Jobs

Delta Lake

Delta Lake es la capa de almacenamiento open source desarrollada para Spark y Databricks.
Proporciona transacciones ACID y gestión avanzada de metadatos.
Incluye un motor de consultas compatible con Spark que permite acelerar las operaciones y mejoran el
rendimiento. Los datos almacenados en formato Parquet.

27
01/11/2022

Recursos

Recursos:
• https://spark.apache.org/docs/2.2.0/index.html Documentación oficial de Spark
• https://colab.research.google.com/ Google Colab para poder tener capacidad de computo
adicional

También podría gustarte

SQL 400
Aún no hay calificaciones
SQL 400
31 páginas
Spark SQL
Aún no hay calificaciones
Spark SQL
21 páginas
Traducción BC360 Resumen Certificacion BASIS - Con Anotaciones Mias
0% (1)
Traducción BC360 Resumen Certificacion BASIS - Con Anotaciones Mias
435 páginas
Ecosistema Spark Intro
Aún no hay calificaciones
Ecosistema Spark Intro
87 páginas
Machine Learning Spark
Aún no hay calificaciones
Machine Learning Spark
65 páginas
Especificacion de Sistemas de Software en UML
Aún no hay calificaciones
Especificacion de Sistemas de Software en UML
172 páginas
Capacitacion Supexterno Registros Iniciales
Aún no hay calificaciones
Capacitacion Supexterno Registros Iniciales
29 páginas
Sesion 7 PDT Plame 2017
Aún no hay calificaciones
Sesion 7 PDT Plame 2017
25 páginas
Instalar Apache, MySQL, PHPMyAdmin Desde Shell en CentOS (Linux)
Aún no hay calificaciones
Instalar Apache, MySQL, PHPMyAdmin Desde Shell en CentOS (Linux)
27 páginas
Catalogo PL-SQL de Sistema Bancario
100% (1)
Catalogo PL-SQL de Sistema Bancario
23 páginas
Apache Spark-Alejandro Palomino
Aún no hay calificaciones
Apache Spark-Alejandro Palomino
54 páginas
1.1 Introducción A Spark
0% (1)
1.1 Introducción A Spark
23 páginas
Análisis de Datos Con Apache Spark
Aún no hay calificaciones
Análisis de Datos Con Apache Spark
66 páginas
Clases Abstractas e Interfaces
Aún no hay calificaciones
Clases Abstractas e Interfaces
30 páginas
Práctica Calificada 3 Base Datos F
100% (1)
Práctica Calificada 3 Base Datos F
6 páginas
Instalar Apache Spark en Windows 10
Aún no hay calificaciones
Instalar Apache Spark en Windows 10
16 páginas
Comando Cacls
Aún no hay calificaciones
Comando Cacls
9 páginas
Parcial Bases de Datos
0% (1)
Parcial Bases de Datos
10 páginas
Breve Resumen de Virus Informáticos
Aún no hay calificaciones
Breve Resumen de Virus Informáticos
14 páginas
Qué Es CentOS
Aún no hay calificaciones
Qué Es CentOS
7 páginas
3.1.1.PPT - Presentacion de Spark
Aún no hay calificaciones
3.1.1.PPT - Presentacion de Spark
16 páginas
Configuración Básica de Un Router
Aún no hay calificaciones
Configuración Básica de Un Router
6 páginas
Instalacion de Apache Starks
Aún no hay calificaciones
Instalacion de Apache Starks
13 páginas
PDF Definido
Aún no hay calificaciones
PDF Definido
25 páginas
7.spark SQL EAE
Aún no hay calificaciones
7.spark SQL EAE
68 páginas
TP 3 Grupal Seguridad Ofensiva 2023
Aún no hay calificaciones
TP 3 Grupal Seguridad Ofensiva 2023
7 páginas
Completar en Los Campos Diseñados El Tema Propuesto
Aún no hay calificaciones
Completar en Los Campos Diseñados El Tema Propuesto
9 páginas
Presentacion Curso Databricks
Aún no hay calificaciones
Presentacion Curso Databricks
27 páginas
Optimización de Consultas Tema - 2
Aún no hay calificaciones
Optimización de Consultas Tema - 2
44 páginas
Triggers MySQL
Aún no hay calificaciones
Triggers MySQL
6 páginas
Módulo 4 - Representación Gráfica de Procesos
Aún no hay calificaciones
Módulo 4 - Representación Gráfica de Procesos
91 páginas
Mod1 - Introducción Big Data y Python
Aún no hay calificaciones
Mod1 - Introducción Big Data y Python
9 páginas
Actividad 6. Investigación Spark
Aún no hay calificaciones
Actividad 6. Investigación Spark
9 páginas
ReleaseNote v17
Aún no hay calificaciones
ReleaseNote v17
62 páginas
Introduction To Spark - ES - Introduccion A Spark
Aún no hay calificaciones
Introduction To Spark - ES - Introduccion A Spark
53 páginas
Modulo 4 - Caso Practico B
Aún no hay calificaciones
Modulo 4 - Caso Practico B
4 páginas
SQL Intermedio
Aún no hay calificaciones
SQL Intermedio
8 páginas
2023.2-06a Aspectos Básicos de Spark
Aún no hay calificaciones
2023.2-06a Aspectos Básicos de Spark
27 páginas
Actividad 6. Investigación Spark
Aún no hay calificaciones
Actividad 6. Investigación Spark
9 páginas
Py Spark
Aún no hay calificaciones
Py Spark
32 páginas
Actividad4 S4U4 DPW
Aún no hay calificaciones
Actividad4 S4U4 DPW
4 páginas
Qué Es BigData - Estudio
Aún no hay calificaciones
Qué Es BigData - Estudio
4 páginas
Modelo de Informe Practica #15 - 2022
Aún no hay calificaciones
Modelo de Informe Practica #15 - 2022
16 páginas
Separata 04
Aún no hay calificaciones
Separata 04
23 páginas
Clase 4 - Herramientas Big Data Nov 15
Aún no hay calificaciones
Clase 4 - Herramientas Big Data Nov 15
31 páginas
Spark 2
Aún no hay calificaciones
Spark 2
46 páginas
Tema 4
Aún no hay calificaciones
Tema 4
38 páginas
Spark 1
Aún no hay calificaciones
Spark 1
44 páginas
Formato Cuadro de Controles
Aún no hay calificaciones
Formato Cuadro de Controles
2 páginas
Security Misconfiguration Informe
Aún no hay calificaciones
Security Misconfiguration Informe
11 páginas
Diseño Responsivo
Aún no hay calificaciones
Diseño Responsivo
3 páginas
Separata 05
Aún no hay calificaciones
Separata 05
25 páginas
Apache Spark - Elasticsearch-Apache storm-RSTUDIO
Aún no hay calificaciones
Apache Spark - Elasticsearch-Apache storm-RSTUDIO
16 páginas
Sesión 8 - Introducción A Apache Spark
Aún no hay calificaciones
Sesión 8 - Introducción A Apache Spark
39 páginas
S02 ApacheSpark
Aún no hay calificaciones
S02 ApacheSpark
25 páginas
Ensayo Hadoop y Spark
Aún no hay calificaciones
Ensayo Hadoop y Spark
4 páginas
Tema 5
Aún no hay calificaciones
Tema 5
27 páginas
Lectura - Apache Spark, Machine Learning (Parte I)
Aún no hay calificaciones
Lectura - Apache Spark, Machine Learning (Parte I)
22 páginas
Apache Spark
Aún no hay calificaciones
Apache Spark
11 páginas
CD - M8 AE1 Contenidos - 2023
Aún no hay calificaciones
CD - M8 AE1 Contenidos - 2023
12 páginas
Big Data Analytics Spark
Aún no hay calificaciones
Big Data Analytics Spark
55 páginas
Modulo 1 - Lectura 3
Aún no hay calificaciones
Modulo 1 - Lectura 3
6 páginas
Glosario Python1
Aún no hay calificaciones
Glosario Python1
6 páginas
Les12 Indices, Secuencias
Aún no hay calificaciones
Les12 Indices, Secuencias
33 páginas
Spark para Dummies
Aún no hay calificaciones
Spark para Dummies
6 páginas
NH Spark Python 2020
Aún no hay calificaciones
NH Spark Python 2020
137 páginas
Inv de Ovidio
Aún no hay calificaciones
Inv de Ovidio
2 páginas
Ccallata Diaz Escalante Fernandez Goñe
Aún no hay calificaciones
Ccallata Diaz Escalante Fernandez Goñe
8 páginas
Intalacion de Pyspark Fat - 045014
Aún no hay calificaciones
Intalacion de Pyspark Fat - 045014
10 páginas
Biblia de Spark y SparkSQL 3
Aún no hay calificaciones
Biblia de Spark y SparkSQL 3
179 páginas
1 Fundamentos
Aún no hay calificaciones
1 Fundamentos
11 páginas
Apache Spark
Aún no hay calificaciones
Apache Spark
24 páginas
Evidencia 1 BIG DATA-2
Aún no hay calificaciones
Evidencia 1 BIG DATA-2
17 páginas
00 Presentación 2
Aún no hay calificaciones
00 Presentación 2
33 páginas
BD TP3
Aún no hay calificaciones
BD TP3
6 páginas
Entregable Aa1 Big Data
Aún no hay calificaciones
Entregable Aa1 Big Data
16 páginas
Apache Spark Básico
Aún no hay calificaciones
Apache Spark Básico
22 páginas
Introducción A Apache Spark para Empezar A Programar El Big Data
Aún no hay calificaciones
Introducción A Apache Spark para Empezar A Programar El Big Data
13 páginas
UD4 - S05 - Big Data
Aún no hay calificaciones
UD4 - S05 - Big Data
24 páginas
1.estructura de Datos
Aún no hay calificaciones
1.estructura de Datos
38 páginas
3.índices y Vistas
Aún no hay calificaciones
3.índices y Vistas
14 páginas
Perform Data Analysis With Azure Databricks
Aún no hay calificaciones
Perform Data Analysis With Azure Databricks
19 páginas
2.sistema de Base de Datos II
Aún no hay calificaciones
2.sistema de Base de Datos II
13 páginas
1.diagramas ER. Avanzadas
Aún no hay calificaciones
1.diagramas ER. Avanzadas
12 páginas
YourShortlist Guía Comparativa de Software ERP
Aún no hay calificaciones
YourShortlist Guía Comparativa de Software ERP
13 páginas
Tema 4
Aún no hay calificaciones
Tema 4
5 páginas
2.modificar y Eliminar Tablas
Aún no hay calificaciones
2.modificar y Eliminar Tablas
15 páginas
1.creación de Tablas
Aún no hay calificaciones
1.creación de Tablas
14 páginas
3.diccionarios y Tuplas
Aún no hay calificaciones
3.diccionarios y Tuplas
14 páginas
Almacenamiento en La Nube
Aún no hay calificaciones
Almacenamiento en La Nube
8 páginas
Introducción Al Big Data (Presentación)
Aún no hay calificaciones
Introducción Al Big Data (Presentación)
6 páginas
Tema Spark
Aún no hay calificaciones
Tema Spark
10 páginas
PySpark - Sesion 1
100% (1)
PySpark - Sesion 1
29 páginas
Clase 9 - Base de Datos y Big Data
Aún no hay calificaciones
Clase 9 - Base de Datos y Big Data
28 páginas
PySpark Vs Spark
Aún no hay calificaciones
PySpark Vs Spark
8 páginas
Analítica en Big Data. Machine Learning
Aún no hay calificaciones
Analítica en Big Data. Machine Learning
26 páginas
Módulo 4. Manejo de Datos Con Spark SQL: Introducción
Aún no hay calificaciones
Módulo 4. Manejo de Datos Con Spark SQL: Introducción
29 páginas
Cu Ndo Los Datos Son Considerados Big Data 1703037162
Aún no hay calificaciones
Cu Ndo Los Datos Son Considerados Big Data 1703037162
6 páginas
Machine Learning (Presentación)
Aún no hay calificaciones
Machine Learning (Presentación)
19 páginas
Sistema Web de Administración de Hoteles
100% (1)
Sistema Web de Administración de Hoteles
42 páginas