0% encontró este documento útil (0 votos)
13 vistas3 páginas

Taller Bigdaa Python Spark

Cargado por

nokiaverde23
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
13 vistas3 páginas

Taller Bigdaa Python Spark

Cargado por

nokiaverde23
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 3

TALLER: BIGDATA CON PYTHON Y SPARK

I. INFORMACION GENERAL:

Expositores : Patricia Harumi Arana Porras


: Victor Quispe Huamani
Nro. De sesiones : 3 sesiones de 1h y 3 sesiones de una hora y media.
Descripción :
Python es un lenguaje de programación poderoso, práctico por ende fácil de
aprender, que sin duda es una gran opción para elegir, grandes empresas como la
NASA, Google, Amazon usan Python. Su aprendizaje es sencillo para todos.
La elegante sintaxis de Python y su tipado dinámico, junto con su naturaleza
interpretada, hacen de éste un lenguaje ideal para scripting y desarrollo rápido de
aplicaciones en diversas áreas y sobre la mayoría de las plataformas.
En Bigdata/spark se verán los fundamentos del ecosistema de bigdata, desde la
arquitectura, mostrando ejemplos practico de uso en el hadoop y su manejo en
lenguajes como Python, Scala y R.

II. EXPECTATIVAS Y OBJETIVOS:


• Introducir y desarrollar habilidades básicas de programación bajo el
lenguaje de programación abierto y libre de Python.
• Realizar prácticas y ejercicios de programación con Python.
• Mejorar las habilidades de programación y procesos así facilitar la
comprensión de código
• Conocer el ecosistema de Big Data, los conceptos, su arquitectura y sus
principales herramientas, apoyados de ejemplos prácticos en una máquina
virtual.

III. MATERIALES PARA EL TALLER:


Sesiones 1,2,3:
• Contar con una cuenta en GMAIL
Sesiones 4,5 y 6
• Es necesario contar con una configuración recomendable:
SO: Windows 7 de 64 bits (SP1) o Windows 10 de 64 bits, o Sistema Linux
similares
CPU: Intel Core i3-4340 o AMD FX-6300
RAM: 8 GB de memoria RAM
Disco duro: 25GB de espacio libre (se trabajara con una máquina virtual)

IV. CONTENIDOS:

SESIÓN CONTENIDO
Parte 1 Se realizará:
Conceptos:
• Cadenas de Texto o string
• Tu primer programa
• Números enteros
Sumas
Restas
• Números Flotantes o Decimales
• Tipo de Objeto
• Booleanos
Operadores AND y OR

Estructuras de datos de Python:


• Colecciones
• Listas
• Tuplas
• Conjuntos o sets
• Diccionarios
Asignación de objetos a variables
• Reasignación de Variables
Parte 2 Conceptos de programación en Python

• Funciones
• Clase y Objetos
• Bucles
Parte 3 Visualización de datos Python Pandas

• Librería Pandas
• Importación de Archivos: csv
• Importación de datos: Archivo parquet

Parte 4 Fundamentos de Bigdata


• Ecosistema de bigdata, arquitectura.
• Haddop
• Spark
• Archivos parquet
• Instalación de ambiente (uso de la maquina
virtual)
• Practica de comandos basicos con hadoop en el
ambiente

Parte 5 Dataframes
• Introducción a los Dataframes
• Practica de Ingesta usando pull y scoop
• Practica de transformación usando pyspark y
archivos parquets
• Practica de cruces usando pyspark
• Revisión de estándares de Python, scala

Parte 6 Explotación de la información


• Práctica de python, scala y R en el ambiente
Tópicos generales
• Como se muestra la información a los usuarios
finales en Power BI
• Ejemplo de empresas que usan bigdata ( Phyton
, Scala, R) netflix, wallmart; Macdonald, zara,
starBucks, otros.
• Como la tecnología 5G acelerara el desarrollo de
sistemas (Conducción automática; internet de
las cosas, otros)

V. BIBLIOGRAFIA:

https://www.python.org/
https://docs.python.org/3/tutorial/index.html
https://cfm.ehu.es/ricardo/docs/python/Learning_Python.pdf
http://do1.dr-chuck.com/pythonlearn/EN_us/pythonlearn.pdf
https://docs.cloudera.com/
https://docs.scala-lang.org/
https://www.rdocumentation.org/
https://hadoop.apache.org/docs/current/

También podría gustarte