0% encontró este documento útil (0 votos)
20 vistas9 páginas

Taller Python Spark Bigdata Guía

Cargado por

nokiaverde23
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
20 vistas9 páginas

Taller Python Spark Bigdata Guía

Cargado por

nokiaverde23
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 9

TALLER: BIGDATA CON PYTHON Y SPARK

I. INFORMACION GENERAL:

Expositores : Ing. Patricia Harumi Arana Porras


: Ing. Victor Quispe Huamani
Nro. De sesiones : 3 sesiones de 1h y 3 sesiones de una hora y media.
Descripción :

Python es un lenguaje de programación poderoso, práctico por ende fácil de


aprender, que sin duda es una gran opción para elegir, grandes empresas como la
NASA, Google, Amazon usan Python. Su aprendizaje es sencillo para todos.
La elegante sintaxis de Python y su tipado dinámico, junto con su naturaleza
interpretada, hacen de éste un lenguaje ideal para scripting y desarrollo rápido de
aplicaciones en diversas áreas y sobre la mayoría de las plataformas.
En Bigdata/spark se verán los fundamentos del ecosistema de bigdata, desde la
arquitectura, mostrando ejemplos practico de uso en el hadoop y su manejo en
lenguajes como Python, Scala y R.

II. EXPECTATIVAS Y OBJETIVOS:


 Introducir y desarrollar habilidades básicas de programación bajo el
lenguaje de programación abierto y libre de Python.
 Realizar prácticas y ejercicios de programación con Python.
 Mejorar las habilidades de programación y procesos así facilitar la
comprensión de código
 Conocer el ecosistema de Big Data, los conceptos, su arquitectura y sus
principales herramientas, apoyados de ejemplos prácticos en una máquina
virtual.

III. MATERIALES PARA EL TALLER:


Sesiones 1,2,3:
 Contar con una cuenta en GMAIL
Sesiones 4,5 y 6
 Es necesario contar con una configuración recomendable:
SO: Windows 7 de 64 bits (SP1) o Windows 10 de 64 bits, o Sistema Linux
similares
CPU: Intel Core i3-4340 o AMD FX-6300
RAM: 8 GB de memoria RAM
Disco duro: 25GB de espacio libre (se trabajara con una máquina virtual)
IV. CONTENIDOS:

SESIÓN CONTENIDO
Parte 1 Se realizará:
Conceptos:
 Cadenas de Texto o string
 Tu primer programa “Hola mundo“
 Índice de cadenas
 Cadenas de caracteres con variables y
concatenación
 Números enteros
o Operaciones simples
 Números Flotantes o Decimales
o Convertir variables a int, float ,str
o Otras funciones útiles para números
 Ver Tipo de Objeto
 Operadores
o Operadores AND y OR
o Operadores de comparación
o Operadores de pertenencia
o Operadores de Asignación
 Introduciendo datos por teclado

Conceptos de programación en Python:


 Estructuras de control
 Funciones
 Clases y Objetos

Parte 2 Estructuras de datos de Python:


 Colecciones
 Listas
 Tuplas
 Conjuntos o sets
 Diccionarios

Parte 3 Visualización de datos Python Pandas

 Librería Pandas
o Series
o Dataframes
 Importación de Archivos: csv
 Importación de datos: Archivo parquet

Parte 4 Fundamentos de Bigdata


 Ecosistema de bigdata, arquitectura.
 Haddop
 Spark
 Archivos parquet
 Instalación de ambiente (uso de la maquina
virtual)
 Practica de comandos basicos con hadoop en el
ambiente
Parte 5 Dataframes
 Introducción a los Dataframes
 Practica de Ingesta usando pull y scoop
 Practica de transformación usando pyspark y
archivos parquets
 Practica de cruces usando pyspark
 Revisión de estándares de Python, scala

Parte 6 Explotación de la información


 Práctica de python, scala y R en el ambiente
Tópicos generales
 Como se muestra la información a los usuarios
finales en Power BI
 Ejemplo de empresas que usan bigdata ( Phyton ,
Scala, R) netflix, wallmart; Macdonald, zara,
starBucks, otros.
 Como la tecnología 5G acelerara el desarrollo de
sistemas (Conducción automática; internet de las
cosas, otros)

V. BIBLIOGRAFIA:

https://www.python.org/
https://docs.python.org/3/tutorial/index.html
https://cfm.ehu.es/ricardo/docs/python/Learning_Python.pdf
http://do1.dr-chuck.com/pythonlearn/EN_us/pythonlearn.pdf
https://docs.cloudera.com/
https://docs.scala-lang.org/
https://www.rdocumentation.org/
https://hadoop.apache.org/docs/current/
¿ Cómo crear una cuenta de Gmail? :
Paso 1: ingresar al siguiente link
https://accounts.google.com/signup/v2/webcreateaccount?hl=en&flowName=GlifWebSignIn
&flowEntry=SignUp

Paso2: Colocar tus datos personales , nombre de usuario , contraseña y confirmación de esta.
Paso3: click en Next , a continuación se nos solicitará el número de celular para proteger
nuestra cuenta, lo colocamos y presionamos next.

Paso4: nos llegará un mensaje de verificación, insertamos el código y damos next.


Paso5: Insertamos nuestra información personal para facilitar la recuperación de nuestra
cuenta en caso la perdamos y luego damos click a next.

Paso6: en la siguiente pantalla damos clic a aceptar y a ESTOY DE ACUERDO , y listo ya tienes
tu cuenta de Gmail.

Le aparecerá una ventana como la siguiente:

En el botón de la esquina superior derecha , que parece un cuadrado subdividido podremos


encontrar las aplicaciones que nos ofrece Google:
Con esta cuenta creada podemos seguir con la creación de nuestro primer notebook en
Google Colab.
Accediendo a Google Colab

Requisito: tener una cuenta de Gmail activa.

Para este taller se utlizará como herramienta GOOGLE COLAB, que permitirá trabajar con
Python.

1. Paso 01: Ingresamos en el buscador de Google: “GOOGLE COLAB” o al siguiente link:


https://colab.research.google.com/notebooks/welcome.ipynb?hl=es

2. Paso 02: Visualizaremos la siguiente ventana ( en modo oscuro o claro, dependiendo


de la configuración: Herramientas -> Configuración ->sitio -> tema( light o dark) ).
3. Paso 03: Una vez dentro damos clic al botón “ Acceder “ e ingresamos con nuestra
cuenta de Gmail.

4. Paso 04: Luego de ingresar , crearemos un nuevo notebook, para ello daremos clic en
“Archivo” y veremos las siguientes opciones:

Seleccionaremos “Bloc de notas nuevo”


5. Paso 05: Finalmente, veremos la siguiente ventana :

Hemos terminado de crear nuestro notebook y estamos listos para empezar!

También podría gustarte