0% encontró este documento útil (0 votos)
59 vistas2 páginas

MRjob - Ayuda Con Python

Este documento describe las entradas, salidas y funciones básicas utilizadas en MapReduce como mapear y reducir datos, manipular cadenas y listas, usar condicionales e iteraciones.

Cargado por

judavperezs
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
59 vistas2 páginas

MRjob - Ayuda Con Python

Este documento describe las entradas, salidas y funciones básicas utilizadas en MapReduce como mapear y reducir datos, manipular cadenas y listas, usar condicionales e iteraciones.

Cargado por

judavperezs
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 2

Entradas del Mapper y Reducer

● La llave y el valor en las entradas son ambos de tipo string. Para realizar
cálculos numéricos debes convertir los datos en tipos numéricos.

Salidas del Mapper y Reducer


● Debes usar la función ​yield​ para emitir la llave y el valor correspondiente. Por
ejemplo, se escribe
yield(llave, valor)

Variables
● No hace falta declarar variables
● Puede utilizar la siguientes funciones para cambiar el tipo de un dato
○ int(x)
convierte ​x​ en un número entero
○ float (x)
convierte ​x​ en un número real
○ str(x)
convierte ​x​ en un string

Operaciones numéricas
● Operaciones numéricas
○ sumar: +
○ multiplicar: *
○ dividir: /
○ restar: -
● Para incrementar n
○ n += 1

Manipulación de Strings (Cadenas de Caracteres)


● La función split convierte un string en una lista de strings.
● Por defecto se divide por whitespace (espacio, tab, etc). Por ejemplo, si
s = "2338 2 1998-12-01"
● s.split()​ crea la lista
["2338","2","1998-12-01"]
● Para dividir una lista usando otro carácter (que no sea whitespace), se puede
dar un parámetro a la función ​split​. Por ejemplo, si ​t="2012-12-6"
● t.split('-')​ crea la lista
["2012","12","6"]
Listas
● En Python, las listas empiezan con la posición 0
● Por ejemplo, si
l = ["2338","2","1998-12-01"]
● l[0]​ arroja el valor ​"2338"
● l[2]​ arroja el valor ​"1998-12-01"
● len(l)​ arroja el valor 3 (el número de elementos en la lista)

If
● Igual que otros lenguajes, el ​if​ en Python se usa para operaciones que se
ejecutan de forma condicional
● NB: La indentación en Python para las instrucciones que están en el cuerpo del
if es obligatoria!
● Por ejemplo, para ver si una variable a es igual una variable b:
● if (a == b):
print "a es igual a b"

Ciclos
● Igual que otros lenguajes, el ​for​ en Python se usa para operaciones que se
ejecutan de forma repetitiva
● Para iterar sobre una lista, y imprimir cada dato de la lista en la pantalla, se
escribe
for l in lista:
print l
print "ya he salido del for"
● En este caso, ​l ​es la variable temporal a la cual es asignada cada elemento de
la lista

Depuración de problemas
● Se recomienda usar la instrucción ​print​ si desean mostrar el valor de una
variable, con el fin de revisar si su código está funcionando correctamente.

También podría gustarte