Tutorial Python 2
Tutorial Python 2
Autor original: Guido van Rossum Editor original: Fred L. Drake, Jr.
Este material fue traducido por voluntarios del grupo de usuarios de Python de
Argentina. Una versión actualizada de este Tutorial puede encontrarse en:
http://python.org.ar/pyar/Tutorial
Septiembre 2009
Copyright © Python Software Foundation Esta documentación está cubierta por la Licencia PSF para Python 2.6.2, que
basicamente permite que use, copies, modifiques y distribuyas este contenido. Para un mayor detalle:
http://www.python.org/doc/2.6.2/copyright.html
Contenido
Introducción 7
Abriendo tu apetito 8
Invocando al intérprete 10
Pasaje de argumentos 11
Modo interactivo 11
El intérprete y su entorno 12
Manejo de errores 12
Números 15
Cadenas de caracteres 18
Listas 24
La sentencia if 28
La sentencia for 28
La función range() 29
La sentencia pass 30
Definiendo funciones 31
Estructuras de datos 40
La instrucción del 45
Tuplas y secuencias 46
Conjuntos 47
Diccionarios 48
Técnicas de iteración 49
Módulos 52
Módulos estándar 56
La función dir() 56
Paquetes 58
Entrada y salida 63
El módulo pickle 69
Errores y excepciones 71
Errores de sintaxis 71
Excepciones 71
Manejando excepciones 72
Levantando excepciones 75
Clases 79
Objetos clase 82
Objetos instancia 83
Objetos método 84
Algunas observaciones 85
Herencia 86
Herencia múltiple 87
Variables privadas 88
Cambalache 89
Iteradores 90
Generadores 92
Expresiones generadoras 92
Matemática 96
Acceso a Internet 96
Fechas y tiempos 97
Compresión de datos 97
Medición de rendimiento 98
Control de calidad 98
Plantillas 101
Multi-hilos 103
Registrando 104
Introducción
Python es un lenguaje de programación poderoso y fácil de aprender. Cuenta con estructuras de datos eficientes y de alto nivel y un enfoque simple pero
efectivo a la programación orientada a objetos. La elegante sintaxis de Python y su tipado dinámico, junto con su naturaleza interpretada, hacen de éste un
lenguaje ideal para scripting y desarrollo rápido de aplicaciones en diversas áreas y sobre la mayoría de las plataformas.
El intérprete de Python y la extensa biblioteca estándar están a libre disposición en forma binaria y de código fuente para las principales plataformas desde el
sitio web de Python, http://www.python.org/, y puede distribuirse libremente. El mismo sitio contiene también distribuciones y enlaces de muchos módulos
libres de Python de terceros, programas y herramientas, y documentación adicional.
El intérprete de Python puede extenderse fácilmente con nuevas funcionalidades y tipos de datos implementados en C o C++ (u otros lenguajes accesibles
desde C). Python también puede usarse como un lenguaje de extensiones para aplicaciones personalizables.
Este tutorial introduce de manera informal al lector a los conceptos y características básicas del lenguaje y el sistema de Python. Es bueno tener un interprete
de Python a mano para experimentar, sin embargo todos los ejemplos están aislados, por lo tanto el tutorial puede leerse estando desconectado.
Para una descripción de los objetos y módulos estándar, mira la Referencia de la Biblioteca de Python. El Manual de Referencia de Python provee una
definición más formal del lenguaje. Para escribir extensiones en C o C++, lee Extendiendo e Integrando el Intérprete de Python y la Referencia de la API
Python/C. Hay también numerosos libros que tratan a Python en profundidad.
Este tutorial no pretende ser exhaustivo ni tratar cada una de las características, o siquiera las características más usadas. En cambio, introduce la mayoría de
las características más notables de Python, y te dará una buena idea del gusto y estilo del lenguaje. Luego de leerlo, serás capaz de leer y escribir módulos y
programas en Python, y estarás listo para aprender más de los variados módulos de la biblioteca de Python descriptos en la Referencia de la Biblioteca de
Python.
También vale la pena mirar el glosario.
Abriendo tu apetito
Si trabajás mucho con computadoras, eventualmente encontrarás que te gustaría automatizar alguna tarea. Por ejemplo, podrías desear realizar una búsqueda y
reemplazo en un gran número de archivos de texto, o renombrar y reorganizar un montón de archivos con fotos de una manera compleja. Tal vez quieras
escribir alguna pequeña base de datos personalizada, o una aplicación especializada con interfaz gráfica, o un juego simple.
Si sos un desarrollador de software profesional, tal vez necesites trabajar con varias bibliotecas de C/C++/Java pero encuentres que se hace lento el ciclo usual
de escribir/compilar/testear/recompilar. Tal vez estás escribiendo una batería de pruebas para una de esas bibliotecas y encuentres que escribir el código de
testeo se hace una tarea tediosa. O tal vez has escrito un programa al que le vendría bien un lenguaje de extensión, y no quieres diseñar/implementar todo un
nuevo lenguaje para tu aplicación.
Podrías escribir un script (o programa) en el interprete de comandos o un archivo por lotes de Windows para algunas de estas tareas, pero los scripts se lucen
para mover archivos de un lado a otro y para modificar datos de texto, no para aplicaciones con interfaz de usuario o juegos. Podrías escribir un programa en
C/C++/Java, pero puede tomar mucho tiempo de desarrollo obtener al menos un primer borrador del programa. Python es más fácil de usar, está disponible
para sistemas operativos Windows, Mac OS X y Unix, y te ayudará a realizar tu tarea más velozmente.
Python es fácil de usar, pero es un lenguaje de programación de verdad, ofreciendo mucho mucho mayor estructura y soporte para programas grandes que lo
que lo que pueden ofrecer los scripts de Unix o archivos por lotes. Por otro lado, Python ofrece mucho más chequeo de error que C, y siendo un lenguaje de
muy alto nivel, tiene tipos de datos de alto nivel incorporados como arreglos de tamaño flexible y diccionarios. Debido a sus tipos de datos más generales
Python puede aplicarse a un dominio de problemas mayor que Awk o incluso Perl, y aún así muchas cosas siguen siendo al menos igual de fácil en Python que
en esos lenguajes.
Python te permite separar tu programa en módulos que pueden reusarse en otros programas en Python. Viene con una gran colección de módulos estándar que
puedes usar como base de tus programas, o como ejemplos para empezar a aprender a programar en Python. Algunos de estos módulos proveen cosas como
entrada/salida a archivos, llamadas al sistema, sockets, e incluso interfaces a sistemas de interfaz gráfica de usuario como Tk.
Python es un lenguaje interpretado, lo cual puede ahorrarte mucho tiempo durante el desarrollo ya que no es necesario compilar ni enlazar. El intérprete puede
usarse interactivamente, lo que facilita experimentar con características del lenguaje, escribir programas descartables, o probar funciones cuando se hace
desarrollo de programas de abajo hacia arriba. Es también una calculadora de escritorio práctica.
Python permite escribir programas compactos y legibles. Los programas en Python son típicamente más cortos que sus programas equivalentes en C, C++ o
Java por varios motivos:
• los tipos de datos de alto nivel permiten expresar operaciones complejas en una sola instrucción
• la agrupación de instrucciones se hace por snagría en vez de llaves de apertura y cierre
8
• no es necesario declarar variables ni argumentos.
Python es extensible: si ya sabes programar en C es fácil agregar una nueva función o módulo al intérprete, ya sea para realizar operaciones críticas a velocidad
máxima, o para enlazar programas Python con bibliotecas que tal vez sólo estén disponibles en forma binaria (por ejemplo bibliotecas gráficas específicas de
un fabricante). Una vez que estés realmente entusiasmado, podés enlazar el intérprete Python en una aplicación hecha en C y usarlo como lenguaje de
extensión o de comando para esa aplicación.
Por cierto, el lenguaje recibe su nombre del programa de televisión de la BBC "Monty Python's Flying Circus" y no tiene nada que ver con reptiles. Hacer
referencias a sketches de Monty Python en la documentación no sólo esta permitido, ¡sino que también está bien visto!
Ahora que ya estás emocionado con Python, querrás verlo en más detalle. Como la mejor forma de aprender un lenguaje es usarlo, el tutorial te invita a que
juegues con el intérprete de Python a medida que vas leyendo.
En el próximo capítulo se explicará la mecánica de uso del intérprete. Esta es información bastante mundana, pero es esencial para poder probar los ejemplos
que aparecerán más adelante.
El resto del tutorial introduce varias características del lenguaje y el sistema Python a través de ejemplos, empezando con expresiones, instrucciones y tipos de
datos simples, pasando por funciones y módulos, y finalmente tocando conceptos avanzados como excepciones y clases definidas por el usuario.
Invocando al intérprete
Por lo general, el intérprete de Python se instala en file:/usr/local/bin/python en las máquinas dónde está disponible; poner /usr/local/bin en el camino de
búsqueda de tu intérprete de comandos Unix hace posible iniciarlo ingresando la orden:
python
...en la terminal. Ya que la elección del directorio dónde vivirá el intérprete es una opción del proceso de instalación, puede estar en otros lugares; consultá a tu
Gurú Python local o administrador de sistemas. (Por ejemplo, /usr/local/python es una alternativa popular).
En máquinas con Windows, la instalación de Python por lo general se encuentra en C:\Python26, aunque se puede cambiar durante la instalación. Para añadir
este directorio al camino, podes ingresar la siguiente orden en el prompt de DOS:
set path=%path%;C:\python26
Se puede salir del intérprete con estado de salida cero ingresando el carácter de fin de archivo (Control-D en Unix, Control-Z en Windows) en el prompt
primario. Si esto no funciona, se puede salir del intérprete ingresando: import sys; sys.exit().
Las características para editar líneas del intérprete no son muy sofisticadas. En Unix, quien instale el intérprete tendrá habilitado el soporte para la biblioteca
GNU readlines, que añade una edición interactiva más elaborada e historia. Tal vez la forma más rápida de detectar si las características de edición están
presentes es ingresar Control-P en el primer prompt de Python que aparezca. Si se escucha un beep, las características están presentes; ver Apéndice
tut-interacting para una introducción a las teclas. Si no pasa nada, o si aparece ^P, estas características no están disponibles; solo vas a poder usar backspace
para borrar los caracteres de la línea actual.
La forma de operar del intérprete es parecida a la línea de comandos de Unix: cuando se la llama con la entrada estándar conectada a una terminal lee y ejecuta
comandos en forma interactiva; cuando es llamada con un nombre de archivo como argumento o con un archivo como entrada estándar, lee y ejecuta un script
del archivo.
Una segunda forma de iniciar el intérprete es python -c comando [arg] ..., que ejecuta las sentencias en comando, similar a la opción -c de la línea de
comandos. Ya que las sentencias de Python suelen tener espacios en blanco u otros caracteres que son especiales en la línea de comandos, es normalmente
recomendado citar comando entre comillas dobles.
Algunos módulos de Python son también útiles como scripts. Pueden invocarse usando python -m module [arg] ..., que ejecuta el código de module como si se
hubiese ingresado su nombre completo en la línea de comandos.
10
Notá que existe una diferencia entre python file y python <file. En el último caso, la entrada solicitada por el programa, como en llamadas a input() y
raw_input(), son satisfechas desde file. Ya que este archivo ya fue leído hasta el final por el analizador antes de que el programa empiece su ejecución, se
encontrará el fin de archivo enseguida. En el primer caso (lo que usualmente vas a querer) son satisfechas por cualquier archivo o dispositivo que esté
conectado a la entrada estándar del intérprete de Python.
Cuando se usa un script, a veces es útil correr primero el script y luego entrar al modo interactivo. Esto se puede hacer pasándole la opción -i antes del nombre
del script. (Esto no funciona si el script es leído desde la entrada estándar, por la misma razón explicada en el párrafo anterior).
Pasaje de argumentos
Cuando son conocidos por el intérprete, el nombre del script y los argumentos adicionales son entonces pasados al script en la variable sys.argv, una lista de
cadenas de texto. Su longitud es al menos uno; cuando ningún script o argumentos son pasados, sys.argv[0] es una cadena vacía. Cuando se pasa el nombre del
script con '-' (lo que significa la entrada estándar), sys.argv[0] vale '-'. Cuando se usa -c command, sys.argv[0] vale '-c'. Cuando se usa -m module, sys.argv[0]
toma el valor del nombre completo del módulo. Las opciones encontradas luego de -c command o -m module no son consumidas por el procesador de opciones
de Python pero de todas formas almacenadas en sys.argv para ser manejadas por el comando o módulo.
Modo interactivo
Se dice que estamos usando el intérprete en modo interactivo, cuando los comandos son leídos desde una terminal. En este modo espera el siguiente comando
con el prompt primario, usualmente tres signos mayor-que (>>>); para las líneas de continuación espera con el prompt secundario, por defecto tres puntos (...).
Antes de mostrar el prompt primario, el intérprete muestra un mensaje de bienvenida reportando su número de versión y una nota de copyright:
python Python 2.6 (#1, Feb 28 2007, 00:02:06) Type "help", "copyright", "credits" or "license" for more information. >>>
Las líneas de continuación son necesarias cuando queremos ingresar un constructor multilínea. Como en el ejemplo, mirá la sentencia if:
>>> el_mundo_es_plano = 1 >>> if el_mundo_es_plano: ... print u"¡Tené cuidado de no caerte!" ... ¡Tené
cuidado de no caerte!
11
El intérprete y su entorno
Manejo de errores
Cuando ocurre un error, el intérprete imprime un mensaje de error y la traza del error. En el modo interactivo, luego retorna al prompt primario; cuando la
entrada viene de un archivo, el programa termina con código de salida distinto a cero luego de imprimir la traza del error. (Las excepciones manejadas por una
clausula except en una sentencia try no son errores en este contexto). Algunos errores son incondicionalmente fatales y causan una terminación con código de
salida distinto de cero; esto se debe a inconsistencias internas o a que el intérprete se queda sin memoria. Todos los mensajes de error se escriben en el flujo de
errores estándar; las salidas normales de comandos ejecutados se escriben en la salida estándar.
Al ingresar el caracter de interrupción (por lo general Control-C o DEL) en el prompt primario o secundario, se cancela la entrada y retorna al prompt primario.
1 Tipear una interrupción mientras un comando se están ejecutando lanza la excepción KeyboardInterrupt, que puede ser manejada con una sentencia try.
En los sistemas Unix y tipo BSD, los programas Python pueden convertirse directamente en ejecutables, como programas del intérprete de comandos,
poniendo la linea:
#! /usr/bin/env python
...al principio del script y dándole al archivo permisos de ejecución (asumiendo que el intérprete están en la variable de entorno PATH del usuario). #! deben
ser los primeros dos caracteres del archivo. En algunas plataformas, la primer línea debe terminar al estilo Unix ('\n'), no como en Windows ('\r\n'). Notá que el
caracter numeral '#' se usa en Python para comenzar un comentario.
$ chmod +x myscript.py
En sistemas Windows, no existe la noción de "modo ejecutable". El instalador de Python asocia automáticamente la extensión .py con python.exe para que al
hacerle doble click a un archivo Python se corra el script. La extensión también puede ser .pyw, en este caso se omite la ventana con la consola que
normalmente aparece.
12
Codificación del código fuente
Es posible utilizar una codificación distinta a ASCII en el código fuente de Python. La mejor forma de hacerlo es poner otro comentario especial enseguida
después de la línea con #! para definir la codificación:
Con esa declaración, todos los caracteres en el archivo fuente serán traducidos utilizando la codificación encoding, y será posible escribir directamente cadenas
de texto literales Unicode en la codificación seleccionada. La lista de posibles codificaciones se puede encontrar en la Referencia de la Biblioteca de Python,
en la sección sobre codecs.
Por ejemplo, para escribir literales Unicode, incluyendo el símbolo de la moneda Euro, se puede usar la codificación ISO-8859-15, en la que el símbolo Euro
tiene el valor 164. Este script imprimirá el valor 8364 (el código Unicode correspondiente al símbolo Euro) y luego saldrá:
Si tu editor tiene soporte para guardar archivos como UTF-8 con marca de orden de byte UTF-8 (también conocida como BOM), podés usar eso en lugar de la
declaración de codificación. IDLE lo soporta si se activa Options/General/Default Source Encoding/UTF-8. Notá que esto no funciona en versiones antiguas
de Python (2.2 y anteriores), ni por el sistema operativo en scripts con la línea con #! (solo usado en sistemas Unix).
Usando UTF-8 (ya sea mediante BOM o la declaración de codificación), los caracteres de la mayoría de los idiomas del mundo pueden ser usados
simultáneamente en cadenas de texto o comentarios. No se soporta usar caracteres no-ASCII en identificadores. Para mostrar todos estos caracteres de forma
apropiada, tu editor debe reconocer que el archivo es UTF-8, y debe usar una tipografía que soporte todos los caracteres del archivo.
Cuando usás Python en forma interactiva, suele ser útil que algunos comandos estándar se ejecuten cada vez que el intérprete se inicia. Podés hacer esto
configurando la variable de entorno PYTHONSTARTUP con el nombre de un archivo que contenga tus comandos de inicio. Esto es similar al archivo .profile
en los intérpretes de comandos de Unix.
Este archivo es solo leído en las sesiones interactivas del intérprete, no cuando Python lee comandos de un script ni cuando file:/dev/tty se explicita como una
fuente de comandos (que de otro modo se comporta como una sesión interactiva). Se ejecuta en el mismo espacio de nombres en el que los comandos
interactivos se ejecutan, entonces los objetos que define o importa pueden ser usados sin cualificaciones en la sesión interactiva. En este archivo también podés
cambiar los prompts sys.ps1 y sys.ps2.
13
Si querés leer un archivo de inicio adicional desde el directorio actual, podés programarlo en el archivo de inicio global usando algo como if
os.path.isfile('.pythonrc.py'): execfile('.pythonrc.py'). Si querés usar el archivo de inicio en un script, tenés que hacer lo siguiente en forma explícita en el
script:
Muchos de los ejemplos de este manual, incluso aquellos ingresados en el prompt interactivo, incluyen comentarios. Los comentarios en Python comienzan
con el carácter numeral, #, y se extienden hasta el final físico de la línea. Un comentario quizás aparezca al comienzo de la línea o seguidos de espacios
blancos o código, pero sin una cadena de caracteres. Un carácter numeral dentro de una cadena de caracteres es sólo un carácter numeral. Ya que los
comentarios son para aclarar código y no son interpretados por Python, pueden omitirse cuando se escriben ejemplos.
Algunos ejemplos:
Números
El intérprete actúa como una simple calculadora; podés ingrsar una expresión y este escribirá los valores. La sintaxis es sencilla: los operadores +, -, * y /
funcionan como en la mayoría de los lenguajes (por ejemplo, Pascal o C); los paréntesis pueden ser usados para agrupar. Por ejemplo:
>>> 2+2 4>>> # Este es un comentario ... 2+2 4>>> 2+2 # y un comentario en la misma línea que el código 4>>> (50-5*6)/4 5
15
>>> # La división entera retorna redondeado al piso: ... 7/3 2>>> 7/-3 -3
El signo igual (=) es usado para asignar un valor a una variable. Luego, ningún resultado es mostrado antes del próximo prompt:
>>> x = y = z = 0 # Cero a x, y, y z >>> x 0>>> y 0>>> z 0Las variables deben estar "definidas" (con un valor asignado) antes de que puedan usarse, o un
error ocurrirá:
>>> # tratamos de acceder a una variable no definida ... n Traceback (most recent call last):
File "<stdin>", line 1, in <module> NameError: name 'n' is not defined
Se soporta completamente los números de punto flotante; las operaciones con mezclas en los tipos de los operandos convierten los enteros a punto flotante:
Los números complejos también están soportados; los números imaginarios son escritos con el sufijo de j o J. Los números complejos con un componente real
que no sea cero son escritos como (real+imagj), o pueden ser escrito con la función complex(real, imag).
>>> 1j * 1J (-1+0j)
16
>>> 1j * complex(0,1) (-1+0j) >>> 3+1j*3 (3+3j) >>> (3+1j)*3 (9+3j)
>>> (1+2j)/(1+1j) (1.5+0.5j)
Los números complejos son siempre representados como dos números de punto flotante, la parte real y la imaginaria. Para extraer estas partes desde un
número complejo z, usá z.real y z.imag.
La función de conversión de los punto flotante y enteros (float(), int() y long()) no funciona para números complejos; aquí no hay una forma correcta de
convertir un número complejo a un número real. Usá abs(z) para obtener esta magnitud (como un flotante) o z.real para obtener la parte real.
>>> a=3.0+4.0j >>> float(a) ... TypeError: can't convert complex to float >>> a.real 3.0 >>> a.imag
4.0 >>> abs(a) # sqrt(a.real**2 + a.imag**2) 5.0 >>>
En el modo interactivo, la última expresión impresa es asignada a la variable _. Esto significa que cuando estés usando Python como una calculadora de
escritorio, es más fácil seguir calculando, por ejemplo:
>>> impuesto = 12.5 / 100 >>> precio = 100.50 >>> precio * impuesto
12.5625 >>> precio + _ 113.0625 >>> round(_, 2) 113.06 >>>
17
Esta variable debería ser tratada como de sólo lectura por el usuario. No le asignes explícitamente un valor; crearás una variable local independiente con el
mismo nombre enmascarando la variable con el comportamiento mágico.
Cadenas de caracteres
Además de números, Python puede manipular cadenas de texto, las cuales pueden ser expresadas de distintas formas. Pueden estar encerradas en comillas
simples o dobles:
>>> 'huevos y pan' 'huevos y pan' >>> 'doesn\'t' "doesn't" >>> "doesn't"
"doesn't" >>> '"Si," le dijo.' '"Si," le dijo.' >>> "\"Si,\" le dijo." '"Si," le dijo.'
>>> '"Isn\'t," she said.' '"Isn\'t," she said.'
Las cadenas de texto literales pueden contener múltiples líneas de distintas formas. Las líneas continuas se pueden usar, con una barra invertida como el último
carácter de la línea para indicar que la siguiente línea es la continuación lógica de la línea:
hola = "Esta es una larga cadena que contiene\n\ varias líneas de texto, tal y como se hace en C.\n\
Notar que los espacios en blanco al principio de la linea\ son significantes."
print hola
Notá que de todas formas se necesita embeber los salto de líneas con \n; la nueva línea que sigue a la barra invertida final es descartada. Este ejemplo
imprimiría:
Esta es una larga cadena que contiene varias líneas de texto, tal y como se hace en C.
Notar que los espacios en blanco al principio de la linea son significantes.
O, las cadenas de texto pueden ser rodeadas en un par de comillas triples: """ o '''. No se necesita escapar los finales de línea cuando se utilizan comillas triples,
pero serán incluidos en la cadena.
18
-h Muestra el mensaje de uso -H nombrehost Nombre del host al cual conectarse """
Si se hace de la cadena de texto una cadena "cruda", la secuencia \n no es convertida a salto de línea, pero la barra invertida al final de la línea y el carácter de
nueva línea en la fuente, ambos son incluidos en la cadena como datos. Así, el ejemplo:
hola = r"Esta es una larga cadena que contiene\n\ varias líneas de texto, tal y como se hace en C."
print hola
...imprimirá:
Esta es una larga cadena que contiene\n\ varias líneas de texto, tal y como se hace en C.
El interprete imprime el resultado de operaciones entre cadenas de la misma forma en que son tecleadas como entrada: dentro de comillas, y con comillas y
otros caracteres raros escapados con barras invertidas, para mostrar el valor preciso. La cadena de texto es encerrada con comillas dobles si contiene una
comilla simple y no comillas dobles, sino es encerrada con comillas simples. (La declaración print, descrita luego, puede ser usado para escribir cadenas sin
comillas o escapes).
Las cadenas de texto pueden ser concatenadas (pegadas juntas) con el operador + y repetidas con *:
>>> palabra = 'Ayuda' + 'A' >>> palabra 'AyudaA' >>> '<' + palabra*5 + '>'
'<AyudaAAyudaAAyudaAAyudaAAyudaA>'
Dos cadenas de texto juntas son automáticamente concatenadas; la primer línea del ejemplo anterior podría haber sido escrita palabra = 'Ayuda' 'A'; esto solo
funciona con dos literales, no con expresiones arbitrarias:
>>> 'cad' 'ena' # <- Esto es correcto 'cadena' >>> 'cad'.strip() + 'ena' # <- Esto es correcto 'cadena' >>> 'cad'.strip() 'ena' # <-
Esto no es correcto ...
19
SyntaxError: invalid syntax
Las cadenas de texto se pueden indexar; como en C, el primer carácter de la cadena tiene el índice 0. No hay un tipo de dato para los caracteres; un carácter es
simplemente una cadena de longitud uno. Como en Icon, se pueden especificar subcadenas con la notación de rebanadas: dos índices separados por dos
puntos.
Los índices de las rebanadas tienen valores por defecto útiles; el valor por defecto para el primer índice es cero, el valor por defecto para el segundo índice es
la longitud de la cadena a rebanar.
>>> palabra[:2] # Los primeros dos caracteres 'Ay' >>> palabra[2:] # Todo menos los primeros dos caracteres 'udaA'
A diferencia de las cadenas de texto en C, en Python no pueden ser modificadas. Intentar asignar a una posición de la cadena es un error:
>>> palabra[0] = 'x' ... TypeError: 'str' object does not support item assignment >>> palabra[:1] = 'Mas' Traceback (most
recent call last):
File "<stdin>", line 1, in ? TypeError: 'str' object does not support item assignment
Sin embargo, crear una nueva cadena con contenido combinado es fácil y eficiente:
20
Los índices degenerados en las rebanadas son manejados bien: un índice muy largo es reemplazado por la longitud de la cadena, un límite superior más chico
que el límite menor retorna una cadena vacía.
Los índices pueden ser números negativos, para empezar a contar desde la derecha. Por ejemplo:
>>> palabra[-1] # El último caracter 'A' >>> palabra[-2] # El penúltimo caracter 'a' >>> palabra[-2:] # Los últimos dos
caracteres 'aA' >>> palabra[:-2] # Todo menos los últimos dos caracteres 'Ayud'
Pero notá que -0 es en realidad lo mismo que 0, ¡por lo que no cuenta desde la derecha!
Los índices negativos fuera de rango son truncados, pero esto no funciona para índices de un solo elemento (no rebanada):
>>> palabra[-100:] 'AyudaA' >>> palabra[-10] # error Traceback (most recent call last):
File "<stdin>", line 1, in ? IndexError: string index out of range
Una forma de recordar cómo funcionan las rebanadas es pensar en los índices como puntos entre caracteres, con el punto a la izquierda del primer carácter
numerado en 0. Luego, el punto a la derecha del último carácter de una cadena de n caracteres tienen índice n, por ejemplo:
+---+---+---+---+---+---+ | A | y | u | d | a | A | +---+---+---+---+---+---+ 0 1 2 3
4 5 6 -6 -5 -4 -3 -2 -1
La primer fila de números da la posición de los índices 0...6 en la cadena; la segunda fila da los correspondientes índices negativos. La rebanada de i a j
consiste en todos los caracteres entre los puntos
21
etiquetados i y j, respectivamente.
Para índices no negativos, la longitud de la rebanada es la diferencia de los índices, si ambos entran en los límites. Por ejemplo, la longitud de palabra[1:3] es
2.
string-methods
Tanto las cadenas de texto normales como las cadenas de texto Unicode soportan una gran cantidad de métodos para transformaciones básicas y búsqueda.
new-string-formatting
Aquí se da información sobre formateo de cadenas de texto con str.format().
string-formatting
Aquí se describe con más detalle las operaciones viejas para formateo usadas cuando una cadena de texto o una cadena Unicode están a la izquierda del
operador %.
Cadenas de texto Unicode
Desde la versión 2.0 de Python, se encuentra disponible un nuevo tipo de datos para que los programadores almacenen texto: el objeto Unicode. Puede ser
usado para almacenar y manipular datos Unicode (ver http://www.unicode.org/) y se integran bien con los objetos existentes para cadenas de texto, mediante
auto-conversión cuando es necesario.
Unicode tiene la ventaja de tener un número ordinal para cada carácter usado tanto en textos modernos como antiguos. Previamente, había sólo 256 ordinales
posibles para los caracteres en scripts. Los textos eran típicamente asociados a un código que relaciona los ordinales a caracteres en scripts. Esto lleva a mucha
confusión, especialmente al internacionalizar software. Unicode resuelve estos problemas definiendo una sola codificación para todos los scripts.
Crear cadenas Unicode en Python es tan simple como crear cadenas de texto normales:
La 'u' al frente de la comilla indica que se espera una cadena Unicode. Si querés incluir caracteres especiales en la cadena, podés hacerlo usando una forma de
escapar caracteres Unicode provista por
22
Python. El siguiente ejemplo muestra cómo:
La secuencia de escape \u0020 indica que se debe insertar el carácter Unicode con valor ordinal 0x0020 (el espacio en blanco) en la posición dada.
Otros caracteres son interpretados usando su respectivo valor ordinal como ordinales Unicode. Si tenés cadenas de texto literales en la codificación estándar
Latin-1 que es muy usada en países occidentales, encontrarás conveniente que los primeros 256 caracteres de Unicode son los mismos primeros 256 caracteres
de Latin-1.
También existe un modo crudo para expertos, del mismo modo que con las cadenas de texto normales. Debés anteponer 'ur' a la comilla inicial para que Python
use el modo de escape crudo de Unicode. Solo se aplicará la conversión \uXXXX si hay un número impar de barras invertidas frente a la 'u'.
El modo crudo es útil principalmente cuando tenés que insertar muchas barras invertidas, como puede suceder al trabajar con expresiones regulares.
Además de estas codificaciones estándar, Python provee muchas más formas de crear cadenas de texto Unicode en las bases de codificaciones conocidas.
La función predefinida unicode() da acceso a todos los codecs (CODificadores y DECodificadores). Algunos de los códigos más conocidos que estos codecs
pueden convertir son Latin-1, ASCII, UTF-8, y UTF-16. Los dos últimas son códigos de longitud variable que almacenan cada carácter Unicode en uno o más
bytes. El código por defecto es normalmente configurado a ASCII, que contiene los caracteres del rango 0-127 y rechaza cualquier otro con un error. Cuando
una cadena Unicode se imprime, escribe en un archivo, o se convierte con la función str(), se realiza la conversión utilizando el código por defecto.
>>> u"abc" u'abc' >>> str(u"abc") 'abc' >>> u"äöü" u'\xe4\xf6\xfc' >>> str(u"äöü") ... UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-5: ordinal not in range(128)
Para convertir una cadena Unicode en una cadena de 8-bit utilizando un código en particular, los objetos Unicode tienen un método encode() que toma un
argumento, el nombre del código. Se prefieren los nombres en minúsculas para los nombres de los códigos.
23
Si tenés datos en un código en particular y querés producir la cadena Unicode correspondiente, podés usar la función unicode() con el nombre del código como
segundo argumento.
Python tiene varios tipos de datos compuestos, usados para agrupar otros valores. El más versátil es la lista, la cual puede ser escrita como una lista de valores
separados por coma (ítems) entre corchetes. No es necesario que los ítems de una lista tengan todos el mismo tipo.
>>> a = ['pan', 'huevos', 100, 1234] >>> a ['pan', 'huevos', 100, 1234]
Como los índices de las cadenas de texto, los índices de las listas comienzan en 0, y las listas pueden ser rebanadas, concatenadas y todo lo demás:
>>> a[0] 'pan' >>> a[3] 1234 >>> a[-2] 100 >>> a[1:-1] ['huevos', 100] >>> a[:2] + ['carne', 2*2] ['pan', 'huevos', 'carne', 4] >>> 3*a[:3] + ['Boo!']
['pan', 'huevos', 100, 'pan', 'huevos', 100, 'pan', 'huevos', 100, 'Boo!']
A diferencia de las cadenas de texto, que son inmutables, es posible cambiar un elemento individual de una lista:
>>> a ['pan', 'huevos', 100, 1234] >>> a[2] = a[2] + 23 >>> a ['pan', 'huevos', 123,
1234]
También es posible asignar a una rebanada, y esto incluso puede cambiar la longitud de la lista o vaciarla totalmente:
24
>>> a [1, 12, 123, 1234] >>> # Borrar algunos: ... a[0:2] = [] >>> a [123, 1234] >>> # Insertar algunos: ... a[1:1] = ['bruja', 'xyzzy'] >>> a
[123, 'bruja', 'xyzzy', 1234] >>> # Insertar (una copia de) la misma lista al principio >>> a[:0] = a >>> a [123, 'bruja', 'xyzzy', 1234, 123,
'bruja', 'xyzzy', 1234] >>> # Vaciar la lista: reemplazar todos los items con una lista vacía >>> a[:] = [] >>> a []
>>> a = ['a', 'b', 'c', 'd'] >>> len(a) 4Es posible anidar listas (crear listas que contengan otras listas), por ejemplo:
>>> q = [2, 3] >>> p = [1, q, 4] >>> len(p) 3>>> p[1] [2, 3] >>> p[1][0] 2>>> p[1].append('extra') # Ver
Notá que en el último ejemplo, p[1] y q ¡realmente hacen referencia al mismo objeto! Volveremos a la semántica de los objetos más adelante.
25
>>> # Series de Fibonacci: ... # la suma de dos elementos define el siguiente ... a, b = 0, 1 >>> while b < 10: ...
print b ... a, b = b, a+b ... 112358Este ejemplo introduce varias características nuevas.
• La primer línea contiene una asignación múltiple: las variables``a`` y b toman en forma simultanea los nuevos valores 0 y 1. En la última linea esto es
vuelto a usar, demostrando que las expresiones a la derecha son evaluadas antes de que suceda cualquier asignación. Las expresiones a la derecha son
evaluadas de izquierda a derecha.
• El bucle while se ejecuta mientras la condición (aquí: b < 10) sea verdadera. En Python, como en C, cualquier entero distinto de cero es verdadero; cero
es falso. La condición también puede ser una cadena de texto o una lista, de hecho cualquier secuencia; cualquier cosa con longitud distinta de cero es
verdadero, las secuencias vacías son falsas. La prueba usada en el ejemplo es una comparación simple. Los operadores estándar de comparación se
escriben igual que en C: < (menor qué), > (mayor qué), == (igual a), <= (menor o igual qué), >= (mayor o igual qué) y != (distinto a).
• El cuerpo del bucle está sangrado: la sangría es la forma que usa Python para agrupar declaraciones. El intérprete interactivo de Python (¡aún!) no
provee una facilidad inteligente para editar líneas, así que debés teclear un tab o espacio(s) para cada línea sangrada. En la práctica vas a preparar
entradas más complicadas para Python con un editor de texto; la mayoría de los editores de texto tienen la facilidad de agregar la sangría
automáticamente. Al ingresar una declaración compuesta en forma interactiva, debés finalizar con una línea en blanco para indicar que está completa (ya
que el analizador no puede adivinar cuando tecleaste la última línea). Notá que cada línea de un bloque básico debe estar sangrada de la misma forma.
26
• La declaración print escribe el valor de la o las expresiones que se le pasan. Difiere de simplemente escribir la expresión que se quiere mostrar (como
hicimos antes en los ejemplos de la calculadora) en la forma en que maneja múltiples expresiones y cadenas. Las cadenas de texto son impresas sin
comillas, y un espacio en blanco es insertado entre los elementos, así podés formatear cosas de una forma agradable:
>>> a, b = 0, 1 >>> while b < 1000: ... print b, ... a, b = b, a+b ... 1 1 2 3 5 8 13 21 34 55 89 144 233 377
610 987
Notá que el intérprete inserta un salto de línea antes de imprimir el próximo prompt si la última línea no estaba completa.
27
La sentencia if
Tal vez el tipo más conocido de sentencia sea el if. Por ejemplo:
>>> x = int(raw_input("Ingresa un entero, por favor: ")) Ingresa un entero, por favor: 42 >>> if x < 0: ... x = 0 ... print
'Negativo cambiado a cero' ... elif x == 0: ... print 'Cero' ... elif x == 1: ... print 'Simple' ... else: ... print 'Mas' ... 'Mas'
Puede haber cero o más bloques elif, y el bloque else es opcional. La palabra reservada 'elif' es una abreviación de 'else if', y es útil para evitar un sangrado
excesivo. Una secuencia if ... elif ... elif ... sustituye las sentencias switch o case encontradas en otros lenguajes.
La sentencia for
La sentencia for en Python difiere un poco de lo que uno puede estar acostumbrado en lenguajes como C o Pascal. En lugar de siempre iterar sobre una
progresión aritmética de números (como en Pascal) o darle al usuario la posibilidad de definir tanto el paso de la iteración como la condición de fin (como en
C), la sentencia for de Python itera sobre los ítems de cualquier secuencia (una lista o una cadena de texto), en el orden que aparecen en la secuencia. Por
ejemplo:
>>> # Midiendo cadenas de texto ... a = ['gato', 'ventana', 'defenestrado'] >>> for x in a: ... print x,
len(x) ... gato 4 ventana 7
28
defenestrado 12
No es seguro modificar la secuencia sobre la que se está iterando en el lazo (esto solo es posible para tipos de secuencias mutables, como las listas). Si se
necesita modificar la lista sobre la que se está iterando (por ejemplo, para duplicar ítems seleccionados) se debe iterar sobre una copia. La notación de
rebanada es conveniente para esto:
>>> for x in a[:]: # hacer una copia por rebanada de toda la lista ... if len(x) > 6: a.insert(0, x) ... >>> a ['defenestrado', 'ventana', 'gato',
'ventana', 'defenestrado']
La función range()
Si se necesita iterar sobre una secuencia de números, es apropiado utilizar la función integrada range(). Genera una lista conteniendo progresiones aritméticas:
El valor final dado nunca es parte de la lista; range(10) genera una lista de 10 valores, los índices correspondientes para los ítems de una secuencia de longitud
10. Es posible hacer que el rango empiece con otro número, o especificar un incremento diferente (incluso negativo; algunas veces se lo llama 'paso'):
>>> range(5, 10) [5, 6, 7, 8, 9] >>> range(0, 10, 3) [0, 3, 6, 9] >>> range(-10,
-100, -30) [-10, -40, -70]
Para iterar sobre los índices de una secuencia, podés combinar range() y len() así:
>>> a = ['Mary', 'tenia', 'un', 'corderito'] >>> for i in range(len(a)): ... print i, a[i] ... 0 Mary 1 tenia 2 un 3
corderito
En la mayoría de los casos, sin embargo, conviene usar la función enumerate(), mirá tut-loopidioms.
29
La sentencia continue, también tomada prestada de C, continua con la próxima iteración del lazo.
Las sentencias de lazo pueden tener una cláusula else que es ejecutada cuando el lazo termina, luego de agotar la lista (con for) o cuando la condición se hace
falsa (con while), pero no cuando el lazo es terminado con la sentencia break. Se ejemplifica en el siguiente lazo, que busca números primos:
>>> for n in range(2, 10): ... for x in range(2, n): ... if n % x == 0: ... print n, 'es igual a', x, '*', n/x ... break ... else: ...
# sigue el bucle sin encontrar un factor ... print n, 'es un numero primo' ... 2 es un numero primo 3 es un numero
primo 4 es igual a 2 * 2 5 es un numero primo 6 es igual a 2 * 3 7 es un numero primo 8 es igual a 2 * 4 9 es igual a 3
*3
La sentencia pass
La sentencia pass no hace nada. Se puede usar cuando una sentencia es requerida por la sintáxis pero el programa no requiere ninguna acción. Por ejemplo:
>>> while True: ... pass # Espera ocupada hasta una interrupción de teclado (Ctrl+C) ...
30
Otro lugar donde se puede usar pass es como una marca de lugar para una función o un cuerpo condicional cuando estás trabajando en código nuevo, lo cual te
permite pensar a un nivel de abstracción mayor. El pass se ignora silenciosamente:
funciones
Podemos crear una función que escriba la serie de Fibonacci hasta un límite determinado:
>>> def fib(n): # escribe la serie de Fibonacci hasta n ... """Escribe la serie de Fibonacci hasta n.""" ... a, b = 0, 1 ... while b
< n: ... print b, ... a, b = b, a+b ... >>> # Ahora llamamos a la funcion que acabamos de definir: ... fib(2000) 1 1 2 3 5 8 13 21
34 55 89 144 233 377 610 987 1597
La palabra reservada def se usa para definir funciones. Debe seguirle el nombre de la función y la lista de parámetros formales entre paréntesis. Las sentencias
que forman el cuerpo de la función empiezan en la línea siguiente, y deben estar con sangría.
La primer sentencia del cuerpo de la función puede ser opcionalmente una cadena de texto literal; esta es la cadena de texto de documentación de la función, o
docstring. (Podés encontrar más acerca de docstrings en la sección tut-docstrings.)
Hay herramientas que usan las docstrings para producir automáticamente documentación en línea o imprimible, o para permitirle al usuario que navegue el
código en forma interactiva; es una buena práctica incluir docstrings en el código que uno escribe, por lo que se debe hacer un hábito de esto.
La ejecución de una función introduce una nueva tabla de símbolos usada para las variables locales de la función. Más precisamente, todas las asignaciones de
variables en la función almacenan el valor en la tabla de símbolos local; así mismo la referencia a variables primero mira la tabla de símbolos local, luego en la
tabla de símbolos local de las funciones externas, luego la tabla de símbolos global, y finalmente la tabla de nombres predefinidos. Así, no se les puede asignar
directamente un valor a las variables globales dentro de una función (a menos se las nombre en la sentencia global), aunque si pueden ser referenciadas.
Los parámetros reales (argumentos) de una función se introducen en la tabla de símbolos local de la función llamada cuando esta es ejecutada; así, los
argumentos son pasados por valor (dónde el valor es
31
siempre una referencia a un objeto, no el valor del objeto). 2 Cuando una función llama a otra función, una nueva tabla de símbolos local es creada para esa
llamada.
La definición de una función introduce el nombre de la función en la tabla de símbolos actual. El valor del nombre de la función tiene un tipo que es
reconocido por el interprete como una función definida por el usuario. Este valor puede ser asignado a otro nombre que luego puede ser usado como una
función. Esto sirve como un mecanismo general para renombrar:
Viniendo de otros lenguajes, podés objetar que fib no es una función, sino un procedimiento, porque no devuelve un valor. De hecho, técnicamente hablando,
los procedimientos sí retornan un valor, aunque uno aburrido. Este valor se llama None (es un nombre predefinido). El intérprete por lo general no escribe el
valor None si va a ser el único valor escrito. Si realmente se quiere, se puede verlo usando print:
Es simple escribir una función que retorne una lista con los números de la serie de Fibonacci en lugar de imprimirlos:
>>> def fib2(n): # devuelve la serie de Fibonacci hasta n ... """Devuelve una lista conteniendo la serie de Fibonacci hasta n.""" ... result = [] ... a, b = 0,
1 ... while b < n: ... result.append(b) # ver abajo ... a, b = b, a+b ... return result ... >>> f100 = fib2(100) # llamarla >>> f100 # escribir el resultado [1,
1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
• La sentencia return devuelve un valor en una función. return sin una expresión como argumento retorna None. Si se alcanza el final de una función,
también se retorna None.
32
• La sentencia result.append(b) llama a un método del objeto lista result. Un método es una función que 'pertenece' a un objeto y se nombra
obj.methodname, dónde obj es algún objeto (puede ser una expresión), y methodname es el nombre del método que está definido por el tipo del objeto.
Distintos tipos definen distintos métodos. Métodos de diferentes tipos pueden tener el mismo nombre sin causar ambigüedad. (Es posible definir tipos de
objetos propios, y métodos, usando clases, mirá tut-classes). El método append() mostrado en el ejemplo está definido para objetos lista; añade un nuevo
elemento al final de la lista. En este ejemplo es equivalente a result = result + [b], pero más eficiente.
La forma más útil es especificar un valor por omisión para uno o más argumentos. Esto crea una función que puede ser llamada con menos argumentos que los
que permite. Por ejemplo:
Este ejemplo también introduce la palabra reservada in, la cual prueba si una secuencia contiene o no un determinado valor.
Los valores por omisión son evaluados en el momento de la definición de la función, en el ámbito de la definición, entonces:
33
i=5
i = 6 f()
...imprimirá 5.
Advertencia importante: El valor por omisión es evaluado solo una vez. Existe una diferencia cuando el valor por omisión es un objeto mutable como una
lista, diccionario, o instancia de la mayoría de las clases. Por ejemplo, la siguiente función acumula los argumentos que se le pasan en subsiguientes llamadas:
Imprimirá:
Si no se quiere que el valor por omisión sea compartido entre subsiguientes llamadas, se pueden escribir la función así:
Las funciones también puede ser llamadas nombrando a los argumentos de la forma keyword = value. Por ejemplo, la siguiente función:
34
print "-- Gran plumaje tiene el", tipo print "-- Esta", estado, "!"
loro() # falta argumento obligatorio loro(tension=5.0, 'muerto') # argumento nombrado seguido de uno posicional loro(110, tension=220) # valor
duplicado para argumento loro(actor='Juan Garau') # palabra clave desconocida
En general, una lista de argumentos debe tener todos sus argumentos posicionales seguidos por los argumentos nombrados, dónde las palabras claves deben ser
elegidas entre los nombres de los parámetros formales. No es importante si un parámetro formal tiene un valor por omisión o no. Ningún argumento puede
recibir un valor más de una vez (los nombres de parámetros formales correspondientes a argumentos posicionales no pueden ser usados como palabras clave
en la misma llamada). Aquí hay un ejemplo que falla debido a esta restricción:
>>> def funcion(a): ... pass ... >>> funcion(0, a=0) ... TypeError: funcion() got multiple values for keyword argument 'a'
Cuando un parámetro formal de la forma **nombre está presente al final, recibe un diccionario (ver typesmapping) conteniendo todos los argumentos
nombrados excepto aquellos correspondientes a un parámetro formal. Esto puede ser combinado con un parámetro formal de la forma *nombre (descripto en la
siguiente sección) que recibe una tupla conteniendo los argumentos posicionales además de la lista de parámetros formales. (*nombre debe ocurrir antes de
**nombre). Por ejemplo, si definimos una función así:
35
for c in claves:
print c, ":", palabrasclaves[c]
-- ¿Tiene Limburger ? -- Lo siento, nos quedamos sin Limburger Es muy liquido, sr. Realmente es
muy muy liquido, sr. ---------------------------------------- cliente : Juan Garau vendedor : Miguel Paez
puesto : Venta de Queso Argentino
Se debe notar que el método sort() de la lista de nombres de argumentos nombrados es llamado antes de imprimir el contenido del diccionario palabrasclaves;
si esto no se hace, el orden en que los argumentos son impresos no está definido.
Finalmente, la opción menos frecuentemente usada es especificar que una función puede ser llamada con un número arbitrario de argumentos. Estos
argumentos serán organizados en una tupla (mirá tut-tuples). Antes del número variable de argumentos, cero o más argumentos normales pueden estar
presentes.:
La situación inversa ocurre cuando los argumentos ya están en una lista o tupla pero necesitan ser desempaquetados para llamar a una función que requiere
argumentos posicionales separados. Por ejemplo, la función predefinida range() espera los argumentos inicio y fin. Si no están disponibles en forma separada,
se puede escribir la llamada a la función con el operador para desempaquetar argumentos de una lista o una tupla *::
36
>>> range(3, 6) # llamada normal con argumentos separados [3, 4, 5] >>> args = [3, 6] >>> range(*args) # llamada con argumentos desempaquetados de
una lista [3, 4, 5]
Del mismo modo, los diccionarios pueden entregar argumentos nombrados con el operador **::
>>> def loro(tension, estado='rostizado', accion='explotar'): ... print "-- Este loro no va a", accion, ... print "si le aplicas", tension, "voltios.", ... print "Esta", estado,
"!" ... >>> d = {"tension": "cuatro millones", "estado": "demacrado", ... "accion": "VOLAR"} >>> loro(**d) -- Este loro no va a VOLAR si le aplicas cuatro millones
voltios. Esta demacrado !
Por demanda popular, algunas características comúnmente encontradas en lenguajes de programación funcionales como Lisp fueron añadidas a Python. Con la
palabra reservada lambda se pueden crear pequeñas funciones anónimas. Esta es una función que devuelve la suma de sus dos argumentos: lambda a, b: a+b.
Las formas con lambda pueden ser usadas en cualquier lugar que se requieran funciones. Semánticamente, son solo azúcar sintáctica para la definición de
funciones. Cómo en la definición de funciones anidadas, las formas con lambda pueden hacer referencia a variables del ámbito en el que son contenidas:
37
Hay convenciones emergentes sobre el contenido y formato de las cadenas de texto de documentación.
La primer línea debe ser siempre un resumen corto y conciso del propósito del objeto. Para ser breve, no se debe mencionar explícitamente el nombre o tipo
del objeto, ya que estos están disponibles de otros modos (excepto si el nombre es un verbo que describe el funcionamiento de la función). Esta línea debe
empezar con una letra mayúscula y terminar con un punto.
Si hay más líneas en la cadena de texto de documentación, la segunda línea debe estar en blanco, separando visualmente el resumen del resto de la descripción.
Las líneas siguientes deben ser uno o más párrafos describiendo las convenciones para llamar al objeto, efectos secundarios, etc.
El analizador de Python no quita el sangrado de las cadenas de texto literales multi-líneas, entonces las herramientas que procesan documentación tienen que
quitarlo si así lo desean. Esto se hace mediante la siguiente convención. La primer línea que no está en blanco siguiente a la primer línea de la cadena
determina la cantidad de sangría para toda la cadena de documentación. (No podemos usar la primer línea ya que generalmente es adyacente a las comillas de
apertura de la cadena y el sangrado no se nota en la cadena de texto). Los espacios en blanco "equivalentes" a este sangrado son luego quitados del comienzo
de cada línea en la cadena. No deberían haber líneas con una sangría menor, pero si las hay todos los espacios en blanco del comienzo deben ser quitados. La
equivalencia de espacios en blanco debe ser verificada luego de la expansión de tabs (a 8 espacios, normalmente).
>>> def mi_funcion(): ... """No hace mas que documentar la funcion. ... ... No, de verdad. No hace nada. ... """
... pass ... >>> print mi_funcion.__doc__ No hace mas que documentar la funcion.
38
Para Python, PEP 8 se erigió como la guía de estilo a la que más proyectos adhirieron; promueve un estilo de codificación fácil de leer y visualmente
agradable. Todos los desarrolladores Python deben leerlo en algún momento; aquí están extraídos los puntos más importantes:
4 espacios son un buen compromiso entre una sangría pequeña (permite mayor nivel de sangrado)y una sangría grande (más fácil de leer). Los tabs
introducen confusión y es mejor dejarlos de lado.
• Recortar las líneas para que no superen los 79 caracteres.
Esto ayuda a los usuarios con pantallas pequeñas y hace posible tener varios archivos de código abiertos, uno al lado del otro, en pantallas grandes.
• Usar líneas en blanco para separar funciones y clases, y bloques grandes de código dentro de funciones.
• Cuando sea posible, poner comentarios en una sola línea.
• Usar docstrings.
• Usar espacios alrededor de operadores y luego de las comas, pero no directamente dentro de paréntesis: a = f(1, 2) + g(3, 4).
• Nombrar las clases y funciones consistentemente; la convención es usar NotacionCamello para clases y minusculas_con_guiones_bajos para funciones
y métodos. Siempre usá self como el nombre para el primer argumento en los métodos (mirá tut-firstclasses para más información sobre clases y
métodos).
• No usar codificaciones estrafalarias si se espera usar el código en entornos internacionales. ASCII plano funciona bien en la mayoría de los casos.
2 En realidad, llamadas por referencia de objeto sería una mejor descripción, ya que si se pasa un objeto mutable, quien realiza la llamada verá cualquier
cambio que se realice sobre el mismo (por ejemplo ítems insertados en una lista).
39
Estructuras de datos
Este capítulo describe algunas cosas que ya aprendiste en más detalle, y agrega algunas cosas nuevas también.
list.append(x)
Agrega un ítem al final de la lista; equivale a a[len(a):] = [x].
list.extend(L)
Extiende la lista agregándole todos los ítems de la lista dada; equivale a a[len(a):] = L.
list.insert(i,x)
Inserta un ítem en una posición dada. El primer argumento es el índice del ítem delante del cual se insertará, por lo tanto a.insert(0, x) inserta al principio de
la lista, y a.insert(len(a), x) equivale a a.append(x).
list.remove(x)
Quita el primer ítem de la lista cuyo calor sea x. Es un error si no existe tal ítem.
list.pop([i])
Quita el ítem en la posición dada de la lista, y lo devuelve. Si no se especifica un índice, a.pop() quita y devuelve el último ítem de la lista. (Los corchetes
que encierran a i en la firma del método denotan que el parámetro es opcional, no que deberías escribir corchetes en esa posición. Verás esta notación con
frecuencia en la Referencia de la Biblioteca de Python.)
list.index(x)
Devuelve el índice en la lista del primer ítem cuyo valor sea x. Es un error si no existe tal ítem.
list.count(x)
Devuelve el número de veces que x aparece en la lista.
list.sort()
Ordena los ítems de la lista, in situ.
list.reverse()
Invierte los elementos de la lista, in situ.
>>> a = [66.25, 333, 333, 1, 1234.5] >>> print a.count(333), a.count(66.25), a.count('x') 2 1 0 >>> a.insert(2, -1)
40
>>> a.append(333) >>> a [66.25, 333, -1, 333, 1, 1234.5, 333] >>> a.index(333) 1>>>
a.remove(333) >>> a [66.25, -1, 333, 1, 1234.5, 333] >>> a.reverse() >>> a [333, 1234.5, 1,
333, -1, 66.25] >>> a.sort() >>> a [-1, 1, 66.25, 333, 333, 1234.5]
Usando listas como pilas
Los métodos de lista hacen que resulte muy fácil usar una lista como una pila, donde el último elemento añadido es el primer elemento retirado ("último en
entrar, primero en salir"). Para agregar un ítem a la cima de la pila, use append(). Para retirar un ítem de la cima de la pila, use pop() sin un índice explícito.
Por ejemplo:
41
También puedes usar una lista convenientemente como una cola, donde el primer elemento añadido es el primer elemento retirado ("primero en entrar, primero
en salir"). Para agregar un ítem al final de la cola, use append(). Para retirar un ítem del frente de la pila, use pop() con 0 como índice. Por ejemplo:
>>> queue = ["Eric", "John", "Michael"] >>> queue.append("Terry") # llega Terry >>> queue.append("Graham") #
llega Graham >>> queue.pop(0) 'Eric' >>> queue.pop(0) 'John' >>> queue ['Michael', 'Terry', 'Graham']
Hay tres funciones integradas que son muy útiles cuando se usan con listas: filter(), map(), y reduce().
filter(funcion, secuencia) devuelve una secuencia con aquellos ítems de la secuencia para los cuales funcion(item) es verdadero. Si secuencia es un string o
tuple, el resultado será del mismo tipo; de otra manera, siempre será list. Por ejemplo, para calcular unos números primos:
>>> def f(x): return x % 2 != 0 and x % 3 != 0 ... >>> filter(f, range(2, 25)) [5, 7, 11, 13, 17, 19, 23]
map(funcion, secuencia) llama a funcion(item) por cada uno de los ítems de la secuencia y devuelve una lista de los valores retornados. Por ejemplo, para
calcular unos cubos:
>>> def cubo(x): return x*x*x ... >>> map(cubo, range(1, 11)) [1, 8, 27, 64, 125, 216, 343, 512, 729,
1000]
Se puede pasar más de una secuencia; la función debe entonces tener tantos argumentos como secuencias haya y es llamada con el ítem correspondiente de
cada secuencia (o None si alguna secuencia es más corta que otra). Por ejemplo:
>>> sec = range(8) >>> def add(x, y): return x+y ...
42
>>> map(add, sec, sec) [0, 2, 4, 6, 8, 10, 12, 14]
reduce(funcion, secuencia) devuelve un único valor que se construye llamando a la función binaria funcion con los primeros dos ítems de la secuencia, entonces
con el resultado y el siguiente ítem, y así sucesivamente. Por ejemplo, para calcular la suma de los números de 1 a 10:
>>> def sumar(x,y): return x+y ... >>> reduce(sumar, range(1, 11)) 55
Si sólo hay un ítem en la secuencia, se devuelve su valor; si la secuencia está vacía, se lanza una excepción.
Un tercer argumento puede pasarse para indicar el valor inicial. En este caso el valor inicial se devuelve para una secuencia vacía, y la función se aplica
primero al valor inicial y el primer ítem de la secuencia, entonces al resultado y al siguiente ítem, y así sucesivamente. Por ejemplo,
>>> def sum(sec): ... def sumar(x,y): return x+y ... return reduce(sumar, sec, 0) ... >>> sum(range(1, 11)) 55>>> sum([]) 0No uses la definición de este
ejemplo de sum(): ya que la sumatoria es una necesidad tan común, se provee una función integrada sum(secuencia) que funciona exactamente así.
Las listas por comprensión proveen una forma concisa de crear listas sin tener que recurrir al uso de map(), filter() y/o lambda. La definición resultante de la
lista a menudo tiende a ser más clara que las listas formadas usando esas construcciones.
Cada lista por comprensión consiste de una expresión seguida por una cláusula for, luego cero o más cláusulas for o if. El resultado será una lista que resulta de
evaluar la expresión en el contexto de las cláusulas for y if que sigan. Si la expresión evalua a una tupla, debe encerrarse entre paréntesis.
>>> frutafresca = [' banana', ' mora de Logan ', 'maracuya '] >>> [arma.strip() for arma in frutafresca] ['banana', 'mora de Logan',
'maracuya'] >>> vec = [2, 4, 6] >>> [3*x for x in vec]
43
[6, 12, 18] >>> [3*x for x in vec if x > 3] [12, 18] >>> [3*x for x in vec if x < 2] []>>> [[x,x**2] for x in vec] [[2, 4], [4, 16], [6, 36]] >>> [x, x**2
for x in vec] # error - se requieren paréntesis para tuplas ...
[x, x**2 for x in vec]
^ SyntaxError: invalid syntax >>> [(x, x**2) for x in vec] [(2, 4), (4, 16), (6, 36)] >>>
vec1 = [2, 4, 6] >>> vec2 = [4, 3, -9] >>> [x*y for x in vec1 for y in vec2] [8, 6, -18, 16, 12, -36, 24, 18, -54]
>>> [x+y for x in vec1 for y in vec2] [6, 5, -7, 8, 7, -5, 10, 9, -3] >>> [vec1[i]*vec2[i] for i in
range(len(vec1))] [8, 12, -54]
Las listas por comprensión son mucho más flexibles que map() y pueden aplicarse a expresiones complejas y funciones anidadas:
>>> [str(round(355/113.0, i)) for i in range(1,6)] ['3.1', '3.14', '3.142', '3.1416', '3.14159']
Si tienes el estómago suficiente, las listas por comprensión pueden anidarse. Son una herramienta poderosa pero, como toda herramienta poderosa, deben
usarse con cuidado, o ni siquiera usarse.
Considera el siguiente ejemplo de una matriz de 3x3 como una lista que contiene tres listas, una por fila:
>>> mat = [ ... [1, 2, 3], ... [4, 5, 6], ... [7, 8, 9], ... ]
Ahora, si quisieras intercambiar filas y columnas, podrías usar una lista por comprensión:
44
>>> print [[fila[i] for fila in mat] for i in [0, 1, 2]] [[1, 4, 7], [2, 5, 8], [3, 6, 9]]
Para evitar aprensión cuando se anidan lista por comprensión, lee de derecha a izquierda.
Una versión más detallada de este retazo de código muestra el flujo de manera explícita:
En el mundo real, deberías preferir funciones predefinidas a declaraciones con flujo complejo. La función zip() haría un buen trabajo para este caso de uso:
La instrucción del
Hay una manera de quitar un ítem de una lista dado su índice en lugar de su valor: la instrucción del. Esta es diferente del método pop(), el cual devuelve un
valor. La instrucción del también puede usarse para quitar secciones de una lista o vaciar la lista completa (lo que hacíamos antes asignando una lista vacía a la
sección). Por ejemplo:
>>> a = [-1, 1, 66.25, 333, 333, 1234.5] >>> del a[0] >>> a [1, 66.25, 333, 333, 1234.5] >>> del
a[2:4] >>> a [1, 66.25, 1234.5] >>> del a[:] >>> a []
>>> del a
Hacer referencia al nombre a de aquí en más es un error (al menos hasta que se le asigne otro valor). Veremos otros usos para del más adelante.
45
Tuplas y secuencias
Vimos que las listas y cadenas tienen propiedades en común, como el indizado y las operaciones de seccionado. Estas son dos ejemplos de datos de tipo
secuencia (ver typesseq). Como Python es un lenguaje en evolución, otros datos de tipo secuencia pueden agregarse. Existe otro dato de tipo secuencia
estándar: la tupla.
Una tupla consiste de un número de valores separados por comas, por ejemplo:
>>> t = 12345, 54321, 'hola!' >>> t[0] 12345 >>> t (12345, 54321, 'hola!') >>> # Las tuplas pueden
anidarse: ... u = t, (1, 2, 3, 4, 5) >>> u ((12345, 54321, 'hola!'), (1, 2, 3, 4, 5))
Como puedes ver, en la salida las tuplas siempre se encierran entre paréntesis, para que las tuplas anidadas puedan interpretarse correctamente; pueden
ingresarse con o sin paréntesis, aunque a menudo los paréntesis son necesarios de todas formas (si la tupla es parte de una expresión más grande).
Las tuplas tienen muchos usos. Por ejemplo: pares ordenados (x, y), registros de empleados de una base de datos, etc. Las tuplas, al igual que las cadenas, son
inmutables: no es posible asignar a los ítems individuales de una tupla (aunque puedes simular bastante ese efecto mediante seccionado y concatenación).
También es posible crear tuplas que contengan objetos mutables como listas.
Un problema particular es la construcción de tuplas que contengan 0 o 1 ítem: la sintaxis presenta algunas peculiaridades para estos casos. Las tuplas vacías se
construyen mediante un par de paréntesis vacío; una tupla con un ítem se construye poniendo una coma a continuación del valor (no alcanza con encerrar un
único valor entre paréntesis). Feo, pero efectivo. Por ejemplo:
>>> vacia = () >>> singleton = 'hola', # <-- notar la coma al final >>> len(vacia) 0>>> len(singleton) 1>>> singleton
('hola',)
La declaración t = 12345, 54321, 'hola!' es un ejemplo de empaquetado de tuplas: los valores 12345, 54321 y 'hola!' se empaquetan juntos en una tupla.
46
>>> x, y, z = t
Esto se llama, apropiadamente, desempaquetado de secuencias, y funciona para cualquier secuencia en el lado derecho del igual. El desempaquetado de
secuencias requiere que la lista de variables a la izquierda tenga el mismo número de elementos que el tamaño de la secuencia. Notá que la asignación múltiple
es en realidad sólo una combinación de empaquetado de tuplas y desempaquetado de secuencias.
Conjuntos
Python también incluye un tipo de dato para conjuntos. Un conjunto es una colección no ordenada y sin elementos repetidos. Los usos básicos de éstos
incluyen verificación de pertenencia y eliminación de entradas duplicadas. Los conjuntos también soportan operaciones matemáticas como la unión,
intersección, diferencia, y diferencia simétrica.
>>> canasta = ['manzana', 'naranja', 'manzana', 'pera', 'naranja', 'banana'] >>> fruta = set(canasta) # crea un conjunto sin repetidos >>> fruta set(['pera',
'manzana', 'banana', 'naranja']) >>> 'naranja' in fruta # verificación de pertenencia rápida True >>> 'yerba' in fruta False
>>> # veamos las operaciones para las letras únicas de dos palabras ... >>> a = set('abracadabra') >>> b = set('alacazam') >>> a # letras únicas en a
set(['a', 'r', 'b', 'c', 'd']) >>> a - b # letras en a pero no en b set(['r', 'b', 'd']) >>> a | b # letras en a o en b set(['a', 'c', 'b', 'd', 'm', 'l', 'r', 'z']) >>> a & b #
letras en a y en b set(['a', 'c']) >>> a ^ b # letras en a o b pero no en ambos set(['b', 'd', 'm', 'l', 'r', 'z'])
47
Diccionarios
Otro tipo de dato útil incluído en Python es el diccionario (ver typesmapping). Los diccionarios se encuentran a veces en otros lenguajes como "memorias
asociativas" o "arreglos asociativos". A diferencia de las secuencias, que se indexan mediante un rango numérico, los diccionarios se indexan con claves, que
pueden ser cualquier tipo inmutable; las cadenas y números siempre pueden ser claves. Las tuplas pueden usarse como claves si solamente contienen cadenas,
números o tuplas; si una tupla contiene cualquier objeto mutable directa o indirectamente, no puede usarse como clave. No podés usar listas como claves, ya
que las listas pueden modificarse usando asignación por índice, asignación por sección, o métodos como append() y extend().
Lo mejor es pensar en un diccionario como un conjunto no ordenado de pares clave: valor, con el requerimiento de que las claves sean únicas (dentro de un
diccionario en particular). Un par de llaves crean un diccionario vacío: {}. Colocar una lista de pares clave:valor separados por comas entre las llaves añade
pares clave:valor iniciales al diccionario; esta también es la forma en que los diccionarios se presentan en la salida.
Las operaciones principales sobre un diccionario son guardar un valor con una clave y extraer ese valor dada la clave. También es posible borrar un par
clave:valor con del. Si usás una clave que ya está en uso para guardar un valor, el valor que estaba asociado con esa clave se pierde. Es un error extraer un
valor usando una clave no existente.
El método keys() de un diccionario devuelve una lista de todas las claves en uso de ese diccionario, en un orden arbitrario (si la querés ordenada, simplemente
usá el metodo sort() sobre la lista de claves). Para verificar si una clave está en el diccionario, utilizá la palabra clave in.
>>> tel = {'jack': 4098, 'sape': 4139} >>> tel['guido'] = 4127 >>> tel {'sape': 4139, 'jack': 4098, 'guido':
4127} >>> tel['jack'] 4098 >>> del tel['sape'] >>> tel['irv'] = 4127 >>> tel {'jack': 4098, 'irv': 4127,
'guido': 4127} >>> tel.keys() ['jack', 'irv', 'guido'] >>> 'guido' in tel True
El constructor dict() crea un diccionario directamente desde listas de pares clave-valor guardados como tuplas. Cuando los pares siguen un patrón, se puede
especificar de forma compacta la lista de pares clave-valor por comprensión.
48
>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)]) {'sape': 4139, 'jack': 4098, 'guido': 4127} >>> dict([(x, x**2) for x in (2, 4, 6)]) # use a list
comprehension {2: 4, 4: 16, 6: 36}
Más adelante en este tutorial, aprenderemos acerca de Expresiones Generadoras que están mejor preparadas para la tarea de proveer pares clave-valor al
constructor dict().
Cuando las claves son cadenas simples, a veces resulta más fácil especificar los pares usando argumentos por palabra clave:
>>> dict(sape=4139, guido=4127, jack=4098) {'sape': 4139, 'jack': 4098, 'guido': 4127}
Técnicas de iteración
Cuando iteramos sobre diccionarios, se pueden obtener al mismo tiempo la clave y su valor correspondiente usando el método iteritems().
>>> caballeros = {'gallahad': 'el puro', 'robin': 'el valiente'} >>> for k, v in caballeros.iteritems(): ... print k, v ... gallahad el puro robin
el valiente
Cuando se itera sobre una secuencia, se puede obtener el índice de posición junto a su valor correspondiente usando la función enumerate().
Para iterar sobre dos o más secuencias al mismo tiempo, los valores pueden emparejarse con la función zip().
>>> preguntas = ['nombre', 'objetivo', 'color favorito'] >>> respuestas = ['lancelot', 'el santo grial', 'azul'] >>> for p, r in
zip(preguntas, respuestas): ... print 'Cual es tu {0}? {1}.'.format(p, r) ... Cual es tu nombre? lancelot.
49
Cual es tu objetivo? el santo grial. Cual es tu color favorito? azul.
Para iterar sobre una secuencia en orden inverso, se especifica primero la secuencia al derecho y luego se llama a la función reversed().
>>> for i in reversed(xrange(1,10,2)): ... print i ... 97531Para iterar sobre una secuencia ordenada, se utiliza la función sorted() la cual devuelve una nueva
lista ordenada dejando a la original intacta.
>>> canasta = ['manzana', 'naranja', 'manzana', 'pera', 'naranja', 'banana'] >>> for f in sorted(set(canasta)): ... print f ... banana manzana naranja pera
Los operadores de comparación in y not in verifican si un valor está (o no está) en una secuencia. Los operadores is e is not comparan si dos objetos son
realmente el mismo objeto; esto es significativo sólo para objetos mutables como las listas. Todos los operadores de comparación tienen la misma prioridad, la
cual es menor que la de todos los operadores numéricos.
Las comparaciones pueden encadenarse. Por ejemplo, a < b == c verifica si a es menor que b y además si b es igual a c.
Las comparaciones pueden combinarse mediante los operadores booleanos and y or, y el resultado de una comparación (o de cualquier otra expresión
booleana) puede negarse con not. Estos tienen prioridades menores que los operadores de comparación; entre ellos not tiene la mayor prioridad y or la menor,
o sea que A and not B or C equivale a (A and (not B)) or C. Como siempre, los paréntesis pueden usarse para expresar la composición deseada.
50
Los operadores booleanos and y or son los llamados operadores cortocircuito: sus argumentos se evalúan de izquierda a derecha, y la evaluación se detiene en
el momento en que se determina su resultado. Por ejemplo, si A y C son verdaderas pero B es falsa, en A and B and C no se evalúa la expresión C. Cuando se
usa como un valor general y no como un booleano, el valor devuelto de un operador cortocircuito es el último argumento evaluado.
Es posible asignar el resultado de una comparación u otra expresión booleana a una variable. Por ejemplo,
>>> cadena1, cadena2, cadena3 = '', 'Trondheim', 'Paso Hammer' >>> non_nulo = cadena1 or cadena2 or cadena3 >>> non_nulo
'Trondheim'
Notá que en Python, a diferencia de C, la asignación no puede ocurrir dentro de expresiones. Los programadores de C pueden renegar por esto, pero es algo
que evita un tipo de problema común encontrado en programas en C: escribir = en una expresión cuando lo que se quiere escribir es ==.
(1, 2, 3) < (1, 2, 4) [1, 2, 3] < [1, 2, 4] 'ABC' < 'C' < 'Pascal' < 'Python' (1, 2, 3, 4) < (1, 2, 4) (1, 2) < (1, 2, -1) (1,
2, 3) == (1.0, 2.0, 3.0) (1, 2, ('aa', 'ab')) < (1, 2, ('abc', 'a'), 4)
Observá que comparar objetos de diferentes tipos es legal. El resultado es determinístico pero arbitrario: los tipos se ordenan por su nombre. Por lo tanto, una
lista (list) siempre evalúa como menor que una cadena (string).
Los tipos numéricos diferentes se comparan a su valor numérico, o sea 0 es igual a 0.0, etc. No confiar demasiado en las reglas para comparar objetos de
diferentes tipos; pueden cambiar en una versión futura del lenguaje.
51
Módulos
Si salís del intérprete de Python y entrás de nuevo, las definiciones que hiciste (funciones y variables) se pierden. Por lo tanto, si querés escribir un programa
más o menos largo, es mejor que uses un editor de texto para preparar la entrada para el interprete y ejecutarlo con ese archivo como entrada. Esto es conocido
como crear un guión, o script. Si tu programa se vuelve más largo, quizás quieras separarlo en distintos archivos para un mantenimiento más fácil. Quizás
también quieras usar una función útil que escribiste desde distintos programas sin copiar su definición a cada programa.
Para soportar esto, Python tiene una manera de poner definiciones en un archivo y usarlos en un script o en una instancia interactiva del intérprete. Tal archivo
es llamado módulo; las definiciones de un módulo pueden ser importadas a otros módulos o al módulo principal (la colección de variables a las que tenés
acceso en un script ejecutado en el nivel superior y en el modo calculadora).
Un módulo es una archivo conteniendo definiciones y declaraciones de Python. El nombre del archivo es el nombre del módulo con el sufijo .py agregado.
Dentro de un módulo, el nombre del mismo (como una cadena) está disponible en el valor de la variable global __name__. Por ejemplo, usá tu editor de textos
favorito para crear un archivo llamado fibo.py en el directorio actual, con el siguiente contenido:
Ahora entrá al intérprete de Python e importá este módulo con la siguiente orden:
Esto no mete los nombres de las funciones definidas en fibo directamente en el espacio de nombres actual; sólo mete ahí el nombre del módulo, fibo. Usando
el nombre del módulo podés acceder a las funciones:
52
[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89] >>> fibo.__name__ 'fibo'
Cada módulo tiene su propio espacio de nombres, el que es usado como espacio de nombres global por todas las funciones definidas en el módulo. Por lo
tanto, el autor de un módulo puede usar variables globales en el módulo sin preocuparse acerca de conflictos con una variable global del usuario. Por otro lado,
si sabés lo que estás haciendo podés tocar las variables globales de un módulo con la misma notación usada para referirte a sus funciones,
nombremodulo.nombreitem.
Los módulos pueden importar otros módulos. Es costumbre pero no obligatorio el ubicar todas las declaraciones import al principio del módulo (o script, para
el caso). Los nombres de los módulos importados se ubican en el espacio de nombres global del módulo que hace la importación.
Hay una variante de la declaración import que importa los nombres de un módulo directamente al espacio de nombres del módulo que hace la importación. Por
ejemplo:
>>> from fibo import fib, fib2 >>> fib(500) 1 1 2 3 5 8 13 21 34 55 89 144 233 377
Esto no introduce en el espacio de nombres local el nombre del módulo desde el cual se está importando (entonces, en el ejemplo, fibo no se define).
Hay incluso una variante para importar todos los nombres que un módulo define:
Esto importa todos los nombres excepto aquellos que comienzan con un subrayado (_).
53
Nota
Por razones de eficiencia, cada módulo se importa una vez por sesión del intérprete. Por lo tanto, si modificás los módulos, tenés que reiniciar el
intérprete -- o, si es sólo un módulo que querés probar interactivamente, usá reload(), por ejemplo reload(nombremodulo).
...el código en el módulo será ejecutado, tal como si lo hubieses importado, pero con __name__ con el valor de "__main__". Eso significa que agregando este
código al final de tu módulo:
if __name__ == "__main__":
import sys fib(int(sys.argv[1]))
...podés hacer que el archivo sea utilizable tanto como script, como módulo importable, porque el código que analiza la linea de órdenes sólo se ejecuta si el
módulo es ejecutado como archivo principal:
$ python fibo.py 50 1 1 2 3 5 8 13 21 34
Esto es frecuentemente usado para proveer al módulo una interfaz de usuario conveniente, o para propósitos de prueba (ejecutar el módulo como un script
ejecuta el juego de pruebas).
El camino de búsqueda de los módulos
Cuando se importa un módulo llamado spam, el intérprete busca un archivo llamado spam.py en el directorio actual, y luego en la lista de directorios
especificada por la variable de entorno PYTHONPATH. Esta tiene la misma sintáxis que la variable de shell PATH, o sea, una lista de nombres de directorios.
Cuando PYTHONPATH no está configurada, o cuando el archivo no se encuentra allí, la búsqueda continua en un camino por omisión que depende de la
instalación; en Unix, este es normalmente .:/usr/lib/python.
En realidad, los módulos se buscan en la lista de directorios dada por la variable sys.path, la cual se inicializa con el directorio que contiene al script de entrada
(o el directorio actual), PYTHONPATH, y el
54
directorio default dependiente de la instalación. Esto permite que los programas en Python que saben lo que están haciendo modifiquen o reemplacen el
camino de búsqueda de los módulos. Notar que como el directorio que contiene el script que se ejecuta está en el camino de búsqueda, es importante que el
script no tenga el mismo nombre que un módulo estándar, o Python intentará cargar el script como un módulo cuando ese módulo se importe. Esto
generalmente será un error. Mirá la sección tut-standardmodules para más información.
Como una importante aceleración del tiempo de arranque para programas cortos que usan un montón de los módulos estándar, si un archivo llamado spam.pyc
existe en el directorio donde se encuentra spam.py, se asume que contiene una versión ya "compilada a byte" del módulo spam (lo que se denomina bytecode).
La fecha y hora de modificación del archivo spam.py usado para crear spam.pyc se graba en este último, y el .pyc se ignora si estos no coinciden.
Normalmente, no necesitás hacer nada para crear el archivo spam.pyc. Siempre que se compile satisfactoriamente el spam.py, se hace un intento de escribir la
versión compilada al spam.pyc. No es un error si este intento falla, si por cualquier razón el archivo no se escribe completamente el archivo spam.pyc resultante
se reconocerá como inválido luego. El contenido del archivo spam.pyc es independiente de la plataforma, por lo que un directorio de módulos puede ser
compartido por máquinas de diferentes arquitecturas.
• Cuando se invoca el intérprete de Python con la opción -O, se genera código optimizado que se almacena en archivos .pyo. El optimizador actualmente
no ayuda mucho; sólo remueve las declaraciones assert. Cuando se usa -O, se optimiza todo el bytecode; se ignoran los archivos .pyc y los archivos .py
se compilan a bytecode optimizado.
• Pasando dos opciones -O al intérprete de Python (-OO) causará que el compilador realice optimizaciones que en algunos raros casos podría resultar en
programas que funcionen incorrectamente. Actualmente, solamente se remueven del bytecode a las cadenas __doc__, resultando en archivos .pyo más
compactos. Ya que algunos programas necesitan tener disponibles estas cadenas, sólo deberías usar esta opción si sabés lo que estás haciendo.
• Un programa no corre más rápido cuando se lee de un archivo .pyc o .pyo que cuando se lee del .py; lo único que es más rápido en los archivos .pyc o
.pyo es la velocidad con que se cargan.
• Cuando se ejecuta un script desde la linea de órdenes, nunca se escribe el bytecode del script a los archivos .pyc o .pyo. Por lo tanto, el tiempo de
comienzo de un script puede reducirse moviendo la mayor parte de su código a un módulo y usando un pequeño script de arranque que importe el
módulo. También es posible nombrar a los archivos .pyc o .pyo directamente desde la linea de órdenes.
• Es posible tener archivos llamados spam.pyc (o spam.pyo cuando se usa la opción -O) sin un archivo spam.py para el mismo módulo. Esto puede usarse
para distribuir el código de una biblioteca de Python en una forma que es moderadamente difícil de hacerle ingeniería inversa.
55
• El módulo compileall puede crear archivos .pyc (o archivos .pyo cuando se usa la opción -O) para todos los módulos en un directorio.
Módulos estándar
Python viene con una biblioteca de módulos estándar, descrita en un documento separado, la Referencia de la Biblioteca de Python (de aquí en más,
"Referencia de la Biblioteca"). Algunos módulos se integran en el intérprete; estos proveen acceso a operaciones que no son parte del núcleo del lenguaje pero
que sin embargo están integrados, tanto por eficiencia como para proveer acceso a primitivas del sistema operativo, como llamadas al sistema. El conjunto de
tales módulos es una opción de configuración el cual también depende de la plataforma subyacente. Por ejemplo, el módulo winreg sólo se provee en sistemas
Windows. Un módulo en particular merece algo de atención: sys, el que está integrado en todos los intérpretes de Python. Las variables sys.ps1 y sys.ps2
definen las cadenas usadas como cursores primarios y secundarios:
>>> import sys >>> sys.ps1 '>>> ' >>> sys.ps2 '... ' >>> sys.ps1 =
'C> ' C> print 'Yuck!' Yuck! C>
Estas dos variables están solamente definidas si el intérprete está en modo interactivo.
La variable sys.path es una lista de cadenas que determinan el camino de búsqueda del intérprete para los módulos. Se inicializa por omisión a un camino
tomado de la variable de entorno PYTHONPATH, o a un valor predefinido en el intérprete si PYTHONPATH no está configurada. Lo podés modificar
usando las operaciones estándar de listas:
La función dir()
La función integrada dir() se usa para encontrar qué nombres define un módulo. Devuelve una lista ordenada de cadenas:
56
>>> dir(sys) ['__displayhook__', '__doc__', '__excepthook__', '__name__', '__stderr__',
'__stdin__', '__stdout__', '_getframe', 'api_version', 'argv', 'builtin_module_names', 'byteorder', 'callstats', 'copyright', 'displayhook', 'exc_clear', 'exc_info',
'exc_type', 'excepthook', 'exec_prefix', 'executable', 'exit', 'getdefaultencoding', 'getdlopenflags', 'getrecursionlimit', 'getrefcount', 'hexversion', 'maxint',
'maxunicode', 'meta_path', 'modules', 'path', 'path_hooks', 'path_importer_cache', 'platform', 'prefix', 'ps1', 'ps2', 'setcheckinterval', 'setdlopenflags',
'setprofile', 'setrecursionlimit', 'settrace', 'stderr', 'stdin', 'stdout', 'version', 'version_info', 'warnoptions']
Sin argumentos, dir() lista los nombres que tenés actualmente definidos:
>>> a = [1, 2, 3, 4, 5] >>> import fibo >>> fib = fibo.fib >>> dir() ['__builtins__', '__doc__', '__file__', '__name__', 'a', 'fib', 'fibo', 'sys']
Notá que lista todos los tipos de nombres: variables, módulos, funciones, etc.
dir() no lista los nombres de las funciones y variables integradas. Si querés una lista de esos, están definidos en el módulo estándar __builtin__:
57
'id', 'input', 'int', 'intern', 'isinstance', 'issubclass', 'iter', 'len', 'license', 'list', 'locals', 'long', 'map', 'max', 'memoryview', 'min', 'object', 'oct', 'open', 'ord',
'pow', 'property', 'quit', 'range', 'raw_input', 'reduce', 'reload', 'repr', 'reversed', 'round', 'set', 'setattr', 'slice', 'sorted', 'staticmethod', 'str', 'sum', 'super',
'tuple', 'type', 'unichr', 'unicode', 'vars', 'xrange', 'zip']
Paquetes
Los paquetes son una manera de estructurar los espacios de nombres de Python usando "nombres de módulos con puntos". Por ejemplo, el nombre de módulo
A.B designa un submódulo llamado B en un paquete llamado A. Tal como el uso de módulos evita que los autores de diferentes módulos tengan que
preocuparse de los respectivos nombres de variables globales, el uso de nombres de módulos con puntos evita que los autores de paquetes de muchos módulos,
como NumPy o la Biblioteca de Imágenes de Python (Python Imaging Library, o PIL), tengan que preocuparse de los respectivos nombres de módulos.
Suponete que querés designar una colección de módulos (un "paquete") para el manejo uniforme de archivos y datos de sonidos. Hay diferentes formatos de
archivos de sonido (normalmente reconocidos por su extensión, por ejemplo: .wav, .aiff, .au), por lo que tenés que crear y mantener una colección siempre
creciente de módulos para la conversión entre los distintos formatos de archivos. Hay muchas operaciones diferentes que quizás quieras ejecutar en los datos
de sonido (como mezclarlos, añadir eco, aplicar una función ecualizadora, crear un efecto estéreo artificial), por lo que ademas estarás escribiendo una lista sin
fin de módulos para realizar estas operaciones. Aquí hay una posible estructura para tu paquete (expresados en términos de un sistema jerárquico de archivos):
58
__init__.py equalizer.py vocoder.py karaoke.py ...
Al importar el paquete, Python busca a través de los directorios en sys.path, buscando el subdirectorio del paquete.
Los archivos __init__.py se necesitan para hacer que Python trate los directorios como que contienen paquetes; esto se hace para prevenir directorios con un
nombre común, como string, de esconder sin intención a módulos válidos que se suceden luego en el camino de búsqueda de módulos. En el caso más simple,
__init__.py puede ser solamente un archivo vacío, pero también puede ejecutar código de inicialización para el paquete o configurar la variable __all__,
descrita luego.
Los usuarios del paquete pueden importar módulos individuales del mismo, por ejemplo:
import sound.effects.echo
Esto carga el submódulo sound.effects.echo. Debe hacerse referencia al mismo con el nombre completo.
Esto también carga el submódulo echo, lo deja disponible sin su prefijo de paquete, por lo que puede usarse así:
De nuevo, esto carga el submódulo echo, pero deja directamente disponible a la función echofilter():
echofilter(input, output, delay=0.7, atten=4)
Notá que al usar from package import item el ítem puede ser tanto un submódulo (o subpaquete) del paquete, o algún otro nombre definido en el paquete,
como una función, clase, o variable. La declaración import primero verifica si el ítem está definido en el paquete; si no, asume que es un módulo y trata de
cargarlo. Si no lo puede encontrar, se genera una excepción ImportError.
Por otro lado, cuando se usa la sintaxis como import item.subitem.subsubitem, cada ítem excepto el último debe ser un paquete; el mismo puede ser un módulo
o un paquete pero no puede ser una clase, función o variable definida en el ítem previo.
59
Ahora, ¿qué sucede cuando el usuario escribe from sound.effects import *? Idealmente, uno esperaría que esto de alguna manera vaya al sistema de archivos,
encuentre cuales submódulos están presentes en el paquete, y los importe a todos. Desafortunadamente, esta operación no funciona muy bien en las plataformas
Windows, donde el sistema de archivos no siempre tiene información precisa sobre mayúsculas y minúsculas. En estas plataformas, no hay una manera
garantizada de saber si el archivo ECHO.PY debería importarse como el módulo echo, Echo o ECHO. (Por ejemplo, Windows 95 tiene la molesta costumbre de
mostrar todos los nombres de archivos con la primer letra en mayúsculas.) La restricción de DOS de los nombres de archivos con la forma 8+3 agrega otro
problema interesante para los nombres de módulos largos.
La única solución es que el autor del paquete provea un índice explícito del paquete. La declaración import usa la siguiente convención: si el código del
__init__.py de un paquete define una lista llamada __all__, se toma como la lista de los nombres de módulos que deberían ser importados cuando se hace from
package import *. Es tarea del autor del paquete mantener actualizada esta lista cuando se libera una nueva versión del paquete. Los autores de paquetes
podrían decidir no soportarlo, si no ven un uso para importar * en sus paquetes. Por ejemplo, el archivo sounds/effects/__init__.py podría contener el siguiente
código:
Esto significaría que from sound.effects import * importaría esos tres submódulos del paquete sound.
Si no se define __all__, la declaración from sound.effects import * no importa todos los submódulos del paquete sound.effects al espacio de nombres actual;
sólo se asegura que se haya importado el paquete sound.effects (posiblemente ejecutando algún código de inicialización que haya en __init__.py) y luego
importa aquellos nombres que estén definidos en el paquete. Esto incluye cualquier nombre definido (y submódulos explícitamente cargados) por __init__.py.
También incluye cualquier submódulo del paquete que pudiera haber sido explícitamente cargado por declaraciones import previas. Considerá este código:
En este ejemplo, los módulos echo y surround se importan en el espacio de nombre actual porque están definidos en el paquete sound.effects cuando se ejecuta
la declaración from...import. (Esto también funciona cuando se define __all__).
Notá que en general la práctica de importar * desde un módulo o paquete no se recomienda, ya que frecuentemente genera un código con mala legibilidad. Sin
embargo, está bien usarlo para ahorrar tecleo en sesiones interactivas, y algunos módulos están diseñados para exportar sólo nombres que siguen ciertos
patrones.
60
Recordá que no está mal usar from paquete import submodulo_especifico! De hecho, esta notación se recomienda a menos que el módulo que estás
importando necesite usar submódulos con el mismo nombre desde otros paquetes.
Cuando se estructuran los paquetes en subpaquetes (como en el ejemplo sound), podés usar import absolutos para referirte a submódulos de paquetes hermanos.
Por ejemplo, si el módulo sound.filters.vocoder necesita usar el módulo echo en el paquete sound.effects, puede hacer from sound.effects import echo.
Desde Python 2.5, además de los import relativos implícitos descritos arriba, podés escribir import relativos explícitos con la declaración de la forma from
module import name. Estos import relativos explícitos usan puntos adelante para indicar los paquetes actual o padres involucrados en el import relativo. En el
ejemplo surround, podrías hacer:
from . import echo from .. import formats from ..filters import equalizer
Notá que ambos import, relativos explícitos e implícitos, se basan en el nombre del módulo actual. Ya que el nombre del módulo principal es siempre
"__main__", los módulos pensados para usarse como módulo principal de una aplicación Python siempre deberían usar import absolutos.
Los paquetes soportan un atributo especial más, __path__. Este se inicializa, antes de que el código en ese archivo se ejecute, a una lista que contiene el
nombre del directorio donde está el paquete. Esta variable puede modificarse, afectando búsquedas futuras de módulos y subpaquetes contenidos en el paquete.
Aunque esta característica no se necesita frecuentemente, puede usarse para extender el conjunto de módulos que se encuentran en el paquete.
61
3 De hecho las definiciones de función son también 'declaraciones' que se 'ejecutan'; la ejecución de una función a nivel de módulo mete el nombre de la
función en el espacio de nombres global.
62
Entrada y salida
Hay diferentes métodos de presentar la salida de un programa; los datos pueden ser impresos de una forma legible por humanos, o escritos a un archivo para
uso futuro. Este capítulo discutirá algunas de las posibilidades.
Frecuentemente querrás más control sobre el formateo de tu salida que simplemente imprimir valores separados por espacios. Hay dos maneras de formatear tu
salida; la primera es hacer todo el manejo de las cadenas vos mismo: usando rebanado de cadenas y operaciones de concatenado podés crear cualquier forma
que puedas imaginar. El módulo string contiene algunas operaciones útiles para emparejar cadenas a un determinado ancho; estas las discutiremos en breve. La
otra forma es usar el método str.format().
Nos queda una pregunta, por supuesto: ¿cómo convertís valores a cadenas? Afortunadamente, Python tiene maneras de convertir cualquier valor a una cadena:
pasalos a las funciones repr() o str().
La función str() devuelve representaciones de los valores que son bastante legibles por humanos, mientras que repr() genera representaciones que pueden ser
leídas por el el intérprete (o forzarían un SyntaxError si no hay sintáxis equivalente). Para objetos que no tienen una representación en particular para consumo
humano, str() devolverá el mismo valor que repr(). Muchos valores, como números o estructuras como listas y diccionarios, tienen la misma representación
usando cualquiera de las dos funciones. Las cadenas y los números de punto flotante, en particular, tienen dos representaciones distintas.
Algunos ejemplos:
>>> s = 'Hola mundo.' >>> str(s) 'Hola mundo.' >>> repr(s) "'Hola
mundo.'" >>> str(0.1) '0.1' >>> repr(0.1) '0.10000000000000001' >>>
x = 10 * 3.25 >>> y = 200 * 200
63
>>> s = 'El valor de x es ' + repr(x) + ', y es ' + repr(y) + '...' >>> print s El valor de x es 32.5, y es 40000... >>> # El repr() de una cadena
agrega apóstrofos y barras invertidas ... hola = 'hola mundo\n' >>> holas = repr(hola) >>> print holas 'hola mundo\n' >>> # El argumento
de repr() puede ser cualquier objeto Python: ... repr((x, y, ('carne', 'huevos'))) "(32.5, 40000, ('carne', 'huevos'))"
>>> for x in range(1, 11): ... print repr(x).rjust(2), repr(x*x).rjust(3), ... # notar la coma al final de la linea anterior ...
print repr(x*x*x).rjust(4) ... 1 1 1 2 4 8 3 9 27 4 16 64 5 25 125 6 36 216 7 49 343 8 64 512 9 81 729 10 100 1000
>>> for x in range(1,11): ... print '{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x) ... 1 1 1 2 4 8 3 9 27 4 16 64 5 25 125 6 36 216
7 49 343 8 64 512 9 81 729 10 100 1000
64
(Notar que en el primer ejemplo, un espacio entre cada columna fue agregado por la manera en que print trabaja: siempre agrega espacios entre sus
argumentos)
Este ejemplo muestra el método rjust() de los objetos cadena, el cual ordena una cadena a la derecha en un campo del ancho dado llenándolo con espacios a la
izquierda. Hay métodos similares ljust() y center(). Estos métodos no escriben nada, sólo devuelven una nueva cadena. Si la cadena de entrada es demasiado
larga, no la truncan, sino la devuelven intacta; esto te romperá la alineación de tus columnas pero es normalmente mejor que la alternativa, que te estaría
mintiendo sobre el valor. (Si realmente querés que se recorte, siempre podés agregarle una operación de rebanado, como en x.ljust(n)[:n].)
Hay otro método, zfill(), el cual rellena una cadena numérica a la izquierda con ceros. Entiende signos positivos y negativos:
Las llaves y caracteres dentro de las mismas (llamados campos de formato) son reemplazadas con los objetos pasados en el método str.format(). El número en
las llaves se refiere a la posición del objeto pasado en el método.
>>> print '{0} y {1}'.format('carne', 'huevos') carne y huevos >>> print '{1} y {0}'.format('carne', 'huevos')
huevos y carne
Si se usan argumentos nombrados en el método str.format(), sus valores serán referidos usando el nombre del argumento.
>>> print 'Esta {comida} es {adjetivo}.'.format( ... comida='carne', adjetivo='espantosa') Esta carne es
espantosa.
>>> print 'La historia de {0}, {1}, y {otro}.'.format('Bill', 'Manfred', ... otro='Georg') La historia de Bill, Manfred, y Georg.65
Un ': y especificador de formato opcionales pueden ir luego del nombre del campo. Esto aumenta el control sobre cómo el valor es formateado. El siguiente
ejemplo trunca Pi a tres lugares luego del punto decimal.
>>> import math >>> print 'El valor de PI es aproximadamente {0:.3f}.'.format(math.pi) El valor de PI es aproximadamente 3.142.
Pasando un entero luego del ':' causará que que el campo sea de un mínimo número de caracteres de ancho. Esto es útil para hacer tablas lindas.
>>> tabla = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678} >>> for nombre, telefono in tabla.items(): ... print '{0:10} ==>
{1:10d}'.format(nombre, telefono) ... Dcab ==> 7678 Jack ==> 4098 Sjoerd ==> 4127
Si tenés una cadena de formateo realmente larga que no querés separar, podría ser bueno que puedas hacer referencia a las variables a ser formateadas por el
nombre en vez de la posición. Esto puede hacerse simplemente pasando el diccionario y usando corchetes '[]' para acceder a las claves
>>> tabla = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678} >>> print ('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; ' ... 'Dcab:
{0[Dcab]:d}'.format(tabla)) Jack: 4098; Sjoerd: 4127; Dcab: 8637678
Esto se podría también hacer pasando la tabla como argumentos nombrados con la notación '**'.
>>> tabla = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678} >>> print 'Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**tabla) Jack: 4098;
Sjoerd: 4127; Dcab: 8637678
Esto es particularmente útil en combinación con la nueva función integrada vars(), que devuelve un diccionario conteniendo todas las variables locales.
Para una completa descripción del formateo de cadenas con str.format(), mirá en formatstrings.
El operador % también puede usarse para formateo de cadenas. Interpreta el argumento de la izquierda con el estilo de formateo de sprintf para ser aplicado al
argumento de la derecha, y devuelve la cadena resultante de esta operación de formateo. Por ejemplo:
>>> import math >>> print 'El valor de PI es aproximadamente %5.3f.' % math.pi
66
El valor de PI es aproximadamente 3.142.
Ya que str.format() es bastante nuevo, un montón de código Python todavía usa el operador %. Sin embargo, ya que este viejo estilo de formateo será
eventualmente eliminado del lenguaje, en general debería usarse str.format().
Podés encontrar más información en la sección string-formatting.
>>> f = open('/tmp/workfile', 'w') >>> print f <open file '/tmp/workfile', mode 'w' at 80a0960>
El primer argumento es una cadena conteniendo el nombre de archivo. El segundo argumento es otra cadena conteniendo unos pocos caracteres que describen
la forma en que el archivo será usado. El modo puede ser 'r' cuando el archivo será solamente leído, 'w' para sólo escribirlo (un archivo existente con el mismo
nombre será borrado), y 'a' abre el archivo para agregarle información; cualquier dato escrito al archivo será automáticamente agregado al final. 'r+' abre el
archivo tanto para leerlo como para escribirlo. El argumento modo es opcional; si se omite se asume 'r'.
En Windows, agregando 'b' al modo abre al archivo en modo binario, por lo que también hay modos como 'rb', 'wb', y 'r+b'. Windows hace una distinción entre
archivos binarios y de texto; los caracteres de fin de linea en los archivos de texto son automáticamente alterados levemente cuando los datos son leídos o
escritos. Esta modificación en bambalinas para guardar datos está bien con archivos de texto ASCII, pero corromperá datos binarios como en archivos JPEG o
EXE. Sé muy cuidadoso en usar el modo binario al leer y escribir tales archivos. En Unix, no hay problema en agregarle una 'b' al modo, por lo que podés
usarlo independientemente de la plataforma para todos los archivos binarios.
El resto de los ejemplos en esta sección asumirán que ya se creó un objeto archivo llamado f.
Para leer el contenido de una archivo llamá a f.read(cantidad), el cual lee alguna cantidad de datos y los devuelve como una cadena. cantidad es un argumento
numérico opcional. Cuando se omite cantidad o es negativo, el contenido entero del archivo será leido y devuelto; es tu problema si el archivo es el doble de
grande que la memoria de tu máquina. De otra manera, a lo sumo una cantidad de bytes son leídos y devueltos. Si se alcanzó el fin del archivo, f.read()
devolverá una cadena vacía ("").
67
''
f.readline() lee una sola linea del archivo; el caracter de fin de linea (\n) se deja al final de la cadena, y sólo se omite en la última linea del archivo si el mismo
no termina en un fin de linea. Esto hace que el valor de retorno no sea ambiguo; si f.readline() devuelve una cadena vacía, es que se alcanzó el fin del archivo,
mientras que una linea en blanco es representada por '\n', una cadena conteniendo sólo un único fin de linea.
>>> f.readline() 'Esta es la primer linea del archivo.\n' >>> f.readline() 'Segunda linea del archivo\n'
>>> f.readline() ''
f.readlines() devuelve una lista conteniendo todos las lineas de datos en el archivo. Si se da un parámetro opcional size, lee esa cantidad de bytes del archivo y
lo suficientemente más como para completar una linea, y devuelve las lineas de eso. Esto se usa frecuentemente para permitir una lectura por lineas de forma
eficiente en archivos grandes, sin tener que cargar el archivo entero en memoria. Sólo lineas completas serán devueltas.
>>> f.readlines() ['Esta es la primer linea del archivo.\n', 'Segunda linea del archivo\n']
Una forma alternativa a leer lineas es iterar sobre el objeto archivo. Esto es eficiente en memoria, rápido, y conduce a un código más simple:
Para escribir algo más que una cadena, necesita convertirse primero a una cadena:
f.tell() devuelve un entero que indica la posición actual en el archivo, medida en bytes desde el comienzo del archivo. Para cambiar la posición usá
f.seek(desplazamiento, desde_donde). La
68
posición es calculada agregando el desplazamiento a un punto de referencia; el punto de referencia se selecciona del argumento desde_donde. Un valor
desde_donde de 0 mide desde el comienzo del archivo, 1 usa la posición actual del archivo, y 2 usa el fin del archivo como punto de referencia. desde_donde
puede omitirse, el default es 0, usando el comienzo del archivo como punto de referencia.
Cuando hayas terminado con un archivo, llamá a f.close() para cerrarlo y liberar cualquier recurso del sistema tomado por el archivo abierto. Luego de llamar
f.close(), los intentos de usar el objeto archivo fallarán automáticamente.
Es una buena práctica usar la declaración with cuando manejamos objetos archivo. Tiene la ventaja que el archivo es cerrado apropiadamente luego de que el
bloque termina, incluso si se generó una excepción. También es mucho más corto que escribir los equivalentes bloques try-finally
>>> with open('/tmp/workfile', 'r') as f: ... read_data = f.read() >>> f.closed True
Los objetos archivo tienen algunos métodos más, como isatty() y truncate() que son usados menos frecuentemente; consultá la Referencia de la Biblioteca para
una guía completa sobre los objetos archivo.
El módulo pickle
Las cadenas pueden facilmente escribirse y leerse de un archivo. Los números toman algo más de esfuerzo, ya que el método read() sólo devuelve cadenas, que
tendrán que ser pasadas a una función como int(), que toma una cadena como '123' y devuelve su valor numérico 123. Sin embargo, cuando querés grabar tipos
de datos más complejos como listas, diccionarios, o instancias de clases, las cosas se ponen más complicadas.
69
En lugar de tener a los usuarios constantemente escribiendo y debugueando código para grabar tipos de datos complicados, Python provee un módulo estándar
llamado pickle. Este es un asombroso módulo que puede tomar casi cualquier objeto Python (¡incluso algunas formas de código Python!), y convertirlo a una
representación de cadena; este proceso se llama picklear. Reconstruir los objetos desde la representación en cadena se llama despicklear. Entre que se picklea
y se despicklea, la cadena que representa al objeto puede almacenarse en un archivo, o enviarse a una máquina distante por una conexión de red.
Si tenés un objeto x, y un objeto archivo f que fue abierto para escritura, la manera más simple de picklear el objeto toma una sola linea de código:
pickle.dump(x, f)
Para despicklear el objeto, si f es un objeto archivo que fue abierto para lectura:
x = pickle.load(f)
(Hay otras variantes de esto, usadas al picklear muchos objetos o cuando no querés escribir los datos pickleados a un archivo; consultá la documentación
completa para pickle en la Referencia de la Biblioteca de Python.)
pickle es la manera estándar de hacer que los objetos Python puedan almacenarse y reusarse por otros programas o por una futura invocación al mismo
programa; el término técnico de esto es un objeto persistente. Ya que pickle es tan ampliamente usado, muchos autores que escriben extensiones de Python
toman el cuidado de asegurarse que los nuevos tipos de datos, como matrices, puedan ser adecuadamente pickleados y despickleados.
70
Errores y excepciones
Hasta ahora los mensajes de error no habían sido más que mencionados, pero si probaste los ejemplos probablemente hayas visto algunos. Hay (al menos) dos
tipos diferentes de errores: errores de sintaxis y excepciones.
Errores de sintaxis
Los errores de sintaxis, también conocidos como errores de interpretación, son quizás el tipo de queja más común que tenés cuando todavía estás aprendiendo
Python:
El intérprete repite la línea culpable y muestra una pequeña 'flecha' que apunta al primer lugar donde se detectó el error. Este es causado por (o al menos
detectado en) el símbolo que precede a la flecha: en el ejemplo, el error se detecta en el print, ya que faltan dos puntos (':') antes del mismo. Se muestran el
nombre del archivo y el número de línea para que sepas dónde mirar en caso de que la entrada venga de un programa.
Excepciones
Incluso si la declaración o expresión es sintácticamente correcta, puede generar un error cuando se intenta ejecutarla. Los errores detectados durante la
ejecución se llaman excepciones, y no son incondicionalmente fatales: pronto aprenderás cómo manejarlos en los programas en Python. Sin embargo, la
mayoría de las excepciones no son manejadas por los programas, y resultan en mensajes de error como los mostrados aquí:
71
TypeError: cannot concatenate 'str' and 'int' objects
La última línea de los mensajes de error indica qué sucedió. Las excepciones vienen de distintos tipos, y el tipo se imprime como parte del mensaje: los tipos en
el ejemplo son: ZeroDivisionError, NameError y TypeError. La cadena mostrada como tipo de la excepción es el nombre de la excepción predefinida que
ocurrió. Esto es verdad para todas las excepciones predefinidas del intérprete, pero no necesita ser verdad para excepciones definidas por el usuario (aunque es
una convención útil). Los nombres de las excepciones estándar son identificadores incorporados al intérprete (no son palabras clave reservadas).
La parte anterior del mensaje de error muestra el contexto donde la excepción sucedió, en la forma de un trazado del error listando líneas fuente; sin embargo,
no mostrará líneas leídas desde la entrada estándar.
Manejando excepciones
Es posible escribir programas que manejen determinadas excepciones. Mirá el siguiente ejemplo, que le pide al usuario una entrada hasta que ingrese un entero
válido, pero permite al usuario interrumpir el programa (usando Control-C o lo que sea que el sistema operativo soporte); notá que una interrupción generada
por el usuario se señaliza generando la excepción KeyboardInterrupt.
>>> while True: ... try: ... x = int(raw_input(u"Por favor ingrese un número: ")) ... break ... except ValueError: ... print u"Oops! No era
válido. Intente nuevamente..." ...
• Primero, se ejecuta el bloque try (el código entre las declaración try y except).
• Si no ocurre ninguna excepción, el bloque except se saltea y termina la ejecución de la declaración try.
• Si ocurre una excepción durante la ejecución del bloque try, el resto del bloque se saltea. Luego, si su tipo coincide con la excepción nombrada luego de
la palabra reservada except, se ejecuta el bloque except, y la ejecución continúa luego de la declaración try.
• Si ocurre una excepción que no coincide con la excepción nombrada en el except, esta se pasa a declaraciones try de más afuera; si no se encuentra
nada que la maneje, es una excepción no manejada, y la ejecución se frena con un mensaje como los mostrados arriba.
Una declaración try puede tener más de un except, para especificar manejadores para distintas excepciones. A lo sumo un manejador será ejecutado. Sólo se
manejan excepciones que ocurren en el
72
correspondiente try, no en otros manejadores del mismo try. Un except puede nombrar múltiples excepciones usando paréntesis, por ejemplo:
El último except puede omitir nombrar qué excepción captura, para servir como comodín. Usá esto con extremo cuidado, ya que de esta manera es fácil ocultar
un error real de programación. También puede usarse para mostrar un mensaje de error y luego re-generar la excepción (permitiéndole al que llama, manejar
también la excepción):
import sys
try:
f = open('miarchivo.txt') s = f.readline() i = int(s.strip()) except IOError as (errno, strerror):
print "Error E/S ({0}): {1}".format(errno, strerror) except ValueError:
print "No pude convertir el dato a un entero." except:
print "Error inesperado:", sys.exc_info()[0] raise
Las declaraciones try ... except tienen un bloque else opcional, el cual, cuando está presente, debe seguir a los except. Es útil para aquel código que debe
ejecutarse si el bloque try no genera una excepción. Por ejemplo:
print 'no pude abrir', arg else: print arg, 'tiene', len(f.readlines()), 'lineas'
f.close()
El uso de else es mejor que agregar código adicional en el try porque evita capturar accidentalmente una excepción que no fue generada por el código que está
protegido por la declaración try ... except.
Cuando ocurre una excepción, puede tener un valor asociado, también conocido como el argumento de la excepción. La presencia y el tipo de argumento
depende del tipo de excepción.
El except puede especificar una variable luego del nombre (o tupla) de excepción(es). La variable se vincula a una instancia de excepción con los argumentos
almacenados en instance.args. Por conveniencia, la instancia de excepción define __getitem__() y __str__() para que se pueda
73
acceder o mostrar los argumentos directamente, sin necesidad de hacer referencia a .args.
Pero se recomienda no usar .args. En cambio, el uso preferido es pasar un único argumento a la excepción (que puede ser una tupla se necesitan varios
argumentos) y vincularlo al atributo message. Uno también puede instanciar una excepción antes de generarla, y agregarle cualquier atributo que se desee:
>>> try: ... raise Exception('carne', 'huevos') ... except Exception as inst: ... print type(inst) # la instancia de excepción ... print inst.args #
argumentos guardados en .args ... print inst # __str__ permite imprimir args directamente ... x, y = inst # __getitem__ permite usar args
directamente ... print 'x =', x ... print 'y =', y ... <type 'exceptions.Exception'> ('carne', 'huevos') ('carne', 'huevos') x = carne y = huevos
Si una excepción tiene un argumento, este se imprime como la última parte (el 'detalle') del mensaje para las excepciones que no están manejadas.
Los manejadores de excepciones no manejan solamente las excepciones que ocurren en el bloque try, también manejan las excepciones que ocurren dentro de
las funciones que se llaman (inclusive indirectamente) dentro del bloque try. Por ejemplo:
>>> def esto_falla(): ... x = 1/0 ... >>> try: ... esto_falla() ... except ZeroDivisionError as detail: ... print 'Manejando error en tiempo de ejecucion:',
detail ... Manejando error en tiempo de ejecucion: integer division or modulo by zero
74
Levantando excepciones
La declaración raise permite al programador forzar a que ocurra una excepción específica. Por ejemplo:
El argumento de raise es una clase o instancia de excepción a ser generada. Hay una sintaxis alternativa que no se usa más, que separa los argumentos de clase
y constructor; lo de arriba podría escribirse como raise NameError, 'Hola'; ya que alguna vez era la única opción, esta forma es muy usada en códigos viejos.
Si necesitás determinar cuando una excepción fue lanzada pero no querés manejarla, una forma simplificada de la instrucción raise te permite relanzarla:
>>> try: ... raise NameError('Hola') ... except NameError: ... print u'Voló una excepción!'
... raise ... Voló una excpeción! Traceback (most recent call last):
File "<stdin>", line 2, in ? NameError: Hola
>>> class MiError(Exception): ... def __init__(self, valor): ... self.valor = valor ... def __str__(self): ... return
repr(self.valor) ... >>> try: ... raise MiError(2*2) ... except MyError as e: ... print u'Ocurrió mi excepción, valor:',
e.valor ...
75
Ocurrió mi excepción, valor: 4 >>> raise MiError('oops!') Traceback (most recent call
last):
File "<stdin>", line 1, in ? __main__.MiError: 'oops!'
En este ejemplo, el método __init__() de Exception fue sobrescrito. El nuevo comportamiento simplemente crea el atributo valor. Esto reemplaza el
comportamiento por defecto de crear el atributo args.
Las clases de Excepciones pueden ser definidas de la misma forma que cualquier otra clase, pero usualmente se mantienen simples, a menudo solo ofreciendo
un número de atributos con información sobre el error que leerán los manejadores de la excepción. Al crear un módulo que puede lanzar varios errores
distintos, una práctica común es crear una clase base para excepciones definidas en ese módulo y extenderla para crear clases excepciones específicas para
distintas condiciones de error:
class Error(Exception):
"""Clase base para excepciones en el modulo.""" pass
class EntradaError(Error):
"""Excepcion lanzada por errores en las entradas.
Atributos:
expresion -- expresion de entrada en la que ocurre el error mensaje -- explicacion del error """
class TransicionError(Error):
"""Lanzada cuando una operacion intenta una transicion de estado no permitida.
Atributos:
previo -- estado al principio de la transicion siguiente -- nuevo estado intentado mensaje -- explicacion de porque la transicion no esta
permitida """ def __init__(self, previo, siguiente, mensaje):
self.previo = previo self.siguiente = siguiente
76
self.mensaje = mensaje
La mayoría de las excepciones son definidas con nombres que terminan en "Error", similares a los nombres de las excepciones estándar.
Muchos módulos estándar definen sus propias excepciones para reportar errores que pueden ocurrir en funciones propias. Se puede encontrar más información
sobre clases en el capítulo tut-classes.
>>> try: ... raise KeyboardInterrupt ... finally: ... print 'Chau, mundo!' ... Chau,
mundo! KeyboardInterrupt
Una cláusula finally siempre es ejecutada antes de salir de la declaración try, ya sea que una excepción haya ocurrido o no. Cuando ocurre una excepción en la
cláusula try y no fue manejada por una cláusula except (o ocurrió en una cláusula except o else), es relanzada luego de que se ejecuta la cláusula finally. finally
es también ejecutada "a la salida" cuando cualquier otra cláusula de la declaración try es dejada via break, continue or return. Un ejemplo más complicado
(cláusulas except y finally en la misma declaración try):
>>> def dividir(x, y): ... try: ... result = x / y ... except ZeroDivisionError: ... print "¡division por cero!" ... else:
... print "el resultado es", result ... finally: ... print "ejecutando la clausula finally" ... >>> dividir(2, 1) el resultado
es 2 ejecutando la clausula finally >>> dividir(2, 0) ¡division por cero! ejecutando la clausula finally
77
>>> divide("2", "1") ejecutando la clausula finally Traceback (most recent call last):
File "<stdin>", line 1, in ? File "<stdin>", line 3, in divide TypeError: unsupported operand type(s) for /: 'str' and 'str'
Como podés ver, la cláusula finally es ejecutada siempre. La excepción TypeError lanzada al dividir dos cadenas de texto no es manejado por la cláusula
except y por lo tanto es relanzada luego de que se ejecuta la cláusula finally.
En aplicaciones reales, la cláusula finally es útil para liberar recursos externos (como archivos o conexiones de red), sin importar si el uso del recurso fue
exitoso.
El problema con este código es que deja el archivo abierto por un periodo de tiempo indeterminado luego de que termine de ejecutarse. Esto no es un problema
en scripts simples, pero puede ser un problema en aplicaciones más grandes. La declaración with permite que objetos como archivos sean usados de una forma
que asegure que siempre se los libera rápido y en forma correcta.
with open("miarchivo.txt") as f:
for linea in f: print linea
Luego de que la declaración sea ejecutada, el archivo f siempre es cerrado, incluso si se encuentra un problema al procesar las líneas. Otros objetos que
provean acciones de limpieza predefinidas lo indicarán en su documentación.
78
Clases
El mecanismo de clases de Python agrega clases al lenguaje con un mínimo de nuevas sintaxis y semánticas. Es una mezcla de los mecanismos de clase
encontrados en C++ y Modula-3. Como es cierto para los módulos, las clases en Python no ponen una barrera absoluta entre la definición y el usuario, sino que
más bien se apoya en la cortesía del usuario de no "forzar la definición". Sin embargo, se mantiene el poder completo de las características más importantes de
las clases: el mecanismo de la herencia de clases permite múltiples clases base, una clase derivada puede sobreescribir cualquier método de su(s) clase(s) base,
y un método puede llamar al método de la clase base con el mismo nombre. Los objetos pueden tener una cantidad arbitraria de datos.
En terminología de C++, todos los miembros de las clases (incluyendo los miembros de datos), son públicos, y todas las funciones miembro son virtuales.
Como en Modula-3, no hay atajos para hacer referencia a los miembros del objeto desde sus métodos: la función método se declara con un primer argumento
explícito que representa al objeto, el cual se provee implícitamente por la llamada. Como en Smalltalk, las clases mismas son objetos. Esto provee una
semántica para importar y renombrar. A diferencia de C++ y Modula-3, los tipos de datos integrados pueden usarse como clases base para que el usuario los
extienda. También, como en C++ pero a diferencia de Modula-3, la mayoría de los operadores integrados con sintaxis especial (operadores aritméticos, de
subíndice, etc.) pueden ser redefinidos por instancias de la clase.
(Sin haber una terminología universalmente aceptada sobre clases, haré uso ocasional de términos de Smalltalk y C++. Usaría términos de Modula-3, ya que su
semántica orientada a objetos es más cercana a Python que C++, pero no espero que muchos lectores hayan escuchado hablar de él).
Unas palabras sobre nombres y objetos
Los objetos tienen individualidad, y múltiples nombres (en muchos ámbitos) pueden vincularse al mismo objeto. Esto se conoce como aliasing en otros
lenguajes. Normalmente no se aprecia esto a primera vista en Python, y puede ignorarse sin problemas cuando se maneja tipos básicos inmutables (números,
cadenas, tuplas). Sin embargo, el aliasing, o renombrado, tiene un efecto posiblemente sorpresivo sobre la semántica de código Python que involucra objetos
mutables como listas, diccionarios, y la mayoría de otros tipos. Esto se usa normalmente para beneficio del programa, ya que los renombres funcionan como
punteros en algunos aspectos. Por ejemplo, pasar un objeto es barato ya que la implementación solamente pasa el puntero; y si una función modifica el objeto
que fue pasado, el que la llama verá el cambio; esto elimina la necesidad de tener dos formas diferentes de pasar argumentos, como en Pascal.
79
conocimientos en este tema son útiles para cualquier programador Python avanzado.
Un espacio de nombres es una relación de nombres a objetos. Muchos espacios de nombres están implementados en este momento como diccionarios de
Python, pero eso no se nota para nada (excepto por el desempeño), y puede cambiar en el futuro. Como ejemplos de espacios de nombres tenés: el conjunto de
nombres incluidos (funciones como abs(), y los nombres de excepciones integradas); los nombres globales en un módulo; y los nombres locales en la
invocación a una función. Lo que es importante saber de los espacios de nombres es que no hay relación en absoluto entre los nombres de espacios de nombres
distintos; por ejemplo, dos módulos diferentes pueden tener definidos los dos una función maximizar sin confusión; los usuarios de los módulos deben usar el
nombre del módulo como prefijo.
Por cierto, yo uso la palabra atributo para cualquier cosa después de un punto; por ejemplo, en la expresión z.real, real es un atributo del objeto z.
Estrictamente hablando, las referencias a nombres en módulos son referencias a atributos: en la expresión modulo.funcion, modulo es un objeto módulo y
funcion es un atributo de éste. En este caso hay una relación directa entre los atributos del módulo y los nombres globales definidos en el módulo: ¡están
compartiendo el mismo espacio de nombres! 4
Los atributos pueden ser de sólo lectura, o de escritura. En el último caso es posible la asignación a atributos. Los atributos de módulo pueden escribirse:
modulo.la_respuesta = 42. Los atributos de escritura se pueden borrar también con la instrucción del. Por ejemplo, del modulo.la_respuesta va a eliminar el
atributo la_respuesta del objeto con nombre modulo.
Los espacios de nombres se crean en diferentes momentos y con diferentes tiempos de vida. El espacio de nombres que contiene los nombres incluidos se crea
cuando se inicia el intérprete, y nunca se borra. El espacio de nombres global de un módulo se crea cuando se lee la definición de un módulo; normalmente, los
espacios de nombres de módulos también duran hasta que el intérprete finaliza. Las instrucciones ejecutadas en el nivel de llamadas superior del intérprete, ya
sea desde un script o interactivamente, se consideran parte del módulo llamado __main__, por lo tanto tienen su propio espacio de nombres global. (Los
nombres incluidos en realidad también viven en un módulo; este se llama __builtin__.)
El espacio de nombres local a una función se crea cuando la función es llamada, y se elimina cuando la función retorna o lanza una excepción que no se
maneje dentro de la función. (Podríamos decir que lo que pasa en realidad es que ese espacio de nombres se "olvida".) Por supuesto, las llamadas recursivas
tienen cada una su propio espacio de nombres local.
Un alcance es una región textual de un programa en Python donde un espacio de nombres es accesible directamente. "Accesible directamente" significa que
una referencia sin calificar a un nombre intenta encontrar dicho nombre dentro del espacio de nombres.
Aunque los alcances se determinan estáticamente, se usan dinámicamente. En cualquier momento durante la ejecución hay por lo menos cuatro alcances
anidados cuyos espacios de nombres son directamente accesibles:
80