0% encontró este documento útil (0 votos)

60 vistas21 páginas

Ficheros Python

Este documento introduce los conceptos básicos de los ficheros en Python. Explica que un fichero es un conjunto de datos almacenados de forma permanente que puede ser tratado como una unidad. Describe cómo abrir y cerrar ficheros, y las diferentes formas de leer y escribir datos en ficheros en Python, incluyendo la lectura línea por línea y el manejo de excepciones. El documento también cubre conceptos clave como los tipos de ficheros, los flujos de datos, y el uso del administrador de contexto with para asegurar que los ficheros se

Cargado por

Danny Gibson

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

60 vistas21 páginas

Ficheros Python

Cargado por

Danny Gibson

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 21

Ficheros

Introducción
Concepto de fichero
Tipos de ficheros
Elementos básicos de programación con ficheros
Lectura línea por línea de ficheros en Python
Manejo de excepciones con ficheros
El administrador de contextos with
Otras formas de lectura en Python
Leyendo un fichero con formato complejo
Escritura en un fichero
Consideraciones finales

Introducción
Toda persona que haya interactuado con los ordenadores tiene alguna idea de
lo que es un fichero o archivo. Sabemos que determinadas aplicaciones
informáticas los crean para almacenar, por ejemplo, los documentos generados
por un editor de textos o una hoja de cálculo. Conocemos que las aplicaciones
son preservadas en ficheros ejecutables. Por otro lado, día tras día, copiamos
ficheros de una carpeta del disco duro a otra, o hacia una memoria USB, ¡o los
borramos definitivamente!

En este tema haremos primero una breve introducción al concepto informático

de fichero. Posteriormente, veremos algunas de las herramientas básicas, las
más habituales, que proporciona Python para trabajar con ficheros.

Concepto de fichero
Un fichero es un conjunto de datos relacionados entre sí, que son
almacenados de forma permanente en dispositivos tales como discos duros,
memorias flash, etc. y que pueden ser tratados, hasta cierto punto, como una
unidad.

En este contexto, permanente quiere decir que, salvo fallos catastróficos o

hasta que sean borrados a propósito, estos datos permanecen en el medio en
que se almacenan (medios magnéticos o de otro tipo) y continúan existiendo
después de que el programa que los creó deja de ejecutarse, incluso después de
apagar el ordenador.

Esto marca la diferencia con los datos que son provisionalmente almacenados
en la memoria RAM, la memoria volátil del ordenador, que no sobreviven al
programa que los crea y mucho menos a la desconexión del computador de la
red eléctrica.

Utilidad de los ficheros

El concepto de fichero es una abstracción del Sistema Operativo (S.O.) que,

de forma transparente al programador, utiliza los recursos
del hardware creando sobre ellos una estructura lógica para representarlos,
facilitando a los lenguajes de programación el uso de interfaces de usuario
simples y versátiles.

El Sistema Operativo crea todo el sistema de ficheros del ordenador: los

directorios para organizarlos, las tablas para localizarlos en el disco, etc.

Los ficheros son enormemente importantes en programación. No solo debido al

hecho evidente de que brindan el soporte que permite la mera existencia de las
aplicaciones en el disco duro. Si no existieran los ficheros, por ejemplo, toda la
interacción del usuario con una aplicación concreta, como la introducción y la
obtención de resultados parciales, tendría que ser laboriosamente recreada
cada vez que se ejecutara el programa. La existencia del fichero hace posible
que, al terminar una sesión de trabajo, se almacenen los datos y resultados en el
disco, para poder retomar la tarea en una sesión posterior.

Por otra parte, los ficheros son útiles también como vehículos para el
intercambio de información entre diferentes aplicaciones: los datos
resultantes escritos en un fichero por el programa A podrán servir
de entrada para un programa B.

Tipos de ficheros
El contenido y la estructura de un fichero responde a un criterio de diseño
libre, elegido por el desarrollador de una aplicación. En cualquier caso, con
relación a la forma en que los datos son almacenados, los ficheros podríamos
clasificarlos como:

 Ficheros binarios: Contienen una representación exacta del contenido

(binario, ceros y unos) de los datos. No son editables.
Ejemplo: Representación de 3 números enteros 255 3 10 en complemento a 2.
Cada entero ocupa el mismo número de bytes.

 Ficheros de texto: Los datos están representados con los caracteres

alfanuméricos que los representan. Pueden ser leídos y modificados a
través de un editor de texto.
Ejemplo: Representación de 3 números enteros 255 3 10 codificados en ASCII,
separados por espacios en blanco (20H en ASCII). Cada entero ocupa un
número de bytes distinto.

En este cuaderno trabajaremos con ficheros de texto. Vamos a ver que el

trabajo con los ficheros de texto es esencialmente análogo al trabajo con
entrada/salida convencional a través de la consola (habitualmente el teclado y la
pantalla).

Elementos básicos de programación con ficheros

La equivalencia entre entrada/salida a través de teclado y pantalla y la
utilización de ficheros es muy profunda. Los S.O. actuales hacen un tratamiento
unificado de estos recursos y tratan, por ejemplo, a la pantalla y al teclado como
ficheros de salida y de entrada respectivamente, ficheros que están
siempre listos para ser utilizados. Es una muestra más del mecanismo de
abstracción mencionado más arriba.

Recalquemos que cuando en Python usamos print(), estamos escribiendo

datos en el fichero por defecto o estándar, la pantalla, y que cuando
empleamos input(), estamos leyendo datos del fichero por defecto o estándar,
el teclado.

Cuando no usamos los ficheros estándar, tanto en Python como en cualquier

otro lenguaje de programación, debemos realizar algunas tareas adicionales:
 Abrir el fichero: hay que asociar el fichero (definido a nivel del S.O.) con
un objeto que provea la fuente de datos y definir si se va utilizar para
entrada o para salida de datos, es decir, para leer o para escribir.
 Cerrar el fichero: Una vez finalizada la interacción con el objeto que
representa el fichero, este hecho debe ser informado al S.O. mediante los
métodos apropiados. Así, el S.O. podrá realizar las acciones requeridas
para garantizar que el fichero queda en un estado consistente y seguro.

El concepto de flujo de datos (stream)

Las operaciones de lectura/escritura hacen uso del concepto

de flujo o corriente de datos (stream). El símil se basa en el hecho de
interpretar la entrada/salida como una corriente o río de datos, donde estos son
representados por la aparición en serie, uno tras otro, de los bytes que
representan cada uno de los valores transferidos.

El concepto de transferencia de datos en serie es clave. Si desde el teclado

queremos introducir el número 543, es evidente que antes de escribir el 3,
debemos escribir el 4 y antes el 5. En el caso de los ficheros se utiliza el mismo
paradigma, se escribe un dato siempre a continuación del anterior.

La figura previa describe la relación que existe entre los datos almacenados en
el medio físico y la construcción lógica que es el fichero. A nivel del dispositivo
periférico, la forma de referirse al dato es a través de atributos de muy bajo
nivel, tales como su dirección, que puede ser descrita, por ejemplo, por la
intersección de cilindros y sectores definidos por el hardware.

El fichero, por su parte, es un conjunto lógico de datos donde el programa que

lo crea (con la ayuda indispensable del Sistema Operativo) decide tratarlos como
una unidad. Nótese que, en el nivel hardware, si se usa un disco duro como
almacenamiento, ese conjunto lógico involucrará a múltiples cilindros y sectores.

Memoria intermedia (buffers)

La entrada/salida desde/hacia ficheros está mediada, de forma transparente al

programador, por memoria auxiliar o búferes (buffers).

Los búferes cumplen distintos cometidos, pero el fundamental es el de servir

como pulmón de la CPU. Dado que los procesos de lectura/escritura en los
dispositivos son mucho más lentos que los realizados en la RAM, los datos son
temporalmente leídos/escritos en búferes. De esta forma, los accesos a un
dispositivo lento no ralentizan las aplicaciones.

Necesidad de cerrar el fichero

Cuando nuestro programa ha terminado de utilizar el fichero debe cerrarlo.

¿Por qué es necesario cerrar el fichero?

 La escritura/lectura se realiza sobre los búferes y estos son eventualmente

transferidos al medio físico. Cuando se cierra el fichero, se fuerza a
realizar esa transferencia. De otro modo, se podría incurrir en pérdida de
información.
 La utilización de un fichero comporta un consumo importante de
memoria del ordenador (búferes y otros elementos). Si no se cierra el
fichero, esa memoria resulta inutilizada.
 El Sistema Operativo establece un número máximo de ficheros que
pueden estar abiertos simultáneamente. Si no cerramos los ficheros que,
de momento, no estamos utilizando, puede que nuestro programa no
pueda abrir otros que sí son necesarios.

https://dungeonofbits.com/uso-de-ficheros-con-python.html
Lectura línea por línea de ficheros en Python
Para entender el manejo de ficheros en Python utilizaremos inicialmente un
sencillo ejemplo. Para ello, utilizaremos un editor de textos con el que hemos
creado un archivo llamado valores_en_columna.txt. El contenido es una
secuencia de valores enteros fácil de recordar, para que las comprobaciones del
buen funcionamiento del código sean sencillas de verificar.

De momento, para simplificar la ruta de acceso al fichero, este archivo está

situado al mismo nivel que este cuaderno. La extensión .txt es la habitual
para recalcar que el fichero es de tipo texto, pero podemos usar cualquier
extensión, preferentemente no utilizando aquellas habituales en aplicaciones
estándar, tales como .doc, .exe, .lib, .pdf, etc.

La apertura y el cierre

Los ficheros no estándar deben ser abiertos antes de ser utilizados, y cerrados
cuando se concluya (al menos provisionalmente) el trabajo con ellos.

Para abrir un fichero debemos tener en cuenta:

 La localización del fichero: (Ej.: “datos/temperaturas/Valladolid.dat”)

 La declaración del modo de apertura, que es un parámetro que indica si,
por ejemplo, queremos leer del fichero o escribir en el fichero:
o 'w' para escritura,
o 'r' para lectura
 La asignación de un nombre en el programa que a partir de ese
momento representará al fichero (Ej.: fich_sal)
Para abrir un fichero disponemos de la función open(), que nos devuelve
el objeto fichero con el que vamos a poder trabajar a partir de ese momento.
En el ejemplo, se abre un fichero 'Valladolid.dat' especificando la ruta de
acceso desde el directorio de trabajo, con la intención de escribir en él datos,
('w') y al que se referenciará con el nombre fich_sal.
fich_sal = open('datos/temperaturas/Valladolid.dat','w')

En la siguiente tabla se muestran los diferentes modos de apertura. Con saber

utilizar los modos 'w' y 'r' es más que suficiente para los objetivos del curso.

Modo de
apertura Descripción Acción
'w' Escritura Si el fichero no existe lo crea. Si existe, borra su contenido
'r' Lectura Si existe fichero: lo abre. Si no existe:
excepción FileNotFoundError
'a' Añadir Si fichero no existe, lo crea para escritura. Si existe, añade al final
'w+' Actualiza Escritura/ lectura. Si el fichero no existe lo crea. Si existe: borra
r
'r+' Actualiza Lectura/Escritura. Si no existe: excepción FileNotFoundError
r
'a+' Añadir Escritura/lectura. Si existe, añade al final.
'b' Binario Abre en binario. Combinadas con otras banderas: establece modo
'x' Creación Abre exclusivamente para crear fichero. Si ya existe, falla
Para cerrar el fichero se usa el método close(). Siguiendo con el ejemplo
anterior:

fich_sal = open('datos/temperaturas/Valladolid.dat', 'w')

# Código de escritura en el fichero
# ...
fich_sal.close() # Cerramos el fichero

En algunas celdas que siguen a continuación vamos a utilizar el comando

mágico de IPython %reset -f para resetear las variables del espacio de
nombres y que los resultados de una celda no influyan en las otras.

Lectura línea por línea

Tras abrir el fichero correspondiente, la forma básica de leer un fichero línea por
línea es:

fich_ent = open('nombre_fichero.txt', 'r')

for linea in fich_ent:
# Procesar la línea
fich_ent.close()

La variable linea es una cadena de caracteres que va tomando

secuencialmente las cadenas de caracteres correspondientes a cada una de las
líneas del fichero, desde la primera a la última.
# Leyendo del fichero "valores_en_columna.txt" línea a línea
fich_ent = open('valores_en_columna.txt', 'r') # Apertura

for linea in fich_ent:

print(linea)

fich_ent.close() # Cierre
1

Al ejecutar el código observaréis que aparece una línea en blanco entre cada
uno de los números. Esto es así porque cada línea en el fichero de texto tiene
un carácter no imprimible nueva línea, el carácter \n. A eso se une el que por
defecto introduce la función print().

Este hecho debe recordarnos que, al igual que con la función de lectura
estándar input(), lo que estamos leyendo son cadenas de caracteres, es
decir, linea es un dato tipo str. Si el usuario sabe que cada línea corresponde
a un valor entero, podemos recurrir a la función int().

En el siguiente ejemplo, rehacemos el código para almacenar los valores enteros

en una lista.

%reset -f
# Leyendo del fichero "valores_en_columna.txt" línea a línea
fich_ent = open('valores_en_columna.txt', 'r') # Apertura

lista_enteros = []
for linea in fich_ent:
lista_enteros.append(int(linea))

print(lista_enteros)

fich_ent.close() # Cierre
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Es muy importante darnos cuenta de que el éxito en la lectura del fichero se

sustenta en el hecho de que conocemos de antemano su formato. En este caso,
que el fichero está formado por líneas en las cuales hay un único número
entero. Si ese formato no se cumple, tendremos problemas.

Veamos qué ocurre si pretendemos utilizar el mismo código con el

fichero valores_en_fila.txt.

%reset -f
# Leyendo del fichero "valores_en_fila.txt" línea a línea
fich_ent = open('valores_en_fila.txt', 'r') # Apertura

lista_enteros = []
for linea in fich_ent:
lista_enteros.append(int(linea))

print(lista_enteros)

fich_ent.close() # Cierre
-------------------------------------------------------------------
--------
ValueError Traceback (most recent
call last)
~\AppData\Local\Temp\ipykernel_8452\3874021872.py in <module>
5 lista_enteros = []
6 for linea in fich_ent:
----> 7 lista_enteros.append(int(linea))
8
9 print(lista_enteros)

ValueError: invalid literal for int() with base 10: '1 2 3 4 5 6 7

8 9 10\n'

Afortunadamente, tenemos una bonita excepción:

ValueError: invalid literal for int() with base 10: '1 2 3 4 5 6 7
8 9 10\n'

El análisis del mensaje nos da luz acerca del problema. La primera línea del
fichero es la cadena de caracteres '1 2 3 4 5 6 7 8 9 10\n', que Python
lógicamente es incapaz de convertir a un entero vía la función int(). Observad
la presencia del carácter nueva línea \n al final.

Decimos afortunadamente porque no hay nada mejor que, de forma

automática, el motor de ejecución de Python nos informe de que algo estamos
haciendo mal. Imaginad que la ejecución no diese error y que en una
importante variable de nuestra aplicación cargásemos un valor espurio.

Veremos más adelante cómo leer este fichero.

Manejo de excepciones con ficheros

Aviso

Este apartado requiere haber estudiado el tema Manejo de excepciones.

En el caso del uso de ficheros, la capacidad de responder de forma consistente

a errores que se puedan producir es muy importante. Hay que tener en cuenta
que, cuando se trata de ficheros, existen una serie de elementos externos que
dependen del hardware y del Sistema Operativo que pueden fallar y que están
fuera del control del programador.

Por ejemplo:

 El fichero que se pretende abrir para lectura no existe.

 Se pretende abrir para escritura un fichero en un medio físico
(dispositivo) o lógico (carpeta) protegido contra escritura.
Otros fallos pueden ser debidos a:

 La estructura o formato que se espera del fichero no es la realmente

existente.
Acabamos de ver el ejemplo más arriba con el fichero valores_en_fila.txt.
 Durante la lectura del fichero, se produce otro tipo de excepción, como
una división por 0, etc.
Vamos a generar artificialmente una excepción IndexError y a capturarla
debidamente. Lo lograremos creando de inicio una lista de 9 elementos, cuando
nuestro fichero tiene realmente 10.
%reset -f
# Leyendo del fichero "valores_en_columna.txt" línea a línea
try:
fich_ent = open('valores_en_columna.txt', 'r')
# Línea "artificial" para generar un error de índice en nuestro
ejemplo
# Cambiando 9 por 10 el programa no genera error
num_valores = 9
lista_enteros = [0]*num_valores
for i, linea in enumerate(fich_ent): # Nótese el usu de
enumerate()
lista_enteros[i] = int(linea)
except IndexError as error:
print(error)
else:
print(lista_enteros)
finally:
print('Cerramos el fichero.')
fich_ent.close() # Cierre
list assignment index out of range
Cerramos el fichero.

Aquí vemos entrar en acción al bloque finally, un bloque concebido para ser

destinado a cerrar recursos abiertos, una especie de coche escoba. Tanto si
existe excepción como si no, el fichero está abierto y debemos cerrarlo.

Vamos ahora a provocar otro error típico: nos equivocamos al transcribir el

nombre. En el siguiente ejemplo, hemos empleado colunna en lugar
de columna.

%reset -f
try:
fich_ent = open('valores_en_colunna.txt', 'r')
# Línea "artificial" para generar un error de índice en nuestro
ejemplo
# Cambiando 9 por 10 el programa no genera error
num_valores = 9
lista_enteros = [0]*num_valores
for i, linea in enumerate(fich_ent):
lista_enteros[i] = int(linea)
except IndexError as error:
print(error)
else:
print(lista_enteros)
finally:
print('Cerramos el fichero.')
fich_ent.close() # Cierre
Cerramos el fichero.
-------------------------------------------------------------------
--------
FileNotFoundError Traceback (most recent
call last)
~\AppData\Local\Temp\ipykernel_8452\2102069716.py in <module>
2 try:
----> 3 fich_ent = open('valores_en_colunna.txt', 'r')
4 # Línea "artificial" para generar un error de índice en
nuestro ejemplo

FileNotFoundError: [Errno 2] No such file or directory:

'valores_en_colunna.txt'

During handling of the above exception, another exception occurred:

NameError Traceback (most recent

call last)
~\AppData\Local\Temp\ipykernel_8452\2102069716.py in <module>
14 finally:
15 print('Cerramos el fichero.')
---> 16 fich_ent.close() # Cierre

NameError: name 'fich_ent' is not defined

¡Tenemos dos excepciones!

 La excepción FileNotFoundError es bastante descriptiva del tipo de

error cometido.
 La excepción NameError nos está diciendo que no conoce la existencia
de la variable fich_ent. Pero, ¡la tenemos definida en la
línea fich_ent = open('valores_en_colunna.txt','r')! Raro ¿no?
Vamos, de momento, a manejar la excepción FileNotFoundError, cuyo origen
tenemos claro.

%reset -f
# Leyendo del fichero "valores_en_columna.txt" línea a línea
try:
fich_ent = open('valores_en_colunna.txt', 'r')
# Línea "artificial" para generar un error de índice en nuestro
ejemplo
# Cambiando 9 por 10 el programa no genera error
num_valores = 9
lista_enteros = [0]*num_valores
for i, linea in enumerate(fich_ent):
lista_enteros[i] = int(linea)
except (IndexError, FileNotFoundError) as error:
print(error)
else:
print(lista_enteros)
finally:
print('Cerramos el fichero.')
fich_ent.close() # Cierre
[Errno 2] No such file or directory: 'valores_en_colunna.txt'
Cerramos el fichero.
-------------------------------------------------------------------
--------
NameError Traceback (most recent
call last)
~\AppData\Local\Temp\ipykernel_8452\1302000543.py in <module>
15 finally:
16 print('Cerramos el fichero.')
---> 17 fich_ent.close() # Cierre

NameError: name 'fich_ent' is not defined

Seguimos teniendo la excepción NameError.

¿Qué está pasando?

El problema es que la excepción FileNotFoundError se genera en la parte

derecha de la asignación a la variable fich_ent, al intentar abrir un fichero que
no existe. Y la asignación nunca llega a producirse y, por tanto, la
variable fich_ent no llega a estar definida nunca.

Nuestro finally tal y como está programado no nos ayuda. Podríamos

solventar el problema a través de la utilización de código más verboso, pero hay
mejores opciones.

El administrador de contextos with
A partir de la versión 2.6 de Python se introdujo una nueva estructura de control
de flujo, la construcción with. La estructura with ha
sido diseñada específicamente para lidiar con código donde se
manejan objetos que utilizan recursos externos. Por ello, Python define a la
estructura with como un administrador de contextos (context manager).

El concepto de contexto se utiliza en informática para referirse al conjunto de

datos utilizados por un recurso que deben ser guardados para permitir una
posterior reutilización.

Además de los ficheros, un administrador de contextos como with puede

trabajar con otros objetos, tales como aquellos dedicados a gestionar
conexiones a red, bases de datos, etc. Con todos estos recursos, se van
produciendo una serie de pasos, generándose nuevos estados. Los recursos
son adquiridos y deben ser liberados o cerrados aún en presencia
de excepciones.

La construcción with crea un contexto que ante la presencia de posibles

excepciones maneja el recurso que representa el fichero. Usando with ya no es
necesario cerrar explícitamente el fichero utilizando close(): el administrador
de contexto creado con with se ocupa de todos estos detalles tras las
bambalinas.

%reset -f
# Leyendo del fichero "valores_en_columna.txt" línea a línea
with open('valores_en_columna.txt', 'r') as fich_ent:
lista_enteros = []
for linea in fich_ent:
lista_enteros.append(int(linea))
print(lista_enteros)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

El manejo de excepciones usando with

Aviso

Este apartado requiere haber estudiado el tema Manejo de excepciones.

El uso de with resuelve los problemas del ejemplo visto más arriba.

%reset -f
# Leyendo del fichero "valores_en_columna.txt" línea a línea
try:
with open('valores_en_columna.txt', 'r') as fich_ent:
# Línea "artificial" para generar un error de índice en
nuestro ejemplo
# Cambiando 9 por 10 el programa no genera error
lista_enteros = [0]*10 # Línea "artificial" que genera un
error de índice en este ejemplo
for i, linea in enumerate(fich_ent):
lista_enteros[i] = int(linea)
except (FileNotFoundError, IndexError) as error:
print(error)
else:
print(lista_enteros)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

En la celda anterior puede probar ahora a cambiar el nombre del fichero o el

número de elementos de la lista para ver cómo se manejan las excepciones
con with.

Una vez analizadas las excepciones, la forma recomendada de leer el

fichero 'valores_en_columna.txt' con with sería:

%reset -f
# Leyendo del fichero "valores_en_columna.txt" línea a línea
try:
with open('valores_en_columna.txt', 'r') as fich_ent:
lista_enteros = []
for linea in fich_ent:
lista_enteros.append(int(linea))
except FileNotFoundError as error:
print(error)
else:
print(lista_enteros)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Vistas estas ventajas, usaremos a partir de ahora, la estructura with.

Otras formas de lectura en Python

Una alternativa a leer línea por línea es hacerlo en un único paso:

 usando el método readlines(). Se crea una lista con las cadenas de

caracteres de cada una de las líneas.
 usando el método read(). Obtendremos una única cadena de caracteres
unión de todas las líneas, incluidos los caracteres nueva línea.
Debemos señalar que estas funciones pueden usarse con un argumento
indicando el número de caracteres a leer, opción que no estudiaremos.

Para hacer menos prolija la explicación, evitaremos el uso del manejo de

excepciones en lo que sigue.

Ejemplo de uso de readlines()

Para el fichero que estamos manejando, podemos observar que el código es

menos compacto que con el método de lectura iterada línea por línea.

%reset -f
# Leyendo del fichero "valores_en_columna.txt" con readlines()

with open('valores_en_columna.txt', 'r') as fich_ent:

lista_lineas = fich_ent.readlines()

print("Lista con las líneas del fichero\n{}".format(lista_lineas))

# Transformamos cada una de las líneas en el entero correspondiente
lista_enteros = [int(linea) for linea in lista_lineas] # Lista por
comprensión
print("Lista con los enteros del fichero\
n{}".format(lista_enteros))
Lista con las líneas del fichero
['1\n', '2\n', '3\n', '4\n', '5\n', '6\n', '7\n', '8\n', '9\n',
'10\n']
Lista con los enteros del fichero
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Ejemplo de uso de read()

%reset -f
# Leyendo del fichero "valores_en_columna.txt" con read()
with open('valores_en_columna.txt', 'r') as fich_ent:
lineas_unidas = fich_ent.read()

print("Una única cadena de caracteres correspondiente a todo el

fichero\n{}".format(lineas_unidas))
Una única cadena de caracteres correspondiente a todo el fichero
1
2
3
4
5
6
7
8
9
10

¡Atención! Lo que hemos sacado por pantalla es una única cadena de

caracteres, la cadena '1\n2\n3\n4\n5\n6\n7\n8\n9\n10\n', en cuyo interior
hay caracteres nueva línea \n.

Si utilizamos esta alternativa, para extraer nuestra secuencia de números

enteros podemos recurrir al método split() asociado a las cadenas de
caracteres. El método split() extrae las palabras de la cadena de caracteres
situadas entre espacios en blanco, que incluyen tabuladores, nuevas líneas, etc…

El método split() ya lo hemos usado cuando introducíamos por teclado

valores secuencialmente separados por espacios sin usar intro.
%reset -f
# Leyendo del fichero "valores_en_columna.txt" con read()
with open('valores_en_columna.txt', 'r') as fich_ent:
lineas_unidas = fich_ent.read()

lista_enteros = [int(palabra) for palabra in lineas_unidas.split()]

print("Lista con los enteros del fichero en columna\
n{}".format(lista_enteros))
Lista con los enteros del fichero en columna
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Con este método, estamos en condiciones de procesar también nuestro archivo

de números en una sola línea valores_en_fila.txt.

%reset -f
# Leyendo del fichero "valores_en_fila.txt" con read()
with open('valores_en_fila.txt', 'r') as fich_ent:
lineas_unidas = fich_ent.read()
lista_enteros = [int(palabra) for palabra in lineas_unidas.split()]
print("Lista con los enteros del fichero en fila\
n{}".format(lista_enteros))
Lista con los enteros del fichero en fila
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Debemos recalcar que existen más posibilidades de lectura de los ficheros, que
pueden consultarse en la documentación de Python, pero, entre todas las
opciones, la lectura línea por línea es probablemente la más fácil y más utilizada.

Leyendo un fichero con formato complejo

Los dos ejemplos de ficheros vistos hasta el momento tienen una estructura
muy simple, lo que no significa que no sean útiles.

Las aplicaciones prácticas requieren ser capaces de crear y leer ficheros que

tengan una estructura compleja conocida de tamaño arbitrario, con
independencia del número de datos que estos ficheros almacenen. En estos
ficheros pueden mezclarse comentarios y datos tanto numéricos como cadenas
de caracteres.

Para dar solo algunos ejemplos de los innumerables que podrían citarse, un
fichero puede contener:

 los datos del censo de una ciudad o un país: nombre y apellidos, DNI,
dirección y edad de los votantes.
 la sucesión de temperaturas recogidas por un sensor en determinado
lugar.
 las filas y columnas de una matriz de dimensiones arbitrarias.
 los datos, organizados en número arbitrario de ejes, de un estudio
epidemiológico, etc.
Todos los problemas tienen en común que el significado de los datos y la
estructura básica de la organización de los mismos tienen que ser conocidos
por el programador que diseña la aplicación de lectura y/o escritura del
fichero. El volumen total de los datos (cantidad de personas, número de lecturas
del sensor, dimensiones de la matriz, numero de ejes y cantidad de elementos
por eje) es, en general, desconocido.

La figura siguiente muestra el fichero almacen.txt, cuyo formato es algo más

complejo, formado por:
 Una línea inicial que es un comentario explicativo del contenido del
fichero, en general, útil solo para el usuario que lo abre directamente
desde un editor de textos.
 Una serie de líneas que contienen, cada una de ellas, una referencia de
un producto y su precio.

Veamos un posible fragmento para su lectura. Lo relevante:

 Leemos la primera línea y la obviamos

 Para cada una de las siguientes líneas, extraemos con split() la
referencia y el precio.
Es importante darnos cuenta también aquí del concepto de flujo de datos. Tras
leer con readline() la línea del comentario, ésta ya está extraída de él. De
hecho, un puntero oculto estará ahora señalando a la siguiente línea, al
siguiente byte a extraer, correspondiente a la línea donde se
encuentra ref_1 y 1.5. Por eso, el bucle for que itera a continuación sobre el
objeto fichero fich lo hace desde esa línea, no desde el principio del fichero.

# Leyendo el fichero "almacen.txt"

with open('almacen.txt', 'r') as fich:
fich.readline() # Leemos la primera línea, pero la obviamos
producto = []
precio = []
for linea in fich:
palabras = linea.split()
producto.append(palabras[0])
precio.append(float(palabras[1]))

print(producto)
print(precio)
['ref_1', 'ref_2', 'ref_3', 'ref_4']
[1.5, 2.1, 9.98, 4.41]

Vamos a introducir en el siguiente fragmento dos mejoras:

 Leemos el fichero a través de una función, encapsulando su código

 Creamos una lista de tuplas con la pareja (referencia, precio)
%reset -f
def lee_fichero(nombre):
with open(nombre, 'r') as fich:
fich.readline() # Leemos la primera línea pero la obviamos
listado_precios = []
for linea in fich:
palabras = linea.split()
listado_precios.append((palabras[0],
float(palabras[1])))

return listado_precios

# Programa principal
lista = lee_fichero('almacen.txt') # Prueba a introducir un nombre
erróneo
print(lista)
[('ref_1', 1.5), ('ref_2', 2.1), ('ref_3', 9.98), ('ref_4', 4.41)]

Escritura en un fichero
La escritura en un fichero es comparativamente algo más simple que la lectura.
No en vano, es el programador el que controla cómo es la estructura del
fichero. Además, puede despreocuparse de elementos tales como los caracteres
nueva línea, espacios en blanco, etc.

Aunque puede usarse la función print() para escribir en un fichero, el método

relevante es write(). A diferencia de print(), el método write() no añade un
carácter nueva línea por defecto al escribir en el fichero.

Si necesitamos añadir una línea, no tenemos más que añadir a la cadena

correspondiente el carácter \n.

Otro aspecto importante es ser conscientes de lo que ocurre si abrimos un

fichero para escritura usando el modo de apertura 'w':

 Si el fichero no existe, se creará uno nuevo con ese nombre

 Si el fichero ya existe, ¡se borrará su contenido!
En el siguiente fragmento, vamos a crear un fichero almacen_clon.txt, idéntico
a almacen.txt, usando todas las herramientas que ya conocemos.

%reset -f
def escribe_fichero(nombre, comentario, lista):
with open(nombre, 'w') as fich:
fich.write(comentario + '\n') # Escribimos el comentario
for x in lista:
fich.write('{} {}\n'.format(x[0], x[1]))

# Programa principal
comentario = 'Lista de productos y precios en Euros'
listado_precios = [('ref_1', 1.5), ('ref_2', 2.1), ('ref_3', 9.98),
('ref_4', 4.41)]
escribe_fichero('almacen_clon.txt', comentario, listado_precios)

En lugar de utilizar el método write() se podría haber utilizado la propia

función print() que hemos venido utilizando para la salida por la consola
(asociada normalmente a la pantalla).

Para que print() escriba en un fichero diferente a la consola, que es el fichero

por defecto, se puede utilizar el parámetro file de print() de la manera que se
muestra:

print(cadena, file=fich)

Como ya sabemos, la función print() sí incluye automáticamente el cambio de

línea al final de la cadena procesada.

La versión de la función escribe_fichero() usando print() sería la siguiente:

%reset -f
def escribe_fichero(nombre, comentario, lista):
with open(nombre, 'w') as fich:
print(comentario, file=fich) # Escribimos el comentario
for x in lista:
print(x[0], x[1], file=fich)

Consideraciones finales
En lo anterior, se han discutido algunos conceptos elementales del concepto
informático de fichero y también un repaso de los métodos básicos para leer
y/o escribir ficheros con Python.

En muchas ocasiones, este acceso básico, es todo lo que se requiere.

Consecuente con su filosofía, Python ofrece recursos de un mayor nivel de

abstracción para lidiar de forma productiva con ficheros que siguen una
estructura más compleja. Esta estructura puede ir desde simples ficheros en los
que los datos aparecen en columnas separados por comas u otros separadores,
llamados ficheros tipo csv (comma separated values), hasta aquellos ficheros
que sirven como infraestructura a bases de datos.

Sin pretender catalogar todas las posibilidades, entre los recursos que brinda
el ecosistema de Python para trabajar con ficheros de diferentes estructuras, se
tienen:

 Módulo csv (biblioteca estándar de Python): Ficheros csv.

 Módulo XML (biblioteca estándar de Python): Para trabajar con ficheros
codificados el estándar XML
 Módulo JSON (biblioteca estándar de Python): Para ficheros codificados
en el estándar JSON (Javascript Object Notation) el estándar de facto en
intercambio de información.
 OpenPyXL: Biblioteca para la manipulación de hojas de cálculo Excel.
 Pandas: Para análisis y manipulación de datos.

También podría gustarte

Manual de Operaciion y Mantenimiento SK210LC-8
100% (1)
Manual de Operaciion y Mantenimiento SK210LC-8
282 páginas
Sistema de Archivos
Aún no hay calificaciones
Sistema de Archivos
28 páginas
M4T8 Ficheros
Aún no hay calificaciones
M4T8 Ficheros
14 páginas
Tema 15 Documentos de La Administración de La Junta de Andalucía
Aún no hay calificaciones
Tema 15 Documentos de La Administración de La Junta de Andalucía
25 páginas
En Inter Lift
100% (2)
En Inter Lift
130 páginas
Ficha de Lectura para Plan Lector El Laboratorio Del Abuelo
Aún no hay calificaciones
Ficha de Lectura para Plan Lector El Laboratorio Del Abuelo
4 páginas
14 Principios de Toyota
100% (3)
14 Principios de Toyota
22 páginas
10 Ejemplos de Modelos Entidad Relacion
76% (25)
10 Ejemplos de Modelos Entidad Relacion
4 páginas
Ficha 22 (2016) - Archivos (Python)
Aún no hay calificaciones
Ficha 22 (2016) - Archivos (Python)
26 páginas
Teorías de Marketing
Aún no hay calificaciones
Teorías de Marketing
4 páginas
Archivos Secuenciales y Directos
100% (1)
Archivos Secuenciales y Directos
33 páginas
Reg 670
Aún no hay calificaciones
Reg 670
106 páginas
Planificacion de Sistemas
100% (1)
Planificacion de Sistemas
53 páginas
Valicha Danza Cuzco Peru
Aún no hay calificaciones
Valicha Danza Cuzco Peru
3 páginas
La Abeja Haragana
Aún no hay calificaciones
La Abeja Haragana
8 páginas
Curso de programación Bash Shell
De Everand
Curso de programación Bash Shell
Arturo Enrique Mata Garcia
Aún no hay calificaciones
Las TIC Como Apoyo A Los Procesos Cognitivos
100% (1)
Las TIC Como Apoyo A Los Procesos Cognitivos
16 páginas
Clase - FICHEROS EN PYTHON
Aún no hay calificaciones
Clase - FICHEROS EN PYTHON
42 páginas
Instrumentos de Medición Del Clima
Aún no hay calificaciones
Instrumentos de Medición Del Clima
6 páginas
Alta de Insumos-1
Aún no hay calificaciones
Alta de Insumos-1
334 páginas
UT06-Ficheros en Python
Aún no hay calificaciones
UT06-Ficheros en Python
79 páginas
Tema 3 - Uso de Ficheros - I Parte-1
Aún no hay calificaciones
Tema 3 - Uso de Ficheros - I Parte-1
41 páginas
Tes Is 1999 Arce
Aún no hay calificaciones
Tes Is 1999 Arce
136 páginas
Tema6 Ficheros
Aún no hay calificaciones
Tema6 Ficheros
28 páginas
Tema10 Ficheros
Aún no hay calificaciones
Tema10 Ficheros
57 páginas
Unidad 6 - Archivos v20
Aún no hay calificaciones
Unidad 6 - Archivos v20
26 páginas
IEE Puente Grúa-Banda Transportadora
Aún no hay calificaciones
IEE Puente Grúa-Banda Transportadora
8 páginas
Unidad 6 Archivos
Aún no hay calificaciones
Unidad 6 Archivos
48 páginas
Sistema de Comunicación
Aún no hay calificaciones
Sistema de Comunicación
137 páginas
Mod1 Tema5
Aún no hay calificaciones
Mod1 Tema5
32 páginas
Ficheros ULSA Diurno
Aún no hay calificaciones
Ficheros ULSA Diurno
27 páginas
9 Archivos
Aún no hay calificaciones
9 Archivos
28 páginas
Tema5 Castellano
Aún no hay calificaciones
Tema5 Castellano
33 páginas
Tema 3. Archivos00
Aún no hay calificaciones
Tema 3. Archivos00
12 páginas
Informe de Falla Baterias
100% (1)
Informe de Falla Baterias
5 páginas
Varias TENTACIONES DE JESUS
Aún no hay calificaciones
Varias TENTACIONES DE JESUS
13 páginas
Módulo 5. El Sistema de Ficheros
Aún no hay calificaciones
Módulo 5. El Sistema de Ficheros
42 páginas
Tema 7. Archivos
Aún no hay calificaciones
Tema 7. Archivos
30 páginas
Unidad 3 - ArchivosSecuenciales - v10
Aún no hay calificaciones
Unidad 3 - ArchivosSecuenciales - v10
16 páginas
Instituto Tecnológico de Toluca: Materia
Aún no hay calificaciones
Instituto Tecnológico de Toluca: Materia
13 páginas
Pregunta Frecuente: Consideraciones Previas
Aún no hay calificaciones
Pregunta Frecuente: Consideraciones Previas
5 páginas
ROBBINS Adm10ed Cap09 (Compatibility Mode)
Aún no hay calificaciones
ROBBINS Adm10ed Cap09 (Compatibility Mode)
18 páginas
Elementos Más Abundantes de La Geósfera
Aún no hay calificaciones
Elementos Más Abundantes de La Geósfera
2 páginas
Xdoc - MX Ficheros Ingkarina Esquivel - 2
Aún no hay calificaciones
Xdoc - MX Ficheros Ingkarina Esquivel - 2
25 páginas
Tema 7. Archivos
Aún no hay calificaciones
Tema 7. Archivos
18 páginas
Archivos
Aún no hay calificaciones
Archivos
30 páginas
AprendePython-cap05.5 - Ficheros
Aún no hay calificaciones
AprendePython-cap05.5 - Ficheros
10 páginas
2022-2023 EDA01 Ficheros V1
Aún no hay calificaciones
2022-2023 EDA01 Ficheros V1
26 páginas
Inventario Riesgos Obra Gruesa Planta Biogas Mostazal
Aún no hay calificaciones
Inventario Riesgos Obra Gruesa Planta Biogas Mostazal
132 páginas
Fi Cheros
Aún no hay calificaciones
Fi Cheros
19 páginas
Archivos
Aún no hay calificaciones
Archivos
17 páginas
Xdoc - MX Ficheros Ingkarina Esquivel
Aún no hay calificaciones
Xdoc - MX Ficheros Ingkarina Esquivel
10 páginas
UT1.2 Ficheros
Aún no hay calificaciones
UT1.2 Ficheros
19 páginas
LOS ECOSISTEMAS - Colegio San Nicoles
Aún no hay calificaciones
LOS ECOSISTEMAS - Colegio San Nicoles
2 páginas
2 Archivos
Aún no hay calificaciones
2 Archivos
21 páginas
El Lenguaje Del Delfín
Aún no hay calificaciones
El Lenguaje Del Delfín
6 páginas
ERA PALEOZOICA - Periodos
Aún no hay calificaciones
ERA PALEOZOICA - Periodos
3 páginas
Fundamentos Del Vole1
Aún no hay calificaciones
Fundamentos Del Vole1
1 página
Eras - Periodos GEOLÓGICAS
Aún no hay calificaciones
Eras - Periodos GEOLÓGICAS
3 páginas
Aplicaciones de Los Gases en La Ingenieria Mecanica
Aún no hay calificaciones
Aplicaciones de Los Gases en La Ingenieria Mecanica
6 páginas
Aniversario de Nuestra Institución San Nicolas
Aún no hay calificaciones
Aniversario de Nuestra Institución San Nicolas
5 páginas
Farmacología - Farmacocinética
Aún no hay calificaciones
Farmacología - Farmacocinética
5 páginas
Diseño de Redes Logísticas
Aún no hay calificaciones
Diseño de Redes Logísticas
62 páginas
14 Archivos
Aún no hay calificaciones
14 Archivos
14 páginas
La Materia
Aún no hay calificaciones
La Materia
2 páginas
Introduccion - A - Archivos C++
Aún no hay calificaciones
Introduccion - A - Archivos C++
27 páginas
Tema5 Ficheros
Aún no hay calificaciones
Tema5 Ficheros
19 páginas
ARCHIVOS
Aún no hay calificaciones
ARCHIVOS
21 páginas
Archivos (Reporte)
Aún no hay calificaciones
Archivos (Reporte)
27 páginas
CCNA2 RS Cap01
Aún no hay calificaciones
CCNA2 RS Cap01
29 páginas
Modulo 8 - Archivos
Aún no hay calificaciones
Modulo 8 - Archivos
17 páginas
Archivos PensamientoComputacional 2c 2023
Aún no hay calificaciones
Archivos PensamientoComputacional 2c 2023
17 páginas
Facultad Ingenierã A - 2023-2
Aún no hay calificaciones
Facultad Ingenierã A - 2023-2
12 páginas
Triptico Papel Organico
Aún no hay calificaciones
Triptico Papel Organico
2 páginas
Reporte GPS
Aún no hay calificaciones
Reporte GPS
5 páginas
TRIPTICO Virgen de Cera
Aún no hay calificaciones
TRIPTICO Virgen de Cera
2 páginas
T06 Ficheros
Aún no hay calificaciones
T06 Ficheros
9 páginas
TEMPERATURA y CALOR - FISICA - II 2do Secundaria
Aún no hay calificaciones
TEMPERATURA y CALOR - FISICA - II 2do Secundaria
5 páginas
Teoria de Archivos
Aún no hay calificaciones
Teoria de Archivos
40 páginas
00 Archivos
Aún no hay calificaciones
00 Archivos
11 páginas
República de Panamá Ministerio de Educacion Instituto Pedagógico Superior Juan Demóstenes Arosemena
Aún no hay calificaciones
República de Panamá Ministerio de Educacion Instituto Pedagógico Superior Juan Demóstenes Arosemena
3 páginas
COMUNICACIÓN Norma, Variación y Enseñanza de La Lengua
Aún no hay calificaciones
COMUNICACIÓN Norma, Variación y Enseñanza de La Lengua
3 páginas
La Composición Artística y Sus Elementos - Ficha
Aún no hay calificaciones
La Composición Artística y Sus Elementos - Ficha
3 páginas
Robot Resolvedor de Laberinto: Equipo 4
Aún no hay calificaciones
Robot Resolvedor de Laberinto: Equipo 4
13 páginas
El Diseño Publicitario
Aún no hay calificaciones
El Diseño Publicitario
3 páginas
Lenguajes I / Lenguajes: Ucasal - Facultad de Ingeniería
Aún no hay calificaciones
Lenguajes I / Lenguajes: Ucasal - Facultad de Ingeniería
24 páginas
Unidad 6 Pensamiento Computacional
Aún no hay calificaciones
Unidad 6 Pensamiento Computacional
18 páginas
Unidad 6 - Flujos y Archivos.
Aún no hay calificaciones
Unidad 6 - Flujos y Archivos.
21 páginas
Auditar Un Business Intelligence
Aún no hay calificaciones
Auditar Un Business Intelligence
2 páginas
Programacion de Cursos Tecnicos Industriales 2018 Tegucigalpa
Aún no hay calificaciones
Programacion de Cursos Tecnicos Industriales 2018 Tegucigalpa
4 páginas
Bacymed400 S GSM
Aún no hay calificaciones
Bacymed400 S GSM
2 páginas
Ficheros en Dev C++
Aún no hay calificaciones
Ficheros en Dev C++
15 páginas
El Sector de La Construcción Civil
Aún no hay calificaciones
El Sector de La Construcción Civil
2 páginas
Archivos Programacion.
Aún no hay calificaciones
Archivos Programacion.
24 páginas
Archivos en C
Aún no hay calificaciones
Archivos en C
6 páginas
María Eliana Briones Calderón - Ensayo Grupal
Aún no hay calificaciones
María Eliana Briones Calderón - Ensayo Grupal
6 páginas
Ficha de Trabajo Educacion Fisica 17-06-2025
Aún no hay calificaciones
Ficha de Trabajo Educacion Fisica 17-06-2025
2 páginas
Presentación - Lectura y Escritura de Archivos
Aún no hay calificaciones
Presentación - Lectura y Escritura de Archivos
17 páginas
Arquitectura Del PLC
Aún no hay calificaciones
Arquitectura Del PLC
4 páginas
Fayser Rack Server Extraventilado
Aún no hay calificaciones
Fayser Rack Server Extraventilado
3 páginas
Resumen Estructura de Archivos
Aún no hay calificaciones
Resumen Estructura de Archivos
15 páginas
Informe Fase 2 PR
Aún no hay calificaciones
Informe Fase 2 PR
12 páginas
Entrada y Salida Por Archivos
Aún no hay calificaciones
Entrada y Salida Por Archivos
14 páginas
Practica de Computacion 5to Primaria
Aún no hay calificaciones
Practica de Computacion 5to Primaria
1 página
Informe Programacion 2DA FASE
Aún no hay calificaciones
Informe Programacion 2DA FASE
11 páginas
Trabajo Archivos - Victor Henriquez
Aún no hay calificaciones
Trabajo Archivos - Victor Henriquez
11 páginas
Día de La Canción Criolla Peru
Aún no hay calificaciones
Día de La Canción Criolla Peru
1 página
Generalidades Programacion C
Aún no hay calificaciones
Generalidades Programacion C
13 páginas
Manejo de Archivos en Python
Aún no hay calificaciones
Manejo de Archivos en Python
6 páginas
Tabla de Derivadas - Integrales
Aún no hay calificaciones
Tabla de Derivadas - Integrales
2 páginas
Programación Orientada A Objetos Unidad 6 Archivos
Aún no hay calificaciones
Programación Orientada A Objetos Unidad 6 Archivos
13 páginas
Archivos y Ficheros
Aún no hay calificaciones
Archivos y Ficheros
5 páginas
Monografia de Ada
Aún no hay calificaciones
Monografia de Ada
14 páginas
Practica Archivos Texto C++
Aún no hay calificaciones
Practica Archivos Texto C++
10 páginas
FICHA DE TRABAJO N°13 ED. RELIGIOSA 1° SEC. IV UNIDAD SAN PEDRO Y SAN PABLO 2025 ALFRED NOBEL MISS WENDI (1)
Aún no hay calificaciones
FICHA DE TRABAJO N°13 ED. RELIGIOSA 1° SEC. IV UNIDAD SAN PEDRO Y SAN PABLO 2025 ALFRED NOBEL MISS WENDI (1)
2 páginas
DÍA NACIONAL DE LA ALPACA
Aún no hay calificaciones
DÍA NACIONAL DE LA ALPACA
1 página
Día Internacional de conservación del Ecosistema de Manglares
Aún no hay calificaciones
Día Internacional de conservación del Ecosistema de Manglares
1 página
Santuario Reserva Parque Biosfera Peru Imagenes
Aún no hay calificaciones
Santuario Reserva Parque Biosfera Peru Imagenes
1 página
Personajes Iliada Principales
Aún no hay calificaciones
Personajes Iliada Principales
1 página
Aprende a Programar a Python
De Everand
Aprende a Programar a Python
Ángel Arias
Aún no hay calificaciones