0% encontró este documento útil (0 votos)
7 vistas26 páginas

Python For Engineers 1

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
7 vistas26 páginas

Python For Engineers 1

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 26

PYTHON FOR ENGINEERS (1)

IMPORTACIÓN DE DATOS EN PYTHON

February 7, 2023
PANDAS

Pandas es una biblioteca de


Python desarrollada
específicamente con el propósito
de ayudar en la manipulación y
análisis de datos, en particular
ofrece estructuras de datos y
operaciones para manipular tablas
numéricas y series de tiempo

2
PIP

Python Package Manager


Nos permite extender funcionalidad
mediante librerías que no están
incluidas en la distribución estándar
de Python
PIP debería estar instalado pero si
algo no esta funcionando, podemos
verificar su instalación mediante el
comando: pip –V

4
INSTALAR LIBRERIAS EXTERNAS

Instalar pandas con PIP


Para poder ocupar librerías externas
necesitamos instalarlas con el
comando pip install

5
DONDE TRABAJAR EN PYTHON

Jupyter Notebooks
Es una herramienta para desarrollar
y presentar nuestro trabajo,
Todo desde el mismo lugar. De tal
forma de ordenar y almacenar
nuestros análisis en cuadernos.

Cabe destacar que esta herramienta no es


necesaria, y podemos utilizar cualquier editor de
texto o IDE para trabajar

6
JUPYTER NOTEBOOKS

Anaconda
Es una distribución de Python que
incluye por defecto muchas
herramientas utilizadas en el área de
ciencia de datos.
Dentro de los cuales nos interesan:
• Pandas
• Matplotlib
• Jupyter Notebooks
Para instalar dirigirse a anaconda.com/products/distribution
Por lo que al instalar Anaconda Y seguir las instrucciones del instalador grafico
tendremos todo lo que necesitamos en
un solo lugar
7
JUPYTER NOTEBOOKS

Basics
1. Abrir Anaconda Navigator
2. Ejecutar jupyter notebooks
• Creamos una carpeta para
almacenar nuestros cuadernos

Si no se abre automáticamente una pestaña nueva en tu navegador,


Copiar y pegar en tu navegador una de las URL indicadas en la terminal

8
JUPYTER NOTEBOOKS

Basics
1. Abrir Anaconda Navigator
2. Ejecutar jupyter notebooks
• Creamos una carpeta para almacenar
nuestros cuadernos

3. Crear un cuaderno nuevo


• Dentro de la carpeta donde
trabajaremos,
• seleccionamos ’new’
• debajo de notebooks seleccionamos la
versión de Python que deseamos utilizar

Archivo creado dentro de la carpeta honeywell en el escritorio

9
JUPYTER NOTEBOOKS

Basics
1. Renombrar el archivo
• Recordar que estos son archivos que
estaran presentes en nuestro
computador localmente

2. Comenzar a programar!
• Tambien recordar que no es necesario
trabajar en jupyter notebooks, todo lo
que haremos aquí, se puede hacer de la
misma manera creando un archivo .py
corriendolo en una terminal o en un IDE

10
IMPORTACIÓN DE DATOS

Basics

1. Primero hay que importar la librería pandas


y asignarle un nombre mas corto (pd) por
conveniencia
2. Asegurarnos que nuestros datos estén en
la misma carpeta que nuestro cuaderno.
3. Pandas trabaja con una estructura de datos
llamada Dataframe. (Basicamente una
tabla) y cuando se lee un archivo con
pandas este lo transforma a Dataframe

11
IMPORTACIÓN DE DATOS

Archivos .CSV
(Asumiendo que los datos están en la misma carpeta)

1. Para leer nuestros datos llamamos al método

pd.read_csv(“miArchivo.csv”)

2. lo que retorna este método lo debemos asignar


a una variable, en este caso ‘data’

3. para comprobar la correcta lectura, podemos


utilizar print(data) o jupyter nos permite
simplemente llamar la variable data

13
IMPORTACIÓN DE DATOS

Archivos .xlsx (Excel)


(Asumiendo que los datos están en la misma
carpeta)
1. Para leer nuestros datos llamamos al
método

pd.read_excel(“miArchivo.xlsx”)

2. Y para utilizar estos datos los asignamos a


una variable que será de tipo dataframe

data = pd.read_excel(“miArchivo.xlsx”)

14
PARAMETROS AVANZADOS

Estos son parámetros que se dan como


argumento después del nombre del archivo

( La mayoría aplica para archivos .csv y .xlsx )

15
PARAMETROS AVANZADOS

sep =

Podemos ver que nuestro archivo .csv es delimitado por comas


16
PARAMETROS AVANZADOS

header =

En este ejemplo se ve que al poner


header=None los nombres de las
columnas se toman como datos

17
PARAMETROS AVANZADOS

header =

El ejemplo resultante muestra que ahora los nombres de las columnas son a, b y c.

Para un mejor resultado podríamos saltar la primera línea y evitar tener los
nombres anteriores como datos en la tabla 18
PARAMETROS AVANZADOS

index_col =

19
PARAMETROS AVANZADOS

usecols =

20
PARAMETROS AVANZADOS

skiprows =

21
PARAMETROS AVANZADOS

nrows =

22
PARAMETROS AVANZADOS

dtype =

Se puede ver que la segunda columna quedo como ’string’ cuando esta
era un float64 previamente 23
ESCRITURA DE DATOS

Escribir a un archivo csv


Para escribir un timeframe que hayamos creado
o copiado de algún archivo solo tenemos que
utilizar el comando to_csv() y especificar el
nombre que queramos para el archivo y el
caracter separador.

26
ESCRITURA DE DATOS

Escribir a un archivo csv


Para escribir un timeframe que hayamos creado
o copiado de algún archivo solo tenemos que
utilizar el comando to_csv() y especificar el
nombre que queramos para el archivo y el
caracter separador.

27
EJEMPLO REAL

Importar las primeras 500 filas seleccionando solo las columnas


”Timestamp” ,”Rec Met L1 Rougher” y ”Ley Cola L1 Rougher” del archivo
“Data Ejemplo.xlsx”

28
EJEMPLO REAL
SOLUCIÓN

29
GRACIAS
POR TU
ATENCIÓN

También podría gustarte