0% encontró este documento útil (0 votos)
11 vistas25 páginas

Python For Engineers 2

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
11 vistas25 páginas

Python For Engineers 2

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 25

PYTHON FOR ENGINEERS (2)

MANIPULACIÓN DE DATOS

February 7, 2023
CREAR DATOS

Dataframe

La forma mas simple Para crear un


dataframe es crear un diccionario y
luego usar el comando

pd.DataFrame(“miDiccionario”)

Para asignar el diccionario a un


dataframe.

3
AGREGAR NUEVA COLUMNA

“indexar” un dataframe

Podemos agregar una nueva


columna a un dataframe dándole
el nombre de la columna nueva
como si fuera el índice en una
lista.

myDataFrame[“myColumna”]= myLista

4
SELECCIONAR COLUMNA

Si la columna ya existe al darle el


nombre del header como índice al
dataframe seleccionaremos toda la
columna

myDataFrame[“myColumna”]

Y podemos seleccionar un dato en


especifico agregando el índice en la
selección anterior

myDataFrame[“myColumna”][0]

5
SELECCIONAR FILAS
Según el índice ( iloc )
Para seleccionar una fila utilizar el
comando iloc y darle el numero de
fila que se requiere

myDataFrame.iloc[0]

Se puede seleccionar un dato en


especifico agregando el índice del dato

myDataFrame.iloc[0][1]

6
SELECCIONAR FILAS
Según el índice ( iloc )
Para seleccionar varias filas al mismo
tiempo, se pueden indicar los índices
entre doble corchetes

myDataFrame.iloc[[0,1,2,3]]

O se puede indicar un rango de filas


(cabe destacar que el limite superior no
es inclusivo)

myDataFrame.iloc[0:3]

7
SELECCIONAR FILAS
Según ‘nombre’ ( loc )
Para seleccionar una fila utilizar el
comando loc y darle el numero de fila
que se requiere

myDataFrame.loc[“fila1”]

Se puede seleccionar un dato en


especifico agregando el índice del dato

myDataFrame.loc[“fila1”,”dato1”]

8
IMPORTANTE

Al realizar una selección sobre un dataframe, no


estamos afectando la variable original, sino que
solo una copia de esta.
Si queremos que las modificaciones afecten nuestro
dataframe original, debemos asignarlo nuevamente
a la variable.

myDataFrame.iloc[[0,1]] No modifica

myDataframe = myDataFrame.iloc[[0,1]] Si modifica

9
MANIPULACION DE DATOS

EJEMPLO
Supongamos que tenemos la
misma lista anterior pero ahora
contiene todos los países del
mundo, además tenemos el PIB
de cada uno
Y queremos calcular el PIB per
cápita de cada pais.

10
MANIPULACION DE DATOS
Tomamos los datos de la columna PIB, los dividimos por los de la columna población y los insertamos
en la nueva columna ”pib per capita”

11
ELIMINAR UNA COLUMNA

DEL
Utilizamos del y le entregamos
el dataframe con el que
estamos trabajando con el
nombre de la columna a
eleminar

del myDataFrame[”miColumna”]

12
ELIMINAR UNA COLUMNA

DEL
Utilizamos del y le entregamos
el dataframe con el que
estamos trabajando con el
nombre de la columna a
eleminar

del myDataFrame[”miColumna”]

13
RESUMIR UNA TABLA

Podemos pedirle a Python que


nos de un pequeño resumen de
los datos que contiene nuestra
tabla con el comando

myDataFrame.describe()

Como podemos ver nos


entrega información util como la
cantidad de datos, el promedio,
la desviación estándar, mínimo
y máximo.
14
EJEMPLOS REALES
Importando ‘Datos Ejemplo.xlsx’ realizaremos los
siguientes ejercicios

1. Filtrar los datos:


• Ley Alimentación >= 0.1 (Analizador Courier fuera)
• Ley Concentrado Rougher >= 0.1
• Ley Cola Rougher L1 >= 0.1
• Ley Cola Rougher L2 >= 0.1

2. Generar Nuevas Columnas:


• Recuperación Metalurgica Rouger L1
• Recuperación Metalurgica Rouger L2
Formula:
𝐿𝑒𝑦 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 ∗ (𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
𝑅𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑡𝑎𝑙𝑢𝑟𝑔𝑖𝑐𝑎 = ∗ 100
𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 ∗ (𝐿𝑒𝑦 𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
15
EJEMPLOS REALES

Importando ‘Datos Ejemplo.xlsx’ realizaremos los


siguientes ejercicios

3. Filtrar nuevamente los datos y dividir DF en


Profit On (1) vs Profit Off (0)

Obtener medias de ambos DF (Recuperacion


Metalurgica Rougher L1 y Recuperacion
Metalurgica Rougher L2)

16
EJEMPLO REAL (1)
Utilizar los siguientes filtros para eliminar los datos que representan mediciones erroneas
• Ley Alimentación >= 0.1 (Analizador Courier fuera)
• Ley Concentrado Rougher >= 0.1
• Ley Cola Rougher L1 >= 0.1
• Ley Cola Rougher L2 >= 0.1

17
EJEMPLO REAL (1.1) SOLUCION:
Importamos los datos

18
EJEMPLO REAL (1.2) SOLUCION:
Filtramos los datos de datos

Al realizar una operación sobre un dataframe, no estamos afectando la variable


original, sino que afectamos una copia de esta.
Si queremos afectar el dataframe original debemos asignar la modificación de
nuevo a este.

19
EJEMPLOS REAL (2)
Generar Nuevas Columnas:
• Recuperación Metalurgica Rouger L1
• Recuperación Metalurgica Rouger L2

Formula:
𝐿𝑒𝑦 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 ∗ (𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
𝑅𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑡𝑎𝑙𝑢𝑟𝑔𝑖𝑐𝑎 = ∗ 100
𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 ∗ (𝐿𝑒𝑦 𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)

Para este ejemplo importar ”Data Ejemplo.xlsx” sin importar las columnas:
• Recuperación Metalurgica Rouger L1
• Recuperación Metalurgica Rouger L2

20
EJEMPLOS REAL (2.1)
SOLUCION:

21
EJEMPLOS REAL (2.2)
SOLUCION:

22
GUIAS
RAPIDAS
PARA
PANDAS
23
GRACIAS
POR TU
ATENCIÓN

También podría gustarte