PYTHON FOR ENGINEERS (2)
MANIPULACIÓN DE DATOS
February 7, 2023
CREAR DATOS
Dataframe
La forma mas simple Para crear un
dataframe es crear un diccionario y
luego usar el comando
pd.DataFrame(“miDiccionario”)
Para asignar el diccionario a un
dataframe.
3
AGREGAR NUEVA COLUMNA
“indexar” un dataframe
Podemos agregar una nueva
columna a un dataframe dándole
el nombre de la columna nueva
como si fuera el índice en una
lista.
myDataFrame[“myColumna”]= myLista
4
SELECCIONAR COLUMNA
Si la columna ya existe al darle el
nombre del header como índice al
dataframe seleccionaremos toda la
columna
myDataFrame[“myColumna”]
Y podemos seleccionar un dato en
especifico agregando el índice en la
selección anterior
myDataFrame[“myColumna”][0]
5
SELECCIONAR FILAS
Según el índice ( iloc )
Para seleccionar una fila utilizar el
comando iloc y darle el numero de
fila que se requiere
myDataFrame.iloc[0]
Se puede seleccionar un dato en
especifico agregando el índice del dato
myDataFrame.iloc[0][1]
6
SELECCIONAR FILAS
Según el índice ( iloc )
Para seleccionar varias filas al mismo
tiempo, se pueden indicar los índices
entre doble corchetes
myDataFrame.iloc[[0,1,2,3]]
O se puede indicar un rango de filas
(cabe destacar que el limite superior no
es inclusivo)
myDataFrame.iloc[0:3]
7
SELECCIONAR FILAS
Según ‘nombre’ ( loc )
Para seleccionar una fila utilizar el
comando loc y darle el numero de fila
que se requiere
myDataFrame.loc[“fila1”]
Se puede seleccionar un dato en
especifico agregando el índice del dato
myDataFrame.loc[“fila1”,”dato1”]
8
IMPORTANTE
Al realizar una selección sobre un dataframe, no
estamos afectando la variable original, sino que
solo una copia de esta.
Si queremos que las modificaciones afecten nuestro
dataframe original, debemos asignarlo nuevamente
a la variable.
myDataFrame.iloc[[0,1]] No modifica
myDataframe = myDataFrame.iloc[[0,1]] Si modifica
9
MANIPULACION DE DATOS
EJEMPLO
Supongamos que tenemos la
misma lista anterior pero ahora
contiene todos los países del
mundo, además tenemos el PIB
de cada uno
Y queremos calcular el PIB per
cápita de cada pais.
10
MANIPULACION DE DATOS
Tomamos los datos de la columna PIB, los dividimos por los de la columna población y los insertamos
en la nueva columna ”pib per capita”
11
ELIMINAR UNA COLUMNA
DEL
Utilizamos del y le entregamos
el dataframe con el que
estamos trabajando con el
nombre de la columna a
eleminar
del myDataFrame[”miColumna”]
12
ELIMINAR UNA COLUMNA
DEL
Utilizamos del y le entregamos
el dataframe con el que
estamos trabajando con el
nombre de la columna a
eleminar
del myDataFrame[”miColumna”]
13
RESUMIR UNA TABLA
Podemos pedirle a Python que
nos de un pequeño resumen de
los datos que contiene nuestra
tabla con el comando
myDataFrame.describe()
Como podemos ver nos
entrega información util como la
cantidad de datos, el promedio,
la desviación estándar, mínimo
y máximo.
14
EJEMPLOS REALES
Importando ‘Datos Ejemplo.xlsx’ realizaremos los
siguientes ejercicios
1. Filtrar los datos:
• Ley Alimentación >= 0.1 (Analizador Courier fuera)
• Ley Concentrado Rougher >= 0.1
• Ley Cola Rougher L1 >= 0.1
• Ley Cola Rougher L2 >= 0.1
2. Generar Nuevas Columnas:
• Recuperación Metalurgica Rouger L1
• Recuperación Metalurgica Rouger L2
Formula:
𝐿𝑒𝑦 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 ∗ (𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
𝑅𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑡𝑎𝑙𝑢𝑟𝑔𝑖𝑐𝑎 = ∗ 100
𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 ∗ (𝐿𝑒𝑦 𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
15
EJEMPLOS REALES
Importando ‘Datos Ejemplo.xlsx’ realizaremos los
siguientes ejercicios
3. Filtrar nuevamente los datos y dividir DF en
Profit On (1) vs Profit Off (0)
Obtener medias de ambos DF (Recuperacion
Metalurgica Rougher L1 y Recuperacion
Metalurgica Rougher L2)
16
EJEMPLO REAL (1)
Utilizar los siguientes filtros para eliminar los datos que representan mediciones erroneas
• Ley Alimentación >= 0.1 (Analizador Courier fuera)
• Ley Concentrado Rougher >= 0.1
• Ley Cola Rougher L1 >= 0.1
• Ley Cola Rougher L2 >= 0.1
17
EJEMPLO REAL (1.1) SOLUCION:
Importamos los datos
18
EJEMPLO REAL (1.2) SOLUCION:
Filtramos los datos de datos
Al realizar una operación sobre un dataframe, no estamos afectando la variable
original, sino que afectamos una copia de esta.
Si queremos afectar el dataframe original debemos asignar la modificación de
nuevo a este.
19
EJEMPLOS REAL (2)
Generar Nuevas Columnas:
• Recuperación Metalurgica Rouger L1
• Recuperación Metalurgica Rouger L2
Formula:
𝐿𝑒𝑦 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 ∗ (𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
𝑅𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑡𝑎𝑙𝑢𝑟𝑔𝑖𝑐𝑎 = ∗ 100
𝐿𝑒𝑦 𝐴𝑙𝑖𝑚𝑒𝑛𝑡𝑎𝑐𝑖𝑜𝑛 ∗ (𝐿𝑒𝑦 𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜 − 𝐿𝑒𝑦 𝐶𝑜𝑙𝑎)
Para este ejemplo importar ”Data Ejemplo.xlsx” sin importar las columnas:
• Recuperación Metalurgica Rouger L1
• Recuperación Metalurgica Rouger L2
20
EJEMPLOS REAL (2.1)
SOLUCION:
21
EJEMPLOS REAL (2.2)
SOLUCION:
22
GUIAS
RAPIDAS
PARA
PANDAS
23
GRACIAS
POR TU
ATENCIÓN