Manual Pandas
Manual Pandas
Series DataFrame
Es un objeto unidimensional de Se corresponde con una tabla de 2
estilo array, que contiene una dimensiones. Tiene un índice de fila y
secuencia de valores del mismo tipo otro de columna; se podría considerar
y un array asociado de etiquetas de como un diccionario de objetos Series
datos, correspondiente a su índice. que comparten todos el mismo índice.
Series A
index
DataFrame
index
data
Series B
index data
data
Creación de Series
import pandas as pd
Con un escalar
Acceso a los elementos de una
Serie
12 4 2 12
Por atributo Por posición
s[['num1','num2']] s[[2,3]]
Creación de un DataFrame
import pandas as pd
Las columnas e
índices deben
especificarse por
separado.
Acceso a los elementos de un
DataFrame
DF
df[df["edad"]>40]
Acceso a los elementos de un
DataFrame
DF
df.loc[["Juan","Lucia"]]
Reindexación en un DataFrame
Reindexación de un DF
B
Métodos de ordenamiento en
Series y DataFrame
obj.sort_index() obj.sort_values()
df.sort_index()
DF df.sort_index(axis="columns")
ordena alfabéticamente
Eliminación de ejes en un
DataFrame
Eliminación de un eje de un DF
Cargar, copiar y guardar un
DataFrame
Cargar un
DataFrame
Copiar un
DataFrame
Guardar el DataFrame
como CSV y JSON
Métodos de información
general
df_ventas.info() df_ventas.columns
df_ventas.index df_ventas.shape
RangeIndex(start=0, stop=7, step=1) (7, 7)
DF
DF
DF
# Añadir una nueva columna al DataFrame # Añadir una nueva columna calculada al DataFrame
DF
df_empleados.isna()
El método isna nos proporciona
una serie booleana con True,
donde los valores son nulos.
Gestión de datos faltantes en
un DataFrame
df_empleados.dropna()
s.dropna() s[s.notna()]
Gestión de datos faltantes en
un DataFrame
valor indicado
df.fillna(0)
Valor de
reemplazo
Método Rename
Replace mediante
listas o diccionarios
NOTA