0% encontró este documento útil (0 votos)

8 vistas

EDA basico con Python

Este documento es una guía de estudio sobre el Análisis Exploratorio de Datos (EDA) básico utilizando Python, que incluye conceptos fundamentales, bibliotecas necesarias, y pasos para la carga, inspección y limpieza de datos. Se abordan técnicas de visualización y análisis univariado y bivariado, así como el manejo de valores faltantes y duplicados. La guía proporciona ejemplos de código para facilitar la comprensión y aplicación de EDA en proyectos de ciencia de datos.

Cargado por

maengora

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

8 vistas

EDA basico con Python

Cargado por

maengora

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 16

Guía de Estudio: Análisis Exploratorio de Datos (EDA) Básico con Python

Licencia: Este documento se rige por la Licencia Pública General de GNU (GNU
General Public License v3.0). Puedes encontrar una copia de la licencia en
https://www.gnu.org/licenses/gpl-3.0.html.

Fecha de Creación: 2025-05-08

1. Introducción al Análisis Exploratorio de Datos (EDA)

¿Qué es EDA?

El Análisis Exploratorio de Datos (EDA, por sus siglas en inglés: Exploratory Data
Analysis) es el proceso de investigar conjuntos de datos para resumir sus principales
características, a menudo con métodos visuales. Es un paso crucial en el ciclo de
vida de la ciencia de datos, ya que permite comprender mejor los datos antes de
aplicar técnicas de modelado más complejas.

¿Por qué es importante el EDA?

• Descubrir patrones: Identificar tendencias, correlaciones y anomalías.

• Detectar errores: Encontrar valores faltantes, atípicos o incorrectos.

• Formular hipótesis: Generar preguntas e ideas basadas en los datos.

• Seleccionar variables: Determinar qué variables son relevantes para un

análisis posterior.

• Preparar los datos: Informar sobre la necesidad de limpieza y transformación

de datos.

• Comunicar hallazgos: Presentar de forma clara las primeras percepciones

sobre los datos.

2. Prerrequisitos y Configuración del Entorno

Bibliotecas de Python Esenciales

Para realizar EDA en Python, utilizaremos principalmente las siguientes bibliotecas:

• Pandas: Para la manipulación y análisis de datos estructurados

(principalmente DataFrames).

• NumPy: Para operaciones numéricas eficientes, especialmente con arrays.

• Matplotlib: Para la creación de gráficos estáticos, animados e interactivos.

• Seaborn: Construida sobre Matplotlib, proporciona una interfaz de alto nivel
para dibujar gráficos estadísticos atractivos e informativos.

Instalación de Bibliotecas

Si no tienes estas bibliotecas instaladas, puedes hacerlo usando pip:

Bash

pip install pandas numpy matplotlib seaborn jupyterlab

(Se recomienda jupyterlab o notebook para un entorno interactivo ideal para EDA).

Importación de Bibliotecas

En tu script de Python o Jupyter Notebook, comienza importando las bibliotecas:

Python

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

# Configuraciones adicionales (opcional pero recomendado)

# Para que los gráficos de Matplotlib se muestren en el notebook

%matplotlib inline

# Estilo de los gráficos de Seaborn

sns.set_theme(style="whitegrid")

# Ignorar advertencias (usar con precaución)

# import warnings

# warnings.filterwarnings('ignore')

3. Carga de Datos

Los datos pueden provenir de diversas fuentes. El formato más común es CSV
(Comma Separated Values).

Python
# Cargar datos desde un archivo CSV

try:

df = pd.read_csv('tu_archivo_de_datos.csv')

print("Datos cargados exitosamente!")

except FileNotFoundError:

print("Error: El archivo 'tu_archivo_de_datos.csv' no fue encontrado.")

print("Por favor, asegúrate de que el archivo está en el directorio correcto o

proporciona la ruta completa.")

# Para fines de demostración, crearemos un DataFrame de ejemplo si el archivo no

se encuentra

print("Creando un DataFrame de ejemplo para continuar con el tutorial...")

data_ejemplo = {

'ID_Estudiante': range(1, 101),

'Edad': np.random.randint(18, 25, size=100),

'Genero': np.random.choice(['Masculino', 'Femenino', 'Otro'], size=100, p=[0.45,

0.45, 0.1]),

'Calificacion_Matematicas': np.random.normal(loc=75, scale=10,

size=100).clip(0, 100),

'Calificacion_Lenguaje': np.random.normal(loc=80, scale=8, size=100).clip(0,

100),

'Horas_Estudio_Semanal': np.random.uniform(5, 20, size=100),

'Asistencia_Porcentaje': np.random.uniform(70, 100, size=100)

df = pd.DataFrame(data_ejemplo)

# Introducir algunos valores nulos para el ejemplo de manejo de nulos

for col in ['Calificacion_Matematicas', 'Horas_Estudio_Semanal']:

idx_nulos = np.random.choice(df.index, size=5, replace=False)

df.loc[idx_nulos, col] = np.nan

df.loc[np.random.choice(df.index, size=3, replace=False), 'Genero'] = np.nan #
Nulos en categórica

print("DataFrame de ejemplo creado.")

Nota: Reemplaza 'tu_archivo_de_datos.csv' con el nombre o la ruta de tu archivo. Si

no tienes un archivo CSV a mano, el código anterior creará un DataFrame de ejemplo
para que puedas seguir el tutorial.

4. Inspección Inicial de los Datos

Una vez cargados los datos, el primer paso es obtener una visión general.

df.head() y df.tail()

Muestra las primeras o últimas filas del DataFrame.

Python

print("Primeras 5 filas del DataFrame:")

print(df.head())

print("\nÚltimas 5 filas del DataFrame:")

print(df.tail())

df.info()

Proporciona un resumen conciso del DataFrame, incluyendo el tipo de datos de cada

columna, el número de valores no nulos y el uso de memoria.

Python

print("\nInformación del DataFrame:")

df.info()

df.describe()

Genera estadísticas descriptivas para las columnas numéricas (como media,

desviación estándar, mínimo, máximo, cuartiles). Para columnas categóricas (si se
incluye include='object' o include='all'), mostrará conteo, valores únicos, el más
frecuente (top) y su frecuencia (freq).
Python

print("\nEstadísticas descriptivas (columnas numéricas):")

print(df.describe())

print("\nEstadísticas descriptivas (columnas categóricas):")

print(df.describe(include=['object'])) # O include='all' para todos los tipos

df.shape

Devuelve una tupla con las dimensiones del DataFrame (número de filas, número de
columnas).

Python

print(f"\nDimensiones del DataFrame (filas, columnas): {df.shape}")

df.dtypes

Muestra el tipo de dato de cada columna.

Python

print("\nTipos de datos de cada columna:")

print(df.dtypes)

5. Manejo de Valores Faltantes (Missing Values)

Los valores faltantes son comunes en los conjuntos de datos y pueden afectar el
análisis.

Identificar Valores Faltantes

Usa .isnull().sum() para contar el número de valores nulos por columna.

Python

print("\nConteo de valores faltantes por columna:")

print(df.isnull().sum())

Estrategias para Manejar Valores Faltantes

1. Eliminación:
o df.dropna(): Elimina filas (por defecto) o columnas (axis=1) que
contienen valores nulos.

o Pros: Simple.

o Contras: Puede perderse información valiosa si se eliminan muchas

filas/columnas.

Python

# df_sin_nulos_filas = df.dropna() # Elimina filas con al menos un nulo

# df_sin_nulos_columnas = df.dropna(axis=1) # Elimina columnas con al menos un

nulo

# print(f"Shape original: {df.shape}, Shape después de dropna (filas):

{df_sin_nulos_filas.shape}")

2. Imputación:

o df.fillna(): Rellena los valores nulos con un valor específico.

▪ Variables numéricas: Usar la media (df['columna'].mean()),

mediana (df['columna'].median()) o un valor constante (ej. 0). La
mediana es generalmente preferible si hay outliers.

▪ Variables categóricas: Usar la moda (df['columna'].mode()[0]) o

una categoría específica (ej. "Desconocido").

Python

# Imputar numéricas con la mediana

if 'Calificacion_Matematicas' in df.columns and

df['Calificacion_Matematicas'].isnull().any():

mediana_cal_mat = df['Calificacion_Matematicas'].median()

df['Calificacion_Matematicas'].fillna(mediana_cal_mat, inplace=True)

print(f"\nValores nulos en 'Calificacion_Matematicas' imputados con la mediana:

{mediana_cal_mat}")

if 'Horas_Estudio_Semanal' in df.columns and

df['Horas_Estudio_Semanal'].isnull().any():
media_horas_estudio = df['Horas_Estudio_Semanal'].mean()

df['Horas_Estudio_Semanal'].fillna(media_horas_estudio, inplace=True)

print(f"Valores nulos en 'Horas_Estudio_Semanal' imputados con la media:

{media_horas_estudio}")

# Imputar categóricas con la moda

if 'Genero' in df.columns and df['Genero'].isnull().any():

moda_genero = df['Genero'].mode()[0]

df['Genero'].fillna(moda_genero, inplace=True)

print(f"Valores nulos en 'Genero' imputados con la moda: {moda_genero}")

print("\nConteo de valores faltantes después de la imputación:")

print(df.isnull().sum())

o inplace=True modifica el DataFrame directamente. Sin él, se devuelve

un nuevo DataFrame.

6. Limpieza Básica de Datos

Identificar y Manejar Duplicados

Python

# Verificar si hay filas duplicadas

duplicados = df.duplicated().sum()

print(f"\nNúmero de filas duplicadas: {duplicados}")

# Eliminar filas duplicadas (conservando la primera aparición)

if duplicados > 0:

df.drop_duplicates(inplace=True)

print(f"Filas duplicadas eliminadas. Nuevo shape: {df.shape}")

Corregir Tipos de Datos

A veces, los datos se cargan con tipos incorrectos (ej. números como texto).

Python

# Ejemplo: Si una columna 'Edad' se cargara como objeto (string)

# df['Edad'] = df['Edad'].astype(int)

# Verificar tipos de datos nuevamente si se hicieron cambios

# print("\nTipos de datos después de posibles correcciones:")

# print(df.dtypes)

7. Análisis Univariado

Análisis de variables individuales para entender su distribución.

Variables Numéricas

• Histogramas: Muestran la frecuencia de los valores en intervalos (bins).

Python

if 'Edad' in df.columns:

plt.figure(figsize=(8, 5))

sns.histplot(df['Edad'], kde=True, bins=10) # kde=True añade una estimación de

densidad del kernel

plt.title('Distribución de Edades')

plt.xlabel('Edad')

plt.ylabel('Frecuencia')

plt.show()

if 'Calificacion_Matematicas' in df.columns:

plt.figure(figsize=(8, 5))

sns.histplot(df['Calificacion_Matematicas'], kde=True, color='skyblue')

plt.title('Distribución de Calificaciones de Matemáticas')

plt.xlabel('Calificación')

plt.ylabel('Frecuencia')

plt.show()

• Box Plots (Diagramas de Caja): Visualizan la mediana, cuartiles, rango

intercuartílico (IQR) y posibles outliers.

Python

if 'Calificacion_Lenguaje' in df.columns:

plt.figure(figsize=(8, 5))

sns.boxplot(x=df['Calificacion_Lenguaje'], color='lightgreen')

plt.title('Box Plot de Calificaciones de Lenguaje')

plt.xlabel('Calificación')

plt.show()

• Density Plots (Gráficos de Densidad): Similar al histograma pero muestra

una estimación continua de la distribución.

Python

if 'Horas_Estudio_Semanal' in df.columns:

plt.figure(figsize=(8, 5))

sns.kdeplot(df['Horas_Estudio_Semanal'], fill=True, color='salmon')

plt.title('Distribución de Horas de Estudio Semanal')

plt.xlabel('Horas de Estudio')

plt.ylabel('Densidad')

plt.show()

Variables Categóricas

• Count Plots / Bar Charts (Gráficos de Barras): Muestran la frecuencia de

cada categoría.

Python

if 'Genero' in df.columns:
plt.figure(figsize=(8, 5))

sns.countplot(data=df, x='Genero', palette='pastel')

plt.title('Distribución por Género')

plt.xlabel('Género')

plt.ylabel('Conteo')

plt.show()

# También se puede obtener el conteo con value_counts()

print("\nConteo de valores para 'Genero':")

print(df['Genero'].value_counts())

• Pie Charts (Gráficos de Pastel): Muestran la proporción de cada categoría.

Útil para pocas categorías.

Python

if 'Genero' in df.columns and df['Genero'].nunique() < 7: # Útil para pocas categorías

plt.figure(figsize=(7, 7))

df['Genero'].value_counts().plot(kind='pie', autopct='%1.1f%%', startangle=90,

colors=sns.color_palette('pastel'))

plt.title('Proporción por Género')

plt.ylabel('') # Ocultar la etiqueta del eje y

plt.show()

8. Análisis Bivariado

Análisis de la relación entre dos variables.

Numérica vs. Numérica

• Scatter Plots (Diagramas de Dispersión): Muestran la relación entre dos

variables numéricas.

Python
if 'Horas_Estudio_Semanal' in df.columns and 'Calificacion_Matematicas' in
df.columns:

plt.figure(figsize=(10, 6))

sns.scatterplot(data=df, x='Horas_Estudio_Semanal', y='Calificacion_Matematicas',

hue='Genero' if 'Genero' in df.columns else None)

plt.title('Horas de Estudio vs. Calificación en Matemáticas')

plt.xlabel('Horas de Estudio Semanal')

plt.ylabel('Calificación en Matemáticas')

plt.legend(title='Género')

plt.show()

• Matriz de Correlación y Heatmap: La correlación mide la relación lineal entre

variables numéricas (rango de -1 a 1). Un heatmap visualiza la matriz de
correlación con colores.

Python

# Seleccionar solo columnas numéricas para la correlación

df_numeric = df.select_dtypes(include=np.number)

if not df_numeric.empty:

correlation_matrix = df_numeric.corr()

print("\nMatriz de Correlación:")

print(correlation_matrix)

plt.figure(figsize=(10, 8))

sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f",

linewidths=.5)

plt.title('Heatmap de Correlación entre Variables Numéricas')

plt.show()

else:
print("\nNo hay suficientes columnas numéricas para calcular la matriz de
correlación.")

Categórica vs. Numérica

• Box Plots (Agrupados): Compara la distribución de una variable numérica a

través de diferentes categorías.

Python

if 'Genero' in df.columns and 'Calificacion_Lenguaje' in df.columns:

plt.figure(figsize=(10, 6))

sns.boxplot(data=df, x='Genero', y='Calificacion_Lenguaje', palette='Set2')

plt.title('Calificación en Lenguaje por Género')

plt.xlabel('Género')

plt.ylabel('Calificación en Lenguaje')

plt.show()

• Violin Plots: Combinan características de box plots y density plots.

Python

if 'Genero' in df.columns and 'Horas_Estudio_Semanal' in df.columns:

plt.figure(figsize=(10, 6))

sns.violinplot(data=df, x='Genero', y='Horas_Estudio_Semanal', palette='husl')

plt.title('Horas de Estudio Semanal por Género')

plt.xlabel('Género')

plt.ylabel('Horas de Estudio Semanal')

plt.show()

• Bar Plots (con agregación): Muestran una medida de tendencia central (ej.
media) de una variable numérica para cada categoría.

Python

if 'Genero' in df.columns and 'Asistencia_Porcentaje' in df.columns:

plt.figure(figsize=(10, 6))

# Por defecto, Seaborn calcula la media. Se puede cambiar con el parámetro

'estimator'

sns.barplot(data=df, x='Genero', y='Asistencia_Porcentaje', palette='viridis',

estimator=np.mean, errorbar='sd')

plt.title('Media de Asistencia (%) por Género (con desviación estándar)')

plt.xlabel('Género')

plt.ylabel('Media de Asistencia (%)')

plt.show()

Categórica vs. Categórica

• Tablas de Contingencia (Cross-tabulation): Muestran la frecuencia conjunta

de dos variables categóricas.

Python

# Suponiendo que tenemos otra variable categórica, ej. 'Nivel_Socioeconomico'

# Para el ejemplo, la crearemos si no existe

if 'Nivel_Socioeconomico' not in df.columns:

df['Nivel_Socioeconomico'] = np.random.choice(['Bajo', 'Medio', 'Alto'],

size=df.shape[0], p=[0.3, 0.5, 0.2])

if 'Genero' in df.columns and 'Nivel_Socioeconomico' in df.columns:

contingency_table = pd.crosstab(df['Genero'], df['Nivel_Socioeconomico'])

print("\nTabla de Contingencia (Género vs. Nivel Socioeconómico):")

print(contingency_table)

# Visualizar con un heatmap

plt.figure(figsize=(8, 6))

sns.heatmap(contingency_table, annot=True, fmt='d', cmap='Blues')

plt.title('Tabla de Contingencia: Género vs. Nivel Socioeconómico')

plt.show()

• Gráficos de Barras Agrupados o Apilados:

Python

if 'Genero' in df.columns and 'Nivel_Socioeconomico' in df.columns:

plt.figure(figsize=(10, 6))

sns.countplot(data=df, x='Genero', hue='Nivel_Socioeconomico', palette='Spectral')

plt.title('Conteo de Género Agrupado por Nivel Socioeconómico')

plt.xlabel('Género')

plt.ylabel('Conteo')

plt.legend(title='Nivel Socioeconómico')

plt.show()

9. (Opcional) Detección Básica de Outliers (Valores Atípicos)

Los outliers son puntos de datos que difieren significativamente de otras

observaciones.

• Usando Box Plots: Los puntos fuera de los "bigotes" del box plot suelen
considerarse outliers. Ya los hemos visto en el análisis univariado.

• Método del Rango Intercuartílico (IQR): Un outlier se define comúnmente

como un valor que está:

o Menor que Q1−1.5×IQR

o Mayor que Q3+1.5×IQR Donde Q1 es el primer cuartil, Q3 es el tercer

cuartil, e IQR=Q3−Q1.

Python

def detectar_outliers_iqr(dataframe, columna):

if columna not in dataframe.columns or not

pd.api.types.is_numeric_dtype(dataframe[columna]):

print(f"La columna '{columna}' no es numérica o no existe.")

return pd.Series(dtype=bool) # Devuelve una Serie vacía o de False

Q1 = dataframe[columna].quantile(0.25)

Q3 = dataframe[columna].quantile(0.75)

IQR = Q3 - Q1

limite_inferior = Q1 - 1.5 * IQR

limite_superior = Q3 + 1.5 * IQR

outliers = (dataframe[columna] < limite_inferior) | (dataframe[columna] >

limite_superior)

return outliers

if 'Calificacion_Matematicas' in df.columns:

outliers_matematicas = detectar_outliers_iqr(df, 'Calificacion_Matematicas')

print(f"\nNúmero de outliers en 'Calificacion_Matematicas' según IQR:

{outliers_matematicas.sum()}")

if outliers_matematicas.sum() > 0:

print("Outliers detectados:")

print(df[outliers_matematicas][['ID_Estudiante', 'Calificacion_Matematicas']])

# Qué hacer con los outliers depende del contexto:

# 1. Investigarlos: ¿Son errores de entrada o valores genuinos extremos?

# 2. Caparlos (winsorizing): Limitar los valores al límite inferior/superior.

# 3. Transformarlos (ej. logaritmo).

# 4. Eliminarlos (con precaución).

# 5. Considerar modelos robustos a outliers.

10. Conclusión y Próximos Pasos

El EDA es un proceso iterativo. A medida que exploras, puedes descubrir nuevas

preguntas o la necesidad de una limpieza de datos más profunda.
Resumen de los Pasos Clave del EDA:

1. Entender las variables: Tipos de datos, significados.

2. Limpieza de datos: Manejar nulos, duplicados, errores.

3. Análisis univariado: Distribución de cada variable.

4. Análisis bivariado (y multivariado): Relaciones entre variables.

5. Identificar patrones y anomalías.

6. Formular hipótesis y guiar los siguientes pasos.

Próximos Pasos Después del EDA:

• Ingeniería de Características (Feature Engineering): Crear nuevas variables

a partir de las existentes.

• Preprocesamiento de Datos: Escalar, codificar variables categóricas para

modelos de Machine Learning.

• Modelado Predictivo: Construir y evaluar modelos de Machine Learning.

• Comunicación de Resultados: Crear informes o dashboards más elaborados.

¡Este tutorial cubre los fundamentos! La práctica constante con diferentes conjuntos
de datos te ayudará a dominar el arte del EDA.

También podría gustarte

Unidad 2 Manipulación de Datos Con Pandas
Aún no hay calificaciones
Unidad 2 Manipulación de Datos Con Pandas
34 páginas
Pandas
100% (5)
Pandas
172 páginas
Analyzing Data With Python 2
Aún no hay calificaciones
Analyzing Data With Python 2
64 páginas
A41 Guía Evidencia 3.1
Aún no hay calificaciones
A41 Guía Evidencia 3.1
3 páginas
EV - 2 - Reporte Labs
Aún no hay calificaciones
EV - 2 - Reporte Labs
16 páginas
Guía Completa de Análisis de Datos Con Python (1)
Aún no hay calificaciones
Guía Completa de Análisis de Datos Con Python (1)
16 páginas
Comenzando con Pandas y Numpy
Aún no hay calificaciones
Comenzando con Pandas y Numpy
11 páginas
Gestión Analítica de Datos Chapter 2
Aún no hay calificaciones
Gestión Analítica de Datos Chapter 2
50 páginas
Instrucciones MiniProyecto Con Notas
Aún no hay calificaciones
Instrucciones MiniProyecto Con Notas
3 páginas
Tarea 5 – Proyecto Análisis de Datos
Aún no hay calificaciones
Tarea 5 – Proyecto Análisis de Datos
34 páginas
Recopilar y Analizar Datos Relevantes Utilizando Python
Aún no hay calificaciones
Recopilar y Analizar Datos Relevantes Utilizando Python
5 páginas
El Análisis Exploratorio de Datos (AED)
Aún no hay calificaciones
El Análisis Exploratorio de Datos (AED)
31 páginas
LEARNING
Aún no hay calificaciones
LEARNING
78 páginas
Sesion 20221126
Aún no hay calificaciones
Sesion 20221126
20 páginas
Análisis y visualización de datos usando Python_ Comenzando con datos
Aún no hay calificaciones
Análisis y visualización de datos usando Python_ Comenzando con datos
15 páginas
Reporte Covid e Imputacion
Aún no hay calificaciones
Reporte Covid e Imputacion
19 páginas
TALLER
Aún no hay calificaciones
TALLER
11 páginas
Módulo 2. Manipulación de Datos Con Python
Aún no hay calificaciones
Módulo 2. Manipulación de Datos Con Python
25 páginas
Inteligencia Artificial y Ciencia de Datos - Data - Base
Aún no hay calificaciones
Inteligencia Artificial y Ciencia de Datos - Data - Base
21 páginas
Practica 2 UNIDAD 2 DRLE
Aún no hay calificaciones
Practica 2 UNIDAD 2 DRLE
7 páginas
Introducción A Python 5
Aún no hay calificaciones
Introducción A Python 5
15 páginas
oLCxSk - YI15eHLrL - FUTwV760YdWYCuHo-Guia de Comandos para El Procesamiento de Datos en Python
Aún no hay calificaciones
oLCxSk - YI15eHLrL - FUTwV760YdWYCuHo-Guia de Comandos para El Procesamiento de Datos en Python
8 páginas
Guión - Video de Python
Aún no hay calificaciones
Guión - Video de Python
6 páginas
Practica - 06 - Pandas - Intro
Aún no hay calificaciones
Practica - 06 - Pandas - Intro
2 páginas
Informe Fundamentos de La Manipulación de Datos en Python Con NumPy y Pandas
Aún no hay calificaciones
Informe Fundamentos de La Manipulación de Datos en Python Con NumPy y Pandas
7 páginas
Guía de Examen Final
Aún no hay calificaciones
Guía de Examen Final
39 páginas
una cosa ahi
Aún no hay calificaciones
una cosa ahi
3 páginas
Estadistica
Aún no hay calificaciones
Estadistica
47 páginas
05 Analisis de Datos Con Pandas
Aún no hay calificaciones
05 Analisis de Datos Con Pandas
32 páginas
(Sesion03) Introduccion Python
Aún no hay calificaciones
(Sesion03) Introduccion Python
47 páginas
Automatización de Procesos de Análisis de Datos en Python
Aún no hay calificaciones
Automatización de Procesos de Análisis de Datos en Python
16 páginas
PRESENTACION EJERCICIO ESTUDIANTES CHICHIPATOS PASO A PASO LIMPIEZA DE DATOS PANDAS
Aún no hay calificaciones
PRESENTACION EJERCICIO ESTUDIANTES CHICHIPATOS PASO A PASO LIMPIEZA DE DATOS PANDAS
70 páginas
Unidad 2 Py
Aún no hay calificaciones
Unidad 2 Py
10 páginas
Clase 6 - Introducción A La Manipulación de Datos Con Pandas (Parte II)
Aún no hay calificaciones
Clase 6 - Introducción A La Manipulación de Datos Con Pandas (Parte II)
73 páginas
Módulo 2. Manipulación de Datos Con Python
Aún no hay calificaciones
Módulo 2. Manipulación de Datos Con Python
23 páginas
VC C3 DPDS
Aún no hay calificaciones
VC C3 DPDS
23 páginas
Ev2 Eq4 Reporte Tecnico Sobre Analisis de Datos Con Pandas
Aún no hay calificaciones
Ev2 Eq4 Reporte Tecnico Sobre Analisis de Datos Con Pandas
20 páginas
CODIGOS
Aún no hay calificaciones
CODIGOS
7 páginas
Anaconda - Analisis de Datos
Aún no hay calificaciones
Anaconda - Analisis de Datos
5 páginas
Exploratory Data Analysis en Python
Aún no hay calificaciones
Exploratory Data Analysis en Python
21 páginas
rgncWI4IUtCSOqAp - CC - 2S7UvchCP9-6U-Guia de Los Comandos Mas Utilizados en Phyton
Aún no hay calificaciones
rgncWI4IUtCSOqAp - CC - 2S7UvchCP9-6U-Guia de Los Comandos Mas Utilizados en Phyton
11 páginas
M4
Aún no hay calificaciones
M4
43 páginas
Limpieza de Datos
Aún no hay calificaciones
Limpieza de Datos
39 páginas
Clase_Python 6 (24_II)
Aún no hay calificaciones
Clase_Python 6 (24_II)
29 páginas
Actividad - 1 - Diplomado Data Science PDF
Aún no hay calificaciones
Actividad - 1 - Diplomado Data Science PDF
2 páginas
Notas de Clase
Aún no hay calificaciones
Notas de Clase
32 páginas
Exploración y Análisis de Datos Con Python
Aún no hay calificaciones
Exploración y Análisis de Datos Con Python
9 páginas
Sesion 06 - Power BI Con Python (Python)
Aún no hay calificaciones
Sesion 06 - Power BI Con Python (Python)
23 páginas
Reporte Analisis y Ejercicios - Robertoemiliomejiaflores
Aún no hay calificaciones
Reporte Analisis y Ejercicios - Robertoemiliomejiaflores
19 páginas
Blog
Aún no hay calificaciones
Blog
13 páginas
Act2.2andat Blanca Garcia
Aún no hay calificaciones
Act2.2andat Blanca Garcia
9 páginas
Clase 3 Numpy Pandas
Aún no hay calificaciones
Clase 3 Numpy Pandas
16 páginas
Unidad 8 Pensamiento Computacional
Aún no hay calificaciones
Unidad 8 Pensamiento Computacional
14 páginas
Tema7 (1)
Aún no hay calificaciones
Tema7 (1)
32 páginas
Caso Propuesto
Aún no hay calificaciones
Caso Propuesto
11 páginas
Ev 1 Adat
Aún no hay calificaciones
Ev 1 Adat
5 páginas
06- Diplomatura en IA - Análisis exploratorio, curación y visualización de datos II
Aún no hay calificaciones
06- Diplomatura en IA - Análisis exploratorio, curación y visualización de datos II
59 páginas
Prog_Orien_M_Datos Modulo 8
Aún no hay calificaciones
Prog_Orien_M_Datos Modulo 8
41 páginas
Machine Learning y Deep Learning
De Everand
Machine Learning y Deep Learning
Jesús Bobadilla
Aún no hay calificaciones
Aprende a Programar en MATLAB
De Everand
Aprende a Programar en MATLAB
Roberto Acuña Silva
3.5/5 (11)
Documentacion Cruce Saber11 - Saber Pro - SaberTyT
Aún no hay calificaciones
Documentacion Cruce Saber11 - Saber Pro - SaberTyT
2 páginas
MIO - Examen Parcial - Semana 4 - INV - SEGUNDO BLOQUE-TELECOMUNICACIONES - (GRUPO1) PDF
Aún no hay calificaciones
MIO - Examen Parcial - Semana 4 - INV - SEGUNDO BLOQUE-TELECOMUNICACIONES - (GRUPO1) PDF
11 páginas
Agenda Gato 2023
Aún no hay calificaciones
Agenda Gato 2023
137 páginas
Propuesta para Monitoria
Aún no hay calificaciones
Propuesta para Monitoria
6 páginas
1SNK161001C0704 PDF
Aún no hay calificaciones
1SNK161001C0704 PDF
100 páginas
Atajos de Teclado en Gimp
Aún no hay calificaciones
Atajos de Teclado en Gimp
7 páginas
Manual de Uso Del Escenario en La Ma Open Sim
Aún no hay calificaciones
Manual de Uso Del Escenario en La Ma Open Sim
17 páginas
Box Vehicular
Aún no hay calificaciones
Box Vehicular
9 páginas
Organizadores Gráficos
Aún no hay calificaciones
Organizadores Gráficos
3 páginas
Salazar Esteban - Informe - P1 - Enclavamiento
Aún no hay calificaciones
Salazar Esteban - Informe - P1 - Enclavamiento
9 páginas
Catastro Rural
Aún no hay calificaciones
Catastro Rural
61 páginas
Analisis de Sistemas de Facturacion en La Empresa
100% (1)
Analisis de Sistemas de Facturacion en La Empresa
22 páginas
Guia de Aprendizaje 3
Aún no hay calificaciones
Guia de Aprendizaje 3
11 páginas
P# Protoboard 2022
Aún no hay calificaciones
P# Protoboard 2022
15 páginas
Guia 1 Matemáticas 9
Aún no hay calificaciones
Guia 1 Matemáticas 9
6 páginas
Celulares ¿Como Influyen Sociedad Estudiantes
Aún no hay calificaciones
Celulares ¿Como Influyen Sociedad Estudiantes
11 páginas
Levantamiento Topografico
Aún no hay calificaciones
Levantamiento Topografico
12 páginas
6.3.3.6 Packet Tracer - Configuring Router-on-a-Stick Inter-VLAN
Aún no hay calificaciones
6.3.3.6 Packet Tracer - Configuring Router-on-a-Stick Inter-VLAN
3 páginas
Análisis Telefónico MP
Aún no hay calificaciones
Análisis Telefónico MP
29 páginas
Asterics Grid 1 Saac
Aún no hay calificaciones
Asterics Grid 1 Saac
19 páginas
Google Maps
Aún no hay calificaciones
Google Maps
4 páginas
Practica - Diodos en CA
Aún no hay calificaciones
Practica - Diodos en CA
4 páginas
Proyecto de Gestion de Servidores
Aún no hay calificaciones
Proyecto de Gestion de Servidores
73 páginas
Silabus Maquinas Electricas
Aún no hay calificaciones
Silabus Maquinas Electricas
8 páginas
Referencias On Off
Aún no hay calificaciones
Referencias On Off
5 páginas
(Esp) Manual Del Alumno
Aún no hay calificaciones
(Esp) Manual Del Alumno
18 páginas
Esclerometro Digital
Aún no hay calificaciones
Esclerometro Digital
2 páginas
PLANIFICACION
Aún no hay calificaciones
PLANIFICACION
11 páginas
Guia Didactica Auditoria Administrativa
100% (1)
Guia Didactica Auditoria Administrativa
54 páginas
Guia 1 - Unidad 2
Aún no hay calificaciones
Guia 1 - Unidad 2
4 páginas