0% encontró este documento útil (0 votos)
85 vistas46 páginas

Seaborn

Este documento describe las funciones de visualización de datos de Seaborn. Seaborn permite explorar y entender los datos a través de funciones de plot que operan en dataframes y arrays. Ofrece funciones a nivel de ejes y figura para graficar relaciones estadísticas entre variables. Incluye opciones para visualizar distribuciones de datos, análisis bivariado, datos categóricos y estimadores de tendencia central.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
85 vistas46 páginas

Seaborn

Este documento describe las funciones de visualización de datos de Seaborn. Seaborn permite explorar y entender los datos a través de funciones de plot que operan en dataframes y arrays. Ofrece funciones a nivel de ejes y figura para graficar relaciones estadísticas entre variables. Incluye opciones para visualizar distribuciones de datos, análisis bivariado, datos categóricos y estimadores de tendencia central.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 46

Seaborn:

Visualización de
datos estadísticos
PH.D. SANTIAGO
E C H E V E R R I A RT E A G A
“Seaborn helps you explore and understand your
data. Its plotting functions operate on dataframes
and arrays containing whole datasets and internally
perform the necessary semantic mapping and
statistical aggregation to produce informative plots.
Its dataset-oriented, declarative API lets you focus on
what the different elements of your plots mean,
rather than on the details of how to draw them.”
Figuras a
nivel de Axes
y de figura

Las funciones a nivel de axes Opciones de configuración por columna


tienen un **kwarg ax=
Importar dataset de ejemplo
import seaborn as sns

sns.set_theme()

tips = sns.load_dataset("tips")

Y a graficar!

sns.relplot(data=tips, x="total_bill", y="tip", col="time", hue="smoker", style="smoker",


size="size",)
Tamaño de figura en Figure level
Cuando se utiliza una función de nivel de figura, existen varias diferencias clave. Primero, las propias
funciones tienen parámetros para controlar el tamaño de la figura. Estos parámetros, height y aspect,
parametrizan el tamaño de forma ligeramente diferente a la parametrización de ancho y alto en
matplotlib (utilizando los parámetros marinos, width = height * aspecto)
Tipos de datos en seaborn
Formato alargado
Tipos de datos en seaborn
Formato ancho
Tipos de datos en seaborn

Datos agrupados
Opciones de estilo fortalecidas
color, fillcolor, edgecolor reciben además de los formatos de matplotlib otros más (https://seaborn.pydata.org/tutorial/properties.html)

Paletas de color: https://seaborn.pydata.org/tutorial/color_palettes.html

alpha, fillalpha, edgealpha: En algunos casos se puede manejar la transparencia del borde y relleno separadamente

fill: True/False

markers:

ls: pointsize

sns.set_theme(style=“OPC") con OPC: darkgrid, whitegrid,


dark, white, ticks
Visualizando Todas las graficas pueden personalizarse con hue, size, and
style asignados a columnas.
relaciones Axes Level: scatterplot() y lineplot() Figure Level: replot()
estadísticas con kind=‘line’ o ‘scatter’
Visualizando
relaciones
estadísticas
Visualizando
relaciones
estadísticas
Visualizando
relaciones
estadísticas
Lineplots
Si hay varias medidas para cada dato de x, grafica la media y
calcula por Boostraping el interval de confianza al 95% pero se
puede deshabilitar o graficar en términos de la desviación
estándar.

Se pueden poner también como opción markers=Bool y


dashes=Bool
Lineplots
Lineplots
Lineplots
SE PUEDE ANALIZAR UNA O
MÁS PROPIEDADES EN UNA
GRÁFICA TIPO CUADRÍCULA
Lineplots
SE PUEDE ANALIZAR UNA O
MÁS PROPIEDADES EN UNA
GRÁFICA TIPO CUADRÍCULA
Distribuciones de datos
A nivel de Axes: histplot(), kdeplot(), ecdfplot(), and rugplot()

A nivel de figura: displot(), jointplot(), and pairplot()

A nivel de figura se pueden configurar por columnas


distplot vs histplot
displot()/histplot() elige un tamaño de bin
predeterminado en función de la varianza de
los datos y el número de observaciones. Pero
no debe confiar demasiado en estos enfoques
automáticos, ya que dependen de suposiciones
particulares sobre la estructura de sus datos.
VA L O R E S Ú N I C O S C A M B I A N D O TA M A Ñ O D E B I N S CAMBIANDO NÚMERO DE BINS

distplot vs histplot
Condicionando
otras variables
Histogramas
normalizados
Histogramas
normalizados
Por defecto normaliza a
que la suma de áreas sea
1, pero se puede
normalizar a que las
alturas sea 1 (Datos
discretos)
Histogramas
normalizados
Por defecto normaliza a
que la suma de áreas sea
1, pero se puede
normalizar a que las
alturas sea 1 (Datos
discretos)
Estimador de
densidad Kernel
Ajustar al ancho de banda
Histograma
junto con
densidad kernel
Cambiando kind=‘kde’ por
kde=True permite graficar al
mismo tiempo un histograma
con la densidad
Función de distribución acumulada
Análisis bivariado
Análisis bivariado
Análisis
bivariado
Análisis
bivariado
Análisis bivariado
DISTRIBUCIONES
MARGINALS CON RUG

k i n d = ‘ h e x ’ PA R A HACERLO A MANO
HEXBINPLOT

Graficando las distribuciones marginales


¿Multivariado como NxN univariado?
Visualización de datos categóricos
Graficos de stripplot() (kind="strip“ ; opción por defecto)
puntos swarmplot() (kind="swarm")

boxplot() (kind="box")
Distribuciones violinplot() (kind="violin")
boxenplot() (kind="boxen")

pointplot() (kind="point")
Estimadores barplot() (kind="bar")
countplot() (kind="count")
Graficos de puntos Se puede poner un argumento opcional
order=[‘A’, ‘B’] para ordenar las categorías

STRIPPLOT()
Graficos de puntos:
swarmplot() Se puede poner un argumento opcional
order=[‘A’, ‘B’] para ordenar las categorías

El eje categórico puede ser el Y


Distribuciones
BOXENPLOT()
BOXPLOT() VIOLINPLOT()

Grafica combinada

En caso de que las categorías no


Dividir los violines cuando la
compartan valores
otra categoría es binaria
Estimadores de tendencia central
Gráficos de barras sin clacular la
BARPLOT() COUNTPLOT()estadística para otra variable
Opera en un conjunto de datos completo y aplica una función para obtener la estimación (la media
por defecto). Utiliza boostrap para calcular un intervalo de confianza alrededor de la estimación, que
se representa mediante barras de error
Estimadores de tendencia central
Como barplot pero sin graficar la barra sino que un
Gráficos de barras sin clacular la
solo punto (En la altura de la barra). Esta función
POINTPLOT() COUNTPLOT()estadística para otra variable
además conecta los puntos
Barras de error
Barras de error Barras de error personalizadas errorbar=lambda
x: (x.min(), x.max()))

errorbar=(“pi”,50) daría el IQR

Usa boostraping con


unintervalo de
confianza del 95%

Tienen **kwarg n_boot para el número de


iteraciones y seed para la semilla
Heatmap
¿Cómo visualizo una matriz de
correlación?
Orientada a axes

También podría gustarte