RPubs - Boxplots Con Ggplot2
RPubs - Boxplots Con Ggplot2
Boxplots
Cristian Ramos Lorenzo
16/5/2019
R Markdown
This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word
documents. For more details on using R Markdown see http://rmarkdown.rstudio.com (http://rmarkdown.rstudio.com).
When you click the Knit button a document will be generated that includes both content as well as the output of any
embedded R code chunks within the document. You can embed an R code chunk like this:
library(ggplot2)
## method from
## [.quosures rlang
## c.quosures rlang
## print.quosures rlang
En esta sección vamos a seguir trabajando con el paquete ggplot2, en este caso para usar los diagramas de cajas.
Cargamos el dataset mtcars y lo guardamos como df.
df <- mtcars
head(df)
El diagrama de cajas se usa en variables numéricas ya que nos proporcionará tanto la mediana como los cuartiles y
los outliers. Vamos a inspeccionar el dataset.
str(df)
https://rpubs.com/MrCristianrl/496859 1/5
8/7/2021 Boxplots
## $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
## $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
## $ vs : num 0 0 1 1 0 1 0 1 1 1 ...
## $ am : num 1 1 1 0 0 0 0 0 0 0 ...
Todas las variables son numéricas, aunque algunas de ellas realmente tienen un número limitado de valores (como es
el caso de la variable cyl, que solo tiene el 4,6 y 8). La sintaxis básica para una representación de un diagrama de
cajas es la siguiente:
pl + geom_boxplot()
https://rpubs.com/MrCristianrl/496859 2/5
8/7/2021 Boxplots
Otra característica importante es que podemos calcular la distribución de una variable respecto a otra categórica. Si,
por ejemplo, quisiéramos ver cómo se distribuye la variable mpg en función de cyl, simplemente modificaríamos la
sintaxis básica de la siguiente manera:
pl + geom_boxplot()
Al igual que los otros tipos de gráficos, se puede modificar tanto su tamaño, color, relleno y otros parámetros que se
encuentran en la documentación. Rellenaremos el gráfico en función de otra columna.
pl + geom_boxplot(aes(fill=factor(cyl))) + theme_bw()
https://rpubs.com/MrCristianrl/496859 3/5
8/7/2021 Boxplots
Para cambiar de dirección el gráfico cuando prefiramos poner los diagramas de cajas en horizontal añadimos el
siguiente comando:
pl + geom_boxplot() + coord_flip()
https://rpubs.com/MrCristianrl/496859 4/5
8/7/2021 Boxplots
https://rpubs.com/MrCristianrl/496859 5/5