Práctica 1 - Introducción a R y RStudio
Ingenieria en Sistemas Ambientales/Estadística Aplicada
J. Rosas - 2017
Introducción
R es un potente lenguaje de programación orientado a objetos destinado al análisis estadístico y la repre-
sentación de datos. Se trata de software libre de última generación basado en el lenguaje estadístico S. La
comunidad científica internacional lo ha elegido como la lingua franca del análisis de datos. Tiene una gran
aceptación en universidades y cada vez toma más importancia en el quehacer empresarial.
1 ¿Cómo instalar R?
Instalar R es sumamente simple, solo hay que dirigirse a la página http://www.r-project.org/ donde se le
da click a la opción download R, luego se escoge un CRAN mirror, por ejemplo USA https://cran.cnr.
berkeley.edu/ de donde se descarga la aplicación para el sistema operativo correspondiente. En este caso
elegiremos la opción Download R for Windows y luego install R for the first time. Una vez realizada
la descarga se da doble click sobre el archivo ejecutable y veremos la ventana de selección de idioma de
instalación y el asistente de instalación:
Figura 1: Ventana de instalación de R.
Es importante conocer las características de su computadora (32/64 bit) para la correcta instalación de R.
2 RStuio
RStudio es una GUI (Graphical user interface) que permite acceder de manera sencilla a toda la potencia
de R. Programado en C#, RStudio, es multiplataforma (Windows, Linux y Mac) y requiere tener instalado
R para poder ser ejecudato. Al igual que R, RStudio es software libre de código abierto que puede ejecutar
en el escritorio de (Windows, Mac o Linux) o incluso a través de Internet mediante el servidor RStudio.
Para instalar RStudio se ingresar a la página https://www.rstudio.com/ y se descarga el RStudio Desktop.
Una vez instalado se ejecuta la aplicación (Figura 2).
1
Figura 2: Interfaz de RStuio.
La interfaz RStudio presenta cuatro paneles: el Editor, la Consola, el Enviroment-History y el que
incluye File-Plots-Packages-Help-Viewer (Figura 2). En la Consola se introducen los comandos y será
dónde se vean los resultados de los análisis. El Editor permite crear códigos en distintos formatos. En el
enviroment se muestran los datos y el historial de los comandos empleados en la Consola. Finalmente el
último panel nos permite visualizar archivos, gráficas, paquetes, ver la de los paquetes insalados y visualizar
las salidas de Rmarkdown en formato HTML.
2.1 ¿Por qué utilizar RStudio?
• Respeta la filosofía tradicional de la consola de R.
• Muestra los objetos del workspace.
• Muestra el historial de comandos.
• Tiene un visor de gráficos que unifica entornos.
• Integra un visor de paquetes instalados y/o cargados (library).
• Permite ejecutar trozos de código con sólo marcarlo en los scripts.
• Dispone de autocompletado de código.
• Presentaciones en HTML5.
• Presentaciones con Knit y Sweave.
• Facilidad para trabajar con varios proyectos a la vez.
Mediante el comando citation () podemos saber cómo citar R o paquetes de R en publicaciones y, así dar
el crédito a la enorme cantidad de personas que desarrollan este proyecto.
Al escribir en la Consola:
citation ()
R Core Team (2016). R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria.
URL https://www.R-project.org/.
2
Primero pasos con RStudio
En la consola aparece el símbolo mayor qué > en el margen izquierdo. A partir de ese momento R esta listo
para recibir instrucciones.
Para ejecutar un comando, basta con introducirlo y presionar la tecla ENTER, R devolverá el resultado; el
símbolo de numeral # se utiliza para agregar un comentario y de esta manera R no trate de ejecutarlo.
Las órdenes elementales en R consisten en expresiones o en asignaciones. Una orden consiste en una expresión,
que se evalúa, se imprime y su valor se pierde; en cambio una asignación evalúa una expresión, no la imprime
y guarda su valor en una variable que es almacenana en el Enviroment.
Una asignación se realiza con el signo de igualdad (=) o bien con el símbolo de asignación (<–).
En cada línea de códio sólo caben 128 caracteres, si se desea escribir más, una opción es utilizar otra línea
que comienza con el símbolo + en el lado izquierdo de la pantalla en vez de >.
Con la tecla flecha arriba se recupera las instrucciones utilizadas anteriormente y con las teclas izquierda y
derecha se pueden corregir errores. Para separar expresiones se emplea el punto y coma, la combinación Ctrl
+ ˆ interrumpe la edición o ejecución en curso y q() es el comando para salir de R.
Veamos expresiones que habitualmente se usan una sesión de R:
getwd() #Muestra el directorio actual de trabajo
## [1] "F:/Joelo/Clases/Curso-R/Aulas/Proyecto"
Para cambiar el directorio de trabajo utilizamos:
setwd( "C:/.../Aula1" ) # ¡¡Ojo con la barra /!!
3 R como calculadora
El uso más básico que tiene R es el de calculadora, pues se pueden realizar cálculos aritméticos simples con
los simbolos de **+, –, *, / ˆ** para las operaciones básicas.
Algunos ejemplos sencillos:
45 + 23 #Sumar
23.5-12.45 #Restar
100 / 4 #Dividir
sqrt(25) #Raíz cuadrada
35.5*6 #Multiplicar
2^3 #Potencia
En los casos anteriores cada orden se evalúa, se imprime y su valor se pierde.
4 Operadores y Funciones en R
Operadores aritméticos
Operador Significados
+ Suma
- Resta
* Multiplicación
/ División
^ Potenciación
%/% División entera
3
Operadores de comparación
Operador Significado
> Mayor que
< Menor que
>= Mayor o igual
<= Menor o igual
== Igual que
!= Distinto que
Operadores lógicos
Operador Significado
e1 & e2 y
e1 | e2 o
!e1 no
xor(e1, e2) o exclusivo
Operador de asignación Veremos habitualmente el uso de puntos en lugar de subrayado para separar
palabras y que las variables sean más autoexplicativas, por ejemplo: isa.grupos.
Por tanto, si vemos esa nomenclatura no tiene porque tratarse de un método o atributo de un objeto (como
pasa en otros lenguajes), sino que puede ser perfectamente una simple variable. Para declarar y asignar un
valor a una variable se puede utilizar tanto = como <-:
mivariable = 7
mivariable <- 7 # tanto = como <- asignan el número 7 al objeto mivariable
Si quiero ver qué valor toma mi variable escribo:
mivariable
## [1] 7
Nota: Cualquier asignación a una variable crea o reutiliza un objeto de R. Si guardo el workspace, quedará
guardada también la variable.
Funciones
exp(x) Exponencial
log(x, base=exp(1)) Logaritmo base
log10(x) Logaritmo base 10
sqrt(x) Raíz cuadrada
abs(x) Valor absoluto
ceiling(x) Menor entero >= x
floor(x) Mayor entero<= x.
trunc(x) Entero más cercano a x entre x y 0, inclusive,
Nota: trunc(1.5) es 1, y trunc(-1.5) es -1. trunc es como floor para valores positivos y como ceiling para
valores negativos.
Utilidades de interés
demo() Abre una ventana con funciones de R para que se observe cómo se ejecutan
y el resultado que devuelve.
help() Para una información más detallada utilizamos la función help() (ayuda).
RStudio no necesita conectarse a la web para mostrar la ayuda, como R.
apropos(” “) Si no nos acordamos del nombre exacto de una función podemos usar la función
apropos(” “) y entre paréntesis algunas letras de la función entre comillas.
example(): Muestra un ejemplo práctico de una función.
4
5 Ayuda en R
Las funciones y el modo para obtner ayuda en R se muestran a continuación:
Función Acción
help.start() Ayuda general
help(mean) o ?mean Función de ayuda sobre el función mean
help.search("mean") o Ayuda online sobre la función mean
RSiteSearch("mean")
help(package = "nombre_del_paquete") Ayuda sobre un paquete
apropos("mean", mode ="function") Lista todas las funciones que
contienen mean en el nombre
data() Muestra los conjuntos de datos de ejemplo
que hay disponibles
6 Espacio y directorio de trabajo en RStudio
En el workspace o espacio de trabajo se incluyen todos los objetos definidos por el usuario (los objetos
representan variables, vectores, dataframes, listas, etc.). El workspace se almacena en la memoria intermedia
mientras se ejecuta R.
Cuando termina una sesión de R aparece el mensaje en el que se pregunta si quieres guardar el workspace
para usos futuros. Este espacio, workspace, se recarga al volver a iniciar la sesión.
Por su parte el Directorio de trabajo o working directory es el directorio donde por defecto trabaja R.
También es donde se guardará el workspace al finalizar la sesión y donde buscará un workspace guardado
al iniciar R.
Si quieres que R lea un fichero que no esté en “working directory” hay que especificar la ruta completa.
Funciones para manejar el workspace:
Función Acción
getwd() Muestra el wd: working directory
setwd(C:/.../Curso-R) Ajusta el wd al especificado
ls() o dir() Enlista lo que hay en el wd
history() Muestra los últimos comandos ejecutados
savehistory() Guarda el historial de comandos en .RHistory
loadhistory() Carga el historial de comandos
save.image("mywspace.R") Guarda los objetos del workspace .RData
load("mywspace.R") Carga el workspace mywspace.R
7 Scripts
Un script es un fichero de texto plano con instrucciones. Para cargar un script, empleamos la función
source() y para crearlo lo guardamos con el nombre script.R (la extensión .R es una convención).
Un scritp que elabore un histograma de una curva normal debería de contener estas instrucciones:
x <- rnorm(100) # crea 100 observaciones aleatorias de la distribución normal.
hist(x)
5
8 Ampliar la funcionalidad de R. Packages
Con la instalación simple de R tenemos muchísimas posibilidades, no obstante existen multitud de módulos
opcionales que llamamos paquetes, packages. Los paquetes son colecciones de funciones y datos.
El directorio de tu PC donde se almacenan los packages es denominado library.
.libPaths()
## [1] "C:/Users/ACER/Documents/R/win-library/3.2"
## [2] "C:/Program Files/R/R-3.2.5/library"
No es lo mismo instalar que cargar un paquete. La instrucción search() nos dice que paquetes están instalados
y listos para usarse.
Instalamos un paquete con la instrucción install.packages(“nombre_paquete”). Sólo instalamos una
vez cada paquete y lo cargamos con la instrucción library(“nombre_paquete”). Tendremos que ejecutar
este comando en cada sesión en que queramos emplear dicho paquete.
Los paquetes disponibles están en CRAN, específicamente en http://cran.r-project.org/. Normalmente son
necesarios más paquetes que los que vienen por defecto, así que siempre se está subiendo paquetes nuevos.
En este curso veremos algunos de los más usuales.
Actividad 1. Realice las siguientes acciones desde la consola:
1. Ejecute library() ¿Qué resutado arroja? ¿Dispone de las liberias ggplot2 y Lattice?. Instale dichas
librerias en caso de no estar disponibles.
2. Obtenga ayuda para las siguientes funciones y librerias: c, matrix, data.frame, str, summary, plot,
hist, Binomial, Poisson, Normal. Explique cada una.
Actividad 2. Realice los siguientes cálculos aritméticos, utilizando el programa R. Redondee
los resultados finales a dos cifra decimales.
a) 24 + −8 + 79− 6 · (2)
1 1
b) 23 − 7 + 4 − +
√ 3 2
2
16 + 5 · 4 − 3
c)
· (4 − 8) +1
3
1 √
1 5 1
d) − 2−1 · − 7 + 8 ÷ 2 − − 32
2 4 3 π 5
π π tan
e) 2 · sen + 5 · cos − 6
3 4 4
1
f) 4 log2 (5) − 3 · log3 (7) + ln (8)
3