0% encontró este documento útil (0 votos)
40 vistas

Instalacion Python-R

Este documento proporciona una introducción a Python y R para propósitos de programación científica. Describe a Python como un lenguaje de programación de propósito general y de código abierto, mientras que R es un entorno de software para análisis estadístico y gráficos. Ambos son populares para ciencia de datos. El documento también cubre la instalación de Anaconda y el uso de cuadernos Jupyter con Python, así como características y usos comunes de Python y R para tareas de ciencia de datos e informática cientí
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
40 vistas

Instalacion Python-R

Este documento proporciona una introducción a Python y R para propósitos de programación científica. Describe a Python como un lenguaje de programación de propósito general y de código abierto, mientras que R es un entorno de software para análisis estadístico y gráficos. Ambos son populares para ciencia de datos. El documento también cubre la instalación de Anaconda y el uso de cuadernos Jupyter con Python, así como características y usos comunes de Python y R para tareas de ciencia de datos e informática cientí
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 8

Programación con Python y R

Daniel Camarena

04-29-2021

Introducción a Python
¿Qué es Python?
Python es un lenguaje de programación para próposito general concebido en 1989 por Dutch programmer
Guido van Rossum.
Python es libre y código abierto, con desarrollo coordinado por Python Software Foundation.
Python ha experimentado una rápida adopción en la última década y ahora es uno de los lenguajes de
programación más populares. En un cuadro, elaborado con Stack Overflow Trends, muestra una medida de
la popularidad relativa de Python.
En general, está claro que
• Python es uno de los lenguajes de programación más populares del mundo
• Python es una herramienta importante para la informática científica, que representa una parte del
trabajo científico en rápido crecimiento en todo el mundo.
Características
Python es un lenguaje de alto nivel adecuado para un desarrollo rápido.
Tiene un lenguaje base relativamente pequeño compatible con muchas bibliotecas.
Otras características de Python:
• Se admiten múltiples estilos/paradigmas de programación (procedimental, orientada a objetos, funcional,
etc.)
• se interpreta en lugar de compilar.
Sintasis y diseño
Una característica interesante de Python es su elegante sintaxis.
Esto puede parecer superfluo, pero de hecho es muy beneficioso porque hace que la sintaxis sea fácil de leer y
recordar.
Recordar cómo leer archivos, ordenar diccionarios y otras tareas rutinarias significa que no es necesario
interrumpir el flujo para buscar la sintaxis correcta.
Estrechamente relacionado con la sintaxis elegante hay un diseño elegante.
Características como iteradores, generadores, decoradores y listas por comprensión hacen que Python sea
altamente expresivo, lo que le permite hacer más con menos código.
Los espacios de nombres mejoran la productividad al reducir los errores y los errores de sintaxis.
Programación científica
• Programación numérica: NumPy, SciPy

1
• Gráficos: Matplotlib
• Álgebra simbólica: SymPy
• Estadística: pandas, statsmodels, scikit-learn
• Redes y grafos: NetworkX
• Computación en la nube: Anaconda Enterprise, Google App Engine
• Computación paralela: Parallel computing through IPython clusters, PyCuda
• Otros: Jupyter

Instalación y entorno
El paquete de Python base es fácil de instalar pero no lo que usaremos en nuestras sesiones.
Estas sesiones usarán todo un ecosistema de programación científica, que
• La instalación principal no proporciona
• Es doloroso instalar una pieza a la vez.
Por lo tanto, el mejor enfoque para nuestros propósitos es instalar una distribución de Python que contenga
1. El lenguaje de Python base
2. Versiones compatibles de las bibliotecas científicas más populares
La mejor distribución de este tipo es Anaconda.
Anaconda es
• Muy popular
• Multiplataforma
• Integral
Anaconda también viene con un excelente sistema de administración de paquetes para organizar sus bibliotecas
de códigos.
Instalando Anaconda
Para instalar Anaconda, descargue el binario y siga las instrucciones.
Puntos importantes:
• ¡Instale la última versión!
• Si durante el proceso de instalación se le pregunta si desea que Anaconda sea su instalación predetermi-
nada de Python, diga que sí.
Actualizando Anaconda
Anaconda proporciona una herramienta llamada conda para administrar y actualizar sus paquetes de
Anaconda.
Un comando conda que debe ejecutar con regularidad es el que actualiza toda la distribución de Anaconda.
Como práctica, ejecute lo siguiente
1. Abre una terminal
2. Escriba conda update anaconda
Para obtener más información sobre conda, escriba conda help en una terminal.
Cuadernos Jupyter
Los cuadernos de Jupyter son una de las muchas formas posibles de interactuar con Python y las bibliotecas
científicas.

2
Usan una interfaz basada en navegador para Python con
• La capacidad de escribir y ejecutar comandos de Python.
• Salida formateada en el navegador, incluidas tablas, figuras, animación, etc.
• La opción de mezclar texto formateado y expresiones matemáticas.
Debido a estas características, Jupyter es ahora un actor importante en el ecosistema de computación
científica.
Si bien Jupyter no es la única forma de codificar en Python, es ideal para cuando desee
• Empezar a codificar en Python
• Probar nuevas ideas o interactuar con pequeños fragmentos de código
• Compartir o colaborar ideas científicas con estudiantes o colegas
Estas sesiones fueron diseñadas para ejecutarse en Jupyter.
Empezando con Jupyter Notebook
Una vez que haya instalado Anaconda, puede iniciar el cuaderno Jupyter.
Ya sea que
• busque Jupyter en el menú de aplicaciones, o
• abra una terminal y escriba jupyter notebook
– Los usuarios de Windows deben sustituir “Anaconda command prompt” por “terminal” en la línea
anterior.
Si usa la segunda opción, verá algo como la Figura 1.

Figure 1: https://python-programming.quantecon.org/_static/lecture_specific/getting_started/starting_n
b.png

La salida nos dice que el cuaderno se está ejecutando en http://localhost:8888/


• localhost es el nombre de la máquina local

3
• 8888 se refiere a número de puerto 8888 en su computadora
Por lo tanto, el kernel de Jupyter está escuchando los comandos de Python en el puerto 8888 de nuestra
máquina local.
Con suerte, su navegador predeterminado también se ha abierto con una página web que se parece a la Figura
2.

Figure 2: https://python-programming.quantecon.org/_static/lecture_specific/getting_started/nb.png

Lo que ve aquí se llama tablero Jupyter.


Si miras la URL en la parte superior, debería ser localhost:8888 o algo similar, coincidiendo con el mensaje
de arriba.
Suponiendo que todo esto ha funcionado bien, ahora puede hacer clic en New en la parte superior derecha y
seleccionar Python 3 o similar.

4
Lo que aparece en nuestra máquina debe ser similar a la Figura3.

Figure 3: https://python-programming.quantecon.org/_static/lecture_specific/getting_started/nb2.png

El cuaderno muestra una celda activa, en la que puede escribir comandos de Python.

Introducción a R
¿Qué es R?
R es un entorno de software libre para gráficos y computación estadística que fue concebido como una
reimplementación de software libre del lenguaje S.
R es un lenguaje de programación y un entorno de software libre para computación estadística y gráficos
respaldados por R Foundation for Statistical Computing.

5
R ha experimentado una rápida adopción en la última década y ahora es uno de los lenguajes de programación
más populares para hacer estadística o ciencia de datos. En un artículo se comparan los lenguajes R, Python,
Matlab y Julia; mostrando ciertas que R posee ciertos puntos fuertes respecto a los otros.
En general, está claro que
• R es uno de los lenguajes de programación más populares del mundo
• R es un gran lugar para comenzar su viaje de ciencia de datos porque es un entorno diseñado desde
cero para respaldar la ciencia de datos.
Características estadísticas
R y sus bibliotecas implementan varias técnicas estadísticas y gráficas, que incluyen modelado lineal y no
lineal, pruebas estadísticas clásicas, análisis espacial y de series de tiempo, clasificación, agrupamiento y otros.
Debido a su herencia de S, R tiene un enfoque de programación orientada a objetos más sólido que la mayoría
de los lenguajes de computación estadística.
Características de programación
R es un idioma interpretado; los usuarios suelen acceder a él a través de un intérprete de línea de comandos.
En R todo es un objeto. Las funciones son de primera clase y se pueden manipular de la misma manera que
los objetos de datos, lo que facilita la metaprogramación y permite el envío múltiple.
Las variables en R tienen un lexical scope) y se escriben dinámicamente.
Otras características de R:
• R admite la programación procedimental con funciones y,
• para algunas funciones, la programación orientada a objetos con funciones genéricas.
Ciencia de datos
La ciencia de datos es un campo enorme y no hay forma de que pueda dominarlo leyendo un solo libro. El
objetivo de este libro es brindarle una base sólida en las herramientas más importantes. Nuestro modelo de
las herramientas necesarias en un proyecto típico de ciencia de datos se parece a esto:

• Importación: Obtener y entender sus datos, cargarlos a R.


• Ordenación: Organizar los datos de tal manera que sea fácil transformarlos, resumirlos, visualizarlos,
modelarlos.
• Transformación: manipular los datos para tener el input que el análisis o técnica estadística necesita.
• Visualización: realizar el análisis exploratorio de datos.
• Modelar: aplicar técnicas estadísticas para el entendimiento del problema o tomar decisiones.
• Comunicación: tratar de mostrar los resultados de tal forma que el resto del mundo los entienda.

6
Alrededor de todas estas herramientas está la programación. La programación es una herramienta transversal
que se utiliza en cada parte del proyecto. No necesita ser un programador experto para ser un científico de
datos, pero aprender más sobre programación vale la pena porque convertirse en un mejor programador le
permite automatizar tareas comunes y resolver nuevos problemas con mayor facilidad.
El flujo de trabajo resulta
1. Importar
2. Ordenar
3. Repetir mientras sea necesario
a. Transformar: Manipular los datos, obtener el input del modelo
b. Visualizar: Realizar el análisis exploratorio de datos
c. Modelar: Aplicar técnicas estadísticas
4. Comunicar

Instalación y entorno
El paquete de R base es fácil de instalar pero no lo que usaremos en nuestras sesiones.
Estas sesiones usarán todo un entorno de programación estadística, que
1. La instalación principal no proporciona
2. Integrar distintas funcionalidades en un mismo entorno
Por lo tanto, el mejor enfoque para nuestros propósitos es instalar un entorno de desarrollo integrado (IDE)
conocido como RStudio.
RStudio es
• Muy popular
• Multiplataforma
• Integral
• Colaborativo
RStudio también viene con un excelente sistema de administración de paquetes para organizar sus bibliotecas
de códigos.
Instalando RStudio
Para instalar RStudio, descargue el ejecutable y siga las instrucciones.
Puntos importantes:
• ¡Antes de empezar debe tener R!
• Instale la última versión
• Si durante el proceso de instalación se le pregunta si desea que Rstudio sea su aplicación predeterminada
de R, diga que sí.
Actualizando R y RStudio
La actualización en Windows puede hacerse usando un paquete llamado installr, que es solo para Windows,
para facilitar el proceso.
Primero instale el paquete de instalación si no lo tiene
# instalando/cargando el paquete:
if(!require(installr)) {
install.packages("installr");
require(installr)
}

7
## Loading required package: installr
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'installr'
## Installing package into '/home/danny/R/x86_64-pc-linux-gnu-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'installr' is not available (for R version 3.6.3)
## Loading required package: installr
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'installr'
Ahora llame a la función updateR() para llamar a la actualización. Esto iniciará el proceso de actualización
de su instalación de R. Verificará si hay versiones más nuevas y, si hay alguna disponible, lo guiará a través
de las decisiones que debe tomar.
# quitar el # en la siguiente línea y ejecutar
#updateR()

Por último, desde RStudio, vaya a Help > Check for Updates para instalar una versión más reciente de
RStudio (si está disponible, opcional).
¡Está listo para Data Science Essentials para R!

También podría gustarte