Unidad 1 Python Básico
Unidad 1 Python Básico
La generalización del big data en los últimos años, seguida de la explosión de la inteligencia
artificial, machine learning, deep learning y el surgimiento de la ciencia de datos o data science
como una nueva área de trabajo con especialistas propios, ha revolucionado el uso de este
lenguaje.
IEEE Spectrum, la organización profesional más grande del mundo dedicada a la ingeniería y
las ciencias aplicadas, elabora anualmente un ranking de los lenguajes de programación más
utilizados, preferidos y relevantes, que este año ubicó a Python en el primer lugar.
En esta unidad, hablaremos sobre Python, sus usos y las bibliotecas más utilizadas para la
ciencia de datos, y comenzaremos con su instalación para su futuro uso a lo largo del curso.
Ideas previas
Python
Instalación y configuración
Comunidad y conferencias
Conclusiones
Referencias
Material descargable
Lección 1 de 10
Ideas previas
https://spectrum.ieee.org/top-programming-languages-2022#toggle-gdpr
La herramienta más básica que hay que decidir es el lenguaje de programación que
vamos a utilizar.
Muchas personas solo utilizan un lenguaje de programación en toda su vida: el
primero y único que aprenden. Para muchas personas, el aprendizaje de un nuevo
lenguaje es una tarea enorme que, idealmente, solo se debería realizar una vez.
Por lo tanto, dependiendo del primer lenguaje que hayas aprendido, algunas tareas
pueden resultar bastante tediosas. (VanderPlas, 2016).
cada tarea y unir sus resultados. También es posible optar por un lenguaje versátil
con una amplia gama de recursos, como bibliotecas de código abierto de terceros.
Python
Python es un lenguaje maduro para programación, pero también posee excelentes
características para principiantes, haciéndolo ideal para aquellos que nunca han
laboratorios nacionales que han optado por usar Python para integrar software
NumPy es un acrónimo que significa “Número Pythonico” y ha sido, por mucho tiempo, el pilar de la
computación numérica en Python (McKinney, 2017).
Ofrece estructuras de datos, algoritmos y bibliotecas necesarias para integrar a la mayoría de las
aplicaciones científicas que trabajan con datos numéricos en Python.
Las matrices NumPy son una forma más eficiente de almacenar y manipular datos
numéricos en comparación con otras estructuras de datos en Python. Además, las
bibliotecas escritas en lenguajes de bajo nivel como C o Fortran pueden trabajar
directamente en los datos almacenados en una matriz NumPy sin tener que copiar
los datos a otra representación de memoria.
Por lo tanto, muchas herramientas de computación numérica para Python asumen
matrices NumPy como una estructura de datos principal o están dirigidas a una
interoperabilidad transparente con NumPy.
Pandas
Pandas_C2_U1
POSTGRADOS UNIVERSIDAD AUTÓNOMA
02:18
Pandas.mp3
2.9 MB
Matplotlib
Cuenta con una buena integración con el ecosistema de Python y, aunque existen
otras opciones, Matplotlib es la más utilizada.
SciPy
SUBMIT
Scikit-learn
Junto con Pandas, Statsmodels e IPython han sido fundamentales para posicionar a
Python como un productivo lenguaje de programación de ciencia de datos.
Statsmodels
Instalación y configuración
https://www.anaconda.com/products/distribution
export
PATH=/home/$USER/anaconda/bin:$PAT
H
Una vez realizado esto, se puede abrir una nueva terminal o volver a ejecutar el
archivo .bashrc con la ruta ~/.bashrc.
Lección 5 de 10
En algún momento mientras leas, es posible que desees instalar paquetes adicionales
de Python que no estén incluidos en la distribución de Anaconda.
Es posible utilizar tanto conda como pip para instalar paquetes, sin embargo, no se
recomienda intentar actualizar paquetes de conda con pip, pues esto puede causar
problemas en el entorno. Cuando se usa Anaconda o Miniconda, es mejor intentar
actualizar primero con conda.
Lección 6 de 10
El efecto más aconsejable es experimentar con los IDE más utilizados por la
comunidad y elegir el que mejor se ajuste a las necesidades aconsejables.
Por otro lado, hay otros que se limitan a trabajar con un solo lenguaje o incluso para
una tarea específica. En cuanto a Python, hay una amplia gama de IDE disponibles,
tanto de pago como de código abierto, como PyCharm y WingIDE.
La comunidad de código abierto ayuda a que surjan los IDE, por lo que cualquiera
puede personalizar su propio entorno y compartirlo con el resto de la comunidad.
Por ejemplo, Spyder (Scientific Python Development Environment) es un IDE
diseñado con el enfoque en los requisitos del científico de datos.
Además, los estudiantes pueden repetir los procesos una y otra vez, y
eventualmente modificar una celda de código en particular (un bloque dentro del
documento que puede contener el código fuente que se ejecutará) y volver a
ejecutarla. Los docentes también tienen acceso a las sesiones de los estudiantes y
pueden revisar el desempeño y los resultados de estos.
Ahora, estas sesiones se conocen como books y no solo se emplean en aulas, también
se utilizan para mostrar resultados en presentaciones o para crear paneles de
información en entornos empresariales.
Se han dado los primeros pasos en la aceptación de los cuadernos por parte de
algunas revistas científicas, lo que permite que se puedan presentar resultados
experimentales con todo su código y fuentes de datos, con el objetivo de lograr
experimentos completamente replicables.
Los books solamente se pueden utilizar en aulas. ¿Esta frase es Verdadera o Falsa?
Falso
Verdadero
SUBMIT
Lección 7 de 10
Comunidad y conferencias
02:10
Comunidad y conferencias.mp3
2.3 MB
Lección 8 de 10
Conclusiones
Referencias
McKinney, W. (2017). Python for Data Analysis: Data Wrangling with Pandas,
NumPy, and IPython. O'Reilly Media, Incorporated.
Seguí, S., Vitrià, J., Puertas, E., Pujol, O., Escalera, S., Garrido, L., Dantí, F., &
Igual, L. (2017). Introduction to Data Science: A Python Approach to Concepts,
Techniques and Applications. Springer International Publishing.
Material descargable