0% encontró este documento útil (0 votos)
207 vistas10 páginas

Tarea 0

nA

Cargado por

Ximena Guerra
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
207 vistas10 páginas

Tarea 0

nA

Cargado por

Ximena Guerra
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 10

Tarea 0-Instalación y reconocimiento de las herramientas de programación

Presenta:
Xx
Códgio:
Xx

Grupo:
Xx

Presenta a:
Xx
Tutor

Universidad Nacional Abierta y a Distancia “UNAD”


Escuela de Ciencias Básicas, Tecnología e Ingenieria
Curso: Programación para el analisis de Datos
08/07/2024
Introducción
El propósito de esta guía es proporcionar una introducción práctica al entorno

dinámico de programación con un enfoque en computación científica para el procesamiento

de datos. En este contexto, se explorarán herramientas y técnicas fundamentales que

permiten a los usuarios manejar y analizar datos de manera efectiva utilizando Python y

Jupyter Notebook. Este entorno es crucial para científicos de datos, investigadores y

profesionales que buscan automatizar análisis, realizar visualizaciones avanzadas y

desarrollar modelos predictivos.


Desarrollo de las actividades:
Ejercicio 1: Instalación de las herramientas de programación.
Ejercicio 2: Reconocimiento de las herramientas de programación.

1. ¿Qué es Jupyter y cómo puede serle útil a un científico de datos?

RTA

Jupyter es un entorno de desarrollo interactivo que permite la creación de

documentos que combinan código ejecutable (generalmente en Python) con texto

enriquecido (como Markdown), ecuaciones, visualizaciones y otros elementos

multimedia. Es extremadamente útil para científicos de datos porque les permite

desarrollar y compartir análisis de datos de manera interactiva y reproducible. Además,

facilita la exploración de datos y la comunicación de resultados mediante la

combinación de código, gráficos y explicaciones en un solo documento.

2. ¿Qué es una celda markdown?

RTA

Una celda Markdown en Jupyter es un tipo de celda que contiene texto

formateado utilizando Markdown, un lenguaje de marcado ligero. Permite incluir texto

normal, encabezados, listas, enlaces, imágenes y otros elementos de formato en un

documento Jupyter. Es útil para proporcionar explicaciones, documentación,

instrucciones y comentarios dentro de un notebook de Jupyter.

3. ¿Qué es un paquete (o librería) en Python?

RTA

Un paquete o librería en Python es un conjunto de módulos que proporcionan

funcionalidades específicas para realizar ciertas tareas. Estos paquetes están diseñados
para ser reutilizables y facilitan el desarrollo de aplicaciones al proporcionar métodos y

clases predefinidos que los programadores pueden usar.

4. Describa para qué sirven cada una de las siguientes librerías: Pip,

NumPy, Pandas, Seaborn, matplotlib, scikit-learn, Requests, Bokeh, y Folium.

RTA

 Pip: Es el sistema de gestión de paquetes de Python, utilizado para instalar y

administrar paquetes de software escritos en Python que no están incluidos en la

biblioteca estándar.

 NumPy: Librería fundamental para la computación científica en Python. Proporciona

soporte para matrices y matrices multidimensionales, junto con funciones matemáticas

para operar en estas estructuras de datos.

 Pandas: Librería que proporciona estructuras de datos y herramientas de análisis de

datos fáciles de usar para Python. Es especialmente útil para manipular y analizar datos

tabulares y series temporales.

 Seaborn: Librería de visualización de datos basada en matplotlib. Seaborn proporciona

una interfaz de alto nivel para dibujar gráficos estadísticos atractivos y informativos.

 Matplotlib: Librería de visualización de datos en Python. Permite crear una amplia

variedad de gráficos de alta calidad, desde simples parcelas hasta gráficos complejos.

 scikit-learn: Librería de aprendizaje automático en Python. Proporciona herramientas

simples y eficientes para la minería y el análisis de datos, incluidos algoritmos de

clasificación, regresión, clustering y preprocesamiento.


 Requests: Librería HTTP para Python. Permite enviar solicitudes HTTP/1.1 de manera

sencilla y eficiente.

 Bokeh: Librería de visualización interactiva de datos que permite la creación de

gráficos interactivos y paneles en navegadores web modernos.

 Folium: Librería para visualizaciones interactivas de datos geoespaciales. Facilita la

creación de mapas interactivos en Python.

Ejercicio 3: Estructuras Básicas de Datos con Python.

a. Construya un diccionario en el cual las llaves (keys) sean los nombres (strings) de

ocho (8) personas de su entorno familiar o amigos y los valores (values) sean tuplas

de cuatro (4) elementos que contengan la siguiente información de cada persona en

orden: (Edad,Peso, Estatura, Estudia). La edad debe ser en años, el peso en

kilogramos, la estatura en metros y el elemento de estudia debe ser un Booleano, en

el cual True significa que si estudia y False el caso contrario.

b. Implemente ciclos (for o while) para extraer la información del diccionario creado

anteriormente y generar las siguientes cuatro (4) listas: Edades, Pesos, Estaturas y

Estudia.

c. Defina una función que reciba como parámetros una lista y regrese (return) el

promedio de dicha lista. Utilice dicha función para imprimir (print) el promedio de

las listas del inciso anterior.

Solución:
Conclusiones

 A través del uso de Jupyter Notebook y paquetes de Python como NumPy, Pandas y

Matplotlib, los usuarios pueden acceder a herramientas avanzadas que facilitan desde la

manipulación de grandes conjuntos de datos hasta la creación de visualizaciones

interactivas. Esto mejora significativamente la eficiencia y precisión en el análisis de

datos complejos.

 La capacidad de Jupyter Notebook para combinar código ejecutable con texto

enriquecido permite documentar y compartir análisis de manera reproducible. Esto es

fundamental para la colaboración en equipos multidisciplinarios y asegura la

transparencia en la investigación y desarrollo de proyectos científicos.

 El aprendizaje de este entorno dinámico no solo fortalece las habilidades en

computación científica, sino que también prepara a los usuarios para adaptarse

rápidamente a nuevas tecnologías y metodologías en un entorno de datos en constante

evolución. Esto fomenta una cultura de aprendizaje continuo y mejora la capacidad de

resolver problemas complejos de manera efectiva.


Referencias

Alex Galea. (2018). Applied Data Science with Python and Jupyter: Use Powerful

Industry-standard Tools to Unlock New,

Actionable Insights From Your Data: Vol. 1st edition. Packt Publishing. (pp. 1-20).

Boschetti, A., & Massaron, L. (2016). Python Data Science Essentials - Second Edition

(Vol. 0002). Packt Publishing. (pp.

33-51).

Alvarez, C. (2020) Introducción al Jupyter Notebook yaplicaciones básicas. Medellín,

Colombia. [OVI]

Thakur, A. (2016). Python: Real-World Data Science. Packt Publishing. (pp. 199 -

220).

Kane, F. (2017). Hands-On Data Science and Python MachineLearning. Packt

Publishing. (pp. 20-39).

También podría gustarte