0% encontró este documento útil (0 votos)
12 vistas21 páginas

Programación para El Procesamiento de Datos

Cargado por

kevincortesh765
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
12 vistas21 páginas

Programación para El Procesamiento de Datos

Cargado por

kevincortesh765
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 21

Programación para el procesamiento de

datos
ESCUELA DE NEGOCIOS

Directora: Lorena Patricia Baus

ELABORACIÓN

Experto disciplinar: Mary Solé

Diseñador instruccional: Antonia Gómez

Editor instruccional: Emilia De la Cruz

VALIDACIÓN

Experto disciplinar: Christian Rojas

Jefa de Diseño Instruccional: Alejandra San Juan

EQUIPO DE DESARROLLO

Welearn

AÑO

2023
Tabla de contenidos
Aprendizaje esperado de la semana .................................................. 4

Introducción ............................................................................................. 5

1. Análisis de datos en base a herramientas de las librerías de


Python ....................................................................................................... 6

2. Package para análisis de datos en Python .................................... 7

2.1. Scipy (tambien instalará numpy) .................................................................. 7

2.2. Pillow (libreria para manejo de imágenes) ................................................ 10

2.3. Imageio (lectura / escritura de imágenes) ................................................ 12

2.4. Matplotlib (para graficar) ............................................................................ 13

2.5. Seaborn (visualizaciones estadísticas) ........................................................ 14

2.6. Scikit-learn ...................................................................................................... 16


3. Importancia de la toma de decisiones basado en los resultados
obtenidos ............................................................................................... 17

Cierre....................................................................................................... 19

Referencias Bibliográficas .................................................................... 20


Aprendizaje esperado de la semana
Configuran los elementos básicos de un entorno virtual de desarrollo para
análisis de datos utilizando Python.

Fuente: Storyset
Introducción
¿De qué manera podemos trabajar una librería como Matplotlib o
Seaborn utilizando Python?

La importancia de la toma de decisiones en la industria se basa que en ella


radica lo que se hará o no en un momento especifico, por lo que en definitiva
define el rumbo de la empresa, llegando al éxito o no dependiendo como y
quien gestione esa decisión, para ello se debe analizar tomas las aristas
posibles para optimizar los procesos, y basarse en estadísticas, y ayudarse con
las herramientas que actualmente contamos en la actualidad, en
aplicaciones y/o software que hagan de este análisis más efectivo. Vamos a
ver como algunas librerías de Python pueden colaborar con este fin dentro de
la empresa.

5
1. Análisis de datos en base a
herramientas de las librerías de Python
Según aws, en lenguaje Python “es un lenguaje de programación
ampliamente utilizado en las aplicaciones web, el desarrollo de software, la
ciencia de datos y el machine learning (ML).”
https://aws.amazon.com/es/what-is/python/ , además declara que entre sus
características más versátiles se encuentra que es un lenguaje interpretado,
fácil de utilizar, un lenguaje de alto nivel y algo muy importante, un lenguaje
orientado a los objetos. Cuando se quiere realizar un análisis de datos el cual
es un proceso que además de la exploración y examinación de datos sirve
para identificar tendencias y patrones y este lenguaje ayuda a este proceso y
a la toma de decisiones respaldas.

Para analizar datos debemos hacer uso de librerías de Python, las cuales son
una herramienta fundamental, existen unas librerías más usadas que otras, y
todas se usan para ayudar a codificar todo el lenguaje de programación y
crear una interfaz independiente, algunos de los tipos de librerías se pueden
mencionar, Visualización, Cálculo Numérico (las más indicadas para la
preparación de datos y cálculo de atributos relevantes), Machine Learning, y
para complementar vamos a ejemplificar algunas librerías: Matplotlib,
Seaborn, Bokeh, NumPy, La librería Beautiful Soup la cual permite extraer
información de contenido en formato HTML o XML, entre otras.

6
2. Package para análisis de datos en
Python
Un paquete es una recopilación de archivos y directorios que se hacen
necesarios para poder desarrollar o construir un software, el programador o
desarrollador del software es quien diseña y construye normalmente el
paquete, después de acabar el desarrollo del código de la aplicación.

2.1. Scipy (tambien instalará numpy)

El paquete scipy contiene varias cajas de herramientas especialmente


dedicadas a problemas en computación científica, este es el paquete núcleo
para rutinas científicas en Python, operando eficientemente los arreglos
numpy. Por tanto podemos decir que es una librería de python especializada
en el cálculo numérico y el análisis de datos, pues te permite crear rutinas
numéricas con estructura de datos, se puede resaltar su forma sencilla de usar
y operar.

Podemos acceder a su página oficial desde el siguiente link:


https://scipy.org/index.html

7
Puedes acceder al menú en documentación, donde te encontraras con
información de interés como guías de usuario, referencias API, entre otra
documentación que será muy útil para la instalación y utilización de la librería.

8
Un ejemplo de la utilidad de Scipy puede ser el del cálculo del mínimo de una
función en un intervalo:

𝑎𝜋 . 𝑥
𝑌 = −𝑐𝑜𝑠 ( ) + 𝑐 𝑥𝑑
2𝑏

import numpy as np # Importamos numpy como el alias np

import scipy as sp# Importamos scipy como el alias sp

from scipy.optimize import fminbound # Importamos fmindbound


desde scipy.optimize   

import matplotlib.pyplot as plt

#definimos la funcion

def mi_funcion(x, a, b, c, d):

y = -sp.cos(a*sp.pi*x/b) + c*x**d

return y

# Definimos los coeficientes a, b, c, d, dándole valores

a = 2

b = 0.5

c = 0.05

d = 2

# Definimos el intervalo de búsqueda del mínimo

x1 = 0.2

x2 = 0.6

xt=sp.arange(0,1,.01)

9
yt = -np.cos(a*sp.pi*xt/b) + c*xt**d

# Para calcular el mínimo local de la función entre x1 y x2

x_minimo = fminbound(mi_funcion,x1,x2, args = (a,b,c,d))

ysol = mi_funcion(x_minimo, a, b, c, d)

# Muestra la gráfica y en pantalla el resultado

print (u'El mínimo esta en x = %2.3f, y = %2.3f' %(x_minimo,


ysol))

plt.plot(xt,yt)

plt.plot(x_minimo,ysol,'x')

2.2. Pillow (libreria para manejo de imágenes)

En Python existen diferentes librerías, y la más adecuada para aplicaciones de


imágenes y procesamiento por lotes, es Pillow, el paquete Pillow de Python se
puede convertir de un formato a otro, hacer impresiones en imágenes,
cambiar de tamaños de la imágenes, rotarlas, transformarlas, entre otros.
Además algo muy interesante es que permite extraer datos estadísticos de una
imagen, con el método del histograma para poder realizar análisis y colaborar
con la toma de decisiones

Para la utilización de Pillow, se debe instalar usando pip, para que hacer
ejecutando el siguiente comando:

• python -m pip instalar pip


• python -m almohada de instalación de pip

10
Vamos a realizar un pequeño ejercicio de rotación de una imagen:

from PIL import Image

#Open image using Image module

im = Image.open("images/nombreimagen.jpg")

#Show actual Image

im.show()

#Show rotated Image

im = im.rotate(45)

im.show()

Debe guardar y ejecutar y se visualizará la imagen rotada 45° de la original.


Además existen muchos atributos de Pillow.

Te invito a visitar la página


https://pillow.readthedocs.io/en/stable/#, para que puedas
complementar tus conocimientos

11
Encontrarás documentación, guías de instalación, y demás información que te
ayudará a realizar ejercicios sencillos con Pillow.

2.3. Imageio (lectura / escritura de imágenes)

Como hemos hablado existen multiples librerías en Python, diseñadas para la


Data Science y el Machine Learning, por su parte Imageio, es una librería
dedicada a los datos de imágenes, ofrece una interfaz para poder escribir y
leer una variedad de datos de imágenes, animadas, diferentes formatos,
vídeos, etc. Tiene la ventaja que es facíl de instalar con Conda o PIP.

En el siguiente link, puedes encontrar información


complementaria y descargarlo de ser necesario:
https://pypi.org/project/imageio/

12
Imageio no está directamente instalado en Python, para ello debes escribir el
siguiente comando: ” pip install imageio ”.

Y debes tomar en cuenta que tiene ciertos requisitos previos, debes utilizar
Python 3.5 o superior y las bibliotecas Numpy y Pillow.

2.4. Matplotlib (para graficar)

Matplotlib es una biblioteca multiplataforma de visualización de datos y


trazado gráfico para Python y su extensión numérica NumPy. La instalación de
la librería se puede desacragar como un paquete binario desde Python
Package Index, con el siguiente comando:

• python -m pip instalar matplotlib

La página https://matplotlib.org/ tiene información


complementaría, documentación, ejercicios, diferentes
versiones, entre otras.

13
Con Matplotlib, se puede diagramar de manera sencilla, por ejemplo: Vamos
a graficar una línea, pyplot se importa como plt y luego se usa para trazar tres
números en línea recta: importar matplotlib.pyplot como plt

# Trace algunos números:

• plt.plot([1, 2, 3])
• plt.title(”Gráfico de líneas”)

# Mostrar la trama:

• plt.show()

2.5. Seaborn (visualizaciones estadísticas)

Es una librería de visualización de datos para Python desarrollada sobre


matplotlib. Ofrece una interfaz de alto nivel para la creación de atractivas
gráficas. Seaborn trabaja en convertir la visualización en una parte central de
la exploración de datos.

Toda la información oficial se puede investigar en su página


oficial : https://seaborn.pydata.org/

14
Esta librería se importa habitualmente con el alias sns: import seaborn as sns

Es importante conocer que para hacer uso de las funciones de seaborn se


debe importar con anterioridad la librería anteriormente mencionada.

En la página oficial encuentras tutoriales que pueden


complementar y mejorar tu agilidad para utilizar la librería,
https://seaborn.pydata.org/tutorial.html

15
2.6. Scikit-learn

Scikit-learn probablemente es la librería más útil para Machine Learning,


contiene diversidad de herramientas para aprendizaje automático y
modelado estadístico, es de código abierto y es reutilizable. Esta librería incluye
lo siguiente:

Fuente: http://bit.ly/3IGLY1N

Para implementar scikit-learn, se debe importar los paquetes mencionados en


la imagen y de esta manera poder usarlos en la programación.

16
3. Importancia de la toma de
decisiones basado en los resultados
obtenidos
La toma de decisiones en el día a día es de suma importancia, en el ámbito
personal una decisión puede cambiar el rumbo de tú vida, la carrera
universitaria por ejemplo es una decisión que marcará lo largo de tú vida,
donde estudiarás esa carrera, que hacer y que no mientras estudias, incluso
desde que eres bebé la decisión de ese primer paso, es algo importante en el
momento, ahora pensemos en la toma de decisiones en las empresas o en la
industria, definitivamente es una elección muy importante, y esa decisión trate
consecuencias para el futuro tanto para la empresa, sus empleados y los
clientes. La toma de decisiones en una empresa debe estar basado en
métricas, datos y estadísticas que guíen las decisiones que de manera
estratégica se alineen con las metas y objetivos futuros. El proceso de toma de
decisiones es continuo y combina conocimientos, habilidades y experiencia y
debe tener en cuenta los riesgos y mitigación de ellos.

Existen distintos tipos de decisiones, dependiendo la posición de gerencia que


se tenga, está la decisión basada en el valor, decisión basada en creencias
conscientes y subconscientes, decisión basada en datos, la cual involucra las
rutinas del negocio para la toma de decisiones.

Para la toma de decisiones en una empresa es importante inicialmente


identificar y analizar la problemática, ver las posibles soluciones y opciones

17
para mejorar o para ser más eficiente, debe tener en cuenta la misión de la
empresa, los productos o servicios que ofrece, el perfil del cliente atendido,
para poder tener una toma de decisiones eficaz se debe conocer todas las
áreas de la empresa, y sobre todo basarse en datos estadísticos, el gerente
mientras más conocimiento tenga de los datos financieros, de recursos
humanos, definitivamente enriquecen el proceso. Y al final de la toma de
decisiones se debe hacer la evaluación de los resultados, para toma de
decisiones futuras que sirva de base.

18
Cierre
Por medio del siguiente organizador gráfico se destacan las ideas clave de
esta semana:

En una organización u empresa para la toma de decisiones debe hacer


primeramente un análisis de los datos, de las estadísticas, para así tener una
proyección, para ello podemos tomar el análisis de los datos con comandos
en la aplicación que sean para esto, y para ello se requiere conocer los
paquetes que traen consigo estos comandos en Python.

19
Referencias Bibliográficas
• AWS. (s/f). ¿Qué es Python? https://aws.amazon.com/es/what-
is/python/

• imageio 2.26.0. (s/f). Descripción de Proyecto.


https://pypi.org/project/imageio/

• matplotlib. (s/f). Matplotlib: Visualization with Python.


https://matplotlib.org/

• Pillow. (s/f). Pillow#. https://pillow.readthedocs.io/en/stable/#


• seaborn. (s/f). seaborn: statistical data visualization#.
https://seaborn.pydata.org/

• seaborn. (s/f). User guide and tutorial#.


https://seaborn.pydata.org/tutorial.html

• SciPy. (2023). SciPy documentation. https://docs.scipy.org/doc/scipy/

20

También podría gustarte