Unidad 5 Aplicaciones
Unidad 5 Aplicaciones
Unidad 5 Aplicaciones
2
ÍNDICE
1.
Aplicaciones del Álgebra Matricial II ........................................................................... 6
5.1. Análisis de datos geoespaciales ................................................................6
5.1.1. Representación de datos geoespaciales con
matrices y vectores ...............................................................................6
5.1.2. Cálculo de distancias y direcciones entre
ubicaciones .........................................................................................11
5.1.3. Análisis de rutas y trayectorias utilizando
operaciones matriciales ......................................................................18
5.1.4. Visualización de datos geoespaciales en el plano
cartesiano ...........................................................................................23
5.2. Procesamiento de imágenes ...................................................................24
5.2.1. Representación de imágenes como matrices de
píxeles ................................................................................................25
5.2.2. Aplicación de filtros y transformaciones en imágenes
mediante operaciones matriciales .......................................................30
5.3. Análisis de datos de movimiento..............................................................36
5.3.1. Representación de datos de movimiento con
matrices y vectores .............................................................................37
5.3.2. Análisis de trayectorias y cambios en la posición
utilizando operaciones matriciales ......................................................42
5.3.4. Aplicaciones en el seguimiento de objetos y análisis
de movimientos ...................................................................................43
TRABAJO PRÁCTICO N° 5 ..................................................................................46
3
4
REFERENCIAS
Preguntas de reflexión
Video de YouTube
Situación problemática
Página de internet
5
5.Unidad 5
Aplicaciones del Álgebra Matricial
5.1 Análisis de datos geoespaciales
En la era digital actual, la abundancia de datos representa un recurso valioso
para comprender fenómenos complejos y tomar decisiones fundamentadas.
Entre estos datos, los relacionados con la ubicación geográfica tienen un papel
crucial. La ciencia de datos ha evolucionado para abordar esta particularidad,
dando origen al análisis de datos geoespaciales. Este campo se centra en
comprender la relación entre los datos y su ubicación geográfica, ofreciendo
perspectivas fundamentales para múltiples disciplinas.
En el marco de la Licenciatura en Análisis y Gestión de Datos, el análisis de
datos geoespaciales adquiere un papel esencial en la formación de profesionales
altamente competentes. Esta sección explorará aspectos fundamentales
relacionados con la representación, cálculo y visualización de datos con
referencias espaciales.
En primer lugar, abordaremos la representación de datos geoespaciales con
matrices y vectores. Estas estructuras matemáticas proporcionan un medio
eficaz para describir ubicaciones, trayectorias y fenómenos en un espacio
geográfico. La traducción de información geográfica a modelos matriciales o
vectoriales permite manipulaciones analíticas precisas.
Continuando, exploraremos el cálculo de distancias y direcciones entre
ubicaciones, una aplicación clave del análisis geoespacial. Estos cálculos,
basados en principios trigonométricos y algebraicos, son fundamentales para
determinar relaciones espaciales entre puntos. Proporcionan información valiosa
para logística, planificación urbana, medio ambiente y muchas otras áreas.
Posteriormente, nos adentraremos en el análisis de rutas y trayectorias
utilizando operaciones matriciales. Este análisis se ha vuelto crucial en un
mundo móvil e interconectado, permitiendo la optimización de rutas de
transporte, seguimiento de flotas y comprensión de la movilidad urbana.
Finalmente, destacaremos la importancia de la visualización adecuada de
datos geoespaciales en el plano cartesiano. Al representar datos en mapas,
gráficos o visualizaciones interactivas, se pueden identificar patrones y
correlaciones espaciales. La interpretación correcta de estos resultados respalda
la toma de decisiones informadas en diversos contextos.
El análisis de datos geoespaciales es un pilar crucial en la formación de
expertos en análisis y gestión de datos. Estos conceptos proveen las bases
esenciales para comprender la relación entre datos y ubicación, permitiendo
el uso óptimo de la información espacial en la toma de decisiones
estratégicas y operacionales. A través de este conocimiento, los futuros
profesionales podrán enfrentar los desafíos de un mundo impulsado por la
información geoespacial de manera efectiva y precisa.
6
En el contexto del análisis y gestión de datos geoespaciales, la representación
efectiva de información sobre ubicaciones geográficas es esencial para
extraer conocimientos significativos. Este proceso se fundamenta en el uso de
estructuras matemáticas poderosas: matrices y vectores. Estas herramientas
matemáticas permiten traducir datos espaciales complejos en formas que son
manejables y susceptibles de análisis.
Las matrices se convierten en una representación fundamental al trabajar con
datos geoespaciales. Cada fila de una matriz puede representar un punto
específico en el espacio geográfico, mientras que las columnas pueden contener
información sobre distintas dimensiones, como la latitud, longitud, altitud u otras
características relevantes. Esta estructura tabular proporciona un marco
organizado para almacenar y manipular datos con referencias espaciales.
Por otro lado, los vectores también son cruciales para describir ubicaciones y
trayectorias en el espacio. Los vectores direccionales pueden representar la
distancia y dirección desde un punto a otro. Por ejemplo, en el análisis de
trayectorias, cada vector puede denotar el cambio de posición entre puntos
sucesivos en un intervalo de tiempo específico. La operación matemática de
vectores proporciona una comprensión más profunda de cómo los puntos están
distribuidos y se relacionan en el espacio geográfico.
La representación de datos geoespaciales con matrices y vectores permite una
manipulación más eficaz y precisa de la información. Estas estructuras
matemáticas brindan la base sobre la cual se construyen algoritmos para el
análisis de rutas óptimas, cálculos de proximidad y visualización de datos en
mapas y gráficos. Además, la combinación de matrices y vectores facilita la
interpretación de patrones complejos en los datos geoespaciales, esencial para
la toma de decisiones informadas en una amplia gama de aplicaciones.
Ahora abordaremos la resolución de un problema que involucra el uso de datos
geoespaciales, diversas coordenadas, y el análisis de sus ventajas y
limitaciones.
7
cualquier punto en la superficie de la Tierra. Este sistema es utilizado por
tecnologías como el GPS (Global Positioning System). Sus principales
características son las siguientes:
Latitud: Es el ángulo imaginario que determina la distancia entre un
punto y el ecuador, la línea horizontal imaginaria que divide el mundo
en dos hemisferios: Norte y Sur. En otras palabras, indica qué tan lejos
o cerca está un punto de la referencia del ecuador y de los trópicos
paralelos a él, como el trópico de Cáncer y el de Capricornio. La latitud
se simboliza con la letra griega phi, 𝜙.
Longitud: Es el ángulo imaginario que determina la distancia entre un
punto y el meridiano de Greenwich o meridiano 0, que cruza por la
localidad del mismo nombre en Londres, Inglaterra. Este meridiano es
vertical y divide al mundo en dos regiones, occidental (Oeste) y
oriental (Este), y sirve como referencia para trazar los demás
meridianos que cruzan imaginariamente el globo de manera paralela
al meridiano de Greenwich. La longitud se simboliza con la letra griega
lambda, 𝜆.
Estas coordenadas de latitud y longitud componen el sistema de coordenadas
conocido como Sistema de Coordenadas Geográficas, cuyo centro imaginario
es el centro de la Tierra. Sus valores se expresan en grados, minutos y
segundos, acompañados de una letra que indica la orientación cardinal en el
globo: Norte, Sur, Este u Oeste. Esta información suele anotarse entre
paréntesis, presentando primero los datos de latitud y luego los de longitud.
Por ejemplo, un punto X en la ciudad de Buenos Aires, Argentina, tiene
coordenadas geográficas angulares de (34° 36’ 47’’ S; 58° 22’ 38’’ O). Es decir,
el punto X está a 34 grados, 36 minutos, 47 segundos de latitud sur, y 58 grados,
22 minutos, 38 segundos de longitud oeste. También es importante mencionar
que, en lugar de utilizar la letra 'S' para el sur y la letra 'O' para el oeste, es común
expresar estas direcciones con valores negativos. Por ejemplo, la latitud sur se
representaría como -34° y la longitud oeste como -58°. Esta notación es
ampliamente utilizada, por ejemplo, en aplicaciones como Google Maps, donde
se emplea el signo negativo para indicar tanto latitud sur como longitud oeste,
simplificando la representación y lectura de las coordenadas geográficas.
Para obtener estas coordenadas para un lugar específico, podemos utilizar
Google Maps. Basta con buscar el aeropuerto que deseamos localizar y, luego,
haciendo clic con el botón derecho en el lugar o en el área del mapa, se
abrirá una ventana emergente donde encontraremos la latitud y longitud en
formato decimal en la parte superior.
8
El Aeropuerto Internacional de Ezeiza en Buenos Aires, Argentina, tiene el
nombre oficial “Aeropuerto Internacional Ministro Pistarini" en honor a Juan
Pistarini, un destacado político y militar argentino. El Aeropuerto Internacional de
Guarulhos en São Paulo, Brasil, es conocido oficialmente como "Aeropuerto
Internacional de São Paulo/Guarulhos - Governador André Franco Montoro", en
honor a André Franco Montoro, quien fue un político y abogado brasileño. El
aeropuerto principal de Lima, Perú, lleva el nombre oficial de "Aeropuerto
Internacional Jorge Chávez", en honor al aviador pionero peruano Jorge Chávez
Dartnell.
Si organizamos estos datos en una tabla tendremos los siguientes valores:
Aeropuerto Internacional de
-23.01586 -46.49848
Guarulhos
9
Para representar estos datos en un sistema de coordenadas plano, podemos
utilizar las coordenadas geográficas proporcionadas (latitud y longitud) como
coordenadas rectangulares en un plano cartesiano. Asignamos la latitud a la
coordenada en el eje Y (ordenada) y la longitud a la coordenada en el eje X
(abscisa). De esta manera, cada aeropuerto se puede ubicar como un punto en
el plano, como se aprecia en la siguiente imagen, realizada con GeoGebra.
10
en la medición de distancias.
Además, al utilizar coordenadas geográficas como coordenadas rectangulares
en un plano, estamos tratando ángulos como si fueran longitudes lineales
en un sistema plano, lo cual es una simplificación y puede generar inexactitudes.
La superficie de la Tierra es curva, y esta aproximación plana puede generar
imprecisiones especialmente en largas distancias.
No obstante, esta representación en un plano cartesiano facilita la visualización
y comprensión de la distribución geográfica de los aeropuertos. Permite
comparar fácilmente sus posiciones relativas y analizar patrones espaciales.
Además, simplifica el uso de herramientas de análisis y visualización disponibles
en entornos gráficos bidimensionales.
En síntesis, al representar coordenadas geográficas en un sistema de
coordenadas plano nos proporciona una visualización clara y conveniente de
la ubicación de los lugares en un plano bidimensional, pero introduce ciertas
limitaciones en la precisión y la fidelidad geométrica debido a la diferencia
entre un modelo esférico y un plano.
Después de haber trabajado con esta representación geoespacial de los
aeropuertos, reflexiona sobre las implicaciones de utilizar coordenadas
rectangulares en un plano para representar posiciones en la superficie esférica
de la Tierra. ¿Qué ventajas y limitaciones identificas en este enfoque para la
representación de datos geoespaciales en comparación con un sistema
esférico?
𝑑 = √(𝑥𝐵 − 𝑥𝐴 )2 + (𝑦𝐵 − 𝑦𝐴 )2
Esta fórmula representa la distancia en línea recta entre dos puntos en un plano
bidimensional. Básicamente, su deducción se deriva de la aplicación del teorema
de Pitágoras, como se ilustra en la siguiente imagen.
11
Es importante tener en cuenta que, en algunos contextos, especialmente en
distancias geográficas largas, es necesario utilizar fórmulas más complejas que
consideren la curvatura de la Tierra.
Dirección entre puntos
La dirección o el ángulo entre dos puntos en un espacio geoespacial se puede
calcular utilizando funciones trigonométricas. Dada dos ubicaciones 𝐴 y 𝐵, el
ángulo 𝜃 entre la línea que los une y el eje horizontal se puede calcular como:
𝑦𝐵 − 𝑦𝐴
𝜃 = 𝑎𝑟𝑐𝑡𝑎𝑛 ( )
𝑥𝐵 − 𝑥𝐴
Esta fórmula nos proporciona el ángulo en radianes. Si deseamos la dirección
en grados, podemos convertirlo multiplicando por 180𝜋.
Este cálculo se deduce aplicando trigonometría básica al triángulo rectángulo
formado por la línea que conecta 𝐴 y 𝐵. La tangente del ángulo 𝜃 es igual a la
relación entre la diferencia en coordenadas 𝑦 y la diferencia en coordenadas 𝑥.
La función arcotangente nos da el ángulo correspondiente a esta relación.
Estos cálculos son fundamentales para diversas aplicaciones en análisis de
datos geoespaciales, ya que permiten evaluar la proximidad y la orientación
relativa entre diferentes ubicaciones.
Distancia en una esfera
Cuando trabajamos con coordenadas geoespaciales en forma de latitud y
longitud, es necesario utilizar fórmulas específicas para calcular la distancia
entre dos puntos en la superficie de la Tierra. Esto se debe a que la Tierra es
una esfera, y la distancia entre dos puntos en una esfera no se calcula
directamente como en un plano bidimensional.
La intersección de un plano que contiene el centro de una esfera con la esfera
misma genera dos tipos de líneas importantes: un círculo máximo y una
circunferencia máxima en la superficie de la esfera. Un círculo máximo divide la
esfera en dos hemisferios iguales. La distancia más corta entre dos puntos A y
B en la superficie de la esfera, medida a lo largo de un arco de círculo máximo,
se denomina distancia ortodrómica. Si viviéramos en una Tierra plana (lo cual
no es así), entonces sí, una línea recta sería la distancia más corta entre los
puntos A y B.
12
En la superficie terrestre, ejemplos de círculos máximos incluyen los meridianos
y la línea ecuatorial. Para calcular la distancia ortodrómica entre dos puntos en
una esfera, como la Tierra, se utiliza la fórmula del Haversine. Esta fórmula
tiene en cuenta la curvatura de la Tierra y proporciona una estimación precisa de
la distancia entre dos puntos en la superficie terrestre.
En consecuencia, dada dos ubicaciones A y B con sus correspondientes latitudes
𝜙𝐴 y 𝜙𝐵 , y longitudes 𝜆𝐴 y 𝜆𝐵 , la distancia 𝑑 entre estos puntos se calcula como:
∆𝜙 ∆𝜆
𝑑 = 2𝑟 × 𝑎𝑟𝑐𝑠𝑒𝑛 (√𝑠𝑒𝑛2 ( ) + 𝑐𝑜𝑠(𝜙𝐴 ) × cos(𝜙𝐵 ) × 𝑠𝑒𝑛2 ( ))
2 2
Donde:
• ∆𝜙 = 𝜙𝐵 − 𝜙𝐴
• ∆𝜆 = 𝜆𝐵 − 𝜆𝐴
• La variable 𝑟 representa el radio de la Tierra, que se aproxima a 6371
kilómetros. Para mayor precisión, se desglosa en el radio ecuatorial
de aproximadamente 6378.1 km y el radio polar de aproximadamente
6356.8 km. Se utiliza un valor medio de 6371 km como referencia
debido a estas variaciones.
En el mundo real, la fórmula de Haversine se utiliza para calcular rutas de
vuelo, distancias en mapas y navegación marítima. También se utiliza en
meteorología para calcular las trayectorias de las tormentas, para posicionar
equipos de telecomunicaciones y para trazar la trayectoria de los satélites en el
cielo. La fórmula también se utiliza en navegación GPS para determinar las
rutas más eficientes para los conductores.
Conversión de latitud y longitud a coordenadas rectangulares
Para representar coordenadas geoespaciales en un plano cartesiano, podemos
convertir las coordenadas de latitud y longitud a coordenadas rectangulares
utilizando proyecciones cartográficas. Una de las proyecciones comúnmente
utilizadas es la proyección de Mercator, que convierte la latitud y longitud en
coordenadas 𝑥 e 𝑦 en un plano bidimensional.
La proyección de Mercator lleva el nombre de su creador, Gerardus Mercator,
un cartógrafo, geógrafo y matemático flamenco-alemán. Mercator presentó esta
proyección en 1569 en su obra "Nova et Aucta Orbis Terrae Descriptio ad Usum
Navigantium Emendate Accommodata" (Una descripción del mundo nueva y
más completa, corregida para su uso por navegantes).
13
La proyección de Mercator fue diseñada originalmente para ayudar en la
navegación marítima, ya que representa líneas de rumbo recto como líneas
rectas en el mapa, facilitando el trazado de rutas en un mapa (en forma de líneas
rectas), lo que es especialmente útil para la navegación con brújula.
Sin embargo, esta proyección distorsiona el tamaño y forma de las áreas,
especialmente hacia los polos, lo que la convierte en una proyección inadecuada
para representar de manera precisa las áreas de continentes en latitudes altas y
bajas. A pesar de sus distorsiones, la proyección de Mercator sigue siendo
ampliamente utilizada y es conocida en todo el mundo.
Dado un punto con una latitud 𝜙 y una longitud 𝜆, la conversión a coordenadas
rectangulares en esta proyección se realiza de la siguiente manera:
14
proyección introduce distorsiones en las distancias y ángulos, especialmente en
latitudes altas.
Retomemos el problema que habíamos trabajado sobre la representación de los
tres aeropuertos de América del Sur.
15
𝜋 −0.209838
𝑦 ≈ 6371 × 𝑙𝑛 (𝑡𝑎𝑛 ( 4 − )) ≈ −1346.80 km
2
𝜙𝐵 − 𝜙𝐴 𝜆𝐵 − 𝜆𝐴
𝑑 = 2𝑟 × 𝑎𝑟𝑐𝑠𝑒𝑛 (√𝑠𝑒𝑛2 ( ) + 𝑐𝑜𝑠(𝜙𝐴) × cos(𝜙𝐵 ) × 𝑠𝑒𝑛2 ( ))
2 2
16
distancia ortodrómica utilizando la fórmula de Haversine, se tiene en cuenta la
curvatura de la Tierra y se calcula la distancia a lo largo de la superficie de la
esfera, ofreciendo resultados más precisos, especialmente para distancias
considerables.
Por otro lado, al optar por una proyección de Mercator y luego calcular la
distancia euclidiana en el plano cartesiano, se asume una representación plana
de la superficie esférica de la Tierra. Las proyecciones planas presentan
distorsiones, especialmente en regiones lejanas al ecuador, lo que puede
ocasionar diferencias significativas en las distancias calculadas.
Las discrepancias también guardan relación con la elección del radio de la Tierra
en la fórmula de Haversine y con la precisión numérica en los cálculos. Es
esencial utilizar el radio de la Tierra adecuado y mantener una precisión precisa
en los cálculos para obtener resultados más fiables y coherentes. En nuestro
caso, elegimos un radio medio de 6371 km para la Tierra.
Para recordar: Las diferencias se pueden atribuir a las características de las
proyecciones y fórmulas empleadas, así como a la precisión numérica en los
cálculos. La fórmula de Haversine proporciona una medida más precisa de la
distancia a lo largo de la superficie de la Tierra, mientras que la proyección de
Mercator y el cálculo euclidiano en el plano pueden introducir distorsiones que
afectan las diferencias observadas.
Al consultar Google Maps, observamos que la distancia entre el Aeropuerto
Internacional de Ezeiza y el Aeropuerto Internacional de Guarulhos es
aproximadamente 1724.43 km, una cifra cercana al cálculo que realizamos
mediante la fórmula de Haversine, que arrojó 1729.77 km. La discrepancia
fundamentalmente radica en la precisión con la que marcamos en el mapa los
dos puntos para calcular la distancia.
17
5.1.3 Análisis de rutas y trayectorias utilizando operaciones
matriciales
El análisis de rutas y trayectorias es fundamental en el campo del análisis y
gestión de datos geoespaciales, ya que permite entender y optimizar la movilidad
en diversos contextos, desde el transporte de bienes hasta la planificación
urbana. En esta sección, exploraremos cómo las operaciones matriciales, una
herramienta poderosa en álgebra lineal, pueden aplicarse con eficacia en este
análisis para obtener información valiosa y tomar decisiones fundamentadas.
Pasemos a la resolución de un problema que pondrá en juego los conceptos
matemáticos centrales de esta sección.
18
San Luis Villa Dolores Mina Clavero Villa Carlos Paz Córdoba
San Luis 0 212 259 369 402
Villa Dolores 212 0 45 154 188
Mina Clavero 259 45 0 112 145
Villa Carlos Paz 369 154 112 0 44
Córdoba 402 188 145 44 0
19
San Luis
0 Villa
1.2333Mercedes
2.7667 Río4.3334
Cuarto Río Tercero
5.2000 Córdoba
San Luis 0
1.2333 1h
0 14 min1.7834 2h 3.3667
46 min 4h 20 min
4.2834 5h 12 min
Villa Mercedes 𝑇𝐵 =1h 14
2.7667
min 1.78340 0 1h 1.7834
47 min 2.6000
3h 22 min 4h 17 min
Río Cuarto 4.3334
2h 46 min 3.3667
1h 47 min1.7834 00 1.4333
1h 47 min 2h 36 min
Río Tercero 5.2000
4h 20 min 4.2834
3h 22 min2.6000 1h0.78334
47 min 0 0 1h 26 min
Córdoba 5h 12 min 4h 17 min 2h 36 min 1h 26 min 0
Costos ponderados
Para tomar una decisión basada en criterios adicionales, como las
velocidades promedio o el tiempo, podemos utilizar una matriz de
costos ponderados. Esto implica asignar pesos a los diferentes
factores y combinarlos en una sola métrica para comparar las rutas. Aquí hay un
enfoque que podemos seguir:
Definir factores y asignar pesos: Identifica los factores que deseas considerar
además de la distancia. Por ejemplo, podríamos considerar la velocidad
promedio y el tiempo de viaje.
La asignación de pesos a los factores (distancia, velocidad promedio y tiempo)
en una matriz de costos ponderados depende de tus preferencias y prioridades
personales. No hay una regla fija para determinar los pesos, y la elección de
los pesos debe estar fundamentada en tus necesidades y objetivos específicos
para el viaje. Aquí te proporcionamos algunas consideraciones para asignar
pesos a estos factores:
Distancia (0.4): Si tu principal objetivo es minimizar la distancia
recorrida y prefieres la ruta más corta, asignar un peso relativamente
alto a la distancia tiene sentido. Una asignación de 0.4 indica que la
distancia es el factor más importante en tu decisión.
Tiempo (0.3): Si consideras que el tiempo es un recurso crítico y estás
dispuesto a comprometer un poco la distancia para ahorrar tiempo,
asignar un peso al tiempo puede ser apropiado. Esto es útil si deseas
llegar a tu destino lo más rápido posible.
Velocidad promedio (0.3): Si valoras la velocidad y prefieres rutas que
permitan un desplazamiento más rápido, puedes asignar un peso a la
velocidad promedio. Esto podría ser relevante si deseas minimizar el
tiempo en carretera.
20
La asignación de pesos no es estática y puede variar según tus circunstancias
y preferencias personales. Por ejemplo, si estás planificando un viaje de ocio, es
posible que desees priorizar la distancia y la escenografía, mientras que en un
viaje de negocios, el tiempo podría ser más importante.
Crear matrices de costo ponderado: Multiplica cada matriz de factor (distancia,
velocidad promedio, tiempo) por su peso correspondiente. Por ejemplo, para la
matriz ponderada para las diferentes rutas tendremos:
𝐶𝑃𝐴 = 0.4𝐷𝐴 + 0.3𝑇𝐴 + 0.3𝑉𝐴
𝐶𝑃𝐵 = 0.4𝐷𝐵 + 0.3𝑇𝐵 + 0.3𝑉𝐵
En un primer paso, introducimos estas matrices en una aplicación de software.
En este caso, utilizaremos GeoGebra como nuestra herramienta.
21
Nos enfrentamos a una pregunta natural: ¿Cómo tomamos una decisión ahora
que solo disponemos de una matriz de costos ponderados? Para comparar
estas matrices ponderadas y seleccionar la ruta óptima, llevamos a cabo el
cálculo del Costo Total Ponderado para cada ruta. Este proceso implica la suma
de todos los elementos de la matriz ponderada de cada ruta. Luego, procedemos
a la comparación de los costos totales ponderados de ambas rutas. La ruta con
el costo total ponderado más bajo se convierte en la elección preferida, ya que
representa la opción que mejor se alinea con los criterios y pesos que hemos
establecido previamente.
Si utilizamos el comando SUMA() de GeoGebra en cada matriz, obtendremos
una lista que refleja la suma de los elementos de cada fila. Luego, aplicamos
nuevamente el comando SUMA() de GeoGebra a esta lista, lo que nos
proporciona un valor equivalente a la suma de todos los elementos de la matriz.
23
El objetivo es determinar la ruta más eficiente para que el conductor de la flota
pueda visitar a cada cliente y regresar al punto de partida minimizando el
tiempo total de viaje. La empresa debe aprovechar al máximo sus recursos y
reducir los costos operativos.
24
manipular estas matrices de píxeles y realizar cálculos para analizar la estructura
y contenido de las imágenes.
Una vez que hemos representado una imagen como una matriz de píxeles,
podemos aplicar una amplia variedad de filtros y transformaciones a través
de operaciones matriciales. Esto incluye técnicas como suavizado, realce de
bordes, mejora del contraste y más. Al utilizar el álgebra lineal, podemos definir
matrices de filtro que actúan sobre la imagen original, lo que nos permite lograr
efectos deseados en la imagen procesada.
La convolución es una operación fundamental en el procesamiento de imágenes
que nos permite detectar bordes y características relevantes en una imagen.
Al aplicar núcleos de convolución a la matriz de píxeles, podemos resaltar
transiciones de intensidad, contornos y detalles en la imagen. Esta técnica es
ampliamente utilizada en la detección de características, como rostros u objetos,
y se basa en conceptos algebraicos que son esenciales en el análisis de
imágenes.
La mejora del contraste y el filtrado en imágenes es otro campo en el que el
álgebra lineal demuestra ser invaluable. Podemos diseñar matrices de filtrado
para realzar áreas de interés, eliminar ruido o mejorar la calidad visual de una
imagen. Estas técnicas permiten una manipulación precisa de la información de
la imagen, contribuyendo a un análisis de datos más efectivo.
En síntesis, el procesamiento de imágenes se basa en la representación de
imágenes como matrices de píxeles y el uso de operaciones matriciales para
aplicar filtros, transformaciones y detectar características. El álgebra lineal
proporciona la base teórica y práctica para estas aplicaciones, permitiendo a los
profesionales de análisis y gestión de datos explorar y analizar datos visuales de
manera efectiva.
En las siguientes secciones, profundizaremos en cada uno de estos conceptos,
brindando una comprensión completa del procesamiento de imágenes en el
contexto de nuestro curso.
25
representar negro y blanco. En esta representación, 0 se usa para el color negro
y 1 para el color blanco.
La elección entre 0-1 y 0-255 depende del contexto y los requisitos específicos
de la aplicación. Ambas representaciones son válidas y pueden ser utilizadas
según las necesidades de procesamiento de imágenes o visualización. La escala
de 0-255 se prefiere a menudo en aplicaciones de mayor precisión debido a su
mayor número de niveles de gris, lo que permite una representación más
detallada de las imágenes en blanco y negro.
26
Resolución: Para obtener el logo de la Universidad Nacional de San Luis,
exploraremos recursos disponibles en Internet y utilizaremos una aplicación
gratuita, en este caso, la aplicación DCODE. Esta herramienta nos permitirá
realizar la conversión de la imagen en un formato binario, que consiste en la
representación de la imagen mediante una secuencia de ceros y unos.
La dirección URL de la aplicación es https://www.dcode.fr/imagen-binario
27
Cuando convertimos una imagen a blanco y negro utilizando una codificación
binaria con 0 y 1, es importante comprender cómo se manejan los colores en
este proceso. En este método, se toma en cuenta la intensidad de luminancia
de cada píxel de la imagen original para decidir si se asigna el valor 0 (negro) o
1 (blanco) al píxel correspondiente en la versión en blanco y negro. Los colores
más oscuros, como el negro, se representan con 0, mientras que los colores más
claros, como el blanco, se representan con 1. Sin embargo, los colores
intermedios, como el amarillo o el celeste, pueden presentar un desafío en esta
conversión. Si un color no es ni completamente negro ni completamente blanco,
la decisión sobre si se le asigna 0 o 1 dependerá de un umbral o porcentaje
específico de intensidad de luminancia. Por ejemplo, si se establece un umbral
del 50%, los colores con una intensidad de luminancia por encima de ese umbral
se considerarán como blanco, mientras que los colores con una intensidad por
debajo de ese umbral se considerarán como negro.
Esta metodología simplifica el proceso de conversión y, en ocasiones, puede
resultar en una pérdida de información de color y matices, ya que los colores
cercanos al umbral se representan de manera uniforme en la imagen en blanco
y negro resultante. Por lo tanto, la elección del umbral es un aspecto
importante en la conversión de imágenes a blanco y negro, y puede variar
según los objetivos y requisitos específicos de la aplicación.
¿Cuál es el criterio utilizado para determinar si se asigna el color negro o
blanco en el caso en que una cuadrícula no esté completamente ocupada por
una imagen en colores, sino que contiene un porcentaje de ocupación?
El criterio para asignar un color (negro o blanco) a una cuadrícula que
no está completamente ocupada por una imagen en colores generalmente se
basa en el porcentaje de ocupación de esa cuadrícula. Es decir, se considera
cuánto de la cuadrícula está ocupado por la imagen en comparación con cuánto
está vacío. Si el porcentaje de ocupación supera un umbral predefinido, se
asigna un valor que representa el color negro, mientras que si el porcentaje de
ocupación está por debajo de ese umbral, se asigna un valor que representa el
color blanco.
El umbral específico puede variar según la aplicación y los requisitos. Por
28
ejemplo, si se establece un umbral del 50%, se considerará que una cuadrícula
está ocupada por la imagen si más del 50% de su área está cubierto por píxeles
de la imagen. En ese caso, se asignaría el valor que representa el color negro.
Si el porcentaje de ocupación es inferior al 50%, se asignaría el valor que
representa el color blanco.
La elección del umbral depende de la tolerancia deseada para definir qué se
considera como ocupación de la cuadrícula y qué se considera como vacío. En
la práctica, este umbral puede ajustarse según las necesidades de la aplicación
y la naturaleza de la imagen, permitiendo cierta flexibilidad en la conversión a
escala de blanco y negro.
En imágenes a color, se utilizan tres canales de color, y cada canal tiene su
propia matriz de intensidades. Para una imagen en color, generalmente se
utilizan tres canales de color (rojo, verde y azul) para representar la intensidad
de cada color en un píxel.
La clave para comprender esta representación radica en ver la imagen como una
matriz bidimensional de píxeles. En esta matriz, cada elemento representa un
píxel individual. Por ejemplo, si tenemos una imagen de 1000x1000 píxeles, esto
se traduce en una matriz de 1000 filas y 1000 columnas.
Para obtener resultados visualmente aceptables, es necesario (y casi suficiente)
proporcionar varias muestras (canales de color) para cada píxel, que se
interpretan como coordenadas en algún espacio de color. Dependiendo del uso,
una imagen a color se puede representar usando diferentes tipos de modelos,
como por ejemplo:
- [rojo, verde, azul] o RGB (por sus siglas en inglés)
- [cian, magenta, amarillo, negro] o CMYK (por sus siglas en inglés)
- [matiz, saturación, intensidad] o HSI (por sus siglas en inglés)
Por lo tanto, diremos que una imagen a color es una matriz 𝐴 ∈ 𝑅𝑚×𝑛×𝑐 , donde
𝑚 representa el largo de la imagen, 𝑛 el ancho de la imagen y 𝑐 son los canales:
rojo (R), verde (G) y azul (B). La imagen a color está formada por 3 matrices de
tamaño 𝑚 × 𝑛. Estas matrices son 𝐴𝑟 (canal rojo), 𝐴𝑔 (canal verde) y 𝐴𝑏 (canal
azul). Es decir, 𝐴 = {𝐴𝑟 , 𝐴𝑔 , 𝐴𝑏 }. Por consiguiente, el pixel 𝐴(𝑖, 𝑗, 𝑤) representa la
posición (𝑖, 𝑗) de la imagen en el canal 𝑤 .
29
La representación de imágenes como matrices de píxeles es fundamental
para aplicar conceptos de álgebra lineal en el procesamiento de imágenes.
Permite que cada píxel sea tratado como un elemento de una matriz, lo que a su
vez nos habilita para realizar cálculos y operaciones matriciales para analizar y
modificar la imagen.
Esta representación no solo se aplica a imágenes estáticas, sino que también se
extiende a secuencias de imágenes o video, donde cada fotograma se convierte
en una matriz individual en una secuencia. Entender cómo se representa una
imagen como una matriz de píxeles es el primer paso en el procesamiento de
imágenes y sienta las bases para técnicas posteriores como filtros,
transformaciones y análisis de características.
30
La matriz de convolución se la suele llamar kernel en el contexto del
procesamiento de imágenes y visión por computadora. La razón principal es
simplificar y abreviar la terminología. Aunque el término matriz de convolución
describe con precisión lo que es, kernel es una abreviatura comúnmente
aceptada que se ha vuelto estándar en la jerga técnica. Básicamente la elección
de la palabra kernel proviene de la idea de que esta matriz actúa como un núcleo
o un filtro que se aplica para procesar la imagen. El kernel define cómo se realiza
la operación de convolución y determina cómo se modifica la imagen original
para obtener la imagen procesada.
El realce de bordes es otra aplicación crucial en el procesamiento de imágenes.
Los bordes representan transiciones abruptas en la intensidad de la imagen y
son fundamentales para identificar características visuales en una imagen. Para
realzar los bordes, se utilizan núcleos de convolución que destacan las
diferencias de intensidad entre píxeles vecinos. Este proceso es especialmente
útil en aplicaciones como la detección de bordes de objetos en imágenes
médicas o la identificación de objetos en imágenes de visión por computadora.
Otro aspecto importante del procesamiento de imágenes es la mejora del
contraste y la calidad visual. Mediante operaciones matriciales, es posible
diseñar filtros que resalten áreas de interés, aclaren u oscurezcan regiones
específicas y ajusten el contraste global de la imagen. Estas técnicas permiten
una manipulación precisa de la información visual, lo que es esencial en
aplicaciones como la restauración de imágenes antiguas o la mejora de
imágenes médicas para diagnóstico.
¿Cómo se lleva a cabo la operación de convolución?
Cuando aplicamos la operación de convolución a una matriz de partida (de
orden 𝑚 × 𝑛) utilizando una matriz de convolución (de orden 𝑟 × 𝑟), seguimos los
siguientes pasos:
31
Coloca la matriz de convolución (kernel) de tamaño 𝑟 × 𝑟 en la posición
superior izquierda de la matriz de partida (la matriz más grande de
tamaño 𝑚𝑥𝑛). Esto alinea la esquina superior izquierda del kernel con
el primer píxel de la matriz de partida.
Realiza una multiplicación elemento por elemento entre los valores de
la matriz de partida cubiertos por el kernel y los valores del kernel.
Estos productos se suman para obtener un solo valor que representará
el resultado de la convolución para esa posición en la matriz de salida.
Mueve el kernel una posición a la derecha a lo largo de la fila superior
de la matriz de partida y repite el proceso de multiplicación y suma para
obtener un nuevo valor en la matriz de salida.
Continúa moviendo el kernel hacia la derecha a lo largo de la fila
superior de la matriz de partida hasta que hayas calculado los valores
para todas las posiciones en esa fila.
Luego, mueve el kernel una fila hacia abajo y comienza nuevamente
desde la izquierda de la matriz de partida, repitiendo el proceso para
calcular los valores en la fila siguiente de la matriz de salida.
Repite estos pasos hasta que hayas calculado los valores de convolución para
todas las posiciones en la matriz de salida, que tendrá un tamaño menor que la
matriz de partida debido a la aplicación de la convolución.
El resultado es una nueva matriz, que es la matriz de salida de la convolución.
Esta nueva matriz tendrá dimensiones (𝑚 − 𝑟 + 1) × (𝑛 − 𝑟 + 1), ya que la
aplicación del kernel reduce el tamaño de la matriz original.
Los criterios a tener en cuenta en este proceso incluyen la elección del tamaño
y la forma del kernel, así como la estrategia para tratar los bordes de la matriz
de partida (por ejemplo, mediante la extensión de ceros o el uso de valores
repetidos). La selección del kernel y la estrategia de manejo de bordes
dependerán de la tarea específica de procesamiento de imágenes que estés
realizando.
Las operaciones matriciales en el procesamiento de imágenes no solo son
aplicables a imágenes estáticas, sino también a secuencias de imágenes o
32
video. Esto es especialmente relevante en campos como la vigilancia por video,
el procesamiento de señales y la visión por computadora.
Es cierto que, en la operación de convolución, las matrices de entrada y el
kernel (matriz de convolución) suelen contener valores que son 0 y 1. Sin
embargo, los valores en la matriz de salida (resultado de la convolución) no
están limitados a 0 o 1, y pueden ser mayores o menores a 1. Esto se debe a
que la operación de convolución implica una combinación ponderada de los
valores de la matriz de entrada y el kernel en cada paso, y el resultado es una
suma ponderada de estos productos. Cada elemento en la matriz de salida es el
resultado de multiplicar el kernel por una región correspondiente de la matriz de
entrada y luego sumar estos productos. Por lo tanto, es posible que el resultado
de esta suma ponderada sea mayor o menor que 1, dependiendo de los valores
en el kernel y en la matriz de entrada.
El kernel actúa como un filtro que convoluciona con la matriz de entrada y,
en función de sus valores, puede amplificar o reducir ciertas características de la
imagen. Por lo tanto, es común que la matriz de salida contenga valores que no
están limitados a 0 o 1, y estos valores representarán las características de la
imagen procesada de manera más detallada y con mayor contraste.
La interpretación de una matriz de salida generada por una operación de
convolución depende de su contexto y del propósito de la operación. Aunque los
valores de la matriz de salida pueden variar y no están limitados a 0 y 1, aún se
pueden analizar y comprender de manera significativa. Aquí hay algunas
consideraciones para interpretar una matriz de salida de convolución:
Amplitud y signo: Los valores en la matriz de salida pueden ser
mayores o menores que 1. Un valor mayor puede indicar una
amplificación de la característica en comparación con la imagen de
entrada, mientras que un valor menor puede indicar una atenuación. El
signo puede indicar si la característica se oscurece (valor negativo) o
se aclara (valor positivo).
Características relevantes: Analiza los valores en la matriz de salida
para identificar las características relevantes resaltadas por el kernel.
Por ejemplo, en la detección de bordes, los valores altos pueden indicar
bordes nítidos.
Escalas de grises: Si estás procesando una imagen en escala de
grises, los valores en la matriz de salida representan diferentes niveles
de gris. Valores más bajos pueden corresponder a áreas más oscuras,
y valores más altos a áreas más claras.
Thresholding: Puedes aplicar un umbral (threshold) a la matriz de
salida para binarizarla nuevamente si deseas convertir los valores en
blanco y negro. Esto implica establecer un valor umbral y asignar un
color o nivel de gris a los valores por encima o por debajo de ese
umbral.
Visualización: La mejor manera de entender la interpretación de la
matriz de salida es visualizarla. Puedes mostrar la imagen de salida
generada por la convolución para apreciar las características realzadas
o atenuadas.
33
En el ejemplo, se utilizó la siguiente matriz de convolución:
1 0 1
𝐾 = [0 1 0]
1 0 1
Esta matriz es comúnmente conocida como un filtro de paso alto o kernel de
realce de bordes. Los valores 1 en esta matriz indican que se resaltarán los
cambios bruscos en la intensidad de los píxeles, como los bordes en una imagen,
mientras que los valores 0 indican que no se aplicará ningún cambio en esa
ubicación. Esto es, los valores 1 en el centro y alrededor del núcleo indican que
se da un mayor peso a los píxeles cercanos en la imagen de entrada. Significa,
además, que el filtro buscará diferencias abruptas en la intensidad de los píxeles
adyacentes, como las que se encuentran en los bordes de los objetos.
En tanto, los valores 0 en el centro y alrededor del núcleo indican que no se
consideran los cambios graduales en la intensidad de los píxeles en la operación
de convolución. Esto permite que el filtro se centre en resaltar los cambios
bruscos y detalles finos.
Los kernels en operaciones de convolución no necesariamente deben ser
matrices cuadradas. Pueden tener diferentes dimensiones, pero es común que
tengan dimensiones pequeñas y generalmente son matrices cuadradas o
rectangulares de tamaños impares para facilitar el cálculo.
Las dimensiones más comunes para kernels suelen ser 3 × 3 y 5 × 5, aunque
también se utilizan 7 × 7, 9 × 9 y otras dimensiones dependiendo de la aplicación
específica. Las matrices cuadradas (por ejemplo, 3 × 3 y 5 × 5) son las más
populares porque son fáciles de trabajar y proporcionan resultados efectivos en
el procesamiento de imágenes.
El tamaño del kernel tiene un impacto en el efecto que tiene en la imagen.
Kernels más pequeños tienden a realizar operaciones locales, mientras que
los kernels más grandes pueden capturar patrones y características más
grandes en la imagen. La elección del tamaño del kernel depende de la tarea
que se esté realizando y de los detalles que se deseen capturar o resaltar en la
imagen.
Veamos algunos ejemplos de lo que hacen los kernels.
Kernel de suavizado (Filtro promedio)
1/9 1/9 1/9
𝐾𝑆 = [1/9 1/9 1/9]
1/9 1/9 1/9
Este kernel se utiliza para suavizar una imagen. Cada píxel de la imagen de
salida es el promedio ponderado de los píxeles vecinos en la imagen de entrada.
Reduce el ruido y las pequeñas imperfecciones.
Kernel de detección de bordes (Filtro Sobel Horizontal)
−1 0 1
𝐾𝑆𝐻 = [−2 0 2]
−1 0 1
Este kernel detecta bordes horizontales en una imagen. Acentúa las diferencias
de intensidad entre píxeles vecinos en la dirección horizontal. Los valores
34
negativos representan bordes oscuros y los valores positivos, bordes claros.
Los filtros "Sobel" son operadores de convolución que se utilizan comúnmente
en el procesamiento de imágenes para resaltar bordes y cambios bruscos en la
intensidad de los píxeles en una imagen. Estos filtros llevan el nombre de sus
inventores, Irwin Sobel y Gary Feldman, quienes desarrollaron estos operadores
en la década de 1960.
Kernel de detección de bordes (Filtro Sobel Vertical)
−1 −2 −1
𝐾𝑆𝑉 [
= 0 0 0]
1 2 1
Este kernel detecta bordes verticales en una imagen. Acentúa las diferencias de
intensidad entre píxeles vecinos en la dirección vertical. Los valores negativos
representan bordes oscuros y los valores positivos, bordes claros.
35
A modo de síntesis: El uso de matrices y operaciones matriciales en
áreas como el procesamiento de imágenes y el análisis de datos de
movimiento plantea interesantes paralelismos y diferencias con las operaciones
matriciales en el álgebra lineal tradicional.
Por un lado, en el ámbito del procesamiento de imágenes, las matrices de
convolución se utilizan para aplicar filtros y transformaciones a una imagen.
Aunque visualmente puede parecer similar a la multiplicación de matrices, la
convolución es una operación específica que involucra la superposición de un
"kernel" o matriz de convolución en una matriz de imagen y la acumulación de
productos en puntos específicos. Esta técnica es fundamental para aplicar
efectos como el desenfoque, la detección de bordes y el realce de detalles en
las imágenes.
Si bien el uso de matrices y operaciones matriciales en campos como el
procesamiento de imágenes y el análisis de datos de movimiento comparte
algunos conceptos fundamentales con el álgebra lineal tradicional, también
introduce elementos específicos y técnicas adaptadas a sus aplicaciones
particulares. La reflexión sobre estas similitudes y diferencias puede enriquecer
nuestra comprensión de cómo las matemáticas son una herramienta poderosa y
versátil en una variedad de disciplinas.
36
5.3.1 Representación de datos de movimiento con matrices y
vectores
Imaginemos un escenario simple: un automóvil que se mueve a lo largo de una
carretera recta. Para describir su movimiento, necesitamos una manera de
representar su posición en cada instante de tiempo. Aquí es donde entran en
juego las matrices y vectores.
Cada punto en el espacio se puede representar mediante un vector
tridimensional. En el caso de un automóvil en una carretera recta, podríamos
utilizar un vector bidimensional, donde una componente representaría la posición
a lo largo de la carretera y la otra componente sería el tiempo. Al combinar estos
vectores a lo largo del tiempo, obtenemos una matriz que describe la trayectoria
del automóvil.
Este enfoque no se limita únicamente a vehículos en una carretera. Su
versatilidad le permite extenderse a objetos en movimiento en dos o tres
dimensiones, lo que resulta fundamental para representar una amplia variedad
de situaciones. A medida que avances en tu formación profesional, tendrás la
oportunidad de explorar con mayor profundidad estos conceptos en cursos
específicos dentro de la carrera. El análisis de datos de movimiento se vuelve
una herramienta valiosa en campos como la logística, el seguimiento de objetos,
la gestión de flotas, el análisis de tráfico, y muchas otras aplicaciones del mundo
real.
En nuestro caso, exploraremos cómo crear estas matrices y vectores para
describir trayectorias y cambios de posición en objetos en movimiento. También
examinaremos cómo estas representaciones matriciales y vectoriales se
extienden a casos más complejos, como el seguimiento de múltiples objetos o el
análisis de datos de movimiento en tiempo real.
Pasemos a la resolución de un problema básico que ponga en juego los
conceptos centrales de esta sección.
37
Distancias y tiempo promedio que demanda el recorrido:
A B C D E F
A 0 min 6 min 3 min 5 min 4 min 3 min
0 km 2.5 km 1.2 km 1.6 km 1.5 km 1.1 km
B 6 min 0 min 6 min 3 min 9 min 5 min
2 km 0 km 1.7 km 1 km 3.5 km 1.5 km
C 6 min 8 min 0 min 6 min 7 min 6 min
1.6 km 2.2 km 0 km 1.6 km 2.6 km 1.6 km
D 3 min 4 min 5 min 0 min 7 min 2 min
1 km 1.4 km 1.3 km 0 km 2.5 km 0.5 km
E 4 min 8 min 6 min 8 min 0 min 5 min
1.3 km 3.3 km 2.3 km 3 km 0 km 1.9 km
F 2 min 6 min 3 min 5 min 5 min 0 min
0.5 km 1.9 km 1.1 km 1.1 km 2 km 0 km
Coordenadas
Punto Hora de llegada Hora de salida
(Latitud, Longitud)
(-32.40677,-
Inicio 8 h 03’ 8 h 35’
63.24809)
(-32.40936,-
B 8 h 50’ 9 h 20’
63.23343)
(-32.39892,-
E 9 h 30’ 10 h 30’
63.25637)
(-32.40831,-
D 10 h 42’ 11 h 32’
63.24077)
(-32.41454,-
C 11 h 47’ 12 h 37’
63.24600)
(-32.40715,-
F 12 h 40’ 13 h 10’
63.24445)
(-32.40677,-
Fin 13 h 15’ 13 h 30’
63.24809)
Resolución: Para analizar la posibilidad de retrasos significativos, áreas de
congestión o problemas recurrentes en la entrega de productos a destinos
específicos, debemos comenzar examinando cuidadosamente los datos
históricos proporcionados. Estos datos comprenden dos conjuntos principales:
los datos promedio registrados para entregas en ubicaciones específicas y los
datos específicos de un conductor identificado con el número de registro interno
M2837.
Para dar inicio a este proceso analítico, es crucial identificar y definir las variables
clave en este problema. En este caso, estas variables incluyen los destinos, sus
coordenadas geográficas, el tiempo de llegada, el tiempo de salida y, también,
la velocidad promedio alcanzada por el conductor. La representación coherente
de estas variables se lleva a cabo mediante la creación de matrices de datos.
Por ejemplo, cada punto de entrega se convierte en una fila de una matriz, y los
38
momentos de tiempo de llegada y salida se organizan en columnas
correspondientes, lo que resulta en una matriz de datos de entregas.
Una vez que tengamos estas matrices, estamos en posición de emplear
operaciones matriciales para analizar los datos. Esto incluye cálculos de
diferencias de tiempo, distancias entre ubicaciones y la obtención de velocidades
promedio utilizando estas matrices. A través de estas operaciones, buscamos
patrones y tendencias que puedan indicar retrasos notables, áreas de congestión
o comportamientos recurrentes en las entregas. La identificación de valores
atípicos o áreas con tiempos de llegada inusualmente extensos puede servir
como punto de partida para investigaciones adicionales.
Finalmente, para lograr un análisis completo de los datos, debemos proporcionar
una explicación sólida de los resultados. En otras palabras, debemos responder
preguntas fundamentales, como: ¿Qué causó ciertos retrasos? ¿En qué áreas
de la ciudad se experimentan con mayor frecuencia problemas de congestión?
¿Se han identificado problemas recurrentes en destinos específicos?
Para llevar a cabo estos análisis, utilizamos las matrices T (que contiene los
tiempos en minutos necesarios para recorrer entre los puntos de entrega) y D
(que almacena las distancias en kilómetros entre estos puntos). Es importante
destacar que estos valores varían dependiendo de la dirección y sentido de las
calles de la ciudad, lo que contribuye a la complejidad del problema. También
tenemos la matriz V (que contiene la velocidad promedio en km/h) que
deducimos de las dos anteriores. A continuación, presentamos las tres matrices
mencionadas para una referencia visual más clara.
0 6 3 5 4 3
6 0 6 3 9 5
6 8 0 6 7 6
T=
3 4 5 0 7 2
4 8 6 8 0 5
2 6 3 5 5 0
0 25 24 19.2 22.5 22
20 0 17 20 23.33 18
16 16.5 0 16 22.86 16
V=
20 21 15.6 0 21.43 15
19.5 24.75 23 22.5 0 22.8
15 19 22 13.2 24 0
39
Este enfoque analítico no solo demuestra la aplicación efectiva de conceptos
matriciales para el análisis de datos de movimiento, especialmente en el contexto
de entregas y logística, sino que también subraya la utilidad y relevancia del
álgebra lineal en la resolución de problemas del mundo real. Además, invita a
discusiones sobre cómo las operaciones matriciales pueden optimizar procesos
logísticos y respaldar la toma de decisiones informadas.
Teniendo la matriz T o D podemos encontrar el camino mínimo que comienza en
el punto A, recorre todos los puntos y regresa a A. Existen algoritmos que se
pueden utilizar, como el algoritmo de TSP (Traveling Salesman Problem,
Problema del Viajante de Comercio). El TSP busca la ruta más corta que visita
cada punto exactamente una vez y luego regresa al punto de partida. De todos
modos, no es el objetivo de esta unidad abordar este tipo de algoritmo y se puede
recurrir a Inteligencia Artificial o utilizar software de optimización o programación
que esté diseñado para resolver problemas de TSP. Estas herramientas pueden
encontrar soluciones aproximadas o incluso óptimas para el problema.
Es importante destacar que encontrar la solución exacta para el TSP (visitar
todos los puntos exactamente una vez) en matrices más grandes puede ser un
problema computacionalmente costoso y requerir mucho tiempo de
procesamiento. Por lo tanto, en la práctica, es común utilizar algoritmos de
aproximación para obtener soluciones cercanas a la óptima. En nuestro caso,
podemos encontrar el camino mínimo que pasa por todos los puntos (A, B, C, D,
E, F) y regresa a A, calculando el recorrido más corto en base a la matriz de
distancias proporcionada. En nuestro caso, podríamos tener los siguientes
caminos:
A→C→F→D→B→E→A
Distancia a recorrer =1.2 km + 1.6 km + 1.1 km + 1.4 km + 3.5 km + 1.3 km
=10.1 km
A →C → D → F → B → E → A.
Distancia a recorrer = 1.2 km + 1.6 km + 0.5 km + 1.9 km + 3.5 km + 1.3 km =
10 km
Ahora procedamos a crear una tabla que contenga los datos del conductor
identificado con el número de registro interno M2837. Esto nos permitirá calcular
los tiempos de permanencia en cada ubicación, el tiempo de viaje y la velocidad
promedio durante cada tramo. Estos valores están presentados en la siguiente
tabla. Aunque podríamos representarlos como una matriz sin las referencias, en
este caso, las referencias son esenciales ya que indican la ruta elegida por el
conductor.
40
Tiempo Tiempo Velocidad
Hora de Hora de Permanencia
Punto de viaje de viaje promedio
llegada salida (minutos)
(horas) (minutos) (km/h)
Inicio 8.0500 8.5833 32
B 8.3333 9.3333 30 0.2500 15 10
E 9.5000 10.5000 60 0.1667 10 21
D 10.7000 11.5333 50 0.2000 12 15
C 11.7833 12.6167 50 0.2500 15 5.2
F 12.6667 13.1667 30 0.0500 3 32
Fin 13.2500 13.5000 15 0.0833 5 6
Podemos advertir que el recorrido realizado fue: : A → B → E → D → C → F →
A. Con la matriz de distancias anteriores podemos establecer la distancia total
recorrida. En este caso resulta:
Distancia recorrida = 2.5 km + 3.5 km + 3 km + 1.3 km + 1.6 km + 0.5 km = 12.4
km
Observamos que la distancia elegida es ligeramente superior a la mínima posible
en esta situación. Para analizar el desempeño del conductor con mayor detalle,
podemos crear una matriz de velocidades (VC). En este caso, consideraremos
únicamente un recorrido, ya que si tuviéramos múltiples trayectos, podríamos
calcular las velocidades promedio para cada uno de ellos. En la matriz de
velocidades, asignamos el valor 0 a los trayectos para los cuales no disponemos
de información, lo que significa que no podemos calcular la velocidad en esos
tramos.
0 10 0 0 0 0
0 0 0 0 21 0
0 0 0 0 0 32
VC =
0 0 5.2 0 0 0
0 0 0 15 0 0
6 0 0 0 0 0
Al comparar esta matriz de velocidades (VC) con los datos promedios de la
empresa, representados en la matriz V, es evidente que en la mayoría de los
trayectos, a excepción de uno, la velocidad del conductor ha sido
significativamente más lenta. Esta discrepancia plantea interrogantes sobre las
razones detrás de los registros de velocidad que hemos observado. Es esencial
investigar las causas subyacentes de esta diferencia para comprender por qué
el conductor se desvió de las velocidades promedio establecidas por la empresa
en la mayoría de los tramos del recorrido.
0 25 24 19.2 22.5 22
20 0 17 20 23.33 18
16 16.5 0 16 22.86 16
V=
20 21 15.6 0 21.43 15
19.5 24.75 23 22.5 0 22.8
15 19 22 13.2 24 0
Finalmente, nos queda por analizar los tiempos de permanencia en cada uno de
los lugares, comparándolos con los datos promedios que tiene registrado la
empresa, o datos esperados.
41
Tiempo promedio de Tiempo insumido por
Punto
trámite (minutos) el conductor (minutos)
A 40 32
B 35 30
C 50 50
D 45 50
E 50 60
F 30 30
42
Para analizar cambios en la posición, calculamos la diferencia entre dos
vectores de posición en momentos diferentes. Esta diferencia nos proporciona
un vector de desplazamiento que indica cómo ha cambiado la posición del objeto
en un intervalo de tiempo dado. La operación matricial esencial aquí es la resta
de vectores, que nos permite calcular estos desplazamientos.
Para estudiar trayectorias, consideramos una secuencia de vectores de
posición a lo largo del tiempo y conectamos estos puntos para formar una curva
o línea que describe la trayectoria del objeto. La representación matricial aquí se
basa en organizar estos vectores de posición en una matriz, donde cada fila
corresponde a un instante de tiempo y las columnas representan las
coordenadas 𝑥, y 𝑧. Esta matriz nos brinda una representación estructurada de
la trayectoria.
Las operaciones matriciales nos permiten analizar estas trayectorias y cambios
en la posición de varias maneras. Podemos calcular la velocidad promedio al
dividir el desplazamiento entre dos puntos en el tiempo por el tiempo
transcurrido. La velocidad se representa como un vector y, por lo tanto, también
se puede tratar con operaciones matriciales.
Además, la aceleración, que mide la tasa de cambio de la velocidad, también
se puede calcular y representar en forma matricial. Estas magnitudes son
esenciales en la descripción de movimientos y se aplican en diversos campos,
desde la física y la ingeniería hasta la geolocalización y la robótica.
El análisis de trayectorias y cambios en la posición mediante operaciones
matriciales nos brinda una forma estructurada y eficiente de abordar problemas
relacionados con el movimiento en el espacio. Al representar las trayectorias y
los cambios en la posición como matrices y vectores, aplicamos las
herramientas y conceptos fundamentales del álgebra lineal para comprender
mejor y analizar los movimientos de objetos en diferentes contextos. Estas
técnicas tienen aplicaciones en una amplia variedad de campos y proporcionan
una base sólida para el análisis de datos de movimiento. A medida que avances
en tu carrera de Licenciatura en Análisis y Gestión de Datos, profundizarás
en estas aplicaciones, lo que te permitirá abordar desafíos más complejos en
este emocionante campo.
43
como la detección de movimiento en sistemas de seguridad, el seguimiento de
vehículos en el transporte público y la realidad aumentada.
44
Esto es, el seguimiento de objetos y el análisis de movimientos son áreas
de aplicación clave para el álgebra lineal en la gestión de datos y la toma de
decisiones. Las operaciones matriciales y los conceptos matemáticos
subyacentes son fundamentales para procesar, analizar y comprender datos
de movimiento en tiempo real en una variedad de campos, desde la visión por
computadora y la geolocalización hasta la robótica y la animación. Estas
aplicaciones demuestran la versatilidad y la relevancia del álgebra lineal en la
resolución de problemas prácticos en la era de los datos y la tecnología.
En el contexto de la inteligencia artificial, cabe preguntarse: ¿Cuáles son los
beneficios y desafíos de aplicar técnicas de aprendizaje automático y análisis de
datos en el seguimiento de movimientos humanos en campos como la animación
por computadora y la fisioterapia? ¿De qué manera podría la inteligencia artificial
contribuir a una comprensión más profunda de la cinemática y la dinámica de los
movimientos humanos?
Final de la Unidad 5
45
TRABAJO PRÁCTICO N° 5
Problema 1: Considera los siguientes aeropuertos internacionales: el
Aeropuerto Internacional de Ezeiza en Buenos Aires, el Aeropuerto Internacional
Arturo Merino Benítez (conocido también como Aeropuerto Internacional de
Santiago o Aeropuerto de Pudahuel), y el Aeropuerto Internacional El Dorado,
que es el principal aeropuerto de Colombia. El desafío consiste en llevar a cabo
una proyección de Mercator utilizando las coordenadas de estos tres
aeropuertos. A continuación, crea una representación gráfica basada en esta
proyección y calcula las distancias entre los aeropuertos en el plano cartesiano
resultante.
Finalmente, compara los cálculos obtenidos con la distancia ortodrómica entre
los aeropuertos y proporciona una explicación detallada y fundamentada de tus
resultados. No dejes de llevar a cabo una comparación con las distancias
proporcionadas por Google Maps para validar y respaldar tus conclusiones.
Problema 2: Evalúa dos alternativas de trayecto para desplazarte desde la
ciudad de San Luis a la ciudad de Villa Mercedes. Utilizando una matriz de costos
ponderados que incluya factores como la distancia, el tiempo y la velocidad,
justifica cuál de las dos rutas resulta más conveniente. Además, contrasta tu
elección con la recomendación proporcionada por Google Maps para respaldar
tus conclusiones.
Problema 3: Imagina que estás de visita en la ciudad de San Luis, Argentina, y
deseas realizar un itinerario para explorar algunos destacados puntos turísticos,
entre los que se incluyen la Universidad Nacional de San Luis, el Estadio Héctor
Odicino-Pedro Benoza, Plaza Independencia, Parque de las Naciones y la
Iglesia Catedral de San Luis. Para simplificar la visualización, análisis y
comparación de distintas ubicaciones y rutas, crea una representación
cartográfica que muestre datos geoespaciales en un plano cartesiano.
Genera una matriz que incluya los tiempos estimados para completar el recorrido
entre estos puntos, ya sea en automóvil o a pie. Por último, recomienda un
itinerario específico y proporciona una justificación sólida para tu elección.
Problema 4: Transforma la imagen suministrada, que presenta dos números 5
en dos cuadrículas de 10x10, en una matriz de 10x10 en escala de blanco y
negro utilizando la escala estándar de 0-255. Además, configura un umbral del
50% para determinar si cada píxel debe ser representado en color blanco o
negro.
46
Problema 6: Supongamos que se te proporciona una matriz de entrada que
representa una imagen en escala de grises.
140 120 110 100 90 80 70
135 125 115 105 95 85 75
130 120 110 100 90 80 70
125 115 105 95 85 75 65
120 110 100 90 80 70 60
115 105 95 85 75 65 55
110 100 90 80 70 60 50
105 95 85 75 65 55 45
100 90 80 70 60 50 40
95 85 75 65 55 45 35
47
de planificar los circuitos de recorrido necesarios para llevar a cabo el trabajo
propuesto. Al comprender estas relaciones, podemos establecer trayectorias de
recorrido óptimas, optimizando la logística y asegurando la eficiencia en la
ejecución del estudio. En este sentido, establece y fundamenta un recorrido que
consideres óptimo, teniendo en cuenta que el punto de partida y llegada es la
Facultad de Ciencias Físicas, Matemáticas y Naturales de la UNSL.
Problema 8: Matías, un estudiante de la Licenciatura en Análisis y Gestión de
Datos de la UNSL realizó un recorrido, referido al estudio que se propone en el
Problema 7, utilizando un dispositivo GPS mientras se desplazaba en una
motocicleta. A continuación, se presentan las coordenadas geográficas (Latitud,
Longitud) y los horarios de llegada y salida en cada punto del recorrido:
Coordenadas
Punto Hora de llegada Hora de salida
(Latitud, Longitud)
(-32.29144,-
Inicio 9 h 01’ 9 h 17’
66.34014)
(-33.30637,-
A 9 h 30’ 9 h 47’
66.32249)
(-33.30143,-
B 9 h 55’ 10 h 30’
66.32876)
(-33.29591,-
C 10 h 35’ 11 h 00’
66.33547)
(-33.30324,-
D 11 h 07’ 11 h 30’
66.34012)
(-32.29144,-
Fin 11 h 40’ 12 h 00’
66.34014)
48
.
49