Universidad del Cauca
Facultad de Ingenierı́a Electrónica y
Telecomunicaciones
Ingenierı́a en Automática Industrial
Seminario de Investigación
Ing. Diego Guzman
Presentado por:
Darwin Felipe Parra
Alejandro Valencia.
Modelo predictivo machine learning aplicado al análisis de datos
climáticos en Colombia implementando electrónica de bajo costo.
AnteProyecto de Grado
Junio de 2019
Tabla de Contenido
1. Planteamiento del problema y pregunta de investigación 3
2. Estado del Arte 5
2
1. Planteamiento del problema y pregunta de investi-
gación
Una de las grandes preocupaciones que se genera en Colombia es la influencia que tiene el
cambio climático y el aumento desmedido de gases contaminantes que afecta potencialmente
a paı́ses en vı́a de desarrollo y en el caso de Colombia a gran parte del sector económico
especialmente al agrı́cola el cual representa el 2.2 % del PIB y que se ha visto afectado drásti-
camente por la ocurrencia de variaciones climáticas y especialmente el fenómeno del niño
afectando el desarrollo de los cultivos y aumentando el riesgo de una catástrofe que genere
una pérdida total del producto y el terreno [1], el Cambio climático es una realidad que define
un cambio en las condiciones medias o en la variabilidad del clima, atribuido directa o in-
directamente a actividades humanas (cambios antropogénicos persistentes en la composición
de la atmósfera mundial o en el uso de las tierras), y que se evidencia en la variabilidad
natural del clima, lo cual podemos observar al realizar comparaciones en diferentes periodos
de tiempo [2, 3] , esta serie de cambios y efectos a ocasionado daños directos en la salud
especialmente por la reducción de los recursos hı́dricos y la perdida de la calidad del agua
potable además de las persistentes sequias y el incremento progresivo de la frecuencia de
fenómenos meteorológicos [2] para esto la sociedad necesita la información e instrumentación
precisa para actuar frente a estos cambios.
En el transcurso de los últimos años se ha cruzado la frontera desde la ciencia básica y la
tecnologı́a hasta la investigación del impacto del cambio climático, al apostarle a las nue-
vas tendencias tecnológicas que surgen, y hacer de ellas una herramienta que aporte hacer
más sustentable el planeta y los desafı́os actuales, se tiene presente como una alternativa de
solución a estos desafı́os, la Inteligencia artificial y al unir conceptos como la predicción de
sucesos fı́sicos con la tecnologı́a en mención obtenemos los nuevos modelos de control machine
learning o aprendizaje automático que junto a algoritmos matemáticos se puede evaluar y
comparar con sistemas expertos capaces de predecir los cambios climáticos en función a una
base de datos existente y completada lo cual hace a partir de las mediciones de humedad,
presión y temperatura [4]
Para realizar la medición de estas variables en cuestión se hace necesario buscar soluciones
que sean efectivas y de un bajo costo; en este caso se propone utilizar sensores de medición
multivariable y electrónica básica, que se puedan integrar en un solo dispositivo como sen-
sores de presión atmosférica, temperatura y humedad relativa, que permitan alta precisión,
bajo consumo energético y un formato ultra compacto. Por otro lado, el proceso de inte-
gración de modelos predictivos en los diferentes dispositivos tiende a desarrollarse desde un
ordenador de esta manera pensando en economı́a y eficacia existen tarjetas compactas como
la raspberry pi es un dispositivo útil en el desarrollo de proyectos enfocado en aprendizaje
automático basado en redes neuronales [4].
3
Y es ası́ que realizando un análisis detallado de los resultados obtenidos mediante un modelo
predictivo machine learning en conjunto a dispositivos electrónicos de bajo costo y compa-
rando los resultados entregados por los diferentes organismos encargados de realizar análisis
estadı́stico de datos climáticos en el Departamento y el paı́s podemos establecer la siguiente
pregunta de investigación: ¿ verificar el desempeño de un modelo predictivo machine lear-
ning para el pronóstico del tiempo en el Departamento del Cauca, indicando ventajas y/o
desventajas frente a la pronosticación convencional?
4
2. Estado del Arte
Nacimiento del Machine Learning.
El Machine Learning (ML), conocido en español como aprendizaje automático o aprendizaje
de máquina, nació como una idea ambiciosa de la Inteligencia Artificial (IA) en la década de
los 60. Para ser más exactos, fue una subdisciplina de la IA, producto de las ciencias de la
computación y las neurociencias. [5]
Lo que esta rama pretendı́a estudiar era el reconocimiento de patrones (en los procesos de in-
genierı́a, matemáticas, computación, etc.) y el aprendizaje por parte de las computadoras. En
los albores de la IA, los investigadores estaban ávidos por encontrar una forma en la cual las
computadoras pudieran aprender únicamente basándose en datos [6].El primer acercamien-
to hacia esta tecnologı́a se dio con matemático y cientı́fico de la computación Alan Turing
(1912-1954) cuando publica un artı́culo titulado “Computing Machenery and intellegence ”
donde plantea lo que actualmente se conoce como test de Turing la cual es una prueba de la
habilidad de una máquina para exhibir un comportamiento inteligente similar, o distinguible
del de un ser humano [7]
El ML un campo de las ciencias de la computación que, de acuerdo a Arthur Samuel en 1959,
le da a las computadoras la habilidad de aprender sin ser explı́citamente programadas [8].
Basicamente es la idea de que existen algoritmos que pueden darte hallazgos o conclusiones
relevantes obtenidas de un conjunto de datos, sin que el ser humano tenga que escribir
instrucciones o códigos para esto. Por su parte un algoritmo no es otra cosa que una secuencia
o serie de instrucciones, que representan la solución a un determinado problema [9, 10]
El propósito del machine learning es que las personas y las máquinas trabajen de la mano,
al éstas ser capaces de aprender como un humano lo harı́a. Precisamente esto es lo que hacen
los algoritmos, permiten que las máquinas ejecuten tareas, tanto generales como especı́fi-
cas,actualmente con el ML pueden hacer cosas tan complejas como predicciones de tráfico
en intersecciones muy transitadas, detectar cáncer, mapear sitios para generar proyectos de
construcción en tiempo real, e incluso, definir la compatibilidad entre dos personas [5, 11].
¿ Cómo funciona?
En la informática clásica, el único modo de conseguir que un sistema informático hiciera algo
era escribiendo un algoritmo que definiera el contexto y detalles de cada acción.
En cambio, los algoritmos que se usan en el desarrollo del Machine Learning realizan
buena parte de estas acciones por su cuenta. Obtienen sus propios cálculos según los datos
que se recopilan en el sistema, y cuantos más datos obtienen, mejores y más precisas serán
las acciones resultantes.
Las computadoras se programan a sı́ mismas, hasta cierto punto, usando dichos algorit-
mos. Estos funcionan como ingenieros que pueden diseñar nuevas respuestas informáticas,
como respuesta a la información que se les suministra a través de su interfaz u otros medios.
5
Todo nuevo dato se convierte en un nuevo algoritmo, y a más datos, mayor complejidad y
efectividad de cálculo puede proporcionar el sistema informático. [12, 13]
La clave de la capacidad de un sistema de Aprendizaje Automático se encuentra en
la construcción y adaptación de los árboles de decisiones en base a los datos previamente
conocidos por el sistema.
Pero también influye la aplicación de fórmulas heurı́sticas en los nodos que forman el
árbol, para el que se elabora un sistema de inferencias.
El sistema de Machine Learning necesita contar con un volumen de datos de relevancia
para poder suministrar respuestas realmente válidas. El mı́nimo que se recomienda es de 6
entradas de datos reales para cada respuesta nueva diseñada, y esto debe repetirse para cada
variable que conforman el sistema de trabajo del sistema. [14]
¿cómo es posible esto?
Haciendo que repliquen las facultades cognitivas del ser humano, formando modelos que
“generalicen” la información que se les presenta para realizar sus predicciones. Y el ingrediente
clave en toda esta cuestión son los datos.
En realidad, el origen y el formato de los datos no es tan relevante, dado que el machine
learning es capaz de asimilar una amplia gama de éstos, lo que se conoce como big data, pero
éste no los percibe como datos, sino como una enorme lista de ejemplos prácticos.
Podrı́amos decir que sus algoritmos se dividen principalmente en tres grandes categorı́as:
supervised learning (aprendizaje supervisado), unsupervised learning (aprendizaje no super-
visado) y reinforcement learning (aprendizaje por refuerzo) y cada uno de ellos presenta sus
diferencias entre si [13, 15]
Tipos de machine learning
Supervised learning Depende de datos previamente etiquetados, como podrı́a ser el que una
computadora logré distinguir imágenes de coches, de las de aviones. Para esto, lo normal es
que estas etiquetas o rótulos sean colocadas por seres humanos para asegurar la efectividad
y calidad de los datos.
En otras palabras, son problemas que ya hemos resuelto, pero que seguirán surgiendo en
un futuro. La idea es que las computadoras aprendan de una multitud de ejemplos, y a partir
de ahı́ puedan hacer el resto de cálculos necesarios para que nosotros no tengamos que volver
a ingresar ninguna información.
Ejemplos: reconocimiento de voz, detección de spam, reconocimiento de escritura, entre
otros.
Unsupervised learning En esta categorı́a lo que sucede es que al algoritmo se le despoja de
cualquier etiqueta, de modo que no cuenta con ninguna indicación previa. En cambio, se le
provee de una enorme cantidad de datos con las caracterı́sticas propias de un objeto (aspectos
o partes que conforman a un avión o a un coche, por ej.), para que pueda determinar qué es,
a partir de la información recopilada.
6
Ejemplos: detectar morfologı́a en oraciones, clasificar información, etc.
Reinforcement learning En este caso particular, la base del aprendizaje es el refuerzo. La
máquina es capaz de aprender con base a pruebas y errores en un número de diversas situa-
ciones.
Aunque conoce los resultados desde el principio, no sabe cuáles son las mejores decisiones
para llegar a obtenerlos. Lo que sucede es que el algoritmo progresivamente va asociando los
patrones de éxito, para repetirlos una y otra vez hasta perfeccionarlos y volverse infalible.
Ejemplos: navegación de un vehı́culo en automático, toma de decisiones, etc.
Existen otros enfoques más complejos para tareas más especı́ficas, pero no vale la pena
ahondar en éstos. De momento no queremos complicar las cosas. De cualquier forma, si estu-
vieras interesado en conocer más acerca de éstos, puedes ver algunos ejemplos más concretos
aquı́. [12, 13]
¿Cuáles son sus perspectivas y aplicaciones actuales?
Una vez que compruebas lo fácil y práctico que resulta aplicar las técnicas de machine lear-
ning a problemas que creı́as serı́an imposibles, es cuando empiezas a creer que podrı́a resolver
prácticamente cualquier problema(siempre y cuando existan suficientes datos).
Para el consumidor moderno, el machine learning es un facilitador clave de muchas de sus
tareas cotidianas. Desde servicios de traducción, a predicciones climáticas, hasta adivinar lo
que los usuarios quieren con base a sus actividades recientes; las prestaciones que ofrece son
incomparables.
En lo que respecta a los negocios, muchas compañı́as han empezado a incorporar esta
tecnologı́a a sus sistemas operativos, con grandes expectativas de mejorar y automatizar sus
procesos [12].
¿exactamente a qué áreas puede aplicarse este tipo de tecnologı́as?
Dado que el machine learning es un sistema basado en el procesamiento y análisis de datos que
son traducidos a hallazgos, se puede aplicar a cualquier campo que cuente con bases de datos
lo suficientemente grandes. De momento, algunos de sus usos más populares y desarrollados
son:
Clasificación de secuencias de DNA
Predicciones económicas y fluctuaciones en el mercado bursátil.
Mapeos y modelados 3D.
Detección de fraudes.
Diagnósticos médicos.
Buscadores en Internet.
Sistemas de reconocimiento de voz.
7
Optimización e implementación de campañas digitales publicitarias.
Un ejemplo del ultimo caso son los AMaaS (Audience Management as a Service) que aplica
Inteligencia Artificial y Machine Learning a la publicidad digital para encontrar la mejor
audiencia o grupo demográfico para cualquier anuncio. Maneja de forma automática los pre-
supuestos alrededor de 20 públicos distintos por anuncio, dentro de diversas plataformas
(Google AdWords, Facebook e Instagram), optimizándolos varias veces al dı́a. [16]
El futuro del machine learning para los negocios.
Aunque ya se ha visto lo que la IA es capaz de aportar a nuestras actividades del dı́a a dı́a,
¿cómo podrı́a esto beneficiar el mundo de los negocios? Bueno, puesto que las conversacio-
nes y comentarios de un sinfı́n de consumidores digitales -cuyo número dı́a con dı́a sigue
incrementando- le ofrecen a este tipo de tecnologı́as una cantidad de información abrumado-
ra, éstas continuamente obtienen conocimientos nuevos y detectan tendencias más rápido de
lo que cualquier humano podrı́a hacerlo. [11, 12]
Si bien es cierto que esta enorme cantidad de datos la volverá mucho más eficiente,
requerirá necesariamente de mucho talento humano para perfeccionarse, ya que finalmente
las computadoras no tienen un dominio tan elevado del lenguaje aplicado al razonamiento.
O lo que es, no son precisamente hábiles para determinar contextos.
Lo que significa que para que el machine learning se desarrolle en estas áreas, los expertos
en cada campo de trabajo tendrán que tomarse el tiempo para entrenar a las máquinas e
irlas incorporando paulatinamente a cada uno de los procesos que deseen afinar. [11, 12]
8
Referencias
[1] M. Fernández, “Efectos del cambio climático en la producción y rendimiento de cul-
tivos por sectores: evaluación del riesgo agroclimático por sectores,” Recuperado de:
http://www. ideam. gov. co/documents/21, vol. 21, p. 21138, 2013.
[2] J. A. Berruezo and J. D. Jiménez, “Cambio climático y salud,” Revista de Salud Am-
biental, vol. 16, no. 2, pp. 181–182, 2016.
[3] A. Yábar Starling, “Cambio climático: Planteamiento y análisis desde una perspectiva
multidisciplinar,” Encuentros multidisciplinares, 2005.
[4] M. J. Rodrı́guez González, “Raspberry pi como plataforma de algoritmos de machine
learning: reconocimiento de imágenes y datos financieros en streaming,” 2018.
[5] C. Sammut and G. I. Webb, Encyclopedia of machine learning. Springer Science &
Business Media, 2011.
[6] A. P. Saygin, I. Cicekli, and V. Akman, “Turing Test: 50 Years Later,” Minds and
Machines, vol. 10, pp. 463–518, Nov 2000.
[7] J. H. Moor, “An analysis of the turing test,” Philosophical Studies, vol. 30, no. 4, pp. 249–
257, 1976.
[8] A. L. Samuel, “Some studies in machine learning using the game of checkers. ii—recent
progress,” IBM Journal of research and development, vol. 11, no. 6, pp. 601–617, 1967.
[9] D. Michie, D. J. Spiegelhalter, C. Taylor, et al., “Machine learning,” Neural and Statis-
tical Classification, vol. 13, 1994.
[10] K. Rasouli, W. W. Hsieh, and A. J. Cannon, “Daily streamflow forecasting by machine
learning methods with weather and climate inputs,” J. Hydrol., vol. 414-415, pp. 284–
293, Jan 2012.
[11] F. Malvicino and G. Yoguel, “Big data. avances recientes a nivel internacional y pers-
pectivas para el desarrollo local,” Documento de Trabajo. Centro Interdisciplinario de
Estudios en Ciencia Tecnologı́a e Innovación (CIECTI-MinCyT). Buenos Aires, 2014.
[12] E. Siegel, Predictive analytics: The power to predict who will click, buy, lie, or die. John
Wiley & Sons, 2013.
[13] S. Shalev-Shwartz and S. Ben-David, Understanding machine learning: From theory to
algorithms. Cambridge university press, 2014.
9
[14] K. P. Murphy, “Machine learning: A probabilistic perspective (adaptive computation
and machine learning series),” 2018.
[15] T. Mitchell, B. Buchanan, G. DeJong, T. Dietterich, P. Rosenbloom, and A. Waibel,
“Machine learning,” Annual review of computer science, vol. 4, no. 1, pp. 417–433, 1990.
[16] F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel,
P. Prettenhofer, R. Weiss, V. Dubourg, et al., “Scikit-learn: Machine learning in python,”
Journal of machine learning research, vol. 12, no. Oct, pp. 2825–2830, 2011.
10