Caracterizacion Nubes
Caracterizacion Nubes
Caracterizacion Nubes
Machine Learning
Trabajo de Grado
Ingenierı́a Topográfica
Facultad de Ingenierı́a
Escuela de Ingenierı́a Civil y Geomática
Santiago de Cali
2020
Desarrollo de una herramienta para la detección de nubes precipitables
Learning
Dirigido por
Trabajo de Grado
Ingenierı́a Topográfica
Facultad de Ingenierı́a
Santiago de Cali
2020
II
III
Índice general
Acrónimos XII
1. Introducción 1
1.1. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1. Nubes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1.1. Clasificación . . . . . . . . . . . . . . . . . . . . . . . . . . 8
IV
ÍNDICE GENERAL
2.3.1.1. Hiperplanos . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.7. Sı́ntesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
V
ÍNDICE GENERAL
3.4. Sı́ntesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4. Resultados y Discusión 48
VI
ÍNDICE GENERAL
4.3.2.5. Visualización . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4. Sı́ntesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
VII
Índice de figuras
VIII
ÍNDICE DE FIGURAS
(C) y gamma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4-6. Gráfico de barras número de neuronas capa oculta, dropout, función de pérdida
vs precisión de validación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
IX
Índice de tablas
X
ÍNDICE DE TABLAS
XI
Acrónimos
CI Convective Initiation.
DT Decision Tree.
IR Infrarrojo.
XII
Acrónimos
ML Machine Learning.
RF Random Forest.
VC Coeficiente de Variación.
VIS Visible.
WV Vapor de Agua.
XIII
Resumen
seleccionar los mejores clasificadores entre los tres métodos. Los resultados ob-
Introducción
acuosas o sólidas, que tienen un papel fundamental en el ciclo del agua y en la estructura
de la distribución global de los recursos hı́dricos (OMM, 2017), son uno de los principales
precipitación se define como la cantidad de partı́culas acuosas en fase lı́quida o sólida, que
través de la liberación de calor latente y de una fuente de agua potable (Michaelides y cols.,
2009).
las masas nubosas precipitables y sus opuestas; por lo tanto, antes de estimar la cantidad de
lluvia que puede caer de una nube en particular, se debe asegurar que realmente posea esta
liza modelos para pronosticar el clima con información de radares en tierra y estaciones me-
1
Introducción
modelos tienen una mayor precisión, mientras que en la región Andina suelen ser inexactas
con diferencias hasta del 50 %, comparadas con las estaciones; estos errores son debidos a
las fuentes de información como el Sistema Global de Predicción (GFS), el modelo micro, la
Misión de Medición de Lluvias Tropicales (TRMM) y la mesoescala V5, que siendo productos
a nivel global cuentan con una baja resolución espacial de 5 a 25km 1 . Las nubes se encargan
del transporte del agua de la atmósfera a la superficie, por lo que la medición y predicción
predicción del clima, cálculo de vientos y para estimar de la precipitación. También permi-
precipitación Climate Hazards Group InfraRed Precipitation with Station data (CHIRPS), que
mundo con datos de precipitación satelital. Estos datos son obtenidos a partir del algoritmo
Cold Cloud Duration (duración de la nube frı́a) que consiste en la observación de las nubes
dentro de un umbral crı́tico donde éstas precipitan, pero para ello se debe tener en cuenta
que no todas son precipitables (Funk y cols., 2015). Lo anterior es importante para grupos
de investigación como la Unidad Nacional para la Gestión del Riesgo y Desastre (UNGRD),
el IDEAM, y el Ministerio de Medio Ambiente y Desarrollo Sostenible para llevar a cabo estu-
sis que consisten en una interpretación visual de las mismas, (Pyszczek y Snaider, 2017;
1
Información disponible en: https://www.elespectador.com/noticias/medio-ambiente/por-que-s
e-equivocan-los-satelites-con-los-pronosticos-de-lluvias-en-colombia-articulo-750407
2
1.1 Objetivos
Rodrı́guez y cols., 2014). Estas técnicas requieren de la experiencia de una persona para di-
ferenciar las tonalidades de grises y reconocer los diferentes géneros de nubes. Es por ello
que para realizar la clasificación, se han desarrollado una variedad de métodos para la ca-
radiativa y los métodos estadı́sticos, siendo estos últimos los más relevantes.
Dado lo anterior, el IDEAM asume que existe una relación directa entre la concentración
de nubes y la probabilidad de lluvia, por ello, los pronósticos terminan siendo imprecisos e
1.1. Objetivos
Objetivo General
Objetivos Especı́ficos
espacial.
bles.
3
1.2 Solución propuesta
este trabajo plantea una solución capaz de cargar la información multi-espectral de imágenes
el tipo de nube observable sea precipitable. La interfaz cuenta con módulos para la carga de
imágenes de la zona de estudio, los clasificadores diseñados con técnicas de ML, la visuali-
Este trabajo toma como fuente de verificación de los resultados los datos reportados por
tir de los registros en el tiempo entre el GOES-16 y las estaciones meteorológicas, se constru-
yen los patrones con caracterı́sticas que definen nubes precipitables, nubes no-precipitables
y cielo despejado. Este insumo junto con los algoritmos de ML como Random Forest (RF),
Support Vector Machine (SVM) y las Redes Neuronales Artificiales (RNA) tipo Feedforward,
lograron obtener resultados de 99.87 %, 99.97 % y 100 % respectivamente para los datos
empleados en imágenes satelitales, seguido del marco teórico que permite desarrollar es-
proyecto, En el capitulo 4 se muestran los resultados obtenidos aplicando las técnicas men-
4
Capı́tulo 2
En este capı́tulo se presenta una revisión bibliográfica (Sección 2.1) de los métodos más
GOES-16 como las diferentes resoluciones que ésta posee, su proceso de adquisición de da-
tos y la forma de acceder a dichos datos. En las Sección 2.3 se explica los conceptos básicos
hiper-parámetros para los diferentes algoritmos de clasificación (Sección 2.4). Para la defini-
ción del vector de caracterı́sticas que finalmente se convierte en el patrón de entrada se hace
Finalmente, en la Sección 2.6 se muestra el uso del Proceso Unificado Racional (RUP) como
5
2.1 Antecedentes
2.1. Antecedentes
y/o de hielo de diferentes dimensiones, que puede contener partı́culas no acuosas o partı́cu-
las sólidas como gases industriales, humo, polvo o cenizas volcánicas (Rochas, 1996). La
clasificación de éstas es esencial para realizar modelos numéricos de predicción del tiempo,
(Orun, 2000; Menzel, 2001; Szantai y cols., 2002; Manoj y cols., 2010) que se han venido
desarrollando desde el boom de la era de los satélites con el fin de comprender la dinámica
Conforme avanzan las nuevas tecnologı́as y a medida que aumenta la capacidad de los
telitales geoestacionarios, en tiempo casi real, es una forma óptima para evaluar el proceso
de Convective Initiation (CI) (Mecikalski y Bedka, 2006) generando una máscara de nubes ti-
po Cumulonimbus que, aparte de causar fuertes precipitaciones, son las causantes de las
tormentas eléctricas; para ello, se han utilizado técnicas de nefoanálisis (Rodrı́guez y cols.,
2014; Pyszczek y Snaider, 2017) que consisten en la interpretación visual de imágenes por
parte de un experto distinguiendo entre diferentes tonalidades de grises, hasta el uso de técni-
cas más avanzadas como aquellas basadas en aprendizaje automático (Cai y Wang, 2017;
Wohlfarth y cols., 2018; Jin y cols., 2019). Para la separación de coberturas se han imple-
cuales brindan excelentes resultados cuando se trata de datos unidimensionales; sin embar-
se presenta en los estudios de percepción remota, porque asumen una distribución de datos
6
2.1 Antecedentes
Las propiedades ópticas de las gotas de agua y las partı́culas de hielo que conforman
mayormente las nubes, generan una alta reflectividad en las imágenes en la región del es-
pectro visible, mientras que la reflectancia espectral empieza a disminuir a medida que au-
menta la longitud de onda (Bai, Li, Sun, Chen, y Li, 2016). Para una identificación correcta
tral y por ello se ha empleado información de texturas a partir de la GLCM (Arab y cols.,
2014; Taravat, Frate, y cols., 2015; Cheng y Yu, 2015; Bai y cols., 2016; Wang y cols., 2018;
Wu y Li, 2018) usando métodos de clasificación como: Decision Tree (DT), SVM, RF, y ar-
quitecturas de RNA como Convolutional Neural Network (CNN) y Multilayer Perceptron (MLP)
principalmente (Ramı́rez y Lizarazo, 2014; Taravat, Proud, y cols., 2015; Cai y Wang, 2017;
Bai y cols. (2016) emplean la información espectral de las bandas azul, verde, roja e
direcciones 0◦ , 45◦, 90◦ , 135◦ con el fin de evitar la varianza rotacional. Además, emplean
Wu y Li (2018) clasifican 3 clases de nubes en imágenes del Satelite Fengyun (FY-2) me-
diante SVM. Las entradas a este modelo corresponden al GLCM (contraste, correlación,
realizó mediante la matriz de confusión obteniendo una precisión del 93.33 %. Por otro lado,
Taravat, Proud, y cols. (2015) evalúan la detección de nubes en imágenes en tierra de vista
de cielo a partir de los métodos de clasificación SVM y MLP. Los hiper-parámetros fueron
optimizados por el método de búsqueda de cuadrı́cula (ver Sección 2.4). Este trabajo obtuvo
7
2.2 Marco teórico
2.2.1. Nubes
siones, (OMM, 2011, s.f.). Éstas se crean por la interacción de masas de aire cálido y frı́o
desplazadas por las corrientes de vientos, que contienen vapor de agua y cuando llegan
la atmósfera forma gotas y cristales de hielo que posteriormente se unen formando nubes.
Las nubes tienen un papel decisivo en las predicciones y los avisos meteorológicos, ya que
2.2.1.1. Clasificación
Las nubes se clasifican en 10 clases denominadas géneros, estas describen las carac-
terı́sticas principales de sus formas, además estas se subdividen en especies, que dependen
Hay variedades que definen las caracterı́sticas especiales de una nube como se observa en
la figura 2.1
Por otro lado, se distinguen regiones, divididas en tres niveles: nubes bajas, medias o
altas. Cada nivel está definido por un rango de altura que varı́a según la región del planeta
tabla 2.5
Los géneros de las nubes se suelen acomodar de acuerdo a la altura, en la que con mayor
8
2.2 Marco teórico
El GOES-16 tiene como principal objetivo estudiar las condiciones meteorológicas desde
la órbita geoestacionaria. El satélite posee seis instrumentos de medición entre ellos se en-
cuentra el Advanced Baseline Imager (ABI), que observa una porción del planeta en 16 ban-
das espectrales comprendidas entre el Visible (VIS) e Infrarrojo (IR). Además, para el estudio
9
2.2 Marco teórico
de las tormentas solares y el sol cuenta con el Space Environmental In - Situ Suite (SEISS),
el Extreme Ultraviolet X - Ray Irradiance Sensors (EXIS), el Solar Ultraviolet Imager (SUVI) y
GOES-16 observa continuamente los Estados Unidos, los océanos Pacı́fico y Atlántico,
a 35.800 km sobre el ecuador terrestre a una velocidad igual a la rotación del planeta, es
por ello que conserva una posición fija de observación (geoestacionario). La disponibilidad
de datos depende de la escala que se requiere. En la Tabla 2.4 se presentan las escalas
El instrumento a utilizar de GOES-16 es el sensor ABI que incluye dos canales VIS, cuatro
canales NIR y diez canales de IR comprendidas entre los 0.45 − 13.3 µm.
10
2.2 Marco teórico
ma en que el sensor escanea la superficie del planeta y obtiene las respuestas espectrales.
Los datos del sensor ABI están disponibles en tres tipos de procesamiento diferente que
11
2.3 Métodos de clasificación
Nivel Descripción
0 Datos del instrumento sin procesar a resolución completa.
1b Datos de nivel 0 con corrección radiométrica y geométrica
aplicada para producir parámetros en unidades fı́sicas.
2+ Variables ambientales derivadas con resolución espacial y
temporal comparable a nivel 1.
Fuente: adaptado de (NOAA y NASA, 2018).
correctamente los conjuntos de datos. Para separar estos datos existen diferentes hiperpla-
nos, por lo que el objetivo es encontrar un plano que tenga un margen máximo, es decir, la dis-
tancia máxima entre los puntos de datos de cada clase, al maximizar la distancia del margen
se proporciona un nivel de confianza mayor para los datos futuros (Hastie, Tibshirani, y Friedman,
2009).
2.3.1.1. Hiperplanos
Los hiperplanos son lı́mites de decisión que ayudan a clasificar los datos que corres-
ponden a las diferentes clases. La dimensión del hiperplano depende del número de carac-
12
2.3 Métodos de clasificación
Con esta función se busca maximizar el margen de separación entre los puntos que re-
presentan los datos y el hiperplano. Esta función de costo o pérdida esta dada por la ecuación
2.1.
0 si y · f (x) ≥ 1
c(x, y, f (x)) = (2.1)
1 − y · f (x) en otro caso
El costo es 0 si el valor predicho y el valor real son del mismo signo. Si no lo son, entonces
Ahora que se tiene la función de pérdida, se toman derivadas parciales con respecto a los
pesos para encontrar los gradientes. Usando los gradientes, se puede actualizar los pesos.
δ
λ|w|2 = 2λwk (2.3)
δwk
w = w − α(2λw) (2.4)
Cuando hay una clasificación errónea, es decir, el modelo comete un error en la predicción
13
2.3 Métodos de clasificación
de la clase de punto de datos, se incluye la pérdida junto con el parámetro de orden para
θk es el vector aleatorio del k-ésimo árbol, independiente de los últimos vectores aleatorios
θ1 , . . . , θk−1 . En la etapa de entrenamiento, el algoritmo intenta optimizar los parámetros de
las funciones de split a partir de las muestras de entrenamiento:
|Sij |
∑ H Sij
I j = H ( j) − (2.7)
i∈1,2 |S j |
Donde S representa el conjunto de muestras que hay en el nodo por dividir, Si son los dos
conjuntos que se crean de la división, la función mide la entropı́a del conjunto donde su
respuesta se obtiene a partir del resultado de una votación no ponderada de los distintos
Dado un conjunto de clasificadores h1 (x), h2 (x), ..., hk (x) y con el conjunto de entrena-
14
2.3 Métodos de clasificación
margen como:
∑K
K
k=1 I(hk (X ) = Y ) ∑k=1 I(hk (X ) = j)
mg(X ,Y ) = − max j6=Y (2.8)
K K
Nota:
incorrecta
ya que es la diferencia entre la proporción de árboles que aciertan y los que se equivocan.
Cuanto mayor sea el margen, mayor será el grado de confianza en la clasificación. El error de
Donde los subı́ndices X ,Y indican que probabilidad está sobre el espacio X ,Y . En RF,
15
2.3 Métodos de clasificación
Para evitar que muchos árboles tengan los mismos criterios de clasificación se inyecta
aleatoriedad esperando maximizar la independencia de los árboles con una precisión razo-
Donde mr(X ,Y ) es la función de margen; en el caso de dos clases que se expresa como:
1 T
∑ I(ct (x, θt ) = y) −→ Eθ[c(x, θ) = y]
T t=1
(2.13)
De esta forma, tal como lo presenta Medina y Ñique (2017), el margen es un valor definido
c ρ̄
2
= 2 (2.14)
s s
Donde c es la correlación del conjunto, entre menor sea c y mayor sea s la independencia
entre los distintos árboles del conjunto será mayor. La correlación de los árboles dentro del
16
2.3 Métodos de clasificación
ρ corresponde al coeficiente de correlación entre dos variables aleatorias y (θ, θ′ ) son inde-
pendientes con la misma distribución. En la figura 2-2 se presenta una representación gráfica
Según (Caicedo y López, 2009) las redes neuronales artificiales son un modelo matemáti-
co que simula el funcionamiento de una neurona biológica que depende de unos datos ini-
ciales para generar un proceso de aprendizaje adaptativo. El aprendizaje podrı́a en una RNA
17
2.3 Métodos de clasificación
Las redes neuronales tipo Feed-Foward han sido utilizadas para resolver problemas de
identificación o clasificación (Olabe, 2008; Taravat, Frate, y cols., 2015). Este tipo de RNA esta
compuesta principalmente de 3 secciones o capas: una capa de entrada, una capa oculta y
otra de salida. Estas capas se componen de neuronas que están interconectadas en una
relación 1 : n con la capa siguiente, donde la información fluye en un único sentido desde la
entrada hasta llegar a la salida. Toda red neuronal inicia usando sus pesos sinápticos w y
Ası́ se calcula la salida lineal de la red neuronal para la capa oculta, dando como resultado la
salida:
N
zhpk = ∑ whji xopi + θhj (2.17)
i
f (·), las cuales podrı́an ser tangente hiperbólica, sigmoide, u otras variaciones.
Después de calcular las salidas de la capa oculta, se debe calcular los valores netos de la
18
2.4 Optimización de hiperparámetros
Con ello se calcula los términos de error para las unidades de salida.
′
δopk = (d pk − yopk ) fko (aopk ) (2.21)
La ecuación se utiliza para actualizar los pesos sinápticos de las redes neuronales en
son diversos, pero su gran mayorı́a buscan encontrar un buen factor de aprendizaje tal que
garanticen una rápida convergencia que minimice la función de costo, que para este caso en
1 P M
Ep = ∑ ∑ (d pk − y pk )2
2 p=1
(2.22)
k=1
perparámetros,estos son parámetros ajustables que se eligen para entrenar un modelo y que
rigen el propio proceso de entrenamiento. Por ejemplo, para entrenar un RF se debe decidir
19
2.4 Optimización de hiperparámetros
Donde, f (x) representa una puntuación objetiva para minimizar, como una tasa de error o la
Raı́z del Error Cuadrátrico Medio (RMSE), evaluada sobre el conjunto de validación; x∗ es el
conjunto de hiperparámetros que produce el valor más bajo de la puntuación y x puede tomar
definido y evalua alguna métrica para conocer el rendimiento del modelo; este método
diante la selección de los siguientes valores de entrada en función de los que han
tros que producen el error más bajo en el conjunto de validación con la esperanza
busca explorar el espacio de los hiperparámetros y al mismo tiempo, limitar las eva-
(Dewancker, McCourt, y Clark, 2015). Las cinco partes del problema son:
20
2.5 Gray-Level Co-Occurrence Matrix - GLCM
Una función de selección para evaluar los hiperpámetros para el modelo sustituto.
sustituto.
Haralick, Shanmugam, y Dinstein (1973) publicaron un trabajo que ha tenido un gran im-
discriminar distintos tipos de terreno en imágenes satelitales. Esta es una matriz de frecuen-
cias con la que un pı́xel con un nivel de gris (i) aparece en una relación de espacio especı́fica
con otro pı́xel de nivel de gris (j). Las matrices de concurrencia son medidas de segundo
orden porque consideran parejas de pı́xeles vecinos, separados una distancia d y en un de-
terminado ángulo. Por tanto, las matrices de coocurrencia pueden revelar ciertas propiedades
n m 1, if I(p, q) = i and I(p + dx, q + dy) = j
P(dx,dy) P(i, j) = ∑ ∑ (2.24)
p=1 q=1 0, otherwise
Donde, P(dx,dy) P(i, j) es una matriz cuadrada, que representa la frecuencias relativas con las
que dos pixeles están separados por una distancia d = (dx, dy) en la imagen I, el primero
con tono gris i y el segundo pı́xel con tono gris j (Salhi y cols., 2018). Las caracterı́sticas
21
2.6 Rational Unified Process - RUP
Contraste
N−1 N−1
Contrast = ∑ ∑ (i − j)2G(i, j) (2.25)
i=0 j=0
Correlación
N−1 N−1
(G(i, j)(i × j) − (µx × µy ))
Correlation = ∑ ∑ σx σy
(2.26)
i=0 j=0
Energı́a
N−1 N−1
Energy = ∑ ∑ G(i, j)2 (2.27)
i=0 j=0
Entropı́a
N−1 N−1
Entropy = − ∑ ∑ G(i, j) loge(G(i, j)) (2.28)
i=0 j=0
Homogeneidad
N−1 N−1
G(i, j)
Homogeneity = ∑ ∑ 1+| i− j |
(2.29)
i=0 j=0
Media
Varianza
N−1 N−1 q q
Varianza = σ2 = ∑ Pi j (i − µi )2 ; σ2 = ∑ Pi j ( j − µ j )2 σi = σ2i ; σ j = σ2j (2.31)
i j=0 i j=0
22
2.7 Sı́ntesis
zar la producción de software de alta calidad que satisfaga las necesidades de sus usuarios
seleccionar los casos de usos que definen la arquitectura base del sistema y dan una solución
fase de transición se asegure que el proyecto está libre de errores y listo para usuario final.
2.7. Sı́ntesis
Este capı́tulo aborda los principales conceptos que definen los componentes de la meto-
dologı́a. Cada uno de los conceptos presentados, serán un insumo importante en la obtención
23
2.7 Sı́ntesis
24
Capı́tulo 3
Colombia
bles, orientado a cumplir los objetivos propuestos en este trabajo. En el diagrama de la figura
25
Determinación de nubes precipitables en Colombia
26
3.1 Zona de estudio
miento de los modelos ML (3.2.1) en esta se obtienen las dos datos tanto de entrenamiento
como de validación que serán usado en las diferentes técnicas de ML, La segunda parte con-
Python (3.3)
Colombia (ver Fig. 3-2) se localiza al noroeste del continente de América del Sur, este
Caribe y Óceano Pacı́fico (Guzmán, Ruiz, y Cadena, 2014). Debido a sus diferentes relieves,
27
3.1 Zona de estudio
cantidad de radiación solar, la orografı́a, la humedad atmosférica, entre otros, con temperatu-
ras desde bajo cero en las cumbres de las montañas de las diferetenes coordilleras y climas
calidos desde 35◦ en las costa, además de microclimas, como por ejemplo la Sierra Nevada
28
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
bles y no precipitables
ción de una base de registros de eventos de precipitación que posteriormente son usados
para descargar las imágenes. En la fase 2 (3.2.3), se procesaron las imágenes obtenidas
ras que son usados para crear una base de datos de entrenamiento. En la fase final (3.2.4)
Para el desarrollo del proyecto es necesario contar con algunas fuentes de información
medir precipitación y humedad relativa; estaciones climatológicas principales: que son aque-
tipo y altura de las nubes, estado del suelo, precipitación, temperatura del aire, humedad,
El segundo insumo son las imágenes satelitales del GOES-16 que se encuentran alma-
1
Información encontrada en http://dhime.ideam.gov.co/atencionciudadano/
29
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
cada 10 min, donde se tomaron registros entre el periodo comprendido del 3 de abril de 2019
hasta el 19 de diciembre del mismo año; esta fecha de inicio fue escogida conforme al satélite
imágenes del disco completo cada 10 minutos (NOAA y GOES-R, 2019). Por lo tanto, se ob-
tuvieron los registros de precipitación de las 52 estaciones seleccionadas con una resolución
datos a disposición se filtraron los registros inferiores a 1mm con el fin de eliminar posibles
registros con ruido o anomalı́as de las estaciones. La base de datos de los registros me-
crear, configurar y acceder a servicios de AWS. Conociendo las fechas y horas de los regis-
nombre de los productos del GOES-16 están estandarizados como se explica a continuación:
OR ABI-Lxx-CMIPF-MxCxx G16
1
Información obtenida de: http://home.chpc.utah.edu/˜u0553130/Brian Blaylock/cgi-bin/gene
ric AWS download.cgi?DATASET=noaa-goes16
30
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
El nombre de los archivos esta dado bajo este formato donde todos los productos inician
El tiempo está dado en U TC − 0; sin embargo, para nuestro caso el nombre se configura
de la siguiente manera:
Se usa el sensor ABI, con datos de procesamiento L2, además se emplea el producto
MCMIP que consiste en un compilado de las 16 bandas a una resolución espacial de 2 km,
este producto consiste de datos procesados a nivel de parámetros fı́sicos. Las bandas ABI
y aerosoles. El valor de las imágenes para las bandas emisivas, bandas ABI 7 a 16, es la
31
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
apoyan la caracterización de la superficie, las nubes, el vapor de agua, el ozono, las cenizas
6 con resolución temporal de 10 minutos, del satélite G16, donde, a partir de los registros de
precipitación, se configura el inicio de escaneo en el que se transforma del formato mes/año
a dı́a del año. Esto requiere que se configure el tiempo a U TC − 5 para que coincida con
los registros. Con todas estas rutinas desarrolladas se realizan las peticiones al servidor y se
Teniendo las imágenes ya disponibles de forma local se procederá a extraer las bandas
necesarias y almacenarlas en formato tif con un sistema de referencia EPSG : 4326, para
manipular los datos de manera sencilla. De las 16 bandas que nos proporciona este sensor
éstas se basó en las consultas bibliográficas como (Chen y cols., 1989; Tian y cols., 1999;
Berendes y cols., 2008; Taravat, Proud, y cols., 2015; Nurtanio y cols., 2019). Estas imáge-
nes son recortadas al cuadro de coordenada (−81.72W, −66.87W, −4.24S, 12.59N ) que co-
Con las imágenes ya depuradas se procede a calcular las texturas. Se aplica una conexión
Python-R donde se envı́an las imágenes desde Python para que se realice el respectivo
cálculo de las texturas en R. Las ecuaciones de las texturas se presentan en la tabla 3.2.
32
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
N−1 N−1
∑ Pi j /1 + (i − j)2 ∑ Pi j (−lnPi j )
i j=0 i j=0
Var Variación de
N−1 N−1 q q
GLCM σ2 = ∑ Pi j (i − µi)2 ; σ2 = ∑ Pi j ( j − µ j )2 σi = σ2i ; σ j = σ2j
i j=0 i j=0
33
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
ser usados para técnicas de clasificación. La GLCM y los cálculos de caracterı́sticas de textura
asociados son técnicas de análisis de imágenes. Dada una imagen compuesta de pı́xeles
cada uno con una intensidad (un nivel de gris especı́fico), la GLCM tabula la frecuencia con la
que coexisten diferentes combinaciones de niveles de gris en a una distancia en pı́xeles y una
dirección en una imagen. Los cálculos de las caracterı́sticas de textura usan el contenido del
GLCM para medir la variación en la intensidad (también conocida como textura de la imagen)
en el pı́xel de interés.
Las caracterı́sticas usadas para este estudio fueron: la homogeneidad, la media y varian-
za. Estas texturas fueron seleccionadas basados en las propuestas de diferentes autores ya
presentatividad que tenı́a en el fenómeno estudiado, que para este caso es la detección de
nubes precipitables. Debido a la resolución espacial de las imágenes se decidió calcular las
texturas a una distancia de una vecindad, es decir para conformar una ventana de cálculo de
Una vez calculada las texturas para todas las imágenes se extraen los datos de entre-
namiento, para ello se cuenta con los registros de precipitación y las coordenadas de cada
estación, además con la resolución temporal de ambas fuentes de información, ellas se su-
perponen para determinar si hubo o no precipitación en caso que el pı́xel muestre la presencia
de nube. Con lo anterior, se cuenta con una base de datos de entrenamiento que cuenta con
desnudo, se realiza una selección manual como se observa en las figuras 3-3 y 3-4 en las
que se enmascaran pequeñas regiones que permiten representar las diferentes clases.
Finalmente la base de datos de entrenamiento cuenta con 42.000 registros, cada clase
34
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
35
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
que sean óptimos para un problema. El ajuste del hiperparámetro depende tanto de la teorı́a
como de los resultados experimentales, por lo tanto, el mejor método para determinar la
de cada modelo. Con el fin de obtener modelos con buenos desempeños y una capacidad de
validación cruzada.
ejemplo, considere ajustar un modelo con K = 5. La primera iteración que entrenamos en los
segundo, tercero y quinto y se evalua en el cuarto. Se repite este procedimiento 3 veces más,
evaluando cada vez en un pliegue diferente. Al final, se promedia el rendimiento en cada uno
de los pliegues para obtener métricas de validación del modelo de la figura 3-5.
Para el ajuste de hiperparámetros, se realizan varias iteraciones, cada vez que se agrega
alguna configuración especı́fica del modelo. Estos modelos son comparados para seleccionar
2018a); es decir, para cada modelo de aprendizaje primero se realiza una optimización alea-
toria con el fin de explorar un mayor rango de combinaciones del espacio de hiperparámetros.
36
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
de espacios por cuadrı́cula, con el fin de encontrar las regiones más efectivas.
maxdepth= número máximo de niveles en cada árbol de decisión, rango (10, 110, 10)
1
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestCla
ssifier.html
37
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
bootstrap= método para muestrear puntos de datos (con o sin reemplazo) [True, False]
la optimización aleatoria.
Las SVM es una técnica que caracteriza la superficie de dos clases de distintos puntos de
entrada, esta está dada por los vectores de soporte que son capaces de crear una frontera
de decisión alrededor de los datos de aprendizaje, estos datos son mapeados por medio
de diferentes kernels. Este método busca la máxima separación entre las clases mediante
I Lineal
II Polinomial
III Sigmoide
IV RBF
C = [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 10, 100, 1000]
38
3.2 Metodológia para la identificación de nubes precipitables y no precipitables
Las RNA son un modelo que simula el funcionamiento de la neurona biológica que de-
pende de datos iniciales para generar un proceso adaptativo que posteriormente se emplea
clasificación de imágenes (Caicedo y López, 2009). En este proceso de utilizó una MLP de
de optimización: Adam y Adamdelta con un dropout que variaba de (0, 0.1 y 0.2). La función
turaleza del problema, y se usaron funciones de activación relu en la capa oculta y so f tmax
en la conexión de salida.
39
3.3 Desarrollo de la interfaz
través de una metodologı́a RUP, donde se presentan las diferentes etapas que tiene la herra-
forma detallada la manera para dar cumplimiento a los requerimientos funcionales y no fun-
40
3.3 Desarrollo de la interfaz
No Función Categoria
1.0 Cargar algoritmo de procesamiento de la imagen GOES E
(preprocesamiento)
2.0 Cargar la imagen GOES en formato .nc E
3.0 Cargar algoritmos de machine learning (SVM, RF, RNA) E
4.0 Ajustar la imagen a lo requerido por el algoritmo E
5.0 Procesar las bandas requeridas para la detección de nubes E
(Rojo, azul, infrarojo WV. . . )
6.0 Cargar la zona de interés en formato .shp O
7.0 Mostrar la zona elegida por el usuario O
8.0 Procesar las imágenes recortadas a la zona de estudio mediante E
el algoritmo elegido por el usuario
9.0 Mostrar el resultado obtenido en la identificación de nubes E
precipitables según las bandas elegidas por el usuario
10.0 Guardas los resultados obtenidos en formato TIF E
No Función Categoria
1.0 Se desarrollará en Python 3.7 E
2.0 Se presentará un documento del funcionamiento del sistema O
3.0 Se utilizarán framework como tensorflow y sklearn E
ejerce cada modulo que conforma el sistema y cómo uno depende del otro.
41
3.3 Desarrollo de la interfaz
método elegido.
Launcher GU I Principal , esta se encarga de que el usuario pueda intereactuar con cada
uno de los modulos, cargar imagen, cargar shape, seleccionar clasificador, seleccionar capas,
ta, donde cada uno de los procesos se empalman con los códigos observados en la figu-
42
3.3 Desarrollo de la interfaz
ejecutar el aplicativo, esta interfaz cuenta con seis módulos, tal como se observa en la figura
43
3.3 Desarrollo de la interfaz
2. Cargar shape: elemento para recortar la imagen y ser almacenada para uso posterior.
cesar su imagen. En éste se usarán las imágenes de acuerdo a los pasos realizados
4. Seleccionar las capas: permite al usuario seleccionar las capas para la visualización; si
clasificador. Con ello, verificar la comprensión visual de las diferentes capas en varios
tonos.
44
3.4 Sı́ntesis
cerrar la aplicación.
El procedimiento que realiza para hacer la clasificación se puede apreciar en la figura 3-9.
Como primer paso al abrir la interfaz, se debe buscar la imagen GOES-16, la cual debe tener
el nombre original para ser posteriormente cargada; al tenerla cargada esta internamente es
procesada para obtener cada una de las capas y las texturas. El siguiente módulo permite
al usuario, cargar un shape dentro del territorio colombiano; en este módulo la imagen es
recortada a la zona especificada por el shape. Una vez se obtiene la imagen deseada, se
procede a elegir los clasificadores, donde se desplega un menú y el usuario escoge entre ellos
entre las que están: nubes no-precipitables, nubes precipitables y sin nubes. Finalmente,
3.4. Sı́ntesis
tección de nubes precipitables en Colombia, presentando cada uno de los pasos realizados
para lograr una correcta detección. Se implementaron con software libre (Python, R-Studio,
PyQt) cada uno de los algoritmos de Machine Learning ası́ como los elementos de la interfaz
de usuario.
za) obteniendo que los resultados con esta cantidad de caracteristicas son deficientes, por
45
3.4 Sı́ntesis
46
3.4 Sı́ntesis
Al usar las estaciones meteorológicas, estas no son suficientes dado que la distribución
espacial de ellas no es apropiada para tener una cobertura total de Colombia, adicionamente,
mayores a 1mm.
La interfaz gráfica se diseña para facilitar al usuario la comprensión del efecto de los
funcionamiento.
47
Capı́tulo 4
Resultados y Discusión
para el método RF. En éste se realizó la optimización de los hiper-parámetros por el método
primero se realiza la optimización aleatoria con el fin de explorar un conjunto mayor de hiper-
48
4.1 Entrenamiento de los modelos de aprendizaje
se presentan en la figura 4-1 en color verde. La figura presenta uno de los hiper-parámetros
árboles con 99.87 % de precisión; además, se puede observar en la figura a la derecha cómo
aumenta el tiempo de entrenamiento a medida que aumenta el número de arboles. Los hiper-
n estimators 1200
min samples split 2
min samples leaf 1
max features auto
max depth 90
bootstrap False
49
4.1 Entrenamiento de los modelos de aprendizaje
una pequeña región. Esta región se central alrededor del mejor conjunto de hiperparámetros
1.300 árboles con una precisión de 99.88 %, esto representa una mejora de 0.1 % en nuestro
modelo final de RF. El mejor conjunto de hiperparámetros resultantes quedarı́a ası́:
bootstrap False
max depth 95
max features auto
min samples leaf 1
min samples split 2
n estimators 1.300
Del mejor modelo RF, la figura 4-2 muestra la importancia de las caracterı́sticas calcu-
llegar a dicho nodo. La probabilidad del nodo se puede calcular por el número de muestras
que llegan a este, dividido por el número total de muestras (Ronaghan, 2018).
Como se observa las bandas espectrales que más aportan a este problema en este caso
ha sido la banda azul y el infrarrojo térmico, junto con las texturas de varianza y media. Por
50
4.1 Entrenamiento de los modelos de aprendizaje
otro lado, se identifica que las texturas de homogeneidad son las que menos aportan. La lı́nea
una optimización aleatoria para definir un espacio de hiperparámetros alrededor del mejor
resultado anterior, junto con una optimización por cuadrı́cula buscando obtener el clasificador
kernel sigmoidal debido a que su desempeño es muy bajo frente a los demás. Se evidencia
que existe un mejor desempeño en el kernel rbf y polinomial de grado 6. También se hace
evidente que a medida que C aumenta, el desempeño de los modelos tiende a mejorar;
Kernel rbf
gamma 1
’C’ 100
51
4.1 Entrenamiento de los modelos de aprendizaje
gra con el kernel rbf, por lo que en la optimización por cuadrı́cula se trata de ajustar los hiper-
El mejor resultado con el modelo de aprendizaje SVM se obtiene con una configuración de
‘C′ : 340, ‘gamma′ : 0.8, ‘kernel ′ : ‘rb f ′ el cual muestra una precisión del 99.98 %, es decir,
una mejora del 0.01 % respecto al mejor modelo de la optimización aleatoria.
están agrupados los resultados inicialmente por el número de iteraciones y por el optimizador;
de aqui, se puede observar que a medida que aumenta el número de epocas o iteraciones,
52
4.1 Entrenamiento de los modelos de aprendizaje
Figura 4-4: Precisión de validación determinada a partir del parametro de regularización (C) y gamma.
aumenta la precisión de los modelos en los test de validación. Además, el optimizador Nadam
presenta mejores resultados a los demás optimizadores. El optimizador Nadam mantiene una
menor dispersión entre las épocas 20 − 60 respecto a los demás optimizadores, siendo ası́ el
En el boxplot de la derecha, se presentan los optimizadores junto con las funciones de ac-
tivación, demostrando el activador relu tiene un mejor desempeño sobre elu y se reafirma un
mejor desempeño en el optimizador Nadam. Aunque los resultados muestran mayor nivel de
correspondencia para Nadam, los otros algoritmos también presentaron buenos resultados.
53
4.2 Comparación de los clasificadores
oculta, dropout y función de costo respecto a la precisión de validación. Aunque existen pe-
queñas diferencias al verificar la sensibilidad de los modelos, el mejor modelo MLP obtiene
Los resultados anteriores indican que los clasificadores tienen la capacidad para separar
las diferentes clases de nubes; sin embargo, se verifica su desempeño usando una imagen
54
4.2 Comparación de los clasificadores
Figura 4-6: Gráfico de barras número de neuronas capa oculta, dropout, función de pérdida vs preci-
sión de validación.
En la Fig. 4-7 con fecha del 2019 − 10 − 25 a las 19 : 00 : 00U TC se observa el resulta-
do de la clasificación por los tres métodos empleados. La imagen (a) presenta la imagen en
color verdadero (RGB) del territorio colombiano; la imagen (b) presenta la clasificación rea-
lizada por el método de RNA con una MLP, donde se muestra la clasificación de las nubes
sentan en color azul claro, las nubes precipitables en azul oscuro y la ausencia no presenta
alguna máscara sobre la imagen original. Para la MLP se observa que el clasificador identifica
parte del territorio como nubes, donde la mayoria corresponden a nubes no-precipitables. El
La imagen (c) presenta un resultado con el método SVM, en el se identifican las nubes
más densas en comparación con el resultado obtenido con MLP. Además, se observa que las
nubes precipitables son en proporción similares entre las escenas (b) y (c). Para el método
de RF se muestra que el método clasifica solamente las nubes más densas que se pueden
percibir de la imagen original (a); en comparación con los métodos anteriores, RF es el que
55
4.2 Comparación de los clasificadores
56
4.3 Desarrollo de la interfaz
tiene una menor clasificación de nubes que sean poco densas, pero, identifica las mismas
nubes precipitables de los dos métodos anteriores, variando sólo en algunos pı́xeles que no
En cuanto a los cuerpos de agua observados en cada una de las imágenes, se puede ob-
servar que en la clasificación por el métodos de MLP presenta falencias en esta identificación,
ya que no los diferencian de las nubes. En cuanto a los métodos de RF y SVM diferencian
más estos cuerpos con pequeños errores en pı́xeles. Se considera que el método más pre-
ciso es SVM debido a que identifica las nubes tanto precipitables, como las que no lo son e
Al ejecutar el aplicativo, se abre la ventana princial la cual tiene las siguientes funcionali-
ejecuta la aplicación. La imagen debe ser cargada con el nombre original en formato
.nc. En cuyo caso, donde la imagen no posea su nombre original, saldrá una alerta
3.2.1, donde el proceso que realiza intermamente el cual consiste en: seleccionar las
57
4.3 Desarrollo de la interfaz
vector de caracterı́sticas.
en el ordenador el archivo en formato shape o kml, para que la imagen sea recortada
mentados para detectar las nubes precipitables de sus opuestas. En ella encontramos
la elección del método que se quiere utilizar, para ello, se cargan los archivos de la
pliegan los métodos para la clasificación. Para efectos de este trabajo se encuentran
quieren visualizar. Aquı́, se puede elegir mostrar las nubes precipitables, las que no lo
58
4.3 Desarrollo de la interfaz
para ser observadas en color verdadero, encima de esta imagen, donde existen nubes
falso color: para nubes precipitables (azul oscuro), para nubes no-precipitables (azul
claro) y para ausencia de nubes (sin color), donde solo se verá alterada la capa que el
usuario ha elegido.
módulo permite elegir las capas de la clasificación que serán almacenadas. Se encuen-
Las pruebas de integración tienen el objetivo de evaluar por conjunto las funcionalidades
del sistema. Estas pruebas se encuentran separadas según lo expuesto en los requerimientos
funcionales. Para la exposición de cada prueba se utiliza una tabla estructurada de acuerdo
59
4.3 Desarrollo de la interfaz
Datos necesarios para la prueba: datos necesarios para la prueba del sistema.
probar que el usuario pueda buscar y cargar la imagen en el formato .nc. Esta prueba y sus
(2) pueda buscar la imagen en el formato nc. Al cargar la imagen, la herramienta crea una
carpera temporal donde se irán almacenando todos los procesos de la interfaz. La carpeta
temporal es un contenedor con las bandas utilizadas y una carpeta con el nombre texturas, tal
como se observa en la captura (3). Este proceso evidencia el cumplimiento del requerimiento
planteado en la prueba.
60
4.3 Desarrollo de la interfaz
Resultado obtenido
61
4.3 Desarrollo de la interfaz
probar que el usuario pueda buscar y cargar el shape en el formato .shp. Esta prueba y sus
realizado para la búsqueda y carga del shape y los resultados obtenidos. En la captura (1) el
usuario busca que el shape se abra en una ventana emergente dentro del equipo en un archi-
vo de extensión .shp. Posteriormente, en la captura (2) se carga la imagen lo cual hará que
se cree una carpeta nueva llamada recorte, donde se almacenan las imágenes recortadas en
orientada a comprobar que el usuario pueda seleccionar y clasificar la imagen. Esta prueba
para la carga y selección de los clasificadores y los resultados obtenidos en ella. En la captura
(1) se observa la carpeta “clasificadores” donde esta cada uno de los métodos de clasificación
empleados en este trabajo, los clasificadores en esta carpeta serán los que se visualicen
clasificador entre los que se encuentran RF, SVM, y RNA. Posteriormente en la captura (3) se
observa una carpeta donde la clasificación es almacenada para ser mostrada posteriormente
62
4.3 Desarrollo de la interfaz
Resultado obtenido
63
4.3 Desarrollo de la interfaz
Resultado obtenido
64
4.3 Desarrollo de la interfaz
probar que el usuario pueda seleccionar las capas que se verán en la visualización. En este
caso se puede seleccionar las nubes no-precipitables, nubes precipitables o no nube (ausen-
cia de nubes). Es posible seleccionar todas las capas, ası́ como no seleccionarlas.
Como se observa en la tabla 4.4, en la captura (1) se muestra la selección de las ca-
4.3.2.5. Visualización
tinada a comprobar que el usuario pueda observar la clasificación obtenida por el método
elegido, adicionalmente, que observe las capas elegidas en el paso anterior en este caso
eligiendo entre nube, nube precipitable o no nube, como se muestra en la tabla 4.5
temporal, de esta forma en la captura (2) se muestra como se visualiza dependiendo del
clasificador seleccionado.
generado en la clasificación de acuerdo a las capas elegidas por el usuario, las pruebas y
65
4.3 Desarrollo de la interfaz
Resultado obtenido
66
4.3 Desarrollo de la interfaz
Resultado obtenido
67
4.3 Desarrollo de la interfaz
Requerimientos:
1. Permitir exportar la clasificación en la ruta elegida por el usuario
Resultado obtenido
decide la ruta donde desee guardar el archivo, en esta se abre una ventana emergente para
que el localice donde sera guardado el archivo en formato .tif, en la caputra (2) se obser-
va en la carpeta que se elija como queda guardado el archivo. Este proceso evidencia el
68
4.4 Sı́ntesis
4.4. Sı́ntesis
En este capı́tulo se mostraron los resultados de cada uno de los procesos realizados.
Estas pruebas y resultados fueron mostrados a través de tablas, imágenes y gráficas, donde
estaciones con datos de precipitación que contengan una resolución temporal de 10minutos,
dado que las imágenes del satélite GOES − 16 nos proporciona esa temporalidad, además,
aunque el trabajo se realizó de forma local, se presenta un volumen de datos grande, lo que
hace que el procesamiento sea largo, debido a que se deben realizar varios procesos como lo
son, la descargar las imágenes, el filtrado los datos y el cálculo de los diferentes procesos ex-
puestos en el capı́tulo de metodologı́a. Sin embargo, como se trabaja por medido de códigos
y los procesos son repetitivos, estos se automatizan para hacer más fácil el procesamiento
plieron satisfactoriamente cada uno de los procesos. Las pruebas de integración realizadas
confirman el cumplimiento de cada uno de los módulos como lo es: la carga de la imagen,
la carga del shape, la clasificación, la selección de capas las a visualizar, la visualización del
proceso de clasificación y el poder guardar la imagen clasificada de acuerdo con las capas
visualizadas.
69
Capı́tulo 5
5.1. Conclusiones
Para la caracterización de las nubes de manera remota es necesario identificar las re-
giones del espectro en donde sus propiedades se destacan, ası́ como estudiar su compor-
roja(0.64µm) e infrarrojo cercano (0.86µm) permiten discriminar entre suelo y nubes por su
alta reflectividad; la región del infrarrojo comprendida entre longitudes de onda de 6.2µm has-
capa de humedad (lower, mid, upper); y el infrarrojo térmico (10.3µm) determina la temperatu-
ra de brillo en función de la radiación absorbida y emitida por parte de las nubes. Se concluye
entonces que transformar las caracterı́sticas distintivas de los rangos de los espectros ayudan
a detectar, con los patrones de textura como la homogeneidad, la varianza y la media, con
70
5.1 Conclusiones
dad tal como fue desarrollado en esta investigación. Los 3 métodos seleccionados requirieron
Todos los clasificadores usaron el mismo conjunto de datos, el cual dividió en dos grupos:
las 3 clases definidas: nubes precipitables, nubes no-precipitables y suelo. Para cada modelo
Soporte Vectorial se destacó el hiper-parámetro kernel, donde se encontró que el tipo rbf
Random Forest, las bandas azul y tir, en combinación con las texturas media y varianza son
Finalizando con los clasificadores, para determinar la precisión de cada uno de los méto-
dos, se realiza el proceso de validación con el 40 % de los registros, comparando las salidas
de los modelos con las salidas reales. Los resultados demuestran que los métodos son efica-
ces a la hora de detectar las nubes, pero presenta una capacidad pobre a la hora de clasificar
los cuerpos de agua, además, entre los métodos usados no existen diferencias significativas
ya que sus porcentajes de precisión fueron 99.87 %, 99.97 % y el 100 % para Random Forest,
71
5.2 Trabajos futuros
del conjunto de bandas de las imágenes GOES-16 para determinar la precisión de cada uno
del satélite GOES-16 funciona a través de una interfaz gráfica de fácil uso, donde el usuario
puede elegir entre cada uno de los métodos propuestos. Además, brinda al usuario de forma
Esta herramienta proporciona ciertas ventajas como lo son: el fácil uso, la clasificación de
nubes por tres métodos diferentes los cuales son efectivos y la obtención de resultados de
ası́ la correcta ejecución de cada uno de los requerimientos que tiene la herramienta para la
Finalmente, se concluye que esta herramienta demuestra ser de gran utilidad para la
de clasificación automaticos.
Realizar la herramienta para diferentes partes del mundo, teniendo en cuenta que el
trabajo realizado se hizo solo para el territorio Colombiano, debido a las diferentes
72
5.2 Trabajos futuros
teléfono inteligente.
sualizar los resultados sin que existan estos errores entre los distintos elementos que
componen la imagen.
73
5.2 Trabajos futuros
Anexos
Anexo A
Anexo B
presente trabajo, se crea un repositorio GitHub el cual se puede acceder mediante la url: h
me.md en el que se especifica los recursos necesarios para hacer uso de la misma.
74
Referencias
Referencias
Arab, D., Ameur, S., y Ameur, Z. (2014, Nov). Cloud classification using local multiresolu-
Bai, T., Li, D., Sun, K., Chen, Y., y Li, W. (2016). Cloud detection for high-resolution satellite
imagery using machine learning and multi-feature fusion. Remote Sensing, 8(9). Des-
Belgiu, M., y Drăguţ, L. (2016). Random forest in remote sensing: A review of applications
and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, 114,
Convective cloud identification and classification in daytime satellite imagery using stan-
Cai, K., y Wang, H. (2017, Nov). Cloud classification of satellite image based on convolutional
neural networks. En 2017 8th ieee international conference on software engineering and
Caicedo, E. F., y López, J. A. (2009). Una aproximación práctica a las redes neuronales
Chen, D. W., Sengupta, S. K., y Welch, R. M. (1989, oct). Cloud field classification based
upon high spatial resolution textural features: 2. simplified vector approaches. Jour-
jd094id12p14749
75
Referencias
Cheng, H.-Y., y Yu, C.-C. (2015). Block-based cloud classification with statistical features
1173–1182.
Dewancker, I., McCourt, M., y Clark, S. (2015). Bayesian optimization primer (Inf. Téc.).
(2015). The climate hazards infrared precipitation with stations - A new environmental
Society.
Guzmán, D., Ruiz, J., y Cadena, M. (2014). Regionalización de colombia según la estaciona-
Haralick, R. M., Shanmugam, K., y Dinstein, I. (1973). Textural features for image classifica-
Hastie, T., Tibshirani, R., y Friedman, J. (2009). The elements of statistical learning. Springer
New York.
Hidalgo, S. (2014). Random forests para detección de fraude en medios de pago. Departa-
Jin, W., Gong, F., Tang, B., y Wang, S. (2019). Cloud types identification for meteorological
satellite image using multiple sparse representation classifiers via decision fusion. IEEE
Access, 7 , 8675–8688.
al-explanation-of-bayesian-model-based-hyperparameter-optimization-f
76
Referencias
or-machine-learning-b8172278050f
Koehrsen, W. (2018b). Hyperparameter tuning the random forest in python. Descarga-
do de https://towardsdatascience.com/hyperparameter-tuning-the-random
-forest-in-python-using-scikit-learn-28d2aa77dd74
Kruchten, P. (2004). The rational unified process: an introduction. Addison-Wesley Professio-
nal.
Liu, K., Shi, W., y Zhang, H. (2011). A fuzzy topology-based maximum likelihood classification.
Manoj, S. O., Kavitha, V., y Arul, J. S. (2010). Recognising the cloud type and estimation of
evolution of moving cumulus in daytime goes imagery. Monthly Weather Review , 134(1),
49-78.
Medina, R. F., y Ñique, C. I. (2017). Bosques aleatorios como extensión de los árboles de
Menzel, W. P. (2001). Cloud tracking with satellite imagery: From the pioneering work of ted
fujita to the present. Bulletin of the American Meteorological Society , 82(1), 33–47.
Michaelides, S., Levizzani, V., Anagnostou, E., Bauer, P., Kasparis, T., y Lane, J. (2009, dec).
NOAA, y GOES-R. (2019). Advanced baseline imager scan mode information. Descargado
de https://www.goes-r.gov/users/abiScanModeInfo.html#scanMode6A
gov/ground/overview.html
Nurtanio, I., Zainuddin, Z., y Setiadi, B. H. (2019, dec). Cloud classification based on ima-
ges texture features. IOP Conference Series: Materials Science and Engineering, 676,
77
Referencias
Ingenieros, Ed.).
.int/es
OMM. (2017). Dı́a meteorológico mundial 2017 — organización meteorológica mundial. Des-
al-2017
Orun, A. (2000). A comparative study of meteosat, ECMWF, and radiosonde wind vectors at
Pabón, J., Zea, J., León, G., Hurtado, G., González, C., y Montealegre, J. (2001). El me-
chitecture design in the RUP, MSF, MBASE and RUP-SOA methodologies: A conceptual
Rodrı́guez, R. J., Montilla, Y., Méndez, Y., y Palma, W. (2014). Alternativas pedagogicas
78
Referencias
Ronaghan, S. (2018). The mathematics of decision trees, random forest and feature
.com/the-mathematics-of-decision-trees-random-forest-and-feature-imp
ortance-in-scikit-learn-and-spark-f2861df67e3
Salhi, K., Jaara, E. M., Alaoui, M. T., y Alaoui, Y. T. (2018). GPU implementation of haralick
Szantai, A., Desalmand, F., y Desbois, M. (2002). A method for the construction of cloud
23(8), 1699–1732.
Tapakis, R., y Charalambides, A. G. (2013). Equipment and methodologies for cloud detection
Taravat, A., Frate, F. D., Cornaro, C., y Vergari, S. (2015). Neural networks and support
Taravat, A., Proud, S., Peronaci, S., Frate, F. D., y Oppelt, N. (2015). Multilayer perceptron
neural networks model for meteosat second generation SEVIRI daytime cloud masking.
Tian, B., Shaikh, M., Azimi-Sadjadi, M., Haar, T., y Reinke, D. (1999). A study of cloud classi-
fication with neural networks using spectral and textural features. IEEE Transactions on
Tsonis, A. A. (1988). Single thresholding and rain area delineation from satellite imagery.
Wang, Y., Shi, C., Wang, C., y Xiao, B. (2018). Ground-based cloud classification by learning
Wohlfarth, K., Schroer, C., Klab, M., Hakenes, S., Venhaus, M., Kauffmann, S., . . . Wohler, C.
79
Referencias
(2018). Dense cloud classification on multispectral satellite imagery. En 2018 10th IAPR
Wu, D., y Li, B. (2018). Cloud feature extraction and classification of meteorological sate-
llite cloud imagery. En 2018 international conference on sensor networks and signal
80