Vision Artificial
Vision Artificial
(1)
Donde c es la velocidad de la luz que es una constante que vale 2.998x10
8
m/s. La energa de
varios componentes del espectro electromagntico estn dados por la expresin:
E=h.v (2)
Donde h es la constante de Planck. Las unidades de la longitud de onda son metros con los prefijos
micro y nano. Estos son los que se usan con frecuencia.
Fig. 9. Representacin grafica de una longitud de onda [4]
22
23
CAPITULO 2
ETAPAS DE LA VISION ARTIFICIAL
2.1 INTRODUCCION
Dentro de un sistema de visin artificial se pueden implementar varias tcnicas. Una de ellas es el
procesamiento de imgenes en donde se incluyen las etapas de captura, codificacin de imgenes
y transformacin. Otro aspecto que tambin se considera en un sistema de visin artificial es el
reconocimiento de formas, tcnica que incluye metodologas de modelado geomtrico.
Por otro lado, el sistema de implementacin juega un papel muy importante en el desarrollo de
cualquier sistema, ya que si cualquiera de las etapas falla, el resultado no ser el esperado y el
proceso resultara errneo.
2.2 ADQUISICIN DE IMGENES
Los tipos de imgenes en las cuales estamos centrados en este estudio son generados por la
combinacin de una fuente de iluminacin y reflexin o absorcin de energa de la fuente de los
elementos de la escena que ser capturada. Nos centraremos en la iluminacin y la escena para
resaltar que estos aspectos son muy importantes y por qu se deben de tomar en cuenta. Por
ejemplo, la iluminacin puede ser originada de una fuente de energa electromagntica tal como
un radar, infrarrojo, o energa de rayos X.
De forma similar, los elementos de la escena pueden ser objetos familiares, pero estos fcilmente
pueden ser molculas, rocas sepultadas o un cerebro humano.
2.2.1 USANDO ARRAYS
Varios dispositivos electromagnticos y ultrasnicos vienen dados en formato de arrays. Esto
tambin es predominante en las cmaras digitales. Un tipo sensor para estas cmaras en un array
CCD
5
, el cual puede ser construido con un rango amplio de propiedades de sensado y puede ser
empaquetado en conjuntos de arrays de 4000X4000 elementos y hasta mas
6
.
La principal manera en la cual estos sensores son usados se puede apreciar en la figura 10. Aqu se
puede observar la energa de una fuente de iluminacin siendo reflejada de una escena de un
elemento. La primera funcin dada por un sistema de captura es recolectar la energa que ingresa
y enfocarla en un plano donde se encuentra la imagen. Si la iluminacin es luz la terminacin
frontal del sistema de imagen es un lente que proyecta la vista de la escena en el plano que se
enfoc.
5
Dispositivo de carga acoplada que tienen varios capacitores capaces de transferir energa
6
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
24
Fig. 10. Ejemplo de un proceso de adquisicin de imgenes mediante arrays [4]
2.2.2 USANDO SENSORES
En la figura 10 se puede observar los componentes de un sensor simpe. Quizs el tipo ms familiar
de este sensor es un fotodiodo, el cual es construido de un material de silicn y cuya forma de
onda de voltaje de salida es proporcional a la luz. El uso de un filtro enfrente del sensor mejora la
selectividad.
Fig. 11. Sensor simple [4]
Por otro lado, para generar una imagen en 2D usando un simple sensor, tiene que existir un
desplazamiento relativo de las dos direcciones tanto x como en y entre el sensor y el rea de la
imagen. En la figura 11 se puede observar un arreglo usado en un escaneo de alta precisin donde
la pelcula negativa es montada sobre un tambor que tiene un mecanismo de desplazamiento que
hace que esta se mueva en una dimensin.
Fig 12. Combinacin de un sensor simple con movimiento para generar una imagen 2D.[4]
25
2.2.3 SISTEMA DE ILUMINACION
La iluminacin de la escena juega un papel muy importante para el desarrollo de un sistema visual.
Antes de pasar mucho tiempo en implementar algoritmos complejos para arreglar este problema,
es mejor prestar atencin en implementar un sistema de iluminacin adecuado para que cuando
se capturen las imgenes sea de manera correcta. Este sistema de iluminacin ser adecuado si se
puede corregir el problema mediante software, debido a que la velocidad de procesamiento ser
mayor con algoritmos ms sencillos
7
.
2.2.3.1 SISTEMA DE RETROALIMENTACION DIFUSA
Este tipo de iluminacin es muy adecuada para el reconocimiento o medida de una pieza solo si se
necesita el contorno y es posible apoyar dicho objeto sobre una superficie transparente.
La retroalimentacin difusa consiste en iluminar contra la cmara, dejando el objeto entre la
cmara y la lmpara. Esta tcnica entrega imgenes con un alto contraste entre el objeto y el
fondo, dando como resultado una segmentacin fcil ya que se puede aplicar una binarizacin.
Dentro de las principales aplicaciones en donde tiene un adecuado comportamiento esta tcnica
de iluminacin son para medir el grado de porosidad de ciertas sustancias y en la inspeccin
dimensional para calcular el tamao de una pieza.
Fig 13. Iluminacin Difusa [5]
2.2.3.2 ILUMINACION FRONTAL
Es la ms usada. Tiene como objetivo iluminar la pieza frontalmente. La desventaja de esta tcnica
es que tiene problemas para obtener un buen contraste entre la pieza y el fondo, debido a que
aparecen brillos y sombras que alteran las propiedades de las piezas en estudio.
Esta tcnica se usa en objetos poco reflectores para evitar los brillos que molestan la captura en
una iluminacin difusa.
7
http://tesis.pucp.edu.pe/repositorio/handle/123456789/68
26
Fig 14. Iluminacin Frontal [5]
2.2.3.3 LUZ DIRECCIONAL
Consiste en iluminar un objeto de manera direccionada en algn sentido del espacio para poder
rescatar alguna caracterstica del objeto. La principal caracterstica es que se crean sombras sobre
el objeto, lo que ayuda a aumentar el contraste de partes tridimensional y obtener informacin en
3d.
Fig 15. Iluminacin Direccional [5]
2.2.3.4 LUZ ESTRUCTURADA
El objetivo de este tipo de iluminacin es proyectar la pieza sobre unos patrones de luz conocidos
modulados y observar la luz reflejada, que tambin viene modulada. De esta manera se puede
obtener la informacin de la superficie del objeto misma que puede reconstruirse mediante
triangulacin.
Las fuentes de luz que se pueden emplear deben ser espaciales capaces de emitir luz estructurada
que por lo general son laser.
Fig 16. Iluminacin Estructurada [5]
27
2.2.4 FUENTES DE ALIMENTACION
Entre los principales tipos de iluminacin tenemos:
Lmparas incandescentes: Es la fuente de iluminacin ms comn y est formada por un
filamento de tungsteno. Su principal ventaja es que tiene una gran variedad de potencias. Por otro
lado, su desventaja es que reduce la luminosidad con el tiempo, lo que ocasiona inconvenientes
con el sistema de visin.
Tubos fluorescentes: son mucho mejores que las lmparas incandescentes. Estos entregan una luz
ms difusa que es aprovechada en objetos que son reflectores. Existe una gran variedad de este
tipo de tubos.
Fibra ptica: este tipo se utiliza para iluminar zonas que realmente tienen un acceso difcil o
partes que son extremadamente pequeas.
Lasers: Estos se emplean para tener una iluminacin estructurada, debido a que este es capaz de
emitir luz con un control adecuado de luminosidad. La desventaja de este es que no se comporta
de manera adecuada en superficies que absorben la luz.
2.3 PROCESAMIENTO DE LA IMAGEN
Para el procesamiento de la imagen, debemos considerar que una imagen en 2 dimensiones se
puede representar de la siguiente forma , . El valor de la amplitud de f en coordenadas
espaciales (x,y) es un escalar positivo el cual tiene un significado fsico que se determina de la
fuente de donde se origina la imagen. Las imgenes con las que trabajaremos basan su esquema
de color en una escala de grises. Cuando una imagen es generada por un proceso fsico, su valor es
proporcional a la energa irradiada por la fuente fsica, por ejemplo una onda electromagntica.
Como consecuencia tenemos lo siguiente:
0 < , < (3)
La funcin , puede ser caracterizada por 2 componentes: la primera que contiene la
cantidad de una fuente de iluminacin incidente en la escena que est siendo observada y la
segunda que la cantidad de iluminacin reflejada por los objetos que se encuentran en la escena.
El nombre apropiado para definir a estas dos caractersticas son la iluminacin y la reflectancia,
componentes que se les denota como , y , respectivamente. Las dos funciones se
combinan para obtener:
, = , , (4)
0 < , <
0 < , < 1
Esta ltima expresin nos indica que la reflectancia es limitada a 0 cuando esta totalmente
absorbida o 1 que tiene una total reflectancia. La naturaleza de , se determina por la fuente
de iluminacin y , se determina por la caracterstica de los objetos fotografiados.
28
2.3.1 CUANTIZACION Y MUESTREO
Para tener una idea de que es el muestreo y la cuantizacin podemos observar las siguientes
imgenes:
Fig. 17. Imagen Digital Generada [4]
Fig. 18. Lnea explorada AB [4]
Fig. 19. Muestreo y Cuantizacin [4]
Fig. 20. Lnea digital explorada [4]
29
En la funcin unidimensional de la figura 17, se grafica la amplitud de los valores continuos de la
imagen a lo largo del segmento AB de la figura 18. Las variaciones aleatorias son ruidos. Para
realizar el muestreo de esta funcin, tomamos muestras de espacios iguales a lo largo de la lnea
AB como se muestra en la figura 18. La localizacin de cada muestra est dada por una marca
vertical delgada en la parte inferior de la figura. Las muestras son mostradas con cuadros blancos
sobrepuestos en la funcin.
Por otro lado, el muestreo se lo hace asumiendo que tenemos una imagen continua en ambas
direcciones como tambin en amplitud. En la prctica el mtodo de muestreo se determina por un
arreglo de sensores usados para generar la imagen. Cuando la imagen es generada por un sensor
simple y combinada con un movimiento mecnico, la salida del sensor es cuantizada en la forma
que se describi arriba.
Cuando se usa un censado de banda para adquirir imgenes, el nmero de sensores en la banda
establece las limitaciones del muestreo. El movimiento mecnico en la otra direccin puede ser
controlado ms exactamente, pero esto hace que pequeas variaciones intenten muestrear toda
la densidad en esa direccin lo que hace que se exceda los limites de muestreo establecido por el
numero de sensores en la direccin opuesta.
Fig. 21. Imagen contina proyectada por un arreglo de sensores [4]
Fig. 22. Resultado de la imagen muestreada y cuantizada [4]
30
2.3.2 REPRESENTACION DE IMGENES DIGITALES
El resultado del muestreo y cuantizacion es una matriz de nmeros reales. Si asumimos que una
imagen , es muestreada entonces el resultado de la imagen tendr filas y columnas. El valor
de las coordenadas , sern ahora cantidades discretas. Para tener una notacin clara y de
conveniencia se denota con valores enteros estas coordenadas discretas. Los valores que se tiene
en el origen son (x,y)=(0,0). La prxima coordenada en el eje de las abscisas se representar como
(x,y)=(0,1). Es importante tener en cuenta que la notacin (0,1) se usa para representar la segunda
muestra a lo largo de la primera columna
8
.
Fig. 23. Representacin de una imagen digital [4]
Una vez descrita la notacin de una imagen digital, podemos describirla como una matriz de la
siguiente manera:
, =
0,0 0,1 . . 0, 1
1,0 1,1 . 1, 1
1,0 1,1 . 1, 1
5
El lado derecho de la ecuacin es la definicin de una imagen digital. Cada elemento de la matriz
se denomina elemento imagen, elemento grfico o pixel.
En algunos casos es mejor denotar como una matriz con sus elementos as:
=
,
. .
,
,
. .
,
,
. .
,
6
Si denotamos Z y R como u conjunto de enteros reales y un conjunto de nmeros reales
respectivamente, el proceso de muestreo puede ser visto como una particin del plano xy en una
malla, con las coordenadas del centro de cada malla siendo un par de elementos de un producto
cartesiano Z
2
, el cual es un conjunto de pares ordenados (z
i
,z
j
) con z
i
y z
j
siendo enteros. De aqu
8
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
31
, es una imagen digital si (x,y) son enteros de Z
2
y f es una funcin que asigne valores de
niveles de grises.
Por otro lado, el proceso de digitalizacin requiere de decidir valores para filas, columnas y para L
que es un nivel discreto de gris para cada pixel. No existen reglas para las filas y columnas
solamente que los enteros tengan valores enteros positivos.
A la escala de grises se la puede representar de la siguiente manera:
L=2
K
Asumimos que los niveles discretos estn igualmente espaciados y que son enteros en un
intervalo de [0, L-1]. Algunas veces el rango de valores que abarca la escala de grises es llamada
rango dinmico de una imagen, y se refiere a aquellas imgenes cuyos niveles de grises tiene una
porcin significativa en la escala dinmica.
Fig. 24. Niveles de gris para distintos bits de una imagen. [4]
2.4 SEGMENTACION
La segmentacin es aquel proceso mediante el cual una imagen se descompone en regiones o
elementos que pueden corresponder a objetos o parte de objetos. Este proceso es el encargado
de evaluar si cada pixel de la imagen pertenece o no a dicho objeto que se est analizando. Esta
tcnica de procesamiento de imgenes genera una imagen binaria, donde se representa con 1 los
pixeles que pertenecen a dicho objeto y 0 a los que no.
2.4.1 SEGMENTACION BASADA EN PIXELES
Este mtodo de segmentacin considera solo el valor de gris de un pixel, para decidir si el mismo
es o no parte del objeto. Para determinar esto, se debe encontrar el rango de valores de gris que
son caractersticos del objeto. Mediante un histograma se localiza estos valores caractersticos.
El objetivo de este mtodo, es el de encontrar de manera ptima los valores caractersticos del
objeto que se est analizando con respecto a las regiones que no pertenecen a este. En un primer
caso si los valores de gris del objeto y el resto de la imagen difiere claramente, tendremos un
histograma con una distribucin bimodal con dos valores mximos distintos que no representan
32
los valores caractersticos y que idealmente fueran igual a cero, con lo que se lograra una
separacin entre el objeto y la imagen.
Por otro lado, si el valor del histograma est ubicado entre los dos mximos es diferente de cero,
las funciones de probabilidad de valores de gris del objeto y la regin restante se sobrepondrn, lo
que hace que algunos pixeles del objeto debern ser tomados en cuenta como pertenecientes a la
regin.
Fig. 25. Imgenes con sus respectivos histogramas [4]
2.4.2 OPERACIONES MORFOLOGICAS
Las operaciones morfolgicas son mtodos para procesar imgenes binarias basadas en formas.
Estas operaciones toman una imagen binaria como entrada y a la salida obtiene tambin una
imagen binaria. El valor de cada pixel en la imagen de salida se basa en cada pixel de la imagen de
entrada y de sus respectivos vecinos.
Dilatacin: si consideramos A y B como conjuntos de Z
2
y representando al conjunto vacio, la
dilatacin de A por B se representa como:
= {/[
} ] (6)
Por lo tanto el proceso de dilatacin consiste en obtener la reflexin de B sobre su origen y
despus cambiarla por la reflexin en x. La dilatacin de A por B es entonces, el conjunto de todos
los desplazamientos x tales que B y A se sobremonten en al menos algn elemento que sea
distinto de cero.
33
Fig. 26. Ejemplo de dilatacin [6]
Erosin: Para los conjuntos de A y B de Z
2
, la erosin de A por B representada por se define
como:
= {/
} (7)
Esta expresin nos dice que la erosin de A por B es el conjunto de todos los puntos x tal que B
trasladado por x, est contenido en A.
Fig. 27 Imagen Original [6]
Fig. 28. Imagen erosionada [6]
2.4.3 ETIQUETADO
Muchas veces no es suficiente el proceso de binarizacin de una imagen, por lo que el proceso de
segmentacin se expande con nuevas tcnicas para el anlisis de imgenes y una de ellas es el
34
etiquetado y cuenta de objetos
9
. Para poder analizar este aspecto debemos entender conceptos
importantes como:
Conectividad y vecindad: el primer inconveniente que se genera en el anlisis es el de diferenciar
el objeto de la imagen de fondo. Para esto se utiliza el criterio de vecindad de un pixel. Para esto
tenemos dos casos:
Pixeles 4- vecinos de A0
A3
A5 A0 A1
A7
Tabla 1. Pixeles de con vecindad 4
Los cuales se representan como: N4 (A0) = {A1, A3, A5, A7}
Pixeles 8- vecinos de A0
A4 A3 A2
A5 A0 A1
A6 A7 A8
Tabla 2. Pixeles con vecindad 8
Los cuales se representan como: N8 (A0) = {A1, A2, A3, A4, A5, A6, A7, A8}
Se dice que dos puntos p y q estn 4-conectados si p pertenece a los 4-vecinos de q y viceversa. Y
si estn 8-conectados si p pertenece a 8-vecinos o viceversa.
Una vez entendido este concepto, podemos ahora si definir la tcnica de etiquetado y cuenta de
objetos. El etiquetado es una tcnica que teniendo una imagen binaria, nos permite etiquetar cada
uno de los objetos conectados presentes en la imagen. Con esto podemos:
Distinguir los objetos respecto del fondo
Distinguir un objeto respecto a los dems objetos
Conocer el nmero de objetos de una imagen.
9
http://biometrics.org/bc2009/presentations/wednesday/Alonso-
Fernandez%20MR%2016%20Wed%20930%20AM%20-%20950%20AM.pdf
35
Fig. 29. Etiquetado y cuenta de objetos [5]
Los algoritmos que se utilizan para etiquetar tienen buenos resultados con objeto convexos, pero
presentan problemas cuando aparecen objetos que tienen concavidades. Considerando este
aspecto, no se podra ocupar este algoritmo cuando un objeto tiene forma espiral.
Fig. 30. Imagen en forma de U etiquetada mediante el algoritmo de etiquetado. [5]
36
37
CAPITULO 3
TCNICAS DE RECONOCIMIENTO DE PATRONES Y MODELOS DE
CLASIFICADORES
3.1 INTRODUCCIN
Cuando ya se tiene la imagen segmentada en regiones, los pixeles segmentados se encuentran
representados y descritos de manera que estn listos para un procesamiento posterior. Cuando
hablamos de representar regiones estamos tocando dos mbitos, el primero que es posible
representar la regin en trminos de sus caractersticas externas, y la segunda representarla en
funcin de sus caractersticas internas.
La etapa de reconocimiento de patrones denominada tambin lectura de patrones, identificacin
de figuras y reconocimiento de formas, consiste en el reconocimiento de patrones de
caractersticas y descripcin donde cada objeto queda representado por un conjunto de
descriptores. El sistema de reconocimiento debe asignar a cada objeto su categora o clase.
3.2 TCNICAS DE RECONOCIMIENTO DE PATRONES
Existen diversas tcnicas para el reconocimiento de patrones, que estn divididas en dos
categoras: Decisiones tericas y estructurales. En las decisiones tericas la base para el
procesamiento son descriptores cuantitativos como son el rea, longitud, textura, etc. Por otro
lado, las tcnicas de decisin estructurales se basan en descriptores cualitativos.
3.2.1 MOMENTOS DE HU
Los momentos de Hu y los relacionados con la invariancia han sido extensivamente analizados en
el reconocimiento de patrones de imgenes en una gran variedad de aplicaciones.
Los momentos invariantes fueron introducidos por primero vez por Hu. HU derivo seis momentos
ortogonales y un momentos asimtrico basados todos estos en el algebra, los mismos que no son
dependientes de la rotacin, tamao y posicin pero si son dependientes de una proyeccin
paralela. Los momentos invariantes han sido probados para ser medidos adecuadamente para la
coincidencia de imgenes a pesar de su rotacin, escalamiento y rotacin. Los momentos
invariantes han sido extensivamente aplicados al reconocimiento de imgenes como ya se explico
anteriormente, al registro de imgenes y a la reconstruccin de las mismas. Sin embargo, las
imgenes digitales en las aplicaciones prcticas no son continuas y tampoco estn libres de ruido,
debido a que estas son cuantificadas con una precisin finita de pixeles y sus coordenadas
discretizadas
10
.
Por otro lado, el ruido puede ser introducido por varios factores, uno de ellos puede ser la cmara
lo que hace que exista errores al momento de realizar el clculo computacional. En otras palabras,
los momentos invariantes pueden variar dependiendo de la geometra de la imagen.
10
Object Detection using Geometric Invariant Moment, American Journal of Applied Sciences
38
La traslacin, rotacin y escalamiento son las transformaciones ms simples de las coordenadas
espaciales, que a veces son denominadas transformada de similaridad, en donde influyen 4
parmetros que son:
= . + (8)
Donde t es un vector de traslacin, s es un factor de escalamiento positivo y R es una matriz de
rotacin.
=
9
Donde es un ngulo de rotacin.
La invarianza con respecto a la traslacin, rotacin y escalamiento se requiere en casi todas las
aplicaciones prcticas, debido a que los objetos deben ser reconocidos correctamente,
independientemente de su posicin y orientacin en la escena y la distancia del objeto a la
cmara.
Por otro lado, el modelo TRS (transformacin, rotacin y escalamiento) es una aproximacin
suficiente de la deformacin de la imagen actual si la escena es lisa y perpendicular al eje de la
ptica.
DEFINICION DE LOS MOMENTOS
Un momento general
, , ,
(10)
En donde
, ,
11
Escribiendo de otra forma, los momentos estadsticos se pueden definir como:
(12)
En donde es el conjunto de pixeles de la regin. El parmetro r+s denota el orden del momento.
El momento de orden cero m
00
corresponde al rea de la regin A. el centro de gravedad de una
regin queda definido por:
39
=
13
En donde el momento de orden cero
es el
centroide de la coordenada en x y
es el centroide la coordenada en y.
Con la ayuda de las coordenadas del centro de gravedad se definen los momentos que son
invariantes al desplazamiento de la regio en la imagen.
14
Los parmetros r y s denota el orden del momento.
En la teora de reconocimiento de patrones son las caractersticas derivadas de los momentos
centrales, denominados momentos de Hu.
(15)
+4
(16)
+3
(17)
] +3
(18)
] +4
(19)
= 3
] +3
[3
] (20)
Con
+1 (21)
El parmetro t es aquella constante que determina la constante del centro de masa del objeto en
anlisis. Para cada uno de los 7 momentos esta varia con lo que se obtiene su valor caracterstico.
Los momentos de Hu son invariantes a la traslacin, rotacin y escalamiento. Es decir que dos
regiones que tengan la misma forma pero que sean de distinto tamao y que estn ubicados en
posiciones y orientaciones distintas en la imagen tendrn momentos de Hu iguales.
3.2.2 SIFT
Este algoritmo fue desarrollado para el reconocimiento de objetos. SIFT detecta un punto
caracterstico de un objeto el mismo que puede ser reconocido con la invariancia de la
iluminacin, escala rotacin y transformaciones afines.
40
Las ventajas que ofrece este mtodo son:
No se necesita transformar a coordenadas polares, para una precisin alta en la
segmentacin de imgenes.
Debido a su invarianza a la iluminacin, escala y rotacin se espera que sea confiable
cuando se use en la adquisicin de imgenes con las siguientes condiciones:
Conveniencia del usuario
Aplicabilidad a los ambientes no cooperativos
11
.
3.2.2.1 Operacin de SIFT
Para poder aplicar SIFT y verificar si los objetos son identificados de manera correcta, debemos
considerar dos aspectos.
1. Caractersticas de extraccin
Construccin de la escala espacial
Localizacin de la deteccin extrema
Descriptor de la extraccin del punto clave
Construccin de la escala espacial: la primera etapa es construir una pirmide Gausiana o tambin
llamada escala espacial par la imagen de ingreso. Este est formado por la convolucin de la
imagen original con una funcin gausiana de ancho variable. La diferencia de un gausiano (DoG),
D(x,y,) es calcular como diferencia entre dos imgenes filtradas, una con una constante de
escalamiento K y la otra si esta:
, , = , , , , 22
Estas imgenes, , , , son producidas por la convolucin de funciones gausianas, , ,
con una imagen de entrada, l(x, y)
, , = , , , 23
, , =
1
2
/2
} 24
Localizacin de la deteccin extrema: En esta etapa se debe encontrar los puntos DOG de la
pirmide. Para detectar un mximo y un mnimo local de D(x,y,), cada punto se compara con los
pixeles de todos los vecinos. Si el valor es el mnimo o mximo, este punto es una extrema. Para
11
http://www.cs.st-andrews.ac.uk/~yumeng/yumeng-SIFTreport-5.18_bpt.pdf
41
mejorar la localizacin de este punto, se puede usar las series de Taylor, que est definido de la
siguiente manera:
=
25
Fig 31. Localizacin de la deteccin extrema
Descriptor de la extraccin del punto clave: en esta etapa de intenta eliminar algunos puntos de
la lista de candidatos de puntos clave para encontrar a los que tengan bajo contraste y tengan una
localizacin muy pobre. El valor del punto clave en la pirmide DoG est definido por:
= +
1
2
26
2. Caractersticas de reconocimiento
Punto clave del reconocimiento
Recorte de falsas concordancias
Fig. 32. Proceso para la obtencin de caractersticas con el mtodo SIFT [7]
42
3.2.4 REDES NEURONALES
Las redes neuronales son estructuras pensadas para simular las estructuras y el comportamiento
del sistema nervioso, por esta razn una neurona artificial posee entradas, salidas y un estado.
Adems de estar conectadas a otras neuronas siendo las salidas de estas las entradas de las
dems
12
.
Cada neurona realiza una operacin matemtica, y adems de agrupan en capas lo que constituye
una RNA. Un sistema neuronal o conexionista se compone de lo siguiente:
Un conjunto de procesadores elementales
Un patrn de conectividad o arquitectura
Una dinmica de activaciones
Una regla o dinmica de aprendizaje
En entorno donde opera
Fig. 33 Esquema de una red neuronal [4]
3.2.4.1 CARACTERISTICAS DE UNA RED NEURONAL
Una red neuronal consta de las siguientes caractersticas:
Procesamiento paralelo: Si queremos procesar una imagen, un ordenador tarda algunos minutos
en recorrer toda la imagen. Por otro lado el cerebro necesita unos pocos segundos en procesar
millones de pixeles, ya que las neuronas que interviene en el sistema trabajan en paralelo.
Memoria distribuida: en un ordenador la informacin se almacena en posiciones continuas bien
definidas, en una red neuronal se almacena en las sinapsis de la red. Si una se daa perdemos la
informacin.
Aprendizaje adaptativo: la capacidad de aprender tareas en base al entrenamiento elimina la
necesidad de elaborar modelos a priori o indicar funciones de distribucin de probabilidad.
Auto organizacin: Las redes neuronales utilizan su capacidad de aprendizaje adaptativo para
organizar la informacin que reciben durante el aprendizaje/operacin.
3.2.4.2 REDES PERCEPTRON
12
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
En la forma ms bsica, la red perceptron, aprende una
opciones. La respuesta de este dispositivo est basada en la suma de los pesos de las entradas.
Esta funcin representa la decisin de una funcin de lineal con respecto a los componentes de los
vectores patrones. Los coeficientes wi= 1,2.. n,n+1 son llamados pesos que modifican los ingresos
antes que ellos sean sumados y vueltos a ingresar por el mi
pesos son anlogos a la sinapsis en un el sistema neurolgico de un ser humano.
Cuando d(x)>0 el elemento de disparo causa la salida de la red perceptron en +1 indicando que el
patrn x fue reconocido y que pertenece a
modo de operacin concuerda con la acotacin de la ecuacin anterior. Cuando d(x)
no sabe a qu clase pertenece lo que da u
Donde la ecuacin del hiperplano es un patrn de n dimensiones en el espacio. Geomtricamente
los primeros n coeficientes establecen la orientacin del hiperplano, y los ltimos coeficientes
Wn+1=0 es proporcional a la distancia perpendicul
13
Digital Image Processing, Rafael C. G
En la forma ms bsica, la red perceptron, aprende una decisin lineal entre dos tipos de
opciones. La respuesta de este dispositivo est basada en la suma de los pesos de las entradas.
Fig. 34. Red Perceptron [4]
=
27
Esta funcin representa la decisin de una funcin de lineal con respecto a los componentes de los
vectores patrones. Los coeficientes wi= 1,2.. n,n+1 son llamados pesos que modifican los ingresos
antes que ellos sean sumados y vueltos a ingresar por el mismo elemento. En este sentido los
pesos son anlogos a la sinapsis en un el sistema neurolgico de un ser humano.
Cuando d(x)>0 el elemento de disparo causa la salida de la red perceptron en +1 indicando que el
patrn x fue reconocido y que pertenece a la clase w1. Lo contrario ocurre cuando d(x)<0. Este
modo de operacin concuerda con la acotacin de la ecuacin anterior. Cuando d(x)
ce lo que da una condicin de indeterminacin
13
.
=
= 0 28
Donde la ecuacin del hiperplano es un patrn de n dimensiones en el espacio. Geomtricamente
los primeros n coeficientes establecen la orientacin del hiperplano, y los ltimos coeficientes
Wn+1=0 es proporcional a la distancia perpendicular del origen hacia el hiperplano.
al Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
43
decisin lineal entre dos tipos de
opciones. La respuesta de este dispositivo est basada en la suma de los pesos de las entradas.
Esta funcin representa la decisin de una funcin de lineal con respecto a los componentes de los
vectores patrones. Los coeficientes wi= 1,2.. n,n+1 son llamados pesos que modifican los ingresos
smo elemento. En este sentido los
Cuando d(x)>0 el elemento de disparo causa la salida de la red perceptron en +1 indicando que el
la clase w1. Lo contrario ocurre cuando d(x)<0. Este
modo de operacin concuerda con la acotacin de la ecuacin anterior. Cuando d(x)=0 el objeto x
Donde la ecuacin del hiperplano es un patrn de n dimensiones en el espacio. Geomtricamente
los primeros n coeficientes establecen la orientacin del hiperplano, y los ltimos coeficientes
ar del origen hacia el hiperplano.
44
Fig 35. Separacin de objetos en un hiperplano [15]
La salida del elemento depende del signo de d(x). En lugar de probar una funcin entera para
determinar si es positivo o negativo, podramos probar con la sumatoria de la ecuacin anterior,
donde podemos definir lo siguiente:
0 =
+1
>
<
29
3.3 MODELO DE CLASIFICADORES
3.3.1 LGICA DIFUSA
La lgica difusa naci en 1965 siendo Lofti Zadeh su creador. A este cientfico se le atribuyen
muchas contribuciones en el desarrollo de la transformada Z para sistemas lineales discretos. La
lgica difusa difiere de la logia clsica debido a que esta ltima maneja de forma imprecisa la
clasificacin de valores. Esta adems permite una clasificacin ms amplia donde la pertenencia a
un grupo es gradual.
La lgica difusa como tal se refiere a toda la serie de teoras para modelacin, control, algoritmos
computacionales e inteligencia artificial que se basan en un razonamiento de incertidumbre o
imprecisin, donde la palabra clave se basa en lmites que no son cortantes
14
.
3.3.1.1 APLICACIONES DE LA LOGIA DIFUSA
SECTOR AUTOMOTRIZ
Control de la transmisin
14
Maestria en control y automatizacion-Control digital avanzado, Fundamentos del Control Difuso,
Ing. Ismael Minchala, Msc
45
Control del motor
Control del frenado
SECTOR INDUSTRIAL
Hornos y calderas
Columnas de destilacin
Produccin del cemento
Refinera y petroqumicas
Industria qumica farmacutica y alimenticia
3.3.1.2 CRISP LOGIC
La teora de conjuntos clsica o Crisp es la base de los conjuntos difusos o Fuzzy sets, ya que la
teora difusa tiene operaciones similares a la Crisp Logic.
En la teora clsica las operaciones de unin, interseccin y complemento estn definidas por:
Sean A y B subconjuntos del universo X, la unin, interseccin y complemento se definen:
Unin de un conjunto Clsico A y B
AUB= {X|XE A o x EB} ( 30 )
Interseccin de un conjunto clsico de A y B
A B = {X|XE A o x EB} (31)
Complemento de un conjunto clsico A
A = {x|xA} (32)
3.3.1.3 FUNCION CARACTERISTICA
Si A representa un conjunto del universo X, su funcin caracterstica yA puede definirse como:
= {0, 1} 33
Es decir que si x pertenece a A entonces la funcin vale 1, y si no pertenece vale 0.
3.3.1.4 CONJUNTO DIFUSO
Mientras los conjuntos clsicos pueden definirse por funciones caractersticas, los conjuntos
difusos se definen por funciones de membreca.
46
Por ejemplo un conjunto clsico es:
X= Integrantes
A=Grupo de hombres
B= Estudiantes de Msica
Un conjunto difuso es:
=
Para estos conjuntos no podemos utilizas diagramas de Venn porque moderadamente altas y
medianamente blancas varan de persona a persona y dependen de la situacin. Por ejemplo,
asignaremos un grado entre 0 y 1 para denotar el moderadamente altas y medianamente blancas,
donde se obtiene:
Conjunto Paty Ana Danny Eric Juan Linda
Moderadamente
altas
0.5 0.7 0.3 0.4 0.8 0.3
Medianamente
blancas
0.3 0.1 0.5 0.8 0.9 0.2
Tabla. 3. Definicin de un Conjunto Difuso
Donde 1 representa una total pertenencia a cada grupo y 0 una no pertenencia al grupo. En un con
junto clsico tendramos que decidir entre 0 y 1 exclusivamente, pero en un difuso puede ser
cualquier valor entre este rango [0,1]
3.3.1.5 Funcin de Membreca
Si A representa un conjunto del universo X, su funcin de membresa A(x) para el conjunto difuso
A se le llama valor de membreca o grado de membresa. El grado de membresa es la pertenencia
de x al conjunto difuso A.
47
Fig. 36. Funcin de membreca [8]
Es importante mencionar que los conjuntos difusos deben definirse correctamente para reflejar la
situacin. Por ejemplo si nos encontramos en una carretera libre o en una autopista.
Fig. 37. Planteamiento de un problema difuso. [8]
Los conjuntos difusos con aquellos que poseen lmites suaves y estn definidos por una funcin
que mapea objetos en un dominio de acuerdo a su grado de pertenencia o membreca en el
conjunto.
3.3.1.6 GRADO DE MEMBRESIA
El grado de membresa es el valor numrico que se asigna como pertenencia a un conjunto difuso
para una variable lingstica.
48
Fig. 38 Grado de Membreca [8]
3.3.1.7 VARIABLE LINGSTICA
La variable lingstica es aquella que toma valores con palabras en lugar de valores numricos. En
una funcin de membresa los conjuntos son asociados con variables lingsticas.
Fig. 39 Variable lingstica [8]
3.3.1.8 RAZONAMIENTO APROXIMADO
El razonamiento aproximado es la forma ms conocida de la lgica difusa que incluye una variedad
de reglas de inferencia. Este en contraste con la inferencia de la lgica clsica, establece que el
consecuente de un conjunto de proposiones difusas depende esencialmente de la interpretacin
dada a estas proposiciones. Este es usado para representar y razonar con conocimientos
expresados en forma primitiva, esto es, expresados en una forma de lenguaje natural
15
.
15
Maestria en control y automatizacion-Control digital avanzado, Fundamentos del Control Difuso,
Ing. Ismael Minchala, Msc
49
3.3.1.9 CONTROLADOR DIFUSO
Fuzificacin: convierte los valores ledos de las variables del proceso necesarias para el control del
proceso a grados de membreca o pertenencia a un conjunto difuso.
Mecanismo de inferencia: calcula el valor de la manipulacin o salida del controlador con base en
las reglas de inferencia difusas.
Defuzificacin: convierte el valor difuso de la manipulacin a una seal de control que se pueda
escribir en el proceso.
Normalmente en un sistema de control difuso en una entrada-una salida, las variables de error (e)
y la derivada del erros son las que procesas para emitir la seal de control m(t).
Fig. 40 Sistema de un Controlador Difuso
3.3.1.10 DEFUSIFICACION
El proceso d defusificacin tambin es conocido como Fuzzy Reasoning. Este proceso consiste en
calcular a partir de las reglas de inferencia difusas, el valor crisp que va de salida al proceso.
50
Fig. 41 Proceso de defusificacin de un conjunto difuso [8]
Existen varios mtodos para defusificar, entre los ms importantes se encuentran:
El mtodo Mamdani
El mtodo del mximo valor de membresa
El mtodo ponderado o simplificado
Por otro lado los mtodos de defusificacin se basan en las reglas de inferencia del tipo:
Regla 1: Si x es A1 y y es B1, entonces z es C1
Regla 2: Si x es A2 y y es B2, entonces z es C1
. . . .
. . . .
. . . .
Regla 3: Si x es A
n
y y es B
N
, entonces z es C
n
Donde la funcin de salida se expresa como la unin o el mximo de los conjuntos de salida, en
caso de que la accin sea funcin, es decir:
Fig. 42. Funcin de salida de un conjunto difuso
51
EL MTODO MAMDANI
El mtodo del centroide aplica para sistemas continuos bsicamente la defusificacin consiste en
encontrar el centro de masa de la funcin de salida.
Fig. 43 Mtodo de Mamdani
El centroide o centro de masa se calcula como:
=
.
34
El smbolo de la integral es una algebraica ya que la funcin o variable de salida es ahora crisp.
EL MTODO DEL VALOR MAXIMO
El mtodo del valor mximo es muy sencillo, ya que solo se debe escoger el pico mximo de la
funcin generada de salida.
Fig. 44. Mtodo del valor mximo
EL MTODO DEL PONDERADO
El mtodo ponderado es el ms utilizado en aplicaciones digitales o en control de procesos. Sin
embargo es deseable que la funcin de salida sea simtrica para su mejor desempeo. La salida
puede calcularse como:
52
=
35
3.3.2 REDES BAYESIANAS
Las redes bayesianas o probabilsticas son una representacin grfica de dependencias para el
razonamiento probabilstico en sistemas expertos.
Formalmente las redes bayesianas son grficos a cclicos dirigidos cuyos nodos representan
variables y los arcos que los unen codifican dependencias condicionales entre las variables.
Fig. 45. Modelo de una red Bayesiana.
Sea U={x1,x2..Xn} un conjunto de variables aleatorias. Formalmente una red bayesiana para U es
un par B=<G, T> en el que:
G es un grfico a cclico dirigido en el que cada nodo representa una de las variables X1,X2,..Xn y
cada arco representa relaciones de dependencia directas entre las variables. La direccin de los
arcos indica que la variable apuntada por el arco depende de la variable situada en su origen
16
.
T es un conjunto de parmetros que cuntica la red. Contiene las probabilidades para cada posible
valor de xi de cada variable Xi y cada posible valor P
xi
de P
xi
, donde este ltimo denota al conjunto
de padres de Xi en G. as una red bayesiana B de una distribucin de probabilidad conjunta sobre
U dada por:
(36)
En donde X
1
,X
2
.Xn son los posibles valores que la red puede tomar.
3.3.2.1 APRENDIZAJE DE REDES BAYESIANAS
El problema del aprendizaje bayesiano puede describirse informalmente como: dado un conjunto
de entrenamiento D={u1,u2un} de instancias de U, encuntrese la red B que se ajuste mejor a D.
16
http://www.sc.ehu.es/ccwbayes/docencia/mmcc/docs/t9knn.pdf
53
Tpicamente este problema tiene dos partes:
Aprendizaje estructural: obtener la estructura de la red
Aprendizaje paramtrico: conocida la estructura del grafo, obtener las probabilidades
correspondientes a cada nodo.
3.3.2.2 APLICACIONES
Las redes bayesianas son un tipo de modelos de minera de datos que pueden ser utilizados en
cualquiera de las siguientes actividades:
Prevencin del fraude
Prevencin del abandono de clientes
Blanqueo de dinero
Marketing personalizado
Scoring de clientes
Clasificacin de datos estelares
3.3.3 CLASIFICADORES DE DISTANCIA MINIMA
Las tcnicas de reconocimiento basadas en coincidencias, representan a cada clase en un vector
patrn prototipo. Un patrn desconocido es asignado a la clase en la cual existe mayor
coincidencia en trminos de algunas mtricas predefinidas. Uno de los enfoques ms simples pero
robustos, es el clasificador de distancia mnima Euclidiana entre los vectores de los objetos
desconocidos y los vectores de los patrones conocidos. Se elige la distancia ms pequea para
realizar la decisin
17
.
Supongamos que definimos el prototipo de cada clase como la medida de su vector:
=
1
= 1,2, . . 37
Donde N representa el tamao de los vectores. Una forma de determinar la clase a la cual un
objeto desconocido es miembro, consiste en asignarlo a la clase prototipo ms cercano. Utilizando
la distancia Euclidiana para determinar la cercana, el problema de medicin de distancias se
reduce a calcular la siguiente ecuacin:
= 1,2. . 38
Donde || =
1
2
= 1,2. 39
Y asignar x a la clase Wi implica analizar el resultado numrico di(x) mximo.
El lmite de decisin que separa dos clases
de
= 0 40
A partir de las ecuaciones anteriores, el lmite de decisin entre dos clases
para un
clasificador de distancia mnima es:
41
1
2
= 0 42
La superficie dada por la ecuacin 33 es la lnea perpendicular que bisecta la lnea que une
con
. Para n=2, la superficie se representa por una lnea perpendicular, para n=3 es un plano y para
n>3 resulta un hiperplano.
Fig. 46. Limite de decisin de un clasificador de distancia mnima [9]
55
3.3.4 CLASIFICADORES DE K VECINOS
K-NN (K vecinos ms cercanos) es uno de los clasificadores ms utilizados por su simplicidad. El
proceso de aprendizaje de este clasificador consiste en almacenar una tabla con los ejemplos
disponibles, junto a la clase asociada a cada uno de ellos
18
.
Fig. 47. Ejemplo del clasificador K-nn [10]
Algoritmo K-NN bsico
La notacin que se utiliza para representar este algoritmo es:
Fig.48. Notacin para el paradigma K-NN [10]
D indica un fichero de N casos, cada uno de los cuales est caracterizado por n variables
predictoras, X1,.Xn y una variable a predecir, la clase C.
Los N casos se denotan por:
41
, 1 .
, = 1, . . 43
, . .
= 1, . . 44
18
http://es.scribd.com/doc/58302048/85/Clasificador-de-k-vecinos-mas-cercanos
56
3.3.4.1 VARIANTES SOBRE EL ALGORITMO BSICO
En este apartado vamos a introducir algunas variantes sobre el algoritmo bsico.
K-NN CON RECHAZO
La idea subyacente al K-NN con rechazo es que para poder clasificar un caso debo tener ciertas
garantas. Es por ello por lo que puede ocurrir que un caso quede sin clasificar, si no existen ciertas
garantas de que la clase a asignar sea la correcta.
K-NN CON DISTANCIA MEDIA
En el K-NN con distancia media, la idea es asignar un nuevo caso a la clase cuya distancia media
sea menor.
Fig 49. Ejemplo del clasificador K-NN con distancia media [10]
K-NN CON DISTANCIA MINIMA
En el K-NN con distancia mnima se comienza seleccionando un caso por clase, normalmente el
caso ms cercano al baricentro de todos los elementos de dicha clase. En este paso se reduce la
dimensin del fichero de casos a almacenar de N a m. A continuacin se asigna el nuevo caso a la
clase cuyo representante este ms cercano.
K-NN CON PESADO DE CASOS SELECCIONADOS
La idea en el K-NN con el que efectan un pesado de los casos seleccionados es que los K casos
seleccionados no se contabilicen de igual forma, sino que se tenga en cuenta la distancia de cada
caso seleccionado al nuevo caso que se pretende seleccionar.
K-NN CON PESADO DE VARIABLES
En todas las aproximaciones presentadas hasta el momento, la distancia entre el nuevo caso que
se pretende clasificar, x, y cada uno de los casos X
r
, r=1 N ya clasificados pertenecientes al
57
fichero de casos D, da el mismo peso a todas y cada una de las n variables, X1, X
n
. Es decir, la
distancia d(x,X
r
) entre x y X
r
, se calcula por medio de la distancia euclidiana.
,
45
Esta manera de calcular la distancia, es decir, dando el mismo nivel de importancia a todas las
variables, puede resultar peligrosa para el paradigma K-NN en el caso de que algunas variable sean
irrelevantes para la variable clase C. este es el motivo por el que resulta interesante el utilizar
distancias entre casis que ponderen cada variable de una manera adecuada. Es decir, la distancia
entre x y xr, se calculara:
,
46
58
59
CAPITULO 4
IMPLEMENTACIN DEL SISTEMA DE VISIN ARTIFICIAL
4.1 INTRODUCCIN
Para realizar todo el procedimiento del clculo de los momentos de Hu y los clasificadores se ha
utilizado el software Labview, el cual nos permite obtener varios parmetros necesarios para
realizar la clasificacin respectiva.
4.2 IMPLEMENTACIN DE HARDWARE
4.2.1 Cmaras
La cmara que se utiliz fue una Basler industrial. Esta cmara permite capturar imgenes con una
alta claridad, con lo que ayuda que procesamiento de las imgenes sea lo ms optimo posible. La
colocacin de la misma tambin juega un papel muy importante, ya que al tener una buena
ubicacin tendremos una mejor captacin de las imgenes. Por el contrario, si no la colocamos en
un lugar adecuado, las imgenes que se obtendrn sern de mala calidad ocasionando que
nuestro procesamiento sea errneo.
4.2.2 Sistema de iluminacin
Como mencionamos anteriormente, la iluminacin es un factor muy importante en el
proceso de visin para la obtencin de resultados ptimos. Una deficiente Iluminacin
implica obtener imgenes de baja calidad, lo que a su vez conlleva a resultados errneos o
un procesamiento excesivo. En nuestro caso no tuvimos mayor inconveniente en cuanto a
la iluminacin por lo que el sistema va a ser implementado en un lugar de bajo
iluminacin y poca reflectancia. Esto ayuda mucho a la cmara ya que la misma solo
enfocara a los objetos en cuestin y no habr problemas en cuanto a reconocer sus
caractersticas se refiere.
4.3 Implementacin de Software
4.3.1 Captura de imgenes
La captura de las imgenes se la realiza mediante el siguiente bloque de programa
60
Fig. 50. Captura de la imagen
Mediante este bloque podemos realizar la captura de nuestras imgenes para en su posterior
trabajo poder procesarlas.
4.4 Procesamiento de la imagen
4.4.1 Umbralizacin
La umbralizacin es un paso muy importante ya que este nos permite binarizar a nuestra imagen
para que el procesamiento sea mucho ms fcil. Al binarizar nuestra imagen trabajamos con
valores que van de 0 a 255. Esto hace que nosotros tengamos un 0 o un 1 en nuestra imagen y
segn esto saber cuntos pixeles estn activados y cuantos no. El bloque que nos permite hacer
esto es el siguiente:
Fig. 51. Binarizacin de la imagen
61
Fig. 52. Pieza binarizada
El resultado de realizar la binarizacin es como se puede observar en la figura anterior. Al tener de
esta forma, podemos calcular los momentos de Hu de manera mucho ms fcil.
4.4.2 Etiquetado
El etiquetado por su parte es otro de los aspectos que debemos considerar ya que esto nos ayuda
al tener varios objetos a clasificarlos segn su color y con esto obtener caractersticas
independientes de cada uno de ellos evitando as la confusin de los mismos.
Fig. 53. Etiquetado de la Imagen
4.4.3 Filtrado del tamao
El filtrado de la imagen nos ayuda a eliminar bordes y contornos no deseados de una imagen, con
el fin de que el proceso sea lo ms puro posible y que no existan valores extras que perjudiquen a
este proceso.
62
63
CAPITULO 5
CALCULO MATEMTICO Y PROCESAMIENTO DE LAS TCNICAS DE
RECONOCIMIENTO DE PATRONES
5.1 INTRODUCCIN
Dentro las tcnicas de reconocimiento de las tcnicas para el reconocimiento de patrones, se ha
escogido para su desarrollo los momentos de Hu. Los momentos de Hu como ya se vio
anteriormente, nos entregan informacin del objeto que estamos procesando, con el fin de que
con estos valores se pueda clasificar a los objetos segn sea su caracterstica.
5.2 CALCULO DE LOS MOMENTOS DE HU.
Para poder calcular los momentos de Hu, debemos primero hacer un pre procesamiento de la
imagen, es decir aplicar una serie de operaciones que permitan realizar el posterior clculo. Todo
este procesamiento se lo realiz en el software Labview.
5.2.1 PARAMETROS
Los parmetros que se consideraron para el desarrollo del software para calcular los 7 momentos
fueron:
Adquisicin: en esta etapa se configura la sesin de la cmara y como la imagen se la captura en
RGB se incluye un paso a imagen monocromtica, extrayendo a la imagen original el plano de
intensidad.
Fig. 54. Adquisicin de Imgenes
Preprocesamiento: En esta etapa se realiza un enmascaramiento de la imagen a travs de
coordenadas ingresadas por el usuario para obtener el ROI (regin de inters).
Segmentacin: El objetivo de la etapa de segmentacin de la imagen es ingresar una imagen al
sistema y obtener caractersticas como resultado, en este caso de manera particular imgenes
64
etiquetadas con informacin de centros de masa y rea, para lo cual se realizan los siguientes
pasos:
Umbralizacin: Se utiliza para obtener imgenes binarias. Para elegir los lmites de umbralizacin
debemos considerar los siguientes aspectos.
Erosin: es una operacin morfolgica que permitir eliminar objetos de un tamao
menor a los objetos que estamos analizando, de forma que el etiquetado de la etapa
siguiente sea relativamente ms sencillo de realizar.
Etiquetado: se agrupan los pixeles vecinos considerando vecindad de 8.
Fig.55. Binarizacin de la imagen
Fig.56. Etiquetado de los objetos
Caracterizacin: en esta etapa se convierte la imagen etiquetada en una matriz de vectores
columna, conteniendo los resultados del clculo de los momentos de Hu.
65
Fig.57. Momentos de Hu de los 4 objetos a reconocer
Clasificacin: Aplicando el criterio del clasificador de distancia mnima, k vecinos ms cercanos y
lgica difusa, se asigna el objeto capturado por la cmara a algn patrn previamente entrenado
en el sistema.
5.2.1 PROCESO DE CLCULO
Una vez hecho el proceso anterior, procedemos al clculo de los momentos de Hu. Para esto se
utilizaron las siguientes frmulas:
(11)
+4
(12)
+3
(13)
] +3
(14)
] +4
(15)
= 3
] +3
[3
] (16)
Para poder calcular, debemos obtener el centro de masa de cada objeto, y el nmero total de
pixeles que lo conforman, ya que esto nos ayudara a definir cul es el valor de cada uno de los
momentos.
=
+
2
+1 17
Donde r y s representan el momento a calcularse, y
(47)
=
+1 (48)
Donde r y s son el momento que va a calcularse.
=
+1 = 2 (49)
(50)
(51)
Los datos de y y son obtenidos de cada figura para el calcula. Estos significa que y son todos los
pixeles del objeto en la coordenada y y es el centro de masa del mismo. Por otro lado, Pero para
el primer momento necesitamos ahora el parmetro
(52)
Ahora bien como en el caso anterior x significa todos los pixeles del objeto en la coordenada x y
es el centro de masa del mismo.
De esta forma es como se van obteniendo los momentos para cada objeto. A continuacin se
describe el valor que se obtuvieron en los objetos de cada momento de Hu.
Moneda
= 0,159745
= 0,000161714
= 0,0000024753
= 0,00000000142066
= 0,0000000000000000627111
= 0,00000000000761959
= 0,0000000000000000562556
Memory Stick
= 0,174548
= 0,00287047
= 0,0000263223
= 0,00000111915
= 0,00000000000376112
= 0,0000000583927
= 0,00000000000476976
67
Pieza amorfa 1
= 0,203677
= 0,0141866
= 0,000386307
= 0,0000291578
= 0,00000000308993
= 0,00000346912
= 0,000000000169138
Pieza amorfa 2
= 0,237502
= 0,015327
= 0,00611976
= 0,000907733
= 0,00000102021
= 0,00000103566
= 0,00000188055
Ahora bien, los momentos de Hu como tal no hacen nada o ms bien no entregan ninguna
informacin, ya que no tenemos ningn clasificador que permita determinar parmetros que
definan el reconocimiento de los objetos. Para que estos tengan utilidad se necesita de un
clasificador. Existen varios tipos de clasificadores que se pueden emplear para clasificar los datos.
Los que se utilizaron fueron el de distancia euclidiana o distancia mnima, el de los k vecinos ms
cercanos y el de lgica difusa. Estos tres clasificadores se implementaron y se contrastaron entre s
para ver cul de ellos era el ms fiable.
CLASIFICADOR DE DISTANCIA MINIMA
El clasificador de distancia mnima, est definido por la siguiente frmula:
2 ) (
1
) (
) (
k
ij
N
n
n
ij
k
ij
X X d
momentos
=
=
( 53)
En donde X
n
representa el momento obtenido de objeto en analisis y X
k
el momento del objeto
patrn.
Con la formula anteriormente descrita, se pueden obtener las distancias correspondientes a cada
objeto. Los resultados obtenidos fueron:
68
Moneda:
D1=0,0129378
D2= 0,0443367
D3= 0,136743
D4= 0,000806814
Memory stick
D1= 0,0151617
D2= 0,0285317
D3=0,15203
D4= 0,0030566
Pieza amorfa 1
D1= 0,0391771
D2=0,0272015
D3= 0,0285922
D4= 0,00440241
Pieza amorfa 2
D1= 0,0746991
D2= 0,0626122
D3= 0,0321515
D4= 0,00789217
Las distancias anteriormente descritas son las distancias medidas con respecto a los objetos en
anlisis. Por ejemplo la distancias de la moneda son medidas respecto a la memory stick, pieza
amorfa 1 y pieza amorfa 2. Esas distancias a su vez sin contrastadas y se ve cul de ellas es la
menor para as saber si es o no la moneda que se esta clasificando.
69
Fig.58. Objeto reconocido-moneda
Fig.59. Objeto reconocido-pieza amorfa2
Fig.60. Objeto reconocido-memory Stick
70
Fig.61 Objeto reconocido-pieza amorfa 1
CLASIFICADOR K VECINOS
Aplicando el mismo concepto de la distancia euclidiana, podemos obtener las distancias ms
cercana de los objetos pero aplicando k vecinos. Esta tcnica a diferencia de la distancia mnima,
nos permite obtener una mayor informacin de las distancias de los objetos que estamos
calculando. Esto hace que esta tcnica sea un poco ms fiable que la anterior. Est definida por la
siguiente ecuacin:
2 ) (
1
) (
) (
k
ij
N
n
n
ij
k
ij
X X d
momentos
=
=
(54)
Moneda:
D1=0, 0129378
D2= 0, 0443367
D3= 0,136743
D4= 0,000806814
D1.1=0, 0156778
D2.1= 0, 0442257
D3.1= 0,1477843
D4.1= 0,0090681
D2.1=0, 0179378
D2.2= 0, 041257
D2.3= 0,133843
D2.4= 0,000868814
71
Memory stick
D1= 0, 0151617
D2= 0, 0285317
D3=0, 15203
D4= 0, 0030566
D1.1=0, 0179378
D2.1= 0, 02987
D3.1= 0, 14307
D4.1= 0,003376
D2.1=0, 0129378
D2.2= 0, 03017
D2.3= 0, 14779
D2.4= 0,003576
Pieza amorfa 1
D1= 0,0391771
D2=0,0272015
D3= 0,0285922
D4= 0,00440241
D1.1=0, 039278
D2.1= 0, 0274026
D3.1= 0,029677
D4.1= 0,004671
D2.1=0, 040183
D2.2= 0, 028432
D2.3= 0, 02976
D2.4= 0,004236
Pieza amorfa 2
D1= 0,0746991
D2= 0,0626122
D3= 0,0321515
D4= 0,00789217
D1.1= 0,075791
D2.1= 0,0735233
D3.1= 0,0422735
D4.1= 0,00838317
D2.1=0, 0129378
72
D2.2= 0,0443367
D2.3= 0,0521616
D2.4= 0,00989317
Como se puede observar, en este caso al igual que la distancia mnima, se va comparando las
distancias entre cada objeto para luego elegir la distancia ms corta. En este caso se obtienen ms
valores con el fin de obtener un poco mas de criterios de eleccin.
Fig. 62. Objeto reconocido- moneda
Fig. 63. Objeto reconocido-pieza amorfa 2
73
Fig. 64. Objeto reconocido-Memory stick
Fig. 65. Objeto reconocido-Pieza amorfa 1
CLASIFICADORES DE LOGICA DIFUSA
Los clasificadores de lgica difusa estn basados en la definicin de reglas de inferencia. A
diferencia de la lgica tradicional estos no tienen solamente valores de 0 o 1 si no valores
intermedios que hacen que la clasificacin tenga un alto rendimiento.
Para lograr esto, se comienza por definir las entradas y salidas difusas del sistema, esto con el fin
de que posteriormente podemos definir las reglas de inferencia que harn posible la clasificacin
del objeto.
Las entradas quedan definidas de la siguiente manera:
74
Fig. 66. Entradas difusas del momento 1 de los objetos
Fig.67. Entradas difusa del momento 2 de los objetos
Fig.68. Entradas difusas del momento 3 de los objetos
Una vez definidas las entradas difusas, procedemos a definir las salidas para su clasificacin.
75
Fig 69.Salida difusa de la moneda
Fig. 70. Salida difusa de la memory stick
Fig. 71. Salida difusa de la pieza amorfa 1
Fig. 72. Salida difusa de la pieza amorfa 2
76
Definidas las entradas y salidas difusas se procede a la implementacin de reglas de inferencia con
el fin de clasificar a los objetos.
Fig. 73. Definicin de reglas de inferencia
Todas la entradas dadas por los momentos de Hu se sacaron logaritmos para obtener un mayor
rango de valores con el fin de que la clasificacin se realice de manera adecuada.
Ahora bien, al momento de realizar la clasificacin, los objetos no fueron clasificados como se
esperaba. La clasificacin result de la siguiente manera:
Fig 74 Pieza amorfa 2 reconocida
77
Fig 75. Memory stick reconocida
Fig 76. Clasificador errneo. Confusin entre elementos
Como se puede observar, este clasificador no est identificando de manera correcta a los objetos
por lo que podemos decir que este no es el adecuado para utilizarlo. Esto es debido a que los
valores de los momentos de Hu son muy pequeos y al definir las reglas de inferencia se
confunden. Se trabaj sacando el logaritmo de esto momentos para poder ver si en algo mejoraba
la clasificacin, sin embargo el resultado era el mismo y no clasificaba de manera adecuada. Se
trabaj una tercera opcin que era el emplear las reas de las figuras, y al final se obtuvieron los
mismos resultados. Con esto se puede concluir que este clasificador no es el adecuado para
reconocer e identificar objetos.
78
Fig. 77 Definicin de entradas difusas de las reas
Fig.78. Definicin de salidas difusas de las reas
Como se puede observar, con las reas tampoco se logr una mejora sustancial ya que se seguan
confundiendo al momento de realizar la clasificacin. Con esta opcin queda definitivamente claro
que el clasificador no es el adecuado.
5.3 RESULTADO
La clasificacin de los objetos mediante la tcnica de los momentos de Hu tiene un mejor
rendimiento cuando se utiliza tcnicas de clasificacin de distancia mnima y la de vecinos ms
cercanos. Como se pudo observar estos clasificaban sin confundirse y no existan inconvenientes
como ocurri en el caso del clasificador de lgica difusa que clasificaba pero con confusin. Lo
que se puede decir que no es una tcnica adecuada para trabajar con valores muy pequeos que
en este caso nos entregaba los 7 momentos de Hu.
79
80
CAPITULO 6
APLICACIN INDUSTRIAL
6.1 Introduccin
La visin artificial es muy utilizada dentro de la industria metlica debido a que las aplicaciones
que esta rea ofrece son muy amplias. Esta industria posee un alto grado de aplicaciones con
visin artificial ya que las mismas se las emplea en el reconocimiento de piezas, calibracin de
objetos, cortado y soldado, clasificacin, etc. Cada una de las aplicaciones antes mencionadas
debe tener un alto grado de precisin ya que al ser una industria en donde las medidas deben ser
lo ms exactas posible entonces se requiere de un sistema tambin que sea altamente preciso.
Para esto se ha llevado una aplicacin de las tcnicas de los momentos de Hu y sus clasificadores a
la industria metlica.
Fig. 79. Parque industrial Cuenca [16]
6.2 Industria metlica
Es el sector industrial que incluye las actividades relacionadas con el procesamiento de metales
para la fabricacin de piezas, mquinas y herramientas que se necesitan en la industria y en otros
sectores de la economa. Por ejemplo, actividades como la fabricacin de lminas de acero, y
planchas para hornos, ingeniera de precisin, construccin de maquinaria elctrica, fabricacin de
equipos electrnicos, y materiales, para transporte areo, terrestre, astilleros, etc.
81
Fig 80. Piezas producidas en la industria metalmecnica[12].
La industria que tiene esta clasificacin manual se llama INSOMET. Esta industria adems de
fabricar productos como son los textiles, se dedica a la fabricacin de piezas metlicas para la
distribucin a las fabricas que forma parte de la empresa, una de ellas es TELARTEC, que se
encarga de la reconstruccin de maquinas en mal estado, y a su vez necesita de piezas que esta
empresa les distribuye. Sin embargo el trabajo se lo hace de manera manual y es tedioso por la
confusin y la cantidad de piezas que hay que identificar. Por esta razn se hizo el estudio a fin de
analizar si es o no factible implementar en la fbrica. Segn los resultados obtenidos los resultados
fueron bastante buenos por lo que se hizo varias pruebas con 4 objetos que nos facilitaron en la
industria para ver si con estos se llegaba a clasificar de manera adecuada. El prototipo que se
construy cumple con las normas que requiere la industria, por lo que se puede decir que es muy
factible su implementacin.
6.3 Identificacin y clasificacin de piezas metlicas
Varias son las formas que se pueden obtener de un tratamiento de acero. Clasificarlas de manera
manual todos estos tipos resultara un poco medio tedioso ya que tomara tiempo y muchas veces
hasta abra confusin ya que se tienen muchas piezas de distinto tamao y muy parecidas en su
dimensin, que en algn momento nos llegaramos a confundir. Para esto se ha aplicado una
tcnica de visin artificial denominado los momentos de Hu. Estos momentos son invariantes a la
rotacin, movimiento, traslacin y escalamiento. Con los datos obtenidos que nos entregan estos
momentos dependiendo de la figura que estemos analizando, se procede a aplicar un clasificador
el cual con son ciertas consideraciones permitir que identifiquemos a los objetos sin problema
alguno. Como ya se ha explicado en los captulos anteriores, los datos deben ser clasificados y
ordenados de manera tal que el clasificador no tenga confusin alguna y pueda saber cul es la
pieza que deseamos identificar.
82
Fig 81. Reconocimiento de una pieza metlica
En la figura anterior se puede observar la clasificacin de una pieza metlica con una forma
amorfa. Lo interesante de este clasificador es que no solo sirve para clasificar figuras con un
estndar de forma definida, si no que no interesa la forma, posicin o el tamao que tenga, el
clasificador lo identifica sin ninguna manera. La consideracin que se debe tener es que el sistema
debe ser implementado en un lugar en donde la luz no intervenga, ya que la misma puede incidir
en el clculo y procesamiento de las imgenes.
6.4 ANALISIS DEL PROTOTIPO EN LA INDUSTRIA INSOMET
Una vez terminado el prototipo con sus distintas pruebas, se llev a la industria solicitante del
proyecto. Aqu se realizaron distintas pruebas de los objetos que la misma nos proporcion. Los
resultados fueron bastante buenos ya que clasificaba las distintas piezas sin cometer errores.
Por otro lado, otra consideracin que se debe tener presente es la ubicacin de la cmara, ya que
si esta no est enfocando a las imgenes o esta con un nivel de intensidad que no es la adecuada
el resultado ser errneo y la clasificacin de igual forma. Esto ocurri en un principio que la
cmara estuvo mal enfocada y los momentos no calculaban los valores adecuados.
83
84
EXPERIMENTACION Y RESULTADOS
Una vez obtenido los distintos resultados aplicando las tcnicas de clasificadores se pudieron
observar cosas interesantes al momento de realizar la clasificacin. La primera observacin que se
pudo hacer es que en la obtencin de los momentos de Hu, se obtuvieron parmetros muy
pequeos que al principio parecan est mal, debido a que todos eran muy parecidos y en algunos
momentos se obtuvieron valores de 0. A medida que se fueron realizando las distintas pruebas se
fue entiendo el por qu de estos momentos. La cuestin es que las figuras con las que estamos
trabajando no tienen un rea muy grande por lo que el valor de los momentos es pequeo. Por
otro lado, tambin debemos considerar trabajar de 6 a 7 decimales con estos, ya que al comienzo
se trabajaron solo con 2 lo que ocasionaba que la clasificacin no se haga de manera adecuada.
La segunda observacin que se pudo realizar es que la clasificacin de los objetos con los datos de
los 7 momentos se la puede hacer de distinta manera, ya sea utilizando un clasificador de distancia
mnima, de K vecinos ms cercanos o la de lgica difusa. Este ltimo clasificador se implement
para hacer un contraste entre estos 3 para ver cul era la fiabilidad de cada uno de ellos. Con los
dos primeros clasificadores no se tuvo ningn inconveniente ya que estos entregan valores de
acorde al clculo de la distancia y los objetos eran reconocidos sin ningn inconveniente. Con el
tercer clasificador sucedi algo bastante extrao, al implementar un clasificador difuso se tena la
idea que este iba a funcionar mucho mejor que los anteriores debido a su gran nivel de
aplicabilidad y fiabilidad que este tiene en procesos industriales, sin embargo al hacer las pruebas
este fue el que peor reaccion, ya que los objetos no se clasificaban de manera adecuada. Esto se
debi a que al momento de definir las entradas y salidas difusas los valores de los momentos de
Hu eran muy pequeos y parecidos lo que haba un solape entre estas. Esto se dio a que fue
imposible clasificar de esta manera. Se trato de sacar los logaritmos de cada momento, sin
embargo no funciono. Tambin se prob obteniendo las reas de los objetos y tampoco funciono.
Lo que se llego a la conclusin que este clasificador no es el adecuado para este proceso cuando se
tiene valores pequeos y sobre todo muy parecidos. Todo lo explicado anteriormente se puede
ver en las siguientes graficas de precisin y cobertura.
Fig 82. Aciertos y Errores del clasificador de distancia mnima para el objeto moneda
0
5
10
15
20
N
M
E
R
O
D
E
P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO MONEDA.
ACIERTOS
ERRORES
85
Fig 83. Aciertos y Errores del clasificador de distancia mnima para el objeto memory stick
Fig 84. Aciertos y Errores del clasificador de distancia mnima para el objeto moneda
0
5
10
15
20
25
N
M
E
R
O
D
E
P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO MEMORY STICK
ACIERTOS
0
5
10
15
20
25
N
M
E
R
O
D
E
P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA1
ACIERTOS
86
Fig 85. Aciertos y Errores del clasificador de distancia mnima para el objeto amorfa 2
De la misma manera se trabajo con pruebas con el clasificador de los vecinos ms cercanos. Los
resultados obtenidos fueron muy favorables. A continuacin se muestran los resultados:
Fig 86. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto moneda
0
2
4
6
8
10
12
14
16
18
20
N
M
E
R
O
D
E
P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 2
ACIERTOS
ERRORES
0
5
10
15
20
25
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE LOS VECINOS MAS CERCANOS
ACIERTOS Y ERRORES DEL
OBJETO MONEDA
ACIERTOS
87
Fig 87. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto memory stick
Fig 88. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto amorfa 1
0
5
10
15
20
25
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE LOS VECINOS MAS CERCANOS
ACIERTOS Y ERRORES DEL
OBJETO MEMORY STICK
ACIERTOS
0
5
10
15
20
25
N
M
E
R
O
D
E
P
U
E
B
A
S
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 1
ACIERTOS
88
Fig 89. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto amorfa 2
Las graficas que se obtiene con el clasificador de lgica difusa tienen una gran diferencia con los
vecinos ms cercanos y distancia mnima. La mayor parte de las pruebas este se equivocaba al
identificar los objetos. Estos se puede observar en los siguientes cuadros comparativos.
Fig 90. Aciertos y Errores del clasificador de lgica difusa para el objeto moneda
0
2
4
6
8
10
12
14
16
18
20
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE VECINOS MAS CERCANOS
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 2
ACIERTOS
0
5
10
15
20
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL OBJETO
MONEDA
ACIERTOS
ERRORES
89
Fig 91. Aciertos y Errores del clasificador de lgica difusa para el objeto memory stick
Fig 92. Aciertos y Errores del clasificador de lgica difusa para el objeto pieza amorfa 1
0
5
10
15
20
25
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL
OBJETO MEMORY STICK
ERRORES
0
5
10
15
20
25
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 1
ERRORES
90
Fig 93. Aciertos y Errores del clasificador de lgica difusa para el objeto pieza amorfa2
De esta experimentacin se puede decir que los momentos de Hu es una tcnica bastante til y
sencilla de implementar ya que utilizando clasificadores adecuadas se puede lograr un trabajo
bastante aceptable en cuanto al reconocimiento de patrones se refiere. Acotando tambin que el
clasificador difuso no es bueno en algunos casos siendo este descartado cuando se vaya a realizar
un trabajo de reconocimiento de objetos.
Estos serian los resultados obtenidos en la experimentacin y estudio del presente trabajo.
0
5
10
15
20
25
N
M
E
R
O
D
E
P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 2
ERRORES
91
CONCLUSIONES
Dentro de la electrnica tenemos un campo amplio denominada visin artificial. Este campo es
muy til para poder realizar distintas aplicaciones ya sea a nivel domestico como a nivel industrial,
como es el control y clasificacin de productos, control de calidad, verificacin de medidas en las
distintas piezas que se fabrica, etc. Tomando como referencia este aspecto hemos propuesto en
esta tesis investigar un poco ms a fondo la aplicacin que se le puede dar a este campo
implementando un sistema de clasificacin basado en la tcnica de los momentos de Hu ms
clasificadores que permitan realizar el objetivo planteado.
Como se pudo observar, varios fueron los aspectos que se tuvieron que considerar para lograr
implementar el sistema, uno de ellos fue el saber cules son las etapas necesarios para poder
obtener la correcta informacin de los objetos que queremos clasificar. Uno de las primeras
etapas era la adquisicin. Esta etapa constituye en un factor muy importante ya que si desde aqu
no obtenemos la calidad necesaria de los objetos o la cmara o el factor de iluminacin no est
bien definido, no podremos obtener valores correctos lo que el procesamiento nos resultara
falloso. Por otro parte una vez solucionada este factor procedemos a procesar la imagen como es
la binarizacin de la misma, ya que as podremos obtener valores de 1 a 255 para un mejor y ms
rpido procesamiento.
Por otro lado, con todas las caractersticas descritas se pudo obtener los momentos de Hu. Estos
momentos de Hu son muy tiles para la caracterizacin de los objetos ya que los mismos permiten
obtener valores para luego clasificarlos y de esta forma saber que objeto es el que estamos
analizando. Adems de esto se debe tener muy en cuenta que estos momentos en nuestro caso
son muy pequeos por lo que puede darse la confusin que no existe valores para ciertos de ellos.
Lo que se debe hacer o lo que se hizo en nuestro caso es trabajar con 7 decimales para saber el
valor exacto de los mismos. Con esto podramos implementarlos en los respectivos clasificadores.
Cabe adems recalcar que si los valores en los dems momentos salan cero era por el tamao del
objeto analizado, ya que segn esto
En cuanto a la parte de los clasificadores, se tuvo un muy buen resultado ya que el de distancia
mnima y el de K vecinos no daba ningn error y clasificaba sin ningn problema. Pero en cuanto
al clasificador de lgica difusa, se tuvo un problema que los objetos no eran reconocidos de
manera adecuada. Esto se debi a que al ser los valores de los momentos de Hu muy pequeos no
se podra definir la reglas de inferencia de manera adecuada por lo que haba la confusin en su
clasificacin. Se trato de sacar el logaritmo de los valores y definir nuevas reglas, pero el resultado
sigui siendo el mismo. Luego se intento trabajar con las reas de las figuras para redefinir
nuevamente las reglas, sin embargo no se obtuvo nada. Lo que nos lleva a concluir que este
clasificador no es el adecuado cuanto se trabaja con valores pequeos y sobre todo muy
parecidos.
Podemos adems recalcar que los momentos de Hu y los clasificadores pueden ser aplicados en
cualquier rea, ya sea de la medicina, industria alimentaria, metlica, de cermicas etc, ya que al
ser una tcnica que nos entrega valores y posteriormente podemos clasificarlos, podemos
implementar en cualquiera de estas reas sin problema alguno.
92
Un trabajo a futuro que se podra implementar es trabajar con los momentos de Hu aplicando
clasificadores de redes bayesianas. Este tipo de clasificadores al tener un alto nivel de clculo
matemtico y sobre todo de probabilidad y estadstica, nos puede dar un porcentaje de precisin
bastante alto, lo que sera aun ms robusto el sistema. Adems se podra dar nuevas aplicaciones
a esta tcnica, como es el caso de la clasificacin de figuras pero tomando en cuanto su
representacin en 3d. Este tipo de aplicacin sera muy bueno ya que aqu se podra considerar
absolutamente todas las caractersticas del objeto en cuestin que se desee analizar.
Se puede concluir acotando que esta tcnica nueva de visin artificial es robusta, a pesar de que
existan otras tcnicas, esta ofrece fiabilidad y su fcil implementacin
93
BIBLIOGRAFIA
[1]http://3.bp.blogspot.com/_uXlJEIeijms/TAC_Lt-
xhI/AAAAAAAAEeQ/YPJz2ImkmDU/s1600/bernhard-plockhorst-entrada-de-jesus-en-jerusalen.jpg
[2]http://bcs.fltr.ucl.ac.be/FE/18/ARIST/Aristote_fichiers/filippino_lippi.jpg
[3]http://eisc.univalle.edu.co/materias/Vision_Computacional/material/Libro%20Vision%20Artifici
al/visiona.pdf
[4] Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
[5]http://tesis.pucp.edu.pe/repositorio/handle/123456789/68
[6]http://biometrics.org/bc2009/presentations/wednesday/Alonso-
Fernandez%20MR%2016%20Wed%20930%20AM%20-%20950%20AM.pdf
[7]Maestria en control y automatizacion-Control digital avanzado, Fundamentos del Control
Difuso, Ing. Ismael Minchala, Msc
[8]Reconocimiento de objetos con visin artificial a travs de Vectores de caractersticas y
distancias mnimas, Ismael Minchala vila.
[9]http://es.scribd.com/doc/58302048/85/Clasificador-de-k-vecinos-mas-cercanos
[10]http://sci2s.ugr.es/docencia/algoritmica/Practicas%20-%20SI.pdf
[11]http://www.sc.ehu.es/ccwbayes/docencia/mmcc/docs/t9knn.pdf
[12]http://www.jmcprl.net/GLOSARIO/METALURGIA.HTM
[13]http://www.cs.st-andrews.ac.uk/~yumeng/yumeng-SIFTreport-5.18_bpt.pdf
[14] Object Detection using Geometric Invariant Moment, American Journal of Applied Sciences
[15]http://www.neuronet.cl/egroupware/sitemgr/sitemgr-
site/templates/neuronet/images/SeparacionClasesHiperPlano.JPG
[16] http://www.eltiempo.com.ec/fotos-cuenca-ecuador/ecuador/t1_1234404033.jpg