0% encontró este documento útil (0 votos)

142 vistas92 páginas

Vision Artificial

Este documento presenta un estudio sobre la identificación de objetos en tiempo real utilizando técnicas de visión artificial. Describe los conceptos básicos de visión artificial, las etapas de adquisición y procesamiento de imágenes, técnicas de reconocimiento de patrones y modelos de clasificadores. También incluye la implementación de un sistema de visión artificial y su aplicación industrial para la clasificación de piezas metálicas.

Cargado por

Stephanie Rodríguez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

142 vistas92 páginas

Vision Artificial

Cargado por

Stephanie Rodríguez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 92

2

IDENTIFICACIN DE OBJETOS EN TIEMPO REAL UTILIZANDO TCNICAS Y

CLASIFICADORES DE VISIN ARTIFICIAL PARA EL RECONOCIMIENTO DE
PATRONES

Jaime Santiago Snchez Reinoso
Estudiante de la carrera de Ingeniera Electrnica
Facultad de ingenieras
Universidad Politcnica Salesiana

Dirigido por:

Ing. Vladimir Robles B.
Ingeniero de Sistemas
Docente de la Universidad Politcnica Salesiana
Facultad de Ingenieras
Carrera de Ingeniera De Sistemas

.

CUENCA ECUADOR
2010 2011

3

Breve resea del autor e informacin de contacto:

Jaime Santiago Snchez Reinoso
Estudiante de la carrera de Ingeniera Electrnica
Facultad de ingenieras
Universidad Politcnica Salesiana
[email protected]

Ing. Vladimir Robles B.
Ingeniero De sistemas
Docente de la Universidad Politcnica Salesiana
Facultad de ingenieras
Carrera de Ingeniera De Sistemas
[email protected]

Todos los derechos reservados.
Queda prohibida, salvo la excepcin prevista por la ley, cualquier forma de reproduccin, distribucin, comunicacin
pblica y transformacin de esta obra para fines comerciales, sin contar con la autorizacin de los titulares de propiedad
intelectual. La infraccin de los derechos mencionados puede ser constitutiva de delito contra la propiedad intelectual.
Se permite la difusin de este texto con fines acadmicos o investigativos por cualquier medio, con la debida
notificacin a los autores.
4

DERECHOS RESERVADOS
2011 Universidad Politcnica Salesiana
CUENCA ECUADOR SUDAMERICA

Ing. Vladimir Robles B.

CERTIFICA:

Haber dirigido y revisado prolijamente cada uno de los
captulos del informe de monografa, realizada por el Sr.
Jaime Santiago Snchez Reinoso, y por cumplir los
requisitos, Autoriz su presentacin.

Cuenca, Octubre del 2011

Ing. Vladimir Robles B
Director

5

DECLARACION DE RESPONSABILIDAD

Los conceptos desarrollados, anlisis realizados y las conclusiones del presente trabajo, son de
exclusiva responsabilidad del autor.

Cuenca, Septiembre 2011

Jaime Santiago Snchez Reinoso

6

INDICE

Dedicatoria II
Agradecimiento III
ndice de Figuras IV
ndice de Tablas V

ESQUEMA DE CONTENIDOS

INTRODUCCIN

CAPITULO 1

VISIN ARTIFICIAL

1.1 Introduccin
1.2 Que es la Visin artificial
1.3 Aplicaciones de la visin artificial
1.4 Elementos de una percepcin visual

CAPITULO 2

ETAPAS DE LA VISIN ARTIFICIAL

2.1Introduccin
2.2Adquisicin de imgenes
2.2.1 Usando Arrays
2.2.2Usando Sensores
2.2.3 Sistema de iluminacin
2.2.4 Fuente de iluminacin
2.3 Procesamiento de imgenes
2.3.1 Cuantizacin y muestreo
2.3.2 Representacin de imgenes digitales

2.4 Segmentacin

2.4.1 Segmentacin en pixeles
2.4.2 Operaciones morfolgicas
7

2.4.3 Etiquetado y cuenta de objetos
CAPITULO 3

TCNICAS DE RECONOCIMIENTO DE PATRONES Y MODELOS DE
CLASIFICADORES

3.1 Introduccin

3.2 Tcnicas de reconocimiento de patrones
3.2.1 Momentos de HU
3.2.2 SIFT
3.2.2.1 Operacin de SIFT
3.2.3 Reconocimiento estadstico de patrones
3.2.4 Redes neuronales
3.2.4.1 Caractersticas de una red neuronal
3.2.4.2 Redes Perceptron
3.3 Modelo de Clasificadores
3.3.1Lgica difusa
3.3.1.1 Aplicaciones de la lgica difusa
3.3.1.2 Crisp Logic
3.3.1.3 Funcin caracterstica
3.3.1.4 Conjunto difuso
3.3.1.5 Funcin de membreca
3.3.1.6 Grado de membreca
3.3.1.7 Variable Lingstica
3.3.1.8 Razonamiento aproximado
3.3.1.9 Controlador Difuso
3.3.1.10 Defusifiacin
3.3.2Redes bayesianas
3.3.2.1 Aprendizaje de redes bayesianas
3.3.2.1 Aplicacin de redes bayesianas
3.3.3Distancia mnima
3.3.4 K vecinos
3.3.4.1 Variantes sobre el algoritmo bsico

CAPITULO 4

IMPLEMENTACIN DEL SISTEMA DE VISIN ARTIFICIAL

4.1 Introduccin

4.2 Implementacin de Hardware
4.2.1 Cmaras
4.2.3 Sistema de iluminacin

4.3 Implementacin de Software
7.3.1 Captura de imgenes
8

4.4 Procesamiento de la imagen
4.4.1 Umbralizacin
4.4.2 Etiquetado
4.4.3 Filtrado

CAPITULO 5

CALCULO MATEMTICO DE LAS TCNICAS DE RECONOCIMIENTO DE
PATRONES

5.1 Introduccin
5.2 Clculo de los momentos de Hu.
5.2.1 Parmetros
5.2.2 Proceso de clculo
5.3 Resultado

CAPITULO 6

APLICACIN INDUSTRIAL

6.1 Introduccin

6.2 Industria metlica

6.3 Identificacin de piezas metlicas

6.4 Clasificacin de piezas metlicas

EXPERIMENTACION Y RESULTADOS
CONCLUSIONES
BIBLIOGRAFIA

9

II

DEDICATORIA

Este trabajo lo dedico a mis padres Que fueron el
pilar fundamental Para lograr terminar el trabajo con
xito. De la misma forma a los compaeros y
docentes que me brindaron su apoyo incondicional.
Jaime

10

III

AGRADECIMIENTOS

Primeramente agradezco a Dios Por haber logrado con xito
la consecucin de mi tesis. Despus a mis padres que Fueron las
personas ms Importantes que estuvieron conmigo brindndome
todo su apoyo en los momentos de Dificultad. Adems a todas las
personas que me brindaron su ayuda para la consecucin de este
proyecto y de manera especial a mi director Ing. Vladimir Robles
B. quien me brindo su apoyo y ayuda en el transcurso del presente
trabajo.
Jaime

11

INDICE DE FIGURAS

Fig. 1. Pintura pre renacentista. Jess entrando a Jerusaln 15
Fig. 2. Pintura renacentista. Iglesia del espritu santo 15
Fig. 3. Maquina de perspectiva 16
Fig. 4. Cmara oscura 16
Fig. 5. . Ojo humano 18
Fig. 6. Representacin grfica de un ojo mirando una palmera 19
Fig. 7. Rango de las sensaciones subjetivas mostradas en un nivel 20
particular de adaptacin
Fig. 8. Ilusiones pticas 20
Fig. 9. Representacin grafica de una longitud de onda 21
Fig. 10. Ejemplo de un proceso de adquisicin de imgenes mediante arrays 23
Fig. 11. Sensor simple 23
Fig. 12. Combinacin de un sensor simple con movimiento 23
para generar una imagen 2D Fig. 13. Iluminacin Difusa 24
Fig. 14. . Iluminacin Frontal 25
Fig. 15. Iluminacin Direccional 25
Fig. 16. Iluminacin Estructurada 25
Fig. 17. Imagen Digital Generada 27
Fig. 18. Lnea explorada AB 27
Fig. 19. Muestreo y Cuantizacin 27
Fig. 20. Lnea digital explorada 27
Fig. 21. Imagen contina proyectada por un arreglo de sensores 28
Fig. 22. Resultado de la imagen muestreada y cuantizada 28
Fig. 23. Representacin de una imagen digital 29
Fig. 24. Niveles de gris para distintos bits de una imagen 30
Fig. 25. Imgenes con sus respectivos histogramas 31
Fig. 26. Ejemplo de dilatacin 32
Fig. 27. Imagen Original 32
Fig. 28. Imagen erosionada 32
Fig. 29. . Etiquetado y cuenta de objetos 34
Fig. 30. Imagen en forma de U etiquetada mediante el algoritmo de etiquetado 37
Fig. 31. Localizacin de la deteccin extrema 38
Fig. 32. Proceso para la obtencin de caractersticas con el mtodo SIFT 39
Fig. 33. Esquema de una red neuronal 39
Fig. 34. Red Perceptron 40
Fig. 35. Separacin de objetos en un hiperplano 41
Fig. 36. Funcin de membreca 44
Fig. 37. Planteamiento de un problema difuso 44
Fig. 38. Grado de Membreca 45
Fig. 39. Variable lingstica 45
12

Fig. 40. Sistema de un Controlador Difuso 46
Fig. 41. Proceso de defusificacin de un conjunto difuso 46
Fig. 42. Funcin de salida de un conjunto difuso 47
Fig. 43. Mtodo de Mamdani 47
Fig. 44. Mtodo del valor mximo 48
Fig. 45. Modelo de una red Bayesiana 49
Fig. 46. Limite de decisin de un clasificador de distancia mnima 51
Fig. 47. Ejemplo del clasificador K-NN 51
Fig. 48. Notacin para el paradigma K-NN 52
Fig. 49. Ejemplo del clasificador K-NN con distancia media 53
Fig. 50 Captura de la imagen 56
Fig. 51. Binarizacin de la imagen 56
Fig. 52. Pieza binarizada 57
Fig. 53. Etiquetado de la Imagen 57
Fig. 54. Adquisicin de Imgenes 59
Fig. 55. Binarizacin de la imagen 60
Fig. 56. Etiquetado de los objetos 60
Fig. 57. Momentos de Hu de los 4 objetos a reconocer 61
Fig. 58. Objeto reconocido-moneda 64
Fig. 59. Objeto reconocido-pieza amorfa2 64
Fig. 60. Objeto reconocido-Memory Stick 65
Fig. 61. Objeto reconocido-pieza amorfa 1 65
Fig. 62. Objeto reconocido- moneda 67
Fig. 63. Objeto reconocido-pieza amorfa 2 68
Fig. 64. Objeto reconocido-Memory Stick 68
Fig. 65. Objeto reconocido-Pieza amorfa 1 68
Fig. 66. Entradas difusas del momento 1 de los objetos 69
Fig. 67. Entradas difusa del momento 2 de los objetos 69
Fig. 68. Entradas difusas del momento 3 de los objetos 69
Fig. 69. Salida difusa de la moneda 70
Fig. 70. Salida difusa de la Memory Stick 70
Fig. 71. Salida difusa de la pieza amorfa 1 70
Fig. 72. Salida difusa de la pieza amorfa 2 71
Fig. 73. Definicin de reglas de inferencia 71
Fig. 74. Pieza amorfa 2 reconocida 72
Fig. 75. Memory stick reconocida 72
Fig. 76. Clasificador errneo. Confusin entre elementos 72
Fig. 77. Definicin de entradas difusas de las reas 73
Fig. 78. Definicin de salidas difusas de las reas 73
Fig. 79. Parque industrial Cuenca 75
Fig. 80. Piezas producidas en la industria metalmecnica 76
Fig 82. Aciertos y Errores del clasificador de distancia mnima para el objeto moneda 84
Fig 83. Aciertos y Errores del clasificador de distancia mnima para el objeto memory stick 85
Fig 84. Aciertos y Errores del clasificador de distancia mnima para el objeto moneda 85
13

Fig 85. Aciertos y Errores del clasificador de distancia mnima para el objeto amorfa 2 86
Fig 86. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto moneda 86
Fig 87. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto memory stick
87
Fig 88. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto amorfa 1 87
Fig 89. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto amorfa 2 88
Fig 90. Aciertos y Errores del clasificador de lgica difusa para el objeto moneda 88
Fig 91. Aciertos y Errores del clasificador de lgica difusa para el objeto memory stick 89
Fig 92. Aciertos y Errores del clasificador de lgica difusa para el objeto pieza amorfa 2 89
Fig 93. Aciertos y Errores del clasificador de lgica difusa para el objeto pieza amorfa2 90

INDICE DE TABLAS

Tabla 1 Pixeles de con vecindad 4 33
Tabla 2 Pixeles con vecindad 8 33
Tabla 3 Definicin de un Conjunto Difuso 43

14

CAPITULO 1

1.1 INTRODUCCION

Dentro de la electrnica, existe un rea que est en auge y se contina desarrollando es la visin
artificial. Esta rea se ocupa de simular el comportamiento del ojo del ser humano para lograr
realizar proyectos que requieren un alto grado de precisin visual.

Por otra parte, la visin artificial se puede aplicar en varios campos como son el mdico,
electrnico, mecnico, etc. Cada uno de estos campos requiere de una percepcin visual artificial
con un alto grado de precisin en virtud de que si se presentan errores, esto no permitir que el
sistema implementado tome acciones correctas de acuerdo a lo que ha captado.

1.2 Que es la visin artificial

La visin artificial es aquella herramienta que nos sirve para establecer la relacin que existe entre
un mundo que es tridimensional y tomar sus vistas bidimensionales. Si tomamos estas vistas
podemos hacer una reconstruccin de este espacio y mediante esto simular una caracterstica
tridimensional y pasarla a un plano bidimensional
1
.

1.2.1 Historia de la visin artificial

Los griegos llegaron a conocer muchas propiedades geomtricas de la proyeccin. Podemos citar
el caso de Tales de Mileto, que aplic sus conocimientos de la geometra y pudo predecir un
eclipse solar. Aparte de esto tambin pudo deducir la altura de una pirmide con solo ver la
sombra proyectada de la misma. Sin embargo los griegos tenan en su pensamiento que la visin
era activa, es decir, que los ojos emitan partculas de 3D al mundo exterior y no los consideraron a
estos como dispositivos pasivos receptores de luz.

Por otro lado, los pintores italianos del renacimiento fueron los que primero entendieron como se
formaban las imgenes y comenzaron a estudiar la geometra que les ayudara a reproducir
correctamente los efectos de la perspectiva en las imgenes de su entorno. La poca anterior de la
pintura fue plana, con lo que esta no mostraba ni diferenciaba la profundidad de los objetos
2
.

Los primeros indicios de perspectiva fueron inventados por Filippo Brunelleschi. Este fue un gran
arquitecto del renacimiento temprano. Adems de esta profesin fue escultor y pintor. Una de sus
principales obras fue la catedral santa Mara de Fiore que se encuentra en Florencia, en donde se
encuentra la cpula ms grande del mundo.

1
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
2
http://biometrics.org/bc2009/presentations/wednesday/Alonso-
Fernandez%20MR%2016%20Wed%20930%20AM%20-%20950%20AM.pdf

15

Fig 1. Pintura pre renacentista. Jess entrando a Jerusaln [1]

Fig 2. Pintura renacentista. Iglesia del espritu santo[2]

Avanzando en el tiempo, llegamos al siglo XVI, en donde se desarrolla la teora de la perspectiva.
Aqu se introducen las mquinas de perspectiva para ayudar a los pintores a reproducir su
perspectiva sin tener que hacer clculos matemticos. En la figura 2 se puede observar este tipo
de mquinas, en donde el ojo del dibujante se mantena fijo y se usa un material para interceptar
cada rayo visual con el plano de la imagen.

16

Fig 3. Maquina de perspectiva [3]

Las mquinas de perspectiva se pueden considerar como el primer intento de construir una
cmara. Estas utilizaban un plano donde se formaba la imagen y un punto central que no
perteneca al plano en donde se intersecan todos los rayos que formaban la imagen.

Entre 1596 y 1650 se empieza a concebir la geometra desde un punto de vista algebraico, por
esta razn las entidades geomtricas son descritas como coordenadas y entidades algebraicas.
Posteriormente en el ao 1826 el qumico francs Niepce lleva a cabo la primera fotografa
colocando una superficie fotosensible dentro de una cmara obscura para fijar la imagen. Despus
de este ao se logra realizar el primer proceso fotogrfico prctico. Aqu se utilizo una placa
fotogrfica que revelada con vapor de mercurio y fijada con trisulfato de sodio.

Fig 4. Cmara oscura [3]

17

1.3 APLICACIN DE LA VISION ARTIFICIAL

La visin artificial tiene un campo amplio de enfoques, ya que se puede implementar en cualquier
rea. Como ejemplo podemos citar las siguientes:

Mdica

Procesamiento de imgenes tomadas de las radiografas de los pacientes, ya sean esto de rayos X,
rayos gamma, o ultravioleta.

Fotogrametra

En donde se requiere realizar mediciones del espacio 3D a partir de fotografas tomadas de este,
de tal forma que se puede medir superficies, objetos, construcciones, etc.

Electrnica

Para la construccin, diseo e implementacin de componentes electrnicos en una placa
electrnica. Aqu se requiere de un alto grado de precisin para que estos elementos queden
ajustan si ningn grado de error.

Mecnica

Construccin de piezas con un alto grado de precisin. La percepcin visual capta las imgenes de
las piezas que se generan y con esto se puede ir observando que se vayan obteniendo de manera
ptima las piezas.
Verificacin: si es que todo el proceso que estuvo en marcha cumpli con el objetivo deseado. Por
ejemplo verificar si es que las piezas se colocaron en su lugar correcto o estn en la posicin
programada.

Deteccin de fallas

Involucra la deteccin de defectos o artefactos no deseados que tienen una forma desconocida y
estn en una posicin no deseada. Tambin se puede calificar a todo este proceso como un
anlisis cualitativo

Estimacin de movimiento

Mediante una cmara que adquiere una imagen de un objeto en movimiento, se puede hacer una
aproximacin de este objeto a partir de ciertos puntos que tengan correspondencia con la
secuencia de imgenes que se fueron adquiriendo

18

1.4 ELEMENTOS DE UNA PERCEPCION VISUAL

Ojo humano

Un ojo humano es cercanamente parecido a una esfera, con un dimetro promedio de alrededor
de 20mm. Est constituido por tres membranas principales la cornea, la coroidea y la retina. La
cornea es una capa resistente que cubre la superficie anterior del ojo. A continuacin de la cornea,
la esclera es una membrana opaca que se encierra y recubre el glbulo ptico.

La coroidea se conecta directamente con la esclera. Esta membrana contiene una red de vasos
sanguneos que sirven como la mayor fuente de nutricin del ojo.

Los lentes por otro lado, son hechos de de capas concntricas de clulas fibrosas y estn
suspendidas por fibras que unen el cuerpo ciliar. Esto contiene un 60 a 70% de agua, 6% de grasa y
ms protena que otra componente en el ojo humano. Los lentes son de colores por una suave
pigmentacin amarillenta que se va incrementando a medida que va pasando la edad
3
.

Fig 5. Ojo humano [4]

FORMACIN DE UNA IMAGEN EN EL OJO HUMANO

La principal diferencia entre los lentes de un ojo y unos ordinarios lentes pticos es que la
formacin es flexible. La figura 4 muestra el radio de curvatura de la superficie anterior a los
lentes que es mucho ms grande que el radio de la superficie posterior. La forma de los lentes es
controlada por la tensin en las fibras del cuerpo ciliar. Para enfocar los objetos distantes, el

3
Digital Image Processing, Rafael C. gonzalez, Richard E. Woods, Second edition

19

control de los msculos causa que los lentes se aflojen. Similarmente, estos msculos permiten
que los lentes lleguen a ser ms delgados para que el enfoque de los objetos este cerca del ojo.

La distancia entre el centro de los lentes y la retina vara aproximadamente 17mm a 14 mm, como
la energa refractiva de los lentes incrementa del mnimo a su mximo. Cuando el ojo enfoca un
objeto lejano ms o menos unos 3 metros, los lentes muestran sus niveles ms bajos de energa
refractiva. Por el contrario, cuando el ojo enfoca un objeto cercano, los lentes se hacen ms
fuertes con la energa refractiva. Esta informacin hace ms fcil calcular el tamao de la imagen
en la retina de cualquier objeto
4
.

Fig 6. Representacin grfica de un ojo mirando una palmera.[3]

ADAPTACIN DEL BRILLO Y DISCRIMINACIN

Las imgenes digitales son mostradas como un conjunto de intensidades, la habilidad de los ojos
para discriminar entre diferentes intensidades, es una importante consideracin en la
presentacin del resultado de imgenes. El rango de la intensidad de la luz al cual el sistema visual
humano se puede adaptar es enorme. Este rango esta en el orden de 10
10
posibilidades. De
manera experimental se indica que el brillo de la visin humana es una funcin logartmica.

4
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
20

Fig 7. Rango de las sensaciones subjetivas mostradas en un nivel particular de adaptacin.[4]

La curva slida representa el rango de intensidades a las cuales el sistema visual puede adaptarse.
En una visin fotpica, el rango se encuentra alrededor de 10
6
. La transicin de escotpica a
fotpica es gradual y esta se encuentra desde los 0.001 a los 0.1 mililamberts.

El punto esencial en interpretar el rango impresivo es que el sistema visual no puede operar sobre
un rango simultneo. Ms bien, esto se enfoca a las largas variaciones por los cambios dados en la
sensitividad, un fenmeno que se conoce como adaptacin al brillo.

ILUSIONES OPTICAS

Fig. 8. Ilusiones pticas [4]

Otros ejemplos de un fenmeno de percepcin son las ilusiones pticas en las cuales los ojos se
llenan de informacin inexistente o errneamente percibe propiedades geomtricas de los
21

objetos. Un ejemplo se puede ver en la figura 8. En el primer cuadrante se pueden observar 4
crculos cortados que dan el efecto de un cuadrado. Esto mismo podemos analizar con los dems
cuadrantes en donde se observa que con colocar lneas en diferente sentido se puede lograr otras
percepciones visuales como es el caso de un crculo en el segundo cuadrante, las flechas ms
grandes en el tercero y lneas desviadas en el ltimo.

LUZ Y ESPECTRO ELECTROMAGNETICO

En 1666, Isaac Newton descubri que cuando se irradia un rayo de luz y este a su vez pasa por un
prisma de vidrio, la irradiacin emergente de luz no es blanca, en vez de esto se obtiene un
espectro continuo de colores comenzando desde el violeta y terminando en rojo. En la figura 8, se
puede observar que el rango de colores que nosotros percibimos representa una pequea porcin
del espectro electromagntico. La finalizacin del espectro son ondas con una longitud que
alcance millones de veces la longitud de la luz visible. Por el otro extremo del espectro estn los
rayos gamma con longitudes de onda millones de veces ms pequeas que de los de la luz visible.
El espectro electromagntico puede ser expresado en trminos de longitud de onda, frecuencia o
energa. La longitud de onda y la frecuencia (v) estn relacionadas por la expresin:

=

(1)

Donde c es la velocidad de la luz que es una constante que vale 2.998x10
8
m/s. La energa de
varios componentes del espectro electromagntico estn dados por la expresin:

E=h.v (2)

Donde h es la constante de Planck. Las unidades de la longitud de onda son metros con los prefijos
micro y nano. Estos son los que se usan con frecuencia.

Fig. 9. Representacin grafica de una longitud de onda [4]

22

23

CAPITULO 2
ETAPAS DE LA VISION ARTIFICIAL

2.1 INTRODUCCION

Dentro de un sistema de visin artificial se pueden implementar varias tcnicas. Una de ellas es el
procesamiento de imgenes en donde se incluyen las etapas de captura, codificacin de imgenes
y transformacin. Otro aspecto que tambin se considera en un sistema de visin artificial es el
reconocimiento de formas, tcnica que incluye metodologas de modelado geomtrico.
Por otro lado, el sistema de implementacin juega un papel muy importante en el desarrollo de
cualquier sistema, ya que si cualquiera de las etapas falla, el resultado no ser el esperado y el
proceso resultara errneo.

2.2 ADQUISICIN DE IMGENES

Los tipos de imgenes en las cuales estamos centrados en este estudio son generados por la
combinacin de una fuente de iluminacin y reflexin o absorcin de energa de la fuente de los
elementos de la escena que ser capturada. Nos centraremos en la iluminacin y la escena para
resaltar que estos aspectos son muy importantes y por qu se deben de tomar en cuenta. Por
ejemplo, la iluminacin puede ser originada de una fuente de energa electromagntica tal como
un radar, infrarrojo, o energa de rayos X.
De forma similar, los elementos de la escena pueden ser objetos familiares, pero estos fcilmente
pueden ser molculas, rocas sepultadas o un cerebro humano.

2.2.1 USANDO ARRAYS

Varios dispositivos electromagnticos y ultrasnicos vienen dados en formato de arrays. Esto
tambin es predominante en las cmaras digitales. Un tipo sensor para estas cmaras en un array
CCD
5
, el cual puede ser construido con un rango amplio de propiedades de sensado y puede ser
empaquetado en conjuntos de arrays de 4000X4000 elementos y hasta mas
6
.

La principal manera en la cual estos sensores son usados se puede apreciar en la figura 10. Aqu se
puede observar la energa de una fuente de iluminacin siendo reflejada de una escena de un
elemento. La primera funcin dada por un sistema de captura es recolectar la energa que ingresa
y enfocarla en un plano donde se encuentra la imagen. Si la iluminacin es luz la terminacin
frontal del sistema de imagen es un lente que proyecta la vista de la escena en el plano que se
enfoc.

5
Dispositivo de carga acoplada que tienen varios capacitores capaces de transferir energa
6
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
24

Fig. 10. Ejemplo de un proceso de adquisicin de imgenes mediante arrays [4]

2.2.2 USANDO SENSORES

En la figura 10 se puede observar los componentes de un sensor simpe. Quizs el tipo ms familiar
de este sensor es un fotodiodo, el cual es construido de un material de silicn y cuya forma de
onda de voltaje de salida es proporcional a la luz. El uso de un filtro enfrente del sensor mejora la
selectividad.

Fig. 11. Sensor simple [4]

Por otro lado, para generar una imagen en 2D usando un simple sensor, tiene que existir un
desplazamiento relativo de las dos direcciones tanto x como en y entre el sensor y el rea de la
imagen. En la figura 11 se puede observar un arreglo usado en un escaneo de alta precisin donde
la pelcula negativa es montada sobre un tambor que tiene un mecanismo de desplazamiento que
hace que esta se mueva en una dimensin.

Fig 12. Combinacin de un sensor simple con movimiento para generar una imagen 2D.[4]

25

2.2.3 SISTEMA DE ILUMINACION

La iluminacin de la escena juega un papel muy importante para el desarrollo de un sistema visual.
Antes de pasar mucho tiempo en implementar algoritmos complejos para arreglar este problema,
es mejor prestar atencin en implementar un sistema de iluminacin adecuado para que cuando
se capturen las imgenes sea de manera correcta. Este sistema de iluminacin ser adecuado si se
puede corregir el problema mediante software, debido a que la velocidad de procesamiento ser
mayor con algoritmos ms sencillos
7
.

2.2.3.1 SISTEMA DE RETROALIMENTACION DIFUSA

Este tipo de iluminacin es muy adecuada para el reconocimiento o medida de una pieza solo si se
necesita el contorno y es posible apoyar dicho objeto sobre una superficie transparente.
La retroalimentacin difusa consiste en iluminar contra la cmara, dejando el objeto entre la
cmara y la lmpara. Esta tcnica entrega imgenes con un alto contraste entre el objeto y el
fondo, dando como resultado una segmentacin fcil ya que se puede aplicar una binarizacin.

Dentro de las principales aplicaciones en donde tiene un adecuado comportamiento esta tcnica
de iluminacin son para medir el grado de porosidad de ciertas sustancias y en la inspeccin
dimensional para calcular el tamao de una pieza.

Fig 13. Iluminacin Difusa [5]

2.2.3.2 ILUMINACION FRONTAL

Es la ms usada. Tiene como objetivo iluminar la pieza frontalmente. La desventaja de esta tcnica
es que tiene problemas para obtener un buen contraste entre la pieza y el fondo, debido a que
aparecen brillos y sombras que alteran las propiedades de las piezas en estudio.

Esta tcnica se usa en objetos poco reflectores para evitar los brillos que molestan la captura en
una iluminacin difusa.

7
http://tesis.pucp.edu.pe/repositorio/handle/123456789/68

26

Fig 14. Iluminacin Frontal [5]

2.2.3.3 LUZ DIRECCIONAL

Consiste en iluminar un objeto de manera direccionada en algn sentido del espacio para poder
rescatar alguna caracterstica del objeto. La principal caracterstica es que se crean sombras sobre
el objeto, lo que ayuda a aumentar el contraste de partes tridimensional y obtener informacin en
3d.

Fig 15. Iluminacin Direccional [5]

2.2.3.4 LUZ ESTRUCTURADA

El objetivo de este tipo de iluminacin es proyectar la pieza sobre unos patrones de luz conocidos
modulados y observar la luz reflejada, que tambin viene modulada. De esta manera se puede
obtener la informacin de la superficie del objeto misma que puede reconstruirse mediante
triangulacin.

Las fuentes de luz que se pueden emplear deben ser espaciales capaces de emitir luz estructurada
que por lo general son laser.

Fig 16. Iluminacin Estructurada [5]

27

2.2.4 FUENTES DE ALIMENTACION

Entre los principales tipos de iluminacin tenemos:

Lmparas incandescentes: Es la fuente de iluminacin ms comn y est formada por un
filamento de tungsteno. Su principal ventaja es que tiene una gran variedad de potencias. Por otro
lado, su desventaja es que reduce la luminosidad con el tiempo, lo que ocasiona inconvenientes
con el sistema de visin.

Tubos fluorescentes: son mucho mejores que las lmparas incandescentes. Estos entregan una luz
ms difusa que es aprovechada en objetos que son reflectores. Existe una gran variedad de este
tipo de tubos.

Fibra ptica: este tipo se utiliza para iluminar zonas que realmente tienen un acceso difcil o
partes que son extremadamente pequeas.

Lasers: Estos se emplean para tener una iluminacin estructurada, debido a que este es capaz de
emitir luz con un control adecuado de luminosidad. La desventaja de este es que no se comporta
de manera adecuada en superficies que absorben la luz.

2.3 PROCESAMIENTO DE LA IMAGEN

Para el procesamiento de la imagen, debemos considerar que una imagen en 2 dimensiones se
puede representar de la siguiente forma , . El valor de la amplitud de f en coordenadas
espaciales (x,y) es un escalar positivo el cual tiene un significado fsico que se determina de la
fuente de donde se origina la imagen. Las imgenes con las que trabajaremos basan su esquema
de color en una escala de grises. Cuando una imagen es generada por un proceso fsico, su valor es
proporcional a la energa irradiada por la fuente fsica, por ejemplo una onda electromagntica.
Como consecuencia tenemos lo siguiente:

0 < , < (3)

La funcin , puede ser caracterizada por 2 componentes: la primera que contiene la
cantidad de una fuente de iluminacin incidente en la escena que est siendo observada y la
segunda que la cantidad de iluminacin reflejada por los objetos que se encuentran en la escena.
El nombre apropiado para definir a estas dos caractersticas son la iluminacin y la reflectancia,
componentes que se les denota como , y , respectivamente. Las dos funciones se
combinan para obtener:

, = , , (4)

0 < , <

0 < , < 1
Esta ltima expresin nos indica que la reflectancia es limitada a 0 cuando esta totalmente
absorbida o 1 que tiene una total reflectancia. La naturaleza de , se determina por la fuente
de iluminacin y , se determina por la caracterstica de los objetos fotografiados.

28

2.3.1 CUANTIZACION Y MUESTREO

Para tener una idea de que es el muestreo y la cuantizacin podemos observar las siguientes
imgenes:

Fig. 17. Imagen Digital Generada [4]

Fig. 18. Lnea explorada AB [4]

Fig. 19. Muestreo y Cuantizacin [4]

Fig. 20. Lnea digital explorada [4]
29

En la funcin unidimensional de la figura 17, se grafica la amplitud de los valores continuos de la
imagen a lo largo del segmento AB de la figura 18. Las variaciones aleatorias son ruidos. Para
realizar el muestreo de esta funcin, tomamos muestras de espacios iguales a lo largo de la lnea
AB como se muestra en la figura 18. La localizacin de cada muestra est dada por una marca
vertical delgada en la parte inferior de la figura. Las muestras son mostradas con cuadros blancos
sobrepuestos en la funcin.

Por otro lado, el muestreo se lo hace asumiendo que tenemos una imagen continua en ambas
direcciones como tambin en amplitud. En la prctica el mtodo de muestreo se determina por un
arreglo de sensores usados para generar la imagen. Cuando la imagen es generada por un sensor
simple y combinada con un movimiento mecnico, la salida del sensor es cuantizada en la forma
que se describi arriba.

Cuando se usa un censado de banda para adquirir imgenes, el nmero de sensores en la banda
establece las limitaciones del muestreo. El movimiento mecnico en la otra direccin puede ser
controlado ms exactamente, pero esto hace que pequeas variaciones intenten muestrear toda
la densidad en esa direccin lo que hace que se exceda los limites de muestreo establecido por el
numero de sensores en la direccin opuesta.

Fig. 21. Imagen contina proyectada por un arreglo de sensores [4]

Fig. 22. Resultado de la imagen muestreada y cuantizada [4]

30

2.3.2 REPRESENTACION DE IMGENES DIGITALES

El resultado del muestreo y cuantizacion es una matriz de nmeros reales. Si asumimos que una
imagen , es muestreada entonces el resultado de la imagen tendr filas y columnas. El valor
de las coordenadas , sern ahora cantidades discretas. Para tener una notacin clara y de
conveniencia se denota con valores enteros estas coordenadas discretas. Los valores que se tiene
en el origen son (x,y)=(0,0). La prxima coordenada en el eje de las abscisas se representar como
(x,y)=(0,1). Es importante tener en cuenta que la notacin (0,1) se usa para representar la segunda
muestra a lo largo de la primera columna
8
.

Fig. 23. Representacin de una imagen digital [4]

Una vez descrita la notacin de una imagen digital, podemos describirla como una matriz de la
siguiente manera:

, =
0,0 0,1 . . 0, 1
1,0 1,1 . 1, 1
1,0 1,1 . 1, 1
5

El lado derecho de la ecuacin es la definicin de una imagen digital. Cada elemento de la matriz
se denomina elemento imagen, elemento grfico o pixel.
En algunos casos es mejor denotar como una matriz con sus elementos as:

=

,
. .
,

,
. .
,
6

Si denotamos Z y R como u conjunto de enteros reales y un conjunto de nmeros reales
respectivamente, el proceso de muestreo puede ser visto como una particin del plano xy en una
malla, con las coordenadas del centro de cada malla siendo un par de elementos de un producto
cartesiano Z
2
, el cual es un conjunto de pares ordenados (z
i
,z
j
) con z
i
y z
j
siendo enteros. De aqu

8
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
31

, es una imagen digital si (x,y) son enteros de Z
2
y f es una funcin que asigne valores de
niveles de grises.

Por otro lado, el proceso de digitalizacin requiere de decidir valores para filas, columnas y para L
que es un nivel discreto de gris para cada pixel. No existen reglas para las filas y columnas
solamente que los enteros tengan valores enteros positivos.

A la escala de grises se la puede representar de la siguiente manera:

L=2
K

Asumimos que los niveles discretos estn igualmente espaciados y que son enteros en un
intervalo de [0, L-1]. Algunas veces el rango de valores que abarca la escala de grises es llamada
rango dinmico de una imagen, y se refiere a aquellas imgenes cuyos niveles de grises tiene una
porcin significativa en la escala dinmica.

Fig. 24. Niveles de gris para distintos bits de una imagen. [4]

2.4 SEGMENTACION

La segmentacin es aquel proceso mediante el cual una imagen se descompone en regiones o
elementos que pueden corresponder a objetos o parte de objetos. Este proceso es el encargado
de evaluar si cada pixel de la imagen pertenece o no a dicho objeto que se est analizando. Esta
tcnica de procesamiento de imgenes genera una imagen binaria, donde se representa con 1 los
pixeles que pertenecen a dicho objeto y 0 a los que no.

2.4.1 SEGMENTACION BASADA EN PIXELES

Este mtodo de segmentacin considera solo el valor de gris de un pixel, para decidir si el mismo
es o no parte del objeto. Para determinar esto, se debe encontrar el rango de valores de gris que
son caractersticos del objeto. Mediante un histograma se localiza estos valores caractersticos.
El objetivo de este mtodo, es el de encontrar de manera ptima los valores caractersticos del
objeto que se est analizando con respecto a las regiones que no pertenecen a este. En un primer
caso si los valores de gris del objeto y el resto de la imagen difiere claramente, tendremos un
histograma con una distribucin bimodal con dos valores mximos distintos que no representan
32

los valores caractersticos y que idealmente fueran igual a cero, con lo que se lograra una
separacin entre el objeto y la imagen.

Por otro lado, si el valor del histograma est ubicado entre los dos mximos es diferente de cero,
las funciones de probabilidad de valores de gris del objeto y la regin restante se sobrepondrn, lo
que hace que algunos pixeles del objeto debern ser tomados en cuenta como pertenecientes a la
regin.

Fig. 25. Imgenes con sus respectivos histogramas [4]

2.4.2 OPERACIONES MORFOLOGICAS

Las operaciones morfolgicas son mtodos para procesar imgenes binarias basadas en formas.
Estas operaciones toman una imagen binaria como entrada y a la salida obtiene tambin una
imagen binaria. El valor de cada pixel en la imagen de salida se basa en cada pixel de la imagen de
entrada y de sus respectivos vecinos.

Dilatacin: si consideramos A y B como conjuntos de Z
2
y representando al conjunto vacio, la
dilatacin de A por B se representa como:

= {/[

} ] (6)

Por lo tanto el proceso de dilatacin consiste en obtener la reflexin de B sobre su origen y
despus cambiarla por la reflexin en x. La dilatacin de A por B es entonces, el conjunto de todos
los desplazamientos x tales que B y A se sobremonten en al menos algn elemento que sea
distinto de cero.
33

Fig. 26. Ejemplo de dilatacin [6]

Erosin: Para los conjuntos de A y B de Z
2
, la erosin de A por B representada por se define
como:

= {/

} (7)

Esta expresin nos dice que la erosin de A por B es el conjunto de todos los puntos x tal que B
trasladado por x, est contenido en A.

Fig. 27 Imagen Original [6]

Fig. 28. Imagen erosionada [6]

2.4.3 ETIQUETADO

Muchas veces no es suficiente el proceso de binarizacin de una imagen, por lo que el proceso de
segmentacin se expande con nuevas tcnicas para el anlisis de imgenes y una de ellas es el
34

etiquetado y cuenta de objetos
9
. Para poder analizar este aspecto debemos entender conceptos
importantes como:

Conectividad y vecindad: el primer inconveniente que se genera en el anlisis es el de diferenciar
el objeto de la imagen de fondo. Para esto se utiliza el criterio de vecindad de un pixel. Para esto
tenemos dos casos:

Pixeles 4- vecinos de A0

A3
A5 A0 A1
A7
Tabla 1. Pixeles de con vecindad 4

Los cuales se representan como: N4 (A0) = {A1, A3, A5, A7}

Pixeles 8- vecinos de A0

A4 A3 A2
A5 A0 A1
A6 A7 A8
Tabla 2. Pixeles con vecindad 8

Los cuales se representan como: N8 (A0) = {A1, A2, A3, A4, A5, A6, A7, A8}

Se dice que dos puntos p y q estn 4-conectados si p pertenece a los 4-vecinos de q y viceversa. Y
si estn 8-conectados si p pertenece a 8-vecinos o viceversa.

Una vez entendido este concepto, podemos ahora si definir la tcnica de etiquetado y cuenta de
objetos. El etiquetado es una tcnica que teniendo una imagen binaria, nos permite etiquetar cada
uno de los objetos conectados presentes en la imagen. Con esto podemos:

Distinguir los objetos respecto del fondo
Distinguir un objeto respecto a los dems objetos
Conocer el nmero de objetos de una imagen.

9
http://biometrics.org/bc2009/presentations/wednesday/Alonso-
Fernandez%20MR%2016%20Wed%20930%20AM%20-%20950%20AM.pdf
35

Fig. 29. Etiquetado y cuenta de objetos [5]

Los algoritmos que se utilizan para etiquetar tienen buenos resultados con objeto convexos, pero
presentan problemas cuando aparecen objetos que tienen concavidades. Considerando este
aspecto, no se podra ocupar este algoritmo cuando un objeto tiene forma espiral.

Fig. 30. Imagen en forma de U etiquetada mediante el algoritmo de etiquetado. [5]

36

37

CAPITULO 3

TCNICAS DE RECONOCIMIENTO DE PATRONES Y MODELOS DE
CLASIFICADORES

3.1 INTRODUCCIN

Cuando ya se tiene la imagen segmentada en regiones, los pixeles segmentados se encuentran
representados y descritos de manera que estn listos para un procesamiento posterior. Cuando
hablamos de representar regiones estamos tocando dos mbitos, el primero que es posible
representar la regin en trminos de sus caractersticas externas, y la segunda representarla en
funcin de sus caractersticas internas.

La etapa de reconocimiento de patrones denominada tambin lectura de patrones, identificacin
de figuras y reconocimiento de formas, consiste en el reconocimiento de patrones de
caractersticas y descripcin donde cada objeto queda representado por un conjunto de
descriptores. El sistema de reconocimiento debe asignar a cada objeto su categora o clase.

3.2 TCNICAS DE RECONOCIMIENTO DE PATRONES

Existen diversas tcnicas para el reconocimiento de patrones, que estn divididas en dos
categoras: Decisiones tericas y estructurales. En las decisiones tericas la base para el
procesamiento son descriptores cuantitativos como son el rea, longitud, textura, etc. Por otro
lado, las tcnicas de decisin estructurales se basan en descriptores cualitativos.

3.2.1 MOMENTOS DE HU

Los momentos de Hu y los relacionados con la invariancia han sido extensivamente analizados en
el reconocimiento de patrones de imgenes en una gran variedad de aplicaciones.

Los momentos invariantes fueron introducidos por primero vez por Hu. HU derivo seis momentos
ortogonales y un momentos asimtrico basados todos estos en el algebra, los mismos que no son
dependientes de la rotacin, tamao y posicin pero si son dependientes de una proyeccin
paralela. Los momentos invariantes han sido probados para ser medidos adecuadamente para la
coincidencia de imgenes a pesar de su rotacin, escalamiento y rotacin. Los momentos
invariantes han sido extensivamente aplicados al reconocimiento de imgenes como ya se explico
anteriormente, al registro de imgenes y a la reconstruccin de las mismas. Sin embargo, las
imgenes digitales en las aplicaciones prcticas no son continuas y tampoco estn libres de ruido,
debido a que estas son cuantificadas con una precisin finita de pixeles y sus coordenadas
discretizadas
10
.

Por otro lado, el ruido puede ser introducido por varios factores, uno de ellos puede ser la cmara
lo que hace que exista errores al momento de realizar el clculo computacional. En otras palabras,
los momentos invariantes pueden variar dependiendo de la geometra de la imagen.

10
Object Detection using Geometric Invariant Moment, American Journal of Applied Sciences

38

La traslacin, rotacin y escalamiento son las transformaciones ms simples de las coordenadas
espaciales, que a veces son denominadas transformada de similaridad, en donde influyen 4
parmetros que son:

= . + (8)

Donde t es un vector de traslacin, s es un factor de escalamiento positivo y R es una matriz de
rotacin.

=

9

Donde es un ngulo de rotacin.

La invarianza con respecto a la traslacin, rotacin y escalamiento se requiere en casi todas las
aplicaciones prcticas, debido a que los objetos deben ser reconocidos correctamente,
independientemente de su posicin y orientacin en la escena y la distancia del objeto a la
cmara.

Por otro lado, el modelo TRS (transformacin, rotacin y escalamiento) es una aproximacin
suficiente de la deformacin de la imagen actual si la escena es lisa y perpendicular al eje de la
ptica.

DEFINICION DE LOS MOMENTOS

Un momento general

de una imagen , , en donde p y q son enteros no negativos y

r=p+q que se denomina el orden del momento. Este se puede definir de la siguiente manera.

, , ,

(10)

En donde

, son bases de polinomios definidos sobre la regin D.

La definicin ms comn de los momentos geomtricos puede ser dada, tomando como referencia
la ecuacin 10, de la siguiente forma:

, ,

11

Escribiendo de otra forma, los momentos estadsticos se pueden definir como:

(12)

En donde es el conjunto de pixeles de la regin. El parmetro r+s denota el orden del momento.
El momento de orden cero m
00
corresponde al rea de la regin A. el centro de gravedad de una
regin queda definido por:

39

=

13

En donde el momento de orden cero

corresponde al rea de la regin a analizarse,

es el
centroide de la coordenada en x y

es el centroide la coordenada en y.

Con la ayuda de las coordenadas del centro de gravedad se definen los momentos que son
invariantes al desplazamiento de la regio en la imagen.

14

Los parmetros r y s denota el orden del momento.

En la teora de reconocimiento de patrones son las caractersticas derivadas de los momentos
centrales, denominados momentos de Hu.

(15)

(16)

(17)

] +3

(18)

] +4

(19)

= 3

] +3

] (20)

Con

+1 (21)

El parmetro t es aquella constante que determina la constante del centro de masa del objeto en
anlisis. Para cada uno de los 7 momentos esta varia con lo que se obtiene su valor caracterstico.

Los momentos de Hu son invariantes a la traslacin, rotacin y escalamiento. Es decir que dos
regiones que tengan la misma forma pero que sean de distinto tamao y que estn ubicados en
posiciones y orientaciones distintas en la imagen tendrn momentos de Hu iguales.

3.2.2 SIFT

Este algoritmo fue desarrollado para el reconocimiento de objetos. SIFT detecta un punto
caracterstico de un objeto el mismo que puede ser reconocido con la invariancia de la
iluminacin, escala rotacin y transformaciones afines.
40

Las ventajas que ofrece este mtodo son:

No se necesita transformar a coordenadas polares, para una precisin alta en la
segmentacin de imgenes.

Debido a su invarianza a la iluminacin, escala y rotacin se espera que sea confiable
cuando se use en la adquisicin de imgenes con las siguientes condiciones:
Conveniencia del usuario
Aplicabilidad a los ambientes no cooperativos
11
.

3.2.2.1 Operacin de SIFT

Para poder aplicar SIFT y verificar si los objetos son identificados de manera correcta, debemos
considerar dos aspectos.

1. Caractersticas de extraccin

Construccin de la escala espacial
Localizacin de la deteccin extrema
Descriptor de la extraccin del punto clave

Construccin de la escala espacial: la primera etapa es construir una pirmide Gausiana o tambin
llamada escala espacial par la imagen de ingreso. Este est formado por la convolucin de la
imagen original con una funcin gausiana de ancho variable. La diferencia de un gausiano (DoG),
D(x,y,) es calcular como diferencia entre dos imgenes filtradas, una con una constante de
escalamiento K y la otra si esta:

, , = , , , , 22

Estas imgenes, , , , son producidas por la convolucin de funciones gausianas, , ,
con una imagen de entrada, l(x, y)

, , = , , , 23

, , =
1
2

} 24

Localizacin de la deteccin extrema: En esta etapa se debe encontrar los puntos DOG de la
pirmide. Para detectar un mximo y un mnimo local de D(x,y,), cada punto se compara con los
pixeles de todos los vecinos. Si el valor es el mnimo o mximo, este punto es una extrema. Para

11
http://www.cs.st-andrews.ac.uk/~yumeng/yumeng-SIFTreport-5.18_bpt.pdf
41

mejorar la localizacin de este punto, se puede usar las series de Taylor, que est definido de la
siguiente manera:

=

25

Fig 31. Localizacin de la deteccin extrema

Descriptor de la extraccin del punto clave: en esta etapa de intenta eliminar algunos puntos de
la lista de candidatos de puntos clave para encontrar a los que tengan bajo contraste y tengan una
localizacin muy pobre. El valor del punto clave en la pirmide DoG est definido por:

= +
1
2

26

2. Caractersticas de reconocimiento

Punto clave del reconocimiento
Recorte de falsas concordancias

Fig. 32. Proceso para la obtencin de caractersticas con el mtodo SIFT [7]

42

3.2.4 REDES NEURONALES

Las redes neuronales son estructuras pensadas para simular las estructuras y el comportamiento
del sistema nervioso, por esta razn una neurona artificial posee entradas, salidas y un estado.
Adems de estar conectadas a otras neuronas siendo las salidas de estas las entradas de las
dems
12
.
Cada neurona realiza una operacin matemtica, y adems de agrupan en capas lo que constituye
una RNA. Un sistema neuronal o conexionista se compone de lo siguiente:

Un conjunto de procesadores elementales
Un patrn de conectividad o arquitectura
Una dinmica de activaciones
Una regla o dinmica de aprendizaje
En entorno donde opera

Fig. 33 Esquema de una red neuronal [4]

3.2.4.1 CARACTERISTICAS DE UNA RED NEURONAL

Una red neuronal consta de las siguientes caractersticas:

Procesamiento paralelo: Si queremos procesar una imagen, un ordenador tarda algunos minutos
en recorrer toda la imagen. Por otro lado el cerebro necesita unos pocos segundos en procesar
millones de pixeles, ya que las neuronas que interviene en el sistema trabajan en paralelo.

Memoria distribuida: en un ordenador la informacin se almacena en posiciones continuas bien
definidas, en una red neuronal se almacena en las sinapsis de la red. Si una se daa perdemos la
informacin.

Aprendizaje adaptativo: la capacidad de aprender tareas en base al entrenamiento elimina la
necesidad de elaborar modelos a priori o indicar funciones de distribucin de probabilidad.

Auto organizacin: Las redes neuronales utilizan su capacidad de aprendizaje adaptativo para
organizar la informacin que reciben durante el aprendizaje/operacin.

3.2.4.2 REDES PERCEPTRON

12
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition

En la forma ms bsica, la red perceptron, aprende una
opciones. La respuesta de este dispositivo est basada en la suma de los pesos de las entradas.

Esta funcin representa la decisin de una funcin de lineal con respecto a los componentes de los
vectores patrones. Los coeficientes wi= 1,2.. n,n+1 son llamados pesos que modifican los ingresos
antes que ellos sean sumados y vueltos a ingresar por el mi
pesos son anlogos a la sinapsis en un el sistema neurolgico de un ser humano.

Cuando d(x)>0 el elemento de disparo causa la salida de la red perceptron en +1 indicando que el
patrn x fue reconocido y que pertenece a
modo de operacin concuerda con la acotacin de la ecuacin anterior. Cuando d(x)
no sabe a qu clase pertenece lo que da u

Donde la ecuacin del hiperplano es un patrn de n dimensiones en el espacio. Geomtricamente
los primeros n coeficientes establecen la orientacin del hiperplano, y los ltimos coeficientes
Wn+1=0 es proporcional a la distancia perpendicul

13
Digital Image Processing, Rafael C. G
En la forma ms bsica, la red perceptron, aprende una decisin lineal entre dos tipos de
opciones. La respuesta de este dispositivo est basada en la suma de los pesos de las entradas.
Fig. 34. Red Perceptron [4]
=

27
Esta funcin representa la decisin de una funcin de lineal con respecto a los componentes de los
vectores patrones. Los coeficientes wi= 1,2.. n,n+1 son llamados pesos que modifican los ingresos
antes que ellos sean sumados y vueltos a ingresar por el mismo elemento. En este sentido los
pesos son anlogos a la sinapsis en un el sistema neurolgico de un ser humano.
Cuando d(x)>0 el elemento de disparo causa la salida de la red perceptron en +1 indicando que el
patrn x fue reconocido y que pertenece a la clase w1. Lo contrario ocurre cuando d(x)<0. Este
modo de operacin concuerda con la acotacin de la ecuacin anterior. Cuando d(x)
ce lo que da una condicin de indeterminacin
13
.
=

= 0 28
Donde la ecuacin del hiperplano es un patrn de n dimensiones en el espacio. Geomtricamente
los primeros n coeficientes establecen la orientacin del hiperplano, y los ltimos coeficientes
Wn+1=0 es proporcional a la distancia perpendicular del origen hacia el hiperplano.

al Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
43
decisin lineal entre dos tipos de
opciones. La respuesta de este dispositivo est basada en la suma de los pesos de las entradas.

Esta funcin representa la decisin de una funcin de lineal con respecto a los componentes de los
vectores patrones. Los coeficientes wi= 1,2.. n,n+1 son llamados pesos que modifican los ingresos
smo elemento. En este sentido los
Cuando d(x)>0 el elemento de disparo causa la salida de la red perceptron en +1 indicando que el
la clase w1. Lo contrario ocurre cuando d(x)<0. Este
modo de operacin concuerda con la acotacin de la ecuacin anterior. Cuando d(x)=0 el objeto x
Donde la ecuacin del hiperplano es un patrn de n dimensiones en el espacio. Geomtricamente
los primeros n coeficientes establecen la orientacin del hiperplano, y los ltimos coeficientes
ar del origen hacia el hiperplano.
44

Fig 35. Separacin de objetos en un hiperplano [15]

La salida del elemento depende del signo de d(x). En lugar de probar una funcin entera para
determinar si es positivo o negativo, podramos probar con la sumatoria de la ecuacin anterior,
donde podemos definir lo siguiente:

0 =

29

3.3 MODELO DE CLASIFICADORES

3.3.1 LGICA DIFUSA

La lgica difusa naci en 1965 siendo Lofti Zadeh su creador. A este cientfico se le atribuyen
muchas contribuciones en el desarrollo de la transformada Z para sistemas lineales discretos. La
lgica difusa difiere de la logia clsica debido a que esta ltima maneja de forma imprecisa la
clasificacin de valores. Esta adems permite una clasificacin ms amplia donde la pertenencia a
un grupo es gradual.

La lgica difusa como tal se refiere a toda la serie de teoras para modelacin, control, algoritmos
computacionales e inteligencia artificial que se basan en un razonamiento de incertidumbre o
imprecisin, donde la palabra clave se basa en lmites que no son cortantes
14
.

3.3.1.1 APLICACIONES DE LA LOGIA DIFUSA

SECTOR AUTOMOTRIZ

Control de la transmisin

14
Maestria en control y automatizacion-Control digital avanzado, Fundamentos del Control Difuso,
Ing. Ismael Minchala, Msc

45

Control del motor
Control del frenado

SECTOR INDUSTRIAL

Hornos y calderas
Columnas de destilacin
Produccin del cemento
Refinera y petroqumicas
Industria qumica farmacutica y alimenticia

3.3.1.2 CRISP LOGIC

La teora de conjuntos clsica o Crisp es la base de los conjuntos difusos o Fuzzy sets, ya que la
teora difusa tiene operaciones similares a la Crisp Logic.
En la teora clsica las operaciones de unin, interseccin y complemento estn definidas por:

Sean A y B subconjuntos del universo X, la unin, interseccin y complemento se definen:

Unin de un conjunto Clsico A y B

AUB= {X|XE A o x EB} ( 30 )

Interseccin de un conjunto clsico de A y B

A B = {X|XE A o x EB} (31)

Complemento de un conjunto clsico A

A = {x|xA} (32)

3.3.1.3 FUNCION CARACTERISTICA

Si A representa un conjunto del universo X, su funcin caracterstica yA puede definirse como:

= {0, 1} 33

Es decir que si x pertenece a A entonces la funcin vale 1, y si no pertenece vale 0.

3.3.1.4 CONJUNTO DIFUSO

Mientras los conjuntos clsicos pueden definirse por funciones caractersticas, los conjuntos
difusos se definen por funciones de membreca.

46

Por ejemplo un conjunto clsico es:

X= Integrantes
A=Grupo de hombres
B= Estudiantes de Msica

Un conjunto difuso es:

=

Para estos conjuntos no podemos utilizas diagramas de Venn porque moderadamente altas y
medianamente blancas varan de persona a persona y dependen de la situacin. Por ejemplo,
asignaremos un grado entre 0 y 1 para denotar el moderadamente altas y medianamente blancas,
donde se obtiene:

Conjunto Paty Ana Danny Eric Juan Linda
Moderadamente
altas
0.5 0.7 0.3 0.4 0.8 0.3
Medianamente
blancas
0.3 0.1 0.5 0.8 0.9 0.2

Tabla. 3. Definicin de un Conjunto Difuso

Donde 1 representa una total pertenencia a cada grupo y 0 una no pertenencia al grupo. En un con
junto clsico tendramos que decidir entre 0 y 1 exclusivamente, pero en un difuso puede ser
cualquier valor entre este rango [0,1]

3.3.1.5 Funcin de Membreca

Si A representa un conjunto del universo X, su funcin de membresa A(x) para el conjunto difuso
A se le llama valor de membreca o grado de membresa. El grado de membresa es la pertenencia
de x al conjunto difuso A.

47

Fig. 36. Funcin de membreca [8]

Es importante mencionar que los conjuntos difusos deben definirse correctamente para reflejar la
situacin. Por ejemplo si nos encontramos en una carretera libre o en una autopista.

Fig. 37. Planteamiento de un problema difuso. [8]

Los conjuntos difusos con aquellos que poseen lmites suaves y estn definidos por una funcin
que mapea objetos en un dominio de acuerdo a su grado de pertenencia o membreca en el
conjunto.

3.3.1.6 GRADO DE MEMBRESIA

El grado de membresa es el valor numrico que se asigna como pertenencia a un conjunto difuso
para una variable lingstica.

48

Fig. 38 Grado de Membreca [8]

3.3.1.7 VARIABLE LINGSTICA

La variable lingstica es aquella que toma valores con palabras en lugar de valores numricos. En
una funcin de membresa los conjuntos son asociados con variables lingsticas.

Fig. 39 Variable lingstica [8]

3.3.1.8 RAZONAMIENTO APROXIMADO

El razonamiento aproximado es la forma ms conocida de la lgica difusa que incluye una variedad
de reglas de inferencia. Este en contraste con la inferencia de la lgica clsica, establece que el
consecuente de un conjunto de proposiones difusas depende esencialmente de la interpretacin
dada a estas proposiciones. Este es usado para representar y razonar con conocimientos
expresados en forma primitiva, esto es, expresados en una forma de lenguaje natural
15
.

15
Maestria en control y automatizacion-Control digital avanzado, Fundamentos del Control Difuso,
Ing. Ismael Minchala, Msc

49

3.3.1.9 CONTROLADOR DIFUSO

Fuzificacin: convierte los valores ledos de las variables del proceso necesarias para el control del
proceso a grados de membreca o pertenencia a un conjunto difuso.

Mecanismo de inferencia: calcula el valor de la manipulacin o salida del controlador con base en
las reglas de inferencia difusas.

Defuzificacin: convierte el valor difuso de la manipulacin a una seal de control que se pueda
escribir en el proceso.

Normalmente en un sistema de control difuso en una entrada-una salida, las variables de error (e)
y la derivada del erros son las que procesas para emitir la seal de control m(t).

Fig. 40 Sistema de un Controlador Difuso

3.3.1.10 DEFUSIFICACION

El proceso d defusificacin tambin es conocido como Fuzzy Reasoning. Este proceso consiste en
calcular a partir de las reglas de inferencia difusas, el valor crisp que va de salida al proceso.

50

Fig. 41 Proceso de defusificacin de un conjunto difuso [8]

Existen varios mtodos para defusificar, entre los ms importantes se encuentran:

El mtodo Mamdani
El mtodo del mximo valor de membresa
El mtodo ponderado o simplificado

Por otro lado los mtodos de defusificacin se basan en las reglas de inferencia del tipo:

Regla 1: Si x es A1 y y es B1, entonces z es C1
Regla 2: Si x es A2 y y es B2, entonces z es C1
. . . .
. . . .
. . . .
Regla 3: Si x es A
n
y y es B
N
, entonces z es C
n

Donde la funcin de salida se expresa como la unin o el mximo de los conjuntos de salida, en
caso de que la accin sea funcin, es decir:

Fig. 42. Funcin de salida de un conjunto difuso

51

EL MTODO MAMDANI

El mtodo del centroide aplica para sistemas continuos bsicamente la defusificacin consiste en
encontrar el centro de masa de la funcin de salida.

Fig. 43 Mtodo de Mamdani

El centroide o centro de masa se calcula como:

=

.
34

El smbolo de la integral es una algebraica ya que la funcin o variable de salida es ahora crisp.

EL MTODO DEL VALOR MAXIMO

El mtodo del valor mximo es muy sencillo, ya que solo se debe escoger el pico mximo de la
funcin generada de salida.

Fig. 44. Mtodo del valor mximo

EL MTODO DEL PONDERADO

El mtodo ponderado es el ms utilizado en aplicaciones digitales o en control de procesos. Sin
embargo es deseable que la funcin de salida sea simtrica para su mejor desempeo. La salida
puede calcularse como:

52

=

35

3.3.2 REDES BAYESIANAS

Las redes bayesianas o probabilsticas son una representacin grfica de dependencias para el
razonamiento probabilstico en sistemas expertos.
Formalmente las redes bayesianas son grficos a cclicos dirigidos cuyos nodos representan
variables y los arcos que los unen codifican dependencias condicionales entre las variables.

Fig. 45. Modelo de una red Bayesiana.

Sea U={x1,x2..Xn} un conjunto de variables aleatorias. Formalmente una red bayesiana para U es
un par B=<G, T> en el que:
G es un grfico a cclico dirigido en el que cada nodo representa una de las variables X1,X2,..Xn y
cada arco representa relaciones de dependencia directas entre las variables. La direccin de los
arcos indica que la variable apuntada por el arco depende de la variable situada en su origen
16
.

T es un conjunto de parmetros que cuntica la red. Contiene las probabilidades para cada posible
valor de xi de cada variable Xi y cada posible valor P
xi
de P
xi
, donde este ltimo denota al conjunto
de padres de Xi en G. as una red bayesiana B de una distribucin de probabilidad conjunta sobre
U dada por:

(36)

En donde X
1
,X
2
.Xn son los posibles valores que la red puede tomar.

3.3.2.1 APRENDIZAJE DE REDES BAYESIANAS

El problema del aprendizaje bayesiano puede describirse informalmente como: dado un conjunto
de entrenamiento D={u1,u2un} de instancias de U, encuntrese la red B que se ajuste mejor a D.

16
http://www.sc.ehu.es/ccwbayes/docencia/mmcc/docs/t9knn.pdf

53

Tpicamente este problema tiene dos partes:

Aprendizaje estructural: obtener la estructura de la red
Aprendizaje paramtrico: conocida la estructura del grafo, obtener las probabilidades
correspondientes a cada nodo.

3.3.2.2 APLICACIONES

Las redes bayesianas son un tipo de modelos de minera de datos que pueden ser utilizados en
cualquiera de las siguientes actividades:

Prevencin del fraude
Prevencin del abandono de clientes
Blanqueo de dinero
Marketing personalizado
Scoring de clientes
Clasificacin de datos estelares

3.3.3 CLASIFICADORES DE DISTANCIA MINIMA

Las tcnicas de reconocimiento basadas en coincidencias, representan a cada clase en un vector
patrn prototipo. Un patrn desconocido es asignado a la clase en la cual existe mayor
coincidencia en trminos de algunas mtricas predefinidas. Uno de los enfoques ms simples pero
robustos, es el clasificador de distancia mnima Euclidiana entre los vectores de los objetos
desconocidos y los vectores de los patrones conocidos. Se elige la distancia ms pequea para
realizar la decisin
17
.

Supongamos que definimos el prototipo de cada clase como la medida de su vector:

=
1

= 1,2, . . 37

Donde N representa el tamao de los vectores. Una forma de determinar la clase a la cual un
objeto desconocido es miembro, consiste en asignarlo a la clase prototipo ms cercano. Utilizando
la distancia Euclidiana para determinar la cercana, el problema de medicin de distancias se
reduce a calcular la siguiente ecuacin:

= 1,2. . 38

Donde || =

es la norma euclidiana. Luego de analizar las distancias euclidianas del objeto

desconocido con los patrones, asignamos este a la clase Wi si D(x) es la distancia ms pequea. Es
decir la distancia ms pequea implica la mejor coincidencia en esta ecuacin. Resulta sencillo

17
Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition
54

probar con algunas manipulaciones algebraicas en matrices que la distancia ms pequea es
equivalente a evaluar las funciones:

1
2

= 1,2. 39

Y asignar x a la clase Wi implica analizar el resultado numrico di(x) mximo.

El lmite de decisin que separa dos clases

esta dado por los valores de x para los cuales

o de manera equivalente para los valores de x que:

= 0 40

A partir de las ecuaciones anteriores, el lmite de decisin entre dos clases

para un
clasificador de distancia mnima es:

1
2

= 0 42

La superficie dada por la ecuacin 33 es la lnea perpendicular que bisecta la lnea que une

con

. Para n=2, la superficie se representa por una lnea perpendicular, para n=3 es un plano y para
n>3 resulta un hiperplano.

Fig. 46. Limite de decisin de un clasificador de distancia mnima [9]

55

3.3.4 CLASIFICADORES DE K VECINOS

K-NN (K vecinos ms cercanos) es uno de los clasificadores ms utilizados por su simplicidad. El
proceso de aprendizaje de este clasificador consiste en almacenar una tabla con los ejemplos
disponibles, junto a la clase asociada a cada uno de ellos
18
.

Fig. 47. Ejemplo del clasificador K-nn [10]

Algoritmo K-NN bsico

La notacin que se utiliza para representar este algoritmo es:

Fig.48. Notacin para el paradigma K-NN [10]

D indica un fichero de N casos, cada uno de los cuales est caracterizado por n variables
predictoras, X1,.Xn y una variable a predecir, la clase C.

Los N casos se denotan por:

, 1 .

, = 1, . . 43

, . .

= 1, . . 44

18
http://es.scribd.com/doc/58302048/85/Clasificador-de-k-vecinos-mas-cercanos
56

3.3.4.1 VARIANTES SOBRE EL ALGORITMO BSICO

En este apartado vamos a introducir algunas variantes sobre el algoritmo bsico.

K-NN CON RECHAZO

La idea subyacente al K-NN con rechazo es que para poder clasificar un caso debo tener ciertas
garantas. Es por ello por lo que puede ocurrir que un caso quede sin clasificar, si no existen ciertas
garantas de que la clase a asignar sea la correcta.

K-NN CON DISTANCIA MEDIA

En el K-NN con distancia media, la idea es asignar un nuevo caso a la clase cuya distancia media
sea menor.

Fig 49. Ejemplo del clasificador K-NN con distancia media [10]

K-NN CON DISTANCIA MINIMA

En el K-NN con distancia mnima se comienza seleccionando un caso por clase, normalmente el
caso ms cercano al baricentro de todos los elementos de dicha clase. En este paso se reduce la
dimensin del fichero de casos a almacenar de N a m. A continuacin se asigna el nuevo caso a la
clase cuyo representante este ms cercano.

K-NN CON PESADO DE CASOS SELECCIONADOS

La idea en el K-NN con el que efectan un pesado de los casos seleccionados es que los K casos
seleccionados no se contabilicen de igual forma, sino que se tenga en cuenta la distancia de cada
caso seleccionado al nuevo caso que se pretende seleccionar.

K-NN CON PESADO DE VARIABLES

En todas las aproximaciones presentadas hasta el momento, la distancia entre el nuevo caso que
se pretende clasificar, x, y cada uno de los casos X
r
, r=1 N ya clasificados pertenecientes al
57

fichero de casos D, da el mismo peso a todas y cada una de las n variables, X1, X
n
. Es decir, la
distancia d(x,X
r
) entre x y X
r
, se calcula por medio de la distancia euclidiana.

,

Esta manera de calcular la distancia, es decir, dando el mismo nivel de importancia a todas las
variables, puede resultar peligrosa para el paradigma K-NN en el caso de que algunas variable sean
irrelevantes para la variable clase C. este es el motivo por el que resulta interesante el utilizar
distancias entre casis que ponderen cada variable de una manera adecuada. Es decir, la distancia
entre x y xr, se calculara:

,

46

58

59

CAPITULO 4

IMPLEMENTACIN DEL SISTEMA DE VISIN ARTIFICIAL

4.1 INTRODUCCIN

Para realizar todo el procedimiento del clculo de los momentos de Hu y los clasificadores se ha
utilizado el software Labview, el cual nos permite obtener varios parmetros necesarios para
realizar la clasificacin respectiva.

4.2 IMPLEMENTACIN DE HARDWARE

4.2.1 Cmaras

La cmara que se utiliz fue una Basler industrial. Esta cmara permite capturar imgenes con una
alta claridad, con lo que ayuda que procesamiento de las imgenes sea lo ms optimo posible. La
colocacin de la misma tambin juega un papel muy importante, ya que al tener una buena
ubicacin tendremos una mejor captacin de las imgenes. Por el contrario, si no la colocamos en
un lugar adecuado, las imgenes que se obtendrn sern de mala calidad ocasionando que
nuestro procesamiento sea errneo.

4.2.2 Sistema de iluminacin

Como mencionamos anteriormente, la iluminacin es un factor muy importante en el
proceso de visin para la obtencin de resultados ptimos. Una deficiente Iluminacin
implica obtener imgenes de baja calidad, lo que a su vez conlleva a resultados errneos o
un procesamiento excesivo. En nuestro caso no tuvimos mayor inconveniente en cuanto a
la iluminacin por lo que el sistema va a ser implementado en un lugar de bajo
iluminacin y poca reflectancia. Esto ayuda mucho a la cmara ya que la misma solo
enfocara a los objetos en cuestin y no habr problemas en cuanto a reconocer sus
caractersticas se refiere.

4.3 Implementacin de Software

4.3.1 Captura de imgenes

La captura de las imgenes se la realiza mediante el siguiente bloque de programa

60

Fig. 50. Captura de la imagen

Mediante este bloque podemos realizar la captura de nuestras imgenes para en su posterior
trabajo poder procesarlas.

4.4 Procesamiento de la imagen

4.4.1 Umbralizacin

La umbralizacin es un paso muy importante ya que este nos permite binarizar a nuestra imagen
para que el procesamiento sea mucho ms fcil. Al binarizar nuestra imagen trabajamos con
valores que van de 0 a 255. Esto hace que nosotros tengamos un 0 o un 1 en nuestra imagen y
segn esto saber cuntos pixeles estn activados y cuantos no. El bloque que nos permite hacer
esto es el siguiente:

Fig. 51. Binarizacin de la imagen

61

Fig. 52. Pieza binarizada

El resultado de realizar la binarizacin es como se puede observar en la figura anterior. Al tener de
esta forma, podemos calcular los momentos de Hu de manera mucho ms fcil.

4.4.2 Etiquetado

El etiquetado por su parte es otro de los aspectos que debemos considerar ya que esto nos ayuda
al tener varios objetos a clasificarlos segn su color y con esto obtener caractersticas
independientes de cada uno de ellos evitando as la confusin de los mismos.

Fig. 53. Etiquetado de la Imagen

4.4.3 Filtrado del tamao

El filtrado de la imagen nos ayuda a eliminar bordes y contornos no deseados de una imagen, con
el fin de que el proceso sea lo ms puro posible y que no existan valores extras que perjudiquen a
este proceso.

62

63

CAPITULO 5

CALCULO MATEMTICO Y PROCESAMIENTO DE LAS TCNICAS DE
RECONOCIMIENTO DE PATRONES

5.1 INTRODUCCIN

Dentro las tcnicas de reconocimiento de las tcnicas para el reconocimiento de patrones, se ha
escogido para su desarrollo los momentos de Hu. Los momentos de Hu como ya se vio
anteriormente, nos entregan informacin del objeto que estamos procesando, con el fin de que
con estos valores se pueda clasificar a los objetos segn sea su caracterstica.

5.2 CALCULO DE LOS MOMENTOS DE HU.

Para poder calcular los momentos de Hu, debemos primero hacer un pre procesamiento de la
imagen, es decir aplicar una serie de operaciones que permitan realizar el posterior clculo. Todo
este procesamiento se lo realiz en el software Labview.

5.2.1 PARAMETROS

Los parmetros que se consideraron para el desarrollo del software para calcular los 7 momentos
fueron:

Adquisicin: en esta etapa se configura la sesin de la cmara y como la imagen se la captura en
RGB se incluye un paso a imagen monocromtica, extrayendo a la imagen original el plano de
intensidad.

Fig. 54. Adquisicin de Imgenes

Preprocesamiento: En esta etapa se realiza un enmascaramiento de la imagen a travs de
coordenadas ingresadas por el usuario para obtener el ROI (regin de inters).

Segmentacin: El objetivo de la etapa de segmentacin de la imagen es ingresar una imagen al
sistema y obtener caractersticas como resultado, en este caso de manera particular imgenes
64

etiquetadas con informacin de centros de masa y rea, para lo cual se realizan los siguientes
pasos:

Umbralizacin: Se utiliza para obtener imgenes binarias. Para elegir los lmites de umbralizacin
debemos considerar los siguientes aspectos.

Erosin: es una operacin morfolgica que permitir eliminar objetos de un tamao
menor a los objetos que estamos analizando, de forma que el etiquetado de la etapa
siguiente sea relativamente ms sencillo de realizar.

Etiquetado: se agrupan los pixeles vecinos considerando vecindad de 8.

Fig.55. Binarizacin de la imagen

Fig.56. Etiquetado de los objetos

Caracterizacin: en esta etapa se convierte la imagen etiquetada en una matriz de vectores
columna, conteniendo los resultados del clculo de los momentos de Hu.

65

Fig.57. Momentos de Hu de los 4 objetos a reconocer

Clasificacin: Aplicando el criterio del clasificador de distancia mnima, k vecinos ms cercanos y
lgica difusa, se asigna el objeto capturado por la cmara a algn patrn previamente entrenado
en el sistema.

5.2.1 PROCESO DE CLCULO

Una vez hecho el proceso anterior, procedemos al clculo de los momentos de Hu. Para esto se
utilizaron las siguientes frmulas:

(11)

(12)

(13)

] +3

(14)

] +4

(15)

= 3

] +3

] (16)

Para poder calcular, debemos obtener el centro de masa de cada objeto, y el nmero total de
pixeles que lo conforman, ya que esto nos ayudara a definir cul es el valor de cada uno de los
momentos.

=
+
2
+1 17

Donde r y s representan el momento a calcularse, y

el dato de cada momento proveniente del

nmero de pixeles de la imagen tanto en la coordenada x como y. cabe recalcar que estos se
calculan utilizando el centroide y el rea de la imagen.

Considerando las distintas formulas que nos ayudan a obtener los 7 momentos de Hu, se
recopilaron los siguientes datos para cada uno de los objetos con los que se trabaj.

Por ejemplo para calcular uno de los momentos se sigui el siguiente proceso:

66

(47)

=

+1 (48)

Donde r y s son el momento que va a calcularse.

=

+1 = 2 (49)

(50)

(51)

Los datos de y y son obtenidos de cada figura para el calcula. Estos significa que y son todos los
pixeles del objeto en la coordenada y y es el centro de masa del mismo. Por otro lado, Pero para
el primer momento necesitamos ahora el parmetro

. Siguiendo el mismo proceso que lo

explicado anteriormente obtenemos:

(52)

Ahora bien como en el caso anterior x significa todos los pixeles del objeto en la coordenada x y
es el centro de masa del mismo.

De esta forma es como se van obteniendo los momentos para cada objeto. A continuacin se
describe el valor que se obtuvieron en los objetos de cada momento de Hu.

Moneda

= 0,159745

= 0,000161714

= 0,0000024753

= 0,00000000142066

= 0,0000000000000000627111

= 0,00000000000761959

= 0,0000000000000000562556

Memory Stick

= 0,174548

= 0,00287047

= 0,0000263223

= 0,00000111915

= 0,00000000000376112

= 0,0000000583927

= 0,00000000000476976
67

Pieza amorfa 1

= 0,203677

= 0,0141866

= 0,000386307

= 0,0000291578

= 0,00000000308993

= 0,00000346912

= 0,000000000169138

Pieza amorfa 2

= 0,237502

= 0,015327

= 0,00611976

= 0,000907733

= 0,00000102021

= 0,00000103566

= 0,00000188055

Ahora bien, los momentos de Hu como tal no hacen nada o ms bien no entregan ninguna
informacin, ya que no tenemos ningn clasificador que permita determinar parmetros que
definan el reconocimiento de los objetos. Para que estos tengan utilidad se necesita de un
clasificador. Existen varios tipos de clasificadores que se pueden emplear para clasificar los datos.
Los que se utilizaron fueron el de distancia euclidiana o distancia mnima, el de los k vecinos ms
cercanos y el de lgica difusa. Estos tres clasificadores se implementaron y se contrastaron entre s
para ver cul de ellos era el ms fiable.

CLASIFICADOR DE DISTANCIA MINIMA

El clasificador de distancia mnima, est definido por la siguiente frmula:

2 ) (
1
) (
) (
k
ij
N
n
n
ij
k
ij
X X d
momentos
=

=
( 53)

En donde X
n
representa el momento obtenido de objeto en analisis y X
k
el momento del objeto
patrn.

Con la formula anteriormente descrita, se pueden obtener las distancias correspondientes a cada
objeto. Los resultados obtenidos fueron:

68

Moneda:

D1=0,0129378
D2= 0,0443367
D3= 0,136743
D4= 0,000806814

Memory stick

D1= 0,0151617
D2= 0,0285317
D3=0,15203
D4= 0,0030566

Pieza amorfa 1

D1= 0,0391771
D2=0,0272015
D3= 0,0285922
D4= 0,00440241

Pieza amorfa 2

D1= 0,0746991
D2= 0,0626122
D3= 0,0321515
D4= 0,00789217

Las distancias anteriormente descritas son las distancias medidas con respecto a los objetos en
anlisis. Por ejemplo la distancias de la moneda son medidas respecto a la memory stick, pieza
amorfa 1 y pieza amorfa 2. Esas distancias a su vez sin contrastadas y se ve cul de ellas es la
menor para as saber si es o no la moneda que se esta clasificando.

69

Fig.58. Objeto reconocido-moneda

Fig.59. Objeto reconocido-pieza amorfa2

Fig.60. Objeto reconocido-memory Stick
70

Fig.61 Objeto reconocido-pieza amorfa 1

CLASIFICADOR K VECINOS

Aplicando el mismo concepto de la distancia euclidiana, podemos obtener las distancias ms
cercana de los objetos pero aplicando k vecinos. Esta tcnica a diferencia de la distancia mnima,
nos permite obtener una mayor informacin de las distancias de los objetos que estamos
calculando. Esto hace que esta tcnica sea un poco ms fiable que la anterior. Est definida por la
siguiente ecuacin:

2 ) (
1
) (
) (
k
ij
N
n
n
ij
k
ij
X X d
momentos
=

=
(54)

Moneda:

D1=0, 0129378
D2= 0, 0443367
D3= 0,136743
D4= 0,000806814

D1.1=0, 0156778
D2.1= 0, 0442257
D3.1= 0,1477843
D4.1= 0,0090681

D2.1=0, 0179378
D2.2= 0, 041257
D2.3= 0,133843
D2.4= 0,000868814

71

Memory stick

D1= 0, 0151617
D2= 0, 0285317
D3=0, 15203
D4= 0, 0030566

D1.1=0, 0179378
D2.1= 0, 02987
D3.1= 0, 14307
D4.1= 0,003376

D2.1=0, 0129378
D2.2= 0, 03017
D2.3= 0, 14779
D2.4= 0,003576

Pieza amorfa 1

D1= 0,0391771
D2=0,0272015
D3= 0,0285922
D4= 0,00440241

D1.1=0, 039278
D2.1= 0, 0274026
D3.1= 0,029677
D4.1= 0,004671

D2.1=0, 040183
D2.2= 0, 028432
D2.3= 0, 02976
D2.4= 0,004236

Pieza amorfa 2

D1= 0,0746991
D2= 0,0626122
D3= 0,0321515
D4= 0,00789217

D1.1= 0,075791
D2.1= 0,0735233
D3.1= 0,0422735
D4.1= 0,00838317

D2.1=0, 0129378
72

D2.2= 0,0443367
D2.3= 0,0521616
D2.4= 0,00989317

Como se puede observar, en este caso al igual que la distancia mnima, se va comparando las
distancias entre cada objeto para luego elegir la distancia ms corta. En este caso se obtienen ms
valores con el fin de obtener un poco mas de criterios de eleccin.

Fig. 62. Objeto reconocido- moneda

Fig. 63. Objeto reconocido-pieza amorfa 2

73

Fig. 64. Objeto reconocido-Memory stick

Fig. 65. Objeto reconocido-Pieza amorfa 1

CLASIFICADORES DE LOGICA DIFUSA

Los clasificadores de lgica difusa estn basados en la definicin de reglas de inferencia. A
diferencia de la lgica tradicional estos no tienen solamente valores de 0 o 1 si no valores
intermedios que hacen que la clasificacin tenga un alto rendimiento.
Para lograr esto, se comienza por definir las entradas y salidas difusas del sistema, esto con el fin
de que posteriormente podemos definir las reglas de inferencia que harn posible la clasificacin
del objeto.

Las entradas quedan definidas de la siguiente manera:

74

Fig. 66. Entradas difusas del momento 1 de los objetos

Fig.67. Entradas difusa del momento 2 de los objetos

Fig.68. Entradas difusas del momento 3 de los objetos

Una vez definidas las entradas difusas, procedemos a definir las salidas para su clasificacin.

75

Fig 69.Salida difusa de la moneda

Fig. 70. Salida difusa de la memory stick

Fig. 71. Salida difusa de la pieza amorfa 1

Fig. 72. Salida difusa de la pieza amorfa 2

76

Definidas las entradas y salidas difusas se procede a la implementacin de reglas de inferencia con
el fin de clasificar a los objetos.

Fig. 73. Definicin de reglas de inferencia

Todas la entradas dadas por los momentos de Hu se sacaron logaritmos para obtener un mayor
rango de valores con el fin de que la clasificacin se realice de manera adecuada.

Ahora bien, al momento de realizar la clasificacin, los objetos no fueron clasificados como se
esperaba. La clasificacin result de la siguiente manera:

Fig 74 Pieza amorfa 2 reconocida

77

Fig 75. Memory stick reconocida

Fig 76. Clasificador errneo. Confusin entre elementos

Como se puede observar, este clasificador no est identificando de manera correcta a los objetos
por lo que podemos decir que este no es el adecuado para utilizarlo. Esto es debido a que los
valores de los momentos de Hu son muy pequeos y al definir las reglas de inferencia se
confunden. Se trabaj sacando el logaritmo de esto momentos para poder ver si en algo mejoraba
la clasificacin, sin embargo el resultado era el mismo y no clasificaba de manera adecuada. Se
trabaj una tercera opcin que era el emplear las reas de las figuras, y al final se obtuvieron los
mismos resultados. Con esto se puede concluir que este clasificador no es el adecuado para
reconocer e identificar objetos.

78

Fig. 77 Definicin de entradas difusas de las reas

Fig.78. Definicin de salidas difusas de las reas

Como se puede observar, con las reas tampoco se logr una mejora sustancial ya que se seguan
confundiendo al momento de realizar la clasificacin. Con esta opcin queda definitivamente claro
que el clasificador no es el adecuado.

5.3 RESULTADO

La clasificacin de los objetos mediante la tcnica de los momentos de Hu tiene un mejor
rendimiento cuando se utiliza tcnicas de clasificacin de distancia mnima y la de vecinos ms
cercanos. Como se pudo observar estos clasificaban sin confundirse y no existan inconvenientes
como ocurri en el caso del clasificador de lgica difusa que clasificaba pero con confusin. Lo
que se puede decir que no es una tcnica adecuada para trabajar con valores muy pequeos que
en este caso nos entregaba los 7 momentos de Hu.

79

80

CAPITULO 6

APLICACIN INDUSTRIAL

6.1 Introduccin

La visin artificial es muy utilizada dentro de la industria metlica debido a que las aplicaciones
que esta rea ofrece son muy amplias. Esta industria posee un alto grado de aplicaciones con
visin artificial ya que las mismas se las emplea en el reconocimiento de piezas, calibracin de
objetos, cortado y soldado, clasificacin, etc. Cada una de las aplicaciones antes mencionadas
debe tener un alto grado de precisin ya que al ser una industria en donde las medidas deben ser
lo ms exactas posible entonces se requiere de un sistema tambin que sea altamente preciso.
Para esto se ha llevado una aplicacin de las tcnicas de los momentos de Hu y sus clasificadores a
la industria metlica.

Fig. 79. Parque industrial Cuenca [16]

6.2 Industria metlica

Es el sector industrial que incluye las actividades relacionadas con el procesamiento de metales
para la fabricacin de piezas, mquinas y herramientas que se necesitan en la industria y en otros
sectores de la economa. Por ejemplo, actividades como la fabricacin de lminas de acero, y
planchas para hornos, ingeniera de precisin, construccin de maquinaria elctrica, fabricacin de
equipos electrnicos, y materiales, para transporte areo, terrestre, astilleros, etc.

81

Fig 80. Piezas producidas en la industria metalmecnica[12].

La industria que tiene esta clasificacin manual se llama INSOMET. Esta industria adems de
fabricar productos como son los textiles, se dedica a la fabricacin de piezas metlicas para la
distribucin a las fabricas que forma parte de la empresa, una de ellas es TELARTEC, que se
encarga de la reconstruccin de maquinas en mal estado, y a su vez necesita de piezas que esta
empresa les distribuye. Sin embargo el trabajo se lo hace de manera manual y es tedioso por la
confusin y la cantidad de piezas que hay que identificar. Por esta razn se hizo el estudio a fin de
analizar si es o no factible implementar en la fbrica. Segn los resultados obtenidos los resultados
fueron bastante buenos por lo que se hizo varias pruebas con 4 objetos que nos facilitaron en la
industria para ver si con estos se llegaba a clasificar de manera adecuada. El prototipo que se
construy cumple con las normas que requiere la industria, por lo que se puede decir que es muy
factible su implementacin.

6.3 Identificacin y clasificacin de piezas metlicas

Varias son las formas que se pueden obtener de un tratamiento de acero. Clasificarlas de manera
manual todos estos tipos resultara un poco medio tedioso ya que tomara tiempo y muchas veces
hasta abra confusin ya que se tienen muchas piezas de distinto tamao y muy parecidas en su
dimensin, que en algn momento nos llegaramos a confundir. Para esto se ha aplicado una
tcnica de visin artificial denominado los momentos de Hu. Estos momentos son invariantes a la
rotacin, movimiento, traslacin y escalamiento. Con los datos obtenidos que nos entregan estos
momentos dependiendo de la figura que estemos analizando, se procede a aplicar un clasificador
el cual con son ciertas consideraciones permitir que identifiquemos a los objetos sin problema
alguno. Como ya se ha explicado en los captulos anteriores, los datos deben ser clasificados y
ordenados de manera tal que el clasificador no tenga confusin alguna y pueda saber cul es la
pieza que deseamos identificar.

82

Fig 81. Reconocimiento de una pieza metlica

En la figura anterior se puede observar la clasificacin de una pieza metlica con una forma
amorfa. Lo interesante de este clasificador es que no solo sirve para clasificar figuras con un
estndar de forma definida, si no que no interesa la forma, posicin o el tamao que tenga, el
clasificador lo identifica sin ninguna manera. La consideracin que se debe tener es que el sistema
debe ser implementado en un lugar en donde la luz no intervenga, ya que la misma puede incidir
en el clculo y procesamiento de las imgenes.

6.4 ANALISIS DEL PROTOTIPO EN LA INDUSTRIA INSOMET

Una vez terminado el prototipo con sus distintas pruebas, se llev a la industria solicitante del
proyecto. Aqu se realizaron distintas pruebas de los objetos que la misma nos proporcion. Los
resultados fueron bastante buenos ya que clasificaba las distintas piezas sin cometer errores.

Por otro lado, otra consideracin que se debe tener presente es la ubicacin de la cmara, ya que
si esta no est enfocando a las imgenes o esta con un nivel de intensidad que no es la adecuada
el resultado ser errneo y la clasificacin de igual forma. Esto ocurri en un principio que la
cmara estuvo mal enfocada y los momentos no calculaban los valores adecuados.

83

84

EXPERIMENTACION Y RESULTADOS

Una vez obtenido los distintos resultados aplicando las tcnicas de clasificadores se pudieron
observar cosas interesantes al momento de realizar la clasificacin. La primera observacin que se
pudo hacer es que en la obtencin de los momentos de Hu, se obtuvieron parmetros muy
pequeos que al principio parecan est mal, debido a que todos eran muy parecidos y en algunos
momentos se obtuvieron valores de 0. A medida que se fueron realizando las distintas pruebas se
fue entiendo el por qu de estos momentos. La cuestin es que las figuras con las que estamos
trabajando no tienen un rea muy grande por lo que el valor de los momentos es pequeo. Por
otro lado, tambin debemos considerar trabajar de 6 a 7 decimales con estos, ya que al comienzo
se trabajaron solo con 2 lo que ocasionaba que la clasificacin no se haga de manera adecuada.

La segunda observacin que se pudo realizar es que la clasificacin de los objetos con los datos de
los 7 momentos se la puede hacer de distinta manera, ya sea utilizando un clasificador de distancia
mnima, de K vecinos ms cercanos o la de lgica difusa. Este ltimo clasificador se implement
para hacer un contraste entre estos 3 para ver cul era la fiabilidad de cada uno de ellos. Con los
dos primeros clasificadores no se tuvo ningn inconveniente ya que estos entregan valores de
acorde al clculo de la distancia y los objetos eran reconocidos sin ningn inconveniente. Con el
tercer clasificador sucedi algo bastante extrao, al implementar un clasificador difuso se tena la
idea que este iba a funcionar mucho mejor que los anteriores debido a su gran nivel de
aplicabilidad y fiabilidad que este tiene en procesos industriales, sin embargo al hacer las pruebas
este fue el que peor reaccion, ya que los objetos no se clasificaban de manera adecuada. Esto se
debi a que al momento de definir las entradas y salidas difusas los valores de los momentos de
Hu eran muy pequeos y parecidos lo que haba un solape entre estas. Esto se dio a que fue
imposible clasificar de esta manera. Se trato de sacar los logaritmos de cada momento, sin
embargo no funciono. Tambin se prob obteniendo las reas de los objetos y tampoco funciono.
Lo que se llego a la conclusin que este clasificador no es el adecuado para este proceso cuando se
tiene valores pequeos y sobre todo muy parecidos. Todo lo explicado anteriormente se puede
ver en las siguientes graficas de precisin y cobertura.

Fig 82. Aciertos y Errores del clasificador de distancia mnima para el objeto moneda
0
5
10
15
20
N

M
E
R
O

D
E

P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO MONEDA.
ACIERTOS
ERRORES
85

Fig 83. Aciertos y Errores del clasificador de distancia mnima para el objeto memory stick

Fig 84. Aciertos y Errores del clasificador de distancia mnima para el objeto moneda
0
5
10
15
20
25
N

M
E
R
O

D
E

P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO MEMORY STICK
ACIERTOS
0
5
10
15
20
25
N

M
E
R
O

D
E

P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA1
ACIERTOS
86

Fig 85. Aciertos y Errores del clasificador de distancia mnima para el objeto amorfa 2

De la misma manera se trabajo con pruebas con el clasificador de los vecinos ms cercanos. Los
resultados obtenidos fueron muy favorables. A continuacin se muestran los resultados:

Fig 86. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto moneda

0
2
4
6
8
10
12
14
16
18
20
N

M
E
R
O

D
E

P
R
U
E
B
A
S
CLASIFICADOR DE DISTANCIA MINIMA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 2
ACIERTOS
ERRORES
0
5
10
15
20
25
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE LOS VECINOS MAS CERCANOS
ACIERTOS Y ERRORES DEL
OBJETO MONEDA
ACIERTOS
87

Fig 87. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto memory stick

Fig 88. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto amorfa 1

0
5
10
15
20
25
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE LOS VECINOS MAS CERCANOS
ACIERTOS Y ERRORES DEL
OBJETO MEMORY STICK
ACIERTOS
0
5
10
15
20
25
N

M
E
R
O

D
E

P
U
E
B
A
S
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 1
ACIERTOS
88

Fig 89. Aciertos y Errores del clasificador de los vecinos ms cercanos para el objeto amorfa 2

Las graficas que se obtiene con el clasificador de lgica difusa tienen una gran diferencia con los
vecinos ms cercanos y distancia mnima. La mayor parte de las pruebas este se equivocaba al
identificar los objetos. Estos se puede observar en los siguientes cuadros comparativos.

Fig 90. Aciertos y Errores del clasificador de lgica difusa para el objeto moneda

0
2
4
6
8
10
12
14
16
18
20
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE VECINOS MAS CERCANOS
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 2
ACIERTOS
0
5
10
15
20
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL OBJETO
MONEDA
ACIERTOS
ERRORES
89

Fig 91. Aciertos y Errores del clasificador de lgica difusa para el objeto memory stick

Fig 92. Aciertos y Errores del clasificador de lgica difusa para el objeto pieza amorfa 1

0
5
10
15
20
25
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL
OBJETO MEMORY STICK
ERRORES
0
5
10
15
20
25
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 1
ERRORES
90

Fig 93. Aciertos y Errores del clasificador de lgica difusa para el objeto pieza amorfa2

De esta experimentacin se puede decir que los momentos de Hu es una tcnica bastante til y
sencilla de implementar ya que utilizando clasificadores adecuadas se puede lograr un trabajo
bastante aceptable en cuanto al reconocimiento de patrones se refiere. Acotando tambin que el
clasificador difuso no es bueno en algunos casos siendo este descartado cuando se vaya a realizar
un trabajo de reconocimiento de objetos.

Estos serian los resultados obtenidos en la experimentacin y estudio del presente trabajo.

0
5
10
15
20
25
N

M
E
R
O

D
E

P
U
E
B
A
S
CLASIFICADOR DE LOGICA DIFUSA
ACIERTOS Y ERRORES DEL
OBJETO PIEZA AMORFA 2
ERRORES
91

CONCLUSIONES

Dentro de la electrnica tenemos un campo amplio denominada visin artificial. Este campo es
muy til para poder realizar distintas aplicaciones ya sea a nivel domestico como a nivel industrial,
como es el control y clasificacin de productos, control de calidad, verificacin de medidas en las
distintas piezas que se fabrica, etc. Tomando como referencia este aspecto hemos propuesto en
esta tesis investigar un poco ms a fondo la aplicacin que se le puede dar a este campo
implementando un sistema de clasificacin basado en la tcnica de los momentos de Hu ms
clasificadores que permitan realizar el objetivo planteado.

Como se pudo observar, varios fueron los aspectos que se tuvieron que considerar para lograr
implementar el sistema, uno de ellos fue el saber cules son las etapas necesarios para poder
obtener la correcta informacin de los objetos que queremos clasificar. Uno de las primeras
etapas era la adquisicin. Esta etapa constituye en un factor muy importante ya que si desde aqu
no obtenemos la calidad necesaria de los objetos o la cmara o el factor de iluminacin no est
bien definido, no podremos obtener valores correctos lo que el procesamiento nos resultara
falloso. Por otro parte una vez solucionada este factor procedemos a procesar la imagen como es
la binarizacin de la misma, ya que as podremos obtener valores de 1 a 255 para un mejor y ms
rpido procesamiento.

Por otro lado, con todas las caractersticas descritas se pudo obtener los momentos de Hu. Estos
momentos de Hu son muy tiles para la caracterizacin de los objetos ya que los mismos permiten
obtener valores para luego clasificarlos y de esta forma saber que objeto es el que estamos
analizando. Adems de esto se debe tener muy en cuenta que estos momentos en nuestro caso
son muy pequeos por lo que puede darse la confusin que no existe valores para ciertos de ellos.
Lo que se debe hacer o lo que se hizo en nuestro caso es trabajar con 7 decimales para saber el
valor exacto de los mismos. Con esto podramos implementarlos en los respectivos clasificadores.
Cabe adems recalcar que si los valores en los dems momentos salan cero era por el tamao del
objeto analizado, ya que segn esto

En cuanto a la parte de los clasificadores, se tuvo un muy buen resultado ya que el de distancia
mnima y el de K vecinos no daba ningn error y clasificaba sin ningn problema. Pero en cuanto
al clasificador de lgica difusa, se tuvo un problema que los objetos no eran reconocidos de
manera adecuada. Esto se debi a que al ser los valores de los momentos de Hu muy pequeos no
se podra definir la reglas de inferencia de manera adecuada por lo que haba la confusin en su
clasificacin. Se trato de sacar el logaritmo de los valores y definir nuevas reglas, pero el resultado
sigui siendo el mismo. Luego se intento trabajar con las reas de las figuras para redefinir
nuevamente las reglas, sin embargo no se obtuvo nada. Lo que nos lleva a concluir que este
clasificador no es el adecuado cuanto se trabaja con valores pequeos y sobre todo muy
parecidos.

Podemos adems recalcar que los momentos de Hu y los clasificadores pueden ser aplicados en
cualquier rea, ya sea de la medicina, industria alimentaria, metlica, de cermicas etc, ya que al
ser una tcnica que nos entrega valores y posteriormente podemos clasificarlos, podemos
implementar en cualquiera de estas reas sin problema alguno.

92

Un trabajo a futuro que se podra implementar es trabajar con los momentos de Hu aplicando
clasificadores de redes bayesianas. Este tipo de clasificadores al tener un alto nivel de clculo
matemtico y sobre todo de probabilidad y estadstica, nos puede dar un porcentaje de precisin
bastante alto, lo que sera aun ms robusto el sistema. Adems se podra dar nuevas aplicaciones
a esta tcnica, como es el caso de la clasificacin de figuras pero tomando en cuanto su
representacin en 3d. Este tipo de aplicacin sera muy bueno ya que aqu se podra considerar
absolutamente todas las caractersticas del objeto en cuestin que se desee analizar.

Se puede concluir acotando que esta tcnica nueva de visin artificial es robusta, a pesar de que
existan otras tcnicas, esta ofrece fiabilidad y su fcil implementacin

93

BIBLIOGRAFIA

[1]http://3.bp.blogspot.com/_uXlJEIeijms/TAC_Lt-
xhI/AAAAAAAAEeQ/YPJz2ImkmDU/s1600/bernhard-plockhorst-entrada-de-jesus-en-jerusalen.jpg

[2]http://bcs.fltr.ucl.ac.be/FE/18/ARIST/Aristote_fichiers/filippino_lippi.jpg

[3]http://eisc.univalle.edu.co/materias/Vision_Computacional/material/Libro%20Vision%20Artifici
al/visiona.pdf

[4] Digital Image Processing, Rafael C. Gonzalez, Richard E. Woods, Second edition

[5]http://tesis.pucp.edu.pe/repositorio/handle/123456789/68

[6]http://biometrics.org/bc2009/presentations/wednesday/Alonso-
Fernandez%20MR%2016%20Wed%20930%20AM%20-%20950%20AM.pdf

[7]Maestria en control y automatizacion-Control digital avanzado, Fundamentos del Control
Difuso, Ing. Ismael Minchala, Msc

[8]Reconocimiento de objetos con visin artificial a travs de Vectores de caractersticas y
distancias mnimas, Ismael Minchala vila.

[9]http://es.scribd.com/doc/58302048/85/Clasificador-de-k-vecinos-mas-cercanos

[10]http://sci2s.ugr.es/docencia/algoritmica/Practicas%20-%20SI.pdf

[11]http://www.sc.ehu.es/ccwbayes/docencia/mmcc/docs/t9knn.pdf

[12]http://www.jmcprl.net/GLOSARIO/METALURGIA.HTM

[13]http://www.cs.st-andrews.ac.uk/~yumeng/yumeng-SIFTreport-5.18_bpt.pdf

[14] Object Detection using Geometric Invariant Moment, American Journal of Applied Sciences

[15]http://www.neuronet.cl/egroupware/sitemgr/sitemgr-
site/templates/neuronet/images/SeparacionClasesHiperPlano.JPG

[16] http://www.eltiempo.com.ec/fotos-cuenca-ecuador/ecuador/t1_1234404033.jpg

También podría gustarte

ENTORNO Labview
100% (1)
ENTORNO Labview
83 páginas
Control de Velocidad Del Motor CD - Lógica Difusa
Aún no hay calificaciones
Control de Velocidad Del Motor CD - Lógica Difusa
20 páginas
Lab View Core 1 Manual de Ejercicios
100% (4)
Lab View Core 1 Manual de Ejercicios
190 páginas
Visión Artificial
100% (1)
Visión Artificial
15 páginas
Practica #5 - Sistemas de Visión - Oviedo-Vizcaya
Aún no hay calificaciones
Practica #5 - Sistemas de Visión - Oviedo-Vizcaya
28 páginas
Practica 5 Cad Cam
Aún no hay calificaciones
Practica 5 Cad Cam
161 páginas
SISTEMAS SCADA 2da EDICION (Capítulo 1)
Aún no hay calificaciones
SISTEMAS SCADA 2da EDICION (Capítulo 1)
76 páginas
TEMA 04 - Tipos de Comunicaciones LabVIEW
Aún no hay calificaciones
TEMA 04 - Tipos de Comunicaciones LabVIEW
19 páginas
Ciclos de Potencia de Gas
100% (1)
Ciclos de Potencia de Gas
48 páginas
Lathe Simulator Lite
Aún no hay calificaciones
Lathe Simulator Lite
4 páginas
Diseño e Implementación de Un Sistema de Reconocimiento de Naranjas para El Robot Gio 1 Usando Visión Asistida Por Computador
Aún no hay calificaciones
Diseño e Implementación de Un Sistema de Reconocimiento de Naranjas para El Robot Gio 1 Usando Visión Asistida Por Computador
61 páginas
Intro LabView
Aún no hay calificaciones
Intro LabView
83 páginas
Unidad 2 Octavo
Aún no hay calificaciones
Unidad 2 Octavo
33 páginas
Tesis PLC
100% (1)
Tesis PLC
100 páginas
Tutorial COSIMIR
Aún no hay calificaciones
Tutorial COSIMIR
12 páginas
Maquinado Ultrasónico
Aún no hay calificaciones
Maquinado Ultrasónico
42 páginas
Modelo de Ensamblado de Componentes
Aún no hay calificaciones
Modelo de Ensamblado de Componentes
8 páginas
Medición de Piezas Con Software Visión Artificial de Labview
100% (1)
Medición de Piezas Con Software Visión Artificial de Labview
9 páginas
Arquitectura Según Von Neumann y Harvard
100% (1)
Arquitectura Según Von Neumann y Harvard
2 páginas
Sistemas Mecatrónicos
100% (1)
Sistemas Mecatrónicos
38 páginas
Mantenimientopreventivoycorrectivo 150104191451 Conversion Gate02
Aún no hay calificaciones
Mantenimientopreventivoycorrectivo 150104191451 Conversion Gate02
9 páginas
Cognex, Guia de Aplicaciones de Vision para El Ingeniero
Aún no hay calificaciones
Cognex, Guia de Aplicaciones de Vision para El Ingeniero
12 páginas
Resumen
Aún no hay calificaciones
Resumen
52 páginas
Sistema de Visión Artificial
100% (2)
Sistema de Visión Artificial
6 páginas
Mecanizado No Convencional
Aún no hay calificaciones
Mecanizado No Convencional
13 páginas
Introduccion A LabVIEW
Aún no hay calificaciones
Introduccion A LabVIEW
18 páginas
MANUAL 3D Con Cura para Delta Inet
100% (1)
MANUAL 3D Con Cura para Delta Inet
6 páginas
Documentación Del Proyecto
Aún no hay calificaciones
Documentación Del Proyecto
48 páginas
Manual Spice
Aún no hay calificaciones
Manual Spice
42 páginas
Presentación CNC
Aún no hay calificaciones
Presentación CNC
35 páginas
Expediente Reforestacion Nuevo Porvenir
100% (1)
Expediente Reforestacion Nuevo Porvenir
126 páginas
Ing Basica de Procesos Quimicos PDF
100% (3)
Ing Basica de Procesos Quimicos PDF
324 páginas
Manufactura Avanzada Unidad 3 Resumen
0% (1)
Manufactura Avanzada Unidad 3 Resumen
9 páginas
VisualMILL 6 Tutorial Esp
Aún no hay calificaciones
VisualMILL 6 Tutorial Esp
39 páginas
SA Tema 06 Sensores Capacitivos
Aún no hay calificaciones
SA Tema 06 Sensores Capacitivos
36 páginas
Introducción A Los Mecanismos.
Aún no hay calificaciones
Introducción A Los Mecanismos.
30 páginas
Visión Artificial
Aún no hay calificaciones
Visión Artificial
11 páginas
Guía de Primeros Pasos Con CMMT-As-PN - Rev3
Aún no hay calificaciones
Guía de Primeros Pasos Con CMMT-As-PN - Rev3
20 páginas
Mecatronica Nivel Medio Superior
Aún no hay calificaciones
Mecatronica Nivel Medio Superior
8 páginas
SIMULACIÓN DE VISUALIZACION Y CONTROL DE PROCESOS Terminada
Aún no hay calificaciones
SIMULACIÓN DE VISUALIZACION Y CONTROL DE PROCESOS Terminada
33 páginas
Sena Ejemplo Diseño
Aún no hay calificaciones
Sena Ejemplo Diseño
116 páginas
Monografia CNC
Aún no hay calificaciones
Monografia CNC
11 páginas
Equipo 2. Procesos y Equipos de Rem de Materiales.
Aún no hay calificaciones
Equipo 2. Procesos y Equipos de Rem de Materiales.
91 páginas
Tesis de Una Maquina CNC Con Labview
Aún no hay calificaciones
Tesis de Una Maquina CNC Con Labview
8 páginas
Practica 1 PDF
0% (1)
Practica 1 PDF
4 páginas
Guia de Aprendizaje CNC 1
100% (1)
Guia de Aprendizaje CNC 1
4 páginas
Sistemas Integrales de Manufactura
0% (2)
Sistemas Integrales de Manufactura
19 páginas
Resumen LabView JAVIER
Aún no hay calificaciones
Resumen LabView JAVIER
1 página
El Torno de Control Numérico Computarizado. Definición, Ventajas y Componentes
Aún no hay calificaciones
El Torno de Control Numérico Computarizado. Definición, Ventajas y Componentes
15 páginas
Memoria
Aún no hay calificaciones
Memoria
73 páginas
GONARTROSIS Resumido
Aún no hay calificaciones
GONARTROSIS Resumido
30 páginas
Anexo A Base Del Parque Eolico
Aún no hay calificaciones
Anexo A Base Del Parque Eolico
17 páginas
Historia, Tipos y Grados de Libertad de Un Robot
Aún no hay calificaciones
Historia, Tipos y Grados de Libertad de Un Robot
4 páginas
Curso Scada Automatizacion - Labview
Aún no hay calificaciones
Curso Scada Automatizacion - Labview
59 páginas
AUTOCAD 3D Avanzado
Aún no hay calificaciones
AUTOCAD 3D Avanzado
2 páginas
Sensor de Temperatura Infrarojo 123698 Español PDF
Aún no hay calificaciones
Sensor de Temperatura Infrarojo 123698 Español PDF
8 páginas
Articulo Robot Cartesiano
Aún no hay calificaciones
Articulo Robot Cartesiano
5 páginas
2° Soy Lector MD Parte 2 - 2023
Aún no hay calificaciones
2° Soy Lector MD Parte 2 - 2023
23 páginas
Himnoss 5toa
Aún no hay calificaciones
Himnoss 5toa
10 páginas
Teoría de Control y Robótica
Aún no hay calificaciones
Teoría de Control y Robótica
6 páginas
Actuadores Hidraulicos
Aún no hay calificaciones
Actuadores Hidraulicos
7 páginas
Modelo Matematico Del Motor DC
Aún no hay calificaciones
Modelo Matematico Del Motor DC
5 páginas
Tarifario BMSC
Aún no hay calificaciones
Tarifario BMSC
22 páginas
Salman Kahn y Las "Escuelas Al Reves". Resumen
100% (1)
Salman Kahn y Las "Escuelas Al Reves". Resumen
2 páginas
Cgpe 2024
Aún no hay calificaciones
Cgpe 2024
128 páginas
Sistema de Permanencia de Inventarios Grupo 2
Aún no hay calificaciones
Sistema de Permanencia de Inventarios Grupo 2
4 páginas
Sesión 1 - Introducción A Las Finanzas Corporativas (Con Marca de Agua)
Aún no hay calificaciones
Sesión 1 - Introducción A Las Finanzas Corporativas (Con Marca de Agua)
32 páginas
Marco Integrado de Cont Int Leyen
Aún no hay calificaciones
Marco Integrado de Cont Int Leyen
84 páginas
Manual de Convivencia Guayacan de Las Garzas
Aún no hay calificaciones
Manual de Convivencia Guayacan de Las Garzas
22 páginas
Manual Estancos
Aún no hay calificaciones
Manual Estancos
67 páginas
La Historia de La Fotografia
Aún no hay calificaciones
La Historia de La Fotografia
3 páginas
Revista Biodiversidad 5 Hongos Selva Misionera
Aún no hay calificaciones
Revista Biodiversidad 5 Hongos Selva Misionera
11 páginas
Rúbrica Rollitos de Primavera, PDF
Aún no hay calificaciones
Rúbrica Rollitos de Primavera, PDF
1 página
Ayudas Kingsport PDF
Aún no hay calificaciones
Ayudas Kingsport PDF
5 páginas
Direcciónde Obras - Grupo 4
Aún no hay calificaciones
Direcciónde Obras - Grupo 4
27 páginas
Informe Yogurt
Aún no hay calificaciones
Informe Yogurt
8 páginas
Tema 4 La Imagen Digital en Los Contenidos Educativos Multimedia
Aún no hay calificaciones
Tema 4 La Imagen Digital en Los Contenidos Educativos Multimedia
20 páginas
GRADO CUARTO CALENTAMIENTO.1pdf
Aún no hay calificaciones
GRADO CUARTO CALENTAMIENTO.1pdf
2 páginas
Examen Final 16
Aún no hay calificaciones
Examen Final 16
2 páginas
Rectas y Planos en El Espacio
Aún no hay calificaciones
Rectas y Planos en El Espacio
4 páginas
Examen (ACDB1-35 - ) (SUP1) Actividad Suplementaria Identifique 5 Paradigmas de La Reforma Del Estado y La Descentralización.
Aún no hay calificaciones
Examen (ACDB1-35 - ) (SUP1) Actividad Suplementaria Identifique 5 Paradigmas de La Reforma Del Estado y La Descentralización.
5 páginas
Actividad3 - Modulo2 - Control - Interno - 2014 Tarea
Aún no hay calificaciones
Actividad3 - Modulo2 - Control - Interno - 2014 Tarea
6 páginas
Infografía Fuentes Energéticas en El Movimiento
Aún no hay calificaciones
Infografía Fuentes Energéticas en El Movimiento
1 página
Estadistica
Aún no hay calificaciones
Estadistica
4 páginas
La Lactancia Materna
Aún no hay calificaciones
La Lactancia Materna
3 páginas
Tópicos Tecnológicos, Científicos Y Ambientales: Red De Colaboración Del Instituto Tecnológico Superior De La Sierra Norte De Puebla Y El Instituto Tecnológico Superior De Huauchinango
De Everand
Tópicos Tecnológicos, Científicos Y Ambientales: Red De Colaboración Del Instituto Tecnológico Superior De La Sierra Norte De Puebla Y El Instituto Tecnológico Superior De Huauchinango
Rafael Garrido Rosado
Aún no hay calificaciones
Aprendizaje significativo de sistemas embebidos: De la teoría a la práctica
De Everand
Aprendizaje significativo de sistemas embebidos: De la teoría a la práctica
Sergio Salas Arriarán
Aún no hay calificaciones
Desarrollo de componentes software para el manejo de dispositivos. IFCT0609
De Everand
Desarrollo de componentes software para el manejo de dispositivos. IFCT0609
Mª Josefa Díaz Coca
Aún no hay calificaciones
Modelos de simulación basados en agentes aplicados a las Ciencias Políticas
De Everand
Modelos de simulación basados en agentes aplicados a las Ciencias Políticas
Antonio Aguilera Ontiveros
Aún no hay calificaciones
Tren Flotante: Allanando el camino hacia los futuros trenes de alta velocidad
De Everand
Tren Flotante: Allanando el camino hacia los futuros trenes de alta velocidad
Fouad Sabry
Aún no hay calificaciones