Redneuronalartificial 120214132949 Phpapp02

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 36

Repblica Bolivariana de Venezuela

Ministerio del Poder Popular para la Defensa


Universidad Nacional Experimental
De la Fuerza Armada Nacional Bolivariana
Ncleo - Lara.

INTELIGENCIA ARTIFICIAL
(Red Neuronal Artificial)

Integrantes:
Querales, Yaneth
Huerta, Yuenni
Prez, Yaina
Principal, Yasmira
Tern, Yandry
Profesor:
Jess Contreras
Seccin: 8N2IS

Barquisimeto, Diciembre 2011

INTRODUCCION
El presente enfoque es terico prctico, de manera que se pueda
lograr su total comprensin. Se presenta el concepto de Redes neuronales
que es uno de esos trminos de gran auge en la era de la tecnologa. La
mayora de la gente los ha odo, pero pocos saben lo que significan. Este
trabajo de investigacin est diseado para iniciar al lector en las redes
neuronales, su funcionamiento, estructura genrica, terminologa, tipos y
usos.
Desde hace algunos aos, algunos investigadores han estado creando
modelos, tanto en hardware como en software, que interpretan la actividad
cerebral en un esfuerzo por producir una forma de inteligencia artificial.
Muchos modelos tericos o paradigmas, datan desde los aos 50's.
Muchos de ellos tenan aplicaciones limitadas en el mundo real, teniendo
como

consecuencia

que

las

Redes

Neuronales

Artificiales

(RNA)

permanecieran en la obscuridad por dcadas.

Las RNA estn compuestas de un gran nmero elementos de


procesamiento altamente interconectados (Neuronas) trabajando al mismo
tiempo para la solucin de problemas especficos. Las RNA, tal como las
personas, aprenden de la experiencia.
En cualquier caso, se trata de una nueva forma de computacin que
es capaz de manejar las imprecisiones e incertidumbres que aparecen
cuando se trata de resolver problemas relacionados con el mundo real
(reconocimiento de formas, toma de decisiones, etc.), ofreciendo soluciones
robustas y de fcil implementacin.

Las RNA estn compuestas de muchos elementos sencillos que


operan en paralelo, el diseo de la red est determinado mayormente por las
conexiones entre sus elementos, entre los cuales se encuentran los pesos
sinpticos que son el factor de aprendizaje de la neurona, las entradas que
sern los valores a procesar, un umbral que viene a ser el sumario donde se
procesan las entradas y los pesos. Aunado a ello se mencionan las frmulas
matemticas que sirven para resolver RNA, entre ellas estn la funcin de
activacin y la de reajuste de pesos. A travs de los parmetros
mencionados Las RNA son

entrenadas para la realizacin de funciones

complejas en variados campos de aplicacin. Hoy en da pueden ser


entrenadas para la solucin de problemas que son difciles para sistemas
computacionales comunes o para el ser humano.
Finalmente, la esencia de este trabajo se ve reflejada en la necesidad
de conocer las redes neuronales artificiales, su implementacin y como llegar
a implementar una RNA en algn caso real, teniendo como objetivo que el
lector quede totalmente satisfecho con la informacin suministrada.

Conceptos bsicos que se deben tener en cuenta:

Red: conjunto de entidades (objetos, personas, etc.) conectadas entre s.

Neurona: Clula diferenciada perteneciente al sistema nervioso, capaz de


propagar el impulso nervioso a otra neurona. Est compuesta por una zona
de recepcin, las dendritas, y otra de emisin o salida, el axn o neurita: se
dice que a partir de cierta edad se acelera el proceso de prdida de
neuronas.

Artificial: Que no ha sido hecho por la naturaleza, sino por el ser humano u
otro ser inteligente.
red neuronal
Es un sistema compuesto por un gran nmero de elementos bsicos
(Neuronas),

agrupados

en

capas

y que se

encuentran

altamente

interconectadas (sinapsis).

REDES NEURONALES BIOLOGICAS (RNB)


Red Neuronal Biolgica
Est compuesta por un conjunto de neuronas de entrada (sensores)
conectados a una compleja red de neuronas "calculadoras" (neuronas
ocultas), las cuales, a su vez, estn conectadas a las neuronas de salidas
que controlan. Una neurona es una clula viva, y como tal, contiene los
mismos elementos que forman parte de todas las clulas biolgicas, adems,
de poseer elementos caractersticos que la diferencian. En general una
neurona consta de un cuerpo celular ms o menos esfrico de 5 a 10 micras
de dimetro, del que sale una rama principal el axn, y varias ramas ms

cortas denominadas dendritas. A su vez el axn puede producir ramas en


torno a su punto de arranque, y con frecuencia se ramifica extensamente
cerca de su extremo.
Soma o cuerpo celular: corresponde a la parte ms voluminosa de la
neurona. Aqu se puede observar una estructura esfrica llamada
ncleo. ste contiene la informacin que dirige la actividad de la
neurona.
Dendritas: son prolongaciones cortas que se originan del soma
neural. Su funcin es recibir impulsos de otras neuronas y enviarlas
hasta el soma de la neurona.
Axn: es una prolongacin nica y larga. En algunas ocasiones,
puede medir hasta un metro de longitud. Su funcin es sacar el
impulso desde el soma neuronal y conducirlo hasta otro lugar del
sistema.

REDES NEURONALES ARTIFICIALES (RNA)


Es una rama de la Inteligencia Artificial es "la disciplina cientfica y
tcnica que se ocupa del estudio de las ideas que permiten ser inteligentes a
los ordenadores" (definicin de H. Winston).

Qu son las RNA


Una RNA es herramienta diseada para emular la forma en que el
cerebro humano funciona.

Una RNA es parecida al cerebro en dos aspectos:


El conocimiento es adquirido a travs de un proceso de

aprendizaje.
La fuerza de conexin interneuronas, conocida como pesos

sinpticos,

son

usados

para

el

almacenamiento

del

conocimiento
Las RNA son un mtodo de resolver problemas, de forma individual o
combinadas con otros mtodos, para aquellas tareas de clasificacin,
identificacin, diagnstico, optimizacin o prediccin en las que el balance
datos/conocimiento se inclina hacia los datos y donde, adicionalmente,
puede haber la necesidad de aprendizaje en tiempo de ejecucin y de cierta
tolerancia a fallos. En estos casos las RNAs se adaptan dinmicamente
reajustando constantemente los pesos de sus interconexiones.
Las RNA se basan en la analoga que existe en el comportamiento y
funcin del cerebro humano, en particular del sistema nervioso, el cual est
compuesto por redes de neuronas biolgicas que poseen bajas capacidades
de procesamiento, sin embargo toda su capacidad cognitiva se sustenta en
la conectividad de stas.
La unidad de una red neuronal artificial es un procesador elemental
llamado neurona que posee la capacidad limitada de calcular, en general,
una suma ponderada de sus entradas y luego le aplica una funcin de
activacin para obtener una seal que ser transmitida a la prxima neurona.
Estas neuronas artificiales se agrupan en capas o niveles y poseen un alto
grado de conectividad entre ellas, conectividad que es ponderada por los
pesos. A travs de un algoritmo de aprendizaje supervisado o no

supervisado, las RNA ajustan su arquitectura y parmetros de manera de


poder minimizar alguna funcin de error que indique el grado de ajuste a los
datos y la capacidad de generalizacin de las RNA.

Las redes neuronales como su nombre lo indica pretenden imitar a


pequesima escala la forma de funcionamiento de las neuronas que forman
el cerebro humano. Todo el desarrollo de las redes neuronales tiene mucho
que ver con la neurofisiologa, no en vano se trata de imitar a una neurona
humana con la mayor exactitud posible. Entre los pioneros en el modelado
de neuronas se encuentra Warren McCulloch y Walter Pitts. Estos dos
investigadores propusieron un modelo matemtico de neurona. En este
modelo cada neurona estaba dotada de un conjunto de entradas y salidas.
Cada entrada est afectada por un peso. La activacin de la neurona se
calcula mediante la suma de los productos de cada entrada y la salida es una
funcin de esta activacin. La principal clave de este sistema se encuentra
en los pesos de las diferentes entradas. Como se ha visto, las entradas son
modificadas por el peso y las salidas son funcin de estas modificaciones.
Esto nos lleva a concluir que los pesos influyen de forma decisiva en la salida
y por lo tanto pueden ser utilizados para controlar la salida que se desea.
En realidad cuando se tienen interconectadas muchas de estas
neuronas artificiales lo que se hace inicialmente es entrenar el sistema. El
entrenamiento consiste en aplicar unas entradas determinadas a la red y
observar la salida que produce. Si la salida que produce no se adecua a la
que

se

esperaba,

se

ajustan

los

pesos

de

cada

neurona

para

interactivamente ir obteniendo las respuestas adecuadas del sistema. A la


red se le somete a varios ejemplos representativos, de forma que mediante
la modificacin de los pesos de cada neurona , la red va "aprendiendo".

ELEMENTOS BSICOS DE LA RNA:


Pesos sinpticos (wij): ligas de conexin entre los datos de

entrada y el sumador. Si estas son positivas entonces son


excitatorias, de lo contrario son inhibitorias.
Sumador: concentra la informacin como una combinacin lineal

de los pesos sinpticos y de la entrada. Conocido como la regla de


propagacin de la suma ponderada de las entradas multiplicadas
por los pesos
Umbral: disminuye la entrada (obtenida en el sumador) a la

funcin de la funcin de activacin.


Funcin de activacin: limita la amplitud de la respuesta de la

neurona al intervalo [0; 1] o [-1; 1].

BENEFICIOS Y VENTAJAS DE USAR RNA


1. Generalizacin: Capacidad para producir respuestas razonables a

estmulos no presentados durante su entrenamiento.


2. Adaptabilidad: La red puede ser construida para adaptar sus pesos

sinpticos

al

medio

ambiente

(re-entrenar).

Es

una

de

las

caractersticas ms atractivas de las redes neuronales, es la


capacidad de aprender a realizar tareas basadas en un entrenamiento
o una experiencia inicial.

3. Auto organizacin: Las redes neuronales usan su capacidad de

aprendizaje adaptativo para organizar la informacin que reciben


durante el aprendizaje y/o la operacin. Una RNA puede crear su
propia organizacin o representacin de la informacin que recibe
mediante una etapa de aprendizaje. Esta auto organizacin provoca la
facultad de las redes neuronales de responder apropiadamente
cuando se les presentan datos o situaciones a los que no haban sido
expuestas anteriormente.

4. Robusta: Por su carcter distributivo, una red maneja muy bien daos

a su estructura (ruido).
5. Complejidad: Puede capturar comportamiento complejo que no es

posible con mtodos tradicionales.

6. No-parametrito: No hace suposiciones.

7. Tolerancia a Fallos: Comparados con los sistemas computacionales

tradicionales, los cuales pierden su funcionalidad en cuanto sufren un


pequeo error de memoria, en las redes neuronales, si se produce un
fallo en un pequeo nmero de neuronas, aunque el comportamiento
del sistema se ve influenciado, sin embargo no sufre una cada
repentina.
Hay dos aspectos distintos respecto a la tolerancia a fallos: primero, las
redes pueden aprender a reconocer patrones con ruido, distorsionados, o

incompleta. Segundo pueden seguir realizando su funcin (con cierta


degradacin) aunque se destruya parte de la red.
La razn por la que las redes neuronales son tolerantes a fallos es que
tienen su informacin distribuida en las conexiones entre neuronas,
existiendo cierto grado de redundancia en ese tipo de almacenamiento, a
diferencia de la mayora de los ordenadores algortmicos y sistemas de
recuperacin de datos que almacenan cada pieza de informacin en un
estado nico, localizado y direccionable.

8. Operacin en Tiempo Real: Los computadores neuronales pueden

ser realizados en paralelo, y se disean y fabrican mquinas con


hardware especial para obtener esta capacidad.

9. Fcil insercin dentro de la tecnologa existente: Debido a que una

red puede ser rpidamente entrenada, comprobada, verificada y


trasladada a una implementacin hardware de bajo costo, es fcil
insertar RNA para aplicaciones especficas dentro de sistemas
existentes (chips, por ejemplo). De esta manera, las redes neuronales
se pueden utilizar para mejorar sistemas de forma incremental, y cada
paso puede ser evaluado

FUNCIONES EN EL MODELO DE NEURONA ARTIFICIAL


El modelo de neurona artificial, modela la neurona como una
serie de funciones que se componen entre ellas siendo los resultados
unas los parmetros de otras, as la funcin de ponderacin hace uso
de los valores que le llegan de las entradas y los pesos de las sinapsis

y la funcin de activacin toma este valor para transformarlo en el


estado de la neuronas mediante la interaccin de estas funciones se
procesa la informacin.
ALGUNAS DE LAS APLICACIONES MS DESTACADAS DE LAS RNA
SON:
Reconocimiento de patrones de clasificacin:
Reconocimiento de voz, de caracteres manuscritos,...
Anlisis y reconocimiento de imgenes, formas,...
Diagnstico clnico.
Escritura. La red es presentada con muchos ejemplos de un

patrn hasta guardar el patrn, luego al ser presentado una


versin con ruido esta es capaz de reconocer el patrn.
Asociacin de patrones: Clasificacin: una la red es entrenada

con ejemplos de clasificacin conocida.


Aproximacin de funciones. Identificacin, problemas inversos.
Control: se conoce una seal de referencia y el objetivo es ajustar

los parmetros libres para seguir la salida deseada.


Filtro: son tiles en predicciones.
Anlisis de series temporales y prediccin:
Modelos meteorolgicos.
Prediccin del comportamiento.

Prediccin de series temporales.

Robtica
Entre otras.

COMPARACIN ENTRE REDES NEURONALES BIOLGICAS Y REDES


NEURONALES ARTIFICIALES
La neurona artificial como smil de la neurona biolgica:
Las neuronas artificiales son modelos que tratan de simular el
comportamiento de las neuronas biolgicas. Cada neurona se representa
como una unidad de proceso que forma parte de una entidad mayor, la red
neuronal.
Como se ve la ilustracin, dicha unidad de proceso consta de una
serie de Entradas Xi, que equivalen a las dendritas de donde reciben la
estimulacin, ponderadas por unos pesos Wi , que representan como los
impulsos entrantes son evaluados y se combinan con la funcin de red que
nos dar el nivel de potencial de la neurona.
La salida de la funcin de red es evaluada en la funcin de activacin
que da lugar a la salida de la unidad de proceso.
Como se puede ver en la siguiente ilustracin, La neurona artificial se
comporta como la neurona biolgica pero de una forma muy simplificada.

Por las entradas Xi llegan unos valores que pueden ser enteros, reales
o binarios. Estos valores equivalen a las seales que enviaran otras
neuronas a la nuestra a travs de las dendritas.
Los pesos que hay en las sinapsis Wi, equivaldran en la neurona
biolgica a los mecanismos que existen en las sinapsis para transmitir la
seal. De forma que la unin de estos valores (Xi y Wi) equivalen a las
seales qumicas inhibitorias y excitadoras que se dan en las sinapsis y que
inducen a la neurona a cambiar su comportamiento.
Estos valores son la entrada de la funcin de ponderacin o red que
convierte estos valores en uno solo llamado tpicamente el potencial que en
la neurona biolgica equivaldra al total de las seales que le llegan a la
neurona por sus dendritas. La funcin de ponderacin suele ser una la suma
ponderada de las entradas y los pesos sinpticos.
La salida de funcin de ponderacin llega a la funcin de activacin
que transforma este valor en otro en el dominio que trabajen las salidas de
las neuronas.

Suele ser una funcin no lineal como la funcin paso o

sigmoidea aunque tambin se usa funciones lineales

El valor de salida cumplira la funcin de la tasa de disparo en las


neuronas
biolgicas. Suele ser la funcin identidad aunque hay sistemas en que no es
as pero estos sistemas sobrepasan el nivel de esta introduccin as que nos
quedamos con lo ms sencillo suponemos que la salida devuelve la identidad

Cuadro Comparativo

NEURONAS BIOLGICAS
Red neuronal biolgica, cmulo de
neuronas fsicamente interconectadas
cuya actividad ayuda a definir un circuito
reconocible en el sistema nervioso.

NEURONAS ARTIFICIALES
Red neuronal artificial, modelos
matemticos y computacionales de una
red neuronal empleados en estadstica,
psicologa cognitiva, e inteligencia
artificial.
Conexiones sinpticas.
(sinapsis: Conexiones ponderadas. (pesos +
conexin dendrita y axn de una neurona entradas)
y otra)
Efectividad de la sinapsis. (mecanismos Peso de las conexiones. (Wi)
que transmiten seal (conexin con otra
neurona)
Efecto excitador o inhibidor de una Signo del peso de una excitacin.
conexin.
peso-entrada (+) = sinapsis excitadora
(estimula la neurona para que se peso-entrada (-) = sinapsis inhibidora
relacione con las dems)
Efecto combinado de la sinapsis
Funcin de propagacin o de red
(ncleo) (realiza procesamiento de pesos
y entradas)
Activacin -> tasa de disparo
Funcin de activacin -> salida (axn)

PERCEPTRN SIMPLE
El Perceptrn es un tipo de red neuronal artificial desarrollado por
Frank Rosenblatt, vase Perceptrn multicapa, tambin puede entenderse
como perceptrn la neurona artificial y unidad bsica de inferencia en forma
de discriminador lineal, que constituye este modelo de red neuronal artificial,
esto debido a que el perceptrn puede usarse como neurona dentro de un
perceptrn ms grande u otro tipo de red neuronal artificial.

Perceptrn simple: El perceptrn usa una matriz para representar las redes
neuronales y es un discriminador terciario que traza su entrada x (un vector
binario) a un nico valor de salida f(x) (un solo valor binario) a travs de
dicha matriz.

Donde w es un vector de pesos reales y

es el producto punto (que

computa una suma ponderada). u es el 'umbral', el cual representa el grado


de inhibicin de la neurona, es un trmino constante que no depende del
valor que tome la entrada.
El valor de f(x) (0 o 1) se usa para clasificar x como un caso positivo o
un caso negativo, en el caso de un problema de clasificacin binario. El
umbral puede pensarse de como compensar la funcin de activacin, o
dando un nivel bajo de actividad a la neurona del rendimiento. La suma
ponderada de las entradas debe producir un valor mayor que u para cambiar
la neurona de estado 0 a 1.
En la fase de aprendizaje los pesos son ajustados de acuerdo a la
suma pesada de las entradas (la red). En el perceptrn estndar, la red pasa
a la funcin de activacin y la salida de la funcin es usada para ajustar los
pesos.

PERCEPTRON MULTICAPA:
Es una red neuronal artificial formada por multicapas, esto le permite
resolver problemas que no son linealmente separables lo cual es la principal
limitacin del perceptron (tambin llamado perceptron simple). El perceptron
multicapa puede ser totalmente o localmente conectado. En el primer caso
cada salida de una neurona de capa i es entrada de todas las neuronas de la
capa i+1, mientras que en el segundo cada neurona de la capa i es
entrada de una serie de neuronas(regin)de la capa i+1

Capa de entrada: las neuronas de la capa de entrada, reciben los


datos que se proporcionan a la RNA para que los procese.

Capas ocultas: estas capas introducen grados de libertad adicionales


en la RNA. El nmero de ellas puede depender del tipo de red que
estemos considerando. Este tipo de capas realiza gran parte del
procesamiento.

Capa de salida: Esta capa proporciona la respuesta de la red


neuronal. Normalmente tambin realiza parte del procesamiento.

RED ADALINE
Esta red es del mismo tipo que la perceptron, la red adaline utiliza un
mtodo de aprendizaje basada en un algoritmo llamado LMS. Est
compuesta por una neurona con dos entradas, la salida presenta dos
opciones o es mayor que 0 o menos que 0. Su aprendizaje es supervisado y
para actualizar el valor de los pesos utiliza el algoritmo anteriormente citado.
Su utilizacin principal es el filtrado y el procesamiento de seale
Estructura Adaline
La Figura (4.5.a) muestra una Adaline bsica. La unidad procesadora
representada por un crculo con el smbolo sumatorio implementa una
funcin umbral. Las conexiones de cada una de las entradas tienen
asociadas un valor de ponderacin llamado tambin peso wi.
El mecanismo de ajuste de los pesos representado en la Figura
(4.5.b), consiste en utilizar

APRENDIZAJE SUPERVISADO
Como ya se mencion anteriormente una red neuronal artificial (ANN)
es un esquema de computacin distribuida inspirada en la estructura del
sistema nervioso de los seres humanos. La arquitectura de una red neuronal
es formada conectando mltiples procesadores elementales, siendo ste un
sistema adaptivo que posee un algoritmo para ajustar sus pesos (parmetros
libres) para alcanzar los requerimientos de desempeo del problema basado
en muestras representativas.
Por lo tanto podemos sealar que una ANN es un sistema de
computacin distribuida caracterizada por:

Un conjunto de unidades elementales, cada una de las cuales posee

bajas capacidades de procesamiento.


Una densa estructura interconectada usando enlaces ponderados.
Parmetros libres que deben ser ajustados para satisfacer los

requerimientos de desempeo.
Un alto grado de paralelismo.

Es importante sealar que la propiedad ms importante de las redes


neuronales artificiales es su capacidad de aprender a partir de un conjunto
de patrones de entrenamientos, es decir, es capaz de encontrar un modelo
que ajuste los datos. El proceso de aprendizaje tambin conocido como
entrenamiento de la red puede ser supervisado o no supervisado.
El aprendizaje supervisado
Se asemeja al mtodo de enseanza tradicional con un profesor que
indica y corrige los errores del alumno hasta que ste aprende la leccin. Si
la red utiliza un tipo de aprendizaje supervisado debemos proporcionarle
parejas de patrones entrada-salida y la red neuronal aprende a asociarlos.
En terminologa estadstica equivale a los modelos en los que hay
vectores de variables independientes y dependientes: tcnicas de regresin,
anlisis discriminante, anlisis lgit, modelos de series temporales, etc. En
aprendizaje automtico y minera de datos, el aprendizaje supervisado es
una tcnica para deducir una funcin a partir de datos de entrenamiento. Los
datos de entrenamiento consisten de pares de objetos (normalmente
vectores): una componente del par son los datos de entrada y el otro, los
resultados deseados. La salida de la funcin puede ser un valor numrico

(como en los problemas de regresin) o una etiqueta de clase (como en los


de clasificacin).
A travs del aprendizaje supervisado es la de crear una funcin capaz
de predecir el valor correspondiente a cualquier objeto de entrada vlida
despus de haber visto una serie de ejemplos, los datos de entrenamiento.
Para ello, tiene que generalizar a partir de los datos presentados a las
situaciones no vistas previamente, cabe destacar que en otros trminos
consiste en entrenar la red a partir de un conjunto de datos o patrones de
entrenamiento compuesto por patrones de entrada y salida. El objetivo del
algoritmo de aprendizaje es ajustar los pesos de la red w de manera tal que
la salida generada por la ANN sea lo ms cercanamente posible a la
verdadera salida dada una cierta entrada. Es decir, la red neuronal trata de
encontrar un modelo al procesos desconocido que gener la salida y. Este
aprendizaje se llama supervisado pues se conoce el patrn de salida el cual
hace el papel de supervisor de la red.
El aprendizaje supervisado consiste en entrenar la red a partir de un
conjunto de datos o patrones de entrenamiento compuesto por patrones de
entrada y salida. El objetivo del algoritmo de aprendizaje es ajustar los pesos
de la red w de manera tal que la salida generada por la ANN sea lo ms
cercanamente posible a la verdadera salida dada una cierta entrada. Es
decir, la red neuronal trata de encontrar un modelo al procesos desconocido
que gener la salida y. Este aprendizaje se llama supervisado pues se
conoce el patrn de salida el cual hace el papel de supervisor de la red.

El aprendizaje no supervisado

No hay un profesor que corrija los errores al alumno; recuerda ms al


auto aprendizaje. El alumno dispone del material de estudio pero nadie lo
controla. Si el entrenamiento es no supervisado, nicamente debemos
suministrar a la red los datos de entrada para que extraiga los rasgos
caractersticos esenciales. En terminologa estadstica equivale a los
modelos en los que slo hay vectores de variables independientes y buscan
el agrupamiento de los patrones de entrada: anlisis de conglomerados o
clster, escalas multidimensionales, etc.
Aprendizaje no supervisado se presenta slo un conjunto de patrones
a la ANN, y el objetivo del algoritmo de aprendizaje es ajustar los pesos de la
red de manera tal que la red encuentre alguna estructura o configuracin
presente en los datos.
Algunas de sus aplicaciones ms importantes son:

Asociadores de patrones, esto es asocia dos patrones y permite


recuperar la informacin a pesar de errores en la capa de entrada.

Modeladores funcionales, las redes neuronales permiten, gracias a


su capacidad de ajustar el error dar los valores ms cercanos a una
funcin de la que solo sabemos algunos puntos por los que pasa
CICLO DE ENTRENAMIENTO

El entrenamiento de la red neuronal es muy importante ya que servir


para que posteriormente la respuesta del sistema sea la adecuada. Si nos
fijamos un poco eso tiene mucho que ver con el aprendizaje humano.
Ejemplo, Cuando a un nio se le ordena coger un vaso, empieza moviendo el
brazo de forma cuasi-aleatoria hasta que choca con el vaso y lo presiona con

sus dedos. La prxima vez que se le ordene al nio, ste alcanzar el vaso
con mayor soltura y precisin. Este mismo modelo se ha ensayado en redes
neuronales de caractersticas similares a las del nio. Una vez que el brazo
mecnico choca con la pieza y memoriza la secuencia, en posteriores
ocasiones al brazo le cuesta menos realizar la misma operacin se dice
entonces que el sistema adquiri experiencia.

Algoritmo de entrenamiento
Son tcnicas matemticas o heursticas bien establecidas a travs de
los cuales se obtienen los valores de los pesos sinpticos y el parmetro de
sesgo. Estos algoritmos NO modifican la funcin de activacin elegida para
el modelo de red neuronal que se entrena.

Lo que hacen es modificar los pesos sinpticos utilizando el valor


anterior de este ms un factor de correccin:

Y se diferencian uno de otro en la forma en que dicha correcciones


obtenidas. Existen una amplia variedad de algoritmos de entrenamiento cada
cual con sus fortalezas y debilidades. Distintos paradigmas de aprendizaje
junto con distintos algoritmos de entrenamiento producen diversas redes
neuronales.

Existen muchos algoritmos de entrenamiento, algunos de los cuales se


mencionan:
Error

correction learning or delta rule: es un aprendizaje

supervisado, en donde se usa el error obtenido en la presentacin del


estmulo para determinar el factor de correccin.
Competitive learning: las neuronas compiten entre s para hacerse

activas estableciendo. Solo una se activa a la vez (especializacin).


Hebbian learning: correlaciona la actividad prey post sinptica (si

ambas neuronas se activan se fortalece la conexin y se debilita en


caso contrario).
Aqu el factor de correccin es multiplicativo entre la actividad prey

post sinptica.
Memory Based learning: la red almacena data ya procesada en

memoria. Un nuevo patrn es procesado segn su cercana (en


sentido euclideo) a un patrn en memoria

ENTRENAMIENTO
Durante la operatoria de una red neuronal podemos distinguir
claramente dos fases o modos de operacin: la fase de aprendizaje o
entrenamiento, y la fase de operacin o ejecucin.
Durante la primera fase, la fase de aprendizaje, la red es entrenada
para realizar un determinado tipo de procesamiento. Una vez alcanzado un
nivel de entrenamiento adecuado, se pasa a la fase de operacin, donde la
red es utilizada para llevar a cabo la tarea para la cual fue entrenada.
Una vez seleccionada el tipo de neurona artificial que se utilizar en
una red neuronal y determinada su topologa es necesario entrenarla para
que la red pueda ser utilizada. Partiendo de un conjunto de pesos sinpticos
aleatorio, el proceso de aprendizaje busca un conjunto de pesos que
permitan a la red desarrollar correctamente una determinada tarea. Durante
el proceso de aprendizaje se va refinando iterativamente la solucin hasta
alcanzar un nivel de operacin suficientemente bueno.
El proceso de aprendizaje se puede dividir en tres grandes grupos de
acuerdo a sus caractersticas [Isasi Viuela y Galvn Len, 2004],
[Yao,1999]:

Aprendizaje supervisado. Se presenta a la red un conjunto de


patrones de entrada junto con la salida esperada. Los pesos se van
modificando de manera proporcional al error que se produce entre la
salida real de la red y la salida esperada.

Aprendizaje no supervisado. Se presenta a la red un conjunto de

patrones de entrada. No hay informacin disponible sobre la salida


esperada. El proceso de entrenamiento en este caso deber ajustar
sus pesos en base a la correlacin existente entre los datos de
entrada.

Aprendizaje por refuerzo. Este tipo de aprendizaje se ubica entre


medio de los dos anteriores. Se le presenta a la red un conjunto de
patrones de entrada y se le indica a la red si la salida obtenida es o no
correcta. Sin embargo, no se le proporciona el valor de la salida
esperada. Este tipo de aprendizaje es muy til en aquellos casos en
que se desconoce cul es la salida exacta que debe proporcionar la
red.

Fase de operacin
Una vez finalizada la fase de aprendizaje, la red puede ser utilizada
para realizar la tarea para la que fue entrenada. Una de las principales
ventajas que posee este modelo es que la red aprende la relacin existente
entre los datos, adquiriendo la capacidad de generalizar conceptos. De esta
manera, una red neuronal puede tratar con informacin que no le fue
presentada durante de la fase de entrenamiento.

Descripcin general:
Las redes neuronales que puede crear y simular el programa estn
formadas por 2 capas de neuronas:

Una capa de entradas, con un mximo de 8 neuronas.


Una capa de salidas, con un mximo de 8 neuronas.

Y, cada neurona de la capa de entradas est conectada con todas las


neuronas de la capa de salidas. Estas conexiones presentan pesos
sinpticos variables: Wij, siendo i el nmero de la neurona de entrada (Xi) y j
el de la neurona de salida (Xj).
Adems, cada neurona de la capa de salidas presenta un valor umbral
(Tj), que, para facilitar la rutina de entrenamiento, se expresa como si fuera
un peso sinptico ms, asociado a una neurona bias (siempre activa).
De esta manera, los valores umbrales quedan: Tj = -W0j, siendo j el
nmero de la neurona de salida (Xj) y X0 la neurona bias.
As, uno de los modelos que puede manejar el programa sera:

Y la condicin de activacin para las neuronas de la capa de salida quedara:

Para el entrenamiento se usa la regla de entrenamiento del Perceptrn


simplificada:

Si la salida generada por la neurona de salida es la correcta (no se

realizan ajustes de los pesos sinpticos).


Si la salida es 1 pero debera ser 0, se reducen slo los pesos de las

conexiones activas sobre la neurona de salida segn una constante


de entrenamiento C.
Si la salida es 0 pero debera ser 1, entonces se aumentan slo los

pesos de las conexiones activas segn la misma constante C.


El programa permite tambin trabajar con la red una vez esta ha sido
entrenada, de forma que introduciendo unos datos de entrada, la red genera
unos datos de salida.
ERROR CUADRTICO
Otro criterio razonable para escoger un determinado estimador de un
parmetro es tomar aquel que cometa, en promedio, el menor error en la
estimacin. Como, en principio, queremos penalizar igualmente los errores
por defecto que por exceso podramos establecer como cantidad a minimizar
la esperanza de la diferencia entre el estadstico T y el parmetro (en valor
absoluto para impedir que los errores por defecto y por exceso se anulen
mutuamente.

Aunque este operador resulta razonable, presenta el inconveniente de


que la funcin valor absoluto es complicada de manejar desde un punto de
vista matemtico. Por dicha razn suele utilizarse el error cuadrtico medio
(ECM) de un estimador T, definido como sigue:

Una propiedad interesante del ECM es que puede descomponerse


como la suma de dos componentes: la varianza del estimador ms su sesgo
al cuadrado:

Por tanto, en el caso de comparar diversos estimadores centrados de


un parmetro , el ECM coincidir con sus varianzas. Con lo que el
estimador con menor ECM coincidir con el de menor varianza.
Debe quedar claro, sin embargo, que el estimador con menor ECM no
debe ser necesariamente centrado. De hecho, no siempre existir el
estimador con ECM mnimo. En realidad, si no nos restringimos a
estimadores centrados, suele suceder que para unos determinados valores
de sea un estimador el que produzca un ECM menor, mientras que para
otros valores de sea otro estimador el que obtenga un ECM menor.
ALGORITMO DE RETROPROPAGACIN
La Red Backpropagation
El mtodo por el cual el error es propagado hacia atrs fue
descubierto por D.E. Rumelhart, G.E. Hinton y R.J. Williams en 1986. Ellos
formalizaron dicho mtodo para que una red neuronal aprendiera la
asociacin que existe entre los patrones de entrada y las clases
correspondientes, utilizando varios niveles de neuronas.
El mtodo backpropagation (propagacin del error hacia atrs),
basado en la generalizacin de la regla delta, a pesar de sus limitaciones, ha
ampliado de forma considerable el rango de aplicaciones de las redes
neuronales.

El mtodo de back-propagation (o entrenamiento hacia atrs) es un


sistema automtico de entrenamiento de redes neuronales con capas
ocultas, perfeccionado en la dcada de los 80. En este tipo de redes, el
problema a la hora de entrenarlas estriba en que slo conocemos la salida
de la red y la entrada, de forma que no se pueden ajustar los pesos
sinpticos asociados a las neuronas de las capas ocultas, ya que no
podemos inferir a partir del estado de la capa de salida como tiene que ser el
estado de las capas ocultas.
Es un algoritmo de aprendizaje supervisado que se usa para entrenar
redes neuronales artificiales. El algoritmo consiste en minimizar un error
(comnmente cuadrtico) por medio de descenso de gradiente, por lo que la
parte esencial del algoritmo es clculo de las derivadas parciales de dicho
error con respecto a los parmetros de la red neuronal.
Conocido tambin por su denominacin en ingls, backpropagation,
este algoritmo es de uso muy extendido en las aplicaciones de redes
neurales. Se le identifica como parte de los procesos de aprendizaje
supervisados como se dijo anteriormente, pues requiere que la red disponga
de informacin para partir de ella, usualmente en las entradas y salidas. El
algoritmo es iterativo alrededor de los pesos, pues la intencin es ajustarlos
en cada unidad de tal manera que se reduzca el error entre la salida deseada
y la real. De ah que la variable principal sea conocida como error derivado
de los pesos, EW (por las siglas en ingls).
El sistema de entrenamiento mediante back-propagation consiste en:
Empezar

con unos pesos sinpticos cualquiera (generalmente

elegidos al azar).

Introducir unos datos de entrada (en la capa de entradas) elegidos al

azar entre los datos de entrada que se van a usar para el


entrenamiento.
Dejar que la red genere un vector de datos de salida (propagacin

hacia delante).
Comparar la salida generada por la red con la salida deseada.
La diferencia obtenida entre la salida generada y la deseada

(denominada error) se usa para ajustar los pesos sinpticos de las


neuronas de la capa de salidas.
El error se propaga hacia atrs (back-propagation), hacia la capa de

neuronas anterior, y se usa para ajustar los pesos sinpticos en esta


capa.
Se continua propagando el error hacia atrs y ajustando los pesos

hasta que se alcance la capa de entradas.


Este proceso se repetir con los diferentes datos de entrenamiento.

La importancia de la red backpropagation:


Consiste en su capacidad de auto adaptar los pesos de las neuronas
de las capas intermedias para aprender la relacin que existe ente un
conjunto de patrones de entrada y sus salidas correspondientes. Es
importante la capacidad de generalizacin, facilidad de dar salidas

satisfactorias a entradas que el sistema no ha visto nunca en su fase de


entrenamiento. La red debe encontrar una representacin interna que le
permita generar las salidas deseadas cuando se le dan entradas de
entrenamiento, y que pueda aplicar, adems, a entradas no presentadas
durante la etapa de aprendizaje para clasificarlas.

CONCLUSION
Con las Redes Neuronales se busca la solucin de problemas
complejos, no como una secuencia de pasos, sino como la evolucin de
unos sistemas de computacin inspirados en el cerebro humano, y dotados
por tanto de cierta "inteligencia", los cuales no son sino la combinacin de

elementos simples de proceso (neuronas - se dar una visin rpida sobre el


funcionamiento de las mismas en los seres vivos-) interconectados, que
operando de forma paralela en varios estilos que sern analizados
detalladamente,

consiguen

resolver

problemas

relacionados

con

el

reconocimiento de formas o patrones, prediccin, codificacin, control y


optimizacin entre otras aplicaciones que finalizarn con este documento.
Tambin se puede decir que las redes neuronales se orientan a
desarrollar mquinas o sistemas inteligentes capaces de simular, desarrollar
y optimizar muchas de las funciones de un ser humano as como tambin la
investigacin cientfica ya que pueden hacer cosas que el hombre por sus
limitaciones fsicas no puede realizar.
Estas redes se pueden ver como dos cosas; primero un intento de
imitar nuestra forma de pensar, por otro lado un magnfico algoritmo basado
en la paralelizacin masiva, al contrario de los sistemas informticos
habituales que se basan en procesar las cosas en serie. Esa, es tambin la
forma que tiene el ser humano de pensar.
Muchas veces se dice que los ordenadores han superado al hombre;
sin embargo no somos capaces de mantener una buena conversacin con
uno, y cosas que para nosotros son tan sencillas como identificar un rostro
en una multitud, para el ordenador basado en los algoritmos es casi
imposible. Si a nosotros nos hablan de un "animal que tiene trompa"
inmediatamente pensamos en un elefante. Sin embargo, un ordenador
habra de buscar recursivamenteen su base de datos sobre animales, uno
por uno, hasta encontrar coincidencias.

REFERENCIAS BIBLIOGRAFICAS

http://www.inf.utfsm.cl/~rsalas/Pagina_Investigacion/docs/Apuntes/Red

es%20Neuronales%20Artificiales.pdf
http://www.cs.buap.mx/~asanchez/RNA_introduccion.pdf

http://es.kioskea.net/contents/initiation/concept.php3
http://perso.wanadoo.es/alimanya/backprop.htm
http://prof.usb.ve/mvillasa/redes/Introduccion-vl.pdf
http://es.scribd.com/doc/14897677/Redes-Neuronales-Artificiales-para-

la-Prediccion-de-la-Falla-en-Vigas-de-Hormigon-Armado
http://www.slideshare.net/iquark/redes-neuronales-1426985
http://www.youtube.com/watch?v=d4t0WGjuYTs
http://www.slideshare.net/darwin2000/redes-neuronales-1725612
http://www.slideshare.net/mentelibre/introduccion-a-las-redes-

neuronales-artificiales
http://www.answermath.com/neural-networks/tutorial-esp-1-

contenido.htm
http://personal5.iddeo.es/wintrmute/ia/neuronal.htm
http://ingenieria.udea.edu.co/investigacion/mecatronica/mectronics/red

es.htm
Es.wikipedia.org/ wiki/ perceptron_multicapa
http://advancedtech.wordpress.com/2007/08/27/arquitectura-

estructura-y-funcionamiento-de-las-rna/
http://www.ibiblio.org/pub/linux/docs/LuCaS/Presentaciones/200304cur

so-glisa/redes_neuronales/curso-glisa-redes_neuronaleshtml/x69.html

También podría gustarte