Sistema Experto Cardiovascular
Sistema Experto Cardiovascular
Sistema Experto Cardiovascular
FACULTAD DE INGENIERA
SISTEMA EXPERTO BAYESIANO PARA
LA IDENTIFICACIN DE ARRITMIAS CARDACAS.
PRESENTADO POR:
LPEZ AMAYA, NELSON FABIN.
ASESOR:
ING. J UAN CARLOS CRUZ DADA.
SEPTIEMBRE DE 2005.
EL SALVADOR, CENTRO AMERICA.
NDICE
Pag.
CAPITULO I
1.1 Definicin del Tema .. 1
1.2 Objetivos ... 2
1.2.1Objetivos Generales ... 2
1.2.2 Objetivos Especficos ... 2
1.3 Alcances y Limitaciones ... 3
1.3.1 Alcances 3
1.3.2 Limitaciones 4
1.4 Cronograma del plan de trabajo 7
CAPITULO II
SISTEMAS EXPERTOS BASADOS EN PROBABILIDADES
2.1 Teorema de Bayes 9
2.2 Tipo de Errores 11
2.3 Reglas Generalizadas 13
2.4 La base de conocimiento 14
2.4.1 Modelo de sntomas
Dependientes
15
2.4.2 Modelo de sntomas
Independientes
17
2.4.3 Modelo de sntomas Relevantes
Independientes
18
2.4.4 Modelo de sntomas Relevantes
Dependientes
19
2.5 Motor de Inferencia 21
2.6 Algunos conceptos sobre Grafos. 23
2.7 Caractersticas de los grafos
dirigidos.
25
2.7.1 Tipos de grafos dirigidos. 26
Pag
CAPITULO III
CONSTRUCCION DE MODELOS PROBABILISTICOS
3.1 Factorizacin de una funcin de
probabilidad.
29
3.2 Construccin de un modelo
probabilstico.
30
3.2.1 Modelos definidos grficamente. 32
3.2.1.1 Algunas definiciones y
problemas.
33
3.2.1.2 De grafos dirigidos a modelos
probabilsticos
35
CAPITULO IV
REDES BAYESIANAS
4.1 Redes Bayesianas 37
4.2 Propagacin de evidencia en
Redes Bayesianas.
39
4.3 Propagacin de evidencia. 40
4.4 Propagacin en polirboles. 43
CAPITULO V
ARRITMIAS CARDIACAS, CONCEPTOS, DESCRIPCION E IDENTIFICACION
5.1 Anatoma y Fisiologa. 62
5.2 El Electrocardiograma. 66
5.3 Presentacin normal de la actividad
elctrica del corazn y su trazado
en el electrocardiograma.
72
5.3.1 Onda P. 73
5.3.2 Intervalo PR. 73
Pag
5.3.3 Complejo QRS. 74
5.3.4 Onda T. 74
5.3.5 Segmento ST. 74
5.3.6 Intervalo QT. 75
5.4 Arritmias. 75
5.4.1 Bradicardia. 76
5.4.2 Taquicardia. 77
5.4.3 Bradicardia. 77
5.4.3.1 Bradicardia Sinusal. 77
5.4.3.2 Paro Sinusal. 78
5.4.3.3 Bloqueo AV de 1er Grado. 78
5.4.3.4 Bloqueo AV de 2do Grado. 78
5.4.4 Taquicardias. 79
5.4.4.1 Taquicardia Sinusal. 79
5.4.4.2 Flter Auricular. 79
5.4.5 Taquicardia-Bradicardia. 80
CAPITULO VI
ESTRUCTURA DEL SISTEMA EXPERTO
6.1 Definicin del proyecto 82
6.2 Adquisicin de Conocimientos 83
6.3 Forma de Presentacin del
Conocimiento.
90
6.3.1 Escala de conceptos 90
6.3.2 Escala de Atributos 91
6.3.3 Proposicin y Variables 91
6.3.4 Diagrama de Influencias 92
6.3.5 Definicin Formal de la Base de
Conocimiento.
96
Pag
Glosario 105
Fuentes de Informacin
a. Referencias Bibliogrficas 109
b. Referencias Electrnicas 110
ANEXOS
Anexo A
Entrevista 1
Anexo B
Entrevista 2
Anexo C
Electrocardiogramas
INDICE DE DEFINICIONES
Pag.
CAPITULO II
Definicin 2.1 Grafos o Red 23
Definicin 2.2 Aristas Dirigidas 24
Definicin 2.3 aristas no Dirigidas 24
Definicin 2.4 Grafos Dirigidos y no Dirigidos 24
Definicin 2.5 Padre e hijo 25
Definicin 2.6 Ciclo 26
Definicin 2.7 Grafos dirigidos Conexos 26
Definicin 2.8 rboles y grafos mltiplemente conexos 26
Definicin 2.9 Grafos cclicos y acclicos 26
Definicin 2.10 Grafos simples y poli rboles 26
CAPITULO III
Definicin 3.1 Factorizacin mediante funciones potenciales 29
Definicin 3.2 Regla de la cadena 29
Definicin 3.3 Mapa perfecto 33
Definicin 3.4 Mapa de independencia 34
Definicin 3.5 Factorizacin recursiva segn un grafo dirigido acclico 35
CAPITULO IV
Definicin 4.1. Red Bayesiana. 37
Definicin 4.2 Evidencia. 4.2
INTRODUCCIN.
Hace algn tiempo se crea que problemas como el diagnstico mdico, controles
de trfico, problemas de planificacin, reconocimiento de voz y el de patrones,
deban ser resueltos por personas, dado que su formulacin y resolucin
requeran ciertas habilidades que solo se encuentran en los seres humanos; sin
embargo el trabajo realizado en las ltimas tres dcadas, muestra que muchos de
estos problemas pueden ser formulados y resueltos por mquinas.
El amplio campo de las ciencias de la computacin que trata estos problemas se
conoce como Inteligencia Artificial (IA), y engloba varias subreas tales como: la
visin artificial, el procesamiento del lenguaje natural, la robtica y los sistemas
expertos. En adelante nos enfocaremos en los sistemas expertos, que son
programas que poseen una gran cantidad de conocimiento sobre un campo o
dominio concreto.
Un sistema experto puede definirse como un sistema informtico (hardware y
software) que simula a los expertos humanos en un rea de especializacin dada
1
.
Como tal un sistema experto debera ser capaz de procesar, memorizar, razonar,
comunicar, tomar decisiones y explicar. Se puede pensar tambin en un sistema
experto como un consultor que pueda suministrar ayuda a los expertos humanos
con un grado razonable de confiabilidad.
Los sistemas expertos pueden clasificarse en dos tipos principales segn la
naturaleza del problema a resolver: deterministas y estocsticos. Los problemas
de tipo deterministas cuyas formulaciones y conclusiones son basadas en un
conjunto de reglas utilizando un mecanismo de razonamiento lgico fueron los
primeros en desarrollarse. En situaciones inciertas, resulta necesaria la
introduccin de medios para tratar la incertidumbre; los sistemas expertos
1
Definicin de Sistema Experto, tomado de: Enrique Castillo, J os Manuel Gutirrez, Ali S. Hadi.
Sistemas Expertos y Modelos de Redes Probabilsticas.
probabilsticos a travs de modelos de redes Bayesianas
2
representan de forma
compacta el conocimiento y es un mtodo flexible para el razonamiento y
tratamiento de la incertidumbre en un dominio especfico.
El presente proyecto esta dedicado al aprendizaje de las redes bayesianas y su
aplicacin en un sistema experto de tipo probabilstico. Dado que las redes
bayesianas involucran o relacionan dependencias a travs de todas las variables,
se adecua para manejar situaciones donde algunas entradas de datos estn
perdidas o existe incertidumbre en la informacin o representacin de los datos.
Se ha elegido el campo de la medicina, y especialmente el diagnstico mdico,
para realizar una aplicacin sencilla y objetiva de las redes bayesianas en un
sistema experto, para la identificacin de arritmias cardacas
3
, utilizando la
informacin que se recoge del electrocardiograma
4
como fuente principal de
informacin y las caractersticas de los pacientes como datos complementarios.
Todos estos datos sern introducidos en el sistema, el cual realizar una
identificacin de las anomalas del ritmo cardaco presentadas en el
electrocardiograma y un informe relacionado a ste, con la finalidad de minimizar
el error mdico con respecto a la identificacin de dichas arritmias. En este
sentido, la ausencia de literatura y trabajos relacionados, justifican la presente
propuesta de trabajo y los objetivos fundamentales del mismo.
2
Una red bayesiana es un grafo acclico dirigido en el que cada nodo representa una variable y
cada arco una dependencia probabilstica; constituye una metodologa para la construccin de
sistemas expertos.
3
Las arritmias cardacas, son trastornos en la formacin del impulso elctrico del corazn, es decir,
variaciones anormales del ritmo y frecuencia en que late el corazn.
4
El electrocardiograma es el registro grfico de la conduccin, magnitud y duracin de la corriente
elctrica del corazn; se pueden identificar trastornos del ritmo, conduccin y desequilibrios
relacionados a la funcionalidad del corazn.
CAPITULO I
1.1 DEFINICIN DEL TEMA.
El obtener soluciones muy parecidas a las que un humano dara en un
dominio especifico de conocimiento, a travs de mtodos o algoritmos
utilizados en un sistema o programa de computadora, es lo que define los
Sistemas Expertos, los cuales pueden ser creados para resolver problemas
deterministas, en el que su mtodo de inferencia esta basado en reglas y
lgica clsica; como tambin resolver problemas no deterministas, en donde
la incertidumbre de la informacin y el razonamiento se encuentran
presentes.
Uno de los mtodos ms difundidos y propuestos para el manejo y
razonamiento con incertidumbre, son las redes bayesianas, el cual, es una
grfica acclica dirigida, la cual representa relaciones de dependencia o
independencia entre el conjunto de variables, las reas de aplicacin, por
mencionar algunas son: el diagnstico, pronstico, control de produccin,
planeacin, control, reconocimiento de voz y en casi cualquier rea donde
tengamos informacin incompleta e incierta.
Especficamente en el diagnstico mdico, nos interesan las arritmias
cardacas, las cuales son trastornos o variaciones del ritmo y frecuencia
cardiaca, lo que puede sobrecargar el corazn y disminuir el gasto cardiaco.
En este sentido resulta importante la identificacin de estas arritmias, con la
finalidad de confirmar y poder as llegar a un diagnstico ms certero.
Es por esto que definimos Sistema Experto Bayesiano para la Identificacin
de Arritmias Cardacas, como la aplicacin de las redes bayesianas en un
sistema experto que identifique arritmias cardacas, a partir de la
informacin obtenida del electrocardiograma.
1
1.2 OBJETIVOS.
1.2.1 OBJETIVOS GENERALES.
Disear y desarrollar un sistema experto del tipo probabilstico utilizando
redes bayesianas, como sistema de identificacin de arritmias cardacas;
estudiando los fundamentos, algoritmos, y mtodos de propagacin de las
redes bayesianas, como metodologa para la creacin de sistemas
expertos. Adems de estudiar y definir los parmetros necesarios que
debern obtenerse de la grfica del electrocardiograma, para poder realizar
la identificacin de las arritmias cardacas.
1.2.2 OBJETIVOS ESPECFICOS.
Proporcionar el formato y la estructura de los parmetros necesarios que
debern ser obtenidos del mdulo de captura de datos del
electrocardiograma, para la identificacin de las arritmias cardacas.
Dicho formato y estructura podr servir como referencia para el sistema
de reconocimiento de patrones que se desee hacer en otro proyecto.
Disear la red bayesiana que posea las relaciones necesarias entre los
parmetros que se obtendrn del mdulo de captura de datos del
electrocardiograma y las anomalas que se podrn identificar, como
base de conocimiento que utilizar el sistema experto.
Crear un modulo de captura de datos del electrocardiograma, datos que
conformarn nuestros parmetros, y en el cual se muestre la imagen de
la grfica del electrocardiograma, previamente escaneado, y sobre la
que el mdico reconozca, identifique e indique al sistema a travs de
lneas sobre la grfica los parmetros necesarios para identificar las
arritmias cardacas.
Desarrollar el sistema experto que posea la red bayesiana y un mtodo
de propagacin como motor de inferencia, el cual identificar las
arritmias cardacas.
Desarrollar un mdulo en el cual se explique el resultado obtenido por el
sistema experto en su razonamiento.
2
1.3 ALCANCES Y LIMITACIONES.
1.3.1 ALCANCES.
Se obtendr un informe con la representacin de los datos introducidos y
obtenidos del mdulo de captura de datos del electrocardiograma, con las
conclusiones relacionadas en la identificacin de arritmias cardacas, como
explicacin del razonamiento realizado.
El sistema experto, podr servir como un apoyo mdico o segunda opinin,
con el cual el mdico pueda reafirmar su identificacin de arritmias, que a
su vez, podr servir para tener informacin complementaria sobre el
examen de electrocardiograma realizado al paciente.
El razonamiento y la conclusin hecha por el sistema quedarn
almacenado, y disponible para poder ser adaptado por cualquier sistema de
administracin de expedientes.
Podr ser utilizado, como un sistema de aprendizaje para la identificacin
de arritmias, como una gua para los estudiantes, que necesiten validar o
reforzar sus conocimientos.
Al establecer los parmetros necesarios que debern de obtenerse del
electrocardiograma y la manera en que estos sern tratados por el sistema
experto, se tendr establecido lo que el sistema de reconocimiento de
patrones deber de hacer y proveer al sistema experto.
3
1.3.2 LIMITACIONES.
El sistema no realizar aprendizaje automtico por no poseer una base de
datos que tenga los registros de los parmetros del electrocardiograma y
sus diagnsticos o como se identificaron las arritmias, nos basaremos en
estimaciones subjetivas de los expertos humanos y del propio conocimiento
en el rea, es decir, la red se construir a partir del conocimiento de los
especialistas.
El sistema experto, no registrar o capturar todo el expediente de
pacientes, ni administrar la identificacin de arritmias por expediente, u
otros exmenes relacionados a la cardiologa, es decir, no ser un sistema
administrativo, ni almacenar historia clnica del paciente, sntomas signos
y/o pruebas complementarias. Por lo que no ser un sistema de
administracin de expedientes.
El sistema no contar con algn tipo de interfaz entre el equipo de
electrocardiograma y la computadora para capturar las grficas y obtener
los valores, representacin o interpretacin de la seal o grfica del
electrocardiograma. La grfica estar previamente escaneada y el sistema
se limitar a cargar dicha imagen, sobre la cual el mdico deber realizar
lneas indicndole al sistema la composicin de la grfica (ondas,
segmentos e intervalos), de este proceso se capturarn los datos que
conformarn los parmetros de entrada para la red bayesiana y poder
identificar las arritmias cardacas, que es el objetivo del proyecto.
No se contar con un sistema de reconocimiento de patrones y/o visin
artificial que capturen el registro y luego lo interprete. El reconocimiento de
los parmetros ser hecho por el propio mdico, el cual indicar los
parmetros necesarios al sistema a travs de lneas trazadas sobre el
electrocardiograma, por lo que el ruido y las seales con artefacto debern
ser reconocidas y descartadas por el mdico, stas no sern introducidas al
sistema, sern obviadas para utilizar la derivacin en la cual se muestre con
4
mejor calidad la grfica del electrocardiograma tal y como lo hacen los
expertos humanos.
Ya que el electrocardiograma no solo proporciona informacin acerca de la
conduccin elctrica, sino tambin de isquemias, lesiones e infartos, cada
uno con trazos y caractersticas diferentes, se enfocar solamente a ciertas
arritmias, primordialmente porque en la identificacin de arritmias no es
importante la derivacin en la que lo hagamos, por tratarse de ritmo.
Las diferentes arritmias cardacas que el sistema identificar, estar limitado
a las siguientes:
a) Bradicardias. (Bradicardia sinusal, Paro o Pausa Sinusal, Bloqueo AV
de 1er Grado y 2do. grado)
b) Taquicardias. (Taquicardia sinusal, Flter Auricular)
c) Taqui-bradicardia.
Se ha limitado ha estas, puesto que son las principales causan con las que
llegan los pacientes a consultar, y de las que se puede obtener con ms
facilidad expedientes por parte del hospital; adems, su identificacin puede
mejorar la calidad de vida del paciente, por no ser enfermedades
terminales.
La comprobacin de estas enfermedades, estarn a la vez limitadas, por los
electrocardiogramas que puedan ser concedidas por parte del hospital que
ayudar y aportar informacin para el desarrollo del proyecto
1
, dado que
stos sern utilizados para validar el sistema experto.
El mdulo de captura de datos del electrocardiograma, no realizar el
escaneado de la grfica de electrocardiograma, si no los
electrocardiogramas estarn previamente escaneadas y se limitar a
cargarlas en pantalla, para que el mdico proceda a realizar el trazados de
lneas sobre la grfica, identificando sus partes importantes (ondas,
segmentos, e intervalos).
1
Los electrocardiogramas sern concedidos por el Hospital Rosales.
5
Dado que son arritmias puede ser utilizada cualquier derivacin; por lo que
la derivacin a utilizar en el mdulo de captura de datos del
electrocardiograma ser aquella en la cual se muestre ms claramente la
grfica de la seal y el sistema no identificar tal derivacin.
El estndar a utilizar y para el cual deber estar preparado el mdulo de
captura de datos del electrocardiograma ser el estndar americano, dado
que es este el que se utiliza en nuestro pas, el cual es 25mm/s y 10mm/mV
de salida.
La red bayesiana que se construya, contendr el conocimiento necesario
para poder identificar arritmias cardacas en adultos, debido a que la
informacin a la cual se tiene alcance est identificado en una poblacin
adulta (Hospital Nacional Rosales).
6
1.4 CRONOGRAMA DEL PLAN DE TRABAJO.
7
CAPITULO II
SISTEMAS EXPERTOS BASADOS EN
PROBABILIDAD.
En la mayor parte de las aplicaciones, la incertidumbre es lo comn y no la
excepcin. Por ejemplo, una pregunta tpica en diagnstico mdico es: dado
que el paciente presenta un conjunto de sntomas, cul de las enfermedades
posibles es la que tiene el paciente? Esta situacin implica un cierto grado de
incertidumbre puesto que:
Los hechos o datos pueden no ser conocidos con exactitud. Por ejemplo, un
paciente puede no estar seguro de haber tenido fiebre la noche pasada. Por
ello, hay un cierto grado de incertidumbre en la informacin asociada a cada
paciente.
El conocimiento no es determinista. Por ejemplo, las relaciones entre las
enfermedades y los sntomas no son deterministas, puesto que un mismo
conjunto de sntomas puede estar asociado a diferentes enfermedades. De
hecho, no es extrao encontrar dos pacientes con los mismos sntomas pero
diferentes enfermedades.
La nica descripcin satisfactoria de la incertidumbre es la probabilidad. Esto
quiere decir que toda afirmacin incierta debe estar en forma de una
probabilidad, que varias incertidumbres deben ser combinadas usando las
reglas de la probabilidad, y que el clculo de probabilidades es adecuado para
manejar situaciones que implican incertidumbre
2
.
2
Lindley, D. V. (1987), El alcance de la probabilidad para el tratamiento de la incertidumbre en
Inteligencia Artificial, de la revista Statistical Science.
8
2.1 TEOREMA DE BAYES.
Publicacin pstuma de Thomas Bayes en 1763, que en esencia nos permite,
si conocemos la probabilidad de que ocurra un suceso, modificar su valor
cuando disponemos de nueva informacin.
Este teorema viene a constituir una combinacin de las leyes sumativa y
multiplicativa de probabilidades.
3
Vamos a llamar P(A) a la probabilidad de que ocurra el suceso A. P(A,B) a la
probabilidad de que ocurran los sucesos A y B. y P(A|B) a la probabilidad de
que ocurra A cuando sabemos que ha ocurrido B (probabilidad condicional).
Entonces, la probabilidad de que ocurra A y B es igual a la probabilidad de B
multiplicada por la probabilidad de A, condicionada a que haya ocurrido B.
) | ( ). ( ) | ( ). ( ) , ( A B p A p B A p B p B A p = =
4
Ec. 2.1
Por simetra se cumple la tercera igualdad de la ecuacin anterior (2.1).
Si tenemos un conjunto de posibles sucesos Ai(A1An), mutuamente
excluyentes (no pueden ocurrir dos de ellos a la vez) y que constituyen todas
las posibles situaciones (P(A1)+P(A2)++P(An)=1); y el suceso B que puede
producirse en cualquiera de las situaciones anteriores, la ecuacin anterior se
puede reescribir para A1.
3
Para una revisin ms profunda de las leyes sumativa y multiplicativa, as como de los
conceptos de probabilidad condicional e incondicional se recomienda la lectura del libro de
Gildaberto Bonilla, Estadstica, elementos de estadstica descriptiva y probabilidad, UCA
editores 1990.
4
Gildaberto Bonilla, Estadstica, elementos de estadstica descriptiva y probabilidad, UCA
editores 1990.
9
Ec. 2.2
) ( . ) | (
) ( ). | (
) | (
) ( ) | ( ) , ( ) (
) , ( ... ) , ( ) , ( ) (
) (
) ( ). | (
) | (
) ( ). | ( ) ( ). | ( ) , (
1 1
1
2 1
1 1
1
1 1 1
i i
i i i
n
A p A B p
A p A B p
B A p
A p A B p A B p B p
A B p A B p A B p B p
B p
A p A B p
B A p
B p A B p B p B A p B A p
=
= =
+ + + =
=
= =
La ecuacin (2.2) se conoce como Teorema de Bayes
5
. Para ilustrar el uso del
teorema de Bayes, supngase que un paciente puede estar sano (no tiene
enfermedad alguna) o tiene una de m - 1 enfermedades posibles {E
1
, . . . , E
m-1
}.
Por simplicidad de notacin, sea E una variable aleatoria que puede tomar uno
de m posibles valores, {e
1
, . . . , e
m
},
Donde E = e
i
significa que el paciente tiene la enfermedad E
i
, y E = e
m
significa
que el paciente no tiene ninguna enfermedad. Supngase tambin que se
tienen n sntomas {S
1
, . . . , S
n
}. Ahora, dado que el paciente tiene un conjunto
de sntomas {s
1
, . . . , s
k
}, se desea calcular la probabilidad de que el paciente
tenga la enfermedad E
i
, es decir, E = e
i
. Entonces, aplicando el teorema de
Bayes, se obtiene
=
ei
i i i
i i i
k i
s p e p
s p e p
e p
) e | ......s ( ) (
) e | ......s ( ) (
) .....s s | (
k
k
1
Ec. 2.3
Conviene hacer los siguientes comentarios sobre la frmula
6
(Ec. 2.3):
La probabilidad p(e
i
) se llama probabilidad marginal, prior, a priori o
inicial de la enfermedad E = ei puesto que puede ser obtenida antes de
conocer los sntomas.
La probabilidad p(e
i
|s
1
, . . . , s
k
) es la probabilidad posterior, a posteriori
o condicional de la enfermedad E = e
i
, puesto que se calcula despus de
conocer los sntomas S
1
= s
1
, . . . , S
k
= s
k
.
5
http://www.seh-lelha.org/bayes1.htm; Asociacin de la sociedad espaola de hipertensin.
Lus M. Molinero, El Mtodo bayesiano en la investigacin mdica. Espaa, ultima revisin
23/09/2004.
6
Francisco Javier Dez. Introduccin al Razonamiento Aproximado. Primera Edicin.
Universidad de Castilla-La Mancha, Cuenca, Espaa 1998.
10
La probabilidad p(s
1
, . . . , s
k
|e
i
) se conoce por el nombre de verosimilitud
de que un paciente con la enfermedad E = e
i
tenga los sntomas S
1
= s
1
, .
. . , S
k
= s
k
.
Por ello, se puede utilizar el teorema de Bayes para actualizar la probabilidad
a posteriori usando ambas, la probabilidad a priori y la verosimilitud, tal
como se muestra en el ejemplo que sigue:
Una prueba diagnstica para la diabetes tiene un CFP de 4% y un CFN del 5%.
Si la prevalencia de la diabetes en la poblacin donde se usa es del 7% cul
es la probabilidad de que sea diabtico un individuo en el que la prueba d
positiva? y de que no lo sea uno en el que d negativo?
p(+|NE) = 0,04 p(-|NE) = 0,96
p(-|E) = 0,05 p(+|E) = 0,95
p(E) = 0,07 p(NE) = 0,93
644 . 0
93 . 0 04 . 0 07 . 0 95 . 0
07 . 0 95 . 0
) / ( =
+ +
= + E p
y
996 . 0
93 . 0 96 . 0 07 . 0 05 . 0
93 . 0 96 . 0
) / ( =
+ +
= NE p
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E)
y p(NE), sern la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-)
y p(NE|-) si dio negativa.
7
2.2 TIPOS DE ERRORES.
Los sntomas son observables, pero las enfermedades no lo son. Pero, puesto
que las enfermedades y los sntomas estn relacionados, los mdicos utilizan
7
Ejemplo tomado de introduccin al razonamiento aproximado, Javier Francisco Dez.
Primera edicin, Universidad de Castilla-La Mancha, Cuenca, Espaa 1998
11
los sntomas para hacer el diagnstico de las enfermedades. Una dificultad que
surge con este tratamiento del problema es que las relaciones entre sntomas y
enfermedades no son perfectas. Por ejemplo, los mismos sntomas pueden ser
causados por diferentes enfermedades. Estudiando estas relaciones entre
sntomas y enfermedades, los mdicos pueden aumentar su conocimiento y
experiencia, y, por tanto, pueden llegar a ser capaces de diagnosticar
enfermedades con un mayor grado de certeza.
Sin embargo, debera ser reconocido que cuando se toman decisiones en
ambiente de incertidumbre, estas decisiones pueden ser incorrectas. En
situaciones de incertidumbre pueden cometerse dos tipos de errores:
Estado de la naturaleza Decisin
Mdica S No
S Decisin Correcta Decisin incorrecta (Tipo I)
No Decisin incorrecta (Tipo II) Decisin Correcta
Tabla 2.1 El doctor est sometido a la probabilidad de cometer uno de los dos errores
dependiendo el verdadero estado de la naturaleza.
Una decisin positiva falsa, tambin conocida como error de tipo I, y Una
decisin negativa falsa, tambin conocida como error de tipo II. En un caso de
diagnstico mdico, por ejemplo, los posibles errores son:
Error de Tipo I: Un paciente no tiene la enfermedad pero el doctor
concluye que la tiene.
Error de Tipo II: Un paciente tiene la enfermedad pero el doctor concluye
que no la tiene.
Idealmente, al doctor le gustara mantener las probabilidades de cometer esos
errores reducidos a un mnimo, pero los riesgos relativos asociados a los dos
tipos de errores deben tomarse en consideracin cuando se hace un
diagnstico. Como ilustracin, supngase que un nuevo paciente con una
enfermedad desconocida viene al centro mdico. Tras el examen por un doctor,
se determina que el paciente tiene k sntomas, s
1
, s
2
, . . . , s
k
.
La pregunta que ambos, doctor y paciente, quieren responder consiste en
saber, dados esos sntomas, cul de las enfermedades es ms probable que
12
tenga el paciente? La respuesta a esta pregunta puede obtenerse sin ms que
calcular las probabilidades a posteriori de E = e para cada una de las
enfermedades e = e
i
dados los sntomas s
1
, s
2
, . . . , s
k
, es decir, p(e
i
|s
1
, s
2
, . . . , s
k
).
Estas probabilidades pueden calcularse usando (2.2); Por ello, dado que el
paciente tiene los sntomas s
1
, s
2
, . . . , s
k
, el doctor puede concluir que la
enfermedad ms probable del paciente es la que maximice la probabilidad, es
decir, maxi{p(e
i
|s
1
, s
2
, . . . , s
k
)}. Si el valor de maxi{p(e
i
|s
1
, s
2
, . . . , s
k
)} est
cercano a la unidad, el doctor puede decidir que el paciente tiene la
enfermedad correspondiente. En otro caso, es necesario un examen adicional
o la identificacin de nuevos sntomas.
La ecuacin (2.2) puede utilizarse para calcular la nueva probabilidad
condicional para cada enfermedad dados todos los sntomas acumulados
(informacin). Este proceso debe repetirse, aadiendo ms evidencia, hasta
que la probabilidad maxi{p(e
i
|s
1
, s
2
, . . . , s
k
)} sea cercana a la unidad. Cuando
esto ocurra, el mdico podr tomar una decisin y terminar el proceso de
diagnosis. El criterio de decidir lo que se entiende por cercana a la unidad le
corresponde al doctor, dependiendo de los riesgos asociados a decisiones
errneas.
2.3 REGLAS GENERALIZADAS.
La medida de probabilidad descrita puede utilizarse para medir la incertidumbre
y para extender los sistemas basados en reglas a situaciones de incertidumbre.
Una forma de introducir la incertidumbre en los sistemas basados en reglas
consiste en utilizar reglas generalizadas.
Por ejemplo, dada la regla determinista
Regla 1: Si A es cierta, entonces B es cierta, se puede introducir
incertidumbre asociando una probabilidad a esta afirmacin.
Regla 2: Si A es cierta, entonces la probabilidad de que B sea cierta es
p(b) = , donde 0 1 es una medida de la incertidumbre de B.
13
Claramente, la Regla 1 es un caso especial de la Regla 2 puesto que se
obtiene de la Regla 2 haciendo = 1 (certeza). Pero cuando 0 < < 1
(incertidumbre), la Regla 1 ya no es apropiada. Por tanto, se puede pensar en
la Regla 2 como una regla generalizada. Por ello, el valor de determina el
nivel de implicacin como sigue (vase la Figura 2.1):
FIGURA 2.1. Ejemplos de implicaciones inciertas: A implica B con probabilidad 1(a), A implica a
B con probabilidad , donde 0 < < 1 (b), y A implica a B con probabilidad 0 (c).
Implicacin fuerte ( = 1): En la lgica clsica, la que se ha utilizado
hasta aqu en los sistemas expertos basados en reglas (Modus Ponens
y Modus Tollens), si la premisa de una regla es cierta, su conclusin
debe ser tambin cierta. Por ello, dada la regla Si A es cierta, entonces
B es cierta, se puede decir que A implica B con probabilidad 1. Esto se
ilustra en la Figura 2.1(a).
Implicacin dbil (0 < < 1): La regla anterior puede ser vista en un
sentido generalizado cuando A implica B slo en algunas ocasiones.
En este caso, se dice que A implica B con probabilidad p(B = cierto|A =
cierto), como se muestra en la Figura 2.1(b).
No implicacin ( = 0): El caso en que A no implica B puede considerarse como
que A implica B con probabilidad 0. Esto se ilustra en la Figura 2.1(c).
2.4 LA BASE DE CONOCIMIENTO.
La base de conocimiento de un sistema experto probabilstico consiste en un
conjunto de variables, {X
1
, . . . , X
n
}, y una funcin de probabilidad conjunta
definida sobre ellas, p(x
1
, . . . , x
n
). Por ello, para construir la base de
conocimiento de un sistema experto probabilstico, se necesita definir la funcin
14
de probabilidad conjunta de las variables. El modelo ms general posible se
basa en especificar directamente la funcin de probabilidad conjunta; es decir,
asignar un valor numrico (parmetro) a cada una de las posibles
combinaciones de valores de las variables. Desgraciadamente, la
especificacin directa de la funcin de probabilidad conjunta implica un gran
nmero de parmetros. Por ejemplo, con n variables binarias, la funcin de
probabilidad conjunta ms general tiene 2
n
parmetros (las probabilidades p(x
1
,
. . . , x
n
) para toda posible realizacin {x1, . . . , xn} de las variables), Esta fue
una de las primeras crticas al uso de la probabilidad en los sistemas expertos.
Sin embargo, en la mayor parte de las situaciones prcticas, muchos
subconjuntos de variables pueden ser independientes o condicionalmente
independientes. En tales casos, se pueden obtener simplificaciones del modelo
ms general teniendo en cuenta la estructura de independencia de las
variables, tales simplificaciones son:
1. El Modelo de Sntomas Dependientes (MSD).
2. El Modelo de Sntomas Independientes (MSI).
3. El Modelo de Sntomas Relevantes Independientes (MSRI).
4. El Modelo de Sntomas Relevantes Dependientes (MSRD).
2.4.1 Modelo de sntomas dependientes (MSD).
En este modelo, se supone que los sntomas son dependientes pero que las
enfermedades son independientes entre s, dados los sntomas. El MSD se
ilustra en la Figura 2.2, donde todo sntoma se conecta con los dems
sntomas y con todo valor posible de E (indicando dependencia).
FIGURA 2.2 Una ilustracin grfica del sistema de modelo de sntomas dependientes.
15
Entonces la funcin de probabilidad conjunta para el MSD puede escribirse
como
). ...., / ( ) .... ( ) .... , (
1 1 1 1 n i n n
S S e p S S p S S e p =
Que puede expresarse como:
). / ....., ( ) (
) ...., (
) / ...., , (
) ...., (
) ...., , (
) ...., / (
1
1
1
1
1
1
i n i
n
i n i
n
n i
n i
e S S p e p
S S p
e S S e p
S S p
S S e p
S S e p
=
=
La proporcionalidad se sigue de que p(s1, . . . , s
n
) es una constante de
normalizacin. La ecuacin muestra que los parmetros necesarios para la
base de datos del MSD son:
Las probabilidades marginales p(e
i
), para todos los valores posibles de
E.
Las verosimilitudes p(s
1
, . . . , s
n
|e
i
), para todas las combinaciones
posibles de sntomas y enfermedades.
Por ejemplo, para m enfermedades y n sntomas binarios, la funcin de
probabilidad marginal de E, p(e
i
), depende de m - 1 parmetros (puesto que los
m parmetros deben sumar uno). Por ello, se necesita especificar m - 1
parmetros para la funcin de probabilidad marginal de E. Con respecto a las
verosimilitudes p(s
1
, . . . , s
n
|e
i
), se necesita especificar (2
n
- 1) parmetros
8
para
cada valor posible de E, un total de m(2
n
- 1) parmetros. Por ello, el MSD
requiere un total de m - 1 + m(2
n
- 1) = m2
n
1 parmetros.
El principal problema del MSD es que requiere un nmero muy alto de
parmetros. Especificar las frecuencias para todas esas combinaciones es muy
difcil y se hace imposible al crecer los nmeros de las enfermedades y los
sntomas. Por ejemplo, con 100 enfermedades y 200 sntomas (que no es una
8
Para n sntomas binarios hay 2n parmetros (un parmetro para cada combinacin posible de
sntomas). Sin embargo, estos parmetros deben sumar uno; en consecuencia, se tienen slo
2
n
- 1 parmetros libres para cada valor posible de E. tomado de Sistemas Expertos
Probabilsticos, J.A. Gmez y J.M. Puerta. Coleccin ciencia y tcnica, vol.20 Ediciones de la
Universidad de Castilla-La Mancha, Cuenca 1998
16
situacin irreal), el nmero de frecuencias (parmetros) necesarios es mayor
que 1062, tan grande que no hay ningn ordenador capaz de almacenarla. La
discusin anterior supone sntomas binarios (sntomas con slo dos posibles
opciones, tales como fiebre, no fiebre; dolor, no dolor; etc.). Las dificultades se
incrementan notablemente en el MSD en casos en los que se tengan sntomas
con mltiples (ms de dos) opciones o niveles, tales como fiebre alta, fiebre
media, fiebre baja y no fiebre.
2.4.2 El Modelo de Sntomas Independientes (MSI).
Una simplificacin posible consiste en suponer que, para una enfermedad
dada, los sntomas son condicionalmente independientes entre si. El modelo
resultante se denomina modelo de sntomas independientes (MSI). El MSI se
ilustra en la Figura 2.3, donde los sntomas no estn ligados, para indicar la
independencia.
FIGURA 2.3 Ilustracin grfica del modelo de sntomas independientes.
Puesto que los sntomas se suponen condicionalmente independientes dada la
enfermedad, se tiene:
=
=
n
j
i j i n
e S p e S S p
1
1
) / ( ) / ...., (
Por ello, se puede escribir la funcin de probabilidad conjunta de la enfermedad
E dados los sntomas s1, . . . , sn como
9
:
9
tomado de Sistemas Expertos Probabilsticos, J.A. Gmez y J.M. Puerta. Coleccin ciencia y
tcnica, vol.20 Ediciones de la Universidad de Castilla-La Mancha, Cuenca 1998
17
=
=
=
=
n
j
i j i
n
n
j
i j i
n i
i n iI
n
e S p e p
S S p
e S p e p
S S e p
e S S p e p
S S e p
1
1
1
1
1
1 1
) / ( ) (
) ...., (
) / ( ) (
) ...., / (
) / ...., ( ) (
) ..., / (
A partir de la ecuacin anterior, puede verse que los parmetros necesarios
para la base de conocimiento del MSI son:
Las probabilidades marginales p(ei), para todos los valores posibles de la
enfermedad E.
Las probabilidades condicionales p(sj |ei), para todos los valores posibles
del sntoma Sj y la enfermedad E.
Por ello, con las hiptesis de independencia de los sntomas, el nmero de
parmetros se reduce considerablemente. Con m enfermedades posibles y n
sntomas binarios, el nmero total de parmetros es m(n + 1). 1. Por ejemplo,
con m = 100 enfermedades y n = 200 sntomas, se tienen 20,099 parmetros
en el MSI en vez de mas de 1062 parmetros para el MSD.
10
2.4.3. El Modelo de Sntomas Relevantes Independientes
(MSRI).
Se puede conseguir una reduccin an mayor del nmero de parmetros
suponiendo que cada enfermedad tiene un nmero reducido de sntomas
relevantes. En consecuencia, para cada valor ei de la enfermedad E se
seleccionan algunos sntomas relevantes S1, . . . , Sr (relativamente pocos
frente al total de sntomas) y los restantes sntomas se suponen independientes
para ese valor de E. El MSRI se ilustra en la Figura 2.4. Se puede observar
que para e1, el conjunto de sntomas relevantes es {S1, S2}; para e2, el
conjunto de sntomas relevantes es {S2, S3, S4}; y as sucesivamente.
10
tomado de Sistemas Expertos Probabilsticos, J.A. Gmez y J.M. Puerta. Coleccin ciencia
y tcnica, vol.20 Ediciones de la Universidad de Castilla-La Mancha, Cuenca 1998
18
FIGURA 2.4 Una ilustracin grfica del modelo de sntomas relevantes independientes.
Por simplicidad de notacin, supngase que S1, . . . , Sri son relevantes para la
enfermedad ei y que los restantes sntomas Sri+1, . . . , Sn son irrelevantes.
Segn el MSRI, p(sj |ei) se supone idntica para todos los sntomas que son
irrelevantes para la enfermedad ei. Entonces la funcin de probabilidad
conjunta de la enfermedad ei dados los sntomas s1, . . . , sn puede escribirse
como sigue:
) ..., (
) / ( ) (
) ..., (
) / ( ) / ( ) (
) ..., (
) / ..., ( ) (
) ..., / (
1
1 1
1
1 1
1
1
1
n
r
j
n
r j
j i j i
n
r
j
n
r j
i j i j i
n
i n i
n i
s s p
P e s p e p
s s p
e s p e s p e p
s s p
e s s p e p
s s e p
i
i
i
i
= + =
= + =
=
=
=
= + =
i
i
r
j
n
r j
j i j i
P e s p e p
1 1
) / ( ) (
donde p
j
=p(s
j
|e
i
), que es la misma para todas las enfermedades para la que S
j
es irrelevante.
La ecuacin implica que en la base de conocimiento se necesita almacenar las
probabilidades de todos los sntomas relevantes para cada enfermedad, y la
misma probabilidad para todos los sntomas irrelevantes para cada valor de E.
El nmero de parmetros se reduce significativamente cuando ri es mucho
menor que n. Por ejemplo, con 100 enfermedades y 200 sntomas, si ri = 10
para todas las enfermedades,4 el nmero de parmetros en el MSRI se reduce
de 20,099 para el MSI a 1,299 para el MSRI.
11
11
Opus, sit pag.18
19
2.4.4. El Modelo de Sntomas Relevantes Dependientes (MSRD).
Aunque el MSRI reduce el nmero de parmetros considerablemente,
desgraciadamente, es poco realista, ya que los sntomas asociados a ciertas
enfermedades suelen producirse en grupos o sndromes. Por ello, puede ser
poco razonable suponer que los sntomas relevantes son independientes. El
modelo de sntomas relevantes dependientes (MSRD) evita este inconveniente.
El MSRD es el mismo que el MSRI pero sin obligar a los sntomas relevantes a
ser independientes, dada la correspondiente enfermedad. De esta forma, se
supone que slo los sntomas irrelevantes son independientes pero los
sntomas relevantes pueden ser dependientes.
El MSRD se ilustra en la Figura 2.5, donde los sntomas relevantes para cada
enfermedad estn conectados, indicando la dependencia.
FIGURA 2.5 Ilustracin grfica del modelo de sntomas relevantes dependientes.
Supngase que S1, . . . , Sri son relevantes para la enfermedad ei y que los
restantes sntomas Sri+1, . . . , Sn son irrelevantes. Entonces segn el MSRD,
la funcin de probabilidad conjunta de ei dados los sntomas s1, . . . , sn puede
escribirse como
12
:
+ =
+ =
+ =
=
=
n
r j
j i r i
n
n
r j
j i r i
n
n
r j
i j i r i
n i
i
i
i
P e s s p e p
s s p
P e s s p e p
s s p
e s p e s s p e p
s s e p
1
1 1
1
1
1 1
1
1
1 1
1
) / ...., ( ) (
) ...., (
) / ...., ( ) (
) ...., (
) / ( ) / ...., ( ) (
) ...., / (
12
Opus, sit pag.18
20
Donde p
j
= p(s
j
|e
i
), que es la misma para todas las enfermedades para las que
Sj es irrelevante.
Para este modelo, es necesario almacenar las siguientes probabilidades en la
base de datos:
Las probabilidades marginales p(e
i
), para todos las posibles valores de la
enfermedad E.
Las probabilidades condicionales p(s
1
, . . . , s
ri
|e
i
), para todos los posibles
valores de la enfermedad E y sus sntomas relevantes S1, . . . , Sri .
Las probabilidades p
j
, para cada valor posible de E que tenga al menos un
sntoma irrelevante.
En el MSRD el nmero de parmetros es muy reducido comparado con el
MSD, y eso a pesar de que es un modelo realista, puesto que considera las
dependencias entre los sntomas ms importantes (relevantes) para cada
enfermedad. Sin embargo, debido a la hiptesis de dependencia, el nmero de
parmetros del MSRD es mayor que el nmero de parmetros en los MSI y
MSRI.
13
2.5 EL MOTOR DE INFERENCIA.
Hay dos tipos de conocimiento en los sistemas expertos probabilsticos:
1. El conocimiento, que est formado por el conjunto de variables y el conjunto
de probabilidades asociadas necesarias para construir su funcin de
probabilidad conjunta. Este tipo de conocimiento se almacena en la base de
conocimiento.
2. Los datos, que consisten en un conjunto de valores de algunas variables (por
ejemplo, sntomas) conocidas por el usuario. A esta informacin se la conoce
con el nombre de evidencia y se almacena en la memoria de trabajo.
13
Opus, sit pag.18
21
El motor de inferencia utiliza ambos, el conocimiento y los datos para
responder a ciertas preguntas hechas por el usuario. Ejemplos de tales
preguntas son:
Antes de que sea examinado por un doctor, cul es la enfermedad
ms probable para el paciente? Aqu, no hay evidencia disponible. El
paciente todava no ha sido examinado y el conjunto de sntomas que
presenta el paciente es vaco (queda por determinar). El problema
consiste en calcular la probabilidad marginal (inicial) de E,
p(E = ei), i = 1, . . . , m.
Dado que el paciente presenta un subconjunto de sntomas S
1
= s
1
, . . . ,
S
k
= s
k
, qu enfermedad tiene el paciente con mayor probabilidad? El
conjunto evidencial en este caso consiste en el conjunto de valores s
1
, . .
. , s
k
. El problema consiste en calcular la funcin de probabilidad
conjunta para cada enfermedad e
i
dada la evidencia s
1
, . . ., s
k
:
p(E = e
i
|s
1
, . . . , s
k
), i = 1, . . . , m.
La probabilidad marginal de E, p(E = ei), se conoce tambin como probabilidad
a priori puesto que se calcula antes de conocer la evidencia. La probabilidad
condicional de ei dada una realizacin del conjunto de sntomas p(ei|s1, . . . ,
sk) se conoce como la probabilidad a posteriori puesto que se calcula tras
conocer la evidencia. Observemos que la probabilidad marginal (a priori)
puede interpretarse como un caso especial de probabilidad a posteriori, en la
que el conjunto de sntomas observado es el conjunto vaco, .
Una de las tareas del motor de inferencia en los sistemas expertos
probabilsticos consiste en calcular las probabilidades condicionales de
diferentes enfermedades cuando se conocen nuevos sntomas o datos. El
motor de inferencia es responsable de actualizar las probabilidades
condicionales:
, ...., 1 ;
) ... (
) ..., , (
) ... / (
1
1
1
m i
s s p
s s e p
s s e p
k
k i
k i
= =
22
para todos los posibles valores de los sntomas, y de decidir cuales tienen
probabilidades condicionales altas. Normalmente se selecciona un nmero
reducido y se muestran al usuario para observarlas y obtener las conclusiones
pertinentes.
El teorema de Bayes se utiliza para calcular con facilidad las probabilidades a
posteriori cuando se tienen unas pocas enfermedades y sntomas. Pero
cuando el nmero de variables (enfermedades y/o sntomas) es alto, que es lo
que sucede normalmente en la prctica, se necesitan mtodos y modelos ms
eficientes para calcular ambas, las probabilidades a priori y las probabilidades
a posteriori. Estos mtodos, que se conocen como mtodos de propagacin
de evidencia o incertidumbre,
2.6 ALGUNOS CONCEPTOS SOBRE GRAFOS
Supngase un conjunto de objetos X = {X
1
,X
2
, . . . , X
n
} que pueden relacionarse
entre s. El conjunto X puede ser representado grficamente por una coleccin
de nodos o vrtices, asociando un nodo a cada elemento de X. Estos nodos
pueden conectarse por aristas, indicando las relaciones existentes entre los
mismos. Una arista entre los nodos X
i
y X
j
se denotar mediante
Li j
. As mismo,
el conjunto de todas las aristas se denotar por L = {L
ij
| X
i
y X
j
estn
conectados}. Por tanto, un grafo puede definirse de forma intuitiva mediante el
conjunto de nodos, X, y las relaciones entre los mismos, L. En el siguiente
ejemplo se ilustra esta idea intuitiva. A continuacin se introduce una definicin
formal.
Ejemplo 2.1 Grafos. La Figura 2.6 es un ejemplo de un grafo compuesto de seis
nodos X = {A,B, . . . , G} y de un conjunto de seis aristas,
L = {L
AB
, L
AC
, L
BD
, L
CE
, L
DF
, L
DG
}. Los nodos estn representados por crculos y
las aristas por lneas que unen los nodos correspondientes.
23
FIGURA 2.6. Ejemplo de un grafo o red.
Definicin 2.1 Grafo o Red. Un grafo es un par de conjuntos G = (X,L), donde
X= {X
1
,X
2
, . . . , X
n
} es un conjunto finito de elementos (nodos), y L es un
conjunto de aristas, es decir, un subconjunto de pares ordenados de elementos
distintos de X.
14
El concepto de grafo puede definirse de forma ms general. Por ejemplo,
puede permitirse que dos nodos estn conectados por ms de una arista, o
incluso que un nodo est conectado consigo mismo. Sin embargo, en el campo
de los sistemas expertos, los grafos se utilizan para representar un conjunto de
variables (nodos), y unas relaciones de dependencia entre ellas (aristas). Por
tanto, no es necesario que dos nodos estn unidos por ms de una arista, o
que una arista una un nodo consigo mismo. Las aristas de un grafo pueden ser
dirigidas o no dirigidas, dependiendo de si se considera o no, el orden de los
nodos. En la prctica, esta distincin depender de la importancia del orden en
que se relacionen los objetos.
Definicin 2.2 Arista dirigida. Dado un grafo G = (X,L), si L
i j
L y L
j i
L, la
arista L
i j
entre los nodos X
i
y X
j
se denomina dirigida y se denota mediante
X
i
X
j
15
.
Definicin 2.3 Arista no dirigida. Dado un grafo G = (X,L), si L
i j
L y L
j i
L, la
arista L
i j
se denomina no dirigida y se denota mediante X
i
- X
j
o X
j
- X
i
.
16
14
15 16
J.A. Gmez y J.M. Puerta. Sistemas Expertos Probabilsticos, Coleccin Ciencia y
Tcnica, vol. 20. Ediciones de la Universidad de Castilla-La Mancha. Cuenca, 1998.
24
Definicin 2.4 Grafo dirigido y no dirigido. Un grafo en el cual todas las aristas
son dirigidas se denomina grafo dirigido, y un grafo en el que todas sus aristas
son no dirigidas se denomina no dirigido.
17
Por tanto, en un grafo dirigido es
importante el orden del par de nodos que definen cada arista, mientras que en
un grafo no dirigido, el orden carece de importancia.
FIGURA 2.7. Ejemplos de un grafo dirigido (a), y uno no dirigido (b).
Ejemplo 2.2 Grafos dirigidos y no dirigidos. En las Figuras 2.7(a) y 2.7(b) se
muestran ejemplos de un grafo dirigido y de un grafo no dirigido,
respectivamente. El grafo de la Figura 2.7(a) est definido por:
X = {A,B,C,D,E, F},
L = {A D,B C,D B,F D,D E,E F},
Mientras que para el grafo de la Figura 2.7(b) se tiene
X = {A,B,C,D,E, F, G,H},
L = {A . B,B . C,C . D,D . E,E . A,E . F,F . G,G . D,D . H}.
17
Opus, sit pag.24
25
2.7 CARACTERSTICAS DE LOS GRAFOS
DIRIGIDOS.
Definicin 2.5 Padre e hijo. Cuando existe una arista dirigida, X
i
X
j
, del nodo
X
i
al nodo X
j
, entonces se dice que el nodo X
i
es un padre del nodo X
j
, y que
el nodo X
j
es un hijo de X
i
.
18
El conjunto de los padres de un nodo X
i
se denota mediante
Xi
o simplemente
i
. Por ejemplo, los nodos C y D son los padres del nodo E en el grafo de la
Figura 2.8.
FIGURA 2.8. Padres e hijos del nodo E.
Definicin 2.6 Ciclo. Un ciclo es un camino cerrado en un grafo dirigido.
19
Ejemplo 2.3 Bucles y ciclos. La Figura 2.9(a) muestra un grafo dirigido que
contiene un slo ciclo: D G F D. Sin embargo, el grafo no dirigido
asociado contiene dos bucles: D.G.F .D y A.B.D.A.
18
19
Opus, sit pag.24
26
FIGURA 2.9. Bucles y ciclos de un grafo dirigido.
2.7.1 Tipos de Grafos Dirigidos
Definicin 2.7 Grafos dirigidos conexos. Un grafo dirigido se denomina conexo
si el grafo no dirigido asociado es conexo; en caso contrario se denomina
inconexo.
Definicin 2.8 rboles y grafos mltiplemente conexos. Un grafo dirigido
conexo se denomina rbol si el grafo no dirigido asociado es un rbol; en caso
contrario se denomina mltiplemente conexo.
Definicin 2.9 Grafos cclicos y acclicos. Un grafo dirigido se denomina cclico
si contiene al menos un ciclo; en caso contrario se denomina grafo dirigido
acclico.
Definicin 2.10 Grafos simples y poli rboles. Un rbol dirigido se denomina un
rbol simple si cada nodo tiene como mximo un padre; en caso contrario se
denomina un poli rbol.
20
20
E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic network models.
Springer-Verlag, New York, 1997.
27
FIGURA 2.10 Ejemplos de grafos dirigidos: rbol simple (a) y polirbol (b)
FIGURA 2.11 Ejemplos de grafos dirigidos: grafo cclico (a) y mltiplemente conexo (b)
28
CAPITULO III
CONSTRUCCION DE MODELOS
PROBABILISTICOS.
Los grafos son herramientas muy potentes para describir de forma intuitiva las
relaciones de dependencia e independencia existentes en un conjunto de
variables {X1, . . . , Xn}. Por tanto, una forma de definir un modelo probabilistico
es partir de un grafo que describa las relaciones existentes entre las variables
(este grafo puede venir dado, por ejemplo, por un experto en el tema). Este
planteamiento motiva a la siguiente pregunta. Pueden representarse las
estructuras de dependencia e independencia definidas por un grafo (dirigido o
no dirigido) de forma equivalente por un conjunto de relaciones de
independencia condicional? En caso afirmativo, cmo se puede obtener este
conjunto?
La respuesta al problema anterior es afirmativa, y una forma de obtener este
conjunto de independencias es utilizar un criterio de separacin grfica para
comprobar cuales, de entre todas las posibles relaciones de independencia
condicional, son satisfechas por el grafo. Los criterios de separacin grfica
son las reglas para entender como pueden codificarse dependencias e
independencias en un grafo. Estos criterios dependen del tipo de grafo (dirigido
o no dirigido) que se est considerando.
29
3.1 FACTORIZACION DE UNA FUNCIN DE
PROBABILIDAD.
Cualquier funcin de probabilidad de un conjunto de variables aleatorias puede
ser definida por medio de funciones de probabilidad condicionada ms sencillas
formando una factorizacin. En esta seccin se analizan distintas formas de
factorizar una funcin de probabilidad.
Definicin 3.1 Factorizacin mediante funciones potenciales. Sean C1, . . . ,
Cm subconjuntos de un conjunto de variables X = {X
1
, . . . , X
n
}. Si la funcin de
probabilidad conjunta de X puede ser escrita como producto de m funciones no
negativas i (i = 1, . . . , m), es decir,
=
=
m
i
i i n
c x x p
1
1
). ( ) .... ( Ec. (3.1)
donde c
i
es una realizacin de C
i
, entonces se dice que (3.1) es una
factorizacin de la funcin de probabilidad. Las funciones
i
se denominan
factores potenciales de la funcin de probabilidad
21
.
Definicin 3.2 Regla de la cadena. Cualquier funcin de probabilidad de un
conjunto de variables {X
1
, . . . , X
n
} puede ser expresada como el producto de m
funciones de probabilidad condicionada de la forma
22
=
=
m
i
i i n
b y p x x p
1
1
) / ( ) .... ( Ec. (3.2)
O, de modo equivalente,
=
=
m
i
i i n
a y p x x p
1
1
) / ( ) .... ( Ec. (3.3)
Donde Bi = {Y
1
, . . . , Y
i-1
} es el conjunto de variables anteriores a Y
i
y A
i
= {Y
i+1
, .
. ., Y
n
} es el conjunto de variables posteriores a Y
i
. Obsrvese que a
i
y b
i
son
realizaciones de A
i
y B
i
, respectivamente.
21
22
E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic network models.
Springer-Verlag, New York, 1997.
30
Ejemplo 3.1 Regla de la cadena. Considrese el conjunto de variables {X
1
, . . . ,
X
4
} y la particin Y
1
= {X
1
}, Y
2
= {X
2
}, Y
3
= {X
3
}, Y
4
= {X
4
}. Entonces las
ecuaciones (3.2) y (3.3) proporcionan la siguientes factorizaciones equivalentes
de la funcin de probabilidad:
p(x
1
, . . . , x
4
) = p(x
1
)p(x
2
|x
1
)p(x
3
|x
1
, x
2
)p(x
4
|x
1
, x
2
, x
3
) Ec. (3.4)
Y
p(x
1
, . . . , x
4
) = p(x
1
|x
2
, x
3
, x
4
)p(x
2
|x
3
, x
4
)p(x
3
|x
4
)p(x
4
). Ec. (3.5)
3.2 CONSTRUCCIN DE UN MODELO
PROBABILSTICO.
El problema de construir una funcin de probabilidad para un conjunto de
variables puede simplificarse notablemente considerando una factorizacin de
la probabilidad como producto de funciones de probabilidad condicionada ms
sencillas. El grado de simplificacin depender de la estructura de
independencia (incondicional o condicional) existente entre las variables del
modelo. Por tanto, para encontrar una factorizacin apropiada del modelo
probabilstico, primero se necesita conocer su estructura de independencia.
Esta estructura de independencia (modelo de dependencia) caracteriza la
estructura cualitativa de las relaciones entre las variables. Por ejemplo, se
necesita definir qu variables son independientes y/o condicionalmente
independientes de otras y cules no; Por tanto, la factorizacin asociada al
modelo probabilstico, puede ser obtenida de varias formas:
1. Modelos definidos grficamente: Como se ha visto en las secciones
anteriores, las relaciones existentes entre las variables de un conjunto pueden
ser descritas mediante un grafo.
Estos modelos de dependencia se conocen como modelos definidos
grficamente, y tienen como ejemplos ms importantes a las redes de Markov,
y las redes Bayesianas. Las tareas de comprobar la validez de un grafo,
entender sus implicaciones, y modificarlo de forma apropiada han de ser
31
realizadas partiendo de la comprensin de las relaciones de dependencia e
independencia existentes en el conjunto de variables.
2. Modelos definidos por listas de independencias:
Una descripcin alternativa a los modelos grficos consiste en utilizar
directamente un conjunto M de relaciones de independencia que describan las
relaciones entre las variables. Este conjunto puede ser definido por un experto
a partir de sus opiniones sobre las relaciones entre las variables del modelo.
Cada una de las independencias del conjunto indica qu variables contienen
informacin relevante sobre otras y cundo el conocimiento de algunas
variables hace que otras sean irrelevantes para un conjunto de variables dado.
El conjunto resultante puede ser finalmente utilizado para obtener una
factorizacin de la funcin de probabilidad del modelo.
Una ventaja de utilizar modelos grficos, o modelos definidos por listas de
independencias, para construir un modelo probabilstico es que stos modelos
definen una factorizacin de la funcin de probabilidad como producto de
funciones de probabilidad condicionada que determinan la estructura cualitativa
del modelo probabilstico. Normalmente, estas funciones condicionadas
contienen un nmero menor de variables que la funcin de probabilidad
conjunta y, por tanto, el proceso de definicin del modelo probabilstico es ms
sencillo.
Una vez que se conoce la estructura cualitativa del modelo probabilstico (la
factorizacin de la funcin de probabilidad), la estructura cuantitativa de un
modelo particular se define mediante la asignacin de valores numricos a los
parmetros asociados a las funciones de probabilidad condicionada que
intervienen en la factorizacin del modelo. Estos valores han de ser definidos
por algn experto, o estimados a partir de un conjunto de datos.
Por tanto, si la estructura cualitativa del modelo es desconocida, que es el caso
habitual en la prctica, entonces tanto la estructura cualitativa, como la
cuantitativa (los parmetros) han de ser estimadas a partir del conjunto de
datos disponible (una base de datos, etc.). Este problema, que se conoce como
aprendizaje.
32
Como resumen de todo lo anterior, la construccin de un modelo probabilstico
puede ser realizada en dos etapas:
1. Factorizar la funcin de probabilidad mediante un producto de funciones de
probabilidad condicionada. Esta factorizacin puede obtenerse de dos formas
distintas:
(a) Utilizando grafos.
(b) Utilizando listas de relaciones de independencia.
2. Estimar los parmetros de cada una de las funciones de probabilidad
condicionada resultantes.
El camino ms simple para definir un modelo probabilstico es comenzar con un
grafo que se supone describe la estructura de dependencia e independencia de
las variables. A continuacin, el grafo puede utilizarse para construir una
factorizacin de la funcin de probabilidad de las variables. De forma
alternativa, tambin puede comenzarse con una lista de relaciones de
independencia y, a partir de ella, obtener una factorizacin de la funcin de
probabilidad. La factorizacin obtenida determina los parmetros necesarios
para definir el modelo probabilstico. Una vez que estos parmetros han sido
definidos, o estimados a partir de un conjunto de datos, la funcin de
probabilidad que define el modelo probabilstico vendr dada como el producto
de las funciones de probabilidad condicionada resultantes.
3.2.1 Modelos Definidos Grficamente.
En esta seccin se desarrolla la forma de obtener modelos probabilsticos ms
generales por medio de grafos. La idea bsica consiste en utilizar grafos (no
dirigidos o dirigidos) para construir un modelo de dependencia que represente
la estructura cualitativa del modelo probabilstico. De esta forma, los modelos
resultantes son generales, pues se crean a partir de un modelo de dependencia
arbitrario, y no de uno impuesto inicialmente.
Antes de comenzar, es necesaria cierta notacin y aclarar la terminologa; El
trmino modelo probabilstico se refiere a la estructura cualitativa y cuantitativa
33
dada por una funcin de probabilidad. Por tanto, los trminos modelo
probabilstico y funcin de probabilidad se utilizarn de forma sinnima. Los
trminos modelo de dependencia y modelo de independencia se refieren
exclusivamente a la estructura cualitativa de las relaciones existentes en el
conjunto de variables. Por tanto, es importante conocer si los grafos permiten
representar cualquier tipo de modelo de dependencia.
3.2.1.1 Algunas Definiciones y Problemas
Definicin 3.3 Mapa perfecto. Un grafo G se dice que es un mapa perfecto de
un modelo de dependencia M si cada relacin de independencia obtenida de G
tambin puede ser obtenida de M y viceversa, es decir,
I(X, Y |Z)
M
I(X, Y |Z)
G
Z separa X de Y.
Dependiendo del carcter dirigido o no dirigido del grafo G, los mapas perfectos
se denominan mapas perfectos dirigidos o no dirigidos, respectivamente.
23
Puede representarse mediante un mapa perfecto dirigido o no dirigido
cualquier modelo de dependencia?
Desafortunadamente, no todo modelo de dependencia tiene asociado un mapa
perfecto.
Ejemplo 3.2 Modelo sin mapa perfecto no dirigido. Considrese el conjunto de
tres variables {X, Y, Z} que estn relacionadas por el siguiente modelo de
dependencia
M = {I(X, Y |), I(Y,X|)},
Que slo contiene una relacin de independencia y su relacin simtrica
24
.
Supngase que se quiere representar este modelo por medio de un grafo no
dirigido. La Figura 3.1 muestra los ocho grafos para el caso de tres variables.
Estos grafos estn ordenados en filas que contienen grafos con el mismo
nmero de aristas. As, la figura 3.1(a) corresponde al grafo totalmente
23
24
E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic network models.
Springer-Verlag, New York, 1997.
34
inconexo (un grafo sin ninguna arista), cada uno de los tres grafos en (b)-(d)
contiene una nica arista, cada uno de los grafos en (e)-(g) contiene dos
aristas, y el ltimo grafo es el grafo completo (un grafo con una arista entre
cada par de nodos). La segunda columna de la Tabla 3.1 muestra algunas
relaciones de independencia implicadas por cada uno de los grafos, y que no
estn contenidas en M.
FIGURA 3.1. Ocho posibles grafos no dirigidos con tres variables.
Grafo G Independencia en G
pero no en M
Independencia en M
pero no en G
(a) I(X,Z|)
(b) I(X,Z| ) I(X,Y| )
(c) I(Y,Z| )
(d) I(X,Z| )
(e) I(Y,Z|X) I(X,Y| )
(f) I(X,Z|Y) I(X,Y| )
(g) I(X,Y|Z) I(X,Y| )
(h) I(X,Y| )
TABLA 3.1 Algunas relaciones de independencia contenidas en G de la figura 4.4 pero no en el
modelo de dependencia M.
Definicin 3.4 Mapa de independencia. Un grafo G se dice que es un mapa de
independencia (I-mapa) de un modelo de dependencia M si
I(X, Y |Z)
G
I(X, Y |Z)
M
,
35
Es decir, si todas las relaciones de dependencia derivadas de G son verificadas
por M.
25
Obsrvese que un I-mapa G de un modelo de dependencia M incluye algunas
de las independencias de M, pero no necesariamente todas. Entonces, se tiene
I(X, Y |Z)
G
I(X, Y |Z)
M
,
Lo cual implica
D(X, Y |Z)M D(X, Y |Z)G.
Por tanto, todas las dependencias de M estn representadas en G. Por
ejemplo, solamente el grafo completo de la Figura 3.1(h) es un I-mapa del
modelo de dependencia. Cada uno de los grafos restantes implica algunas
independencias que no son propias de M (ver Tabla 3.1). En general, un grafo
completo es siempre un I-mapa trivial de cualquier modelo de dependencia.
3.2.1.2 De Grafos Dirigidos a Modelos probabilsticos.
En la prctica no se suele conocer la funcin de probabilidad p(x) ni el modelo
M. Por tanto, la forma real de construir un modelo probabilstico consiste en las
siguientes etapas:
1. Construir un grafo dirigido D que describa la estructura de dependencia entre
las variables de X.
2. Encontrar una funcin de probabilidad p(x) para la cual D sea un I-mapa.
La construccin del grafo no dirigido es una tarea que ha de realizarla un
experto, o inferida de un conjunto de datos mediante alguna tcnica de
aprendizaje. En esta seccin se analiza el segundo problema, es decir, obtener
el modelo probabilstico asociado a un grafo.
Definicin 3.5 Factorizacin recursiva segn un grafo dirigido acclico. Una
funcin de probabilidad se dice que admite una factorizacin recursiva segn
25
Opus, sit pag.34
36
un grafo dirigido acclico D, si la funcin de probabilidad se puede expresar
como
=
=
m
i
i i n
y p x x p
1
1
) / ( ) .... ( Ec. (3.6)
Donde p(x
i
|
i
) es la funcin de probabilidad de X
i
condicionada a sus padres
26
i
.
Ejemplo 3.3 Factorizacin segn un grafo dirigido. Considrense los dos
grafos dirigidos mostrados en la Figura 3.2. Aplicando la definicin anterior, se
pueden construir dos factorizaciones recursivas de la funcin de probabilidad
asociada a estos grafos. A partir del grafo de la Figura 3.2(a), se tiene
p(x
1
, x
2
, x
3
, x
4
) = p(x
1
|
1
)p(x
2
|
2
)p(x
3
|
3
)p(x
4
|
4
)
= p(x
1
)p(x
2
|x
1
)p(x
3
|x
2
)p(x
4
|x
2
, x
3
),
Mientras que el grafo de la Figura 3.2(b) sugiere la factorizacin:
p(x
1
, x
2
, x
3
, x
4
) = p(x
1
|
1
)p(x
2
|
2
)p(x
3
|
3
)p(x
4
|
4
)
= p(x
1
)p(x
2
|x
1
, x
3
, x
4
)p(x
3
)p(x
4
).
FIGURA 3.2 Factorizacin segn un grafo dirigido.
Por tanto, dado un grafo dirigido D, puede construirse una funcin de
probabilidad que sea el producto de las funciones de probabilidad condicionada
dadas en la ecuacin (3.6).
26
Opus, sit pag.34
37
CAPITULO IV
REDES BAYESIANAS.
4.1 REDES BAYESIANAS
En las secciones anteriores se ha analizado la relacin existente entre los
grafos dirigidos y los modelos de dependencia. En esta seccin se presenta un
tipo importante de modelos de dependencia asociados a grafos dirigidos. Esta
clase se conoce como redes Bayesianas.
Definicin 4.1. Red Bayesiana. Una red Bayesiana es un par (D,P), donde D es
un grafo dirigido acclico, P = {p(x
1
|
1
), . . . , p(x
n
|
n
)} es un conjunto de n
funciones de probabilidad condicionada, una para cada variable, y i es el
conjunto de padres del nodo X
i
en D. El conjunto P define una funcin de
probabilidad asociada mediante la factorizacin.
27
=
=
n
i
i i
x p x p
1
) | ( ) ( Ec. (4.1)
El grafo dirigido acclico D es un mapa de p(x).
En el caso de redes Bayesianas, la factorizacin de la funcin de probabilidad
se obtiene de forma sencilla a partir del grafo dirigido considerando un conjunto
de funciones de probabilidad condicionada que involucran a cada nodo con sus
padres.
Redes Bayesianas Multinomiales
En una red Bayesiana multinomial se supone que todas las variables son
discretas, es decir, que cada variable puede tomar nicamente un conjunto
27
Francisco Javier Dez. Introduccin al Razonamiento Aproximado. Primera Edicin.
Universidad de Castilla-La Mancha, Cuenca, Espaa 1998.
38
finito de valores. En este tipo de redes tambin se supone que la funcin de
probabilidad condicionada asociada a cada variable es una funcin de
probabilidad de tipo multinomial. Este tipo de funciones de probabilidad pueden
ser definidas, ya sea de forma paramtrica o numrica, por medio de tablas
que asignan valores numricos a las diferentes combinaciones de las variables
involucradas. A continuacin se muestra un ejemplo de una red Bayesiana
multinomial.
FIGURA 4.1. Grafo dirigido utilizado para construir la red Bayesiana del Ejemplo 4.1.
Ejemplo 4.1 Red Bayesiana multinomial. Considrese el grafo dirigido
mostrado en la Figura 4.1 y supngase que todas las variables del conjunto
{A,B,C,D,E,F,G} son binarias, es decir, solamente pueden tomar dos valores
posibles (por ejemplo, 0 1). Este grafo dirigido define una red Bayesiana por
medio de las funciones de probabilidad condicionada en la ecuacin (4.1) que
definen la siguiente factorizacin de la funcin de probabilidad
p(a, b, c, d, e, f, g) = p(a)p(b)p(c|a)p(d|a, b)p(e)p(f|d)p(g|d, e). Ec. (4.2)
En este caso, las funciones de probabilidad condicionada son tablas de
probabilidades para las diferentes combinaciones de valores de las variables.
La Tabla 4.1 muestra un ejemplo de los valores numricos necesarios para
definir el conjunto de funciones de probabilidad condicionada dadas en la
ecuacin (4.1). Por tanto, el grafo dirigido acclico de la Figura 4.1 junto con el
conjunto de probabilidades condicionadas dado en la Tabla 4.1 definen una red
Bayesiana multinomial.
39
TABLA 4.1 Funciones de probabilidad condicionada correspondientes al grafo dirigido de la
figura 4.1
a p(a)
0 0.3
1 0.7
b p(b)
0 0.6
1 0.4
e p(e)
0 0.1
1 0.9
a c p(c|a)
0 0 0.25
0 1 0.75
1 0 0.50
1 1 0.50
d f p(f|d)
0 0 0.25
0 1 0.75
1 0 0.50
1 1 0.50
a b d p(d|a,b)
0 0 0 0.40
0 0 1 0.60
0 1 0 0.45
0 1 1 0.55
1 0 0 0.60
1 0 1 0.40
1 1 0 0.30
1 1 1 0.70
d e g p(g|d,e)
0 0 0 0.90
0 0 1 0.10
0 1 0 0.70
0 1 1 0.30
1 0 0 0.25
1 0 1 0.75
1 1 0 0.15
1 1 1 0.85
4.2 PROPAGACION DE EVIDENCIA EN REDES
BAYESIANAS
En los captulos anteriores se han analizado diversas formas de definir una
base de conocimiento coherente para un sistema experto probabilstico. Esta
est formada por la funcin de probabilidad conjunta de las variables que
componen el modelo. Una vez definida, una de las tareas ms importantes de
un sistema experto consiste en obtener conclusiones a medida que se va
conociendo nueva informacin, o evidencia. Por ejemplo, en el rea mdica, la
principal tarea de los sistemas expertos consiste en obtener un diagnstico
para un determinado paciente que presenta ciertos sntomas (evidencia). El
mecanismo para obtener conclusiones a partir de la evidencia se conoce como
propagacin de evidencia o, simplemente, propagacin. Esta tarea consiste en
actualizar las probabilidades de las variables en funcin de la evidencia. En el
caso del diagnstico mdico, se trata de conocer las probabilidades de cada
una de las enfermedades, dados los sntomas observados en el paciente.
Existen dos tipos distintos de algoritmos de propagacin: exactos y
aproximados. Un algoritmo de propagacin se denomina exacto si calcula las
probabilidades de los nodos sin otro error que el resultante del redondeo
producido por las limitaciones de clculo del ordenador. En este captulo se
analizan detalladamente algunos de los mtodos de propagacin exacta ms
importantes. Los algoritmos de propagacin aproximada utilizan distintas
40
tcnicas de simulacin para obtener valores aproximados de las
probabilidades. Estos algoritmos se utilizan en aquellos casos en los que los
algoritmos exactos no son aplicables, o son computacionalmente costosos.
4.3 PROPAGACIN DE EVIDENCIA.
La propagacin de evidencia es una de las tareas ms importantes de un
sistema experto, pues permite obtener conclusiones cuando se dispone de
nueva informacin (sntomas, etc.). Supngase un conjunto de variables
discretas X = {X
1
, . . . , X
n
} y una funcin de probabilidad p(x), en X.
Cuando no se dispone de ninguna informacin, es decir, cuando no existe
evidencia, el proceso de propagacin consiste en calcular las probabilidades
marginales p(X
i
= x
i
), tambin denotadas por p(xi), para cada Xi X. Estas
probabilidades proporcionan informacin a priori sobre los distintos valores
que pueden tomar las variables.
Definicin 4.2 Evidencia. Un subconjunto de variables E X cuyos valores son
conocidos, E = e, en una situacin dada, se conoce como conjunto de
evidencia, o simplemente evidencia.
28
En esta situacin, la propagacin de evidencia consiste en calcular las
funciones de probabilidad condicionada p(x
i
|e) para cada variable Xi E, dada
la evidencia E = e. Estas funciones de probabilidad condicionada miden el
efecto producido por la evidencia en cada variable. Cuando no se dispone de
evidencia (E = ), las funciones condicionadas p(x
i
|e) son simplemente las
funciones de probabilidad marginal p(x
i
).
Un forma de calcular las probabilidades p(x
i
|e) consiste en utilizar la frmula
), , (
) (
) , (
) / (
1
e x p
e p
e x p
e x p
i
i
= Ec. (4.3)
28
E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic network models.
Springer-Verlag, New York, 1997.
41
Donde 1/p(e) es una constante de proporcionalidad. Por tanto, se puede
obtener p(xi|e), calculando y normalizando las probabilidades marginales p(xi,e).
De esta forma se tiene
{ }
) ..., ( ) / (
, /
1
=
e x x
n e i
i
x x p e x p
Ec. (4.4)
Donde pe(x1, . . . , xn) es la funcin de probabilidad obtenida sustituyendo en
p(x1, . . . , xn) las variables con evidencia, E, por sus valores e
29
. Por tanto,
para calcular p(xi, e), ha de sumarse pe(x1, . . . , xn) para todas las posibles
combinaciones de valores de las variables que no estn contenidas en E,
excepto la variable Xi. Cuando no se dispone de evidencia, la ecuacin se
reduce a
) ..., ( ) (
/
1
=
xi x
n e i
x x p x p
Ec. (4.5)
Ejemplo 4.1 Utilizando la estructura de independencia. Considrese el
modelo probabilstico formado por el conjunto de variables X = {A, . . . , G} y una
funcin de probabilidad p(x) que puede ser factorizada segn el grafo dirigido
acclico mostrado en la Figura 4.2
=
= =
n
i
i i
e d g p d f p e p b a d p a c p b p a p x p x p
1
), , / ( ) / ( ) ( ) , / ( ) / ( ) ( ) ( ) / ( ) ( Ec. (4.6)
Donde
i
es una realizacin de i, el conjunto de los padres del nodo X
i
.
Supngase que desean calcularse las probabilidades marginales de los nodos,
es decir, las probabilidades iniciales cuando no se conoce ninguna evidencia.
En ese caso, el mtodo ms sencillo para obtener p(x
i
) es marginalizar la
funcin de probabilidad utilizando. Por ejemplo, las probabilidades iniciales de
la variable D se pueden obtener mediante
= =
g f e c b a d x
g f e d c b a p x p d p
, , , , , /
). , , , , , , ( ) ( ) (
Ec. (4.7)
29
Opus, sit pag 41
42
Considerando el caso ms simple, es decir, suponiendo que todas las variables
son binarias, la sumatoria anterior contendra 26 = 64 trminos distintos.
Una forma ms eficiente de calcular esas probabilidades es utilizar la estructura
de independencia contenida en la funcin de probabilidad conjunta p(x). Esta
estructura se pone de manifiesto en la factorizacin, que
FIGURA 4.2. Un grafo dirigido acclico.
Permite simplificar tanto el proceso de definicin del modelo probabilstico,
como el proceso de propagacin de evidencia. El nmero de operaciones en
puede ser reducido agrupando los trminos dentro del sumatorio de la forma
siguiente:
=
=
g f e c b a
g f e c b a
d f p e d g p e p b a d p a c p b p a p
e d g p d f p e p b a d p a c p b p a p d p
, , , ,
, , , , ,
) / ( ) , / ( ) ( ) , / ( ) / ( ) ( ) (
) , / ( ) / ( ) ( ) , / ( ) / ( ) ( ) ( ) (
Ec. (4.8)
Donde cada uno de las dos sumatorias puede ser calculado de forma
independiente
30
. Por tanto, el problema original de marginalizar una funcin de
probabilidad de seis variables se reduce a marginalizar dos funciones que
dependen slo de tres variables. La complejidad de los clculos se simplifica
enormemente. En este ejemplo, se ha reducido el nmero de trminos de cada
sumatoria (de 64 a 23 + 23 = 16) y el nmero de factores de cada uno de los
trminos (de 7 a 4 y de 7 a 3, respectivamente). Puede obtenerse una
reduccin adicional utilizando de nuevo la estructura dada por la factorizacin
para reordenar los trminos dentro de los sumatorios de la forma siguiente:
a g f e b c
e d g p d f p e p b a d p b p a c p a p , ) , / ( ) / ( ) ( ) , / ( ) ( ) / ( ) (
30
Opus, sit pag 41
43
Reduciendo el nmero de trminos que aparecen dentro de cada sumatorio.
4.4 PROPAGACIN EN POLIRBOLES.
El polirbol es uno de los modelos grficos ms simples para construir redes
Bayesianas. En esta seccin se presenta un algoritmo de propagacin para
este tipo de modelos probabilsticos. La caracterstica principal de este
algoritmo es que su complejidad es lineal en el tamao de la red (es decir en el
nmero de nodos y aristas que la componen).
Como ya se ha visto en un polirbol dos nodos cualesquiera estn unidos por
un nico camino, lo cual implica que cada nodo divide al polirbol en dos
polirboles inconexos: uno que contiene a sus padres y a los nodos a los que
est conectado pasando por sus padres, y otro que incluye sus hijos y a los
nodos a los que est conectado pasando por sus hijos. Por ejemplo, el nodo D
divide al polirbol de la Figura 4.2 en dos polirboles inconexos, el primero de
los cuales, {A,B,C}, incluye a sus padres y a los nodos que son accesibles
desde D a travs de sus padres, y el segundo, {E,F,G}, que incluye a sus hijos
y a los nodos que son accesibles desde D a travs de sus hijos. Este hecho se
muestra en la Figura 4.3, en la cual tambin puede comprobarse que el nodo D
separa a estos dos conjuntos, es decir, que se verifica grficamente la relacin
de independencia I({A,B,C}, {E,F,G}|D).
FIGURA 4.3. El nodo D divide al polirbol en dos polirboles inconexos.
El proceso de propagacin puede realizarse en este tipo de grafos de un modo
eficiente combinando la informacin procedente de los distintos subgrafos
mediante el envo de mensajes (clculos locales) de un subgrafo a otro.
44
Supngase que se conoce una cierta evidencia E = e y que se quieren calcular
las probabilidades p(x
i
|e) para todos los valores x
i
de un nodo cualquiera X
i
que no est contenido en E. Para facilitar el clculo de estas probabilidades, el
conjunto de evidencia E se puede descomponer en dos subconjuntos disjuntos,
cada uno de los cuales est contenido en uno de los polirboles separados por
el nodo Xi en el polirbol original. Por tanto, E se puede descomponer como:
E
+
i
, que es el subconjunto de E accesible desde Xi a travs de sus
padres.
E
-
i
, que es el subconjunto de E accesible desde Xi a travs de sus hijos.
Por tanto, se tiene E = E
+
i
i E
-
i
. En algunos casos se utilizar en lugar de
E
+
xi
E
+
i
Aplicando (4.1) se tiene
31
). ( ) . ((
) . (
1
) . . ( ) (
i i i i
i i
i i i i
x p x e e p
e e p
e e x p e x p
+
+
= = Ec. (4.9)
Dado que X
i
separa E
-
i
, de E
+
i
i en el polirbol, es decir, dado que se cumple la
relacin de independencia I(E
-
i,
E
+
i
,/X
i
), entonces se tiene
32
) ( ) (
). , ( ) . (
). . ( ) . ((
) . (
1
). ( ) ( ) . ((
) . (
1
) (
i i i
i i i i
i i i i
i i
i i i i i
i i
i
x p x k
e x p x e p k
e x p x e p
e e p
x p x e p x e p
e e p
e x p
=
=
=
=
+
+
+
+
+
Ec. (4.10)
Donde k = 1/p(e
-
i
, e
+
i
) es una constante de normalizacin,
33
i(xi) = p(e. |xi), Ec. (4.11)
Que tiene en cuenta la evidencia procedente de los hijos de X
i
, y
34
i
(x
i
) = p(x
i
, e
+
i
), Ec. (4.12)
Que tiene en cuenta la evidencia procedente de los padres de X
i
. Por tanto, la
funcin de probabilidad condicionada sin normalizar viene dada por
35
31
32
33
34
E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic network
models. Springer-Verlag, New York, 1997.
45
i
(x
i
) =
i
(x
i
)
i
(x
i
). Ec. (4.13)
Entonces
p(x
i
|e) = k
i
(x
i
)
i
(x
i
). Ec. (4.14)
Para calcular las funciones
i
(x
i
),
i
(x
i
) y
i
(x
i
), se considera la situacin
siguiente, en la que un nodo arbitrario X
i
tiene p padres y c hijos. Para
simplificar la notacin, los padres se representan mediante U = {U1, . . . , Up} y
los hijos mediante Y = {Y
1
, . . . , Y
c
}, tal como se ilustra en la Figura 4.4.
FIGURA 4.4. Los padres e hijos de un nodo arbitrario X
i
.
Teniendo en cuenta la estructura del polirbol, el conjunto de evidencia E
+
i
puede ser descompuesto en p subconjuntos disjuntos
36
, uno para cada padre
de X
i
:
{ }, ....
1 1
+ + +
=
e p
X U X U i
E E E
Ec. (4.15)
Donde la evidencia E
+
Uj Xi
es el subconjunto de E
+
i
contenido en el subgrafo
asociado al nodo U
j
cuando se elimina la arista U
j
X
i
. De forma similar, la
evidencia E
-
i
tambin puede ser dividida en c subconjuntos disjuntos, uno
asociado a cada hijo de X
i
:
{ }, ....
1 1
=
e p
Y X Y X i
E E E
Ec. (4.16)
Donde E
-
Xi Yj
es el subconjunto de E
-
i
contenido en el subgrafo asociado al nodo
Y
j
cuando se elimina la arista X
i
Yj .
37
La Figura 4.5 muestra los distintos
35
36
Opus, sit pag.45
46
subconjuntos de evidencia asociados al nodo X
i
. Sea u = {u
1
, . . . , u
p
} una
realizacin de los padres del nodo X
i
. Entonces, la funcin
i
(x
i
) puede ser
calculada de la forma siguiente:
+ + +
+ +
+ +
=
=
= =
u
UpX X U i i
u
i i i
u
i i i i i i
i
e e u p e u x p
e u p e u x p
e u x p e x p x p
) ... ( ) (
) ( ) . (
) , ( ) . ( ) (
1 1
Ec. (4.17)
FIGURA 4.5. Divisin del conjunto E en subconjuntos asociados a los padre e hijos de un nodo
arbitrario
38
Xi.
Dado que {U
j
, E
+
Uj
X
i
} es incondicionalmente independiente de {U
k
,E
+
Uk
X
i
} para
j k, se tiene
, ) ( ) (
) ( ) ( ) (
1
1
=
+
=
+ +
=
=
u
p
j
j i j i i
u
p
j
X U j i i i i
u x U e u x p
e u p e u x p x p
i j
Ec. (4.18)
Donde
) ( ) (
+
=
UjXi j j UjXi
e u p u p
Ec. (4.19)
37
38
Opus, sit pag 45
47
Es el mensaje que el nodo U
j
enva a su hijo X
i
. Este mensaje slo depende
de la informacin contenida en el subgrafo asociado al nodo U
j
cuando se
elimina la arista U
j
X
i
. Obsrvese que si U
j
es una variable con evidencia, u
j
= e
j
, entonces el mensaje correspondiente, U
j
X
i
(u
j
), es la funcin trivial
39
=
=
j j
j j
j i j
e u si
e u si
u X U
, 0
, 1
) ( Ec. (4.20)
La funcin i(xi) puede ser calculada de forma anloga
40
:
). ...., ( ) ( ) (
i XiYj XiYj i i i i
x e e p x e p x
= =
Ec. (4.21)
Dado que X
i
separa E
-
XiYi
de E
-
XiYk
para j k, entonces se tiene
). ( ) (
1
i Yjxi
e
j
i i
x x
=
=
Ec. (4.22)
Donde
). ( ) (
i XiYj i jXi Y
x e p x
=
Ec. (4.23)
Es el mensaje que el nodo Y
j
enva a su padre X
i
.
41
A partir de la ecuacin (4.18) puede verse que un nodo X
i
puede calcular su
funcin ,
i
(x
i
), una vez que haya recibido los mensajes de todos sus padres.
De forma similar, a partir de (4.22) puede observarse que la funcin
i
(x
i
) puede
ser calculada una vez que Xi haya recibido los mensajes de todos sus hijos.
La Figura 4.6 muestra los distintos mensajes asociados arbitrario Xi.
39
40
41
Opus, sit pag 45
48
FIGURA 4.6. Mensajes y enviados y recibidos por un nodo Xi.
Substituyendo (4.18) y (4.22) en (4.14), se tiene
. ) ( ) ( ( ) ( ) (
1 1
=
= =
+
i
e
j
YjXi
u
j
p
j
j i i i i i
x u xi U e u x p x e x p Ec. (4.24)
A continuacin se calculan los distintos mensajes que aparecen en la frmula
anterior. Considerando de nuevo un nodo arbitrario X
i
y uno cualquiera de sus
hijos, Y
j
, y utilizando la igualdad
42
U
j k
Y X i Y X
k i j i
E E E
+ +
= ,
Ec. (4.25)
Se tiene
+
+
+
+
+
=
=
=
=
=
=
j k
i YkXi i i
j k
i Y X i i
i i
j k
Y X i i
j k
Y X i
j k
Y X i i
j k
Y X i i
Y X i i Y X
x x p
x e x e p
x p x e x e p
e x p e x e p
e e x p
e x p x
k i
k i
k i k i
k i
j i j i
) ( ) (
) ) (
) ( ) )( (
) ( ) (
) (
) ( ) (
U
U U
U
Ec. (4.26)
42
Opus, sit 45
49
Obsrvese que si Xi es un nodo con evidencia, entonces (4.26) tambin es
vlido si se considera la funcin siguiente para este nodo: i(xi) = 1 si xi = ei,
y i(xi) = 0 si xi _= ei. En este caso, el valor de Xi Yj (xi) obtenido a partir de
(4.26) es el mismo que se obtiene de (4.20). Este hecho hace ms sencilla la
implementacin de este mtodo de propagacin.
43
Por otra parte, para calcular el mensaje Y
j
X
i
(x
i
), se considera el conjunto de
todos los padres de Yj distintos de X
i
, V = {V
1
, . . . , V
q
}. Por tanto, el nodo Y
j
tiene q + 1 padres, como se muestra en la Figura 4.6. Entonces,
+
=
.
j j j i
VY Y Y X
e e e
Ec. (4.27)
Donde e
+
V Yj
representa la evidencia obtenida a travs de todos los padres de
Y
j
, excepto de X
i
. Por tanto, se tiene
44
.
) . ( ) . ( ) (.
) .. ( )) . . ( ( ) . . (
) . . (
) . . ( ) ( ) (
. .
.
.
+
+ + +
+
=
=
=
= =
v
VY i j j Y
Yj
i Y V i Y X j
v Yj
j i Y V j Y
v Yj
i VY Y j
v Yj
i Y X j
v Yj
i Y X i
i
X Y
j j
j i j i j i j
j i
j i j i J
e v p x v y p y e p
x e v p x e v y p y p x e v y e p
x e e v y p
x e v y p x e p x
Ec. (4.28)
Donde la ltima igualdad se ha obtenido considerando las relaciones de
independencia existentes entre los distintos conjuntos de evidencia. Por tanto,
(4.27) puede escribirse como
45
.
) ( ) ( ) ( ) (
1 ..., 1
k j k
q
k
Yi j
vq v
j J
Yj
i
i
X Y
v Y V y p y Y x
J
=
=
Ec. (4.29)
43
44
45
Opus, sit pag.44
50
FIGURA 4.7. Conjunto de padres de un hijo, Y
j
, del nodo X
i
.
A partir de las ecuaciones (4.18), (4.22), (4.26) y (4.29) se puede concluir lo
siguiente:
La ecuacin (4.18) muestra que la funcin
i
(x
i
) puede ser calculada tan
pronto como el nodo X
i
haya recibido los mensajes de todos sus
padres.
La ecuacin (4.22) muestra que la funcin
i
(x
i
) puede ser calculada tan
pronto como el nodo X
i
haya recibido los mensajes de todos sus hijos.
La ecuacin (4.26) muestra que el nodo X
i
puede enviar el mensaje X
i
Y
j
(x
i
) a su hijo Y
j
tan pronto como haya calculado su funcin
i
(x
i
) y
haya recibido los mensajes del resto de sus hijos.
La ecuacin (4.29) muestra que el nodo X
i
puede enviar el mensaje X
i
U
j
(u
j
) a su padre U
j
tan pronto como haya calculado su funcin
i
(x
i
) y
haya recibido los mensajes del resto de sus padres.
La discusin anterior sugiere el algoritmo iterativo siguiente para calcular p(x
i
|e)
para todos los nodos Xi E.
46
46
Opus, sit pag.45
51
Datos: Una red Bayesiana (D,P) definida sobre un conjunto de variables
X a partir de un polirbol D y un conjunto de nodos evidnciales E que
toman los valores E = e.
Resultados: Las funciones de probabilidad condicionada p(x
i
|e) para
cada nodo X
i
E.
Etapa de Iniciacin:
1. Asignar a todos los nodos evidnciales, X
i
E, las funciones
i
(xi) = 1 si x
i
= e
i
, o
i
(x
i
) = 0 si x
i
e
i
.
i
(xi) = 1 si x
i
= e
i
, o
i
(x
i
) = 0 si x
i
e
i
.
(El efecto de esta asignacin es reducir los valores posibles de los nodos
evidnciales X
i
, eliminando todos aquellos valores que la contradicen.)
2. Asignar a todos los nodos Xi E que no tengan padres la funcin
i
(x
i
) =
p(x
i
).
3. Asignar a todos los nodos X
i
E que no tengan hijos la funcin
i
(x
i
) = 1,
para todo x
i
.
Etapa Iterativa:
4. Para cada nodo X
i
E:
(a) Si X
i
ha recibido los mensajes de todos sus padres, calcular
i
(x
i
)
utilizando (4.18).
(b) Si X
i
ha recibido los mensajes de todos sus hijos, calcular
i
(x
i
)
utilizando (4.22).
(c) Si ya se ha calculado
i
(x
i
), entonces, para cada hijo Y
j
de X
i
tal que
X
i
haya recibido los mensajes del resto de sus hijos, calcular y enviar el
mensaje X
i
Y
j
(x
i
) utilizando (4.26). Por tanto, si X
i
ha recibido los
mensajes de todos sus hijos, entonces, puede ya enviar todos los
mensajes correspondientes.
52
(d) Si ya se ha calculado i(xi), entonces, para cada padre U
j
de X
i
tal
que Xi haya recibido los mensajes del resto de sus padres, calcular y
enviar el mensaje X
i
U
j
(u
i
) utilizando (4.29).
Anlogamente al caso anterior, si X
i
ha recibido los mensajes de todos sus
padres, entonces, ya puede enviar todos los mensajes correspondientes.
5. Repetir el Paso 4 tantas veces como sea necesario hasta que se calculen las
funciones y de todos los nodos Xi E, es decir, hasta que no se produzca
ningn nuevo mensaje en una iteracin completa.
6. Para cada nodo Xi E, calcular
i
(x
i
) utilizando (4.13). Estas son las
probabilidades no normalizadas correspondientes a p(x
i
|e).
7. Para cada nodo X
i
E, calcular p(x
i
|e) normalizando la funcin
i
(x
i
), es
decir, p(x
i
|e) =
i
(x
i
)/k, donde k =
xi
i
(x
i
).
Obsrvese que durante el proceso de propagacin, las funciones y de cada
nodo se calculan en distintas etapas de la iteracin. Por tanto, si slo se sta
interesado en una variable objetivo X
i
, el algoritmo puede detenerse una vez
que se conozcan las funciones i(xi) y i(xi).
La estructura de envo de mensajes utilizada en el algoritmo hace posible su
implementacin distribuida (paralela), en la que distintos procesadores realizan
diferentes tareas simultneas cuya combinacin permite resolver el problema.
Supngase que se asocia a cada nodo de la red su propio procesador. El
procesador de un nodo arbitrario, X
i
, necesita conocer la siguiente informacin
para calcular p(x
i
|e):
Dos listas: una formada por los padres de Xi y otra por los hijos. Esta
informacin es independiente de la evidencia E.
53
La funcin de probabilidad condicionada p(xi|Xi ), que tambin es
independiente de la evidencia E. Si Xi no tiene padres, entonces
p(xi|Xi) = p(xi), que es la funcin de probabilidad marginal de Xi.
La funcin i(xi), que se calcula por el procesador correspondiente al
nodo Xi utilizando (4.18).
La funcin i(xi), que se calcula por el procesador asociado al nodo Xi
utilizando (4.22).
El mensaje Uj Xi (uj ), recibido de cada uno de los padres, Uj , del nodo
Xi. Este mensaje se calcula por el procesador asociado al nodo Uj ,
utilizando (4.26).
El mensaje Yj Xi (xi), recibido de cada uno de los hijos, Yj del nodo Xi.
Este mensaje se calcula por el procesador asociado al nodo Yj ,
utilizando (4.29).
Una vez que el procesador del nodo Xi ha recibido la informacin anterior,
puede calcular las probabilidades no normalizadas i(xi) utilizando (4.13).
Finalmente, normalizando estos valores se obtiene la funcin de probabilidad
condicionada p(xi|e).
Por otra parte, cada procesador tiene que calcular los siguientes mensajes para
enviar a sus vecinos:
El mensaje Xi Yj (xi), que es enviado a cada hijo Yj del nodo Xi. Este
mensaje se calcula por el procesador asociado al nodo Xi, utilizando
(4.26).
El mensaje Xi Uj (uj ), que es enviado a cada padre Uj del nodo Xi. Este
mensaje se calcula por el procesador asociado al nodo Xi, utilizando
(4.29).
La Figura 4.8 muestra los clculos realizados por el procesador de un nodo
arbitrario, X
i
, as como los mensajes recibidos y enviados desde el nodo. Esta
figura ilustra las operaciones bsicas necesarias para una implementacin
paralela de este algoritmo.
54
FIGURA 4.8. Clculos realizados por el procesador de un nodo arbitrario X
i
y mensajes que son
recibidos y enviados a padres e hijos.
47
La complejidad del algoritmo es lineal en el nmero de nodos y aristas (el
tamao de la red). Por tanto, cuando una red Bayesiana tiene estructura de
polirbol, el proceso de propagacin puede ser llevado a cabo de forma
eficiente mediante este algoritmo.
Ejemplo 4.2 Propagacin en polirboles (I). Considrese la red Bayesiana
introducida en el Ejemplo 4.1 cuyo grafo dirigido acclico se muestra en la
Figura 4.1. La funcin de probabilidad de la red Bayesiana puede ser
factorizada segn este grafo como
p(a, b, c, d, e, f, g) = p(a)p(b)p(c|a)p(d|a, b)p(e)p(f|d)p(g|d, e).
Para simplificar los clculos se supondr que las variables son binarias. Las
funciones de probabilidad condicionada que definen el modelo se muestran en
la Tabla 4.1. En primer lugar, se considera el caso de no disponer de evidencia.
Por tanto, el algoritmo de propagacin en polirboles permitir obtener las
funciones de probabilidad iniciales p(x
i
), de todos los nodos del grafo. A
47
Imagen tomada de E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic
network models. Springer-Verlag, New York, 1997.
55
continuacin se considera la evidencia D = 0 y se utiliza el mismo algoritmo
para actualizar las probabilidades, es decir, para obtener las funciones de
probabilidad condicionada p(x
i
|D = 0) para todos los nodos X
i
D.
Para ilustrar las distintas etapas del algoritmo, se describen todos los pasos
realizados, siguiendo el orden alfabtico de los nodos en cada paso de
iteracin. En el caso de no disponer de evidencia, el algoritmo consta de los
siguientes pasos:
Etapa de Iniciacin:
En este caso no se aplica el primer paso de la etapa de iniciacin, pues
no se tiene evidencia.
Las funciones de los nodos sin padres, A,B y E, se definen como
A(a) = p(a), B(b) = p(b), E(e) = p(e).
Por tanto, a partir de los valores mostrados en la Tabla 4.1, se tiene
A(0) = 0.3, B(0) = 0.6, E(0) = 0.1,
A(1) = 0.7, B(1) = 0.4, E(1) = 0.9.
TABLA 4.1. Funciones de probabilidad condicionada de la red Bayesiana del Ejemplo 4.2.
a p(a)
0 0.3
1 0.7
b p(b)
0 0.6
1 0.4
e p(e)
0 0.1
1 0.9
a c p(c|a)
0 0 0.25
0 1 0.75
1 0 0.50
1 1 0.50
d f p(f|d)
0 0 0.25
0 1 0.75
1 0 0.50
1 1 0.50
a b d p(d|a,b)
0 0 0 0.40
0 0 1 0.60
0 1 0 0.45
0 1 1 0.55
1 0 0 0.60
1 0 1 0.40
1 1 0 0.30
1 1 1 0.70
d e g p(g|d,e)
0 0 0 0.90
0 0 1 0.10
0 1 0 0.70
0 1 1 0.30
1 0 0 0.25
1 0 1 0.75
1 1 0 0.15
1 1 1 0.85
Las funciones de los nodos sin hijos, C, F y G, se definen como
C(0) = 1.0, F (0) = 1.0, G(0) = 1.0,
C(1) = 1.0, F (1) = 1.0, G(1) = 1.0.
La Figura 4.9 muestra las funciones y calculadas en la etapa de iniciacin.
Los nmeros indican el orden en el que se calculan las diferentes funciones.
56
Primer Paso de Iteracin:
Nodo A: Aplicando al nodo A las reglas dadas en la etapa de iteracin
del algoritmo, se tiene
(a) La funcin A(a) ha sido calculada en la etapa de iniciacin.
(b) La funcin A(a) no puede ser calculada, pues A no ha recibido el
mensaje de ninguno de sus dos hijos, C y D.
(c) La funcin A(a) ha sido calculada, pero A no puede enviar los mensajes
AC(a) y AD(a) a sus hijos, ya que no ha recibido los mensajes de D y C,
respectivamente.
FIGURA 4.9. Etapa de iniciacin del algoritmo de propagacin en polirboles.
(d) Dado que el nodo A no tiene padres, no tiene que enviar ningn
mensaje .
Por tanto, no se realiza ningn clculo asociado al nodo A en esta etapa de
iteracin.
Nodo B: Dado que el nodo D es el nico hijo del nodo B, entonces se
puede calcular el mensaje BD utilizando (4.26) y envidrselo a D:
), ( ) ( ) (
/
2
b b b
B Y
d y
B BD
j
=
Ec. (4.30)
Donde Y
j
es el hijo j-simo del nodo B. Dado que B slo tiene un hijo, esta
ecuacin se reduce a BD(b) = (b). Por tanto, se tiene (BD(0), BD(1)) = (0.6,
0.4).
Nodo C: Dado que A es el nico padre del nodo C, se puede calcular y
enviar el mensaje CA utilizando (4.29). En este caso se tiene
57
), / ( ) ( ) ( a c p e a
C
c
CA
=
Ec (4.31)
Que implica
. 00 . 1 5 . 0 1 5 . 0 1
) 1 1 ( ) 1 ( ) 1 0 ( ) 0 ( ) 1 (
. 00 . 1 75 . 0 1 25 . 0 1
) 0 1 ( ) 1 ( ) 0 0 ( ) 0 ( ) 0 (
= + =
= = + = = =
= + =
= = + = = =
A C p A C p
A C p A C p
C C CA
C C CA
Nodo D: En esta etapa no se realiza ningn clculo asociado al nodo D,
pues ste no ha recibido ningn mensaje de sus padres e hijos.
Nodo E: Como G es el nico hijo del nodo E, se puede calcular y enviar
el mensaje
EG
(e) utilizando (4.26). Procediendo de la misma forma que
para el nodo B, se obtiene
EG
(e) = (e). Por tanto, (
EG
(0),
EG
(1)) = (0.1,
0.9).
Nodo F: La situacin del nodo F es similar a la del nodo C. En este caso
se tiene
), / ( ) ( ) ( d f p f d
f
FD
=
Ec. (4.32)
Es decir, (
FD
(0),
FD
(1)) = (1.0, 1.0).
Nodo G: El nodo G tiene dos padres, D y E; adems la funcin
G
(g) fue
calculada en el paso de iniciacin, y G ha recibido el mensaje del nodo
E. Por tanto, el nodo G puede calcular y enviar el mensaje a su otro
padre, D. Utilizando (4.29) se tiene
), ( ) , / ( ) ( ) ( e e d g p g d
EG
e
G
g
GD
=
Ec. (4.33)
Que implica
58
. 0 . 1 ) 9 . 0 85 . 0 1 . 0 75 . 0 ( 0 . 1
) 9 . 0 15 . 0 1 . 0 25 . 0 ( 0 . 1
) ( ) , 1 1 ( ) 1 (
) ( ) , 1 0 ( ) 0 ( ) 1 (
. 0 . 1 ) 9 . 0 3 . 0 1 . 0 1 . 0 ( 0 . 1
) 9 . 0 7 . 0 1 . 0 9 . 0 ( 0 . 1
) ( ) , 0 1 ( ) 1 (
) ( ) , 0 0 ( ) 0 ( ) 0 (
= + +
+ =
= = +
= = =
= + +
+ =
= = +
= = =
e e D G p
e e D G p
e e D G p
e e D G p
EG
e
G
EG
e
G GD
EG
e
G
EG
e
G GD
Por tanto, se obtiene el mensaje (
GD
(0),
GD
(1)) = (1.0, 1.0).
La Figura 4.10 muestra el orden en el que las funciones y mensajes y han
sido calculadas en el primer paso de iteracin. Todas las funciones
correspondientes a la etapa anterior se muestran con menor intensidad para
distinguirlas de las nuevas funciones.
Segundo Paso de Iteracin:
Nodo A: El nodo A tiene dos hijos, C y D. La funcin
A
(a) ya ha sido
calculada y el nodo A ha recibido el mensaje del nodo
FIGURA 4.10. Primer paso de iteracin del algoritmo de propagacin en polirboles.
C. Entonces, se puede calcular el mensaje y envirselo al nodo D
utilizando (4.26):
59
AD
(a) =
A
(a)
CA
(a). Ec. (4.34)
Por tanto, se tiene (
AD
(0),
AD
(1)) = (0.3, 0.7).
Los nodos B y C no han recibido los mensajes de los nodos D y A,
respectivamente. Por tanto, no se puede efectuar ningn clculo
asociado a los nodos B y C en este paso de la iteracin.
Nodo D: El nodo D ha recibido los mensajes de sus dos padres A y B.
Por tanto, puede calcularse D(d) utilizando (4.18):
). ( ) ( ) , ( ) (
,
b a b a d p d p
BD AD
b a
D
=
Por ejemplo, para D = 0 se tiene
462 . 0 4 . 0 7 . 0 3 . 0 6 . 0 7 . 0 6 . 0
4 . 0 3 . 0 45 . 0 6 . 0 3 . 0 4 . 0
) 1 ( ) 1 ( ) 1 , 1 0 (
) 0 ( ) 1 ( ) 0 , 1 0 (
) 1 ( ) 0 ( ) 1 , 0 0 (
) 0 ( ) 0 ( ) 0 , 0 0 ( ) 0 (
= + +
+ =
= = = +
= = = +
= = = +
= = = =
BD AD
BD AD
BD AD
BD AD D
B A D p
B A D p
B A D p
B A D p
De forma similar, para D = 1 se tiene
D
(1) = 0.538. Adems, el nodo D
ha recibido el mensaje de sus dos hijos, F y G. Esto implica que
D
(d)
puede ser calculado utilizando (4.22):
D
(d) =
FD
(d)
GD
(d),
Obtenindose (
D
(0),
D
(1)) = (1.0, 1.0).
Como el nodo D ha recibido los mensajes de todos sus padres e hijos,
entonces puede enviar todos los mensajes y a sus padres e hijos.
Por ejemplo, utilizando (4.26) se pueden calcular los mensajes
DF
(d) y
DG
(d) de la forma siguiente:
DF
(d) =
D
(d)
GD
(d),
DG
(d) =
D
(d)
FD
(d).
De forma similar, utilizando (4.29) se pueden calcular los mensajes
DA
(a) y
DB
(b) de la forma siguiente:
60
), ( ) , / ( ) ( ) (
), ( ) , / ( ) ( ) (
a b a d p d b
b b a d p d a
AD
a
D
d
DB
BD
b
D
d
DA
=
=
Ec. (4.35)
Los valores numricos correspondientes a estos mensajes se muestran
en la Figura 4.11.
El nodo E no ha recibido el mensaje de su hijo G. Por tanto, no se
puede realizar ningn clculo con este nodo.
Nodo F: El nodo F ha recibido el mensaje DF (d) de su nico padre, D.
Por tanto, puede calcular la funcin F (f):
), ( ) / ( ) ( d p d f p f
DF
d
F
=
Obtenindose (
F
(0),
F
(1)) = (0.531, 0.469).
Nodo G: El Nodo G ha recibido los dos mensajes de sus dos padres, D
y E. Por tanto, se puede calcular la funcin
G
(g) utilizando (4.18):
). ( ) ( ) , / ( ) (
,
e d p e d g p g
EG DG
e d
G
=
Por otra parte, la funcin G(g) tambin ha sido calculada. Por tanto, se
puede calcular y enviar el mensaje al nodo E. Utilizando (4.29) se
tiene:
). ( ) , / ( ) ( ) ( d e d g p g e
DG
d
G
g
GE
=
La Figura 4.11 muestra el orden en que se calculan y envan las
funciones y mensajes en el paso de iteracin anterior.
Procediendo de la misma forma que en los pasos anteriores, en el ltimo
paso de iteracin se calculan las funciones y mensajes siguientes:
A
(a),
FIGURA 4.11. Segundo paso de iteracin del algoritmo de propagacin en polirboles.
61
AC
(a),
B
(b),
C
(c) y
E
(e). La Figura 4.12 ilustra este ltimo paso de la
etapa de iteracin del algoritmo. En esta figura puede comprobarse que
todos los mensajes han sido enviados y todas las funciones y han
sido calculadas. Por tanto, la etapa de iteracin del algoritmo ha sido
completada.
FIGURA 4.12. ltimo paso de iteracin del algoritmo.
En la Etapa 6 del algoritmo se calculan las funciones . Dado que en
este caso no se tiene evidencia, las funciones y mensajes son
constantes para todos los nodos. Por tanto, en este caso
i
(x
i
) =
i
(x
i
)
para todos los nodos X
i
.
En la ltima etapa del algoritmo se obtienen las funciones de
probabilidad marginal, p(x
i
), normalizando las correspondientes
funciones (x
i
). Sin embargo, en este caso las funciones ya estn
normalizadas, por lo que no es necesario realizar ningn proceso de
normalizacin. Este hecho se muestra en la Figura 4.13, que contiene
los valores numricos de todas las funciones y mensajes calculados en
el proceso de propagacin.
62
FIGURA 4.13. Valores numricos de los mensajes y funciones calculados por el algoritmo de
propagacin en polirboles cuando no se dispone de evidencia
48
.
Obsrvese que cuando no se dispone de evidencia, todas las funciones y
mensajes (ver ecuaciones (4.22) y (4.29)) toman el valor 1. Por tanto, en este
caso no es necesario calcular estas funciones y mensajes. Sin embargo,
cuando se dispone de evidencia, los mensajes propagan la informacin
basada en esta evidencia de padres a hijos.
48
Imagen tomada de E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic
network models. Springer-Verlag, New York, 1997.
63
CAPITULO V
ARRITMIAS CARDIACAS, CONCEPTOS,
DESCRIPCION E IDENTIFICACION.
5.1 ANATOMIA Y FISIOLOGIA
Para comprender la fisiologa y fisiopatologa cardiaca, deberamos partir de un
enfoque morfolgico, de indudable importancia pero en este caso vamos a
iniciar el estudio de cardiologa, sin abundar en detalles que se quedan para los
textos de las materias correspondientes.
49
La funcin cardiaca y su posible deterioro no pueden tampoco ser
comprendidos fcilmente sin una revisin de los aspectos anatmicos y
filolgicos del corazn.
El corazn es un rgano muscular cuyo nico fin es bombear sangre hacia y
desde todos los rganos del cuerpo. Considerando su tamao, no mayor que el
puo cerrado, el trabajo que realiza es enorme.
Naturalmente, el corazn no podra realizar esta tarea sin un medio para
distribuir la sangre a travs del cuerpo. Esto se realiza mediante los vasos
sanguneos, algunos de los cuales denominan arterias y otras venas.
La vista del interior del corazn muestra que contiene cuatro cmaras
separadas y distintas. Las cmaras pueden contraerse y relajarse a medida
que expelen la sangre, para luego llenarse nuevamente.
El corazn posee una notable capacidad de latir rtmicamente. Un corazn
saludable late aproximadamente 100 mil veces al da y bomba alrededor de
cinco cuartos de galn de sangre por minutos o 75 galones por hora. Con cada
latido, su ritmo uniforme enva sangre rica en oxgeno y nutrientes a todas las
clulas del cuerpo.
50
49
Vlez A. Hernan FUNDAMENTOS DE MEDICINA Cardiologa, Quinta Edicin, 1997.
50
Vlez A. Hernan FUNDAMENTOS DE MEDICINA Manual de Electrocardiologa, Cuarta
Edicin, 1996
64
El corazn posee su propio sistema de conduccin elctrica. Ciertos tejidos
especiales emiten seales elctricas que viajan a lo largo de las vas de
conduccin del corazn cada vez que ste late.
El nodo Sinoauricular (SA) es el marcapaso natural del corazn, situado en la
cmara superior derecha (aurcula derecha). El nodo SA produce impulsos
elctricos muy pequeos que varan en frecuencia segn las necesidades del
cuerpo de sangre.
Nodo
Sinusal
(Nodo SA)
FIGURA 5.1: nodo sinusal dispara normalmente de 60-100 veces por minuto
Durante el reposo (en personas promedio), el nodo SA inicia por lo general
entre 60 y 80 latidos cardiacos por minuto. Tambin responde cuando se
necesitan frecuencias cardacas ms rpidas. Si esta haciendo ejercicio o se
encuentra bajo un estmulo emocional, el cuerpo requerir de una circulacin
de sangre mayor. Un nodo SA saludable responder a estos cambios del
cuerpo, y aumentara la frecuencia cardiaca segn corresponda.
Una vez que el impulso elctrico sale del nodo SA, viaja a travs de la mitad
superior del corazn, haciendo que se contraigan las aurculas, hasta llegar a
un punto de unin llamado nodo Auriculoventricular o nodo AV. De all el
impulso viaja por las vas de conduccin que recorren la mitad inferior del
corazn y hace que los ventrculos se contraigan. Esta sincrona de
contracciones impulsa la sangre fuera del corazn para que viaje a travs del
cuerpo.
65
Nodo
Atrioventricular
(Nodo AV)
Nodo Sinusal
(Nodo SA)
FIGURA 5.2: Lnea de conduccin, Nodo AV (atrioventricular)
Para que el corazn funcione debidamente, el impulso emitido por el nodo SA
pasa en primer lugar a travs de las aurculas, haciendo que stas se
contraigan. Luego, el mismo impulso pasa a travs de los ventrculos y tambin
provoca su contraccin. Sin embargo, el impulso debe seguir un trayecto ms
complejo que el ya mencionado. Dicho trayecto comprende otras partes del
sistema de conduccin elctrica cardiaca que se explica a continuacin.
Despus de atravesar las aurculas, el impulso elctrico es conducido a otra
superficie de tejido especializado, situado cerca del septo en el que se juntan
las aurculas y los ventrculos.
El nodo AV es la unin a travs de la cual normalmente pasan los impulsos
antes de ser conducidos a los ventrculos. En determinadas condiciones, el
nodo AV contribuye a regular el ritmo ventricular. El ritmo de los impulsos que
llegan a las aurculas (ya se originados en el nodo SA o en los pulsos ectpicos
cualquier pulso elctrico que no viene del nodo sinusal) es extremadamente
alto, el nodo AV no permite que pasen todos los impulsos, asegurando a s un
ritmo ventricular ms lento.
Los impulsos se desplazan desde el nodo SA hasta el nodo AV a travs de
trayectos especializados denominados tractos internodales. Al mismo tiempo,
el impulso activa la pared auricular, que posteriormente se contrae y expulsa
sangre hacia los ventrculos, que en ese momento se encuentran relajados.
66
Una vez el nodo AV ha permitido el paso del impulso, dicho impulso ingresa a
un haz de fibras especializadas que baja por el tabique interventricular. All,
este haz se divide y forma ramas de haces. A su vez, estas ramas se dividen
sucesivamente y, finalmente, terminan en el miocardio ventricular. Esta
conexin con las paredes ventriculares proporciona un trayecto al impulso; al
llegar el impulso, ocurre la contraccin ventricular.
El haz de fibras, que comienza cerca del nodo AV, recibe el nombre de has de
His. El haz de His se divide en dos ramas de haces e individualmente rama
izquierda y rama de Has Derecha.
Cada rama de haces de subdivide en fibras que se adhieren al miocardio
ventricular y que se denominan fibras de Purkinje.
Para comprender mejor por que la funcin elctrica correcta del corazn es
importante, debemos hablar del Gasto Cardaco, el gasto cardiaco es el
volumen de sangre existente en el cuerpo en cualquier momento dado, el
volumen de sangre de una persona es variable. Por ejemplo, cuando alguien
transpira excesivamente por corre, parte del fluido de la sangre se elimina y
pasa a formar parte de la transpiracin. A menos que se beba una cantidad de
agua suficiente para compensar la prdida, el volumen de sangre disminuir.
Existen otros factores que son ms pertinentes al estudio que nos ocupa. Se
trata del ritmo cardaco y del volumen sistlico (volumen de sangre expulsado
por el ventrculo izquierdo).
Para nuestro anlisis, supondremos que la persona o personas que
empleamos como ejemplo estn incluidas en las definiciones normales.
Adems, a medida que discutimos diversos problemas cardacos,
supondremos que no existen otra enfermedad o condicin que pueda modificar
la situacin.
La secuencia de eventos que hace que la sangre ingrese a las aurculas, pase
por los ventrculos y finalmente sea expulsada es la siguiente: Las aurculas se
relajan y la sangre fluye al interior de las mismas. Cuando se contraen, los
ventrculos se relajan y la sangre fluye desde las aurculas hacia los
ventrculos. Luego los ventrculos se contraen y la sangre es bombeada hacia
las arterias y a todo el cuerpo.
67
Con un ritmo cardiaco lento, esta secuencia se mantiene pero el corazn late
con menor frecuencia. Cuando el ritmo comienza a disminuir, el corazn
inicialmente compensa el ritmo menor y mantiene un gasto cardaco adecuado.
Sin embargo, si el ritmo contina descendiendo, con el tiempo alcanza un
punto en el que el gasto cardaco adecuado se reduce y ya no se considera
normal para esa persona.
La seal de la conduccin elctrica del corazn podra fallar por varias razones.
Es posible que exista un efecto hereditario que haya afectado el ritmo cardaco.
Ciertas enfermedades o ciertos medicamentos cardacos podran interrumpir el
funcionamiento normal de los ritmos naturales del corazn. El tejido conductivo
del corazn podra perder parte de su capacidad para transmitir impulsos
elctricos, debido al proceso de envejecimiento. A veces los ataques cardiacos
dejan cicatrices que impiden la conduccin de seales elctricas a travs del
corazn. Cualquiera de estas causas podra producir como resultado una
condicin conocida como ARRITMIAS.
51
5.2 EL ELECTROCARDIOGRAMA
Para comprender mejor la presencia de Arritmias Cardacas debemos
comenzar por conocer como se determinan stas.
Ya hemos visto la importancia que tiene el estado del Gasto Cardaco en todas
las personas. Debido a esa importancia, hay parmetros que pueden ser
medidos y que son detectados aun con los menores cambios que se producen
en la condicin del paciente, que podran ser tratados antes de que originen
problemas graves.
Estos parmetros son capturados por el electrocardiograma, que consiste en
una presentacin grfica de la actividad elctrica del corazn. Dado que los
cambios del ritmo cardaco pueden poner en peligro la actividad del corazn, la
monitorizacin elctrica del corazn permite detectar seales de advertencia de
alteraciones severas del ritmo, as como las propias alteraciones.
51
Dubin Dale ELECTROCARDIOGRAFA PRACTICA, Trazado e Interpretacin, Tercera
Edicin, 1976.
68
De forma sencilla se dice que el electrocardiograma es un registro de la funcin
del corazn (actividad elctrica) y suele designarse por las letras ECG, y nos
da una informacin muy til acerca de la funcin del corazn.
La monitorizacin se lleva a cabo mediante el uso de cables, que son alambres
aislados o conductores. Un extremo del cable se adhiere a la piel del pecho del
paciente mediante una almohadilla viscosa conductora denominada electrodo.
El otro extremo se enchufa a un conductor que se encuentra conectado a una
mquina denominada monitor cardiaco.
Cuando el corazn funciona, su actividad genera cargas elctricas que se
emiten y transmiten a travs de los tejidos del cuerpo hasta la superficie de la
piel. Una vez all, pasan a los electrodos, atraviesan el cable y el conductor, y
llegan al monitor. Los circuitos internos permiten ver un electrocardiograma,
que es una representacin grfica de la actividad elctrica del corazn. Segn
el tipo de dispositivo de monitorizacin que se utilice, dicha representacin
puede consistir en un registro impreso en papel o proyectado en una pantalla.
Slo el papel del electrocardiograma proporciona un registro permanente de la
actividad elctrica.
La tira de papel cuadriculado constituye un registro permanente de la actividad
cardiaca. El electrocardiograma registra los impulsos elctricos que estimulan
el corazn y producen su contraccin.
En este proyecto analizaremos cualquiera de las configuraciones de conexin
de electrodos al pecho del paciente. Al colocar los electrodos sobre el pecho,
deben de ser de modo que el monitor pueda seguir el flujo de electricidad en el
corazn.
El registro de papel de electrocardiograma de 12 electrodos imprime los
registros en papel de electrocardiograma y es necesario asegurar que el
trazado de cada electrodo est marcado con la identificacin correspondiente.
Cada sistema de monitorizacin de electrocardiograma (el sistema de 12
electrodos) cuenta con un mtodo para regular el tamao o ganancia del
trazado de electrocardiograma. Por lo general, el sistema de monitorizacin o
electrocardigrafo se ajusta a una ganancia de 1 mV. Esto significa que el
trazado del electrocardiograma del paciente se mide en relacin a una
referencia de 1 mV (milivoltio) de electricidad, lo que constituye un modo
normalizado de evaluar los electrocardiogramas. Cuando se imprime el
69
trazado, el papel debe salir de la mquina a una velocidad preestablecida (25
milmetros por segundo), la mayora de electrocardiogramas tienen ajustes de
ganancia y velocidad, para este estudio se utilizar las ganancias y velocidad
preestablecidas.
52
Ahora veremos las caractersticas del papel de electrocardiograma:
FIGURA 5.3: Papel de Electrocardiograma
El trazado que muestra en este papel es siempre el mismo. El papel del
electrocardiograma posee una caracterstica que no es entendible en la
ilustracin. La mayor parte de los papeles de este tipo estn compuestos por
varias capas delgadas sobre una base de papel oscuro. El trazado que
aparece en el papel del electrocardiograma es fundido sobre la superficie de
cera del papel por un punzn caliente del electrocardigrafo. Por consiguiente,
el trazado a menudo no se imprime, sino que fija trmicamente sobre el papel.
Los dos componentes de la cuadricula que se indican a continuacin siempre
se representan de la misma forma:
El tiempo de cada forma de onda: Est representada por el eje horizontal de la
cuadricula.
El voltaje o amplitud registrada durante ese tiempo: Est representado por el
eje vertical de la cuadricula.
52
Medtronic Manual de Entrenamiento de ECG, Medtronic Company 2003.
70
Si se remite nuevamente a la muestra en blanco del papel de
electrocardiograma, ver que en la cuadricula hay lneas gruesas y lneas
finas. Estas lneas forman pequeos cuadrados (1mm de largo) que estn
contenidos dentro de los cuadrados ms grandes formados por las lneas
gruesas. Hay cinco cuadrados pequeos dentro de cada par de lneas gruesas,
tanto horizontal como verticalmente. En direccin horizontal, cada uno de estos
cuadrados representa 40 ms (milisegundos). Esto puede expresarse como
cuarenta milisegundos (40 ms) o cero como cero cuatro segundos (0.04 s)
1 ms = 0.001 segundos = 1/1000 segundos.
1 s = 1000 ms
Dado que 1 ms = 0.0001 s, las expresiones cuarenta milisegundos y cero
como cero cuatro segundos son equivalentes. Las mismas se utilizan segn la
preferencia y la costumbre. Sin embargo, la mayora de los mdicos emplean
milisegundos, por lo que aqu emplearemos dichas unidades.
Debido a que hay cinco cuadros pequeos entre las lneas gruesas, cada uno
de los cuadrados grandes representan 200 ms (40ms x 5 cuadrados = 200 ms)
Verticalmente, los cuadrados pequeos representan 0.1 mV (milivoltios) de
electricidad. Estos cuadrados verticales indican el voltaje de la forma de onda y
cada cuadrado grande representa 0.5 mV (0.1 mV x 5 cuadrados = 0.5 mV).
0
.
5
m
V
0
.
1
m
V
FIGURA 5.4: Medidas del papel del electrocardiograma
El papel del electrocardiograma est diseado para medir pequeas unidades
de tiempo, ya que para interpretar correctamente un electrocardiograma se
71
requiere mediciones precisas. Como se ver, uno de los factores utilizados
para identificar ciertos ritmos cardacos es la cantidad de tiempo requerida para
completar actividad elctrica asociada a los distintos segmentos del
electrocardiograma.
El ECG estndar consiste de 12 derivaciones diferentes que se usan para
obtener un cuadro completo de la actividad elctrica del corazn. Seis de estas
se denominan derivaciones de las extremidades (I, II, III, aVr, aVl, aVf), las
cuales registran la actividad elctrica del corazn en el plano frontal. Las seis
derivaciones restantes son llamadas derivaciones precordiales o torcicas (V1
a V6), las cuales registran la actividad elctrica del corazn en el plano
horizontal.
Las derivaciones I, II, III, se conocen como bipolares porque cada una de ellas
tiene dos electrodos un positivo y uno negativo que registran simultneamente
las fuerzas elctricas del corazn que se dirigen hacia las dos extremidades.
Derivacin I, registra la actividad elctrica entre el brazo derecho y el izquierdo;
Derivacin II, registra la actividad elctrica entre el brazo derecho y la pierna
izquierda; y la Derivacin III, registra la actividad elctrica entre el brazo
izquierdo y la pierna izquierda.
Las derivaciones aVr, aVl, aVf, registran la diferencia de potencial elctrico
entre las extremidades y el centro del corazn. Estas derivaciones se llaman
unipolares porque utilizan un solo electrodo para el registro; el centro del
corazn es siempre neutro. Por tanto, el electrodo que se usa en cada
derivacin es positivo. Estas derivaciones tambin se llaman aumentadas
porque la amplitud de los complejos est aumentada en un 50% con relacin a
la de los complejos de las derivaciones estndar de las extremidades. Este
hecho las hace ms fciles de analizar.
53
Derivaciones V1 a V6 miden la diferencia de potencial elctrico entre un
electrodo precordial y una terminal central. El electrodo precordial usado en
53
Dr. Mario Testelli. ECG Interpretacin Clnica; Facultad de Medicina, Universidad Nacional
Autnoma de Mxico. Editorial El Manual Moderno, S.A. de C.V. Mxico, D.F.
72
cada derivacin V es positivo. La colocacin de las derivaciones precordiales
ofrece una buena imagen de la actividad elctrica de los ventrculos. Las
derivaciones V1 y V2 se llaman precordiales derechas; las derivaciones V3 y
V4 reciben el nombre de precordiales intermedias y las V5 y V6 precordiales
izquierdas.
En el mayor de los casos para el monitoreo cardiaco continuo se emplea una
sola derivacin, siendo las mas utilizadas la derivacin II, la precordial 1
modificada y la precordial 6 modificada.
La derivacin II, es especifica para el monitoreo del ritmo cardiaco. Las ondas
P se observan con claridad. Pero en ocasiones es imposible identificar entre un
bloqueo de rama y una extrasstole ventricular.
La derivacin precordial 1 modificada MCL1 vara de V1 por ser bipolar; ofrece
mas ventajas diagnsticas que la derivacin II porque distingue entre una
ectopia ventricular izquierda y una derecha, identifica bloqueos de rama
izquierda y derecha, revela claramente las ondas P, que por lo general, se ven
mejor en una derivaron precordial derecha.
La derivacin precordial 6 modificada MCL6, es una derivacin bipolar parecida
a V6 que complementa la informacin que MCL1 cuando sta no ofrece todo lo
necesario para una evaluacin correcta de la funcin cardiaca del paciente.
54
Se debe tomar en cuenta que el monitoreo mediante una sola derivacin
aunque es prctico y conveniente no basta, a veces se necesita un ECG de 12
derivaciones estndar para esclarecer el diagnstico.
55
54
Opus sit, pag 70
55
En el sistema experto ya que son arritmias las que identificar, puede ser utilizada cualquier
derivacin; por lo tanto, la derivacin a utilizar en el mdulo de captura de datos del
electrocardiograma ser aquella en la cual se muestre ms claramente la grfica de la seal y
el sistema no identificar tal derivacin.
73
5.3 PRESENTACION NORMAL DE LA
ACTIVIDAD ELECTRICA DEL CORAZON Y SU
TRAZO DE ELECTROCARDIOGRAMA.
Ahora que conocemos el papel de electrocardiograma, analicemos la
interpretacin de dicho estudio.
El proceso normal de despolarizacin/repolarizacin de todas las clulas
cardacas presenta en el monitor o el papel de electrocardiograma un trazado
de forma de onda claro y reconocible. Dicha forma de onda es como sigue:
FIGURA 5.5: Reconocimiento de ondas del corazn, Onda P, Q, R, S,
lnea isoelctrica basal y onda T.
Como puede verse en esta ilustracin, se han elegido las letras P, Q, R, S y T
Para identificar los diversos segmentos de esta forma de onda. La letra P
designa la deflexin o loma que se muestra inmediatamente debajo de dicha
letra. Lo mismo ocurre con la letra T. El grupo de letras QRS se refiere a la
deflexin ms abrupta, que es una combinacin de las ondas Q, R y S.
Es importante notar que hay una lnea de base que recorre totalmente el trazo
del electrocardiograma, y que se denomina lnea isoelctrica.
La lnea isoelctrica indica el nivel en que no existe ninguna actividad elctrica
o polarizacin celular.
Analizaremos ahora cada letra y el correspondiente segmento de la onda.
74
5.3.1 ONDA P
Segn la direccin del flujo de electricidad y de acuerdo con el electrodo
empleado, la deflexin en el electrocardiograma puede ser positiva, negativa o
bifsica. La onda P generalmente constituye el primer segmento saliente y
redondeado de la onda que precede al segmento QRS. La onda P indica la
descarga de electricidad del nodo SA y la despolarizacin (contraccin) de
todas las clulas auriculares en una direccin que sigue el flujo de electricidad
normal esperado del nodo AV. Si se observa el complejo o segmento
compuesto, se notar que la lnea isoelctrica se hace visible entre la onda P y
el comienzo del complejo QRS.
5.3.2 INTERVALO PR
El tiempo que transcurre desde el comienzo de la onda P hasta el Principio del
complejo QRS se denomina intervalo PR, y representa la cantidad de tiempo
que el impulso original tarda en avanzar desde el nodo SA y atravesar las
aurculas y el nodo AV. Dicho perodo debera ser de 120ms a 200ms, o bien
entre 3 y 5 cuadrados pequeos del papel de electrocardiograma.
FIGURA 5.6: Reconocimiento de segmentos del corazn, segmento PR, duracin QRS, e
intervalo QT.
Este tiempo incluye una demora en la conduccin que se produce en el nodo
AV. Se trata de una demora intencional para que los ventrculos puedan
llenarse adecuadamente como resultado de la contraccin auricular. Sin esta
demora, los ventrculos se contraeran demasiado pronto, no se llenaran por
completo y el gasto cardaco sera menor.
75
Ntese que el intervalo PR se define como aquel que comienza al iniciarse la
onda P y que finaliza al iniciarse la onda Q, aunque no se denomina PQ . Esto
se debe a que la onda Q a veces no est presente y el intervalo se extiende en
realidad hasta la onda R. Por esta razn resulta mejor considerar al intervalo
PR como el tiempo que transcurre desde la iniciacin de la onda P hasta la
iniciacin del complejo QRS, independientemente de las ondas que estn
presentes en el complejo QRS.
5.3.3 COMPREJO QRS
El complejo QRS normalmente se compone de tres ondas Q, R y S que
indican la despolarizacin ventricular. Este complejo no contiene siempre las
tres ondas. Puede hallarse ritmos son la onda Q, son la onda S, o bien sin
ambas. Cuando la monitorizacin se lleva a cabo con una configuracin de tres
electrodos, la onda Q normalmente es negativa, la onda R es positiva y la onda
S es negativa.
La duracin del complejo QRS es normalmente de 60 ms a 120 ms. Es
interesante notar que la repolarizacin auricular se produce al mismo tiempo
que la despolarizacin ventricular. El Segmento que indica la repolarizacin
auricular no puede verse debido a que es superado por el segmento que indica
la despolarizacin ventricular, cuyo voltaje es mayor.
5.3.4 LA ONDA T
La onda T alude a la repolarizacin ventricular y, por lo general, Tiene deflexin
positiva. La forma de onda que hemos analizado es la que se considera
normal. De acuerdo con la terminologa de la estimulacin, se dice que tiene
una morfologa normal.
5.3.5 SEGMENTO ST
Un segmento S-T normal posee la siguientes caractersticas, su ubicacin se
extiende donde termina la onda S hasta el comienzo de la onda T con una
duracin que no suele medirse. Casi siempre isoelctrico (sobre la lnea base),
puede variar ligeramente, pero lo comn no mayor de 1mm.
76
5.3.6 INTERVALO Q-T
La ubicacin de este intervalo es entre el comienzo del complejo QRS hasta el
final de la onda T. Incluye el complejo QRS, el segmento S-T y la onda T. Con
una duracin que varia segn la edad, sexo y frecuencia cardiaca. Pero por
regla general el intervalo Q-T no puede ser mayor que la mitad de la longitud
del intervalo R-R si el ritmo es regular.
56
Las cinco caractersticas esenciales que deben determinarse para distinguir un
ritmo normal de uno anormal son los siguientes:
Frecuencia Cuntos latidos por minuto (lpm) se producen
para las aurculas o para los ventrculos?
Ritmo Es regular o irregular?
QRS Se encuentra presente?
Es su duracin normal?
ONDA P Se encuentra presente?
Son coherentes? Es su forma normal?
INTERVALO PR Cul es su duracin?
OTROS INTERVALOS Cul es su duracin en milisegundos?
Tabla 5.1 caractersticas esenciales para determinar un ritmo elctrico del corazn normal
5.4 LAS ARRITMIAS
Sea querido dar una breve explicacin sobre el comportamiento normal del
corazn as como su actividad elctrica gravada en una tira de papel de
electrocardiograma, para facilitar y cimentar el estudio de las arritmias
cardiacas y su diagnstico, que es el centro del estudio en particular.
Las arritmias pueden variar de acuerdo a su causa, complejidad y gravedad.
Las caudas pueden deberse a trastornos en la formacin del impulso como
sucede en las muchas variaciones anormales del ritmo y frecuencia, o
trastornos de la conduccin.
El primer diagnstico de las arritmias se basa siempre en la historia y sntomas
del paciente y una exploracin cardiovascular minuciosa con un ECG de 12
derivaciones, donde se vern los ritmos anormales y se clasifican dependiendo
56
Testelli Mario ECG Interpretacin Clnica, Primera Edicin, 1997.
77
del sitio de origen. Las arritmias ventriculares suelen ser mucho ms peligrosas
que las supraventriculares.
Las arritmias se pueden dividir en dos grandes grupos, los trastornos en la
formacin o conduccin del impulso y los desordenes en la formacin del
impulso. Por lo que en este estudio nos interesaremos en los trastornos de
conduccin del impulso y formacin de impulso, la derivacin o vista del
corazn en el electrocardiograma (de miembros o precordiales AVL, AVF,
AVR, V1, V2, V3, V4, V5, V6, I, II, III)no nos interesar, sino ms bien la
derivacin ms representativa, ya que las lecturas que nos interesan son
ritmos, frecuencias, o milisegundos de las onda, intervalos y segmentos, y no
tanto la deformacin de las mismas.
La frecuencia cardiaca mide el ritmo normal del corazn, que es controlado por
el Nodo Sinusal, ste se despolariza entre 60 y 100 veces por minuto, y todos
estos impulsos son conducidos a los ventrculos en un tiempo razonable.
Cuando se presentan frecuencias fuera del rango normal de disparo del nodo
Sinusal nos encontramos con dos diferentes problemas, los disparos debajo de
los 60 latidos por minuto BRADICARDIAS o arriba de 100 latidos por minuto
TAQUICARDIAS.
5.4.1 BRADICARDIA.
Qu es la bradicardia?.
Bradicardia es un trmino amplio que significa la frecuencia cardiaca es
demasiado lenta. Si el corazn es incapaz de hacer circular la sangre que el
cuerpo necesita, podra producirse mareos, fatiga o desmayos.
La bradicardia puede surgir como resultado de los siguientes problemas de
conduccin cardiaca.
Las enfermedad del nodo sinoauricular son trastornos del ritmo cardaco
relacionados con el nodo SA se clasifican bajo el trmino amplio de
SINDROME DEL SENO ENFERMO. Si el nodo SA, que es el marcapasos
natural del corazn, pierde su capacidad para iniciar los latidos o aumentar la
frecuencia cardiaca, el corazn podra dejar de responder eficazmente a las
demandas cambiantes de la circulacin sangunea del organismo. En
respuesta al sndrome de seno enfermo, muchas veces otros tejidos cardacos
78
empiezan a hacer el trabajo del nodo SA, pero a frecuencias irregulares o que
resultan demasiado lentas o demasiado rpidas para las actividades normales
de la persona.
5.4.2 TAQUICARDIA
Y el otro trastorno de conduccin elctrica como resultado de una aceleracin
excesiva de los latidos del corazn, la TAQUICARDIA, o frecuencia cardiaca
anormalmente alta. En la taquicardia, el corazn bobea rpidamente pero
ineficazmente. Al igual que con la bradicardia, la taquicardia no permite que el
corazn satisfaga las demandas de circulacin sangunea del cuerpo. Las
taquicardias se pueden originar en las aurculas o en los ventrculos y su
tratamiento depende de su localizacin.
Ya que conocemos las caractersticas generales de los dos trastornos de
conduccin nos enfocaremos ahora, en las caractersticas especficas de cada
uno de las enfermedades de conduccin derivadas, que hemos elegido por su
representatividad.
Las diferentes arritmias cardacas que el sistema identificar, estar limitado a
las siguientes:
5.4.3 Bradicardias:
Son arritmias cuya frecuencia (en general) es menor de 60 latidos por minuto.
Se pueden producir por la disminucin del automatismo de las clulas
marcapaso o por bloque de los impulsos normalmente generados en cualquier
lugar del sistema de conduccin.
5.4.3.1 Bradicardia sinusal: Consiste en la disminucin del automatismo
sinusal, Al ECG veremos complejos P-QRS-T normales, pero a una frecuencia
menor de 60 latidos por minuto. Si la bradicardia es severa, pueden aparecer
latidos de escape supraventriculares o ventriculares. La bradicardia sinusal
puede ser normal en algunos atletas bien entrenados. Y sus parmetros son
los siguientes:
79
Frecuencia ventricular menor a 60 LPM
Frecuencia Auricular menor a 60 LPM
Ritmo Regular
Complejo QRS Normal entre 60 120 ms
Ondas P presentes
Intervalo PR normal de 120 a 200 ms
5.4.3.2 Paro o Pausa Sinusal:
Frecuencia ventricular normal
Frecuencia auricular normal
Ritmo irregular debido a las pausas.
Complejo QRS Normal entre 60 120 ms
Ondas P presentes
Intervalo PR normal de 120 a 200 ms
5.4.3.3 Bloqueo AV de 1er Grado: Es importante saber que el intervalo PR se
acorta durante una taquicardia debida a la emocin o al ejercicio, pues la
estimulacin simptica acorta favorece la conduccin en el rea N del nodo AV.
As pues, el bloqueo AV de primer grado consiste en una prolongacin
constante del intervalo PR, se presenta en 2% de la poblacin adulta.
Caractersticas:
Frecuencia ventricular normal
Frecuencia auricular normal
Ritmo regular.
Complejo QRS Normal entre 60 120 ms
Ondas P presentes
Intervalo PR anormal mayor a 200 ms
5.4.3.4 Bloqueo AV de Segundo Grado (TIPO I). Mobitz, Algn impulso se
bloquea despus de un alargamiento progresivo del PR, los RR se acortan y
los PP son constantes.
80
Frecuencia ventricular normal
Frecuencia auricular normal
Ritmo auricular regular.
Ritmo ventricular irregular
Complejo QRS Normal entre 60 120 ms
Ondas P presentes
Intervalo PR se prolonga progresivamente hasta que se interrumpe el
complejo QRS anormal.
1.4.4 Taquicardias: las taquicardias tienen frecuencias cardacas mayores a
100 latidos por minuto, son complejos QRS estrechos, menores de 120
ms, sin embargo en algunos pacientes tienen taquicardias con QRS
anchos mayores de 120 ms debido a que tengan bloqueos de ramas.
5.4.4.1 Taquicardia sinusal: Es una respuesta fisiolgica por un aumento del
tono simptico.
Frecuencia ventricular de 100 a 150 LPM
Frecuencia auricular de 100 a 150 LPM
Ritmo regular
Complejo QRS Normal entre 60 120 ms
Ondas P presentes
Intervalo PR normal de 120 a 200 ms
5.4.4.2 Flter Auricular: tambin llamado Aleteo Auricular, en el
electrocardiograma observamos unas ondas llamadas dientes de sierra. Suelen
presentar una mayor amplitud en DI, DII y aVF, donde habitualmente son
negativas y con menor frecuencia positivas
57
Frecuencia ventricular inferior a la frecuencia auricular.
Frecuencia auricular de 250 a 350 LPM
Ritmo auricular regular
Ritmo ventricular puede ser regular o irregular
57
Albert Aranda Pallero, Apuntes de Electrocardiografa Bsica.
http://webs.comb.es/aranda/eind.html creada en enero de 2000, ultima actualizacin 24/07/04
81
Complejo QRS Normal entre 60 120 ms
Ondas P son reemplazadas por ondas de Flter.
Intervalo PR no corresponde o ausente.
1.4.5 Sndrome de Taquicardia-bradicardia.
Sus caractersticas son como su nombre los indica segmentos bradicrdicos y
taquicrdicos con bruscos cambios entre ellos.
Frecuencia auricular vara bruscamente.
Frecuencia auricular con segmentos menores de 60 LPM y segmentos
mayores de 100 LPM
Ritmo auricular irregular
Ritmo ventricular puede ser regular o irregular
Complejo QRS Normal entre 60 120 ms
Ondas P normales.
Intervalo PR no corresponde o ausente.
58
58
Testelli Mario ECG Interpretacin Clnica, Primera Edicin, 1997.
82
CAPITULO VI
ESTRUCTURACION DEL SISTEMA EXPERTO.
El electrocardiograma es de utilidad para estudiar la actividad elctrica cardiaca
y la presencia de determinadas enfermedades o sntomas, las arritmias
cardacas (las cuales son alteraciones en el ritmo o frecuencia cardiaca)
constituyen un problema de identificacin, diagnstico y teraputico para lo cual
resulta necesario conocer las relaciones de los parmetros de la grfica y su
interpretacin, con el fin de identificar algn tipo de enfermedad arrtmica; este
conocimiento se basa en el estudio de cada una de las ondas que componen el
registro elctrico de cada pulsacin (capitulo V) y determinar los valores de
cada uno; es decir, cuantificar y caracterizar los diferentes parmetros
necesarios para la determinacin de las diferentes arritmias.
Esta cuantificacin y caracterizacin de parmetros resultaran ser nuestros
signos o hallazgos, a partir de los cuales tendremos evidencia que afirman o
niegan la posibilidad de ciertas enfermedades dependiendo del conjunto de
parmetros, acortando cada uno de las posibles arritmias, hasta encontrar la
ms adecuada.
En captulos anteriores se estudi la teora relacionada con los sistemas
expertos probabilsticos, teora de grafos y la aplicacin de estos conceptos a
las redes bayesianas; posterior a esto se estudio un rea particular de la
cardiologa, las arritmias cardacas y su representacin en el
electrocardiograma; en este captulo, se presenta como se estructura el
conocimiento para la identificacin de arritmias cardacas en un sistema
experto probabilstico que utiliza los conceptos de redes bayesianas como
representacin de conocimiento y sus algoritmos de propagacin de evidencia
para poder lograr la identificacin de arritmias cardacas a partir de los
parmetros obtenidos del trazo del electrocardiograma.
83
6.1 DEFINICIN DEL PROYECTO.
Despus de estudiar la presentacin de la actividad elctrica del corazn en el
trazo del electrocardiograma y las arritmias que se pueden identificar a partir de
este, resulta necesario el estudio de los procesos, secuencias o mtodos
empleados por el experto en la lectura del electrocardiograma, para la
identificacin de atributos o parmetros necesarios que dirigen la identificacin
de arritmias en el electrocardiograma, resulta interesante ver como los
sistemas expertos pueden colaborar a resolver este tipo de dificultades, dado el
conocimiento necesario relacionado a la identificacin de arritmias a partir de
electrocardiogramas.
El fundamento del diagnstico de arritmias, consiste en obtener los registros
elctricos del corazn, mediante el uso del electrocardiograma; el cual por ser
una tcnica no invasiva, aporta gran informacin sin riesgo para el paciente.
Uno de los inconvenientes, es la obtencin de los parmetros necesarios a
partir de la grfica, como tambin la cantidad de conocimiento necesario para
relacionar los diferentes parmetros obtenidos y concluir en un diagnstico de
acuerdo a dichos parmetros, lo cual puede dar diferencias de interpretacin y
diagnstico entre mdicos.
El sistema experto, a partir del conocimiento traducido en una red bayesiana,
debe de interpretar la informacin obtenida por el tratamiento digital del
registro, en un editor de la grfica de electrocardiograma, las cuales son sus
evidencias y utilizando un motor de inferencia, junto con la base de
conocimiento sobre la cual se propagar la evidencia, y concluir en identificar
la arritmia cardiaca encontrada, que deber ser explicado o mostrar
conclusiones del proceso realizado por el motor de inferencia para llegar a
dicha identificacin.
84
FIGURA 6.1 Sistema experto para la identificacin de arritmias cardacas.
6.2 ADQUISICIN DE CONOCIMIENTOS.
Los problemas que deben de ser enfrentados en el momento de construir una
red probabilstica son tres: determinacin de la estructura, determinacin de los
parmetros y propagacin de la evidencia.
La determinacin de la estructura de una red consiste en encontrar su
topologa, es decir las relaciones de dependencia entre las variables relevantes
involucradas en el problema dado. La determinacin de la topologa de una red
es en muchos de los casos, proporcionada por el experto y en otras no se
extrae del experto si no de datos estadsticos (mtodos de aprendizaje).
En nuestro caso particular, la determinacin de la topologa de la red viene
dado por el experto humano y la literatura con lo cual se han definido las
relaciones entre las variables, as como los parmetros numricos que
corresponden a los nodos en la red probabilstica.
Dado lo anterior, debemos de partir de la metodologa utilizada por el
especialista en electrocardiografa para la evaluacin de cada arritmia, lo cual
nos da una representacin general de las reglas y pasos realizados durante el
proceso de identificacin.
Inicialmente y de manera general el especialista comienza evaluando la grfica
del electrocardiograma, respondiendo las siguientes preguntas:
1. Existen ondas P?
2. Son todas las ondas P iguales en forma y tamao?
85
3. Se encuentra cada onda P a la misma distancia de su complejo QRS?
4. La relacin auriculoventricular es 1:1?
En caso contrario La frecuencia auricular es mayor o menor que la
ventricular?
5. Los intervalos P-P son regulares o irregulares?
Si son irregulares, existe periodicidad regular?
6. Los intervalos RR son regulares?
Si son irregulares, existe periodicidad regular?
7. Las ondas P, intervalo PR, QRS son normales?
8. Cul es la duracin del intervalo P-R? (Normal de 0.12 a 0.20 seg.)
9. Es el intervalo P-R constante?
10. Estn todas a la misma distancia de las ondas T siguientes?
11. Es la frecuencia cardiaca rpida, lenta o normal?
Determinar la frecuencia cardiaca.
La frecuencia cardiaca est dentro de los limites normales? (60 a 100
latidos por minuto), < 60 bradicardia, > 100 taquicardia.
12. Pudiera haber una onda P oculta por el segmento S-T?
13. Pudiera haber una onda P oculta en la onda T?
El estudio de las arritmias y los mtodos de identificacin de estas a partir del
electrocardiograma proponen la siguiente secuencia para la lectura del
electrocardiograma:
Inicialmente se analiza la frecuencia cardiaca del trazo del electrocardiograma,
la frecuencia no es diagnstica de ninguna arritmia
59
, pero si la frecuencia
cardiaca est dentro de los 60 a 100 lpm, se considera una frecuencia normal,
si la frecuencia es menor a los 60 lpm, debe de pensarse en una bradicardia, y
si este es mayor a los 100 lpm entre el rango de 100 a 160 lpm debe de
pensarse en una taquicardia.
Por lo tanto segn la frecuencia cardiaca, pueden clasificarse las arritmias en:
1. Taquicardias
2. Bradicardias.
59
Gua practica para el diagnstico y tratamiento de las arritmias, servicios de cardiologa-
urgencias. HUVA-Murcia 1999, Dr. Luis Muoz Gimeno, Dr. Arcadio Garca Alberola.
86
Determinar la frecuencia cardiaca, se realiza de la siguiente manera,
considerando que la velocidad del registro del papel es de 25mm por segundo;
por tanto 1 mm = 0.04seg, 5 mm = 0.20 seg., se mide la distancia que existe
entre una P y la siguiente P, despus se divide 1500
60
entre el espacio P-P
medido, con lo cual obtenemos la frecuencia auricular, se debe repetir el
procedimiento anterior para determinar la frecuencia ventricular midiendo las
distancias R-R.
La frecuencia cardiaca vara con la edad 110-150 lpm a los 2 aos: 85-125 lpm.
A los 4 aos 75-115 lpm. A los 6 aos 65-100 lpm. Mayor a 6 aos. Dado que
los electrocardiogramas obtenidos son de personas adultas, la edad no se
considerar un parmetro del cual deba depender la frecuencia.
El siguiente parmetro que debemos analizar es el ritmo, y determinar si este
es regular o irregular. El ritmo cardiaco normal es tal que existe una distancia
constante entre ondas semejantes, el ritmo se considera variable cuando
muestran una irregularidad general, sin que sea posible predecir ninguna
repeticin fija; es decir, los intervalos entre los ciclos P-QRS-T cambian
constantemente.
La manera de determinar la regularidad o irregularidad del ritmo es midiendo
las distancias entre ondas P, esta distancia es el intervalo P-P, la cual debe de
medirse a lo largo del trazo del electrocardiograma, si cada uno de los
intervalos P-P mantienen la misma distancia, tenemos un ritmo auricular
normal, si las distancias entre ondas P a lo largo de la tira del ECG son
variables estamos en presencia de un ritmo irregular. Luego con el mismo
procedimiento debe de medirse los intervalos R-R de los complejos QRS para
determinar la regularidad o irregularidad del ritmo ventricular.
Debe de considerarse que en la determinacin del ritmo, pueden existir
regularidad dentro de los ritmos irregulares y determinar si el ritmo es muy
irregular o ligeramente irregular. Ligeras variaciones en el ritmo (0.04 seg) a
60
El cual es el resultado de dividir 60seg entre 0.04seg que es el tiempo que hay en 1mm del
ECG
87
veces pueden considerarse regulares
61
. Por otro lado, si al medir el ritmo de
cada ciclo encontramos ritmos constantes y posterior se encuentra un ritmo
ms bajo a los anteriores y luego regresa a su ritmo original se considera un
ritmo irregular y podemos pensar en una pausa sinusal. Si por el contrario
estamos en presencia de regularidad en ritmos irregulares, es decir un varios
ritmos regulares pero a frecuencia alta y posterior ritmos regulares pero a
frecuencia baja, en su totalidad el ritmo es irregular porque pasa de rpido a
lento y luego a rpido, con regularidad en cada uno de sus ciclos, podemos
pensar en el sndrome de bradicardia-taquicardia.
Posterior a la valoracin de la frecuencia y el ritmo mostrado en el trazo del
ECG, se debe de estudiar la onda P, intervalo PR, complejo QRS, onda T,
segmento ST, intervalo QT, estudiadas en el capitulo 5.3, para poder
determinar valores y relaciones que se encuentren fuera de los parmetros
normales y reafirmar las sospechas iniciales obtenidas del ritmo y frecuencia.
Por ejemplo el ritmo anormal, o no sinusal, vine sealado por la presencia de
ondas P en nmero o formas anormales; por lo que debe de medirse su
amplitud y ancho.
La ausencia de ondas P indican un ritmo no sinusal, es decir anomalas en la
formacin del impulso, que se ve en bloqueo sinoauricular, fibrilacin auricular.
Si hay una onda P diferente en amplitud y ancho despus de una pausa, este
proviene de un nodo ectpico, bloqueo AV de 1er grado. Hay que resaltar que
los disparos de seal de un nodo ectpico pueden ser a diferentes frecuencias,
por lo que resulta necesario medir la frecuencia como el intervalo PR.
Si se dispara una onda P del nodo normal, luego otra de un nodo ectpico y
otra del nodo normal podemos pensar en un bloqueo AV 2do Grado; resulta
necesario obtener la frecuencia, intervalos PR, y relacin auriculoventricular
P:QRS.
Por otro lado si se visualizan mltiples ondas P por QRS, puede ser porque el
nodo sinusal esta disparando y a la vez otros nodos ectpicos, que por lo
61
ECG interpretacin clnica, Keith Lassner, Editorial el Manual Moderno, S.A. de C.V. 1993
Mxico D.F.
88
general tendrn el mismo ancho y alto, cambiadas en ondas F llamados dientes
de sierra, que pueden manifestarse flter auricular o fibrilacin auricular.
Al medir el intervalo PR, siempre deben de encontrarse lecturas dentro del
rango de 120 a 200 ms que se consideran normales; si en todos los ciclos el
PR es ms largo de lo normal y se mantiene constante este largo para cada
ciclo, entonces podemos pensar en un bloqueo de primer grado.
Si el intervalo PR, se va alargando para cada ciclo, hasta desaparecer un
segmento QRS, entonces, podemos pensar en un bloqueo de 2do grado
Mobitz I.
Debemos de determinar la anchura del complejo QRS, se considera normal si
esta dentro del rango de 0.08 a 0.12 seg. Si es un QRS estrecho, se debe de
considerar la posibilidad de un flter auricular. Si la anchura es de 0.12seg o
mayor debemos de pensar en bloqueos de rama, taquicardias ventriculares y
supraventriculares.
En algunas ocasiones pueden encontrarse extrasstoles, las cuales son QRS
sin forma, lo que indica que el nodo AV est disparando mal su seal, es decir,
hay una mala contraccin de los ventrculos, si la secuencia es QRS normal,
extrasstole, luego QRS normal, extrasstole y normal, se llama bigeminsmo; y
si la secuencia es por cada extrasstole hay 3 ondas QRS normales, se llama
trigeminsmo.
El intervalo QT desaparece cuando hay una fibrilacin; medimos el intervalo QT
para determinar si los ventrculos se estn despolarizando de manera
adecuada, por lo que no debe ser mayor que la mitad del intervalo RR, si el
ritmo es regular o dentro del rango 0.35-0.44seg. Si no cumple estos
parmetros indica que existe algn tipo de infarto.
El segmento ST similar que el intervalo QT, nos puede indicar la presencia de
algn tipo de infarto, por lo general debe de medir dentro del rango 0.05-
0.15seg. y hacer referencia a la lnea isoelctrica o basal.
89
De manera general la secuencia de pasos descrita para la lectura del
electrocardiograma se muestra en la figura 6.2; Las arritmias que el sistema
deber identificar se muestran en la tabla 6.1 con la descripcin de los
parmetros y los valores que estos pueden tomar en el ECG.
FIGURA 6.2 Secuencia general descrita para la lectura del Electrocardiograma, con el cual se
obtienen los parmetros iniciales necesarios y se orienta la identificacin con las primeras
aproximaciones.
90
Ritmo Sinusal Normal Bradicardia Sinusal Taquicardia Sinusal Flter Auricular Bloqueo AV 1er Grado Bloqueo AV 2do Grado Paro Sinusal
Frecuencia 60-100 lpm Frecuencia Auricular <
60 lpm
Frecuencias auricular
100-160 lpm
Frecuencia auricular 240-
360 lpm
Frecuencia Auricular y
Ventricular normal.
Frecuencia 30-100 lpm Frecuencia Auricular
normal 60-100 lpm.
Cada complejo es
completado P, QRS, T
normales
Frecuencia Ventricular
< 60 lpm
Frecuencias
ventricular 100-180
lpm
Frecuencia ventricular
inferior a la frecuencia
auricular. (o mas baja de
lo normal)
Prolongacin constante
del intervalo PR, se
presenta en el 2% de la
poblacin adulta.
Alargamiento progresivo
de PR, hasta interrumpir
el complejo QRS.
Frecuencia
Ventricular normal.
60-100 lpm.
Ritmo Auricular y
Ventricular regular
Cada complejo es
completado P, QRS, T
normales
P puede estar oculta
por la Onda T
anterior.
Ritmo auricular regular. Ritmo Auricular y
Ventricular regular.
R-R se acortan.
Ritmo Irregular
debido a las pausas
QRS normal 60-120 ms. Ritmo Auricular y
Ventricular regular.
QRS normal 60-180
ms.
Ritmo ventricular Regular
o Irregular.(usualmente
regular).
Complejo QRS normal
entre 60-120 ms
P-P constantes. Complejo QRS
normal entre 60-120
ms.
Intervalo PR 120-200 ms. QRS normal 60-120 ms. Ritmo Auricular y
Ventricular regular.
En vez de ondas P tiene
ondas F, dientes de
sierra.
Intervalo PR anormal
mayor a 200ms
Ritmo Auricular y
Ventricular regular.
Ondas P presentes.
Ondas P < 100 ms. Ondas P < 100 ms. Ondas P presentes QRS normal 60-120 ms. Ondas P presentes. QRS normal 60-120 ms. Pausa sinusal > 2seg
No puede ser mayor que
la mitad de la longitud del
intervalo R-R, si el ritmo
es regular. Intervalo QT
de 350-420 ms.
Intervalo PR 120-200
ms.
Intervalo PR 120-200
ms.
Intervalos RR regulares a
menos que haya
alternancia en la relacin
AV (2:1 y 4:1 haciendo
que tengan una
irregularidad regular)
Ritmo Regular con
todos los QRS
precedidos por ondas
P, 1:1
Aumento progresivo del
intervalo PR hasta
producirse un bloqueo
completo de una onda P
Intervalo PR normal
120 - 200 ms
Todas las ondas P
seguidas de QRS.
Relacin P:QRS 1:1
QT 380msg a 420msg o
<50% del RR anterior.
El nodo sinusal se
activa entre 100 y
180 lpm
Relacin F:QRS puede
ser 1:1, 2:1, 3:1 etc.
(tpica la conduccin 2:1
con frecuencia ventricular
a 150 lpm.)
PR alargado > 0.20seg Frecuencia auricular 60-
200 lpm, frecuencia
ventricular 30-55 lpm.
Segmento ST, normal no
existen ondas P sobre el
Todas las ondas P
seguidas de QRS.
Relacin P:QRS 1:1
Todas las ondas P
seguidas de QRS.
Relacin P:QRS 1:1
La frecuencia ventricular
puede presentarse 60-100
lpm, con relacin P:QRS
de 2:1, 3:1, 4:1
Ritmo usualmente regular,
podra ser irregular si el
bloqueo esta variando de
2:1 a 3:1
Onda T normal, no
existen ondas P sobre l.
QT 380 a 420 msg. Complejos QRS angostos.
ST no mayor a 1mm. Intervalo PR ausente.
TABLA 6.1. Parmetros y valores que deben de ser identificados del ECG.
91
6.3 FORMA DE REPRESENTACIN DEL
CONOCIMIENTO.
En este estudio en particular el sistema experto deber tener la posibilidad de
identificar las arritmias descritas en el capitulo 5.4, donde tambin se
presentaron los parmetros y valores necesarios que deben de estar presentes
en el trazo del ECG para la identificacin de cada una de las arritmia; a
continuacin se presentan la forma de representar este conocimiento para
poder construir nuestra base de conocimientos.
6.3.1 ESCALA DE CONCEPTOS.
En esta forma de representar el conocimiento se muestra las clasificaciones de
los conceptos y sus subtipos; todas las relaciones son del tipo es un. Ej. Paro
sinusal es una bradicardia. A continuacin se presenta la escala de conceptos
para las arritmias a identificar.
FIGURA 6.3 Escala de conceptos para las arritmias a identificar.
92
6.3.2 ESCALA DE ATRIBUTOS.
Esta escala muestra todos los atributos relacionados con el estudio particular
de las arritmias cardiacas y sus posibles valores. Todos los valores de tipo
proposicional; es decir, valores que expresan o califican el contenido del
atributo se muestran como sub-nodos; esta es una manera de representar el
conocimiento de las propiedades que pueden ser asociados a un concepto.
FIGURA 6.4 Atributos y valores que se pueden obtener del ECG.
6.3.3 Proposiciones y variables.
Proposiciones y variables son las formas ms elementales e importantes sobre
las cuales se edifica el conocimiento, para lo cual las proposiciones se asocian
con un valor que expresa si el contenido de la misma se cumple o no, o si es
cierto o no, por ejemplo: ritmo regular, si o no; ondas P iguales en ancho y
largo, si o no; frecuencia normal o anormal.
93
Las variables les corresponden un valor numrico o de otro tipo dentro de un
intervalo de valores posibles que las mismas pueden tomar. Ej. Frecuencia
auricular de 70 lpm, intervalo PR de 150ms. La tabla 6.2 muestra las
proposiciones iniciales detectadas y en la tabla 6.3 las variables iniciales con
sus posibles valores, a partir de la seccin 6.2.
Proposicin. Valores.
Ritmo auricular (P-P) Regular, Irregular.
Ritmo ventricular (R-R) Regular, Irregular.
Ritmo irregular con regularidad Si, No.
Ondas P presentes Si, No.
Ondas P normales Si, No.
Ondas P diferentes ectpicas Si, No.
Onda P oculta por la onda T Si, No.
Intervalo P-R Normal, anormal.
Intervalo P-R ausente Si, No.
Ondas P seguidas de QRS Si, No.
Existen ondas ectpicas antes de
cada QRS
Si, No.
Complejo QRS normal. Si, No.
QRS sin forma Si, No.
TABLA 6.2 Proposiciones y sus respectivos valores.
Variables. Intervalo de valores posibles.
Frecuencia Auricular 30 430 lpm.
Frecuencia Ventricular 30- 430 lpm.
Onda P 60 100 msg.
Intervalo PR 80 - 200 msg.
QRS 60 120 msg.
Intervalo QT 350 420 msg.
TABLA 6.3 Variables identificadas iniciales y sus respectivos valores.
6.3.4 Diagrama de influencias.
En este mapa se muestra de manera organizada los objetos mostrados en la
escala de atributos y sus relaciones entre ellos, as como sus relaciones
dependiendo de los valores que estos pueden tomar, lo cual nos da una
claridad de las influencias que puede tener cada atributo sobre los conceptos, y
como dirigen la identificacin de cada caso. A continuacin se muestra un
diagrama para cada concepto identificado en la escala de conceptos.
94
Figura 6.5 Diagrama de influencias para el ritmo sinusal normal.
FIGURA 6.6 Bradicardia Sinusal, representado por frecuencias bajas, menores a 60 lpm.
95
FIGURA 6.7 Paro Sinusal, puede verse que sta arritmia se da cada vez que el ritmo es
irregular debido a las pausas y por la presencia de ondas P ectpicas.
FIGURA 6.8 Bloqueo AV de 1er Grado, se caracteriza por intervalo PR alargado ms de lo
normal mayor a 200ms.
96
FIGURA 6.9 Bloqueo AV de 2do Grado tipo Mobitz 1, se aprecia que la frecuencias varan
respecto del rango normal, con alargamientos progresivos del intervalo PR, presencia de ondas
P Ectpicas y relacin aurculo ventricular 2:1 o X:1.
FIGURA 6.10Taquicardia Sinusal, frecuencias anormales mayores a 100 lpm.
97
FIGURA 6.11 Flter Auricular, frecuencias anormales, mltiples ondas P normales de igual
forma y tamao, sin distancia entre ellas reemplazadas por ondas de flter F, con intervalo PR
ausente.
6.3.5 DEFINICION FORMAL DE LA BASE DE CONOCIMIENTOS.
Los diagramas de influencia mostrados en la seccin anterior, nos muestran las
relaciones existentes entre los parmetros o atributos que relacionados con la
identificacin de arritmias cardiacas, constituyen la base para el conjunto de
reglas, premisa y conclusin, que para nuestro caso es la base para definir la
estructura de dependencia.
Partimos del hecho, que cada parmetro del ECG debe de ser analizado para
cada uno de sus ciclos, por lo tanto, tendremos una matriz de valores por cada
ciclo completo del ECG; es decir, si el ECG muestra cinco ciclos, entonces
deber de obtenerse cinco mediciones de P-QRS-T entre otros.
98
Esto nos servir para poder determinar las clasificaciones de cada parmetro
reflejado en el ECG, por ejemplo: el ritmo puede ser regular o irregular pero
esto solo lo sabemos evaluando el valor medido en cada uno de los ciclos y
determinando la continuidad de ste, a lo largo del trazo, por ejemplo: en la
tabla 6.4 se muestra que despus de las mediciones realizadas, el ritmo
durante tres ciclos permaneci constante, al cuarto cayo en forma de pausa y
el quinto regreso a su ritmo normal.
TABLA 6.4 Determinacin del ritmo irregular a partir
Ritmo
No. Valor (lpm)
1 70
2 70
3 70
4 30
5 70
6 70
de los valores medidos en cada ciclo.
Por lo tanto, para la clasificacin de cada parmetro, deber de ser
considerado dentro de la red bayesiana cada uno de los valores obtenidos de
la medicin.
A continuacin se muestra la red bayesiana inicial para la representacin del
conocimiento, hay que hacer resaltar que en esta red no se muestra al final el
nombre del nodo resultante, que en nuestro caso sera cualquiera de los
conceptos de arritmias antes descritos, esto es debido a que los mismos
parmetros del ECG influyen cada uno de manera especifica sobre las
arritmias descritas, es decir unos se activan dependiendo de la evidencia en el
trazo y as se propaga sobre la red. La nomenclatura utilizada para cada uno
de los nodos se muestra a continuacin:
99
Nodo Significado
A Bradicardia Sinusal
B Paro Sinusal
C Bloqueo AV 1er Grado
D Bloqueo AV 2do Grado Mobitz 1
E Taquicardia Sinusal
F Flutter Auricular
G Taquicardia-Bradicardia
H Frecuencia auricular
I Frecuencia ventricular
J Ritmo Auricular
K Ritmo Ventricular
L Ondas P
M QRS
N PR Normal
P PR Alargado
Q Existe
R Relacin P:QRS
S Ondas F
T Segmento ST
U Intervalo QT
TABLA 6.5 Significado de los nodos utilizados en la red
100
FIGURA 6.12 Red bayesiana inicial
101
Para la identificacin de algunas de las arritmias no se utilizan todos los nodos
mostrados en la red bayesiana anterior dado que para algunas no aportan
informacin significativa para la determinacin de su estado final, dada la
evidencia; tal como se mostr en los diagramas de influencia (seccin 6.4.3);
por lo tanto para la determinacin de algunas arritmias no se esta interesado en
todas las variables del modelo. En estos casos el objetivo es obtener las
funciones de probabilidad condicionada de las variables de inters, dada la
evidencia. En esta situacin y para la identificacin de algunas arritmias, ciertas
variables pueden ser irrelevantes para el clculo de estas funciones. Por tanto
se pueden evitar operaciones innecesarias, utilizando solo el conjunto de
variables relevantes para la tarea o las identificaciones concretas a realizar.
Estas variables pueden ser eliminadas del grafo, permitiendo obtener un
modelo equivalente ms sencillo, que solo tenga los nodos relevantes.
Por ejemplo: para la identificacin de una bradicardia sinusal los nicos dos
parmetros relevantes son la frecuencia auricular y la frecuencia ventricular
(figura 6.13), por lo tanto los nodos que representan la onda P, complejo QRS,
onda T, intervalo PR, Segmento ST, e intervalo QT, pueden ser descartados
para la determinacin de una bradicardia sinusal.
FIGURA 6.13 Nodos relevantes para la identificacin de una bradicardia sinusal
Por ello, la red bayesiana propuesta considerando los nodos relevantes para
cada arritmia a identificar, se muestra en la figura 6.14.
102
FIGURA 6.14 Red bayesiana propuesta con nodos relevantes por arritmia.
Los atributos de cada nodo se utilizan como datos evidnciales para la red
bayesiana, y posteriormente como conclusiones o resultados de salida por el
sistema experto segn como estos se hayan activado. A continuacin se
muestra la informacin relacionada a cada nodo de la red.
NODO RANGO DE VALORES
Frecuencia Auricular. Alta, normal, baja.
Frecuencia Ventricular. Alta, normal, baja.
Ritmo Auricular Regular, Irregular.
Ritmo Ventricular Regular, Irregular.
Intervalo PR Ausente, normal, alargado.
PR Constante Si, No.
P_QRS 1:1, 2:1, X:1, 0:1.
Ondas P Normal, Anormal.
Segmento ST Presente, ausente.
Frecuencia. Bradicardia, normal, taquicardia.
Bloqueo AV 1er Grado Presente, Ausente.
Bloqueo AV 2do Grado Presente, Ausente.
Paro Sinusal Presente, Ausente.
Flutter Auricular Presente, Ausente.
Bradi-Taquicardia Presente, Ausente.
TABLA 6.6 Rango de valores para cada nodo de la red.
103
Por ejemplo, para la identificacin de una bradicardia sinusal o un paro sinusal,
y tomando solo los parmetros que influyen en la identificacin, se tiene que
para una persona antes de realizarse el examen de electrocardiograma tiene
una probabilidad de 0.049 de poseer bradicardia y un 0.069 de poseer un paro
sinusal, lo cual ha sido obtenido a partir del anlisis de una muestra de 50
casos
62
, tal y como se muestra en la figura 6.15.
FIGURA 6.15 Valores iniciales de la red, para la identificacin de bradicardia.
Si para el primer caso, se tiene como evidencia una frecuencia irregular
auricular debajo de 60 lpm, esto activa el nodo relacionado a la frecuencia
auricular y propaga dicha evidencia, por lo que ahora nuestra probabilidad
aumenta a 0.222, lo cual no es suficiente para indicar una bradicardia, para
esto se debe propagar la evidencia encontrada para la frecuencia ventricular; si
este tambin esta debajo de los 60 lpm, la presencia de bradicardia se activa.
62
Los casos fueron obtenidos de la distribucin de la base de datos del Hardvard-MIT Division
of Health Science and Technology disponible en http://ecg.mit.edu/
104
FIGURA 6.16 Frecuencia auricular y ventricular debajo de 60 lpm activado.
Ahora supongamos que tambin encontramos, ritmo auricular y ventricular
anormal, al propagar esta evidencia, nuestra probabilidad de tener un paro
sinusal ha aumentado a 0.58, tal y como se muestra en figura 6.17.
FIGURA 6.17 Ritmo auricular y ventricular irregular
105
Pero aun no podra considerarse como paro sinusal, puesto que tambin
pudiera ser algn tipo de bloqueo, por lo tanto al obtener la informacin del
intervalo PR que esta dentro de los lmites normales y propagar dicha
informacin se identifica el paro sinusal.
FIGURA 6.18 Propagacin del Intervalo PR, identifica un paro sinusal
106
CAPITULO VII
IMPLEMENTACIN DEL SISTEMA EXPERTO.
En el siguiente captulo se describe el desarrollo e implementacin del Sistema
Experto Bayesiano para la Identificacin de Arritmias Cardacas, como tambin
las herramientas utilizadas en la implementacin, con las cuales a partir de la
estructuracin del modelo formal, se ha podido representar e interpretar el
conocimiento del experto en un modelo que pueda ser interpretado por la
computadora a travs del sistema experto.
Se describe la estructura de los parmetros necesarios que debera ser
obtenidos del mdulo de captura de datos del electrocardiograma, para la
identificacin de arritmias cardiacas, que deberan servir como referencia para
el sistema de reconocimiento de patrones, descrito en los objetivos del sistema;
se describe tambin el funcionamiento del sistema experto, y el diagrama de
clases para la representacin de la red bayesiana, el motor de inferencia y el
modulo de explicacin.
107
7.1 SELECCIN DE LA HERRAMIENTA DE
DESARROLLO.
Se ha elegido desarrollar el sistema experto en Java dado que, los programas
desarrollados en Java presentan diversas ventajas frente a los desarrollados en
otros lenguajes como MS visual basic. La ejecucin de programas en Java
tiene muchas posibilidades: ejecucin como aplicacin independiente (Stand-
alone Application), ejecucin como applet, ejecucin como servlet, etc.. Un
applet es una aplicacin especial que se ejecuta dentro de un navegador o
browser al cargar una pgina HTML desde un servidor Web. El applet se
descarga desde el servidor y no requiere instalacin en el ordenador donde se
encuentra el navegador, lo nico que necesita el navegador es el plugin de
Java. La ejecucin como aplicacin independiente es anloga a los programas
desarrollados con otros lenguajes.
Adems de incorporar la ejecucin como Applet, Java permite fcilmente el
desarrollo tanto de arquitecturas en dos y tres capas, como de aplicaciones
distribuidas, consistentes en crear aplicaciones capaces de conectarse a otros
ordenadores y ejecutar tareas en varios ordenadores simultneamente,
repartiendo por lo tanto el trabajo. Aunque tambin otros lenguajes de
programacin permiten crear aplicaciones de este tipo, Java incorpora en su
propio API estas funcionalidades.
La implementacin en Java tiene diversas ventajas, dado que es un lenguaje
portable; un paquete de clases escrito en Java puede ser ejecutado en
plataformas Unix, Linux, Macintosh y Windows; un programa o paquete puede
ejecutarse desde pginas web, a travs del Internet, lo que puede alcanzar
ms audiencia dada la distribucin que este puede tener en Internet, y de
manera ms importante las clases desarrolladas en Java pueden ser
implementadas o reutilizadas en diversas aplicaciones, ya que estas pueden
ser importadas o crear nuevas clases que hereden atributos y mtodos de las
clases originales.
108
Los IDEs (Integrated Development Environment), tal y como su nombre indica,
son entornos de desarrollo integrados. En un mismo programa es posible
escribir el cdigo Java, compilarlo y ejecutarlo sin tener que cambiar de
aplicacin. Estos entornos integrados permiten desarrollar las aplicaciones de
forma mucho ms rpida, incorporando en muchos casos libreras con
componentes ya desarrollados, los cuales se incorporan al proyecto o
programa. El entorno de desarrollo utilizado para la creacin del sistema
experto es el NetBeans ver4.0, el cual puede ser descargado gratuitamente, del
sitio de NetBeans
63
.
Adems del desarrollo del sistema en Java, se ha elegido el uso de
documentos XML
64
para el almacenamiento e intercambio de la informacin
que se recolecta y procesa de cada ECG; tambin, la definicin de la red
bayesiana para la identificacin de las arritmias esta almacenada en un
documento XML, este entorno permite publicar documentos XML, que antes de
ser enviados al navegador, sufrirn una serie de transformaciones para
adaptarlo a los requisitos del mismo, en nuestro caso sern transformaciones
hacia HTML. Esto nos da la posibilidad de que la informacin y los resultados
de la identificacin queden disponibles para ser adaptado por otros sistemas de
administracin de consulta y expediente.
63
www.netbeans.org
64
XML significa eXtensible Markup Language, o lenguaje de anotacin extensible
109
7.2 IMPLEMENTACIN DE CLASES.
Una vez seleccionado el entorno de desarrollo, la estructuracin del sistema
experto (capitulo VI), gua la implementacin del sistema. Mientras que el
modelo especifica que har, el diseo de la implementacin nos muestra como
puede alcanzarse el comportamiento deseado, dado la base de conocimientos
y los mecanismos de inferencia.
7.2.1 CAPTURADOR DE PARMETROS DE
ELECTROCARDIOGRAMA.
Dadas las posibilidades de desarrollo en Java se eligi desarrollar un applet
para obtener los parmetros del electrocardiograma, cuyo objetivo es el de
capturar informacin relevante de la imagen de ECG, preprocesarla para
obtener nuestra evidencia y propagarla sobre la red, obteniendo los resultados
de la inferencia y su explicacin, para ello se utilizaron las libreras grficas de
Java particularmente el paquete Swing, que son clases extendidas del AWT
(Abstract Window Toolkit), con el cual se creo todo el entorno grfico del
capturador de parmetros.
Para poder cargar la imagen escaneada del ECG se creo una clase llamada
Panel I magen extendida de la clase J Label para sobrescribir los mtodos
pai nt Component y Updat e heredados de J Label y as pintar sobre la
imagen las lneas con las que se miden cada uno de los parmetros del ECG y
actualizar la imagen cada vez que se realizan estos trazos.
Para realizar el desplazamiento de la imagen hacia arriba, abajo, izquierda y
derecha se utiliz la clase J Scr ol l Pane, el cual requiere de un objeto tipo
J Panel sobre el cual hacer el desplazamiento para lo que se creo un clase
llamada Cont enedor I magen extendida de J Panel , el cual a su vez contiene
a la clase Panel I magen, as se hace el efecto de desplazamiento de la
imagen, J scr ol l Pane acta sobre Cont enedor I magen, que posee una
referencia a Panel I magen y este es quin contiene la imagen del ECG; en la
figura 7.1 se muestra el diagrama de clases.
110
FIGURA 7.1 Diagrama de clases para el capturador de parmetros del electrocardiograma.
Una vez capturada la informacin del ECG, estos se escriben en archivos XML,
para su posterior preprocesado de datos, de esta manera la informacin
capturada queda tal y como se obtuvo, as quedarn disponibles no solo para
el sistema experto, sino para cualquier otro sistema que lo necesite. A
continuacin se muestra el formato del archivo XML cuyo nombre sigue el
siguiente formato:
Ao
Hora
Mes
Dia
08212005025707AM. xml
FIGURA 7.2 Formato del nombre para los archivos XML.
111
Cada XML, inicia con la expresin <?xml version=1.0?>, esta etiqueta inicial
es seguida por cualquier definicin XML o sentencias que define el DTD
(Document Type Definition), el DTD es opcional en un archivo XML.
Todo registro comienza dentro de las etiquetas <ecg></ ecg> el cual tiene los
atributos de edad, fecha del registro, imagen, sexo posterior se abre la etiqueta
<ci cl o> el cual deber contener cada uno de los parmetros obtenidos del
ECG como Ondas P, Complejo QRS, Onda T, etc. As como se muestra a
continuacin:
<?xml ver si on=" 1. 0" encodi ng=" UTF- 8" ?>
<ecg EDAD=" 78" FECHA=" 08- 21- 2005" I MAGEN=" av2. gi f " SEXO=" Femeni no" >
<CI CLO>
<ONDAS>
<P>0. 1178571</ P>
<QRS>0. 0910714</ QRS>
<T>0. 2142857</ T>
</ ONDAS>
<I NTERVALOS>
<PR>0. 2196429</ PR>
<QT>0. 4071429</ QT>
</ I NTERVALOS>
<SEGMENTO>
<ST>0. 1232143</ ST>
</ SEGMENTO>
<FRECUENCI AS>
<AURI CULAR>
<f PP>76. 1904762</ f PP>
</ AURI CULAR>
<VENTRI CULAR>
<f RR>66. 6666667</ f RR>
</ VENTRI CULAR>
</ FRECUENCI AS>
<RI TMOS>
<AURI CULAR>
<r PP>0. 7875000</ r PP>
</ AURI CULAR>
<VENTRI CULAR>
<r RR>0. 9000000</ r RR>
</ VENTRI CULAR>
</ RI TMOS>
</ CI CLO>
</ ecg>
7.2.2 PREPROCESADO DE PARMETROS.
El preprocesado de parmetros es el encargado de preparar y transformar
cada uno de los valores obtenidos del ECG en evidencia que pueda ser
insertada en cada uno de los nodos de la red e interpretada por esta. Para esto
se creo la clase ECGpr epr ocesado el cual es instanciado desde Tr azaECG,
la figura 7.3 muestra el diagrama de clases.
112
FIGURA 7.3 Diagrama de clases para el preprocesado de parmetros y escritura XML.
113
En donde a travs de la clase Wr i t ePr eECG, se genera un XML con la
informacin del preprocesamiento, este es formateado utilizando stylesheet
transformndolo en un HTML que es lo que se presenta al usuario.
XML generado despus del preprocesamiento.
<?xml ver si on=" 1. 0" encodi ng=" UTF- 8" ?>
<ecg EDAD=" 78" FECHA=" 08- 21- 2005" I MAGEN=" av2. gi f " SEXO=" Femeni no" >
<ONDAS>
<P>Nor mal es y Anor mal es</ P>
<QRS>Nor mal </ QRS>
</ ONDAS>
<I NTERVALOS>
<PR>Se Al ar ga pr ogr esi vament e</ PR>
<QT>Nor mal </ QT>
</ I NTERVALOS>
<FRECUENCI AS>
<AURI CULAR>Nor mal </ AURI CULAR>
<VENTRI CULAR>Baj a</ VENTRI CULAR>
</ FRECUENCI AS>
<RI TMOS>
<AURI CULAR>Regul ar </ AURI CULAR>
<VENTRI CULAR>I r r egul ar </ VENTRI CULAR>
</ RI TMOS>
<P_QRS>2: 1</ P_QRS>
</ ecg>
Stylesheet utilizado para transformar el documento en HTML
<?xml ver si on=" 1. 0" encodi ng=" UTF- 8" ?>
<! - -
Document : ECGst yl e. xsl
Cr eat ed on : 6 de mar zo de 2005, 07: 17 PM
Aut hor : Nel son
Descr i pt i on:
Pur pose of t r ansf or mat i on f ol l ows.
- - >
<xsl : st yl esheet xml ns: xsl =" ht t p: / / www. w3. or g/ 1999/ XSL/ Tr ansf or m"
ver si on=" 1. 0" >
<! - - TODO cust omi ze t r ansf or mat i on r ul es
synt ax r ecommendat i on ht t p: / / www. w3. or g/ TR/ xsl t
- - >
<xsl : t empl at e mat ch=" / ecg" >
<ht ml >
<head>
<t i t l e>Pr epr ocesado de par amet r os. </ t i t l e>
</ head>
<body>
<span><f ont si ze=" 1" f ace=" Ver dana, Ar i al , Hel vet i ca, sans- ser i f " ><b>
<di v al i gn=" cent er " >
<di v al i gn=" l ef t " >
<t abl e wi dt h=" 714" bor der =" 0" >
114
<t r >
<t d></ t d>
<t d></ t d>
<t d><di v al i gn=" r i ght " >Fecha del Regi st r o: <xsl : val ue- of
sel ect =" @FECHA" / ></ di v></ t d>
</ t r >
<t r >
<t d>Edad: </ t d>
<t d><xsl : val ue- of sel ect =" @EDAD" / ></ t d>
<t d></ t d>
</ t r >
<t r >
<t d>Sexo: </ t d>
<t d><xsl : val ue- of sel ect =" @SEXO" / ></ t d>
<t d></ t d>
</ t r >
<t r >
<t d>I magen ECG: </ t d>
<t d><xsl : val ue- of sel ect =" @I MAGEN" / ></ t d>
<t d></ t d>
</ t r >
</ t abl e>
</ di v>
<p al i gn=" l ef t " >
</ p>
</ di v>
</ b></ f ont ></ span>
<di v al i gn=" cent er " cl ass=" st yl e2" ></ di v>
<t abl e wi dt h=" 487" bor der =" 0" >
<capt i on al i gn=" t op" >
<span><f ont si ze=" 2" f ace=" Ver dana, Ar i al , Hel vet i ca, sans-
ser i f " ><b> Val or es pr epr ocesados
</ b></ f ont ></ span>
</ capt i on>
<t r >
<t d wi dt h=" 158" bgcol or =" #E1EBFF" scope=" col " ><span>
<f ont si ze=" 1" f ace=" Ver dana, Ar i al , Hel vet i ca, sans-
ser i f " >Fr ecuenci a Aur i cul ar </ f ont ></ span></ t d>
<t d wi dt h=" 26" bgcol or =" #FFFFEA" scope=" col " ><span>
<f ont si ze=" 1" f ace=" Ver dana, Ar i al , Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" FRECUENCI AS/ AURI CULAR" / >
</ f ont >
</ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
Fr ecuenci a Vent r i cul ar </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span>
<f ont si ze=" 1" f ace=" Ver dana, Ar i al , Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" FRECUENCI AS/ VENTRI CULAR" / >
</ f ont >
</ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
Ri t mo Aur i cul ar </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span>
115
<f ont si ze=" 1" f ace=" Ver dana, Ar i al , Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" RI TMOS/ AURI CULAR" / >
</ f ont >
</ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
Ri t mo Vent r i cul ar </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" RI TMOS/ VENTRI CULAR" / >
</ f ont ></ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
Ondas P </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" ONDAS/ P" / >
</ f ont ></ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
Compl ej o QRS </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" ONDAS/ QRS" / >
</ f ont ></ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
Rel aci on P: QRS </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" P_QRS" / >
</ f ont ></ span></ t d>
</ t r >
<t r >
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
I nt er val o PR </ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span cl ass=" st yl e17" ><f ont si ze=" 1"
f ace=" Ver dana, Ar i al , Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" I NTERVALOS/ PR" / >
</ f ont ></ span></ t d>
</ t r >
<t r >
116
<t d bgcol or =" #E1EBFF" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
I nt er val o QT</ f ont ></ span></ t d>
<t d bgcol or =" #FFFFEA" ><span><f ont si ze=" 1" f ace=" Ver dana, Ar i al ,
Hel vet i ca, sans- ser i f " >
<xsl : val ue- of sel ect =" I NTERVALOS/ QT" / >
</ f ont ></ span></ t d>
</ t r >
</ t abl e>
<p></ p>
</ body>
</ ht ml >
</ xsl : t empl at e>
</ xsl : st yl esheet >
7.2.3 LA BASE DE CONOCIMIENTOS.
La base de conocimientos de nuestro sistema es la red bayesiana, para lo cual
se utilizaron las clases del paquete JavaBayes, el cual es una herramienta para
la creacin y manipulacin de redes bayesianas, compuesto por una serie de
parsers
65
que permiten la lectura de redes en diversos formatos, uno de ellos
XML y un motor responsable de la manipulacin de las estructuras de datos
que representan la red, y el cual puede producir la probabilidad marginal para
cualquier nodo de la red.
Se utilizan los paquetes InterchangeFormat y Parsers, para poder leer y
manipular una red bayesiana escrita en XML, este formato esta definido dentro
de una serie de etiquetas que se describen a continuacin.
La primera etiqueta con la que inicia la representacin es <BIF> (Bayesian
Interchange Format) y se cierran con </BIF>; toda la informacin de la red est
contenida dentro de estas dos etiquetas.
Una red esta definida por su nombre, seguido de una serie de propiedades
opcionales, nodos de la red y las distribuciones de probabilidad. Por ejemplo, si
observamos el caso simple para la determinacin de la frecuencia, el
documento sera de la siguiente manera:
65
Parse: Dividir la representacin de la informacin en pequeos componentes que puede ser
posteriormente analizados. Por Ejemplo, un Parse para una oracin podra involucrar el dividir
la oracin en palabras y frases e identificar el tipo de componente (verbo, adjetivo, pronombre,
etc.)
117
<?xml ver si on=" 1. 0" encodi ng=" US- ASCI I " ?>
<! - - DTD f or t he XMLBI F 0. 3 f or mat - - >
<! DOCTYPE BI F [
<! ELEMENT BI F ( NETWORK ) *>
<! ATTLI ST BI F VERSI ON CDATA #REQUI RED>
<! ELEMENT NETWORK ( NAME, ( PROPERTY | VARI ABLE | DEFI NI TI ON ) * ) >
<! ELEMENT NAME ( #PCDATA) >
<! ELEMENT VARI ABLE ( NAME, ( OUTCOME | PROPERTY ) * ) >
<! ATTLI ST VARI ABLE TYPE ( nat ur e| deci si on| ut i l i t y) " nat ur e" >
<! ELEMENT OUTCOME ( #PCDATA) >
<! ELEMENT DEFI NI TI ON ( FOR | GI VEN | TABLE | PROPERTY ) * >
<! ELEMENT FOR ( #PCDATA) >
<! ELEMENT GI VEN ( #PCDATA) >
<! ELEMENT TABLE ( #PCDATA) >
<! ELEMENT PROPERTY ( #PCDATA) >
] >
<BI F VERSI ON=" 0. 3" >
<NETWORK>
<NAME>ECGBayes</ NAME>
El atributo versin en la etiqueta BIF es obligatorio; posterior esta la etiqueta
NETWORK y el nombre de la red (etiqueta NAME).
Los nodos estn definidos por su nombre el tipo y sus propiedades opcionales:
<! - - Var i abl es - - >
<VARI ABLE TYPE=" nat ur e" >
<NAME>f r ecuenci a_aur i cul ar </ NAME>
<OUTCOME>al t a</ OUTCOME>
<OUTCOME>nor mal </ OUTCOME>
<OUTCOME>baj a</ OUTCOME>
<PROPERTY>posi t i on = ( 335, 66) </ PROPERTY>
</ VARI ABLE>
<VARI ABLE TYPE=" nat ur e" >
<NAME>f r ecuenci a_vent r i cul ar </ NAME>
<OUTCOME>al t a</ OUTCOME>
<OUTCOME>nor mal </ OUTCOME>
<OUTCOME>baj a</ OUTCOME>
<PROPERTY>posi t i on = ( 477, 25) </ PROPERTY>
</ VARI ABLE>
<VARI ABLE TYPE=" nat ur e" >
<NAME>f r ecuenci a</ NAME>
<OUTCOME>br adi car di a</ OUTCOME>
<OUTCOME>nor mal </ OUTCOME>
<OUTCOME>t aqui car di a</ OUTCOME>
<PROPERTY>expl anat i on br adi car di a</ PROPERTY>
<PROPERTY>posi t i on = ( 395, 292) </ PROPERTY>
</ VARI ABLE>
118
El contenido del atributo TYPE de la etiqueta VARIABLE puede tomar los
valores nature, decision, utility. En nuestro caso particular, no utilizamos nodos
de decisin y funciones de utilidad por lo tanto siempre veremos en los
documentos nodos tipo nature. La etiqueta NAME define el nombre del nodo,
OUTCOME, indica los posibles valores que el nodo puede tomar y las
propiedades opcionales, la idea de las propiedades es almacenar informacin
especfica, til para un sistema en particular.
La distribucin de probabilidad para cada nodo se representa dentro del
documento, de la siguiente manera:
<DEFI NI TI ON>
<FOR>f r ecuenci a_aur i cul ar </ FOR>
<TABLE>0. 222 0. 556 0. 222 </ TABLE>
</ DEFI NI TI ON>
<DEFI NI TI ON>
<FOR>f r ecuenci a_vent r i cul ar </ FOR>
<TABLE>0. 222 0. 556 0. 222 </ TABLE>
</ DEFI NI TI ON>
<DEFI NI TI ON>
<FOR>f r ecuenci a</ FOR>
<GI VEN>f r ecuenci a_aur i cul ar </ GI VEN>
<GI VEN>f r ecuenci a_vent r i cul ar </ GI VEN>
<TABLE>0. 0 0. 0 1. 0 0. 0 0. 35 0. 65 0. 25 0. 5 0. 25 0. 0 0. 35 0. 65 0. 0
1. 0 0. 0 0. 65 0. 35 0. 0 0. 25 0. 5 0. 25 0. 65 0. 35 0. 0 1. 0 0. 0 0. 0 </ TABLE>
</ DEFI NI TI ON>
La etiqueta TABLE es especfica del bloque DEFINITION, el cual es usado para
definir la topologa de la red, por la especificacin de las tablas de probabilidad
condicional. Por ejemplo el nodo frecuencia_auricular es un nodo sin padres
cuya distribucin de probabilidad est definida dentro de la etiqueta TABLE;
para el caso del nodo frecuencia se definen las etiquetas GIVEN dentro de las
cuales se indica cada uno de los nodos padres, se mostrarn tantas etiquetas
GIVEN como nodos padres tenga el nodo que se est definiendo. El cuerpo de
la etiqueta TABLE es una secuencia de nmeros reales no negativos
representando la distribucin de probabilidad dados los padres y los posibles
valores del nodo.
El documento que representa la red bayesiana completa se puede consultar en
el apartado de anexos; en la figura 7.4 se muestra el diagrama de clases para
la base de conocimientos.
119
FIGURA 7.4 Diagrama de clases para la base de conocimiento.
120
7.2.4 EL MOTOR DE INFERENCIA.
Habiendo implementado las clases para almacenar la base de conocimiento y
cargar esta en la memoria de trabajo, el siguiente paso es la implementacin
del motor de inferencia que utilizar el sistema, cuya funcin es la de propagar
la evidencia obtenida del capturador de parmetros; para esto se cre una
clase llamada i nf er enci aECG, la cual utiliza las clases I nf er enceGr aph,
I nf er enceGr aphNode, Quasi BayesNet , Pr obabi l i t yFunct i on,
Di scr et eVar i abl e, QBI nf er ence.
Las relaciones entre los nodos evidnciales, intermedios y los nodos objetivos
viene dada por la representacin de estos en la red bayesiana, por lo que el
motor de inferencia, recibe cada uno de los parmetros preprocesados con
ECGpr epr ocesado, cuyos valores resultantes son los atributos que cada nodo
puede tener; es decir, de cada uno de los atributo-valor que puede tener un
nodo evidencial, el preprocesado devuelve al motor de inferencia uno de estos
atributo-valor capturados del ECG, para que sean propagados sobre la red
instanciando cada uno de ellos en su respectivo nodo; posteriormente se
calculan las probabilidades marginales de cada nodo objetivo dada la evidencia
para posteriormente ser analizados y explicados por el subsistema de
explicacin.
El algoritmo de propagacin utilizado es el de propagacin en poliarboles,
descrito en la seccion 4.4, cuya implementacin se encuentra dentro del
paquete Bayesi anI nf er ences en la clase Bucket Tr ee. El diagrama de
clases para el motor de inferencia se presenta en la figura 7.5
121
FIGURA 7.5 Diagrama de clases para el motor de inferencia.
122
7.2.5 SUBSISTEMA DE EXPLICACION.
El subsistema de explicacin es el encargado de generar el informe final con
los resultados de la propagacin de la evidencia, su funcin es mostrar la
arritmia identificada por el sistema experto, dar un breve descripcin de sta,
explicar como se logr la identificacin, describiendo la lectura del trazo, as
como de manera general las causas probables, sntomas y tratamiento.
Para tal funcin se creo la clase Wr i t eI nt er pr et ado, que es llamado desde
Tr azaECG, y utiliza i nf er enci aECG, para conocer los resultados de la
inferencia, as tambin recibe como parmetro una referencia a
ECGpr epr ocesado, para describir la lectura del trazo. El diagrama de clases
se muestra en la figura 7.6
FIGURA 7.6 Diagrama de clases para el subsistema de explicacin.
123
7.3 INTERFAZ DE USUARIO.
El sistema es cargado a travs del navegador el cual carga una pgina inicial
conteniendo el applet de java utilizado para capturar los parmetros del
electrocardiograma, el cual tambin es el encargado de cargar la imagen del
ECG previamente escaneado, mostrndolo en pantalla y que acta como un
editor de imagen, sobre el cual se realizan diferentes trazos para la valoracin
de cada onda, segmento e intervalo, y as capturar la matriz de parmetros de
entrada que necesitan ser preprocesados obteniendo evidencia para ser
propagada e inferir un resultado. Tal y como se muestra en la figura 7.7 y 7.8.
FIGURA 7.7 Sistema Experto Bayesiano, Modulo de captura de datos del electrocardiograma.
124
FIGURA 7.8 Sistema Experto Bayesiano, Modulo de identificacin de parmetros del ECG.
Una vez capturados los parmetros del ECG, se genera una matriz con los
datos obtenidos tal y como se describi en la seccin 7.2.1, transformados en
un HTML tal y como se muestra en la figura 7.9.
FIGURA 7.9 Sistema Experto Bayesiano, parmetros obtenidos del ECG.
125
Por lo tanto, al obtener los valores de cada parmetro estos son
preprocesados, y posteriormente son propagados sobre la red, de la cual se
logre la identificacin de las arritmias, el preprocesado de la informacin se
muestra de en la figura 7.10
FIGURA 7.10 Valores preprocesados despus de capturar los parmetros.
El informe final es la identificacin de la arritmia y la interpretacin de los datos
que influyeron en la identificacin.
Adems de manera general se describe las causas probables que conlleva a la
arritmia identificada, as como, sntomas que se pueden encontrar en el
paciente y un posible tratamiento, hay que resaltar que esto puede variar
dependiendo del historial clnico del paciente.
126
Fecha del Registro: 08-21-2005
Edad: 78
Sexo: Femenino
Imagen ECG: av2.gif
Interpretacin del trazo
El trazo corresponde a un Bloqueo AV de 2 , Mobitz I, llamado tambin Fenmeno de
Wenckebach, se caracteriza por un alargamiento progresivo del intervalo PR hasta que
un impulso se bloquea y hay ausencia de un complejo QRS.
Lectura
Paciente femenina de 78 aos de edad con frecuencia auricular mayor a la ventricular
dentro de los lmites normales; ritmo auricular normal y ventricular irregular.
Onda P normal en tamao y configuracin.
Intervalo PR se alarga con cada ciclo, hasta que se produce una onda P no seguida por
un complejo QRS. Relacin P:QRS 2:1
Complejo QRS dentro de los lmites normales.
Segmento ST normal en tamao y configuracin
Segmento QT normal.
Causas Probables
Infarto miocardio de la pared inferior, Intoxicacin con digital, Fiebre Reumtica aguda
(transitoria), Desequilibrio de electrolitos (transitorio), Estimulacin vagal (transitorio),
Tratamiento con quinina o procainamida (transitorio).
Sntomas que puede encontrar en este paciente.
En general sin sntomas, pero puede haber hipotensin y sncope si disminuye la
frecuencia ventricular.
Tratamiento
Ningn tratamiento es necesario para la mayora de pacientes, si el paciente est
sintomtico, puede recurrirse a la atropina o a la implantacin de un marcapaso
temporal, se recomienda vigilar a los pacientes por la posible progresin a un grado
mayor de bloqueo AV.
Valores encontrados
Frecuencia Auricular Normal
Frecuencia Ventricular Baja
Ritmo Auricular Regular
Ritmo Ventricular Irregular
Ondas P Normales y Anormales
Complejo QRS Normal
Relacin P:QRS 2:1
Intervalo PR Se Alarga progresivamente
Intervalo QT Normal
127
CAPITULO VIII
VALIDACIN DE RESULTADOS.
La construccin de un sistema experto quedara incompleta si no se realizara
una evaluacin del programa resultante. En este captulo se muestra una
descripcin de la evaluacin realizada, as como los resultados obtenidos.
8.1 MTODO DE EVALUACIN.
Para la evaluacin de verificacin, validacin y aceptacin del sistema experto
se utiliz el mtodo del cuestionario.
un cuestionario con 15 preguntas cerradas es decir limitadas de respuestas
posibles; 5 preguntas abiertas y comentarios del experto al final de cada
segmento de preguntas; tanto para las preguntas cerradas como para las
preguntas abiertas al formularlas se tuvo cuidado de no predisponer al usuario
experto a dar una respuesta concreta.
En la evaluacin se encontr la limitacin de la disponibilidad de los expertos
dispuestos a colaborar por la disponibilidad de tiempo del que disponen.
En la evaluacin de la interfaz del sistema experto se cargaron
electrocardiogramas de las diferentes arritmias que identifica el sistema,
adems de otras que no fuesen identificables. Los electrocardiogramas fueron
cargados de pacientes reales, de referencias bibliogrficas y referencias de
Internet.
A continuacin se presenta el formato del cuestionario que se presento para la
evaluacin del sistema:
Cuestionario sobre SISTEMA EXPERTO ARRITMIAS CARDIACAS
A. Modelo cardiolgico
1. Considera que los datos e interpretaciones que incluye el modelo son suficientes para
identificar las arritmias consideras en este sistema.
Suficientes 1. 2. 3. 4. 5. Insuficientes
128
a. Comentarios:_________
B. Interfaz
Nos referimos al sistema de pantallas y mens, etc.
2.. Es fcil de aprender?
Fcil 1. 2. 3. 4. 5. Difcil
3.. Es cmodo y agradable de manejar?
Cmodo 1. 2. 3. 4. 5. Engorroso
4. La interaccin con el programa es flexible o se siente forzado/a por el?
Flexible 1. 2. 3. 4. 5. Forzado/a
5. Cmo le parece la presentacin de datos y resultados?
Clara 1. 2. 3. 4. 5. Confusa
6. La ayuda que ofrece el sistema para su manejo es suficiente
Suficiente 1. 2. 3. 4. 5. Insuficiente
b. Comentarios:_____________
C. Explicacin
7. Considera tiles las explicaciones y grficas incluidas en el programa de las ondas e
intervalos.
tiles 1. 2. 3. 4. 5. Intiles
8. Le parecen suficientes
Suficientes 1. 2. 3. 4. 5. Insuficientes
9. Son fciles de comprender
Comprensibles 1. 2. 3. 4. 5. Complicadas
c. Comentarios:_____________
D. Interpretacin
10. En general es correcto la interpretacin que ofrece el programa
Correcto 1. 2. 3. 4. 5. Incorrecto
11. Le parece til que el programa realice una interpretacin
til 1. 2. 3. 4. 5.Intil
d. Comentarios:______________
E. Informe
129
12. Es correcto en su contenido
Correcto 1. 2. 3. 4. 5. Incorrecto
13. Es adecuada la forma de presentar las conclusiones
Adecuada 1. 2. 3. 4. 5. Inadecuada
e. Comentarios sobre el informe:________________________
F. Comentarios generales
14. Valoracin general del programa
Positiva 1. 2. 3. 4. 5. Negativa
15. Considera que el informe que realiza un programa como ste, ayudar a los
usuarios a aprender la lectura e interpretacin de los parmetros de un
electrocardiograma as como las arritmias cardacas cargadas en su base de datos.
S 1. 2. 3. 4. 5. No
16. Por qu?
17. Que es lo que ms le ha gustado del sistema?
18. Y lo que menos le ha gustado o le ha decepcionado?
19. Que hay que aadir a al sistema?
20. Hay algo que suprimir?
21. Otros comentarios sugerencias opiniones
8.2 RESULTADOS OBTENIDOS.
Para la evaluacin del sistema experto se cont con dos cardilogos, un
ingeniero experto en electrocardiografa y un tcnico en cardioritmo. Cuatro
personas en total.
Los resultados de las evaluaciones se presentan como una valoracin en
conjunto, as como tambin comentarios individuales que se tomaron en cuenta
para validacin final del sistema:
A. Modelo Cardiolgico
El sistema demostr que los datos que incluye en su modelo son los
suficientemente necesarios para interpretar una arritmia en un
electrocardiograma. Y aunque en uno de los comentarios se dijo que hay una
130
gran variedad de arritmias cardiaca con diversos grados de complejidad, las
arritmias que interpreta el electrocardiograma cumple con los datos necesarios
para identificarlas.
Todos coincidieron en comentar y/o sugerir ampliar la base de datos con ms
desordenes de conduccin cardiaca (arritmias).
Debemos mencionarse tambin que la limitacin de tiempo por parte de las
personas evaluadas fue un factor negativo para el cuestionario, as como
tambin la pequea muestra de usuarios expertos evaluados (disponibilidad) al
no proporcionar y dedicar tiempo.
B. Interfaz
El sistema de pantallas y men les pareci fcil de aprender, pero al contrario
la captura de parmetros del ECG les pareci un tanto engorroso, y muy
incomoda de manejar para la toma de estos valores; cabe aclarar que los
encuestados son expertos humanos que posiblemente solo con una
observacin pueden deducir los resultados del estudio; y el sistema est
pensado para personas que comienzan el estudio de interpretacin de un
electrocardiograma.
En la interaccin con el programa les pareci flexible, y clara la presentacin de
los datos. Comentarios apunta a que la tabla Parmetros obtenidos del ECG
proporciona valores muy exactos, y que por separado no son utilizables en la
historia clnica del paciente. Pero que las conclusiones del preprocesado e
interpretacin de sta, son herramientas buenas para tomar de base como gua
para la realizacin de historias clnicas de pacientes con las arritmias
identificables u otras arritmias.
La ayuda que ofrece el sistema en su manejo ha recibido una calificacin muy
positiva.
C. Explicacin
Los mdicos han apreciado notablemente la utilidad de las explicaciones en
especial la presentacin de los intervalos correspondientes a cada parmetro,
as como fcilmente comprensibles. Sin embargo ser deseable que el
programa ofreciera explicaciones que incluyera un poco ms los antecedentes
131
del paciente, si es o fue fumador, si es deportista, si esta en un proceso de
infarto, etc.
Debe comprenderse que las limitaciones para tener acceso al expediente de un
paciente son grandes y que el sistema podra incluirlos y mejorar sus
conclusiones si se le brindara ms apoyo al desarrollo de stos proyectos.
D. Interpretacin
En general el sistema ha generado una interpretacin correcta, el experto ha
comentado la inquietud de que la interfaz este directamente colocada con la
captura del electrocardiograma en estudio y no sea solamente una imagen,
adems casi todos coincidieron positivamente en que la utilidad del sistema,
sera mejor para personas que comienzan el estudio de la lectura e
interpretacin de electrocardiogramas; mientras que a uno les parece intil
dado que el mdico ya ha extrado sus conclusiones mientras realizaba el
electrocardiograma, talvez por que l es un experto.
E. Informe
Dentro del funcionamiento del sistema en este aspecto que ha producido en su
informe un contenido correcto y con conclusiones adecuadas, un informe en
que los datos e interpretaciones aparecen de forma ordenada concisa y
completa.
F. Comentarios Finales
La valoracin general del sistema ha sido bastante positiva, los cuestionarios
que han contestado mostraron ms comentarios positivos manifestando el
inters de presentar el sistema con estudiantes y las cualidades que este tiene
sobre todo que gua al usuario en la identificacin de arritmias. Uno de los
encuestados seala como virtud del sistema la objetividad y otro las futuras
posibilidades de desarrollo. Entre las deficiencias que los usuarios
mencionaron fue la captura de parmetros, ciertamente la captura de estos
valores es de los aspectos que debe ser mejorado o introducido en nuevos
proyectos a implementar, teniendo ya esto como base. Tal y como se presento
en la idealizacin del sistema en el que debera existiera un sistema de
reconocimiento de patrones, analizador de seales o visin artificial.
132
8.3 VALIDACIN DEL SISTEMA.
Para la validacin de resultados del sistema experto se realizaron 12 muestras
con expertos humanos y se compararon los resultados contra los del sistema
experto, de la siguiente manera.
No Experto humano Sistema Experto.
1 Bradicardia con frecuencia de 55
lpm, en derivacin V6
Bradicardia con frecuencia de 57
lpm, en derivacin V6.
2 Ritmo sinusal norma en derivacin
en aVf y V3.
Ritmo sinusal normal, frecuencia
de 73 lpm. En aVf y V3
4 Ritmo sinusal norma en derivacin
en II.
Ritmo sinusa con frecuencia de 61
lpm, en derivacin II
5 Bradicardia con frecuencia de 40
lpm, en derivacin II y V6
Bradicardia con frecuencia de 44
lpm, en derivacin II y frecuencia
de 46 lpm en V6
6 Taquicardia con frecuencia de 110
lpm, en derivacin aVf y V1
Taquicardia con frecuencia de 104
lpm, en derivacin aVf y V1.
7 Taquicardia con frecuencia de 115
lpm, en derivacin II y aVf
Taquicardia con frecuencia de
125lpm, en derivacin II y
frecuencia de 117lpm en V1
8 Bradicardia con frecuencia de 50
lpm, en derivacin aVf y V1
Bradicardia con frecuencia de 53
lpm, en derivacin aVf y con
frecuencia de 51 lpm, en V1
9 Ritmo sinusal norma en derivacin
en V6.
Ritmo sinusal norma en derivacin
en V6 con frecuencia de 86 lpm.
10 Bradicardia con frecuencia de 50
lpm, en derivacin V3 y V6
Pausa sinusal con frecuencia de
49 en v3 y Bradicardia sinusal con
frecuencia de 51 en V6.
11 Bloqueo AV 1er Grado en II y V6 Bloqueo AV 1er Grado con
frecuencia de 69 en II y 65 en V6
12 Pausa sinusal en II y aVf Pausa sinusal en II con frecuencia
de 62 y bradicardia con frecuencia
de 59 en aVf.
13 Taquicardia con frecuencia de 110
lpm, en derivacin V1 y V6
Taquicardia con frecuencia de
105lpm, en derivacin V1 y
frecuencia de 106 lpm en V6.
Tabla 8.1 Validacin de resultados del sistema experto.
De la tabla anterior se puede concluir que el sistema experto, logr la
identificacin de las arritmias con un porcentaje de acierto del 84.6%, las fallas
en los aciertos es debido a las diferentes vistas y caractersticas que en cada
derivacin se muestra.
133
CAPITULO IX
CONCLUSIONES Y RECOMENDACIONES.
9.1 CONCLUSIONES.
En el desarrollo del Sistema Experto, se estudio la forma de representar el
conocimiento en un rea de especializacin dada a travs de redes
bayesianas, as como, de los algoritmos de inferencia para obtener resultados
o conclusiones a partir de una muestra de datos. La caracterstica principal del
sistema experto es que no est basado en reglas, sino en un modelo
probabilstico.
La principal ventaja frente a otros modelos alternativos de representacin del
conocimiento, es su base probabilstica, en las cuales se indica qu
probabilidades son necesarias, cmo debe de obtenerse y cmo han de
combinarse, para el tratamiento de la incertidumbre; a diferencia de los
sistemas basados en reglas, factores de certeza o inferencia difusa.
Otra ventaja de la utilizacin de modelos probabilsticos es el empleo del
razonamiento causal, lo cual permite tres tipos de razonamiento: abductivo (de
los efectos a las causas), deductivo o predictivo (de las causas a los efectos) e
intercausal (entre dos causas del mismo efecto). Dicho de otra manera, son
capaces de obtener todas y nicamente las inferencias que estn justificadas;
en cambio en los sistemas basados en reglas sea que utilicen factores de
certeza o lgica difusa, solo admiten un solo tipo de inferencia, de los hallazgos
hacia las hiptesis.
Aunque las redes bayesianas pueden trabajar con interpretaciones subjetivas
de la probabilidad; de manera personal, sera deseable utilizar probabilidades
objetivas procedentes de estudios epidemiolgicos. Solo en caso de no existir
estudios estadsticos, se debera de recurrir a la estimacin subjetiva de las
probabilidades que los expertos humanos pueden ofrecer.
134
Uno de los obstculos que se encontraron desde el inicio para la aplicacin de
modelos probabilsticos al sistema experto, es la dificultad para construir las
redes, a partir de los datos, dada la escasez de bases de datos completas,
como la carencia de conocimiento en el dominio de aplicacin, lo cual dificulta
la construccin con la ayuda de expertos humanos.
El desarrollo de este tipo de sistemas es una tarea muy compleja, dada la poca
disponibilidad de tiempo por parte de los expertos.
El sistema proporciona una forma sencilla y eficiente de almacenar la
informacin de casos, lo que permite su posterior anlisis, distribucin y
estudio.
9.2 RECOMENDACIONES.
Para una estimacin ms precisa de los valores inferidos, se deberan de
estudiar los mtodos de aprendizaje bayesiano para, poder obtener datos
objetivos a partir de una base de datos, sin necesidad de obtenerlos de manera
subjetiva del experto humano.
Incorporar la posibilidad de realizar el preprocesado de la informacin a travs
de mtodos de lgica difusa. Esto por su capacidad de procesar datos de
entrada expresados verbalmente y con incertidumbre.
Siguiendo las observaciones por los expertos sera deseable ampliar la base de
arritmias que el sistema debera de poder identificar.
Para la captura de parmetros a partir de la imagen del electrocardiograma,
resulta recomendable que estas imgenes, sean cargadas en el sistema con al
menos 3 complejos completos (P-QRS-T), para minimizar el error en la
obtencin de los datos y maximizar el anlisis de los parmetros por el
preprocesado de estos.
135
El monitoreo cardiaco mediante una sola derivacin aunque es prctico y
conveniente, no basta; se recomienda analizar hasta 3 derivaciones del ECG,
la seleccin de estas derivaciones estar individualizada de acuerdo al perfil
cardiaco del paciente, pero de manera general se recomienda el uso de las
derivaciones II, V1, V6 y/o aVf.
Las imgenes de los trazos a analizar deben de mostrar la calibracin del
electrocardigrafo, esto con la finalidad de conocer sobre cuales condiciones
tcnicas fueron tomadas las lecturas del ECG.
Resultara interesante poder omitir el capturador de parmetros del ECG, por
un sistema que analice la seal del ECG y del cual se obtengan los parmetros
que necesita el motor de inferencia para la identificacin de arritmias, para ello
resulta interesante el trabajo realizado por Gretchen Kleisinger, Eduardo del
Valle y Jorge Monzn. Deteccin de Parmetros Electrocardiogrficos con
Modelos SOM y LVQ de Redes Neuronales.
Las caractersticas mnimas sobre las cuales el sistema experto puede ser
ejecutado son las siguientes:
Hardware Software
Procesador 800 Mhz o superior Internet Explorer v6.0
Memoria RAM 128Mb Java Plugin ver 1.4.01 o
superior
Almacenamiento en
Disco
8 MB + el espacio en disco
para cada imagen.
JRE 1.4.02 (Java
Runtime Enviroment) o
Superior.
136
GLOSARIO
Arritmias: Cualquier variacin del ritmo normal del latido cardiaco, que
incluye arritmia sinusal, extrasstole, bloqueo cardiaco, fibrilacin auricular,
aleteo auricular, pulso alternante y taquicardia paroxstica.
Bloqueo AV de 1er Grado: Es un trastorno de la conduccin en que los
impulsos elctricos pasan normalmente desde el nodo SA a travs de las
aurculas, pero se retardan en el nodo AV.
Bradicardias: Lentitud del latido cardiaco, que se manifiesta por
disminucin de la frecuencia del pulso, a menos de 60.
Bradicardia sinusal: Es una disritmia con frecuencia sinusal inferior a 60
latidos por minuto en la cual todos los impulsos provienen del nodo sinusal.
Complejo QRS: Indican la despolarizacin ventricular en una variedad de
situaciones clnicas en que hay alteraciones en los tejidos cardacos.
Derivacin: Es una ilustracin grfica de la diferencia de potencial elctrico
entre dos puntos sobre la superficie cutnea, que se transmite por el
corazn durante el ciclo cardaco.
Electrocardiograma: Trazado grfico de las corrientes elctricas
producidas por la accin del msculo cardaco, y que se descubre en la
superficie corporal. Abreviatura, ECG o EKG.
Fisiologa: Ciencia que trata sobre el funcionamiento del organismo y sus
partes, de los factores fsicos y qumicos y los procesos involucrados.
Fisiopatologa: Desordenes en el funcionamiento de los organismos y sus
partes.
137
Flter Auricular: Es una disritmia auricular caracterizada por una
frecuencia auricular rpida, de 250 a 350 latidos por minuto, que se debe a
impulsos ectpicos o conduccin de reingreso.
Gasto cardiaco: Volumen de sangre expulsado por cualquier ventrculo por
minuto.
Inteligencia Artificial: Es la parte de la Ciencia que se ocupa del diseo de
sistemas de computacin inteligentes, es decir, sistemas que exhiben las
caractersticas que asociamos a la inteligencia en el comportamiento
humano que se refiere a la comprensin del lenguaje, el aprendizaje, el
razonamiento, la resolucin de problemas, etc.
Intervalo P-R: Representa el tiempo que tarda un impulso para llegar a las
fibras de Purkinje cuando se origina en un sitio distinto al nodo SA o cuando
se retarda al pasar por el nodo AV.
Intervalo Q-T: Representa la sstole elctrica. Es el tiempo que tarda el
ventrculo en despolarizarse y repolarizarse.
Isquemia: dficit localizado de irrigacin causado por constriccin u
obstruccin de un vaso sanguneo en una zona determinada.
Morfologa: Es la ciencia de las formas y estructuras de los organismos; la
forma y estructura de rganos y sus partes.
Onda P: Representa la despolarizacin auricular; indica el tiempo necesario
para que un impulso elctrico se origine ya sea en el nodo SA o tejido
auricular y se transmita por el miocardio de las aurculas derecha e
izquierda.
Onda T: Refleja la repolarizacin ventricular del sistema de Purkinje o son
causadas por un potencial posterior al comienzo de la distole en una
variedad de situaciones clnicas que afectan al tejido ventricular.
138
Paro Sinusal: Pausa en el ritmo cardiaco que depende de insuficiencia
pasajera de nodo sinusal, que no inicia un impulso.
Redes bayesianas: Es un grafo dirigido acclico conexo ms una
distribucin de probabilidad sobre sus variables, que cumplen la propiedad
de separacin direccional.
Regla: Una regla es una afirmacin lgica que relaciona dos o ms objetos
e incluye dos partes, la premisa y la conclusin. Cada una de estas partes
consiste en una expresin lgica con una o ms afirmaciones objeto-valor
conectados mediante operadores lgicos.
Segmento S-T: Representa un cambio entre el final de la despolarizacin
ventricular y el comienzo de la repolarizacin ventricular.
Sistema Experto: Se define como un sistema informtico (hardware y
software) que simula a los expertos humanos en un rea de especializacin
dada.
Taqui-bradicardia: Es una disritmia grave del nodo SA en que se combinan
varias alteraciones del nodo SA, como bradicardia sinusal o sndrome de
braditaquicardia, paro sinusal, bloqueo sino auricular, paro auricular,
taquicardias supraventriculares, fibrilacin auricular, asistolia transitoria y
raras veces flter auricular.
Taquicardias: Rapidez excesiva en la actividad cardiaca; el trmino suele
aplicarse a una frecuencia cardiaca mayor de 100 lpm; puede considerarse
auricular, nodal o ventricular y paroxstica.
Taquicardia sinusal: Es una disritmia con frecuencia sinusal superior a la
normal entre 100 y 160 latidos por minuto.
139
Taquicardia Ventricular: Es la sucesin de ms de tres extrasstoles
ventriculares que ocurren con una frecuencia superior a 100 por minuto.
Puede ser breve o sostenida. No existe ninguna relacin entre la actividad
auricular y la ventricular; el gasto cardiaco puede disminuir
considerablemente.
140
FUENTES DE INFORMACION.
A. REFERENCIAS BIBLIOGRAFICAS
[1] J.A. Gmez y J.M. Puerta. Sistemas Expertos Probabilsticos,
Coleccin Ciencia y Tcnica, vol. 20. Ediciones de la Universidad de
Castilla-La Mancha. Cuenca, 1998.
[2] E. Castillo, J. M. Gutirrez y A. S. Hadi. Expert Systems and Probalistic
network models. Springer-Verlag, New York, 1997.
[3] Heckerman, D. A tutorial on learning Bayesian networks. MSR-TR-95-
06, Microsoft Press, Redmond, W.A. U.S.A. 1995
[4] Francisco Javier Dez. Introduccin al Razonamiento Aproximado.
Primera Edicin. Universidad de Castilla-La Mancha, Cuenca, Espaa 1998.
[5] Dr. Mario Testelli. ECG Interpretacin Clnica; Facultad de Medicina,
Universidad Nacional Autnoma de Mxico. Editorial El Manual Moderno,
S.A. de C.V. Mxico, D.F.
[6] Dr. Fernando Cabrera Bueno, Dr. J.A. Rivero Guerrero. Diagnstico y
Manejo de las Arritmias; Hospital Universitario Virgen de la Victoria,
Campus Universitario de Teatinos. Malaga.
[7] Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas
Reinartz, Colin Shearer, and Rdiger Wirth, CRISP-DM 1.0 Step by Step
data mining guide.
[8] Carl M. Cadie, David Hovel, Eric Horvitz, MSBNx: A component-Centric
Toolkit for Modeling and Inference with Bayesian Networks. Technical
report MSR-TR-2001-67.
141
[9] F. Martinez, M.C. Daz, M.T. Martin, V.M. Rivas, L.A. Urea. Aplicacin
de redes neuronales y redes bayesianas en la deteccin de multipalabras
para tareas IR. Universidad de Jan, Espaa.
[10] Hector Javier Ruidas, Diego Alberto Godoy. Navegacin inteligente de
un material educativo mediante redes bayesianas y XML.
B. REVISTAS ELECTRONICAS.
[11] www2.texaschildrenshospital.org/internetarticles/uploadedfiles/104.pdf
Texas Childrens Hospital, Necesidad de un marcapasos. USA, ultima
revisin 23/09/2004.
[12] http://www.seh-lelha.org/bayes1.htm; Asociacin de la sociedad
espaola de hipertensin. Lus M. Molinero, El Mtodo bayesiano en la
investigacin mdica. Espaa, ltima revisin 23/09/2004.
[13] http://www.geocities.com/siliconvalley/bay/4183/rrbb01.pdf; Ing. Jos
Esteban Saavedra Lpez, Fundamentos de redes bayesianas. Bolivia,
ltima revisin 23/09/2004.
[14] http://dns1.mor.itesm.mx/~emorales/Cursos/RdeC/node139.html
Ing. Guillermo Morales, Razonamiento con incertidumbre.
Mxico, ltima revisin 23/09/2004.
[15] http://www.ijcai-03.org/~fcantu/datamining/clasificador-bayesiano.ppt
Francisco J. Cantu, Centro de inteligencia artificial, Redes Bayesianas:
Inferencias, Aprendizaje y Aplicaciones.
Espaa, ltima revisin 23/09/2004
[16] http://ecg.mit.edu/
Distribucin de la base de datos del Hardvard-MIT Division of Health
Science and Technology.
142
UNIVERSIDAD DON BOSCO
FACULTAD DE INGENIERA
ESCUELA DE INGENIERA EN CIENCIAS DE LA COMPUTACIN
Tenga usted buen da, soy estudiantes de la Universidad Don Bosco y estoy solicitando su
colaboracin para llenar la presente encuesta, con la esperamos recavar informacin
acerca de la forma en la cual ustedes hacen lectura del trazo del electrocardiograma y la
manera en la cual se determina el diagnstico. De antemano le agradecemos su
colaboracin.
1. Cuales son los parmetros ms importantes que se obtienen del
electrocardiograma?
2. El trazo y la lectura del electrocardiograma tiene reglas especiales?
3. Cul es la manera habitual de leer el electrocardiograma?
4. La lectura de electrocardiogramas que realizan de manera habitual es siempre
fiable?
5. Todos los mdicos pueden diagnosticar males cardacos con solo ver el trazo de
un electrocardiograma?
6. Cmo mdico cardilogo puede prescindir de una segunda opinin para el
diagnstico de enfermedades del corazn?
7. Qu clases de enfermedades pueden determinarse a partir de la lectura del
electrocardiograma?
8. Cules son las arritmias ms importantes que pueden diagnosticarse a partir del
electrocardiograma?
9. Para que sirve determinar las arritmias?
10. En base a la lectura y los valores que se obtienen del electrocardiograma como se
van descartando las enfermedades, hasta determinar una especfica?
11. Existe algn tipo equipo mdico o software especializado que sirva como
herramienta para validar o tener un diagnstico ms preciso?
12. Si existe alguna herramienta que facilite el diagnstico, Se cuenta con estas
herramientas en los centros hospitalarios?
Muchas gracias por su colaboracin.
A N E X O A
ENTREVISTA 1
ING. ATILIO BOLAOS
ESPECIALISTA EN CARDIORITMO Y CATETERISMO CARDIACO.
OBJETIVO: Conocer los conceptos bsicos de la actividad normal y anormal del corazn.
Qu es el corazn y cul es su objetivo principal?
El corazn es un rgano muscular que bombea sangre a todas las clulas del cuerpo,
esto lo hace por medio de un sistema complejo de cuatro cmaras (aurcula derecha,
aurcula izquierda, ventrculo derecho y ventrculo izquierdo), vlvulas (tricspide, mitral,
pulmonar y artica), arterias y venas que ayudan a distribuirla a todo el cuerpo.
El corazn contrae esas cuatro cmaras por un sistema de conduccin elctrico, que se
distribuye a lo largo de todo el corazn.
Cul es sistemas de conduccin y qu es lo que hace cada uno sus componentes?
Bueno, impulso elctrico se inicia en la aurcula derecha en el marcapaso natural del
cuerpo llamado Nodo SA, que normalmente descarga impulsos elctricos a razn de 60 a
100 veces por minuto. Este manda el impluso al nodo AV que constituye la unin a travs
de la cual normalmente pasan los impulsos antes de ser conducidos a los ventrculos. De
ste pasa al Has de His que es un grupo de de fibras especializadas que desciende por el
tabique interventicular a las Ramas de haces que se dividen en dos ranas, que se
denominan rama de haces izquierda y derecha. Y finaliza en las Fibras de Purkinje, fibras
que estn adheridas al miocardio ventricular.
Que es el Gasto Cardaco?
El Gastos cadicaco se refiere a un termino de cantidad de sangre expulsada por el
ventrculo izquierdo en minutos.
Que es electrocardiografa?
La electrografa es el estudio de las actividad elctrica del corazn, estas ondas son
captadas por un equipo llamado electrocardigrafo a travs de electrodos adheridos al
cuerpo. En este estudio podemos ver varias vistas del corazn que son llamadas
derivaciones hay 12 derivaciones cada una nos da una vista diferente del corazn. Con
este estudio podemos ver anomalias en la conduccin elctrica, adems de isquemias o
infartos.
Que diferencias existen entre un electrocardiograma, un holter y una prueba de
esfuerzo?
La base del estudio es la misma, la actividad elctrica del corazn a travs de un
electrocardiograma.
La diferencia es que un electrocardiograma normal, es en el que se toman las 12
derivaciones aproximadamente 15 segundos, es rpido y el paciente esta en reposo al
momento de la prueba. El Holter en el que se monitoriza al paciente 24 horas, cuando
est caminando, dormido, actividad diaria. La prueba de esfuerzo es el estudio
electrocardiogrfico en una banda sin fin, con diferentes tipo de velocidad monitorizando
al paciente.
Cada una de estas diferentes pruebas nos proporcionan o corroboran datos de
enfermedades de conduccin o formacin del impulso, incompetencias cronotrpicas, asi
como anginas, infartos o algn tipo de distrofias del corazn.
Qu son las Arritmias Cardacas?
La arritmias como su nombre lo indica son enfermedades del ritmo, el nodo SA dispara
generalmente entre 60 a 100 veces por minuto, fuera de ste rango nos encontramos en
presencia de una arritmia en el caso de frecuencias debajo de 60 latido por minuto en una
bradicardia y arriba de 100 latidos por minuto en una taquicardia. Las arritmias cardiacas
son enfermedades con las cuales el organismo no alcanza a cubrir su gasto cardiaco
quiere decir que no alcanza a oxigenar todas las clulas del cuerpo, el paciente puede
presentar desmayos, sncope, cansancio, sueo, no puede realizar ninguna actividad
fsica que requiera de un mayor esfuerzo fsico.
Es igual el ritmo y la frecuencia?
Son variable dependientes una de la otra, pero no es lo mismo, el ritmo es la constante
continuidad de los segmentos y ondas en electrocardiograma, y la frecuencia es la
distancia a la que se disparan cada una de ellas. Por ejemplo puede haber un ritmo
constante pero con una frecuencia demasiado baja o ritmos anormales con frecuencias
normales.
En una arritmia es importante observar las diferentes derivaciones del
electrocadiograma?
En una arritmia lo primero que nos indica que estamos en presencia de una es la
frecuencia, la falta de alguna onda o segmento, por lo que si solo queremos ver arritmias
no esta importante las derivaciones, stas la utilizamos en su mayora para determinar
anginas de pecho e infartos.
Qu es Bradicardia y Taquicardia?
Bradicardia es un ritmo cardaco ms bajo que lo normal y la taquicardia es un ritmo
cardaco ms alto de lo normal.
Qu parmetros, ondas o segmentos se observan en un electrocardiograma?
En un electrocardiograma observamos la ondas P, Q, R, S y T, y se miden segmentos
como el segmento PR, el segmento QRS, el ST y QT, y se determinar la presencia o
ausencia de stas, las distancia entre las ondas y cada segmentos. A travs de estos
datos nosotros aprobamos la normalidad del electrocardiograma.
Que clasificaciones se le da a la frecuencia dependiendo de sus valores medidos?
La frecuencia tiene relacin con el ritmo, si la frecuencia es normal el ritmo es normal, ya
sea una frecuencia <60 o mayor a 100 el ritmo puede ser normal.
Si la frecuencia es anormal, el ritmo ser anormal. Ejemplo: Si tenemos una frecuencia
normal y de pronto existe una pausa el ritmo ya no es constantes es decir anormal, de
igual manera con el sndrome del bradi-taqui en donde aparentemente observaremos
ritmos anormales aunque aparezcan segmentos de ritmos normales.
La frecuencia puede ser normal de 60 a 100, anormal fuera del intervalo 60 y 100 con
ritmo regular y anormal con ritmo irregular.
Que clasificaciones se le da al ritmo de pediendo de sus valores medidos?
El ritmo puede ser regular e irregular
Nota: Se finaliz entrevista por falta de tiempo del ingeniero.
A N E X O B
ENTREVISTA 2
DR. ORLANDO CABRERA CANDRAY
CARDIOCENTRO
OBJETIVO: Aclarar y profundizar conocimientos en el estudio de las arritmias cardiacas,
as como la evaluacin e identificacin que hace el experto humano.
Que ondas, segmentos y/o intervalos pueden estudiarse un electrocardiograma?
En un electrocardiograma normal tenemos la onda P, Q, R, S T y a veces U, los
intervalos mas importantes son el PR, ORS y el QT, tambin el ST, algunos libros lo
toman en cuento otros no, uno como cardilogo le interesa ms que todo la elevacin o
depresin en esos intervalos.
Que relaciones o que clasificaciones podemos sacar de la onda P
resumiendo de explicacin de mdico
Normal cuando es disparada del nodo sinusal a 60 lpm que es el marcapaso natural del
corazn.
Anormal cuando es disparado de un nodo ectpico, que puede disparar a diferentes
frecuencias
Existe o No existen ondas P, esto tambin se verifica con la relacin aurcula- ventricular
P:QRS
Como identificamos su normalidad?
Las P siempre tienen un ancho determinado cuando son disparados de un nodo sinusal;
cuando son disparados de un nodo ectpico las P son ms pequeas, disparadas a
diferente frecuencia generalmente diferentes a las del nodo sinusal.
Que relaciones o que clasificaciones podemos sacar del complejo QRS?
El QRS se refiere a la despolarizacin de ambos ventrculos y podemos tener un:
QRS normal de 0.08-0.12
QRS ancho >a 0.12
QRS estrecho <0.08
Podemos observar malas contracciones de los ventrculos, a stas se les llama
EXTRASISTOLES, y se caracterizan por ser un QRS ancho y deforme. Aqu no hay un
buen bombeo de la sangre y puede desprenderse cogulos pudiendo causar embolias o
infartos en el peor de los casos.
Porqu se caracteriza la secuencia de P:QRS?
Siempre en un ciclo de conduccin elctrica debe de aparecer las ondas P-QRS-T, la
onda P que es el impulso generado normalmente del nodo sinusal (nodo SA) y que
dispara aproximadamente entre 60 y 100 veces por minuto, que se trasmite al nodo AV
(Atrioventricular) y que genera la contraccin de los ventrculos que es el segmento QRS
y su repolarizacin que es la onda T, de aqu que por norma siempre debe de haber una
onda P seguida del QRS, con sto se ve la normalidad del trazo y si no cumple con esto
que hay una anormalidad.
Qu pasa si hay mas P que QRS?
Hay algn tipo d bloqueo, al atravesar el nodo sinusal (SA) al nodo AV.
1:1 Normal
2:1 Bloqueo 2
3:1 Bloqueo AV completo
para que medimos el intervalo PR y segn sus valores como lo podemos clasificar?
Siempre debe de ser de 120 a 200 ms, esto es lo normal. Si este es alargado o se va
alargando en cada ciclo nos indica que existe un bloqueo AV de Primer, Segundo grado o
bloqueo AV completo (tercer grado).
Tambin si es demasiado corto podemos estar en presencia de el sndrome de Woft
Parkinson White, que provocar una onda delta y representa un estimulo prematuro por
parte del tabique o del nodo sinusal.
Si no existe estamos en presencia de un fluter, talvez y si es alargado tenemos algn
tipo de bloqueo , esto depender de sumar todas las condiciones de las ondas.
Para que medimos el intervalo QT y segn sus valores como lo podemos clasificar?
Desaparece cuando hay una fibrilacin, pero generalmente nos hace referencia a que
sino est sobre la lnea basal o isoelctrica nos indica un infarto, isquemia o aneurisma en
alguna zona del corazn. Esto tambin depende de los sntomas y presiones arteriales
que maneje el paciente.
Cules son los pasos que sigue para la lectura del un electrocardiograma?
1. Lo primero medir frecuencia.
2. Se revisa el ritmo .
3. Medir el PR en cada intervalos para revisar si est alargado (hay algn tipo de
bloqueo), o corto
4. Observar si cada P es igual. En largo y amplitud.
5. Medir RR de los ciclos para confirmar si el ritmo esta bueno.
6. Ancho de QRS para si hay algun tipo de bloqueo de ramo o infarto.
7. Revisar si hay un P:QRS:T para saber si mi ritmo esta completo.
8. Medir QT para ver la despolarizacin de los ventrculos y algn tipo de infarto.
9. Si esta isoelctrico o hay alguna deflexin (elevacin o depresin de ST) para verificar
algn tipo de infarto.
Que medimos con la frecuencia con QRS
si esta debajo de 60 lpm entonces hay una bradicardia.
si esta entre 60 y 100 entonces es normal
si esta arriba de 100 entonces hay una taquicardia.
Medir el ritmo (regular, irregular).
Si al medir el ritmo de cada ciclo encontramos uno que baja y luego regresa al mismo
valor podemos pensar en una pausa 70-70-70-30-30-70-70. entonces es un ritmo
irregular.
Si el ritmo de nodo SA sigue una frecuencia de 150-150-150-50-50-50-150-150-15-50-50-
50 podemos pensar en una bradi/taqui., y observamos un ritmo irregular.
Al Medir ondas P. deben ser iguales en amplitud y largo, Si hay una P diferente despus
de una pausa, provienen de un nodo ectpico, no viene del nodo sinusal,. Si no vienen
del nodo sinusal pueden disparar a diferentes frecuencias.
SI se dispara del nodo normal ectopico normal hay un problema con el nodo sinusal.
Si el nodo sinusal dispara y otros tambin y son conducidas se daran varias ondas P
que cambian en ondas F, el cual seria un fluter o fibrilacin auricular.
Al Medir PR. Si esta entre el intervalo normal (3 cuadritos) es un intervalo PR normal y
tienen que se iguales en todos los ciclos. Si en todos los ciclos el PR esta mas largo de
lo normal y es constante el alargamiento en cada ciclo entonces podemos pensar en un
bloqueo de primer grado.
Si PR en el 1er intervalo es normal, en el 2do mayor a lo normal, 3er mayor a lo normal y
al 2do, incluso hasta desaparecer un QRS es decir dos P luego un QRS y se repite
norma, entonces pensamos en un bloqueo de 2do grado Mobitz 1.
Si hay dos P y un QRS en todos los ciclos tenemos un bloqueo de 2do grado Mobitz II.
Si PR es menor al rango normal y con el comienzo de un QRS en forma de J , es Wolf
Parkinson White.
Si tengo 3 P y un QRS o un QRS sin P entonces es un bloqueo de 3er grado.
Al Medir QRS. Si un QRS es ancho entonces. Y con elevaciones distintas o dos picos
vemos un bloqueo de rama que puede ser izquierda o derecha.
Si es angosto entonces fibrilacin auricular o flutter. O talvez taquicardia auricular.
Nota: Se tomo lo ms relevante de las notas de la entrevista para fijar parmetros,
conocimientos y reglas de un experto humano en nuestro estudio, el Dr. Cabrera me
seguir apoyando a lo largo del estudio
UNIVERSIDAD DON BOSCO
FACULTAD DE INGENIERA
Cuestionario De Evaluacin del Sistema Experto
INTERPRETACION DE ARRITMIAS CARDIACAS
OBJETIVO: Evaluar los diferentes aspectos contenidos en el sistema, con lo cual se
obtenga una retroalimentacin, que ayude a encontrar reas de oportunidad para mejorar
el sistema experto.
A. Modelo cardiolgico
1. Considera que los datos e interpretaciones que incluye el modelo son suficientes para
identificar las arritmias consideradas en este sistema.
Suficientes 1. 2. 3. 4. 5. Insuficientes
a. Comentarios
_______________________________________________________________________
_______________________________________________________________________
_______________________________________________________________________
___
B. Interfaz
Nos referimos al sistema de pantallas mens, etc.
2. Es fcil de aprender?
Fcil 1. 2. 3. 4. 5. Difcil
3. Es cmodo y agradable de manejar?
Cmodo 1. 2. 3. 4. 5. Engorroso
4. La interaccin con el programa es flexible o se siente forzado/a por el?
Flexible 1. 2. 3. 4. 5. Forzado/a
5. Cmo le parece la presentacin de datos y resultados?
Clara 1. 2. 3. 4. 5. Confusa
6. La ayuda que ofrece el sistema para su manejo es suficiente
Suficiente 1. 2. 3. 4. 5. Insuficiente
b. Comentarios:
_______________________________________________________________________
_______________________________________________________________________
__
C. Explicacin
7. Considera tiles las explicaciones y grficas incluidas en el programa de las ondas e
intervalos.
tiles 1. 2. 3. 4. 5. Intiles
8. Le parecen suficientes
Suficientes 1. 2. 3. 4. 5. Insuficientes
9. Son fciles de comprender
Comprensibles 1. 2. 3. 4. 5. Complicadas
c. Comentarios:_____________
D. Interpretacin
10. En general es correcto la interpretacin que ofrece el programa
Correcto 1. 2. 3. 4. 5. Incorrecto
11. Le parece til que el programa realice una interpretacin
til 1. 2. 3. 4. 5.Intil
d. Comentarios:
_______________________________________________________________________
_______________________________________________________________________
__
E. Informe
12. Es correcto en su contenido
Correcto 1. 2. 3. 4. 5. Incorrecto
13. Es adecuada la forma de presentar las conclusiones
Adecuada 1. 2. 3. 4. 5. Inadecuada
e. Comentarios sobre el informe :
_______________________________________________________________________
_______________________________________________________________________
__
________________________________________________________________________
F. Comentarios generales
14. Valoracin general del programa
Positiva 1. 2. 3. 4. 5. Negativa
15. Considera que el informe que realiza un programa como ste, ayudar a los usuarios
a aprender la lectura e interpretacin de los parmetros de un electrocardiograma asi
como las arritmias cardacas cargadas en su base de datos.
S 1. 2. 3. 4. 5. No
16. Por qu?
_______________________________________________________________________
_______________________________________________________________________
__
17. Que es lo que ms le ha gustado del sistema?
_______________________________________________________________________
_______________________________________________________________________
__
18. Y lo que menos le ha gustado o le ha decepcionado?
_______________________________________________________________________
_______________________________________________________________________
__
19. Que hay que aadir a al sistema?
_______________________________________________________________________
_______________________________________________________________________
__
20. Hay algo que suprimir?
_______________________________________________________________________
_______________________________________________________________________
__
21. Otros comentarios sugerencias opiniones
_______________________________________________________________________
_______________________________________________________________________
__