These A SANCHEZSANTANA Mariaaydee 2014
These A SANCHEZSANTANA Mariaaydee 2014
These A SANCHEZSANTANA Mariaaydee 2014
médicales
Maria Aydée Sanchez Santana
N◦ 1 0 h
Unité de Recherche :
Institut FEMTO-ST/DISC UMR CNRS 6174
Je tiens ici à remercier toutes les personnes proches qui ont fait que ces travaux de thèse
ont pu être menés à bien. C’est un tel plaisir d’écrire ces remerciements envers tant de
personnes qui m’ont soutenue tout au long de ces trois années.
Au-delà de la formalité d’usage, c’est avec un grand plaisir que je remercie les membres
de mon jury :
Monsieur Jean-Christophe Lapayre, mon directeur de thèse, et Madame Marie-Laure
Betbeder, ma co-directrice de thèse, pour avoir cru en moi et m’avoir donné l’opportunité
de réaliser cette thèse au sein de votre équipe malgré la distance qui nous séparait
à la base. Grâce à vous, j’ai pu découvrir un nouveau domaine scientifique que sont les
ontologies qui font le lien entre l’informatique et la médecine, mais également un nouveau
pays et une nouvelle culture.
Monsieur Philippe Roose et Monsieur Mohand-Said Hacid qui m’ont fait l’honneur de rap-
porter ma thèse ainsi que pour les retours que vous m’avez fait. Et Monsieur Christophe
Nicolle pour avoir accepté de faire partie de mon jury et pour l’ensemble de ses conseils
techniques ainsi que pour son expertise.
Le Docteur Jaime Carranza Madrigal pour avoir bien voulu être membre de mon jury
malgré le décalage horaire et l’obligation de se réveiller très tôt (ou de se coucher très
tard) et pour m’avoir donné son point de vue de médecin sur le travail réalisé et fourni une
validation de la partie médicale de mes travaux, en collaboration avec le Docteur Sonia
Maria López Contreras et le Radiologue Fernando Sánchez Contreras.
Je tiens également à remercier chaleureusement :
L’ensemble des membres du département informatique pour leur accueil. Et plus parti-
culièrement mes collègues et amis doctorants et docteurs : Rami et Oscar pour avoir
été mes premiers amis au laboratoire et pour m’avoir offert votre amitié inconditionnelle.
Merci à la TEAM des doctorants : Sébastien, Aloı̈s, Alban, Hadrien, Jean-Marie, Romain
et les autres, pour votre amitié, votre aide avec le français et vos conseils, ainsi que
pour l’ambiance quotidienne. Je les remercie pour leurs encouragements et leur bonne
humeur.
Ma famille, et en particulier mes parents, à qui je souhaite adresse un immense merci
pour leur soutien tout au long de ma vie, leurs enseignements et leur confiance.
Enfin, j’adresse une mention toute particulière à Cédric, mon compagnon, qui m’a donné
plus que son amour. Il a su me soutenir tout au long de ces 3 années de thèse et a su me
motiver chaque jour pour écrire et finir ce manuscrit à temps. Merci pour m’avoir toujours
soutenue dans mes choix, pour nos discussions sans fin, pour regarder dans le même
direction que moi et bien plus encore. . .
S OMMAIRE
Introduction 13
Introduction générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Plan du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Quelques indications pour la lecture de ce rapport . . . . . . . . . . . . . . . . . 17
I État de l’art 19
1 Télé-applications collaboratives 23
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.1 Le travail collaboratif et les collecticiels . . . . . . . . . . . . . . . . . . . . . 24
1.1.1 Modèle fonctionnel des environnements collaboratifs . . . . . . . . . 26
1.1.2 Les modes de fonctionnement en collaboration . . . . . . . . . . . . 27
1.2 Le cloud computing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3 Télé-applications pour la médecine . . . . . . . . . . . . . . . . . . . . . . . 29
1.3.1 Une croissance exponentielle depuis 2010 . . . . . . . . . . . . . . 29
1.3.2 organisation collaborative des applications de santé . . . . . . . . . 31
1.3.3 Aspect médico-légal . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
II Contribution 69
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.1 Cycle de vie des ontologies . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2 Validation des ontologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.2.1 Interactions avec les experts . . . . . . . . . . . . . . . . . . . . . . 136
5.2.2 Types de validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.3 Modifications des ontologies . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.4 Premiers tests de COOVADIS . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Bibliographie 161
C ONTEXTE DE LA TH ÈSE
Concernant les données manipulées au cours des diagnostics médicaux, pour nos re-
cherches nous avons focalisé sur la manipulation d’images médicales en format DICOM
(Digital Imaging and Communication in Medicine) qui est la norme mondiale pour les
données d’images médicales. Il existe un modèle d’information, basé sur DICOM, pour
permettre à la communauté de créer des bases d’archivage médicales qui soient in-
teropérables : par exemple les serveurs PACS (Picture Archiving and Communication
System).
Ces serveurs ont des capacités de stockage très conséquentes : on trouve couramment
dans les hôpitaux des serveurs de plus de 20 Terabytes. Pour un seul patient, le nombre
et la taille des données sont déjà très importants. Par expérience lors de l’utilisation du lo-
giciel CovotemT M au sein des hôpitaux, nous avons pu observer qu’un CT SCAN Cérébral
peut représenter 570 Mo, ou bien qu’une IRM peut représenter 100 Mo. Des dossiers
médicaux peuvent atteindre, s’ils combinent plusieurs données d’imagerie, une taille de
l’ordre du Gigaoctet : 1.2 Go pour un dossier traité en RCP (réunions de concertation
pluridisciplinaire), 3 Mo pour la dermatologie, 100 Mo pour la neurologie, plus de 500 Mo
en cardiologie, . . .
La manipulation des dossiers devient alors très rapidement très coûteuse, et donc plus
particulièrement la traçabilité des manipulations est très lourde. L’objectif de cette Thèse
est donc de trouver des moyens de l’optimiser. Et nous avons ainsi orienté nos recherches
vers le domaine des ontologies.
Les ontologies sont devenues très populaires dans plusieurs domaines de recherche : les
ontologies encodent un domaine de connaissances en une description formelle. Cette
connaissance offre différentes possibilités de raisonnements, lexiques et sémantiques qui
ne sont pas offerts par les bases des données. Les ontologies sont employées dans l’in-
telligence artificielle, le Web sémantique, la génie logiciel, l’informatique biomédicale ou
encore l’architecture de l’information comme une forme de représentation de la connais-
sance d’un monde ou d’une certaine partie de ce monde, . . .
Dans ce travail, nous avons souhaité utiliser les ontologies, non seulement afin d’optimi-
ser la recherche d’informations pertinentes dans les diagnostics, mais également pour
ajouter des paramètres d’ontologie supplémentaires (temporels) permettant la traçabilité.
Nous proposons de développer des ontologies dédiées à DICOM qui permettront d’unifier
et de rendre explicite l’ensemble des entités et des relations clés dans DICOM, dans un
format à la fois utilisable pour l’homme et interprétable par la machine. La création d’un
SOMMAIRE 15
P LAN DU M ÉMOIRE
Comme le montre la présentation du contexte (Fig. 1), cette Thèse s’inscrit à la frontière
de trois domaines : deux informatiques dont relèvent ces travaux de recherche (le travail
collaboratif❶ et les ontologies❷) et un médical ❶ qui est le fond applicatif des travaux.
Dans la première partie de ce mémoire, nous présentons les états de l’art qui ont été
nécessaires à la mise en place de ce travail : travail collaboratif (télé-applications) et
ontologies.
Dans un premier chapitre, nous mettons en avant les évolutions qui ont eu lieu ces
dernières années du point de vue des télé-applications collaboratives, de leur architec-
ture, en focalisant plus particulièrement sur les télé-applications dans le domaine de la
médecine.
Le seconde chapitre est consacré à l’état de l’art des ontologies, tout d’abord d’un point
de vue général (méthodes de conception, outils et langages) puis plus spécifiquement
dans le domaine médical. Pour terminer, les dernières sections de ce chapitre exposent
deux points essentiels qui sont le cycle de vie des ontologies et leur évaluation.
implémentées en mode SaaS (Software as a Service) sous la forme d’un serveur WEB,
et validées d’un point vue théorique et avec un test en milieu clinique.
Dans le troisième chapitre, nous définissons les trois ontologies essentielles pour
développer la traçabilité des diagnostics dans le domaine cardiovasculaire : tout d’abord
les deux ontologies liées au domaine vasculaire (ontologie du système vasculaire, et on-
tologie du diagnostic), puis l’ontologie de traçabilité.
Puis nous définissons dans le chapitre 4 notre nouvelle plateforme COOVADIS COlla-
bOrative VAscular DIagnoSis créée autour de ces trois ontologies. Développée en mode
SaaS Software as a Service, elle permet de suivre et de tracer les diagnostics élaborés
par un staff de médecins sur un patient atteint d’une pathologie cardiovasculaire, offrant
ainsi la traçabilité des actes.
Le dernier chapitre de cette partie expose les aspects validation théorique, ainsi qu’une
validation par un essai en milieu clinique. Nous présentons également les premiers
résultats expérimentaux obtenus à l’aide de notre plateforme.
Nous pouvons préciser que dans cette partie nous présentons un cas réel ≪ Mr J. ≫ sur
lequel des diagnostics ont été réalisés (deux Accidents Vasculaires Cérébraux succes-
sifs, et le suivi du patient). Ce patient anonyme est notre fil rouge et permet de montrer
sur un cas concret et complet l’intérêt de notre plateforme dans le suivi et la traçabilité de
l’acte médical.
SOMMAIRE 17
Le plan est organisé sur quatre niveaux : Parties, Chapitres, Sections et Sous-Sections.
Il est utile de savoir que la Partie II, présentant les contributions et résultats, est
indépendante de la première Partie.
Les résultats de nos travaux ont pour la plupart été publiés. La liste des publications
personnelles est donnée avant la bibliographie placée en fin du document.
I
É TAT DE L’ ART
I NTRODUCTION
Ce sujet de Thèse se situe à la croisée de plusieurs domaines de recherche dont les deux
plus importants sont les applications distribuées pour le télé-diagnostic et les ontologies.
Avec le développement fulgurant des réseaux (réseaux Wifi, 3G, 4G,. . . ), la puissance
des nouveaux processeurs, et la banalisation des périphériques audio et vidéo (tout or-
dinateur portable possède maintenant ≪ obligatoirement ≫ une webcam, un micro et un
haut-parleur), la production d’outils de communication pour favoriser les échanges à dis-
tance a explosé.
Les outils grand public comme Skype, Oovoo par exemple, permettent des échanges au-
dio et vidéo, mais ils demeurent incomplets et peu fiables : pas de garantie de qualité de
service, peu ou pas de partage de données (ou partage de données mais sans garan-
tie de cohérence par exemple), pas de tolérance aux pannes, pas d’adaptabilité, pas de
traçabilité,. . .
Depuis les années 2000 environ, différentes communautés de recherches se sont
fédérées autour du CSCW (Computer Supported Collaborative Work). Ce domaine,
malgré tout encore très récent, regroupe des chercheurs issus de l’informatique dis-
tribuée, des sciences humaines, de la sociologie de l’ethnologie, de l’ergonomie, . . .
Dans ce domaine très large, on peut distinguer les télé-applications collaboratives qui
sont des outils de travail à distance pour lesquels il faut offrir des services et des outils
garantissant la cohérence du travail à distance, l’awareness (outils permettant la prise
de conscience des autres pour favoriser les interactions distantes), des interfaces dis-
tribuées, des outils d’adaptabilité, . . .
L’équipe dans laquelle les travaux de cette thèse ont été menés étudie plus parti-
culièrement l’algorithmique distribuée pour les télé-applications de diagnostic médical
à distance : appelée télé-diagnostic médical. Et l’un des nouveaux challenges est la
traçabilité. En effet, l’aspect médico-légal est très important et notamment lors d’erreur
de diagnostic, il est donc nécessaire de pouvoir tracer, de manière fiable et facilement
exploitable, le travail de chaque acteur du travail collaboratif de télé-diagnostic.
Les masses de données dans ce domaine sont très importantes : la taille d’un dossier
peut représenter de quelques méga octets (tomographie pour la neurologie par exemple)
à quelques Gigaoctets (pour une mammographie par exemple une coupe représente
50 Mo) voire même de l’ordre du Téraoctet (en microscopie, une série de coupes peut
représenter 1 To). Lorsque ces masses de données sont manipulées, partagées, . . . il
devient rapidement très lourd et coûteux de tracer le diagnostic. Il nous est apparu que
l’utilisation des ontologies nous permettrait un stockage et une restitution d’information
performants et pertinents.
Comme nous le verrons dans la suite de ce document une ontologie, dans le do-
maine de l’ingénierie des connaissances, est une spécification formelle, explicite d’une
conceptualisation partagée [Stu98]. Dans le domaine médical, l’ontologie est à la
22
frontière des sciences de l’information et des sciences médicales, et elle vise à uni-
fier la compréhension des mécanismes d’interprétation et de raisonnement médical. Par
exemple, grâce à l’utilisation de l’ontologie, lors d’un diagnostic médical le langage et les
concepts utilisés pour écrire le compte rendu de l’acte ne varient pas (ou peu de manière
acceptable) d’un praticien à un autre. Dans notre cas, la conceptualisation partagée est
l’acte médical, et si le langage et les concepts utilisés sont suffisamment formels et ex-
plicites, la recherche d’information, par exemple pour la traçabilité, sera performante et
pertinente.
L’état de l’art qui suit est donc logiquement articulé en deux sections. La première
présente l’état de l’art des télé-applications collaboratives et en particulier des appli-
cations de télé-diagnostic médical. Ces applications distribuées de nouvelle génération
nécessitent de respecter certaines contraintes en terme de sécurité, de cohérence des
données, de sûreté . . . . Notons que cette Thèse ne propose pas de contribution dans le
domaine de la collaboration, mais les ontologies, qui seront proposées, seront intégrées
à un serveur de collaboration.
Dans le domaine médical en particulier, mais pas uniquement dans ce domaine, il est
nécessaire de pouvoir tracer les actions effectuées par les différents acteurs dans le
système collaboratif, et c’est dans ce contexte émergeant que s’inscrivent les travaux de
cette Thèse. Pour tracer il est nécessaire de bien définir la structure des informations
de traçage, et ainsi la deuxième section étudie l’état de l’art des ontologies plus parti-
culièrement utilisées dans le domaine médical. Notre démarche a été descendante : nous
sommes partis de l’état de l’art assez large des ontologies pour ensuite donner les ca-
ractéristiques et les spécifications des ontologies dédiées au monde médical. Pour finir
cette section nous étudions la notion de temps dans les ontologies : pour tracer un diag-
nostic collaboratif, il faut structurer l’information mais également la dater pour ordonner
les actions de diagnostic. En effet, pour des pathologies ≪ dites lourdes ≫ (de type car-
diovasculaire par exemple), différents examens sont nécessaires et même pour un seul
examen plusieurs médecins peuvent intervenir à quelques heures, minutes ou secondes
près, et il est important d’ordonner ces interventions afin de suivre la démarche diagnos-
tique à des fins médico-légales ou d’enseignement par exemple. Ainsi, nous présentons
les ontologies et les modélisations, issues de la littérature, qui permettent de tenir compte
de la temporalité.
1
T ÉL É - APPLICATIONS COLLABORATIVES
Les travaux relatifs à cette Thèse ne sont pas directement rattachés, en terme de contri-
bution scientifique, au travail collaboratif. Ce domaine est le cadre global puisqu’il s’agit
d’utiliser les ontologies afin de faciliter la traçabilité dans les téléapplications collabora-
tives.
Il était donc important, avant d’aborder l’état de l’art principal de ce document sur les
ontologies, d’étudier au préalable les applications collaboratives.
I NTRODUCTION
Dans cette section nous caractérisons la collaboration et le travail collaboratif, puis nous
dégageons un ensemble de concepts génériques de ce domaine.
Les environnements collaboratifs sont basés sur les échanges cohérents des données
[LeM04]. Pour bien situer le domaine de la collaboration (Figure 1.1 ❶), nous allons
tout d’abord définir un domaine plus vaste qui est celui du CSCW (Computer Supported
Cooperative Work Figure 1.1 ❷).
Le terme anglo-saxon CSCW représente un domaine de recherche pluridisciplinaire qui
existait depuis les années 90 mais qui a vraiment émergé au début des années 2000. Il
s’intéresse au travail en groupe, aux outils et aux supports permettant d’assister ce travail
de groupe [Jac06]. Il ne s’agit pas seulement de prendre en compte les interactions qu’un
individu peut avoir avec un ordinateur mais également les échanges entre les personnes
(ou les agents) via un système informatique.
Le CSCW est un domaine pluridisciplinaire dans lequel interviennent, tout d’abord, des
recherches provenant des sciences humaines :
• Psychologie :
Cette discipline étudie les répercussions liées à l’utilisation d’un logiciel collaboratif au
sein d’un groupe.
• Linguistique :
Ce domaine étudie la sémantique des informations échangées. Par exemple pour
des solveurs distribués, la sémantique des données échangées est importante, alors
que dans les éditeurs collaboratifs les messages permettent simplement les échanges
d’objets qui sont des éléments du contexte partagé.
• Sociologie :
L’étude des comportements sociaux dans le cadre du travail doit être prise en compte
dans la réalisation des collecticiels et plus particulièrement les lois qui régissent les
comportements de groupe. C’est ainsi que certaines applications collaboratives uti-
lisent la notion de hiérarchie pour gérer la sécurité de l’information. Par exemple une
application d’enseignement à distance permettra de séparer les contextes enseignants
et élèves.
• Ethnologie :
L’interaction au sein d’un groupe varie suivant les cultures d’où la nécessité d’adapter
le collecticiel aux besoins des différentes cultures.
Ensuite, du point de vue de l’informatique le CSCW s’inspire des recherches de domaines
variés dont les principaux sont les suivants :
• Le rôle : est défini pour chaque participant au sein du groupe afin qu’il sache
quelles actions il doit effectuer selon ses possibilités, ses capacités et ses devoirs
CHAPITRE 1. T ÉL É-APPLICATIONS COLLABORATIVES 26
• La vue : est propre à chaque participant et adaptée en fonction de ses besoins et des
autorisations qu’il détient sur les entités manipulées collectivement,
Afin de pouvoir comparer les différents collecticiels, Ellis définit dans [Ell94] un modèle
conceptuel formé de trois dimensions fonctionnelles : la production, la coordination et la
communication.
Assez rapidement ce modèle a été enrichi dans [Sal95] tout d’abord avec une première
évolution vers le modèle des trois C : la Co-production, la Coordination et la Communica-
tion. Puis B. David ajoute dans [Dav01] un quatrième espace, celui de la Conversation.
Enfin dans [Elm07] (Figure 1.2) un cinquième espace, celui de la régulation, est ortho-
gonal aux autres. Il caractérise la capacité du système à être régulé ou à s’auto-réguler
(ou s’auto-adapter) : comme par exemple la modification des caractéristiques d’une vidéo
pour s’adapter à la bande passante disponible, ou la régulation des autorisations d’accès
...
Le travail collaboratif s’est développé dans différents domaines d’application comme l’ap-
prentissage en ligne ou e-learning [Wat10], la maintenance à distance [Ste11], la concep-
tion collaborative [Duq09] ou encore la télémédecine [Fui08, Maz14] . . .
Dans le cadre de la mobilité des utilisateurs qui devient une nécessité du domaine
collaboratif, l’informatique dite ubiquitaire (ou pervasive) a vu le jour [Lou09, Mat03,
Dib13] : elle a pour but de rendre accessible une multitude de services depuis n’importe
où tout en masquant l’ordinateur. Ainsi depuis les années 2010, l’apparition du cloud
computing a mis en avant des modes de collaboration particuliers comme le mode SaaS
(Software as a Service).
2. NIST, http://www.nist.gov
3. RAD Lab, https://radlab.cs.berkeley.edu
CHAPITRE 1. T ÉL É-APPLICATIONS COLLABORATIVES 28
puting fait également référence aux applications fournies comme un service sur internet.
Les services ont été longtemps connus comme : L’IaaS (Infrastructure as a Service), Le
PaaS (Platform as a service) et le SaaS (Software as a Service), tandis que le hardware
et software dans les centres de données est ce que l’on appelle Cloud. Les trois services
d’infrastructure, de plateforme et de logiciel correspondent à des modèles techniques
différents. Chacun de ces modèles joue un rôle spécifique [Arm09] :
et Guyanne . . . Dans les nouveaux outils et plateforme collaboratifs qui sont développés,
il existe plusieurs applications pour différentes facettes de la télémédecine :
• La télésurveillance :
La télésurveillance permet de fournir des outils pour surveiller les malades à domicile
en utilisant Internet et des réseaux ADSL, GPRS, edge, 3G,. . .
Le projet UR-SAFE [Rum05] propose des solutions de télésurveillance des patients.
L’idée est de donner au patient un terminal mobile qui peut récupérer et transmettre
des données comme la pression artérielle ou le rythme cardiaque. On peut également
citer dans le même domaine le projet EPI-MEDICS [Fay10].
• La téléchirurgie :
En Septembre 2001, le premier cas réel de téléchirurgie a été réalisé par le Professeur
Jacques Marescaux [Mar02] spécialiste en chirurgie digestive. Il a opéré depuis New
York une patiente qui était à l’hôpital de Strasbourg. Une autre forme de téléchirurgie
est la téléassistance permettant d’aider un praticien à effectuer les gestes utiles au
diagnostic à distance. Dans ce domaine, un autre projet permet de partager les
dossiers médicaux d’un patient en temps réel pour une analyse en profondeur et
une préparation optimale des stratégies chirurgicales dans le cadre des tumeurs du
foie : c’est le projet Argonaute3D [LeM04] en relation avec France télécom. On peut
également citer le robot DaVinci (Figure 1.5) qui est un robot dont la première vocation
est ergonomique (position optimal du praticien pour effectuer son geste chirurgical)
mais qui propose une distanciation entre chirurgien et champs opératoire qui permet
d’envisager la téléchirurgie.
CHAPITRE 1. T ÉL É-APPLICATIONS COLLABORATIVES 31
• La téléconsultation :
Traditionnellement, les cas cliniques complexes sont traités entre médecins présents phy-
siquement dans un même lieu, principalement pour assurer la confidentialité du patient
et une rapide prise de décision. Cependant il est parfois nécessaire qu’une collaboration
médicale entre différents professionnels de la santé soit mise en place. Cette collabo-
ration peut se faire au sein de la même institution ou au sein de différentes institutions.
Pour cette raison, les services médicaux (les hôpitaux et les centres de santé) ont be-
soin d’échanger des informations sur les patients, telles que les examens cliniques, les
diagnostics et les images exploratoires pour prendre des décisions cliniques et réaliser
des diagnostics entre différents professionnels qui ne sont pas nécessairement présents
dans le même pays (problème de localisation et d’horaire de travail).
Il peut donc être important de créer une discussion sur un cas clinique avec une inter-
action ouverte et asynchrone, comme par exemple au travers d’un e-mail, d’un forum ou
d’une liste de discussion. Ainsi, l’objectif de mettre à disposition sur une plateforme la
description du cas clinique (le dossier du patient et les images exploratoires du patient
qui contiennent les diagnostics préliminaires) est de permettre aux autres médecins un
accès à ces informations. Ils seront alors en mesure de commenter et de partager leurs
CHAPITRE 1. T ÉL É-APPLICATIONS COLLABORATIVES 32
expériences et expertises.
La prise de décision médicale couvre des tâches importantes telles que le diagnostic,
la planification du traitement, l’interaction avec les patients, l’identification des erreurs
médicales,. . . Le diagnostic médical est un processus qui vise à identifier les maladies
en se basant sur les symptômes et les rapports de laboratoire. Dans le processus de
diagnostic, un schéma de représentation approprié est nécessaire à la fois pour l’in-
terprétation du problème et la récupération de la connaissance. Un système de diagnos-
tic pour les applications de santé a été proposé par Ulieru [Uli04]. Cette application est
composée d’une holarchie médicale (Figure 1.6), qui est une communauté de personnes
et/ou d’entités (hôpitaux, cliniques, bases de données et dispositifs médicaux) ayant pour
objectif commun le partage et le contrôle de l’information (par exemple transférer l’infor-
mation du patient Jean, qui présente une maladie cardiaque). Une plateforme de diag-
nostic doit être capable de regrouper toutes les ressources implicites dans les diagnostics
du patient, tout en ayant pour objectif la surveillance par les médecins de la progression
de la maladie grâce à un flux d’informations et à une interaction collaborative.
santé à caractère personnel sur support informatique, Article R1111-9 modifié par décret
n. 2011-246 du 4 mars 2011 - art. 1.).
L’anonymat et le stockage des données médicales est un aspect important, et des entre-
prises en France sont agréées (actuellement seulement une petite dizaine d’agréments
ont été délivrés), et le simple fait de faire héberger ses données médicales sur leurs sites
permet de rendre conforme une application qui utilise des données médicales.
Il faut également ajouter des identifications par Carte Professionnelle de Santé, dont la
dernière génération est le CPS3 : cette dernière est une carte unique d’identification,
d’authentification et de signature électronique, clé d’accès aux différents systèmes d’in-
formation. Elle permet de sécuriser l’accès aux données mais également d’identifier quel
professionnel de santé est intervenu dans l’acte médical, et quelles responsabilités sont
engagées.
Responsabilité de l’acte
Dans ces actes de télémédecine, un autre point très important est celui de la responsa-
bilité de l’acte. En effet, en cas d’erreur médicale il est nécessaire de pouvoir déterminer
les responsabilités (aspect juridique, assurance...).
Ainsi pour cet aspect médico-légal, le Conseil d’État (Rapport public du Conseil d’État :
≪ Réflexions sur le droit de la Santé ≫, 1998) reconnaı̂t que la recherche de responsabilité
• Les médecins de l’hôpital civil de Morelia travaillent sur des patients tests qui ne sont
pas des patients français et la règlementation mexicaine, pour le moment, est moins
contraignante,
• Nous avons sécurisé la connexion à notre site par login/password du médecin,
• Il s’agit d’une utilisation dans le cadre de recherche franco-méxicaine.
C ONCLUSION
I NTRODUCTION
Les ontologies de domaine sont étudiées et utilisées dans plusieurs domaines de re-
cherche (par exemple la médecine, la biologie, les applications militaires, la philosophie,
la linguistique. . . ). Les ontologies permettent de stocker des connaissances du domaine
dans un formalisme partagé. A l’inverse des bases de données, elles offrent la possibilité
de stocker la sémantique d’un domaine et de fournir des mécanismes d’inférence.
Au cours des dernières décennies, la recherche dans le domaine de l’informatique
biomédicale s’est développée. Dans le même temps, divers outils biomédicaux sont
conçus pour exécuter la collecte et la gestion des données. Aujourd’hui, les systèmes
de base de données sont confrontés à la gestion d’une grand quantité d’information (par
exemple dossiers cliniques, diagnostics des patients, examens de laboratoire, images
médicales. . . ). Il est donc très important :
• (1) de collecter et stocker correctement les informations médicales produites au cours
des consultations, traitements et études médicales ;
• et (2) de collecter des connaissances utiles à partir de ces données, pour fournir le
meilleur traitement possible aux patients.
Ces efforts visent à créer des modèles qui permettent de formaliser d’une manière effi-
cace toutes les connaissances issues des activités médicales de sorte qu’elles puissent
être utilisées par la suite, et de rendre plus efficace la détection et le traitement des patho-
logies connues. Parmi les mécanismes de formalisation, largement utilisés ces dernières
années, on trouve les ontologies. Elles s’intéressent à la création d’entités : les propriétés
et les relations de termes concrets ou abstraits. L’ontologie s’appuie sur la mise en place
d’un vocabulaire commun et utilise des représentations et des concepts définis par des
ressources terminologiques (par exemple UMLS 1 , MeSH 2 , SNOMED 3 . . . ) et des res-
sources ontologiques construites pour répondre à des besoins précis mais divers (par
exemple OBO 4 qui est une bibliothèque d’ontologies formelles), elles sont expliquées
dans la section 2.2.1. Ces ressources permettent l’interopérabilité des données et faci-
litent l’ajout de connaissances.
1. UMLS http://www.nlm.nih.gov/research/umls/
2. MeSH http://www.ncbi.nlm.nih.gov/mesh
3. SNOMED http://www.ihtsdo.org/snomed-ct/
4. OBO http://www.obofoundry.org
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 36
Dans ce chapitre, nous présentons tout d’abord le domaine général de recherche sur
les ontologies, puis les spécificités des ontologies développées et utilisées dans le cadre
médical. Enfin les dernières sections de ce chapitre présentent deux points essentiels
qui sont le cycle de vie d’une ontologie et son évaluation.
définition : ≪ une ontologie implique ou comprend une certaine vue du monde par rapport
à un domaine donné ≫. Cette vue est souvent conçue comme un ensemble de concepts
(entités, attributs, processus), de définitions et d’interrelations. Gandon [Gan06] enrichit
cette définition en indiquant qu’une ontologie informatique est une représentation de pro-
priétés générales de ce qui existe, que l’on peut formaliser et qui peut supporter un trai-
tement rationnel.
Le développement d’ontologies s’est effectué dans des domaines aussi variés
que la médecine, le droit, la biochimie, l’indexation de séquences audiovisuelles,
l’électronique. . . Les ontologies apparaissent aujourd’hui comme des composants logi-
ciels avancés qui s’insèrent au centre des systèmes informatiques pour leur apporter
une dimension sémantique [Bod06a].
Après plusieurs critiques et suggestions, en 2009, Gruber propose une nouvelle définition
de l’ontologie [Gru09] : ≪ Dans le contexte de l’informatique et des sciences de l’informa-
tion, une ontologie définit un ensemble de primitives de représentation qui permettent
la modélisation d’un domaine de connaissance ≫. Les primitives de représentation sont
généralement des classes (ou ensemble), des attributs (ou propriétés), et des rela-
tions (ou des relations entre les membres de la classe). La définition de primitive de
représentation comprend des informations sur leur signification et les contraintes sur leur
application logique et cohérente. Dans le contexte des systèmes de base de données,
l’ontologie peut être considérée comme un niveau d’abstraction des modèles de données,
analogues à des modèles hiérarchiques et relationnels, mais conçue pour la modélisation
des connaissances sur les individus, leurs attributs et leurs relations avec d’autres indi-
vidus. Les ontologies sont généralement spécifiées dans des langages qui permettent
l’abstraction à partir des structures de données et du contexte d’application.
En pratique, les langages des ontologies sont plus proches de l’expressivité de la lo-
gique du premier ordre que les langages utilisés pour modéliser des bases de données.
Pour cette raison, les ontologies sont censées être au niveau sémantique , alors que le
schéma de base de données est un modèle de données au niveau logique ou au niveau
physique. Dû à leur indépendance, les ontologies sont utilisées pour intégrer des bases
de données hétérogènes, permettant l’interopérabilité entre des systèmes disparates, et
en spécifiant des interfaces de services indépendants, basées sur la connaissance. Dans
la technologie des normes du Web sémantique [Ber01], les ontologies sont composées
de plusieurs couches (cf. section 2.1.3). Il y a maintenant des langages standards et une
variété d’outils commerciaux et open source pour créer et travailler sur des ontologies.
Dans une perspective plus pragmatique, on peut dire que l’ontologie est un outil qui pro-
duit de l’ingénierie des connaissances dépendante de son domaine d’application (cf. sec-
tion 2.1.1). Ainsi, les ontologies fournissent des mécanismes pour instancier des modèles
d’un domaine dans des bases de connaissances, faire des requêtes basées sur ces
connaissances et représenter les résultats obtenus. Malgré tout, la création d’une onto-
logie constitue une tâche complexe pour le développeur. C’est pourquoi, un ensemble
de méthodologies ont été mises en œuvre pour faciliter cette tâche (cf. section 2.1.2).
La représentation de l’ontologie s’appuie quant à elle sur un formalisme spécifique qui
a été mis en avant par le W3C-Semantic Web. Ce formalisme permet de coder des on-
tologies et possède plusieurs variantes avec des expressivités différentes (cf. section
2.1.3). Cela reflète l’intention qu’une ontologie est une spécification d’un modèle abstrait
de données (la conceptualisation du domaine) indépendant d’une structure particulière.
Une ontologie définit un vocabulaire qui permet la formulation d’assertions. De même, si
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 38
une ontologie doit être formulée dans un langage de représentation, il est destiné à être
une spécification de niveau sémantique, c’est-à-dire, qu’il est indépendant de la stratégie
de modélisation de données ou de la mise en application.
Comme dans le cas de la définition d’une ontologie, il n’existe pas non plus de consensus
à propos de la classification des différents types d’ontologie. Valencia [Val05] montre une
synthèse des diverses classifications existantes. La Figure 2.1 illustre cette classification.
Kerpler [Ker06] détaille une autre classification conçue pour les ontologies médicales.
Mais cette classification est également applicable à d’autres types d’ontologie tels que :
• les ontologies linguistiques (construites par des vocabulaires contrôlés, des taxono-
mies, des thésaurus et des glossaires),
• les ontologies destinées pour une application (constituées de schémas conceptuels et
de bases de connaissances)
• et les ontologies formelles (construites par des ontologies de domaine, des ontologies
de bases ou de références et des ontologies fonctionnelles).
Ce même auteur souligne que les catalogues et les schémas conceptuels ne doivent pas
être considérés comme des ontologies.
Tout objet contenant des connaissances peut être considéré comme une ontologie
[Gru09]. Malgré tout, certains éléments sont nécessaires afin de constituer/construire
une ontologie. Ces éléments sont les suivants :
• les Classes : elles sont également appelées concepts ou termes. Elles correspondent
aux abstractions pertinentes d’un segment de la réalité (le domaine du problème) re-
tenues en fonction des objectifs qu’on se donne et de l’application envisagée pour
l’ontologie. Habituellement, elles sont organisées en taxonomies. Elles ne doivent pas
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 39
être considérées à elles seules comme une ontologie complète, mais elles peuvent
être considérées comme un thésaurus.
• les Caractéristiques : elles constituent la structure interne des classes et peuvent être
propres ou héritées lorsque la classe agit comme fille d’une autre classe, en raison de
la taxonomie.
• les Relations : elles traduisent les associations (pertinentes) existantes entre les
concepts présents dans le segment analysé de la réalité. Ces relations incluent les
associations : ≪ sous classe de ≫, ≪ partie de ≫, ≪ associe à ≫, ≪ instance de ≫, . . . Ces
relations nous permettent d’apercevoir la structuration et l’interrelation des concepts,
les uns par rapport aux autres.
• les Fonctions : elles constituent des cas particuliers de relations, dans lesquelles un
élément de la relation, (le Nème) est défini en fonction des N-1 éléments précédents.
• les Axiomes : ils constituent des assertions acceptées comme vraies, à propos des
abstractions du domaine, définies par l’ontologie. Ils sont utilisés pour définir le sens
des composants ontologiques, définir des contraintes complexes sur les valeurs des
attributs, les arguments des relations et les concepts. Il est nécessaire de vérifier la
complétude des informations spécifiées dans l’ontologie ou dans le cas contraire de
décider de nouvelles informations à introduire. Il est également possible d’utiliser la
logique du premier ordre pour les décrire.
• les Instances : elles permettent d’enrichir l’ontologie, ces objets véhiculent les
connaissances (statiques, factuelles) à propos du domaine du problème.
Terminae 6 [Bie99] apporte à la fois une méthodologie comme un outil d’ingénierie des
connaissances assisté par ordinateur écrit en Java. L’originalité de cet outil est d’intégrer
des outils linguistiques et de l’ingénierie des connaissances (l’utilisation des relations
linguistiques entre les notions et leurs synonymes). Il aide à représenter une notion
comme un concept, lequel est appelé le concept terminologique. Terminae propose
une méthodologie pour construire des concepts terminologiques à partir de l’étude des
termes correspondants dans un corpus. Terminae est composé des étapes suivantes :
(1) établir la liste des termes qui constituent un corpus de textes pertinents sur le do-
maine, (2) LEXTER (un extracteur de termes) [Aus00], cet outil propose à l’ingénieur
un ensemble de termes candidats qui doivent être choisis avec l’aide d’un expert, (3)
conceptualiser chaque terme (l’ingénieur analyse les usages du terme dans le corpus
pour définir toutes les notions du terme), (4) définir en langage naturel chaque notion, et
(5) traduire la notion dans un formalisme (par exemple, logique descriptive, TBox, ABox).
La méthodologie NeOn 8 est un projet européen, qui a débuté en Mars 2006 avec la
participation de chercheurs de 14 pays européens, dans le domaine de l’ingénierie on-
7. Methontology, http://semanticweb.org/wiki/METHONTOLOGY
8. NeOn, http://www.neon-project.org
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 42
Au début des années 90, les langages les plus représentatifs étaient Cycl créé en 1990
par Lenat et Guha [Len90], LOOM créé en 1991 par McGregor [Mac91], Ontolingua créé
par Gruber en 1992 [Gru92], F-logic créé par Kifer en 1995 [Kif97], OCML créé par Motta
en 1998 [Mot98, Mot00]. La plupart de ces langages suivent une syntaxe basée sur LISP
et sont appelés ≪ langages classiques ≫. Plus récemment, l’évolution de ces langages
s’est appuyée sur un langage largement utilisé dans le web (XML - Extensible Markup
Language) pour donner de nouveaux langages pour les ontologies comme OML/CKML
[Ken00], RDF 9 (Ressource Description Framework), RDF Schema 10 , SHOE 11 , OIL, DA-
MIL + OIL [Hor02], ou OWL 12 (Ontologies Web language).
Les langages de description et de représentation des connaissances évoluent dans
9. RDF http://www.w3.org/2001/sw/wiki/RDF
10. RDF Schema http://www.w3.org/TR/PR-rdf-schema
11. SHOE http://www.cs.umd.edu/projects/plus/SHOE
12. W3C, OWL http://www.w3.org/2001/sw/wiki/OWL
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 44
tous les domaines. Ainsi, la connaissance du domaine, en particulier les ontologies, est
représentée en utilisant le formalisme des graphes conceptuels ou les logiques de des-
cription. Depuis l’avènement du web sémantique, la représentation des ontologies est en
passe d’être normalisée par un langage : OWL qui intègre nativement des fonctionna-
lités telles que la création d’axiomes qui concernent la définition complète ou partielle de
concepts et de relations. Ce langage permet de manipuler et de spécifier des classes,
les propriétés de ces classes et des restrictions sur ces propriétés (OWL-DL et OWL-Full
deux variantes de OWL). OWL est basé sur une sur-couche XML et sur les logiques de
description provenant des graphes conceptuels [Gan02].
Par rapport à la problématique de la représentation des connaissances issues de textes,
XML devient le standard de fait de l’ingénierie documentaire textuel [W3C13]. De plus,
il fournit avec une sur-couche comme RDF [Wei09], une façon de décrire des méta-
données permettant l’indexation et l’accès à l’information [Cru04].
Les technologies, langages, outils et standards du Web Sémantique (XML, RDF, OWL)
jouent également aujourd’hui un rôle déterminant dans tout type d’applications de do-
maine qui ont des besoins réels et concrets d’utilisation du web. Des enjeux importants
sont de savoir si les langages standards d’ontologies du web permettront de répondre à
ces principaux besoins [Gan02, Gan06].
Une ontologie médicale est souvent conçue pour assister l’analyse qualitative des
décisions médicales dans un domaine spécialisé. La modélisation s’appuie sur deux
sources complémentaires [Sad12] :
• la structure de l’observation médicale informatisée utilisée dans l’unité qui fournit direc-
tement des concepts fondamentaux pour la prise en charge d’une maladie ou le suivi
hospitalier (diagnostics des patients, dossiers médicaux, médicaments administrés,
. . . ),
• l’analyse terminologique des corpus qui permet d’enrichir et de structurer ce noyau
ontologique.
La construction de ces types d’ontologie médicale pour la recherche d’information est
problématique au niveau de la terminologie et de la modélisation (à la croisée de plusieurs
domaines tels que l’ingénierie des connaissances et la gestion pour l’optimisation des
coûts en médecin) pour permettre l’interopérabilité des documents et faciliter l’élaboration
de diagnostics plus précis [Sta09].
Le développement d’une ontologie utilise obligatoirement des systèmes terminologiques,
bien que les ontologies aient un rôle normatif analogue aux terminologies. Pourtant, le
recours à des terminologies ou des corpus de textes, pour la création d’ontologies est par-
fois inévitable (par exemple si l’ontologie a pour intérêt à être intégrée à un système de
traitement automatique de documents), l’ontologie doit assurer la couverture terminolo-
gique du domaine. Depuis de nombreuses années, l’accès aux connaissances médicales
est un enjeu majeur pour les professionnels de la santé et les chercheurs. Face à la mul-
tiplication des sources d’information potentiellement accessibles et à l’augmentation ver-
tigineuse de la production textuelle électronique et d’imagerie l’utilisation des ontologies
s’est développée.
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 45
le centre national d’ontologie biomédicale (National Center for Biomedical Ontolgy ) qui
est maintenant dans sa septième année, et HeTOP (The health Terminology/Ontology
Portal) développé par Stefan Darmoni, sont des centres qui visent (1) à créer et mainte-
nir un référentiel d’ontologies et de terminologies biomédicales, (2) à construire des outils
et des services web pour permettre l’utilisation des ontologies et terminologies dans la
recherche clinique et translationnelle (disponibles principalement en français ou en an-
glais, mais aussi en allemand, italien, chinois, . . . ). La pièce maı̂tresse du centre national
est une ressource en ligne continue sous le nom BioPortail, et HeTOP peut être utilisé
par les humains et les ordinateurs via des services Web.
Au niveau national, le Groupe d’Informatique Biomédicale (GIB) a travaillé durant 15
ans dans divers domaines de l’informatique biomédicale sur entre autres : la prise de
décision, le traitement d’images, les lignes directrices et protocoles cliniques, les ontolo-
gies biomédicales, l’intégration de bases de données, le data-mining, . . . L’expérience ac-
quise dans ces domaines se reflète dans le grand nombre de publications scientifiques,
dans la participation à différents projets de la Commission Européenne et dans les in-
vestissements faits par les industriels. Le groupe a participé à de nombreux projets fi-
nancés par la Commission européenne, comme ACGT (essais cliniques post-genomique
axés sur le cancer) ; INFOBIOMED (Réseau d’excellence en informatique biomédicale) ;
INFOGENMED (développement d’un laboratoire virtuel pour l’accès et l’intégration des
informations génétiques médicales et les applications dans le domaine de la santé) et
BIOINFOMED (en mettant l’accent sur les relations et les synergies entre l’informatique
médicale et bio-informatique). En 2011, un projet d’action de soutien de type (ACTION-
GRID) a été négocié avec la Commission Européenne pour étendre les applications de
la grille de la biomédecine pour les pays d’Amérique Latine, les Balkans et l’Afrique du
Nord.
Pour le développement d’une ontologie médicale, les ressources terminologiques sont
utilisées par les professionnels de la santé dans le monde entier, dans le cadre de la
communication des connaissances et des pratiques scientifiques, s’appuyant sur des
ressources documentaires (cf. section 2.2.1). Ces ressources aident à la construction
d’ontologies dans le domaine biomédical. Elles sont basées sur un traitement automatisé
de l’information de façon intensive, standardisée et généralisée pour la représentation
des connaissances (cf. section 2.2.2). La section 2.2.3 introduit les ontologies médicales
les plus reconnues et utilisées dans le domaine de la pratique médicale. Finalement,
nous considérons certaines des tendances en matière de développement et traitement
ontologique (cf. section 2.3) ainsi que l’évaluation d’une ressource terminologique et on-
tologique (cf. section 2.4).
des lexiques, des bases de données ou des ontologies. Les lexiques sont constitués
d’une collection de mots enrichie d’informations pour leur compréhension et leur utilisa-
tion [Sch12]. Nous pouvons rencontrer aussi des terminologies, qui sont généralement
considérées comme des lexiques spécialisés [Bod06b]. Les bases de données se
fondent sur le traditionnel modèle relationnel qui fournit un schéma strict pour des ins-
tances. D’autre part, les concepts sont représentés par des tables et les relations par
des clés étrangères entre les tables. Ce formalisme limite les définitions formelles pos-
sibles des concepts et n’offre pas beaucoup de capacités de raisonnement, même s’il
existe des approches pour stocker des ontologies dans des bases de données [Lep08].
Les ontologies de domaine ont des objectifs plus précis, alors que leurs administrateurs
sont des applications informatiques plutôt que des personnes. Ainsi, les ontologies de
domaine n’ont pas besoin de s’occuper des variantes et des catégories syntaxiques sur
les termes qui sont utilisés parce qu’elles sont généralement modélisées par un lan-
gage de représentation. Nous identifions les formalismes simples comme les réseaux
sémantiques et les langages de représentation complexes qui permettent d’appliquer
l’inférence comme la structure logique ou la logique de description.
UMLS 15 (Unified Medical Language System) a été mis en place dans le but d’améliorer
l’accès à l’information médicale à partir de diverses bases de données : bibliographiques,
enregistrements cliniques et bases de connaissances médicales. UMLS sert à définir un
15. UMLS http://www.nlm.nih.gov/research/umls/
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 48
vocabulaire médical de base (méta-thésaurus) qui reprend et dédouble entre autres les
termes de MeSH, SNOMED 16 . Ce méta-thésaurus propose une description hiérarchique
des connaissances médicales utilisées dans divers documents et systèmes à base de
connaissances.
Pour le traitement du vocabulaire médical en anglais, l’UMLS constitue un outil infor-
matique puissant qui permet d’accéder à de nombreuses informations car il gère les
variations des termes et les relations. Ce méta-thésaurus concerne essentiellement des
terminologies anglophones. Il existe trois sources de connaissances UMLS : (1) un méta-
thésaurus, qui contient des informations sémantiques sur des concepts biomédicaux,
leurs noms et leurs relations ; (2) un réseau sémantique qui est un réseau de catégories
générales ou de types sémantiques qui sont assignés à tous les concepts de méta-
thésaurus ; (3) un lexique spécialisé qui contient des informations syntaxiques sur les
termes biomédicaux et qui couvre la plupart des termes correspondant aux noms de
concepts dans le méta-thésaurus.
FMA 17 ( Fundational Model of Anatomy ) est une ontologie de référence pour le domaine
de l’anatomie. C’est une représentation de toutes les entités anatomiques et les rela-
tions nécessaires pour la modélisation symbolique de la structure phénotypique du corps
humain dans une forme qui soit compréhensible par l’homme et qui soit également com-
putationnelle.
sont associés un code alphanumérique. Les descripteurs s’organisent selon une struc-
ture hiérarchique et associative. Le MeSH comprend jusqu’à 11 niveaux de hiérarchie.
Ces principaux composants sont les Headings (MH pour Main Headings), les Subhea-
ding et les Supplementary Concept Records. En outre, des connecteurs permettant des
références explicites entre termes expriment les relations de synonymie, de voisinage ou
d’association tandis que des qualificatifs permettent de considérer les différentes facettes
d’un concept.
OBO 22 (Open Biomedical Ontologies) est un travail collaboratif pour créer des vocabu-
laires contrôlés pour une utilisation partagée entre différents domaines biologiques et
médicaux. En 2006, OBO faisait partie des ressources du National Center for Biomedical
Ontologies. La bibliothèque d’ontologies OBO constitue la base d’une collaboration entre
différents groupes de développeurs d’ontologies scientifiques qui ne cessent d’améliorer,
d’augmenter et d’enrichir son contenu. Les ontologies présentes dans OBO ont été va-
lidées et sont utilisées par des experts du domaine. Elles sont considérées comme des
ontologies formelles.
Kingsbury Center for Cancer Care Glossary a été obtenu par le Kinsbury Informa-
tion Center 27 . C’est un glossaire de termes liés au diagnostic et au traitement du cancer,
spécialement destiné aux patients et à leurs familles. Ainsi MedicineNet Medical Dictio-
nary 28 est un glossaire des termes médicaux pour les patients et les semi-spécialistes.
1. Domaine des connaissances : il doit être délimité le plus précisément possible se-
lon plusieurs axes ; les connaissances du domaine, les connaissances de raisonne-
ment et les connaissances de haut niveau qui, par leur degré d’abstraction, peuvent
être communes à plusieurs domaines [Cor06]. Le premier souci concernant la
construction de l’ontologie est d’identifier quel est le domaine de connaissances que
nous cherchons à modéliser (par exemple, si notre domaine de connaissance est
le traitement du cancer, l’ensemble des connaissances que nous devons concep-
tualiser est l’analyse d’un corpus du domaine de la cancérologie). Quelle que soit
sa spécialité médicale, un médecin se sert constamment de connaissances appar-
tenant à d’autres spécialités. Dans ce cas, il est difficile de définir les limites des
connaissances à modéliser et comment identifier les connaissances pertinentes.
2. Degré de formalisme et granularité : la formalisation est nécessaire pour per-
mettre un raisonnement automatique afin de décharger les utilisateurs d’une partie
de leur tâche d’exploitation [Char06]. Ces utilisateurs doivent, au même titre que
l’objectif opérationnel, être identifiés car le choix du degré de formalisation et de
la granularité de l’ontologie dépendent de leurs besoins et de leurs compétences.
Les principales problématiques sur les questions de formalisme et de granularité
concernent l’interprétation du sens des connaissances médicales en logique de
description [Sch07, Bha09] :
• comment passer de l’expression linguistique des connaissances à une
représentation formelle et calculable, propre à l’exploitation informatique,
• comment ne pas réduire de manière excessive l’expressivité du langage médical
en le formalisant,
• comment définir quelles sont les primitives de représentation et leurs significa-
tions dans le processus de modélisation.
3. L’importation et la réutilisation : le premier objectif est de définir la configura-
tion de l’ontologie sur la base de discussions avec des experts du domaine et
les sources de données existantes, comme les bases de données ou d’autres
ontologies. En raison du nombre croissant de sources de connaissances dans
le domaine biomédical, il est nécessaire de pouvoir mettre ensemble toutes ces
sources complémentaires. L’automatisation de cette tâche est plus que nécessaire.
La combinaison de différentes sources peut être triviale si un lien explicite entre
les concepts similaires présents dans une base de données relationnelle existe.
Selon la façon dont les ontologies sont combinées, deux principales techniques
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 52
sont définies par Noy [Noy00] : l’alignement et la fusion des ontologies. En ali-
gnement d’ontologies, les deux ontologies restent intactes et des liens entre elles
sont créés. Cette technique est utilisée quand les ontologies sont de domaines
complémentaires. Dans la fusion des ontologies, les deux ontologies sont fu-
sionnées en une seule. Cette technique est utilisée quand il est nécessaire de
prévoir une ontologie cohérente et unifiée.
4. La classification hiérarchique : elle est utilisée pour regrouper des termes
en fonction du contexte. Les structures hiérarchiques résultantes peuvent être
vérifiées par un ingénieur ontologique et/ou par un expert du domaine. Blaschke
[Bla02] et Krishnan [Kri12] ont utilisé la classification hiérarchique pour grouper
des termes du domaine provenant de la littérature. Le résultat a été un ensemble
d’arbres indépendants qui ont été fusionnés par un expert du domaine. Ces arbres
hiérarchiques qui représentent la taxonomie dans l’ontologie peuvent être conçus
selon trois principes :
• l’identification des concepts les plus génériques que l’on déclinera en concepts
de plus en plus spécifiques. Il s’agit d’une approche de haut en bas (ou TOP
DOWN),
• l’identification des concepts spécifiques que l’on organise avec des concepts plus
génériques. C’est une approche de bas en haut (ou BOTTOM UP),
• l’identification des concepts les plus importants (pas forcément spécifiques ou
génériques) et à partir de ceux-ci l’identification des concepts plus génériques
et plus spécifiques dont on aura besoin. Cette approche part du milieu vers les
extrémités (ou MIDDLE OUT).
Dans la pratique, il n’y a pas d’approche purement ≪ TOP DOWN ≫ ou ≪BOTTOM
UP ≫ surtout lorsqu’une ontologie est conçue par une combinaison de constructions
taxonomiques ou à partir d’ontologies déjà existantes réutilisées.
5. Les ontologies représentent ≪ ce qui est ≫, les modèles d’information
représentent ≪ ce que nous savons ≫ : la tâche de représentation des faits cli-
niques exige deux aspects strictement séparés : (1) Les vérités universelles sur
les entités du monde visé par des termes de domaine, et (2) les faits connus
sur des cas cliniques concrets. La première tâche correspond à ce que l’on en-
tend par ontologie, la seconde correspond aux modèles d’information. Il s’agit non
seulement des faits qui sont dans le monde, mais aussi de la connaissance de
ces faits. Par exemple il existe une distinction entre les classes Tuberculose pul-
monaire, confirmée par culture médical et Tuberculose pulmonaire, confirmée par
antécédents cliniques, or la tuberculose pulmonaire est confirmée comme maladie
(vérité universelle), le patient X a d’un point de vue pulmonaire des facteurs à risque
de tuberculose (connaissance). La nature de la tuberculose d’un patient ne dépend
pas de la façon dont elle est diagnostiquée. Cette distinction n’a pas de sens au
niveau des ontologies médicales car l’information ne change pas en fonction d’un
fait connu ou inconnu [Rec06].
6. Les exigences pratiques peuvent justifier les écarts contrôlés : dans de nom-
breux cas, les besoins des utilisateurs peuvent engendrer des difficultés dans la
conception des ontologies. Comme les ontologies sont basées sur des vérités uni-
verselles, elles évitent la représentation des conjectures qui sont importantes dans
le contexte médical (par exemple, il peut être nécessaire de classer certains fac-
teurs de risques liés aux maladies : si nous déclarons ≪ Hypertension ≫ comme
≪ Facteur de risque pour une rupture d’anévrisme ≫ dans une ontologie en utilisant
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 53
7. Les ontologies doivent être liées à des dictionnaires : lors de la création d’une
ontologie, il n’est pas obligatoire d’intégrer un lexique ou des informations termi-
nologiques même si cela est fortement recommandé. Cependant, il est important
que les nœuds de l’ontologie soient eux-mêmes explicites et emploient des termes
couramment utilisés dans le domaine. En outre, ils doivent éviter des formulations
ambiguës. Cela signifie que les termes de l’ontologie ne doivent pas être erronés ou
porter à confusion. Deux nœuds ne peuvent pas avoir le même terme. Il est alors
parfois nécessaire de choisir des synonymes. C’est pourquoi il est nécessaire de
fournir un lien entre l’ontologie et un dictionnaire où chaque entrée du dictionnaire
correspond à un terme du domaine ou à des synonymes. Ce dictionnaire est une
structure de données séparée et ne fait pas partie intégrante des ontologies.
8. Le découpage d’ontologie : les étapes du développement de l’ontologie
présentées précédemment recueillent l’information et elles peuvent exiger le
découpage du contenu de l’ontologie pour maintenir l’information qui correspond
le mieux au domaine. Nous devons tenir compte de l’équilibre entre intégralité (qui
peut poser des problèmes dans la gestion du contenu) et complexité du traite-
ment (qui limite l’expressivité de l’ontologie). Lee [Lee11] propose le découpage
sur l’exemple d’une ontologie développée sur le domaine des drogues. Il propose de
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 54
supprimer les concepts non nécessaires dans l’ontologie du domaine. Les concepts
supprimés ne doivent pas changer la similarité sémantique sur l’ontologie complète.
9. Les utilisateurs des ontologies n’ont pas besoin de connaitre l’ensemble du
système : du point de vue de l’utilisateur, la structure interne d’une ontologie peut
facilement conduire à la confusion ou à des interprétations erronées. Les utilisa-
teurs inexpérimentés dans l’ingénierie ontologique n’ont pas besoin de connaitre
tous les détails de la hiérarchie. Ainsi, les ontologies ne doivent montrer aux uti-
lisateurs que l’organisation des catégories bien définies pour faire respecter la
cohérence dans le contenu. Il faut fournir des interfaces sur lesquelles s’appuyer
pour des tâches personnalisées.
10. Les ontologies doivent fournir des services de terminologie personnalisés :
les utilisateurs finaux des ontologies médicales doivent recevoir des terminologies
précises, sans avoir besoin d’accéder à l’ontologie, car ces utilisateurs créent et
sélectionnent uniquement des termes. Le service de terminologie est à son tour
responsable de la liaison des termes de l’ontologie pour la représentation contrôlée
à l’utilisateur (Figure 2.7).
La représentation des connaissances dans le contexte clinique est étudiée par la com-
munauté d’informatique médicale depuis la dernière décennie [Cim00]. L’objectif est d’of-
frir un ensemble de références sémantiques sur les connaissances cliniques (patholo-
gies, traitements, médicaments, . . . ). Ces ensembles comptent actuellement différents
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 55
tions d’articles médicaux). Les instances dans l’ontologie ne sont pas des traitements
spécifiques pour la condition d’un patient en particulier, mais une information générique
applicable à un groupe de patients avec une instance de maladie similaire et dans des
conditions similaires. La Figure 2.8 montre un exemple de hiérarchisation générale pour
la modélisation d’une pathologie et le traitement possible.
Les Figures suivantes montrent une hiérarchie qui est considérée comme un complément
d’un aspect médical, où ≪ maladie ≫ représente l’altération des fonctions de l’état physio-
logique ou morphologique considérées comme normales. Les maladies complexes sont
dues à l’interaction entre un profil génétique particulier et un environnement (Figure 2.9).
Le ≪ traitement ≫ suit l’évolution de la maladie concernée comme par exemple la prise de
médicaments, les thérapies, les chirurgies (Figure 2.10). La ≪ condition ≫ se réfère à des
conditions supplémentaires ou à des attributs que le patient pourrait présenter pour l’effi-
cacité des traitements (Figure 2.11), ajoutant ainsi des données spécifiques aux patients
(âge, sexe, les antécédents médicaux,. . . ).
Au sein des ontologies, si l’on utilise le langage OWL, il est possible d’associer aux pro-
priétés (relations) des sous-propriétés (sous-relations) qui forment ainsi une hiérarchie
de relations.
Il est important de noter qu’il n’y a aucune limite sur le nombre de fois ou un composant
peut être référencé. Par exemple, un traitement peut comprendre une combinaison de
traitements (médicaments, chirurgie,. . . ), de la même façon, un traitement peut être ap-
pliqué à une combinaison de conditions pour un patient qui conduit à des effets multiples.
Une fois construite et acceptée par une communauté particulière, cette ontologie traduit
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 57
Ce type d’ontologie regroupe les concepts utilisés pour formaliser les connaissances.
L’ontologie définit les concepts utilisés principalement dans des langages structurés
(classes, sous-classes, attributs, valeurs, relations et axiomes) [Gru93a]. L’ontologie de
domaine permet de spécifier les connaissances d’un domaine de façon indépendante du
type de manipulation qui va être opéré.
De nombreuses ontologies de domaine existent déjà (Figure 2.13). MENELAS [Zwe99]
présente des ontologies de haut niveau de conceptualisation. Le projet LERUDI (LEc-
ture Rapide en Urgence du Dossier patient Informatisé) 33 vise à développer un système
d’information offrant aux professionnels de la santé une vision synthétique du dossier
patient informatisé et la possibilité de prises de décisions médicales. Le développement
d’ONTOURGENCES [Char12] a été réalisé en 6 étapes :
• construction du squelette ontologique de la ressource termino-ontologique,
• utilisation de ressources terminologiques et ontologiques existantes pour compléter
manuellement le système de concepts,
• enrichissement automatique,
• acquisition de concepts ou niveau de termes,
• enrichissement des termes en concepts en rapport avec les médicaments,
• mise en œuvre de procédures de validation.
Ces 6 étapes sont les règles de construction de toutes ces ontologies : les
deux premières étapes de construction correspondant à une méthode classique de
construction d’ontologie, les trois étapes suivantes étant en revanche spécifiques au
développement de ressources termino-ontologique et à son usage dans un système. La
validation est l’assurance qualité qu’il faut prendre en considération pour tous les types
d’ontologies.
Dans la littérature, nous trouvons différentes ontologies appliquées dans différents do-
maines.
33. LERUDI, http://esante.gouv.fr/actus/services/le-projet-lerudi-fiche-signaletique
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 59
l’anatomie, les organismes et les protéiques. De façon similaire, une ontologie du cancer
de la prostate a été conçue à l’aide de la gestion et de l’intégration des données cliniques
sur les diagnostics de maladies cancéreuses [Min09]. Il existe également une ontologie
sur la gestion des concepts liés aux traitements et à la recherche du cancer, pour la
gestion et l’intégration des données des essais cliniques [Gei13].
produits génétiques comme leur processus biologique associé, une seconde pour les
composants cellulaires, et la dernière pour décrire les fonctions moléculaires de façon
indépendante de l’espèce. Un autre aspect important de GO est d’utiliser un cycle de
construction simple et intuitive. SO et PDB cherchent à développer une ontologie qui
convient pour décrire des séquences biologiques. Il existe une version allégée de cette
ontologie appelée SOFA (Sequence Ontology Feature Annotation) 41 . Cette ontologie est
écrite dans le langage OWL.
Il est important de noter la grande quantité d’information existante sur les ontologies dans
le domaine médical, ce qui peut être considéré comme un avantage. Il est possible d’ob-
tenir une grande compréhension de la terminologie médicale en utilisant efficacement
ces nombreux systèmes qui s’appuient sur ces ontologies à des fins différentes. Notons
également qu’OWL est le langage pionnier de modélisation de l’ontologie.
Il s’agit dans cette section d’étudier le cycle de vie des ontologies, autrement dit comment
ont évolué les ontologies médicales, comment elles peuvent évoluer et enfin comment
elles sont maintenues.
Puisque les ontologies sont destinées à être utilisées comme des composants lo-
giciels dans des systèmes répondant à des objectifs opérationnels différents, leur
développement doit s’appuyer sur les mêmes principes que ceux appliqués en génie logi-
ciel. Ainsi, les ontologies doivent être considérées comme des objets techniques évolutifs
possédant un cycle de vie qui nécessite d’être précisé. Les étapes pour une ontologie
comprennent des activités de gestion de projet (planification, contrôle, assurance qua-
lité) et des activités de développement (spécification, conceptualisation, formalisation)
auxquelles s’ajoutent des activités transversales de support telles que l’évaluation, la do-
cumentation et la gestion de la configuration [Gan06].
Le cycle de vie d’une ontologie (Figure 2.14) comprend :
• une étape initiale de détection et de spécification des besoins qui permet notamment
de circonscrire précisément le domaine des connaissances,
• une étape de conception découpée en trois sous-étapes : Normalisation, Formalisation
et Opérationnalisation,
• une étape de déploiement et de diffusion,
• une étape d’utilisation incontournable,
• une étape d’évaluation,
• et une étape d’évolution et de maintenance du modèle.
L’ontologie et les besoins des utilisateurs doivent être réévalués et l’ontologie peut être
ou bien étendue ou bien si nécessaire en partie reconstruite. La validation du modèle de
connaissances est au centre du processus et se fait de manière itérative [Fer00].
Les phases de conception initiale et d’évaluation ont elles aussi un certain nombre de
points incontournables :
• la spécification des solutions,
L’évolution d’une ontologie peut avoir plusieurs objectifs : comme effectuer un bilan d’en-
semble, ou guider la prochaine étape de construction, ou découvrir l’origine des diffi-
cultés, ou rendre compte de résultats . . . Il est clair que ces objectifs peuvent s’opposer
et qu’ils doivent être organisés. Il faut évaluer par une méthode qualitative et quantitative
la hiérarchisation relationnelle incluant les concepts et la taxonomie. Il faut également
choisir entre évaluer toutes les étapes de construction ou bien uniquement le résultat
obtenu.
Les critères pertinents pour évaluer une ressource terminologique et ontologique sont
ceux qui doivent être respectés lors de la construction de cette même ressource.
Ainsi, il est important de respecter un certain nombre de contraintes pour obtenir une
modélisation de qualité, à la fois adaptable et maintenable [Rou10] :
• clarté et objectif : l’ontologie doit fournir la signification des termes définis en donnant
des définitions objectives. Quand une définition peut être axiomatisée, elle doit l’être.
Des définitions en langage naturel doivent être fournies,
• perfection : une définition exprimée par des conditions nécessaires et suffisantes est
préférable à une définition partielle,
• cohérence et extensibilité : une ontologie doit être cohérente pour permettre des
inférences conformes aux définitions. Les axiomes doivent être consistants. La
cohérence des définitions en langage naturel doit être vérifiée. L’ajout de nouveaux
concepts à l’ontologie ne doit pas entraı̂ner la révision des définitions existantes. Plus
généralement, l’ontologie doit être construite de telle manière que l’on puisse l’étendre
facilement, sans remettre en cause ce qui a déjà été fait,
• encodage minimal : l’ontologie doit être conceptualisée indépendamment de tout
langage d’implémentation. Le but est de permettre le partage des connaissances
contenues dans l’ontologie entre différentes applications utilisant des langages de
différentes représentations,
• ontologies minimales : une ontologie doit faire un minimum d’hypothèses sur le monde.
Elle doit contenir un vocabulaire partagé mais ne doit pas être une base de connais-
sances comportant des connaissances supplémentaires sur le monde à modéliser. Elle
doit choisir de représenter un point de vue en particulier sur le domaine qui l’intéresse.
• distinction ontologique : l’ontologie doit identifier et isoler un noyau de propriétés
considérées comme invariables pour une classe (critère d’identité), il faut créer une
nouvelle classe de concepts,
• normaliser l’ontologie : l’ontologie doit être normalisée chaque fois que cela est pos-
sible, ces normalisations représentant les classes des objets reconnus comme existant
dans le domaine. Construire une ontologie, c’est aussi décider d’une manière d’être et
d’exister des objets.
Comme tout logiciel, le contenu des ontologies (concepts, taxonomie et axiomes) doit
être évalué avant d’être utilisé ou réutilisé dans d’autres ontologies ou dans des applica-
tions. Dans [Gom07], l’auteur indique que l’évaluation d’une ontologie est un processus
technique de son contenu par rapport à un cadre de référence (les exigences, des ques-
tions de compétence, . . . ), pendant toutes les phases de son cycle de vie (le bon usage
du langage utilisé pour la codification, l’exactitude de la structure taxonomique, le sens
des termes, les concepts représentés et l’adéquation des exigences exprimées au début
CHAPITRE 2. ÉTAT DE L’ART DES ONTOLOGIES M ÉDICALES 64
C ONCLUSION
Les ontologies sont des spécifications formelles qui permettent une représentation
de la connaissance d’un domaine spécifique. Elles facilitent la communication, la
réutilisation et le partage d’information entre les individus, les organisations et les
systèmes informatiques. Les ontologies peuvent être considérées comme des res-
sources fondamentales pour le web sémantique. Pour cette raison, au cours des
dernières décennies, les travaux de recherche se sont multipliés et ce en particulier
dans le domaine médical.
Ce chapitre a présenté les aspects fondamentaux des ontologies générales et
biomédicales. Nous avons examiné certaines méthodologies pour le développement
des ontologies, comme Methontology et Ontology development 101(méthodologies
que nous avons utilisées pour nos travaux). Nous avons également présenté les lan-
gages ontologiques, le raisonnement des ontologies dans le domaine médical, les
principes de conception ainsi que le cycle de vie et l’évaluation d’une ontologie.
Dans cette première partie, nous avons présenté deux états de l’art.
L’état de l’art des télé-applications collaboratives a permis de situer le contexte de
cette Thèse : celui de la télé-médecine et plus particulièrement du télé-diagnostic
médical. Et dans ce contexte, de nouvelles exigences, en particulier du CNOM Conseil
National de l’Ordre des Médecins, imposent la traçabilité des applications de télé-
médecine : d’un point de vue médico-légal, il est nécessaire de pouvoir rejouer un
diagnostic en sachant par exemple ≪ qui a fait quoi et à quel moment ≫.
Comme les flux de données pris en compte dans un télé-diagnostic sont de taille très
importante, il est apparu indispensable de faire appel aux ontologies pour développer
de nouveaux outils de traçabilité qui seront capables de trouver de manière efficace et
fiable, dans la masse d’informations, les informations pertinentes pour tracer le télé-
diagnostic.
Ainsi, le chapitre suivant d’état de l’art a permis d’étudier les méthodes de conception,
les outils et les langages qui permettent de construire des ontologies. Nous avons
utilisé ces méthodes pour élaborer les trois ontologies qui constituent le cœur de notre
plateforme COOVADIS COllabOrative VAscular DIagnoSis.
La deuxième partie de ce document est donc consacrée à la définition des trois onto-
logies, puis à celle de la plateforme complète. Nous présentons ensuite les validations
(théorique et clinique) de COOVADIS.
II
C ONTRIBUTION
I NTRODUCTION
I NTRODUCTION
1. OMS, http://www.who.int/fr/
2. athérosclérose, https://www.nhlbi.nih.gov/health/health-topics/topics/atherosclerosis/
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 75
une maladie coronarienne. La plupart des lésions dues à la maladie périphérique ap-
paraissent avant même les premiers symptômes.
• Les fonctions rénales : les maladies affectent les artères et les veines des reins qui
provoquent une insuffisance rénale ou une hypertension artérielle.
Entre 2000 et 2010 les ontologies ont occupé une place importante dans l’ingénierie
des connaissances [Yun11]. Plusieurs groupes de recherche ont proposé des méthodes
de développement des ontologies, mais les domaines à modéliser sont si nombreux et si
divers qu’il est impossible d’obtenir une seule méthode adaptée à tous les cas. La section
2.1.2 a introduit les méthodologies les plus utilisées.
Nous avons entre autres détaillé : Ontology development 101 [Noy01] proposée par l’Uni-
versité de Standord et Methontology 3 [Cor03]. Ces deux méthodologies s’appliquent
dans le cadre du développement d’ontologies à partir de zéro, de la réutilisation d’on-
tologies ou d’un processus de ré-ingénierie. Ces méthodologies comportent un en-
semble établi de principes, de processus, de pratiques, de méthodes et d’activités uti-
lisés pour le design, le développement, l’évaluation et l’implémentation [Gas09]. De telles
méthodologies incluent des méthodes pour l’unification, le reengineering, la maintenance
et l’évolution des ontologies. Nous nous appuyons sur la combinaison de ces deux
méthodologies pour le développement de nos ontologies dédiées à l’organisation de
connaissances dans le domaine des maladies vasculaires, du diagnostic lié à ces ma-
ladies et à la traçabilité des traitements et analyses du patient.
Ces méthodologies proposent un processus de développement qui s’appuie sur la
construction d’un modèle conceptuel robuste et sur la détermination claire et consistante
des exigences de l’ontologie à construire par :
• La détermination des besoins de l’ontologie (portée de l’ontologie, et ensemble des
questions de compétences) ;
• La réutilisation des ontologies ou des méta-données existantes ;
• Le développement d’un modèle conceptuel ;
• La mise en œuvre du modèle conceptuel ;
• L’évaluation de l’ontologie.
Il est important de déterminer l’ensemble des questions de compétences [Noy01] car
leur définition va nous aider pour la prise de décisions pendant le processus de
développement de notre ontologie. Ontology development 101 donne la définition sui-
vante : ≪ une ontologie est un modèle de la réalité et il n’y a pas qu’une seule façon
correcte de modéliser son domaine, il y a toujours des alternatives viables. La meilleure
solution dépend presque toujours de l’application que nous voulons mettre en place et
des évolutions que nous anticipons ≫.
Les processus d’évaluation et de documentation sont des axes transversaux de ces
méthodologies, ce qui implique leur présence continue dans chacune des étapes ci-
dessus, mais pas toujours avec le même degré de formalité. Nous allons utiliser divers
outils fournis par Methontology (schémas, diagrammes et descripteurs) pour documenter
correctement le processus d’élaboration du modèle conceptuel. La Figure 3.2 illustre le
3. Methontology, http://semanticweb.org/wiki/METHONTOLOGY
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 76
Quel est le domaine que vont couvrir les ontologies ? Nos ontologies permettent
de modéliser la structure du diagnostic des maladies vasculaires à partir de laquelle la
communauté médicale peut collaborer pour un diagnostic et/ou une prise de décision
de diagnostic. Les ontologies construites sont également utilisées pour permettre une
surveillance médicale (la traçabilité des interventions ou études, l’historique clinique, les
images d’explorations, les traitements et les résultats de diagnostic) d’un patient.
Dans quel but utiliserons-nous les ontologies ? Les ontologies facilitent la re-
cherche d’informations et de concepts concernant les diagnostics dans le standard d’ima-
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 77
gerie médicale (DICOM)(cf. section 3.3.2) pour fournir aux médecins l’ensemble des infor-
mations relatives à un patient et son évolution clinique, tout en conservant la traçabilité du
patient dans un objectif de travail collaboratif ultérieur. Pour l’acquisition de cette informa-
tion, il est nécessaire d’inclure des concepts qui décrivent à la fois une maladie vasculaire,
le diagnostic médical lié à la maladie et la collaboration médicale. Ces concepts donnent
un guide médical sur l’évolution du patient. Chaque résultat doit exclure les éléments
répétés dans les diagnostics qui peuvent créer de la confusion.
Qui va utiliser les ontologies ? Les utilisateurs potentiels de ces ontologies sont les
médecins qui participent de manière individuelle ou collaborative au diagnostic.
L’utilisation des questions de compétences est le départ de notre travail. Ces questions
contraignent l’ingénieur des connaissances à un engagement sémantique, c’est-à-dire,
d’expliciter clairement le sens de chacune des tâches de l’ontologie.
Methontology [Cor03] propose de commencer par une tâche de planification pour identi-
fier les tâches à réaliser, les corrections, le temps et les ressources nécessaires. Suivent
les activités d’administration (contrôle et assurance de la qualité) et de support (acqui-
sition de connaissances, intégration, évaluation, documentation et gestion de configura-
tion) qui sont effectuées en parallèle avec les activités de développement (spécification,
conceptualisation, formalisation, implémentation et maintenance) tout au long du cycle
de vie de l’ontologie.
Après avoir spécifié le premier prototype, le modèle conceptuel est construit principale-
ment en soutien de l’activité d’acquisition des connaissances. Au terme de la conceptuali-
sation, les activités de formalisation peuvent être effectuées. Si aucun détail n’est détecté
dans certaines de ces activités, il est possible de retourner à des activités antérieures
pour apporter des modifications ou des améliorations.
L’activité de conceptualisation de l’ontologie mérite une attention spéciale dans l’orga-
nisation des tâches à réaliser. En principe, il est nécessaire d’avoir une perception in-
formelle du domaine en utilisant un ensemble de représentations intermédiaires (tables,
graphiques, schémas) qui peuvent être comprises par les experts du domaine et les
développeurs d’ontologies. La Figure 3.3 montre les composants de l’ontologie (les
concepts, les attributs, les relations constantes, les axiomes formels, les règles et les
instances) construits durant chaque tâche.
Les tâches de conceptualisation de l’ontologie sont décrites ci-dessous :
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 78
Tâche 1 : construire le glossaire de termes. Le glossaire doit inclure tous les termes
remarquables du domaine (les concepts, les instances, les attributs, les relations entre
concepts, . . . ). Il doit également inclure les descriptions en langage naturel, les syno-
nymes et les acronymes. Il est important de mentionner qu’au début, il peut exister divers
termes qui se réfèrent au même concept. Ceux-ci doivent être identifiés et enregistrés
comme des synonymes.
À la fin, il faut évaluer la taxonomie créée pour vérifier qu’il n’existe pas d’erreurs, telles
que l’héritage cyclique, l’erreur de partition, l’erreur sémantique ou la classification de
concepts incomplète.
Tâche 5 : décrire les relations en détail. Il faut créer la table de relations dans la-
quelle est décrite de façon détaillée toutes les relations inclues dans le dictionnaire des
concepts. Pour chaque relation, il faut spécifier le nom, les concepts sources et destina-
tions, la cardinalité et la relation inverse.
Tâche 6 : décrire les attributs d’instances en détail. Il faut créer la table d’attributs
d’instances et décrire en détail tous les attributs d’instances inclus dans le dictionnaire
de concepts. Les attributs d’instances sont les attributs qui décrivent les instances d’un
concept et leurs valeurs, celles ci pouvant être différentes pour chaque instance du
concept. Pour chaque attribut d’instance, il faut spécifier le nom, le concept auquel il
appartient, le type de valeur, le rang de valeurs (dans le cas de valeurs numériques) et la
cardinalité.
Tâche 7 : décrire les attributs de classe en détail. Il faut créer une table d’attributs
de classe et décrire en détail tous les attributs de classe inclus dans le dictionnaire de
concepts. Par chaque attribut de classe, il faut spécifier le nom, l’endroit où le concept
est défini, le type de valeur, la valeur et la cardinalité.
Tâche 8 : décrire les constantes en détail. Il faut créer une table de constantes et
décrire en détail chaque constante définie dans le glossaire de termes. Pour chaque
constante, il faut spécifier le nom, le type de valeur, la valeur et l’unité de mesure (pour
les constantes numériques).
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 80
Tâche 9 : décrire les axiomes formels. Il faut identifier les axiomes formels
nécessaires à l’ontologie et les décrire avec précision dans une table. Pour chaque
définition d’axiome formel, il faut spécifier le nom, la description, l’expression logique
qui le décrit formellement (de préférence en utilisant la logique du premier ordre), les
concepts, les attributs et les relations auxquelles l’axiome fait référence ainsi que les
variables utilisées.
Tâche 10 : définir les règles. Il faut identifier quelles règles sont nécessaires dans
l’ontologie et les décrire dans une table de règles. Pour chaque règle, il faut spécifier : le
nom, la description, l’expression qui la décrit formellement, les concepts, les attributs, les
relations auxquelles elles font référence et les variables utilisées dans l’expression. Pour
la spécification des règles, il est suggéré d’utiliser la syntaxe suivante :
Tâche 11 : décrire les instances. Une fois que le modèle conceptuel de l’ontologie a
été créé, il faut définir les instances remarquables qui apparaissent dans le dictionnaire
de concepts dans une table d’instances. Pour chaque instance, il faut spécifier le nom, le
concept auquel il appartient et les valeurs des attributs.
Ces tâches représentent la normalisation, la formalisation et l’ opérationalisation d’une
ontologie (Figure 3.4)
non seulement de fixer le cadre interprétatif, en fonction de l’objectif que s’est donné
l’ingénieur ontologique, mais également d’obtenir une primitive exploitable. Cela revient
à associer aux termes une signification puisqu’ils sont décrits selon un certain point de
vue, en l’occurrence celui de la tâche à réaliser. En pratique, l’ingénieur ontologique doit
exprimer en langage naturel les identités (caractéristiques sémantiques génériques) et
les différences (caractéristiques sémantiques spécifiques en opposition les unes avec
les autres) que chaque terme entretient avec ceux qui lui sont proches. La structura-
tion de ces termes, en fonction des identités et des différences qu’elles partagent avec
leurs termes pères et leurs termes frères dans un arbre, permet de passer à l’ontologie
différentielle.
L’ingénieur ontologique obtient à la fin de l’étape de normalisation une taxonomie de
termes. La signification de chacune s’obtient de manière composée en parcourant les
identités et les différences qui définissent l’ensemble des termes de l’arbre : du plus
générique (le terme racine) au terme cible considéré. Autrement dit, la position d’un
nœud dans l’arbre ontologique conditionne sa signification. Le processus de normali-
sation sémantique permet de passer d’un terme candidat à une notion dont le sens est
invariable, et par conséquent, à une primitive représentant une connaissance du domaine
à modéliser.
La normalisation des connaissances permet de formaliser les connaissances du do-
maine à représenter. Il s’agit de définir des concepts, et non plus des termes, selon une
sémantique formelle et extensionnelle. Grâce à cela, les concepts pourront servir comme
primitives dans un langage formel de représentation des connaissances. Il faut passer
de la dimension linguistique et interprétative de la taxinomie à l’ontologie référentielle ou
l’ontologie formelle composée de concepts et des significations. Selon la sémantique ex-
tensionnelle, les concepts sont liés à un ensemble de référents d’un ensemble d’objets du
domaine. Cet ensemble est appelé l’extension du concept. L’ingénieur ontologique peut
mettre en œuvre des opérations ensemblistes, telles que l’union, l’intersection, . . . (cf.
section 3.3.1.2), qui lui permettront de composer de nouveaux sens et donc de nouveaux
concepts formels.
La structure de la hiérarchie ontologique n’est plus alors un arbre mais un graphe concep-
tuel puisque les extensions des concepts peuvent avoir un sous-ensemble commun.
L’héritage multiple est alors possible (Figure 3.4). Cette étape de la méthodologie per-
met également de formaliser les relations qui existent entre les concepts en définissant
leur parité et les ensembles d’extensions de concepts qu’elles relient.
L’étape d’opérationalisation s’attache à informatiser l’ontologie référentielle dans un lan-
gage opérationnel de représentation des connaissances, en adoptant le formalisme des
graphes conceptuels. En effet, un système informatique ne peut pas manipuler des
concepts en fonction de leur interprétation sémantique. Il ne peut exploiter les concepts
qu’en suivant les règles et les opérations associées. Ainsi, la sémantique qui permet
à une machine d’utiliser des concepts réside dans la spécification informatique des
opérations mathématiques que l’on peut faire sur ces concepts. Ces opérations peuvent
être de plusieurs sortes en fonction du formalisme de représentation des connaissances
choisis (RDF et OWL). Il s’agit ici de définir une sémantique computationnelle pour
chaque concept de l’ontologie, c’est-à-dire que chaque concept est vu par la machine
comme le résultat d’un ensemble d’inférences et de calculs. Cette étape marque le pas-
sage à l’ontologie computationnelle.
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 82
La modélisation des connaissances d’un domaine avec les logiques de description (LD)
peut se réaliser en deux niveaux séparant les représentations de connaissances inten-
tionnelles et extensionnelles. Le premier est un niveau terminologique ou TBox, qui décrit
les connaissances générales d’un domaine alors que le second est un niveau factuel ou
ABox, et représente une configuration précise [Zom10]. Ainsi nous pouvons définir plus
précisément :
• La TBox (T pour terminologie) décrit les connaissances générales d’un domaine et
contient les déclarations des primitives conceptuelles, organisées en concepts et re-
lations, qui peuvent également être combinés grâce à des constructeurs, pour former
de nouveaux concepts. Ces déclarations décrivent les propriétés des concepts et des
relations, elles constituent donc une définition intentionnelle des connaissances.
• Une TBox (A pour assertion) décrit les connaissances factuelles d’un domaine et
représente une configuration précise. Elle contient les déclarations d’individus, ins-
tances des concepts qui ont été définis dans la Tbox. Plusieurs Abox peuvent être
associées à une même Tbox ; chacune représente une configuration constituée d’indi-
vidus et utilise les concepts et rôles de la TBox pour l’exprimer.
Cette approche nous a permis : de déterminer pour la TBox s’il existe une interprétation
quelconque pour laquelle un concept a une instance et pour la ABox de déterminer si un
individu particulier est ou n’est pas une instance d’un concept (instanciation).
Nous pouvons envisager, par exemple, une classe ontologique appelée HypertensivePa-
tient. Cette classe se composera de l’ontologie initiale (TBox). Quand nous commençons
le remplissage de la classe avec les instances sur les critères d’adhésion, nous créons
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 84
Sur la base de l’exemple ci-dessus (MildHypertension), toute entité qui remplit la condi-
tion droite de l’équation implique d’être membre de la classe MildHypertension. Globale-
ment, il existe deux types de relations : relation de taxonomie et relation associative.
Les taxonomies qui organisent des concepts (sous-super-concept) dans une struc-
ture hiérarchique. Les relations de hiérarchie les plus utilisées sont : les relations de
spécialisation connues sous le nom ≪ is-a ≫ ou ≪ is-a-kind-of ≫ (par exemple MildHyper-
tension is-a-kind-of Hypertension), et les relations partitives décrivent les concepts qui
font parties d’autres concepts (par exemple Heart hasComponent HeartValve).
Les relations associatives lient les concepts dans l’arbre structurel. Les relations plus
communes sont : les relations nominatives qui décrivent les noms des concepts (par
exemple Disease hasName CongestiveHeartFailure), les relations locatives décrivent
l’emplacement d’une notion ou d’un concept l’un par rapport à l’autre (par exemple
HeartValve hasPhysicalLocation Heart), et les relations associatives qui représentent les
propriétés qui peuvent être attribuées à un concept (par exemple CongestiveHeartFai-
lure playsPathologicalRole Disease).
Les relations peuvent également être hiérarchiques. Par exemple, la relation has-
Name peut être subdivisée en hasDiseaseName et hasPatientName. Ces relations ont
également des fonctionnalités (comme la transitivité et la cardinalité) qui capturent des
connaissances supplémentaires sur les relations entre les concepts.
4. GALEN http://www.ncbi.nlm.nih.gov/pubmed/7889770
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 85
Les logiques de description aussi appelées Logique Descriptive (LD) sont des langages
formels permettant de représenter des propriétés pour des ensembles de connaissances
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 86
Par exemple si nous supposons la définition du concept ≪ patient ≫ comme une ≪ per-
sonne qui a une maladie ≫, selon le Tableau 3.1, la syntaxe de LD pour cette déclaration
est la suivante :
Les membres individuels d’une classe peuvent être spécifiés explicitement (par exemple
Jean is-a Patient), les classes peuvent également être définies de façon plus générale
en termes d’axiomes. Ces axiomes décrivent les conditions nécessaires ou conditions
suffisantes concernant les individus qui sont membres d’une classe. Par exemple, un
patient avec une pathologie cardiaque peut être défini comme suit :
HeartDisease(d)
HeartDisease ⊑ Disease
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 87
Où d affirme une maladie cardiaque HeartDisease qui est elle-même une sous-classe
d’une maladie Disease. La règle ∃hasDisease(p, d) est aussi appelée une restriction de
propriété (dans cet exemple, une propriété ≪ existentielle ≫ dans le tableau 3.1). Il existe
d’autres types de restrictions des propriétés, telles que les restrictions universelles,
déclarant que toutes les valeurs d’une propriété doivent appartenir à certaines restric-
tions de classes et de cardinalité, et déclarant que l’instance doit avoir un certain nombre
de valeurs distinctes pour une propriété.
L’utilisation d’axiomes pour la définition des classes et des propriétés permet de
déterminer automatiquement les contradictions au sein d’une ontologie qui est appelé
vérification de cohérence [Zom10]. Dans l’exemple précédent si nous avons p qui est
déclaré comme une instance de HeartPatient mais qu’il n’est pas lié à une instance de
HeartDisease pour la propriété existentielle ∃hasDisease, alors un système d’inférence
(connu sous le nom OWL raisonneur) peut détecter cette incohérence automatiquement.
La nature combinatoire de OWL–DL permet à de nouveaux concepts d’être créés à
partir de la combinaison de concepts existants et qui sont automatiquement placés
dans la hiérarchie ontologique. Les services de raisonnement fournis par OWL reaso-
ners (logiciels d’application qui peuvent faire des déductions logiques basées sur des
axiomes OWL) ont de nombreuses applications qui sont spécifiquement adaptées pour
les systèmes de classification dans le domaine biomédical.
La terminologie médicale utilisée dans le domaine de la Cardiologie et la Neurologie
est caractérisée par un grand nombre de termes, qui sont décrits comme des artefacts
linguistiques, lesquels relient les différents sens ou significations aux entités. Ces termi-
nologies ont des finalités bien établies (par exemple la récupération d’information dans
des documents, l’enregistrement de statistiques de mortalité et de morbidité, la factu-
ration des services de santé, . . . ). La plupart de ces terminologies n’utilisent pas des
descriptions formelles, elles définissent les termes à travers des expressions du langage
humain et par des associations explicites entre les termes par des relations informelles,
également proches du langage humain. Ils sont formés avec des racines grecques et la-
tines, préfixes et suffixes ce qui vise à simplifier la langue, à trouver de la précision dans
le sens des mots et à faciliter les échanges scientifiques entre les pays de différentes
langues.
Les maladies vasculaires sont plus présentes au niveau du cœur. Un exemple simple sur
les fonctions du cœur est :
• Le cœur est une pompe à sang, comme concept, il est composé de deux pompes dis-
tinctes : le côté droit qui pompe le sang des poumons et le côté gauche qui pompe
le sang des organes périphériques. Chacune de ces parties séparées du cœur est
composée d’un atrium et d’un ventricule. Ces deux grosses artères sont connectées à
un système fermé (vaisseaux, vaines, capillaires) de distribution vasculaire. Si le cœur
ou le système vasculaire souffre d’une insuffisance de sang, alors plusieurs facteurs
physiologiques d’un patient peuvent se développer comme des dysfonctions ou des
maladies. Par exemple : la cardiopathie, la sténose, l’insuffisance cardiaque, l’embo-
lisme, la thromboses, l’accident vasculaire cérébral, la mort subite, . . .
Selon l’information précédente, la base de connaissances est composée de deux
éléments : (1) le traitement de la terminologie, qui dispose d’un ensemble d’axiomes
et des déclarations qui décrivent la structure du domaine (logique de description TBox) ;
(2) le traitement des déclarations des éléments ou des objets (logique de description
ABox ). Autrement dit, l’ABox contient des connaissances intentionnelles sur le domaine
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 88
d’intérêt et le TBox est un modèle de base de déclarations des concepts et cette base
est constituée d’un ensemble d’assertions et d’inclusions entre les concepts. Les com-
posantes de base TBox et ABox sont présentées dans la Table 3.1. La déclaration ci-
dessous est l’expression du concept de la cardiopathie valvulaire (Valvular Heart Di-
sease), qui se traduit comme un élément du concept cœur (Heart) et du concept maladie
cardiaque (Heart Disease).
Selon la déclaration suivante, pour qu’il y ait la référence à l’artère coronaire, l’élément
doit appartenir au concept de Heart et non au concept de Valvular Heart Disease.
Pour l’ABox il est possible de faire deux types de déclarations différentes : la déclaration
de concepts et la déclaration de rôles, où la construction de la connaissance extension-
nelle prend place quand les concepts et les rôles sont des déclarations affirmatives (as-
sertives) sur les éléments. La déclaration de concepts : Valvular Heart Disease (Ste-
nosis) signifie que l’élément Stenosis appartient au concept Valvular Heart Disease. La
déclaration de rôles : Heart Diseases (Stenosis, Right Coronary Arthery) signifie que
l’élément Stenosis se rapporte à l’élément Right Coronary Artery à travers le rôle de
heart diseases. Il est possible de faire différentes logiques de description, chacune étant
spécifique à une situation particulière. Les classements suivants montrent les services
typiques d’inférence dans TBox et ABox :
L’équivalence entre les instances. Affirmer que les concepts C et D sont équivalents
(C ≡ D), revient à dire qu’ils ont la même instance. Un exemple est le concept de Right
Coronary Artery et Electrical Conduction Disorders of the Heart.
Le modèle ABox :
Le modèle ABox :
De cette information, nous pouvons dire que l’élément Stenosis appartient au concept de
Heart Valve Diseases.
Retour d’élément. Cette tâche consiste à trouver le concept le plus spécifique sur le-
quel l’élément est une instance. Dans le cas de l’élément Stenosis, la détermination du
concept le plus spécifique (concept le plus bas de la hiérachisation) est rendue possible
grâce au modèle suivant :
Le modèle ABox :
Retourne l’élément :
Valvular Heart Disease (valvular insu f f iciency) ⊔ Valvular Heart Disease (S tenosis)
Résultat :
F IGURE 3.6 – Classe OWL du concept ≪ heart valve disease ≫ (pathologies du cœur)
F IGURE 3.7 – Classe OWL du concept Infarctus comme pathologies du cœur et du cer-
veau
Rappelons que nous travaillons avec les cardiologues mexicains de Morelia (en particu-
lier pour évaluer et valider l’ontologie de la pathologie), et nos ontologies ont donc été
conçues en anglais afin d’être également utilisables en Europe.
L’ontologie extraite du thésaurus MeSH pour le domaine vasculaire contient 525 classes
OWL, chacune correspondant à un descripteur MeSH. La première étape de l’enrichis-
sement du vocabulaire en langue anglaise a été d’augmenter de 7 320 le nombre de
nouveaux termes, 2 500 étant des synonymes et les autres sont des variantes lexicales
(Figure 3.9). Le concept est représenté par son ID provenant du MeSH et un terme appelé
aussi terme préféré (preferred term). Nous avons associé dans cette phase Jean-Denys
Maréchal, élève ingénieur en Génie Biomédical (École ISIFC) que j’ai encadré en stage
de fin d’étude R & D.
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 93
Un exemple d’une classe OWL est donné ci-dessous pour le concept Infarctus (Infarction)
des pathologies du cœur (Figure 3.7 et Figure 3.8) qui est la sous-classe hiérarchique
de Pathological Bodily Process. L’ontologie complète du système vasculaire (Figure
3.10) correspond à la modélisation des maladies du cœur, du cerveau, du système
périphérique et rénal.
Les ontologies ont également un intérêt dans les applications de diagnostic, surtout pour
l’aide aux décisions cliniques. Les ontologies dans le domaine du diagnostic peuvent être
utilisées pour représenter la connaissance globale des patients (par exemple données
des patients, les diagnostics, les prescriptions, les résultats de tests, les imageries, . . . )
[Bla09]. Le diagnostic des maladies du système vasculaire combine une série de tests
de laboratoire et en particulier des images d’exploration. Depuis 2004 5 , les organisations
médicales et de santé ont approuvé le partage d’informations numérisées du patient sous
la forme d’historique clinique électronique basé sur un standard de communication pour
l’imagerie appelé DICOM 6 (Digital Imaging and Communication in Medicine)[Vos07]. Ce
standard a évolué au cours des dernières années pour prendre en charge non seulement
des images médicales, mais également d’autres types d’informations médicales comme
des vidéos, des signaux et des rapports structurés. On retrouve par exemple : l’identifica-
tion du patient, les procédures de l’étude, la date de l’étude, l’identification du médecin,
l’identification de l’institution et le diagnostic (ou des observations) [Med12].
Notre objectif est de fournir un scénario de diagnostic évolutif des patients, basé sur
DICOM. Ce scénario de diagnostic doit comprendre : l’information de patient, le problème
de santé relevant du patient, les examens et les résultats, les diagnostics et leurs images,
les traitements et la médication appliquée au patient. C’est donc l’utilisation du potentiel
de l’information pour le soutien clinique, la prise de décision et le travail collaboratif.
Avec l’émergence de DICOM, son intégration a été étendue aux dispositifs d’acquisi-
tion, de visualisation, d’impression et de stockage des images médicales de différents
Dans un cheminement de pensée décisionnelle classique utilisé par les médecins, l’étude
des symptômes, les analyses et l’observation des résultats qui conduisent au diagnostic
sont accompagnés d’une procédure de soin adaptée. Ce cheminement se rapproche
du modèle SOAP 7 (Subjective, Objective, Assise et Plan), lequel est utilisé par certains
médecins pour décrire l’état de santé complet d’un patient. Dans un tel modèle, la partie
Subjective décrit les symptômes et les signes cliniques du patient, la partie Objective
décrit les observations et les analyses des médecins, la partie Assise correspond aux
maladies et aux problèmes de santé du patient et enfin la partie Plan correspond aux
procédures de soins ou au plan de santé mis en place pour résoudre les problèmes du
patient.
Une ontologie pour la modélisation du diagnostic doit permettre de représenter un che-
minement logique d’une procédure classique de soin. Cette démarche permet, au tra-
vers d’un modèle informatique, la représentation d’une prise de décision formalisée pour
différents cas et différents types d’imagerie DICOM.
Le flux d’informations et de connaissances qui peut être inclus dans les documents
numérisés (DICOM) au sein d’un modèle ontologique permet le partage des données
et des connaissances entre les médecins sur un travail collaboratif (Figure 3.13). L’infor-
mation partagée doit être intégrée dans une ontologie qui considère toutes les situations
possibles de diagnostic pour que les données soient effectivement partagées correcte-
ment. Cette ontologie du diagnostic doit comprendre : (1) l’information du diagnostic qui
inclut la maladie et les analyses d’un patient ; (2) les symptômes qui représentent les
malaises et les problèmes physiques du patient ; (3) les traitements représentés par les
médicaments ou thérapies prescrits pour la maladie ; et (4) les observations ou notes du
médecin.
Il existe un problème principal pour la spécification des diagnostics. En effet, un médecin
peut définir le diagnostic de différents manières. Par exemple, le médecin peut utiliser
les symptômes comme élément de plus haute importance pour référencer les maladies
qui référencent les traitements, tandis qu’un autre peut utiliser la maladie pour organi-
ser les symptômes et leurs traitements. Le problème est la recherche et la sélection
des données, car les traitements peuvent être associés à différentes maladies qui ont
des symptômes similaires. La complexité d’adaptation de l’information est aussi struc-
turelle. L’information peut avoir différentes hiérarchies au sein de l’ontologie. Pour cette
raison, il est très important que l’ontologie du diagnostic soit unifiée syntaxiquement et
sémantiquement pour s’adapter aux différents diagnostics.
L’adaptation des éléments de diagnostic à une ontologie OWL basée sur des classes,
des attributs et des relations doit représenter également les caractéristiques et les pro-
priétés du diagnostic d’un patient. L’ontologie comprend : l’information du patient, l’infor-
mation du médecin et l’institution qui contrôle la visite du patient, le maladie traitée, la
procédure et le type d’imagerie, les observations et diagnostic, le traitement ainsi que
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 99
La classe Patient est définie en utilisant divers attributs (id, nom, adresse, sexe, date de
naissance, . . . ) qui correspondent à des données statiques dans DICOM. La classe est
liée à l’association de données du patient et à Visite qui contrôle la date du diagnostic et
le lien Médecin – Patient.
La classe Médecin a les mêmes attributs que Patient car les deux sont des personnes as-
sociées à un même diagnostic. La différence entre Patient et Médecin est que le Patient
est directement lié à une Visite et le Médecin est lié à une Institution. On peut affirmer la
relation suivante : ≪ Le Patient (données du patient) a une Visite (date du diagnostic) chez
le Médecin (données du médecin) qui travaille dans l’Institution (données de l’hôpital ou
clinique où il a effectué le diagnostic) ≫.
Les classes Procédure, Observation, Traitement, Thérapie ont un lien direct avec l’ontolo-
gie du système vasculaire pour la représentation exacte des données pour un diagnostic
complet (Figure 3.15 )
La logique de description sur une procédure Heart Valve (présence d’une maladie :
Stenosis, Thrombosis, Heart Inssuficiency, . . . ) pour montrer la relation Diagnostic –
Procédure – Maladie est la suivante :
La représentation basée sur la LD décide que certaines restrictions ajoutent par défaut
le constructeur ∀. Dans un diagnostic, il est également nécessaire de savoir quel organe
présente une insuffisance.
mais également de disposer de l’avis d’un autre médecin spécialisé situé à distance
du lieu de réalisation du diagnostic. Cette communication a l’avantage de favoriser
les échanges de connaissances et de savoir-faire entre les médecins pour la prise de
décision du diagnostic et du traitement.
Le recours à la télé-médecine doit s’exercer dans le respect d’un certain nombre de
principes pour garantir le bon usage des dossiers des patients et assurer la pratique
raisonnée et maı̂trisée des transmissions de données sensibles.
L’objectif d’une ontologie de traçabilité du diagnostic est de conserver l’ensemble des
actions d’expertises du diagnostic collaboratif, avec un principe d’optimisation de l’acces-
sibilité aux données de grandes tailles qui sont manipulées et échangées. Car, comme
nous l’avons montré dans l’état de l’art (cf. 1.3.3, la traçabilité a été identifiée par le
Conseil National de l’Ordre des Médecins comme indispensable. Et grâce aux ontolo-
gies, l”accès aux traces se fera de manière optimisée.
L’informatisation des données de santé, en France et Europe, est protégée par un cadre
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 105
juridique [OJEU13], qui décrit le processus de traçabilité et définit les conditions mini-
mums qui doivent être garanties, c’est-à-dire : (1) l’authentification des professionnels de
santé intervenant dans l’acte ; (2) l’identification du patient ; (3) l’accès des professionnels
de santé aux données médicales du patient nécessaires à la réalisation de l’acte.
Le développement d’une ontologie dédiée à la traçabilité du diagnostic et le suivi médical
des patients a pour principal objectif : l’amélioration de la qualité des diagnostics dans
le domaine vasculaire. L’ontologie de traçabilité avec l’ontologie du diagnostic va per-
mettre un post-traitement du diagnostic dans un travail collaboratif sous la responsabilité
des médecins des différentes spécialités. L’application de cette ontologie doit s’intégrer
dans des environnements informatiques qui permettent une meilleure interprétation des
résultats de l’imagerie et du diagnostic associé (cf. Chapitre 4).
L’objectif principal de cette ontologie est de permettre un échange d’information entre les
professionnels de santé qui contribuent à l’amélioration du diagnostic (Figure 3.18) par le
partage d’expériences et principalement l’aide à la prise de décision clinique. Pour obte-
nir une collaboration clinique, il est nécessaire de pouvoir : (1) Récupérer les différents
diagnostics liés au patient tout au long de sa gestion clinique ; (2) Récupérer les traite-
ments et procédures liés au diagnostic ; (3) Afficher la chronologie de participation des
médecins qui ont contribué aux diagnostics ainsi que leur institution hospitalière et (4)
Afficher les commentaires, les observations ou les recommandations cliniques que les
médecins ont proposés.
L’enjeu principal de cette ontologie constitue un facteur clé d’amélioration de la perfor-
mance du diagnostic. Son utilisation dans le travail collaboratif est la réponse organisa-
tionnelle et l’unification entre Diagnostic–Collaboration (Ontologie de diagnostic – Onto-
logie de traçabilité). Les objectifs d’utilisation de cette ontologie sont :
• l’amélioration de l’accessibilité de tous les médecins travaillant de manière collabora-
tive,
• l’impulsion d’une meilleure coordination entre les médecins (enregistrement de : ac-
tions de participation, contenus, informations du spécialiste, dates et heures de parti-
cipations),
• la favorisation au recours maı̂trisé du diagnostic du système vasculaire numérisé,
• La prise en compte des besoins et attentes du patient,
• L’amélioration en toute sécurité du partage de l’information entre les professionnels de
santé,
• La favorisation d’une meilleure prise de décision clinique.
La Figure 3.19 montre une représentation de l’information dans l’ontologie de traçabilité.
Cette ontologie fournit l’information nécessaire pour la distribution du diagnostic et la
modélisation du travail collaboratif entre les professionnels. L’ontologie de traçabilité est
liée directement à l’ontologie du diagnostic et a quatre fonctions principales : (1) Décrire
les différents types de dysfonctionnement dans le système vasculaire ; (2) Donner un
aperçu de tous les examens et traitements associés au patient ; (3) Montrer les institu-
tions et les médecins qui ont collaboré pour améliorer le diagnostic et les observations
individuelles pour la prise de décision clinique ; et (4) Montrer la participation (en enre-
gistrant la date) au diagnostic.
CHAPITRE 3. CONCEPTION DES ONTOLOGIES DANS LE DOMAINE VASCULAIRE 106
C ONCLUSION
Nous avons présenté, dans ce chapitre, la démarche que nous avons utilisée pour le
développement de nos trois ontologies : l’ontologie du système vasculaire, l’ontologie
du diagnostic et l’ontologie de traçabilité.
Nous avons adopté une démarche méthodologique, dites à partir de rien pour
leur développement. Ces ontologies nous permettent d’effectuer la caractérisation
sémantique d’informations médicales pour l’aide à la collaboration des diagnostics et
décisions cliniques. L’ontologie de diagnostic et l’ontologie de traçabilité ont pour but
l’indexation des connaissances à travers une langue de spécialité (vocabulaire, termi-
nologie et sémantique spécifiques du diagnostic) pour le travail collaboratif.
I NTRODUCTION
Faciliter les interactions entre médecins peut être une réponse aux besoins et aux exi-
gences du système de santé d’aujourd’hui. En particulier, ce type d’interaction aborde la
nécessité d’un accès à l’information médicale sans restriction aux services de santé et
facilite la gestion du flux de travail dans une plateforme médicale. L’objectif est de favori-
ser les interactions entre médecins par un mécanisme solide (cloud computing basé sur
un mode SaaS) et un moteur de recherche ontologique des connaissances cohérentes
qui permet de créer de nouvelles connaissances pour le traitement des maladies com-
plexes. La plateforme exploite le standard DICOM qui est une représentation structurée
des examens du patient, d’imagerie et du diagnostic liés entre eux.
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 112
nostic et ontologie de traçabilité, cf. Chapitre 3) en utilisant des images au format DICOM.
Pour aider à la réalisation d’un diagnostic, COOVADIS a comme objectif la corrélation de
l’information des diagnostics et la création dynamique de connaissances au cours des
interventions temporaires, c’est-à-dire, des connaissances créées durant un travail col-
laboratif où chaque spécialiste peut partager des informations, des expériences et des
expertises pour la prise de décisions cliniques. Ainsi la plateforme permet aux profession-
nels impliqués dans l’aide au diagnostic collaboratif d’avoir un accès total aux rapports
médicaux mis à jour et aux images exploratoires DICOM associées.
Comme nous le montre l’état de l’art du travail collaboratif (cf. Section 1.1) les points
clés du travail collaboratif sont le partage de l’information, et les échanges cohérents des
partages (par exemple des données patient) et des actions (par exemple participation au
diagnostic de chaque acteur professionnel de santé).
La Figure 4.2 montre notre objectif principal qui est de mettre en œuvre le partage de l’in-
formation entre professionnels de la santé et l’amélioration les diagnostics numériques en
appui sur des images DICOM. Cette chaı̂ne de traçabilité contient la catégorisation : de
l’information du diagnostic, de l’information de la pratique clinique, des mentions et ob-
servations du médecin, des institutions médicales, du type des images d’observation, du
fabricant d’appareillage pour l’imagerie médicale et de l’amélioration du diagnostic pour
le travail collaboratif.
La valeur ajoutée de cette plateforme est un gain de temps pour la prise de décision
clinique sur des diagnostics complexes. La plateforme aide les médecins à :
• partager des informations cruciales,
• faire une interprétation sémantique de l’information,
• faire un rapport automatique pour aider les médecins plus expérimentés,
• obtenir une collaboration médicale sans que le groupe de travail soit physiquement
présent à chaque instant.
Cette chaı̂ne de traçabilité permet l’inclusion de tous les diagnostics passés et présents
liés au patient pour avoir une meilleur visibilité sur l’évolution de la pathologie grâce au
support des ontologies.
Comme nous l’avons montré dans l’état de l’art (cf. Section 1.3.3), la traçabilité a été iden-
tifiée par le Conseil National de l’Ordre des Médecins comme indispensable. La réduction
des inégalités de ressources entre les établissements de santé figure dans la réforme de
l’hospitalisation. La normalisation des diagnostics et des actes médicaux est devenu une
obligation légale des structures de soins (cf. section 3.3.2.1).
Notre volonté est que pour proposer un environnement d’aide au diagnostic collaboratif,
il faut :
• non seulement permettre aux médecins de se ré-approprier le diagnostic du patient en
mettant en place un langage médical habituel et complet,
• mais également proposer une plateforme semi-automatique pour assister le médecin
dans sa tâche de collaboration, d’interprétation du diagnostic et de prise de décision.
Cette plateforme propose aux médecins spécialisés en cardiologie, neurologie, chirurgie
vasculaire, médecine interne, urgence. . . de partager leurs questions, leurs observations
et leurs échanges d’avis avec leurs confrères, de manière asynchrone ou en temps réel.
Ils peuvent notamment échanger sur les cas cliniques qui leur posent problème, voire
même confronter leurs pratiques professionnelles à celles de leurs confrères.
Selon leurs besoins, les médecins peuvent ainsi solliciter l’avis et la collaboration au diag-
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 114
F IGURE 4.2 – Partage de l’information entre professionnels pour l’amélioration des diag-
nostics
sont : strock, acute accident, apoplexy, heart attack, infarct, coronary accident, vascular
accident. . . ). Pour résoudre ce problème, cette plateforme permet l’utilisation d’ontolo-
gies qui gèrent la terminologie médicale complète utilisée aujourd’hui par les centres
médicaux (ontologies en langue espagnol pour l’évaluation des cardiologues mexicains
de Morelia, et ontologies en langue anglaise afin d’être également utilisables en Europe).
Il est essentiel pour une collaboration entre médecins distants d’avoir la possibilité
d’accéder à l’application par un navigateur Web : en effet, on peut ainsi s’affranchir de
l’hétérogénéité des plateformes, les outils personnels de navigation Web se chargeant
pour une grande partie de la gérer. COOVADIS est développé en mode SAAS Software
as a Service, lequel permet un meilleur contrôle de l’information accessible pour la colla-
boration. Nous avons utilisé également des technologies sémantiques pour le stockage,
la représentation et le traitement des informations des diagnostics.
Nous ne souhaitons pas automatiser la procédure de diagnostic. Notre idée est de propo-
ser une représentation des connaissances avec laquelle le médecin peut interagir pour
l’aider à construire une représentation de la pathologie du patient, en tenant compte
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 116
F IGURE 4.4 – Travail collaboratif pour l’ajout de connaissance sur des cas cliniques
Pour obtenir des résultats attendus par la collaboration, la plateforme COOVADIS fournit à
chaque médecin au sein de l’environnement de collaboration, la même base de connais-
sances et elle contient une section pour l’ajout de commentaires et/ou d’observations à
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 117
la prise de décisions. Une fois que les médecins ont participé, leurs ajouts seront ana-
lysés afin de trouver des similitudes au sein de la base de connaissances ontologiques,
qui est considérée comme la base commune de connaissances. Les résultats des nou-
velles consultations, sur des mêmes cas cliniques, utilisent cette base de connaissances
commune et les résultats s’affichent avec l’ajout de la connaissance avec l’information de
chaque participation (Figure 4.4).
Nous disposons également d’un thésaurus spécialisé dans les pathologies du système
vasculaire, des diagnostics numérisés sur le standard DICOM (fournis en langue espa-
gnol) mis au point et fourni par le Centro Unión-diagnostico médico et par l’UPAC (Unidad
de prevención y atención cardiometabolica), institutions de santé de Morelia au Mexique.
Ce thésaurus prend en compte les cas de codages médecin-diagnosticien les plus cou-
ramment utilisés par les cardiologues et neurologues. Les codages comprennent deux
parties : (1) le code de diagnostic selon le codage médecin-radiologiste (Centro Unión)
et (2) le code de diagnostic selon les observations des spécialistes traitant des patients
(UPAC). Les images DICOM nous servent à enrichir le vocabulaire fourni par les onto-
logies et par conséquent à améliorer la reconnaissance automatique des expressions
pertinentes dans des dossiers médicaux réels. Ces ressources médicales sont montrées
dans la Figure 4.5. Ces données (images DICOM) sont stockées dans une base de
données MySQL qui contient donc plusieurs examens de patients et leurs descriptions
pathologiques.
Dans cette deuxième section du chapitre 4, nous décrivons les choix et outils qui nous
ont permis de développer le premier prototype de COOVADIS. Cette section demeure
très technique, mais il était important qu’elle figure au sein de ce document pour justifier
des choix qui ont mené au produit final qui est utilisé dans le chapitre 5 pour la validation.
Pour la réalisation de notre plateforme nous avons étudié et utilisé différents outils. Ces
outils permettent le développement de nos ontologies, mais également la communication
entre elles, la réalisation de requêtes, et la représentation des résultats au sein d’une
page web. Ils sont présentés ci-dessous :
• Protégé-2000 est un logiciel open-source pour l’édition et le développement des
ontologies (RDF, RDFS, OWL). Cet éditeur permet de développer une ontologie pour
un domaine donné, de définir des formulaires d’entrée de données et d’acquérir des
données à l’aide de ces formulaires sous forme d’instances de cette ontologie. Il existe
également une librairie Java qui peut être étendue pour créer de véritables applications
à base de connaissances en utilisant un moteur d’inférence pour raisonner et déduire
de nouveaux faits par l’application de règles d’inférences aux instances de l’ontologie.
• Java, qui par ailleurs devient un standard, est également une plateforme open-source
qui permet de manipuler de nombreux langages pour les ontologies (Jena, SPARQL),
de réaliser le design et la communication web (HTML5, JavaScript, JSP) et de gérer
les accès à des bases de données (SQL).
• Jena est une API open-source (licence Apache) développée par HP Labs semantic
Web programme, permettant de lire et de manipuler des ontologies décrites en RDF,
RDFS ou OWL, de stocker en mémoire les connaissances et d’appliquer certains
mécanismes d’inférences.
• JSP est un langage de programmation qui sert à créer des programmes sur le web. Il
permet l’intégration de contenu dynamique. JSP (Java Servlet) permet de programmer
simplement l’affichage de contenus dynamiques sur HTML, qui inclut du code Java qui
s’exécutera soit sur le serveur Web, soit sur le serveur d’application. Le langage HTML
décrit la manière dont s’affiche la page. Le code Java sert, quant à lui, à effectuer
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 119
un traitement, par exemple récupérer les informations nécessaires pour effectuer une
requête dans une base de connaissances.
• dcm4che est une application open-source créée en Java pour l’application du service
de santé. C’est une implémentation robuste de la norme DICOM qui permet la gestion
de l’image et de son contenu.
L’implémentation de COOVADIS consiste premièrement à l’édition de nos ontologies avec
le langage OWL, suivie par son exploitation dans une application de gestion Jena et
d’annotation JSP, afin d’intégrer une application développée pour le travail collaboratif
accessible par le web. Les ontologies ont été développées avec le logiciel Protégé et
la manipulation des ontologies est faite par Jena 2.6.4 (version la plus récente de Jena
au moment de l’implémentation). Nous avons également utilisé JSP pour les communica-
tions réseaux par lesquelles les requêtes SPARQL et les réponses sont émises. Il décode
également les requêtes faites pour les utilisateurs (médecins) et formate les réponses
SPARQL au format approprié supporté par le protocole HTTP. Les dossiers des patients
intégrés aux images DICOM sont stockés dans une base de données MySQL manipulée
par JSP grâce à dcm4che3. La Figure 4.6 montre l’interaction décrite.
L’extraction des informations des diagnostics n’est pas une tâche difficile car la norme
DICOM déclare dans des entités spécifiques les données qui sont classées par segment
(par exemple un segment ST peut traduire un infarctus du myocarde en phase aiguë). De
plus, la norme est construite autour d’un langage standardisé facilement interopérable par
les systèmes d’information (Figure 4.7). L’avantage d’utiliser un standard est qu’il existe
de nombreux outils qui facilitent la gestion et la manipulation des messages sans qu’il
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 120
′ ′ ′ ′
∗
(Oi )iǫI , Ai j ∪ Oi , Ai j (i, = Oi ∪ Oi , Ai j ∪ Ai j (i,
(i, j)ǫI 2 iǫI j)ǫI 2 iǫI j)ǫI 2
Où :
O correspond à l’ontologie,
A correspond au concept atomique,
I correspond à l’index conceptuel,
(i, j) correspond aux coordonnées hiérarchiques de l’ontologie
L’union ontologique a été faite entre l’ontologie du système vasculaire et l’ontologie du
diagnostic, qui partagent des concepts index référant à la pathologie du patient (concept
général de la hiérarchie ontologique : vascular disorder, heart disorder, brain disorder,
peripheral disorder, renal disorder ). De même, l’union ontologique entre l’ontologie du
diagnostic et l’ontologie de traçabilité qui partagent des concepts index fait référence au
patient et au dossier médical (concept général de la hiérarchie ontologique : Patient et
Study ID) (cf. Figure 4.8).
L’étape de traitement consiste à appliquer les patrons lexicaux qui peuvent être re-
connus par dcm4che dans la structure DICOM. Ainsi, ils permettent d’analyser des
segments textuels porteurs de sens et de les étiqueter sur les graphes syntaxiques
d’ontologies manipulées par Jena. Les séquences extraites correspondent aux patrons
de l’ontologie alimentée. Par exemple, une phrase complète obtenue par analyse qui
représente les instances peut être : Stenosis in the left coronary artery, injured by ci-
garette smoking. Nous pouvons éventuellement attribuer des sorties aux transitions du
graphe comme : < Stenosis,.Affection >, < left coronary artery,.ObjetAnatomique >,
< coronary,.ObjetAnatomiqueCoeur >, < injured,.Qualificatif > et < cigarette smo-
king,.OrigineDeAffection >.
Les ressources lexicales sont regroupées par une forme associative, soit en forme
dérivée, soit en forme synonyme. Ces formes sont récupérées en accord avec le diction-
naire ontologique par le terme préféré du concept (preferred term), lequel est un concept
Nous présentons dans cette section deux dossiers médicaux d’un patient réel. L’enrichis-
sement des dossiers médicaux (dans les images au format DICOM) a été effectué par
le médecin radiologue Dr. Fernando Sánchez du Centro Unión, au Mexique. Il détaille
les diagnostics résultant d’imageries faites sur patient. Le Dr. Jaime Carranza Madrigal,
médecin cardiologue de l’hôpital Civil de Morelia, a complété ces informations par l’en-
tretien avec patient, ainsi qu’à l’aide des diagnostics résultant de l’examen physique et
du traitement.
Sept mois plus tard, le 24 novembre 2008, le patient a présenté un deuxième acci-
dent vasculaire cérébral. Le cas est le suivant :
Mr J., âge de 64 ans, fumeur, porteur d’un diabète de type 2 révélé il y a 7 ans. Le patient
présente brutalement un déficit moteur du côté gauche responsable d’une chute. Ses
antécédents personnels résident en une hypertension artérielle traitée par du COTAREG
160/12, du LODOZ 10 et du BISOPROLOL 10mg, et des chiffres de PA élevés à plu-
sieurs occasions, fluctuant entre 150/94 et 162/104 mmHg. Il précise qu’au cours des 10
dernières années des chiffres élevés de PA avaient été retrouvés de façon inconstante.
Il existe un antécédent d’AVC ischémique avec sur-poids. Le poids actuel est de 115 kg
pour 1.73 m. Le périmètre abdominal est de 147 cm.
L’examen physique :
Le patient est conscient, il présente un déficit moteur du côté gauche à 2/5 avec troubles
sensitifs de même topographie et difficultés d’expression orale avec paraphasies. Il
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 128
présente une HTA de grade 1 à 2 chez un diabétique de type II, fumeur. Il s’agit d’un
sujet à risque cardiovasculaire élevé en référence à l’âge, sexe, présence d’un diabète
de type II et un antécédent d’AVC ischémique. La TA est de 180/100 mm de mercure. Le
pouls est irrégulier et l’ECG montre un tracé de FA. Sur le plan anamnestique, il s’agit
d’un sujet hypertendu traité. L’auscultation cardiaque est normale de même que la pal-
pation des pouls périphériques. L’examen vasculaire n’a pas retrouvé d’anomalie et en
particulier pas de souffle sur les trajets artériels. Le pouls est à 88 battements/minute, et
la température est de 37.4 degrés.
L’examen d’imagerie :
L’IRM (L’imagerie par résonance magnétique nucléaire) montre des déficits sensitifs
ou moteurs unilatéraux, une aphasie et une cécité monoculaire transitoire. Le patient
présente un syndrome optico-pyramidal, un déficit brachio-facial et un trouble du langage
avec un déficit du membre supérieur dominant. Ils sont le fait d’un déficit carotidien.
Diagnostic :
La glycémie suggère un contrôle glycémique insuffisant, mais une Hb glyquée est indis-
pensable. Il existe une dyslipidémie associée au diabète II avec hypertriglycéridémie, un
HDL bas et un LDL à 1.45 g/l (formule de Friedwald) ; il s’agit des anomalies lipidiques
liées à l’insulinorésistance à situer dans le contexte de diabète 2. On retient la présence
d’une microalbuminurie significative à 60 mg/24h. Le traitement initial comprend un anti-
hypertenseur assurant une néphroprotection par Losartan 50-100mg 1cp et Atorvastatine
10mg.
A la suite des examens, la première étape consiste à récupérer l’ensemble des infor-
mations présentes au sein de l’image DICOM, c’est-à-dire, les informations personnelles
du patient (ID, nom, âge, sexe. . . ) ainsi que le diagnostic (ID de l’image DICOM, type
d’imagerie, date de création. . . ). Cette étape permet ainsi d’adapter le contenu présent
au sein des images au format de l’ontologie afin d’en extraire uniquement les données
pertinentes pour les besoins des professionnels de la santé. La seconde étape consiste
en l’interprétation des interventions cliniques chez le patient (les types d’études, les ob-
servations des résultats et les traitements). Cette étape permet d’intégrer l’ensemble des
dossiers d’un patient au sein d’un même système facilitant ainsi la visualisation des diag-
nostics et l’accès aux informations.
La connaissance liée au patient est traitée par un processus de filtrage et de restructura-
tion basé sur quatre objectifs principaux :
• (1) fournir une description du patient (historique clinique),
• (2) déterminer les acteurs (médecins) directement impliqués dans la prise en charge
du patient,
• (3) fournir une description intégrée des maladies et traitements du patient pour la
compréhension de certains aspects de l’évolution du patient,
• et (4) produire une structure de connaissances intégrée dans la plateforme afin d’ana-
lyser l’état du patient.
Nous savons qu’il est difficile dans un système de terminologie de retrouver le terme qui
exprime fidèlement le sens associé au libellé d’un diagnostic. L’utilisation de nos onto-
logies va permettre de lever ces ambiguı̈tés. Chaque concept est désigné par un terme
préféré qui correspond au terme employé par le médecin (le terme préféré est la forme
canonique du terme). À partir de l’ontologie, nous avons pu extraire automatiquement
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 129
les informations nécessaires pour la construction d’une sémantique à savoir les termes
préférés associés aux concepts de l’ontologie et leurs synonymes.
CHAPITRE 4. COOVADIS : COLLABORATIVE VASCULAR DIAGNOSIS 130
Un concept défini peut être composé de deux ou plusieurs concepts primitifs reliés entre
eux par une ou plusieurs relations. La plupart du temps, une expression est modélisée
pour un concept défini. Cette combinaison sous-entend la présence de relations entre ces
concepts, même si elles ne sont pas explicitées. Une définition explicite de ces liens doit
être faite pour le codage DICOM. Ces liens vont être définis dans l’ontologie. La formation
des concepts définis provient d’un mode de composition des concepts et des relations
régi par des contraintes. Par exemple, l’expression Hypertension artériel est modélisée
par un concept défini appartenant à l’axe Pathologie.
Les instances de patrons textuelles repérées dans le texte (diagnostics dans DI-
COM)(Figure 4.15) sont traitées de façon à pouvoir les afficher par une expression recon-
nue comme étant un diagnostic. Précisément, lors de l’application des patrons, chaque
terme reconnu est précédé de sa catégorie. Nous recherchons alors la forme canonique,
définie dans les ontologies, de chacun des termes reconnus et des relations existantes
entre eux (Figure 4.16).
Comme nous l’avons précédemment indiqué, nos ontologies sont en espagnol pour per-
mettre une évaluation par des cardiologues mexicains de Morelia, et en anglais afin d’être
également utilisables en Europe. Les dossiers médicaux sont en espagnol en raison
de l’origine des diagnostic (Hôpital Civil, Centro Union et UPAC, qui sont des centres
médicaux mexicains).
C ONCLUSION
Nous avons présenté notre plateforme web pour le travail collaborative appelé COOVA-
DIS (COllabOrative VAscular DIagnoSis) : cette plateforme utilise les trois ontologies
définies dans le chapitre 3 (l’ontologie du système vasculaire, l’ontologie du diagnostic
et l’ontologie de la traçabilité. Nous avons présenté une partie plus technique dans la
section 4.2 sur l’implémentation que nous avons réalisée, enfin nous avons exposé le
premier propotype de COOVADIS.
Précisons que nous avons dû réellement finaliser ce premier prototype, car c’est grâce
à lui que les médecins ont pu tester ses fonctionnalités, son utilisabilité, et la souplesse
et l’efficacité apportées par l’utilisation de nos ontologies.
Nous avons terminé ce chapitre par quelques explications basiques agrémentées de
copies d’écran sur ce premier prototype qui a permis aux médecins d’effectuer les
premiers tests. Ainsi sur un dossier existant le cas de Mr J. (qui nous servira de fil
rouge dans le chapitre suivant) nous avons pu exposer les résultats fournis par notre
plateforme.
I NTRODUCTION
• Une connaissance des traitements médicaux spécifiques qui ont été réalisés sur un
patient ;
• Une étude comparative des différents traitements sur le patient avec les ca-
ractéristiques mesurables de la progression de la maladie ou le risque ;
• Des événements défavorables associés aux traitements médicaux spécifiques ;
• Un espace de collaboration pour travailler sur un plan de traitement plus optimal en
fonction de l’historique obtenu du patient via l’extraction de données médicales.
Intégration. Dans cette phase, nous avons cherché des modèles ontologiques exis-
tants qui correspondent aux critères de la phase d’analyse du problème. Malheureuse-
ment, nous n’avons pas trouvé un modèle qui comprenne les associations nécessaires
pour le diagnostic de maladies vasculaires et leur traçabilité. Pour ce dernier point, nous
avons développé les ontologies qui résolvent ce problème (cf. chapitre 3).
Spécification. Cette phase est une étape très importante dans le cycle de vie du
développement d’une ontologie, phase similaire au développement d’un logiciel. Dans
cette phase l’ingénieur ontologique interagit avec les utilisateurs finaux (les médecins)
afin de définir la portée et les détails fonctionnels du modèle d’ontologie (phase d’analyse
du problème), les associations (phase d’intégration) et la connaissance critique d’appli-
cation (phase d’acquisition de connaissances). Dans cette phase, il est possible d’initier
la validation et si nécessaire de spécifier des changements. En général, la spécification
demande un effort de collaboration entre les acteurs impliqués dans le développement et
la validation.
Conception. Cette phase est le cœur du cycle de vie de développement où l’ingénieur
ontologique identifie les concepts impliqués dans la connaissance pour la classification
(analyse de textes), l’agrégation ou le changement sur des niveaux de conceptualisation
(en accord avec les résultats de la phase de spécification pour le design pattern onto-
logiques) ce qui correspond à la normalisation. La formalisation des connaissances se
situe à un certain niveau d’abstraction, lequel correspond à la représentation conceptuel
sur la logique de description (TBox et ABox). Finalement, pour l’opérationnalisation nous
avons utilisé la représentation sémantique OWL.
Analyse. Cette phase est l’étape d’itération qui doit être exécutée avant la mise en
œuvre de l’ontologie parce que cette phase valide les modifications et les résultats atten-
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 136
dus par les experts. Durant la conception et l’analyse, les connaissances sémantiques
nécessaires sont vérifiées afin de s’assurer de leur exactitude. Par exemple, l’expert teste
les modèles ontologiques avec leurs questions et il vérifie aussi si le problème général
d’analyse a été abordé.
Mise en œuvre et utilisation. Dans le domaine des ontologies, l’étape finale est la
mise en œuvre et l’utilisation à l’aide d’une plateforme ou d’un outil d’exploitation. L’uti-
lisation peut être aussi un processus cyclique, s’il y a une identification des termes, du
vocabulaire ou d’ontologie qui ne répond pas aux besoins du domaine.
La difficulté des ontologies est souvent liée au type d’environnement dynamique concep-
tualisé par de multiples acteurs impliqués et par le domaine distribué où l’ontologie va
travailler. Elles ne peuvent être pensées comme une conceptualisation finie d’un domaine
de connaissances délimité et stable. Les motifs de changements dans une ontologie sont
multiples :
• le domaine de définition peut évoluer ce qui implique des modifications dans l’ontologie
pour rendre compte de l’évolution ;
• la modification de l’application au sein de laquelle est utilisée l’ontologie implique la
nécessité d’adapter l’ontologie ;
• la conceptualisation même de l’ontologie peut être affinée à travers le processus cy-
clique de validation. Ainsi pour répondre aux objectifs organisationnels et d’usage, les
ontologies doivent s’adapter aux besoins.
de l’ontologie en raison de l’énorme quantité d’informations qui doit être modélisée. Par
exemple, dans le domaine médical, le nombre de connaissances est doublé tous les cinq
ans voire même tous les deux ans [Asm12].
La validation de nos ontologies a été réalisée en utilisant des schémas de connaissance
ontologique et de description de leurs individus. Plus précisément, nous nous concen-
trons sur le niveau de conceptualisation du domaine en répondant à quatre questions
principales :
1. l’application du vocabulaire,
2. la correspondance de la taxonomie (la généralisation et la hiérarchisation),
3. l’adéquation des relations non-taxonomique, c’est-à-dire, l’ajustement des relations
sémantiques,
4. la cohérence et l’extensibilité, (L’ontologie doit être cohérente afin d’effectuer des
déductions qui soient correctes, en accord avec les définitions disponibles. Elle doit
être construite de façon à ce que tout ajout de concept n’affecte pas sa cohérence.)
5. la forme minimale de l’ontologie. (Elle doit avoir les hypothèses minimales sur le
besoin à modéliser et ne doit pas contenir de connaissances supplémentaires qui
ne sont pas utilisées dans la pratique actuelle.)
Pour analyser les besoins concrets de nos ontologies (ontologie du système vasculaire et
ontologie de diagnostic), nous avons mené des entretiens avec des médecins spécialisés
en cardiologie et radiologie pour valider nos ontologies médicales. La première étape a
consisté en la construction d’une liste de questions en langage naturel à partir de l’on-
tologie à valider. Ces questions sont soumises à des experts du domaine qui offrent
des réponses (réponses de validation, réponses de modifications ou d’ajout d’informa-
tions) en accord avec leur expérience et leur expertise. L’étape suivante consistait en
l’interprétation des commentaires des experts pour valider ou modifier l’ontologie. Le
processus proposé en Figure 5.2 basé sur des modifications-validations a été utilisé
pour : (1) valider les ontologies construites basées sur des textes médicaux et sur des
outils d’extraction terminologique (UMLS, ICD, MeSH, . . . ) ; et (2) valider la connaissance
sémantique que les ontologies renvoient de la plateforme COOVADIS.
Le but de la première étape est de construire des connaissances formalisées dans les
ontologies afin de valider un nombre maximum d’affirmations avec un nombre minimum
de questions. Puisque nous avons utilisé des outils existants pour vérifier le formalisme
ontologique (Protégé et Jena), ces outils ont validé les types de déclarations d’ontologie
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 139
La gestion des changements pour enrichir ou modifier l’ontologie est une tâche cruciale.
L’ingénieur d’ontologie doit contrôler tous les effets des changements et évaluer l’impact
du changement sur l’ontologie. Lors de la validation de l’expert du domaine sur nos on-
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 142
Dans le cadre de notre plateforme, il a été nécessaire de faire évaluer COOVADIS par un
expert. Cet étape permet de vérifier que les résultats attendus sont corrects. Les critères
de validation de l’expert sur la plateforme sont la pertinence des connaissances du do-
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 144
maine (les concepts et relations sémantiques du contenu) et le formalisme qui est utilisé
pour représenter les connaissances (le vocabulaire utilisé pour décrire les concepts).
Divers tests ont été appliqués pour évaluer la couverture des concepts ou des termes en
cours d’utilisation. Nous avons analysé les erreurs et les imprécisions de notre plateforme
et nous avons fait évoluer les ontologies pour améliorer nos résultats. L’analyse de ces
résultats nous a aidé à enrichir nos ressources (ontologies) à base de synonymes et de
termes non identifiés et qui ont été présents dans des diagnostics particuliers.
Dans notre plateforme, la représentation des connaissances des diagnostics (résultats
de la plateforme) a été systématiquement soumise à validation récurrente. L’ambigüité
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 145
F IGURE 5.10 – Attestation du Dr. Jaime Carranza Madrigal pour la validation de COOVA-
DIS
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 149
F IGURE 5.11 – Attestation du Docteurs Sonia Maria López Correa pour la validation de
COOVADIS
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 150
F IGURE 5.12 – Attestation du Docteurs Luis Fernando Sanchez Contreras pour la valida-
tion de COOVADIS
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 151
C ONCLUSION
La première partie de ce document a permis de présenter deux états de l’art sur les
télé-applications collaboratives (en particulier dans le domaine du télédiagnostic médical)
d’une part, et d’autre part, sur le domaine des ontologies.
Le premier état de l’art a permis de montrer les évolutions récentes des télé-applications
collaboratives, et plus particulièrement les nouvelles exigences dans le domaine de la
télémédecine, comme la traçabilité. Les flux de données pris en compte dans un télé-
diagnostic étant de taille très importante, il est apparu indispensable de faire appel aux
ontologies pour développer de nouveaux outils de traçabilité qui seront capables de trou-
ver de manière efficace et fiable, dans la masse d’informations, les informations perti-
nentes pour tracer le télé-diagnostic.
Le chapitre suivant de l’état de l’art a permis d’étudier les méthodes de conception, les
outils et les langages qui permettent de construire des ontologies. Ces méthodes ont été
utilisées pour élaborer les trois ontologies qui constituent le cœur de notre plateforme
COOVADIS COllabOrative VAscular DIagnoSis.
duction de cas d’utilisation (Mr J. fil rouge du document), puis exposition des premiers
résultats de traçabilité et évaluation des trois ontologies par les médecins. Nous avons
validé les ontologies de manière théorique ainsi qu’avec trois médecins mexicains de
Morelia (validation en milieu clinique).
Les résultats sont très encourageants :
• d’un point de vue théorique tout d’abord, nos deux ontologies de traçabilité (ontologie
du diagnostic et ontologie de la traçabilité) permettent le traitement direct des diagnos-
tics liés au même patient (ontologie de diagnostic), et elles gèrent la correspondance
du travail collaboratif sur des examens concrets, c’est-à-dire, la traçabilité des aides au
diagnostic pour les experts en lien avec les données d’examen au format DICOM déjà
explorées.
• d’un point vue applicatif : il faut rappeler que ces travaux s’inscrivent en amont des
problématiques R&D de l’entreprise Covalia Interactive. Et dans l’état actuel d’avance-
ment de nos tests, la solution de traçabilité de notre plateforme est très convaincante.
En effet, dans une trace, la plateforme COOVADIS fournit toutes les images issues
des examens passés par le patient. Et pour chaque image, il est possible d’en affi-
cher les détails et, de façon sémantique : les connaissances qui sont y attachées mais
également celles issues de la démarche complète de diagnostic du cas du patient. De
plus, la plateforme fournit les informations relatives au patient, au médecin traitant et
au type d’imagerie utilisé ainsi qu’à la collaboration pour la prise de décision clinique.
P ERSPECTIVES
L’ontologie de la pathologie ne peut pas être générique, en effet nous n’échapperons pas
au fait de devoir développer une nouvelle ontologie par nouveau domaine médical traité.
Concernant l’ontologie de traçabilité, elle est quant à elle indépendante de la pathologie.
Reste l’ontologie de diagnostic qui est liée à la pathologie et qu’il sera intéressant de
rendre générique pour facilité l’adaptabilité de la plateforme, et le traitement de di-
vers pathologies. Pour le développement d’une ontologie de diagnostic générique, il est
nécessaire de construire un réseau conceptuel formé par combinaisons des types d’exa-
mens propres aux maladies à traiter. Grâce au fait que notre ontologie comprend des ter-
minologies ontologiques de diagnostic vasculaire (types d’imagerie, d’examen physique,
de procédures, résultats de laboratoire et mesures, observations complémentaires, co-
ordonnées de patient, coordonnées de médecin traitant, information sur l’institution, . . . ),
les concepts sont annotés avec des propriétés, et modélisés en logique de description
au format OWL. Il est possible ainsi d’ajouter des règles associatives et des nouveaux
concepts de diagnostic qui permettent d’aborder d’autres pathologies du patient.
Afin de valider un enrichissement d’ontologie dans un domaine diagnostique qui peut
comprendre les différents types pathologiques et d’exploration, notre réflexion a porté
sur la collecte, l’organisation, la représentation, la formalisation et l’enrichissement des
connaissances dans l’ontologie de diagnostic : la recherche de nouveaux concepts, leurs
rôles ainsi qu’une phase de placement de ces concepts et relations au sein de l’ontologie
originale.
Puis, à nouveau, chaque nouvelle ontologie de pathologie devra subir les mêmes phases
de validation.
Enfin une perspective indépendante du transfert de ces travaux dans les produits de
Covalia Interactive.
Il serait intéressant de pouvoir utiliser les ontologies comme aide au diagnostic en utilisant
un moteur d’inférences. Il s’agirait par exemple, en utilisant les symptomes issus des
phénotypes du patient, d’inférer quelles pourraient être les pathologies possibles. Ces
propositions pourraient être formulées aux médecins comme aide à la prise de décision
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 158
clinique. Un autre exemple serait de proposer aux médecins un traitement et les effets
secondaires lors de la définition du diagnostic.
L’aide au diagnostic pourrait également être améliorée en proposant plus d’informa-
tions que celles contenues dans nos ontologies mais recensées dans des réseaux
sémantiques comme par exemple UMLS (Unified Medical Language System). Ce réseau
sémantique pourrait être utilisé en analysant de façon automatique les comptes rendus
cardiovasculaires afin de proposer des recommandations en vue d’améliorer la prise de
décisions cliniques et la prise en charge des patients. Il faudrait pour cela, indexer nos
concepts pour permettre que les réseaux ontologiques travaillent en collaboration.
Enfin, l’aide au diagnostic pourrait être facilité en proposant un système de requêtes
aux médecins permettant la recherche de cas similaires à l’aide des symptômes ou des
pathologies.
MA BIBLIOGRAPHIE PERSONNELLE
( Y COMPRIS PUBLICATIONS ANT ÉRIEURES AU COURS DU MASTER )
A RTICLE EN R EVUE
[San13] Sanchez Santana Maria-Aydee and Aupet Jean-Baptiste and Betbeder Marie-
Laure and Lapayre Jean-Christophe and Camarena Antonio. A Tool for Telediagnosis
of Cardiovascular Diseases in a Collaborative and Adaptive Approach. JUSC, Journal
of Universal Computer Science. ISIWEB IF 0.762,Pages 1275–1294, Vol. 19(9), 2013.
[San14] Sanchez Santana Maria Aydee and Betbeder Marie-Laure and Lapayre Jean-
Christophe and Carranza Madrigal Jaime. COOVADIS : A New Framework for
Collaborative Diagnosis Approach of the Vascular System. Proceedings of the
CSCWD 2014, 18th IEEE Int. Conf. on Computer Supported Cooperative Work in
Design. Pages 627–632, Hsinchu, Taiwan, May 2014.
[San12] Sanchez Santana Maria Aydee and Aupet Jean-Baptiste and Betbeder Marie-
Laure and Lapayre Jean-Christophe and Camarena Ibarrola Jose Antonio. Adaptive
Collaborative Environment for Vascular Problems Telediagnosis. Proceedings of
the LNCS IWAAL 2012, 4th Int. Workshop on Ambient Assisted Living. Pages 1–8,
Vitoria-Gasteiz, Spain, December, 2012.
[San12a] Sanchez Santana Maria Aydeé and Carranza Madrigal Jaime. Desarrollo de
un programa de cómputo para medir automaticamente el espesor de la intima media
carotı́dea y la luz de la arteria humeral mediante ultrasonografı́a ası́ como el cálculo
del riesgo cardiovascular. Anales de Radiologı́a México Pages 20–26, Vol. 1, 2012.
Publiée au cours du Master á Morelia.
CHAPITRE 5. VALIDATIONS EN MILIEU CLINIQUE ET PREMIERS TESTS EXP ÉRIMENTAUX 160
AUTRES PUBLICATIONS
[San10] Sanchez Santana Maria Aydee and Carranza Madrigal Jaime and Camarena
Ibarrola Jose Antonio and Calderon Solorio Felix. Discrepancy Detection of Cardio-
vascular Abnormalities : Computer System to Manual Measurement by Radiologists.
XXXIII National Internal Medicine Congress of México, Vol6(1). Cancún, México.
November 2010. Publiée au cours du Master á Morelia.
[San10a] Sanchez Santana Maria Aydee and Carranza Madrigal Jaime. Software for
Automatic Diagnosis of Cardiovascular Diseases Through Ultrasonographic Measure-
ment of Arteries. Institute of Electrical and Electronic Engineers IEEE, Morelia Institute
of Tecnology. Pages 107–113, Morelia, México. October 2010, Publiée au cours du
Master á Morelia.
[San09] Sanchez Santana Maria Aydee and Carranza Madrigal Jaime and Camarena
Ibarrola Jose Antonio and Calderon Solorio Felix. Software for Automatic Measure-
ment of Carotid Alterations and Endothelial Function in the Brachial Artery. XXXII
National Internal Medicine Congress. Pages 15–19, Vol.25(1), Mérida, México.
November 2009. Publiée au cours du Master á Morelia.
[San08] Sanchez Santana Maria Aydee and Carranza Madrigal Jaime. Software for
Automatic Measurement of Carotid Plaque and Brachial Diameter. VII State Hyperten-
sion Congress. Pages 91–94, Vol.6(2), Morelia, México. May 2008. Publiée au cours
du Master á Morelia.
B IBLIOGRAPHIE
[Aba13] Asma Ben Abacha, Marcos Da Silveira, and Cédric Pruski. Medical Onto-
logy Validation through Question Answering, volume 7885, pages 196–205.
Springer-Verlag, 2013.
[Ant09] Erick Antezana, Mikel Egana, Ward Blondé, Aitzol Illarramendi, Inaki Bilbao,
Bernard De Baets, Robert Stevens, Vladimir Mironov, and Martin Kuiper. The
cell cycle ontology : an application ontology for the representation and inte-
grated analysis of the cell cycle process. Genome Biology, 10(5) :1–20, 2009.
[Arm09] Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy H.
Katz, Andrew Konwinski, Gunho Lee, David A. Patterson, Ariel Rabkin, and
Matei Zaharia. Above the clouds : A berkeley view of cloud computing. Techni-
cal Report UCB/EECS-2009-28, EECS Department, University of California,
Berkeley, February 2009.
[Ash04] Joan S. Ash, Marc Berg, and Enrico Coiera. Some unintended consequences
of information technology in health care : The nature of patient care infor-
mation system-related errors. Journal of the American Medical Informatics
Association, 11(2) :104–112, March 2004.
[Asm12] Pierre Zweigenbaum Asma Ben Abacha. Une étude comparative empirique
sur la reconnaissance des entités médicales. In Traitement Automatique des
Langues, 53(1) :39–68, dec 2012.
[Asm13] Cédric Pruski Asma Ben Abacha, Marcos Da Silveira. Medical Ontology Va-
lidation through Question Answering. In Proceedings of the 14th conference
on AI in Medicine in Europe : Artificial Intelligence Medicine, AIME’13, pages
196–205, Murcia, Spain, May 2013. Springer-Verlag.
[Aup10] Jean-Baptiste Aupet, Eric Garcia, Hervé Guyennet, Jean-Christophe Lapayre,
and David Martins. Security in medical telediagnosis. In Book Multimedia Ser-
vices in Intelligent Environments - Integrated Systems, Chapter 9, Springer,
2010.
[Aup12] Jean-Baptiste Aupet. Environnements collaboratifs temps réel : Adaptabilité
des échanges de données multimédia. Thèse de Doctorat, January 2012.
[Aus00] Nathalie Aussenac-gilles and Didier Bourigault. The th(ic)2 initiative : Corpus-
based thesaurus. In Workshop on Ontologies and Texts, Juans-Les-Pins
(France), volume 51 of EKAW’2000, 2000.
[Aus05] Nathalie Aussenac-Gilles. Méthodes ascendantes pour l’ingénierie des
connaissances. PhD thesis, Université Toulouse III, December 2005.
[Ban05] Audrey Baneyx, Jean Charlet, and Marie-Christine Jaulent. Building medical
ontologies based on terminology extraction from texts : an experimentation in
pneumology. In Connecting Medical Informatics and Bio-Informatics, pages
27–50, Geneva, Switzerland, August 2005. Studies in Health Technology and
Informatics.
BIBLIOGRAPHIE 162
[Kif97] Michael Kifer and Georg Lausen. F-logic : a higher-order language for
reasoning about objects, inheritance, and scheme. In Proceedings of the
ACM/SIGMOD Int. Symposium on Management of Data, volume 18(2), pages
134–146. ACM, 1997.
[Kri12] Reshmy Krishnan, Amir Hussain, and P. C. Sherimon. Retrieval of semantic
concepts based on analysis of texts for automatic construction of ontology.
In Proceedings of the 19th International Conference on Neural Information
Processing, ICONIP’12, pages 524–532, Berlin, Heidelberg, 2012. Springer-
Verlag.
[Lee11] Wei-Nchih Lee, Will Bridewell, and Amar K. Das. Comparison of semantic
similarity measures for application specific ontology pruning. In Proceedings
of the 2011 IEEE First International Conference on Healthcare Informatics,
Imaging and Systems Biology, HISB ’11, pages 97–103, Washington, DC,
USA, 2011. IEEE Computer Society.
[LeM02] S. Le Moignon, J. Charlet, D. Bourigault, and Jaulent M.C. Construction d’une
ontologie à partir de corpus : expérimentation et validation dans le domaine
de la réanimation chirurgicale. In Actes des 6eme Journées Ingénierie des
Connaissances, pages 229–238, Rouen, France, 2002.
[LeM04] Pascal Le Mer, Luc Soler, Dominique Pavy, Alain Bernard, Johan Moreau, Di-
dier Mutter, and Jacques Marescaux. Argonaute 3d : A real-time cooperative
medical planning software on dsl network. In MMVR12, 12th Annual Medi-
cine Meets Virtual Reality Conference, volume 98, pages 203–209, Newport
Beach, January 2004.
[Lep08] Paea Lependu, Dejing Dou, Gwen A. Frishkoff, and Jiawei Rong. Ontology
database : A new method for semantic modeling and an application to brain-
wave data. In Proceedings of the 20th International Conference on Scientific
and Statistical Database Management, SSDBM ’08, pages 313–330, Berlin,
Heidelberg, 2008. Springer-Verlag.
[Len90] Douglas B. Lenat and R. V. Guha. Building Large Knowledge-Based Sys-
tems : Representation and Inference in the Cyc Project. Addison-Wesley
Longman Publishing Co., Inc., Boston, MA, USA, 1st edition, 1989.
[Lou09] Christine Louberry, Philippe Roose, and Marc Dalmau. Qos-based design
process for pervasive computing applications. In Proceedings of the 6th In-
ternational Conference on Mobile Technology Application Systems Mobility,
pages 1–4, New York, 2009. ACM.
[Luc12] Jacques Lucas. Le secret médical et la esante. In Numéro spécial secret
médical de la revue Médecins, page 21, nov-dec 2012.
[Mac89] John McCarthy. Artificial intelligence, logic and formalizing common sense. In
Philosophical Logic and Artificial Intelligence, pages 161–190. Kluwer Acade-
mic, 1989.
[Mac91] Robert M. MacGregor. Inside the loom description classifier. SIGART Bull.,
2(3) :88–92, June 1991.
[Mar02] Jacques Marescaux, Joel Leroy, Francesco Rubino, Michel Vix, Michele Si-
mone, and Didier Mutter. Transcontinental robot assisted remote telesurgery :
Feasibility and potential applications. In Annal of Surgery, volume 235, pages
487–492. Ann Surg, April 2002.
BIBLIOGRAPHIE 167
[Mat03] Friedemann Mattern and Peter Sturm. From distributed systems to ubiquitous
computing - the state of the art, trends, and prospects of future networked
systems. In In K. Irmscher and K.-P. Fähnrich, editors, Proc. KIVS 2003,
pages 3–25. Springer-Verlag, 2003.
[Mat10] Ely Edison Matos, Fernanda Campos, Regina Braga, and Daniele Palazzi.
Celows : An ontology based framework for the provision of semantic web
services related to biological models. Journal of Biomedical Informatics,
43(1) :125–136, February 2010.
[Maz14] Ilaria Mazzanti, Maolo Alessandro, and Antonicelli Roberto. E-health and te-
lemedicine in the elderly : State of the art. Assistive Technologies : Concepts,
Methodologies, Tools, and Applications, pages 693–704, April 2014.
[Med12] Juan Miguel Medina, Sergio Jaime-Castillo, and Esther Jiménez. A di-
com viewer with flexible image retrieval to support diagnosis and treatment
of scoliosis. Expert Systems with Applications : An International Journal,
39(10) :8799–8808, August 2012.
[Min09] Hua Min, Frank J. Manion, Elizabeth Goralczyk, Yu-Ning Wong, Eric Ross,
and J. Robert Beck. Integration of prostate cancer clinical data using an onto-
logy. Journal of Biomedical Informatics, 42(6) :1035–1045, December 2009.
[Mot98] Enrico Motta. An overview of the ocml modelling language. In In Procee-
dings KEML’98 : 8th Workshop on Knowledge Engineering Methods and Lan-
guages, pages 21–22, 1998.
[Mot00] Enrico Motta, Simon Buckingham Shum, and John Domingue. Ontology-
driven document enrichment : Principles, tools and applications. International
Journal of Human-Computer Studies, 52(6) :1071–1109, June 2000.
[Noy00] Natalya Fridman Noy and Mark A. Musen. Prompt : Algorithm and tool for
automated ontology merging and alignment. In AAAI/IAAI, pages 450–455,
2000.
[Noy01] Natalya F. Noy and Deborah L. McGuinness. Ontology development 101 : A
guide to creating your first ontology. Technical report, Knowledge Systems
Laboratory Stanford University, 2001.
[Obr07] Leo Obrst, Werner Ceusters, Inderjeet Mani, Steve Ray, and Barry Smith.
The evaluation of ontologies. In Semantic Web, pages 139–158. Springer
US, 2007.
[OJEU13] Official Journal of the European Union. Recommendations on a common
framework for a unique device identification system of medical devices in
the union. http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2013:
099:0017:0024:EN:PDF, April 2013.
[Pat09] Jyotishman Pathak, Thomas M. Johnson, and Christopher G. Chute. Sur-
vey of modular ontology techniques and their applications in the biomedical
domain. Integr. Comput.-Aided Eng., 16(3) :225–242, August 2009.
[Pie09] Christian Pieralli, Bruno Wacogne, Vincent Bonnans, Philippe Humbert, Pa-
zart Lionel, Franck Marzani, Jean-Christophe Lapayre, and Christophe Lang.
Collaborative platform for skin cancer screening and associated optical fibe-
red probe for diagnosis. In Sin’Fran09, Singaporean-French IPAL Symposium,
pages 44–55. World Scientific, February 2009.
BIBLIOGRAPHIE 168
[Pit13] Perrine Pittet, Christophe Cruz, and Christophe Nicolle. Modeling changes for
shoin(d) ontologies : An exhaustive structural model. In Proceedings of the
2013 IEEE Seventh International Conference on Semantic Computing, ICSC
’13, pages 104–109, Washington, DC, USA, 2013. IEEE Computer Society.
[Por04] Robert Porzel and Rainer Malaka. A task-based approach for ontoly eva-
luation. In ECAI Workshop on Ontology Learning and Population, Valencia,
Spain, 2004.
[Pou12] M. Poulymenopoulou, F. Malamateniou, and G. Vassilacopoulos. Emergency
healthcare process automation using mobile computing and cloud services.
Journal of Medical Systems, 36(5) :3233–3241, October 2012.
[Rec06] AI. Rector, R. Qamar, and T. Marley. Binding ontologies and coding systems
to electronic health records and messages. In Bodenreider O., editor, Procee-
dings of the Second International Workshop on Formal Biomedical Knowledge
Representation, pages 11–19, 2006.
[Rou10] Mohamed Rouane-Hacene, Schahrazed Fennouh, Roger Nkambou, and
Petko Valtchev. Refactoring of ontologies : Improving the design of ontolo-
gical models with concept analysis. In Proceedings of the 2010 22Nd IEEE
International Conference on Tools with Artificial Intelligence, volume 2 of ICTAI
’10, pages 167–172, Washington, DC, USA, 2010. IEEE Computer Society.
[Rui11] Juana Maria Ruiz-Martı́nez, Rafael Valencia-Garcı́a, Jesualdo Tomas
Fernandez-Breis, Francisco Garcia-Sanchez, and Rodrigo Martinez-Bejar.
Ontology learning from biomedical natural language documents using umls.
Expert Systems with Applications, 38(10) :12365–12378, 2011.
[Rum05] P. Rumeau, M. Savoldelli, C. Magne, JL. Weber, A. Alonso, F. Castanié, and
L. Lareng. Ur-safe project : improving response to telealarm users needs. In
Poster in International Association of Gerontology Congress, 2005.
[Sad12] Kazem Sadegh-Zadeh. Medical ontology. In Handbook of Analytic Philosophy
of Medicine, Philosophy and Medicine, pages 711–756. Springer Netherlands,
2012.
[Saf00] Charles Safran and Goldberg. Howard. Electronic patient records and the
impact of the internet. International journal of medical informatics, 60(2) :77–
83, June 2000.
[Sal95] D. Decouchant D. Salber, J. Coutaz and M. Riveill. De l’observabilité et
de l’honnêteté : le cas du contrôle d’accès dans la communication homme-
homme médiatisée. Journées IHM’95, Cépaduès, 1995.
[Sal12] José Salavert Torres, Damian J. Segrelles Quilis, Ignacio Blanquer Espert,
and Vicente Hernandez Garcı́a. Improving knowledge management through
the support of image examination and data annotation using dicom structured
reporting. Journal of Biomedical Informatics, 45(6) :1066–1074, December
2012.
[San12] David Sánchez, Albert Sole-Ribalta, Montserrat Batet, and Francesc Serra-
tosa. Enabling semantic similarity estimation across multiple ontologies :
An evaluation in the biomedical domain. Journal of Biomedical Informatics,
45(1) :141–155, February 2012.
[Sar11] K. Saruladha, G. Aghila, and A. Bhuvaneswary. Information content based
semantic similarity approaches for multiple biomedical ontologies. In Ajith
BIBLIOGRAPHIE 169
Abraham, Jaime Lloret Mauri, JohnF. Buford, Junichi Suzuki, and Sabu M.
Thampi, editors, Advances in Computing and Communications, volume 191
of Communications in Computer and Information Science, pages 327–336.
Springer Berlin Heidelberg, 2011.
[Sch07] Stefan Schulz and Ingvar Johansson. Continua in biological systems. The
Monist, pages 499–515, 2007.
[Sch12] Andrea C. Schalley. Ontology and the lexicon : A natural language proces-
sing perspective. Language Resources and Evaluation, 46(1) :95–100, March
2012.
[Smi04] Barry Smith. Beyond concepts : Ontology as reality representation. In A. C.
Varzi and L. Vieu, editors, Formal Ontology in Information Systems, pages
73–84. IOS Press, 2004.
[Sta09] Steffen Staab and Rudi Studer. Handbook on Ontologies. Springer Publishing
Company, Incorporated, 2nd ed. edition, 2009.
[Ste07] O. Steichen, C. Daniel-Le Bozec, M.C. Jaulent, and J. Charlet. Construction
d’une ontologie pour la prise en charge de l’hypertension artérielle. Actes des
18ème Journées en Ingénierie des Connaissances, pages 241–253, June
2007.
[Ste11] Michael Kleiber and Thomas Alexander. Evaluation of a mobile ar tele-
maintenance system. In Universal Access in Human-Computer Interac-
tion. Applications and Services, volume 6768 of Lecture Notes in Computer
Science, pages 253–262. Springer, 2011.
[Stu98] R. Studer, V.R. Benjamins, and D. Fensel. Knowledge engineering : Prin-
ciples and methods. IEEE Transactions on Data and Knowledge Engineering,
25(162) :161–197, 1998.
[Sua12] MariCarmen Suárez-Figueroa, Asunción Gómez-Pérez, and Mariano
Fernández-López. The neon methodology for ontology engineering. In Onto-
logy Engineering in a Networked World, pages 9–34. Springer Berlin Heidel-
berg, 12.
[Sul14] Nabil Sultan. Making use of cloud computing for healthcare provision : Op-
portunities and challenges. International Journal of Information Management :
The Journal for Information, 34(2) :177–184, April 2014.
[Tar10] Samir Tartir, I. Budak Arpinar, and Amit P. Sheth. Ontological evaluation and
validation. In Theory and Applications of Ontology : Computer Applications,
pages 115–130. Springer Netherlands, 2010.
[Tho11] Janke Thomas. Ontology engineering based on domain specific languages
and the application of ontology design patterns. In Advanced Information
Systems Engineering Workshops, volume 83 of Lecture Notes in Business
Information Processing, pages 167–176. Springer Berlin Heidelberg, 2011.
[Uli04] Mihaela Ulieru. Internet-Enabled Soft Computing Holarchies for e-Health Ap-
plications, pages 131–165. Enhancing the Power of the Internet. Springer-
Verlag, 2004.
[Ush95] Mike Uschold and Martin King. Towards a methodology for building onto-
logies. In In Workshop on Basic Ontological Issues in Knowledge Sharing,
EATIS ’07, 1995.
BIBLIOGRAPHIE 170
Abstract: