XML 3

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 205

Plan

2. XML
◻ Introduction au standard XML (formations XML)
Objectifs et définition
Les limites de HTML
Les apports de XML
Les champs d'application
Les standards et outils associés (Open Document, RSS, SVG...)
Les langages du Web : XHTML, WML, XFORM, XUL...
◻ Les documents XML
La structure et la définition du document
Les balises, les éléments et les attributs
Commentaires, Texte et CDATA.Document bien formé versus document valide
Le Document Type Definition (DTD)
Les espaces de noms (namespaces)TP : Définir des DTD internes et externes
Plan
2

◻ XML Schema
XML Schema : rôle et intérêt par rapport aux DTD
Les types de bases : integer, string, date, decimal...
La syntaxe des schémas : les listes, les unions, les séquences, les choix...
Les dérivations : par restriction et extension
XML Schema et les espaces de nomsTP : Concevoir, à partir de spécifications, des XML
Schema utilisant les notions de bases et avancées (dérivation)
◻ XPath et la navigation
XPath : le langage de navigation.Les axes nodaux
Les types d'expression de sélection
Les expressions : booléennes, numériques, chaînes de caractères
◻ Les liens XML (XLL)
XML Linking Language : rôle et intérêt
Xlink : les liens simples et étendus
Xpointer : l'adressage de documents
Plan
3

◻ Les feuilles de styles


XML et les feuilles de styles
L'intégration des CSS.XSL : rôle et positionnement
XSLT versus XSL-FO.XSLT : le langage de transformation
Les documents réguliers et non réguliers
Les règles de transformation et les expressions de sélection
Les instructions : test, itération, fusionTP : Mettre en oeuvre les différents concepts
XSLT par l'écriture de feuilles XSLT générant du code HTML à partir d'une source
XML.
◻ Les outils XML
Les outils d'édition : XMLSpy, oXygen, CookTop...
Les parseurs XSLT : MSXML, Sablotron, Xalan...
◻ Les modèles d'architecture
Le traitement sur le navigateur (XSLT, DOM...)
Le traitement sur le serveur Web (XSLT, DOM, SAX...)
2020/2021
Université Abdelmalek Essaâdi
École Normale Supérieure
Tétouan
Département d'Informatique et de Gestion

Chapitre 5

Introduction au standard XML


(formations XML)

LDW
Plan
5

Introduction au standard XML (formations XML)


Objectifs et définition
Les limites de HTML
Les apports de XML
Les champs d'application
Les standards et outils associés (Open Document, RSS, SVG...)
Les langages du Web : XHTML, WML, XFORM, XUL...
Objectifs
6

◻ Ecrire des documents XML

◻ Imposer une structure bien précise à nos documents XML.

◻ Les mettre en forme.

◻ Lire facilement les données contenues dans un document XML.

◻ Transformer les documents XML vers d'autres formats comme une page
Internet.
Qu'est-ce que le XML ?
7

◻ Le XML ou eXtensible Markup Language est un langage informatique de balisage


générique.
◻ le langage XML est un langage qui permet de décrire des données à l'aide de balises
et de règles que l'on peut personnaliser.
◻ Un langage informatique:
les langages de description permettent de décrire et structurer un ensemble de données
selon un jeu de règles et des contraintes définies.
on peut par exemple utiliser ce type de langage pour décrire l'ensemble des livres d'une
bibliothèque, ou encore la liste des chansons d'un CD, etc.
parmi les langages de description les plus connus, on peut citer le SGML, le XML ou
encore le HTML.
Qu'est-ce que le XML ?
8

◻ Un langage de balisage générique:


est un langage qui s'écrit grâce à des balises.
■ ces balises permettent de structurer de manière hiérarchisée et organisée
les données d'un document.

le terme générique signifie qu’on va pouvoir créer nos propres


balises.
■ on n’est pas obligé d'utiliser un ensemble de balises existantes comme
c'est par exemple le cas en HTML.
Origine et objectif du XML
9

◻ répondre à un besoin très précis : l'échange de données.


◻ Aux débuts d'Internet, les ordinateurs et les programmes échangeaient des
données en utilisant des fichiers.
ces fichiers avaient bien souvent des règles de formatage qui leur étaient propres.
par exemple, les données étaient séparées par des points, des virgules, des espaces,
des tirets, etc.

◻ Problème: il fallait adapter les programmes au format du fichier ce qui


représentait une charge de travail importante.
Origine et objectif du XML
10

◻ Solution: Le langage SGML ou Standard Generalized Markup Language.


c'est un langage puissant, extensible et standard qui permet de décrire à l'aide de
balises un ensemble de données.
n'était pas forcément compatible pour effectuer des échanges sur le web.

◻ Le langage XML est donc né. Le XML 1.0 est devenu une recommandation
du W3C le 10 février 1998.
Origine et objectif du XML
11

◻ Les objectifs du XML:


faciliter les échanges de données entre les machines.
décrire les données de manière aussi bien compréhensible par les hommes qui
écrivent les documents XML que par les machines qui les exploitent.

◻ Le XML se veut également compatible avec le web afin que les échanges de
données puissent se faire facilement à travers le réseau Internet.
◻ Le XML se veut donc standardisé, simple, mais surtout extensible et
configurable afin que n'importe quel type de données puisse être décrit.
Exemple
12

◻ Une application téléphonique qui met à jour ses données.


◻ L'application demande à un serveur web les dernières informations dont il
dispose.
◻ Après être allé les chercher, ce dernier doit les communiquer en retour.
C'est là qu'intervient le XML : le serveur web s’en sert pour structurer les
informations qu'il doit renvoyer à l'application téléphonique.
Lorsque cette dernière reçoit les informations ainsi structurées, elle sait comment
les lire et les exploiter rapidement !
Exemple HTML
13
14

◻ <xml id="fichierxml" src="simple.xml"></xml>


15
Exemple Python
16
17
En résumé
18

◻ Le XML a été créé pour faciliter les échanges de données entre les
machines et les logiciels.
◻ Le XML est un langage qui s'écrit à l'aide de balises.
◻ Le XML est une recommandation du W3C, il s'agit donc d'une technologie
avec des règles strictes à respecter.
◻ Le XML se veut compréhensible par tous : les hommes comme les
machines.
◻ Le XML nous permet de créer notre propre vocabulaire grâce à un
ensemble de règles et de balises personnalisables.
19

Les bons
outils
L'éditeur de texte
20

◻ Bloc-notes
◻ Notepad++
Afin d'adapter la coloration syntaxique au langage XML, il vous suffit de
sélectionner Langage dans la barre de menu puis XML dans la liste.
Lorsque vous enregistrerez vos documents, il suffira alors de préciser comme
extension ".xml" pour conserver la coloration syntaxique d'une fois sur l'autre.
EditiX
21

◻ En plus de la coloration syntaxique essentielle à l'écriture de documents


XML, ce logiciel nous offre de nombreux outils
Exemple: la validation des documents.
◻ La version gratuite : Editix 2008
<oXygen/> XML Editor
22

◻ comme Editix
◻ multiplateformes.
◻ il n'existe pas de version gratuite du logiciel
23

Les éléments de base


Les balises
24

◻ les balises sont les éléments de base d'un document XML.


◻ Une balise porte un nom qui est entouré de chevrons.
◻ Une balise commence donc par un < et se termine par un >.
◻ Exemple : <balise> définit une balise qui s'appelle "balise".
◻ on distingue 2 types de balises :
les balises par paires
les balises uniques.
Les balises par paires
25

◻ composées en réalité de 2 balises que l'on appelle ouvrantes et fermantes.


la balise ouvrante commence par < et se termine par >
la balise fermante commence par </ et se termine par >.
les balises ouvrantes et fermantes aient exactement le même nom.
Exemple:
<balise></balise>
◻ XML est sensible à la casse
la distinction entre les majuscules et les minuscules
◻ Toute balise ouverte doit impérativement être fermée
Les balises par paires
26

◻ on peut mettre "des choses" entre ces balises. On parle alors de contenu.
<balise>Je suis le contenu de la balise</balise>
◻ Une balise par paires ne peut pas contenir n'importe quoi :
elle peut contenir une valeur simple comme par exemple:
■ une chaîne de caractères,
■ un nombre entier,
■ un nombre décimal,
■ etc.
<balise1>Ceci est une chaîne de caractères</balise1>
<balise2>10</balise2>
<balise3>7.5</balise3>
Les balises par paires
27

◻ Une balise par paires peut également contenir une autre balise. On parle
alors d'arborescence. <balise1>
<balise2>10</balise2>
</balise1>
◻ si une balise peut en contenir une autre, il est cependant interdit de les
chevaucher. L'exemple suivant n'est pas du XML !
<balise1><balise2>Ceci est une chaîne de caractères</balise1></balise2>
◻ une balise par paires peut contenir un mélange de valeurs simples et de
balises <balise1>
Ceci est une chaîne de caractères
<balise2>10</balise2>
7.5
</balise1>
Les balises uniques
28

◻ Une balise unique est en réalité une balise par paires qui n'a pas de contenu.
<balise />
Les règles de nommage des balises
29

◻ Ce qui rend le XML générique, c'est la possibilité de créer votre propre


langage balisé.
ce langage balisé, est un langage composé de balises sauf qu'en XML, c'est vous qui
choisissez leurs noms.
◻ règles de nommage à respecter pour les balises
Les noms peuvent contenir des lettres, des chiffres ou des caractères spéciaux.
Les noms ne peuvent pas débuter par un nombre ou un caractère de ponctuation.
Les noms ne peuvent pas commencer par les lettres XML (quelle que soit la casse).
Les noms ne peuvent pas contenir d'espaces.
On évitera les caractères - , ; . < et > qui peuvent être mal interprétés dans les
programmes.
Les attributs
30

◻ Il est possible d'ajouter à nos balises ce qu'on appelle des attributs.


◻ comme pour les balises, on pourra choisir le nom.
◻ Un attribut peut se décrire comme une option ou une donnée cachée.
Ce n'est pas l'information principale que souhaite transmettre la balise, mais il
donne des renseignements supplémentaires sur son contenu.
Exemple :
<prix devise="DH">25.3</prix>

l'information principale est le prix.


l'attribut devise permet d'apporter des informations supplémentaires sur ce prix.
mais ce n'est pas l'information principale que souhaite transmettre la balise
<prix/>.
Les attributs
31

◻ Une balise peut contenir 0 ou plusieurs attributs.

◻ Exemple :

<prix devise="DH" moyen_paiement="chèque">25.3</prix>

◻ quelques règles sont à respecter pour les attributs :


Les règles de nommage sont les mêmes que pour les balises.

La valeur d'un attribut doit impérativement être délimitée par des guillemets, simples
ou doubles.

Dans une balise, un attribut ne peut-être présent qu'une seule fois.


Les commentaires
32

◻ Un commentaire est un texte qui permet de donner une indication sur ce que
l'on fait.
une grande aide pendant la rédaction de longs documents XML !
◻ C'est une balise unique qui commence par <!-- et qui se termine par -->.

<!-- Ceci est un commentaire ! -->

◻ Exemple: <!-- Description du prix -->


<prix devise="DH">12.5</prix>
Structure d'un document XML
33

◻ Un document XML peut être découpé en 2 parties :


le prologue
le corps.
Le prologue
34

◻ Le prologue correspond à la première ligne du document XML.

◻ Il donne des informations de traitement.

◻ Exemple:
<?xml version = "1.0" encoding="UTF-8" standalone="yes" ?> ,

◻ le prologue est une balise unique qui commence par <?xml et qui se termine
par ?>.
Le prologue
35

◻ La version:
indiquer la version de XML que l'on utilise pour décrire les données.
il existe actuellement 2 versions : 1.0 et 1.1.
n'est obligatoire que depuis la version 1.1
il est plus que conseillé de l'ajouter quand même lorsque vous utilisez la
version 1.0.
La différence entre les 2 versions est une amélioration dans le support des
différentes versions de l'Unicode.
il conviendra d'utiliser la version 1.0 qui est encore aujourd'hui la version la
plus utilisée.
Le prologue
36

◻ Le jeu de caractères
La seconde information du prologue est encoding="UTF-8".
Il s'agit du jeu de caractères utilisé dans le document XML.
par défaut, l'encodage de XML est l'UTF-8,
si l’éditeur de texte enregistre les documents en ISO8859-1, il
suffit de la changer dans le prologue :

<?xml version = "1.0" encoding="ISO8859-1" standalone="yes" ?>


Le prologue
37

◻ Un document autonome
la dernière information présente dans le prologue est
standalone="yes".
permet de savoir si le document XML est autonome ou si un autre
document lui est rattaché.
Le corps
38

◻ Le corps d'un document XML est constitué de l'ensemble des balises qui
décrivent les données.
◻ une règle très importante à respecter dans la constitution du corps :
une balise en paires unique doit contenir toutes les autres.
■ Cette balise est appelée élément racine du corps.
Exemple:
<racine>
<balise_paire>texte</balise_paire>
<balise_paire2>texte</balise_paire2>
<balise_paire>texte</balise_paire>
</racine>
Le corps
39

◻ le but est d'être le plus explicite possible dans le nommage des balises.
◻ la balise racine aura pour mission de décrire ce quelle contient.
◻ Si on choisit de décrire un répertoire, on peut par exemple nommer les
balises comme:
<repertoire>
<personne>Rachid</personne>
<personne>Kamal</personne>
</repertoire>
Un document bien formé
40

◻ Quand on parle de XML on parle souvent de document XML bien formé ou


well-formed en anglais.

◻ Cette notion décrit en réalité un document XML conforme aux règles


syntaxiques.
Un document bien formé
41

◻ On peut résumer un document XML bien formé à un document XML avec


une syntaxe correcte:
S'il s'agit d'un document utilisant la version 1.1 du XML, le prologue est bien
renseigné.
Le document XML ne possède qu'une seule balise racine.
Le nom des balises et des attributs est conforme aux règles de nommage.
Toutes les balises en paires sont correctement fermées.
Toutes les valeurs des attributs sont entre guillemets simples ou doubles.
Les balises du document XML ne se chevauchent pas, il existe une arborescence
dans le document.
Utilisation d'EditiX
42

◻ On va créer notre premier document XML grâce au logiciel EditiX et


vérifier qu'il est bien formé.
Créer un nouveau document
43

◻ Pour créer un nouveau document, vous pouvez cliquer sur l'icône


suivante :

◻ sélectionner dans la barre de menu File puis New ou encore utiliser le


raccourci clavier Ctrl + N.

◻ Dans la liste qui s'affiche, sélectionnez Standard XML document


Créer un nouveau document
44

◻ Voici ce qu’on devra voir :


<?xml version="1.0" encoding="UTF-8"?>
<!-- New XML document created with EditiX XML Editor (http://www.editix.com) at Wed Dec 14 00:18:39
CET 2016 -->

EditiX s'est chargé pour d'écrire le prologue du document XML.


un petit commentaire pour rappeler la date et l'heure de création du document.
◻ Puisque ce document sera autonome on peut modifier le prologue pour
l'indiquer :
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
Vérification du document
45

◻ vérifier si le document est bien formé.


cliquer sur l'icône suivante :

ou encore utiliser le raccourci clavier Ctrl + K.


une erreur s'afficher:
■ La ligne où se situe l'erreur est représentée par un rectangle aux bords rouges sur
l’espace de travail
Vérification du document
46

◻ une erreur à la ligne 6 du document.


◻ Pour en savoir plus sur cette erreur, il suffit de regarder en bas de l'écran:

◻ le message : « Un document bien formé nécessite un élément racine. »


◻ Complétez le document avec les éléments suivant :
<repertoire>
<personne>Robert</personne>
<personne>John</personne>
</repertoire>

◻ Lancez de nouveau la vérification du document:


L'indentation
47

◻ Il est possible de demander à Editix d'indenter automatiquement les


documents une fois écrits.
sélectionnez dans la barre de menu XML puis Format et Pretty format (default)
ou utilisez le raccourci clavier Ctrl + R
Dans ce même menu, on peut accéder aux paramètres concernant la tabulation.
L'arborescence du document
48

◻ Editix met à notre disposition un outil fort sympathique qui permet de


visualiser l'arborescence du document en cours d'édition :

◻ le répertoire contient 2 personnes : Robert et John.


Enregistrer le document
49

◻ choisissez l'emplacement dans lequel vous souhaitez stocker le fichier


XML, tapez son nom et cliquez sur Enregistrer.
TP : structuration d'un répertoire
50

◻ Le but de ce TP est de créer un document XML structurant les données d'un


répertoire.

◻ le répertoire doit comprendre au moins 2 personnes.


◻ Pour chaque personne, on souhaite connaître les informations suivantes :
Son sexe (homme ou femme).
Son nom.
Son prénom.
Son adresse.
Un ou plusieurs numéros de téléphone (téléphone portable, fixe, bureau, etc.).
Une ou plusieurs adresses e-mail (adresse personnelle, professionnelle, etc.).
TP : structuration d'un répertoire
51

◻ aucune indication concernant le choix des balises, des attributs et de


l'arborescence à choisir
Quelques explications
52

◻ Le sexe: le choix de renseigner le sexe dans un attribut de la balise


<personne/> et non d'en faire une balise à part entière.
◻ L'adresse: Il est important que les documents XML aient une arborescence
logique.
C'est pourquoi on représente l'adresse postale par une balise <adresse /> qui
contient les informations détaillées de l'adresse de la personne comme le numéro de
l'immeuble, la voie, le pays, etc.
ajouter un attribut type dans la balise <voie />. Une nouvelle fois, cet attribut est
destiné à être utilisé par une machine.
une machine qui traitera ce fichier, pourra facilement accéder au type de la voie
sans avoir à récupérer le contenu de la balise <voie/> et tenter d'analyser s'il s'agit
d'une impasse, d'une rue, d'une avenue, etc.
■ un gain de temps dans le traitement des données.
Quelques explications
53

◻ Numéros de téléphone et adresses e-mails


dans un soucis d'arborescence logique, on crée les blocs <telephones /> et
<emails /> qui contiennent respectivement l'ensemble des numéros de
téléphone et des adresses e-mail.
Pour chacune des balises <telephone/> et <email/>, on met un attribut type.
Cet attribut permet de renseigner si l'adresse e-mail ou le numéro de téléphone
est par exemple professionnel ou personnel.
cette information est placée dans un attribut car ce n'est pas l'information
principale que l'on souhaite transmettre.
Ici, l'information principale reste le numéro de téléphone ou l'adresse e-mail et
non son type.
2020/2021
Université Abdelmalek Essaâdi
École Normale Supérieure
Tétouan
Département d'Informatique et de Gestion

Chapitre 6

Créez des définitions pour vos


documents XML
LDW
Introduction aux définitions et aux DTD
55

◻ le XML est très peu utilisé seul


utiliser en parallèle d'autres technologies permettant d'étendre ses possibilités.

◻ les technologies qui permettent de définir une structure stricte aux


documents XML :
les fichiers de définition.

◻ Il existe plusieurs technologies qui permettent d'écrire des fichiers de


configuration.
les DTD.
les Schémas XML.
un document XML ?
56

◻ Une définition d'un document XML est un ensemble de règles que l'on
impose au document.
◻ Ces règles permettent de décrire la façon dont le document XML doit être
construit.
◻ Elles peuvent être de natures différentes.
◻ Ces règles peuvent imposer la présence d'un attribut ou d'une balise:
imposer l'ordre d'apparition des balises dans le document.
ou
imposer le type d'une donnée (nombre entier, chaîne de caractères, etc.).
Un document valide
57

◻ Un document valide est un document bien formé conforme à une


définition.
le document XML respecte toutes les règles qui lui sont imposées dans les
fameuses définitions.
Pourquoi écrire des définitions ?
58

◻ Associer une définition à un document oblige à une certaine rigueur dans


l'écriture des données XML.
plus important lorsque plusieurs personnes travaillent sur un même document.

la définition impose une écriture uniforme que tout le monde doit respecter.

on évite ainsi que l'écriture d'un document soit anarchique et, par conséquent,
difficilement exploitable.
Exploitable par qui ?
59

◻ par un programme informatique


on peut par exemple écrire un programme informatique qui traite les données
contenues dans un document XML respectant une définition donnée.
imposer une définition aux documents que le programme exploite permet d'assurer
un automatisme et un gain de temps précieux :
■ Le document n'est pas valide : je ne tente pas de l'exploiter.
■ Le document est valide : je sais comment l'exploiter.

◻ deux technologies pour écrire les définitions des documents XML :


◻ les DTD ou
◻ les schémas XML.
Définition d'une DTD
60

◻ Un Document Type Définition ou une Définition de Type de Document


une technologie pour écrire les définitions des documents XML.

c'est-à-dire, de construire un ensemble de règles qui vont régir la construction du


document XML.

grâce à l'ensemble de ces règles, on va définir l'architecture du document XML et


la hiérarchie qui existe entre les balises de celui-ci.

on pourra préciser l’enchaînement et le contenu des balises et des attributs contenus


dans le document XML.
Où écrire les DTD ?
61

◻ dans des fichiers.


◻ il existe 2 types de DTD :
les DTD externes.
les DTD internes.

◻ les règles des DTD internes s'écrivent directement dans le fichier XML
qu'elles définissent
◻ les règles des DTD externes sont écrites dans un fichier séparé portant
l’extension .dtd
Les éléments
62

◻ La syntaxe :
Pour définir les règles portant sur les balises, on utilise le mot clef ELEMENT.

<!ELEMENT balise (contenu)>

Une règle peut se découper en 3 mots clefs : ELEMENT, balise et contenu


Le mot-clef balise est à remplacer par le nom de la balise à laquelle on souhaite
appliquer la règle.
Exemple: pour une balise du TP de la partie 1: <nom>DOE</nom>
■ On écrira :

<!ELEMENT nom (contenu)>


Les éléments
63

◻ le contenu a pour vocation de décrire ce que doit contenir la balise :


une autre balise

une valeur
Cas d'une balise contenant une autre
64

<!ELEMENT personne (nom)>


◻ Exemple: <!-- suite de la DTD -->

◻ Cette règle signifie que la balise <personne /> contient la balise <nom />.
◻ Le document XML respectant cette règle ressemble donc à:
<personne>
<nom>John DOE</nom>
</personne>

◻ aucune règle pour la balise <nom/>:


le document n'est, par conséquent, pas valide.
dans une DTD, il est impératif de décrire tout le document sans exception.
des balises qui n'apparaissent pas dans la DTD ne peuvent pas être utilisées dans
le document XML.
Cas d'une balise contenant une valeur
65

◻ on utilisera la mot clef #PCDATA


◻ une valeur simple désigne par exemple une chaîne de caractères, un entier,
un nombre décimal, un caractère, etc.
◻ Exemple: <personne>
<nom>John DOE</nom>
</personne>

on peut compléter la DTD en ajoutant une règle pour la balise <nom/>.


si l'on souhaite que cette balise contienne une valeur simple, on écrira :
<!ELEMENT nom (#PCDATA)>
Au final, la DTD du document XML est la suivante :
<!ELEMENT personne (nom)>
<!ELEMENT nom (#PCDATA)>
Cas d'une balise vide
66

◻ Il est également possible d'indiquer qu'une balise ne contient rien grâce au


mot-clef EMPTY
<!ELEMENT personne (nom)>
<!ELEMENT nom EMPTY>
◻ Le document XML répondant à la définition DTD:
<personne>
<nom ></nom>
</personne>

◻ lors de l'utilisation du mot clef EMPTY, l'usage des parenthèses n'est pas
obligatoire !
Cas d'une balise pouvant tout contenir
67

◻ une autre balise,


◻ une valeur simple
◻ ou tout simplement être vide.
◻ dans ce cas, on utilise le mot-clef ANY.
◻ l'usage des parenthèses n'est pas obligatoire pour le mot-clef ANY!
◻ Exemple: <!ELEMENT personne (nom)> <personne>
<!ELEMENT nom ANY> <nom>John DOE</nom>
</personne>
<!-- vide -->
◻ Les documents XML suivants sont bien valides : <personne>
Bien que le mot-clef ANY existe, il est souvent <nom ></nom>
déconseillé de l'utiliser afin de restreindre le plus </personne>
possible la liberté de rédaction du document XML.
Structurer le contenu des balises
68

◻ des syntaxes permettant d'apporter un peu de généricité aux


définitions DTD.
◻ Exemple: un répertoire contient généralement un nombre variable de
personnes
il faut permettre au document XML d'être valide quel que soit le nombre de
personnes qu'il contient.
La séquence
69

◻ Une séquence permet de décrire l’enchaînement imposé des balises.


◻ Il suffit d'indiquer le nom des balises en les séparant par des virgules.
<!ELEMENT balise (balise2, balise3, balise4, balise5, etc.)>

◻ Exemple : <!ELEMENT personne (nom, prenom, age)>


<!ELEMENT nom (#PCDATA)>
<!ELEMENT prenom (#PCDATA)>
<!ELEMENT age (#PCDATA)>

◻ Cette définition impose que la balise <personne /> contienne obligatoirement


les balises <nom />, <prenom /> et <age /> dans cet ordre.
<!-- valide -->
<personne>
<nom>DOE</nom>
<prenom>John</prenom>
70 <age>24</age>
</personne>
<!– invalide, les balises ne sont pas dans le bon ordre -->
<personne>
<prenom>John</prenom>
<nom>DOE</nom>
<age>24</age>
</personne>
<!-- invalide , il manque une balise -->
<personne>
<prenom>John</prenom>
<age>24</age>
</personne>
<!-- invalide, il y a une balise en trop, qui plus est non déclarée -->
<personne>
<nom>DOE</nom>
<prenom>John</prenom>
<age>24</age>
<date>12/12/2012</date>
</personne>
La liste de choix
71

◻ Une liste de choix permet de dire qu'une balise contient l'une des balises
décrites.
◻ Il suffit d'indiquer le nom des balises en les séparant par une barre verticale.

<!ELEMENT balise (balise2 | balise3 | balise4 | balise5 | etc.)>

◻ Exemple: <!ELEMENT personne (nom | prenom)>


<!ELEMENT nom (#PCDATA)>
<!ELEMENT prenom (#PCDATA)>

◻ Cette définition impose que la balise <personne /> contienne obligatoirement


la balise <nom /> ou la balise <prenom />
72
<!-- valide -->
<personne>
<nom>DOE</nom>
</personne>
<!-- valide -->
<personne>
<prenom>John</prenom>
</personne>
<!-- invalide -->
<!-- les 2 balises prenom et nom ne peuvent pas être présentes en même temps. -->
<personne>
<prenom>John</prenom>
<nom>DOE</nom>
</personne>
<!-- invalide -->
<!-- il manque une balise -->
<personne ></personne>
La balise optionnelle
73

◻ Pour indiquer qu'une balise est optionnelle, on fait suivre son nom par un
point d’interrogation.
◻ Exemple :
<!ELEMENT personne (nom, prenom?)>
<!ELEMENT nom (#PCDATA)>
<!ELEMENT prenom (#PCDATA)>
◻ Cette définition impose que la balise <personne /> contienne obligatoirement
la balise <nom /> puis éventuellement <prenom />.
74

<!-- valide -->


<personne>
<nom>DOE</nom>
</personne>
<!-- valide -->
<personne>
<nom>DOE</nom>
<prenom>John</prenom>
</personne>
<!-- invalide -->
<!-- l'ordre des balises n'est pas respecté -->
<personne>
<prenom>John</prenom>
<nom>DOE</nom>
</personne>
La balise répétée optionnelle
75

◻ Une balise peut être répétée plusieurs fois même si elle est optionnelle.
◻ Pour indiquer une telle balise, on fait suivre son nom par une étoile.
<!ELEMENT balise (balise2, balise3*, balise4)>

<!ELEMENT repertoire (personne*)>


◻ Exemple: <!ELEMENT personne (nom, prenom)>
<!ELEMENT nom (#PCDATA)>
<!ELEMENT prenom (#PCDATA)>

◻ Cette définition impose que la balise <repertoire /> contienne entre 0 et une
infinité de fois la balise <personne />.
◻ La balise <personne />, quant à elle, doit obligatoirement contenir les
balises <nom /> et <prenom /> dans cet ordre.
<!-- valide -->
<repertoire>
76
<personne>
<nom>DOE</nom>
<prenom>John</prenom>
</personne>
<personne> <!-- valide -->
<nom>POPPINS</nom> <repertoire ></repertoire>
<prenom>Marie</prenom> <!-- invalide -->
</personne> <!-- il manque la balise prenom dans la seconde balise personne-->
</repertoire> <repertoire>
<!-- valide --> <personne>
<repertoire> <nom>DOE</nom>
<personne> <prenom>John</prenom>
<nom>DOE</nom> </personne>
<prenom>John</prenom> <personne>
</personne> <nom>POPPINS</nom>
</repertoire> </personne>
</repertoire>
La balise répétée
77

◻ Une balise peut être répétée plusieurs fois.


◻ Pour indiquer une telle balise, on fait suivre son nom par un plus.
<!ELEMENT balise (balise2, balise3+, balise4)>

<!ELEMENT repertoire (personne+)>


<!ELEMENT personne (nom, prenom)>
<!ELEMENT nom (#PCDATA)>
<!ELEMENT prenom (#PCDATA)>

◻ Cette définition impose que la balise <repertoire /> contienne au minimum


une fois la balise <personne />.
◻ La balise <personne /> quant à elle doit obligatoirement contenir les
balises <nom /> et <prenom /> dans cet ordre.
<!-- valide -->
<repertoire>
<personne>
78 <nom>DOE</nom>
<prenom>John</prenom>
</personne>
<personne>
<nom>POPPINS</nom>
<prenom>Marie</prenom>
</personne>
</repertoire>
<!-- valide -->
<repertoire>
<personne>
<nom>DOE</nom>
<prenom>John</prenom>
</personne>
</repertoire>
<!-- invalide -->
<!-- la balise personne doit être présente au moins une fois-->
<repertoire ></repertoire>
En résumé
79

• Un document valide est un document bien formé conforme à une définition.

• Un document conforme à une définition est un document qui respecte toutes les
règles qui lui sont imposées dans les fameuses définitions.

• Il existe les DTD internes et les DTD externes.

• Il est possible d'écrire de nombreuses règles grâce aux DTD.

• Le mot clef ELEMENT permet de d'écrire les règles relatives aux balises XML.
80

DTD : les attributs et les


entités
Les attributs
81

◻ une balise peut contenir ce qu'on appelle des attributs.


◻ Il convient donc de décrire les règles relatives à ces attributs.
La syntaxe
82

◻ Pour indiquer que la règle porte sur un attribut, on utilise le mot clef
ATTLIST: <!ATTLIST balise attribut type mode>

◻ Une règle peut donc se diviser en 5 mots clefs : ATTLIST, balise, attribut,
type et mode.
il suffit simplement d'écrire le nom de la balise et de l'attribut concerné par la
règle.
Exemple: une balise du TP<personne
de la partie 1:
sexe="masculin" />

■ On écrira :
<!ATTLIST personne sexe type mode>
le type
83

◻ une valeur bien précise


◻ du texte
◻ un identifiant
Cas d'un attribut ayant pour type la liste des valeurs possibles
84

◻ Les différentes valeurs possibles pour l'attribut sont séparées par une barre
verticale.
<!ATTLIST balise attribut (valeur 1 | valeur 2 | valeur 3 | etc.) mode>

◻ la balise <personne /> possède un attribut sexe.


◻ imposer la valeur que peut prendre cette attribut : soit masculin, soit féminin:
<!ATTLIST personne sexe (masculin|féminin) mode>
◻ exemple de documents XML possibles : <!-- valide -->
<personne sexe="masculin" ></personne>
<!-- valide -->
<personne sexe="féminin" ></personne>
<!-- invalide -->
<personne sexe="autre" ></personne>
Cas d'un attribut ayant pour type du texte non "parsé"
85

◻ la possibilité de mettre ce que l'on veut comme valeur : un nombre, une


lettre, une chaîne de caractères, etc.
◻ Il s'agit de données qui ne seront pas analysées par le "parseur" au moment
de la validation et/ou l'exploitation du document XML.
◻ Dans le cas où l’attribut contient du texte non "parsé", on utilise le mot
clef CDATA: <!ATTLIST balise attribut CDATA <!-- valide -->
mode> <personne sexe="masculin" ></personne>
◻ Exemple:
<!ATTLIST personne sexe CDATA <!-- valide -->
mode> <personne sexe="féminin" ></personne>
<!-- valide -->
<personne sexe="autre" ></personne>
<!-- valide -->
<personne sexe="12" ></personne>
Cas d'un attribut ayant pour type un identifiant unique
86

◻ Exemple: une course à pied.


Dans le classement de la course, il y aura un unique vainqueur, un unique second
et un unique troisième.
Pour indiquer que la valeur de l'attribut est unique, on utilise le mot clef ID
comme IDentifiant. <!ATTLIST balise attribut ID mode>
<!ATTLIST personne position ID mode>
<!-- valide -->
<personne position="POS-1" ></personne>
◻ Exemples de documents XML : <personne position="POS-2" ></personne>
<personne position="POS-3" ></personne>
<!-- invalide -->
<personne position="POS-1" ></personne>
<personne position="POS-1" ></personne>
<personne position="POS-2" ></personne>
Cas d'un attribut ayant pour type une référence à un identifiant unique
87

◻ un des attributs fasse référence à un identifiant.


◻ cela permet souvent de ne pas écrire 100 fois les mêmes informations.
◻ Exemple: le document XML peut servir à représenter des liens de
parenté entre des personnes.
grâce aux références, on n'a pas devoir imbriquer des balises XML dans tous
les sens pour tenter de représenter le père d'une personne ou le fils d'une
personne.
Cas d'un attribut ayant pour type une référence à un identifiant unique
88

◻ Pour faire référence à un identifiant unique, on utilise le mot clef IDREF:


<!ATTLIST father id ID mode >
<!ATTLIST child id ID mode
father IDREF mode
◻ cette règle signifie que la balise child a 2 attributs: >
id qui est l'identifiant unique de la personne et father qui fait référence une autre
personne.
la personne PER-2 a pour père la personne PER-1.
<!-- valide -->
<father id="PER-1" ></father>
<child id="PER-2" father="PER-1" ></child>
<!-- invalide -->
<!-- l'identifiant PER-0 n'apparaît nulle part -->
<father id="PER-1" ></father>
<child id="PER-2" father="PER-0" ></child>
le mode
89

◻ donner une information supplémentaire sur l'attribut


◻ Exemple: une indication sur son obligation ou sa valeur.
Cas d'un attribut obligatoire
90

◻ Lorsqu'on souhaite qu'un attribut soit obligatoirement renseigné, on


utilise le mot clef #REQUIRED:
◻ si l'on souhaite que le sexe d'une personne soit renseigné:
<!ATTLIST personne sexe (masculin|féminin) #REQUIRED>

<!-- valide -->


<personne sexe="masculin" ></personne>
<!-- valide -->
<personne sexe="féminin" ></personne>
<!-- invalide -->
<personne ></personne>
Cas d'un attribut optionnel
91

◻ indiquer qu'un attribut n'est pas obligatoire


on utilise le mot clef #IMPLIED.
◻ on peut indiquer qu'il n'est pas obligatoire de renseigner le sexe d'une
personne: <!ATTLIST personne sexe CDATA
#IMPLIED>

<!-- valide -->



<personne sexe="masculin" ></personne>
<!-- valide -->
<personne sexe="féminin" ></personne>
<!-- valide -->
<personne sexe="15" ></personne>
<!-- valide -->
<personne ></personne>
Cas d'une valeur par défaut
92

◻ indiquer une valeur par défaut pour un attribut.


Il suffit tout simplement d'écrire cette valeur "en dur" dans la règle.
◻ il est possible d'indiquer qu'une personne dont l'attribut sexe n'est pas
renseigné est un homme par défaut grâce à la règle suivante :
<!ATTLIST personne sexe CDATA
"masculin">

<!-- valide -->


<personne sexe="masculin" ></personne>
<!-- valide -->
<personne sexe="féminin" ></personne>
<!-- valide -->
<!-- l'attribut sexe vaut "masculin" -->
<personne ></personne>
Cas d'une constante
93

◻ il est possible de fixer la valeur d'un attribut quand celui-ci est présent
grâce au mot clef #FIXED suivi de ladite valeur
◻ Exemple: lorsque l'on souhaite travailler dans une devise bien précise et
que l'on souhaite qu'elle apparaisse dans le document.
la règle suivante permet d'indiquer que la devise, dans le cas où elle est
renseignée, doit obligatoirement avoir pour seule valeur possible l'euro
<!ATTLIST objet devise CDATA #FIXED
"Euro">
<!-- valide -->
<objet devise="Euro" ></objet>
<!-- invalide -->
<objet devise="Dollar" ></objet>
<!-- valide -->
<objet ></objet>
Les entités
94

◻ Une entité peut-être considérée comme un alias permettant de réutiliser des


informations au sein du document XML ou de la définition DTD.
◻ 3 types d'entités qui existent :
les entités générales.
les entités paramètres.
les entités externes.
Les entités générales
95

◻ Les entités générales sont les entités les plus simples.


◻ Elles permettent d'associer un alias à une information afin de l'utiliser dans le
document XML.
◻ la syntaxe : <!ENTITY nom "valeur">

◻ Pour utiliser une entité générale dans le document XML, il suffit d'utiliser la
syntaxe suivante : <!ENTITY samsung "Samsung">
&nom; <!ENTITY apple "Apple">
<telephone>
<marque>&samsung;</marque>
<modele>Galaxy S3</modele>
</telephone>
<telephone>
<marque>&apple;</marque>
<modele>iPhone 4</modele>
</telephone>
Les entités générales
96

◻ Au moment de son interprétation, les références aux entités seront remplacées


par leurs valeurs respectives, ce qui donne une fois interprété :

<telephone>
<marque>Samsung</marque>
<modele>Galaxy S3</modele>
</telephone>
<telephone>
<marque>Apple</marque>
<modele>iPhone 4</modele>
</telephone>
Les entités paramètres
97

◻ les entités paramètres n'apparaissent que dans les définitions DTD.


◻ Elles permettent d'associer un alias à une partie de la déclaration de la DTD.
◻ La syntaxe: <!ENTITY % nom "valeur">

◻ Pour utiliser une entité paramètre dans la DTD, il suffit d'utiliser la syntaxe
suivante :
%nom;

◻ Exemple: le cas où des téléphones ont pour attribut une marque :


<telephone marque="Samsung" />
<telephone marque="Apple" ></telephone>
Les entités paramètres
98

◻ pour indiquer que l'attribut marque de la balise <telephone/> est obligatoire et


qu'il doit contenir la valeur Samnsung ou Apple, on doit écrire la règle
suivante : <!ATTLIST telephone marque (Samsung|Apple) #REQUIRED>

◻ à l'aide d'une entité paramètre, cette même règle s'écrit de la façon suivante :
<!ENTITY % listeMarques "marque (Samsung|Apple) #REQUIRED">
<!ATTLIST telephone %listeMarques; >

◻ au moment de son interprétation, les références aux entités seront remplacées


par leurs valeurs respectives.
Les entités externes
99

◻ Il existe en réalité 2 types d'entités externes :


les analysées
les non analysées.
◻ Les entités externes analysées ont sensiblement le même rôle que les entités
générales:
elles permettent d'associer un alias à une information afin de l'utiliser dans le
document XML.
dans le cas des entités externes analysées, les informations sont stockées dans un
fichier séparé.
Les entités externes
100

◻ La syntaxe
<!ENTITY nom SYSTEM "URI">

◻ Pour utiliser une entité externe dans notre XML, il suffit d'utiliser la
syntaxe suivante : &nom;
<!ENTITY samsung SYSTEM "samsung.xml">
<!ENTITY apple SYSTEM "apple.xml"> ◻ Le contenu des fichiers samsung.xml et
<telephone> apple.xml sera par exemple le suivant :
&samsung;
<modele>Galaxy S3</modele>
</telephone> <!-- Contenu du fichier samsung.xml -->
<telephone> <marque>Samsung</marque>
&apple; <!-- Contenu du fichier apple.xml -->
<modele>iPhone 4</modele> <marque>Apple</marque>
</telephone>
Les entités externes
101

◻ Au moment de son interprétation, les références aux entités seront remplacées


par leurs valeurs respectives, ce qui donne une fois interprété :
<telephone>
<marque>Samsung</marque>
<modele>Galaxy S3</modele>
</telephone>
<telephone>
<marque>Apple</marque>
<modele>iPhone 4</modele>
</telephone>
102

DTD : où les écrire


?
Les DTD internes
103

◻ Une DTD interne est une DTD qui est écrite dans le même fichier que le
document XML.
Elle est généralement spécifique au document XML dans lequel elle est écrite.
◻ La syntaxe:
Une DTD interne s'écrit dans le DOCTYPE.
On le place sous le prologue du document et au dessus du contenu XML.
<!DOCTYPE racine [ ]>
La DTD interne est écrite entre les [].
Dans le DOCTYPE, le mot racine doit être remplacé par le nom de la balise qui
forme la racine du document XML.
Les DTD internes
104

◻ Exemple:
<?xml version = "1.0" encoding="UTF-8" standalone="yes" ?>
Une boutique <boutique>
possède plusieurs téléphones.
Chaque téléphone<telephone>
est d'une certaine marque et d'un certain modèle représenté
<marque>Samsung</marque>
par une chaîne de caractère.
<modele>Galaxy S3</modele>
</telephone>
<telephone>
<marque>Apple</marque>
<modele>iPhone 4</modele>
</telephone>
<telephone>
<marque>Nokia</marque>
<modele>Lumia 800</modele>
</telephone>
</boutique>
<?xml version = "1.0" encoding="UTF-8" standalone="yes" ?>
Les DTD internes <!DOCTYPE boutique [
<!ELEMENT boutique (telephone*)>
105 <!ELEMENT telephone (marque, modele)>
<!ELEMENT marque (#PCDATA)>
◻ La définition DTD: <!ELEMENT boutique (telephone*)>
<!ELEMENT modele (#PCDATA)>
<!ELEMENT telephone (marque, modele)>
]>
<!ELEMENT marque (#PCDATA)>
<boutique>
<!ELEMENT modele (#PCDATA)>
<telephone>
<marque>Samsung</marque>
◻ Le document XML complet avec <modele>Galaxy
la DTD interne S3</modele>
</telephone>
<telephone>
<marque>Apple</marque>
<modele>iPhone 4</modele>
</telephone>
<telephone>
<marque>Nokia</marque>
<modele>Lumia 800</modele>
</telephone>
</boutique>
Les DTD externes
106

◻ Une DTD externe est une DTD qui est écrite dans un autre document que
le document XML.
elle est commune à plusieurs documents XML qui l'exploitent.

◻ Un fichier contenant uniquement une DTD porte l'extension .dtd.


◻ La syntaxe:
il existe 2 types de DTD :
■ les DTD externes PUBLIC.
■ les DTD externes SYSTEM.
Les DTD externes PUBLIC
107

◻ Les DTD externes PUBLIC sont généralement utilisées lorsque la DTD est
une norme.
dans les documents xHTML 1.0.
<!DOCTYPE racine PUBLIC "identifiant" "url">
si on l'applique à un document xHTML, on obtient alors le DOCTYPE suivant :

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">


Les DTD externes SYSTEM
108

◻ Une DTD externe SYSTEM permet d'indiquer au document XML


<?xml version = "1.0" encoding="UTF-8" standalone="yes" ?>
l'adresse du document DTD.
<boutique>
<telephone>
Cette adresse peut-être relative ou absolue.
<marque>Samsung</marque>
<modele>Galaxy S3</modele>
<!DOCTYPE racine SYSTEM "URI">
</telephone>
<telephone>
◻ Exemple: le fichier XML : <marque>Apple</marque>
<modele>iPhone 4</modele>
</telephone>
<telephone>
<marque>Nokia</marque>
<modele>Lumia 800</modele>
</telephone>
</boutique>
Les DTD externes SYSTEM
109

◻ la DTD doit être placée dans<?xml


un version = "1.0" encoding="UTF-8" standalone="yes" ?>
fichier à part (par exemple doc1.dtd)
<!DOCTYPE boutique SYSTEM "doc1.dtd">
<!ELEMENT<boutique>
boutique (telephone*)>
<telephone>
<!ELEMENT telephone (marque, modele)>
<!ELEMENT marque <marque>Samsung</marque>
(#PCDATA)>
<!ELEMENT modele<modele>Galaxy
(#PCDATA)> S3</modele>
</telephone>
<telephone>
◻ Le document XML complet avec la DTD externe sera alors le suivant:
<marque>Apple</marque>
le fichier XML et DTD sont stockés<modele>iPhone
au même endroit :
4</modele>
</telephone>
<telephone>
<marque>Nokia</marque>
<modele>Lumia 800</modele>
</telephone>
</boutique>
le prologue
110
<?xml version = "1.0" encoding="UTF-8" standalone="no" ?>
◻ La dernière information présente dans le boutique
<!DOCTYPE prologue est standalone="yes".
SYSTEM "doc1.dtd">
<boutique>
◻ Cette information permet de savoir si votre document XML est autonome ou
<telephone>
<marque>Samsung</marque>
si un autre document lui est rattaché. <modele>Galaxy S3</modele>
</telephone>
◻ Dans le cas d'une DTD externe, les documents XML ne sont plus autonomes
<telephone>
<marque>Apple</marque>
ils font référence à un autre fichier qui <modele>iPhone
fournit la DTD.4</modele>
</telephone>
◻ indiquer la valeur de l'attribut standalone à "no".
<telephone>
<marque>Nokia</marque>
<modele>Lumia 800</modele>
</telephone>
</boutique>
Un exemple avec EditiX
111

◻ écrire une DTD externe SYSTEM avec EditiX.


◻ La création du document XML:<?xml version = "1.0" encoding="UTF-8" standalone="no" ?>
<!DOCTYPE boutique SYSTEM "boutique.dtd">
<boutique>
lancer la vérification du document: <telephone>
<marque>Samsung</marque>
<modele>Galaxy S3</modele>
</telephone>
<telephone>
<marque>Apple</marque>
<modele>iPhone 4</modele>
</telephone>
<telephone>
Message d'erreur indiquant que le <marque>Nokia</marque>
document DTD est introuvable <modele>Lumia 800</modele>
</telephone>
</boutique>
Un exemple avec EditiX
112

◻ Création du document DTD:


cliquer sur l'icône:
sélectionner dans la barre de menu File puis New ou encore utiliser le
raccourci clavier Ctrl + N
Dans la liste qui s'affiche, sélectionnez DTD
Un exemple avec EditiX
113

◻ Replacez le contenu par : <!ELEMENT boutique (telephone*)>


<!ELEMENT telephone (marque, modele)>
<!ELEMENT marque (#PCDATA)>
<!ELEMENT modele (#PCDATA)>

◻ Enregistrez le document avec le nom boutique.dtd


◻ Vérification de la DTD
cliquez sur l'icône:
ou sélectionnez dans la barre de menu DTD/Schema puis Check this DTD
ou utilisez le raccourci clavier Ctrl + K.
Un exemple avec EditiX
114

◻ Vérification du document XML:


sélectionnez dans la barre de menu XML puis Check this document
ou utilisez le raccourci clavier Ctrl + K.
En résumé
115

◻ Les DTD internes s'écrivent dans le document XML.

◻ Les DTD externes s'écrivent dans un fichier différent de celui du


document XML dont l'extension est .dtd.

◻ EditiX permet en quelque cliques de vérifier qu'un document DTD est


correct et qu'un document XML est valide.
TP
116

◻ créer la DTD du répertoire élaboré dans le premier TP.


◻ les informations que l'on souhaite connaître pour chaque personne :
Son sexe (homme ou femme).
Son nom.
Son prénom.
Son adresse.
Un ou plusieurs numéros de téléphone (téléphone portable, fixe, bureau, etc.).
Une ou plusieurs adresses e-mail (adresse personnelle, professionnelle, etc.).
◻ la DTD doit être une DTD externe
2020/2021
Université Abdelmalek Essaâdi
École Normale Supérieure
Tétouan
Département d'Informatique et de Gestion

Chapitre 7

XML Schema

LDW
Les défauts des DTD
118

Un nouveau format:
◻ les DTD ne sont pas au format XML.
un nouveau langage avec sa propre syntaxe et ses propres règles.

on va être obligé d'utiliser un outil différent de celui qui exploite un fichier


XML.

futurs programmes, logiciels ou applications mobiles devront forcément


exploiter la DTD et le fichier XML différemment.
■ à l'aide, par exemple, d'une API différente.
Les défauts des DTD
119

Le typage de données:
◻ les DTD ne permettent pas de typer des données.
◻ on se contente d'indiquer qu'une balise contient des données
impossible de préciser si l'on souhaite que ça soit un nombre entier, un nombre
décimal, une date, une chaîne de caractères, etc.
Les apports des schémas XML
120

◻ pour pallier les défauts des DTD, les Schémas XML ont été créés.
◻ apportent de nouvelles fonctionnalités :
Le typage des données
■ les Schémas XML permettent tout d'abord de typer les données.
■ il est possible de créer nos propres types de données.
Les contraintes
■ les Schémas XML permettent d'être beaucoup plus précis que les DTD lors de l'écriture
des différentes contraintes qui régissent un document XML.
Des définitions XML
■ Un des principaux avantages des Schémas XML est qu'ils s'écrivent grâce au XML.
■ pour exploiter un document XML et le Schéma qui lui est associé, on n'a en théorie plus
besoin de plusieurs outils.
Structure d'un schéma XML
121

◻ L'extension du fichier
Comme pour les DTD, on sépare les données formatées avec XML et le Schéma
XML associé dans 2 fichiers distincts.
les Schémas XML soient écrits avec un langage de type XML,
■ Un fichier dans lequel est écrit un Schéma XML porte l'extension ".xsd".
◻ Le prologue
Puisque c'est le XML qui est utilisé, il ne faut pas déroger à la règle du prologue.
la première ligne d'un Schéma XML est :
<?xml version="1.0" encoding="UTF-8" ?>
Structure d'un schéma XML
122
◻ Le corps
le corps d'un Schéma XML est constitué d'un ensemble de balises
la présence d'un élément racine, c'est-à-dire la présence d'une balise qui contient
toutes les autres.
■ contrairement à un fichier XML, son nom nous est imposé.
<!-- Prologue -->
<?xml version="1.0" encoding="UTF-8" ?>
<!-- Elément racine -->
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
</xsd:schema>
■ l'élément racine est <xsd:schema />.
■ la présence de l'attribut xmlns:xsd.
■ xmlns nous permet de déclarer un espace de noms.
■ A travers la déclaration de cet espace de noms, tous les éléments doivent commencer par
Référencer un schéma XML
123

◻ Le référencement d'un schéma XML se fait au niveau de l'élément racine


du fichier XML grâce à l'utilisation de 2 attributs:
◻ L'espace de noms
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
◻ La location
permet d'indiquer à notre fichier XML où se situe le fichier contenant le Schéma
XML.
2 possibilités : les schémas XML qui décrivent un espace de noms et ceux qui ne
décrivent pas un espace de noms.
Référencer un schéma XML
124

◻ Schéma XML décrivant un espace de noms


c'est ce type de Schéma XML qu’on va utiliser.
xsi:noNamespaceSchemaLocation="chemin_vers_fichier.xsd">
En résumé
125

◻ voici ce à quoi le fichiers XML ressembleront :


<?xml version="1.0" encoding="UTF-8"?>
<racine xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="chemin_vers_fichier.xsd">
</racine>

◻ Les Schémas XML offrent plus de possibilités que les DTD.


◻ Les Schémas XML s'écrivent à l'aide d'un langage de type XML.
◻ Un fichier dans lequel est écrit un Schéma XML porte
l'extension ".xsd".
126

Schéma XML : les éléments


simples
les éléments simples
127

◻ Un élément simple est un élément qui ne contient qu'une valeur dont le type
est dit simple.
Il ne contient pas d'autres éléments.
◻ Un élément simple peut donc être une balise qui ne contient aucun attribut
et dans laquelle aucune autre balise n'est imbriquée.
◻ Un attribut d'une balise peut également être considéré comme un élément
simple.
En effet, la valeur d'un attribut est un type simple.
◻ Un type simple, c'est par exemple un chiffre, une date ou encore une chaîne
de caractères.
Les éléments simples
128

◻ Exemples:
<!-- Ne contient ni attribut ni aucun autre élément => élément simple -->
<nom>ROBERT</nom>
<!-- Contient un attribut => n'est pas un élément simple -->
<!-- Cependant l'attribut "sexe" est un élément simple -->
<personne sexe="masculin">Robert DUPONT</personne>
<!-- La balise personne contient d'autres éléments (les balises nom et prénom) => n'est pas un
élément simple -->
<personne>
<!-- Ne contient ni attribut ni aucun autre élément => élément simple -->
<nom>DUPONT</nom>
<!-- Ne contient ni attribut ni aucun autre élément => élément simple -->
<prenom>Robert</prenom>
</personne>
Les éléments simples
129

◻ Déclarer une balise comme un élément simple


il faut utiliser le mot clef element.
■ N'oubliez pas de précéder son utilisation par xsd:
Cette balise prend 2 attributs : un nom et un type.

<xsd:element name="mon_nom" type="xsd:mon_type" />

Exemple: éléments simples :

<nom>DUPONT</nom>
<prenom>Robert</prenom>
<age>38</age>
Les éléments simples
130

◻ Au sein d'un Schéma XML, ces éléments seront déclarés de la sorte :


<xsd:element name="nom" type="xsd:string" />
<xsd:element name="prenom" type="xsd:string" ></xsd:element>
<xsd:element name="age" type="xsd:int" ></xsd:element>

◻ String est utilisé pour qualifier une chaîne de caractères et int est utilisé pour qualifier
un nombre entier.
Les éléments simples
131

◻ Valeur par défaut:


indiquer dans les Schémas XML qu'un élément a une valeur par défaut.
■ la valeur par défaut est la valeur que va prendre automatiquement un élément si aucune
valeur n'est indiquée au niveau du fichier XML.
Pour indiquer une valeur par défaut, c'est l'attribut default qui est utilisé au niveau
de la balise <element /> du Schéma XML.
◻ indiquer qu'à défaut d'être renseigné, le prénom d'une personne
<!-- valide -->
est Robert:
<prenom>Jean</prenom>
<xsd:element name="prenom" type="xsd:string" default="Robert" />
<!-- valide -->
◻ Exemple de documents XML possibles : <prenom>Marie</prenom>
<!-- valide -->
<!-- la balise prenom vaut "Robert" -->
<prenom ></prenom>
Les éléments simples
132

◻ Valeur constante
il est également possible d'imposer une valeur.
■ Cette valeur inchangeable est appelée constante.
Pour indiquer une valeur constante, c'est l'attribut fixed qui est utilisé au niveau
de la balise <element /> du Schéma XML.
obliger toute les personnes de mon document XML à porter le prénom Robert:
<xsd:element name="prenom" type="xsd:string" fixed="Robert" />
Exemple: <!-- valide -->
<prenom>Robert</prenom>
<!-- invalide -->
<prenom>Marie</prenom>
<!-- invalide -->
<prenom></prenom>
Les attributs
133

◻ dans un Schéma XML, tous les attributs d'une balise XML sont
considérés comme des éléments simples.
◻ ils ne peuvent prendre comme valeur qu'un type simple, c'est-à-dire un
nombre, une chaîne de caractère, une date, etc.
Les attributs
134

◻ Déclarer un attribut
C'est le mot attribut qui est utilisé.
n'oubliez pas de faire précéder son utilisation par xsd.
Cette balise prend 2 attributs : un nom et un type.
<xsd:attribut name="mon_nom" type="xsd:mon_type" />
Exemple :
<personne sexe="masculin">Robert DUPONT</personne>
la balise contient un attribut, c'est ce qu'on appelle un élément complexe
déclarer l'attribut dans le Schéma XML :
<xsd:attribut name="sexe" type="xsd:string" />
Les attributs
135

◻ Valeur par défaut


indiquer dans les Schémas XML qu'un attribut a une valeur par défaut.
la valeur par défaut est la valeur prise automatiquement par un attribut si
aucune valeur n'est indiquée au niveau du fichier XML.
Pour indiquer une valeur par défaut, c'est l'attribut default qui est utilisé au
niveau de la balise <attribut /> du Schéma XML
Exemple: indiquer qu'à défaut d'être renseigné, le sexe d'une personne est
masculin:

<xsd:attribut name="sexe" type="xsd:string" default="masculin" />


Les attributs
136

◻ Valeur constante
il est possible d'imposer une valeur.
■ Cette valeur inchangeable est appelée constante.
Pour indiquer une valeur constante, c'est l'attribut fixed qui est utilisé au
niveau de la balise <attribut /> du Schéma XML.
Exemple: obliger toutes les personnes du document XML à être des femmes :

<xsd:attribut name="sexe" type="xsd:string" fixed="feminin" />


Les attributs
137

◻ Attribut obligatoire
les attributs sont, par défaut, optionnels.
Pour indiquer qu'un attribut est obligatoire, on doit renseigner la propriété use à
laquelle on affecte la valeur required.
Exemple: obliger l'utilisation de l'attribut sexe :

<xsd:attribut name="sexe" type="xsd:string" use="required" />


En résumé
138

◻ Un élément simple est un élément qui ne contient qu'une valeur dont le type
est dit simple comme par exemple une balise qui ne contient aucun attribut et
dans laquelle aucune autre balise n'est imbriquée.
◻ Pour décrire un élément simple, on utilise la balise <xsd:element />.
◻ Il est possible de définir une valeur par défaut ou une valeur constante à un
élément simple.
◻ Un attribut est également un élément simple.
◻ Pour décrire un attribut, on utilise la balise <xsd:attribut />.
◻ Il est possible de définir une valeur par défaut, une valeur constante à un
élément simple ou rendre obligatoire un attribut.
139

Schéma XML : les types


simples
Type Description Commentaire
string Les types chaînes
représente une de caractères
chaîne de caractères attention aux caractères spéciaux
normalizedString représente une chaîne de caractères normalisée basé sur le type string
140
token représente une chaîne de caractères normalisée sans espace au basé sur le type normalizedString
début et à la fin
language représente le code d'une langue basé sur le type token
NMTOKEN représente une chaîne de caractère "simple" basé sur le type token
applicable uniquement aux attributs
NMTOKENS représente une liste de NMTOKEN applicable uniquement aux attributs
Name représente un nom XML basé sur le type token
NCName représente un nom XML sans le caractère : basé sur le type Name
ID représente un identifiant unique basé sur le type NCName
applicable uniquement aux attributs
IDREF référence à un identifiant basé sur le type NCName
applicable uniquement aux attributs
IDREFS référence une liste d'identifiants applicable uniquement aux attributs
ENTITY représente une entité d'un document DTD basé sur le type NCName
applicable uniquement aux attributs
ENTITIES représente une liste d'entités applicable uniquement aux attributs
Le type string
141

◻ Il représente une chaîne de caractères et peut donc contenir un peu tout et


n'importe quoi.
◻ Il est cependant important de noter que certains caractères spéciaux comme
le & doivent être écrits avec leur notation HTML.
Une liste des caractères spéciaux et de leur notation HTML est disponible:
http://www.commentcamarche.net/contents/489-caracteres-speciaux-html

Exemple: la règle de Schéma XML suivante :


<xsd:element name="string" type="xsd:string" />
Les lignes XML suivantes sont alors valides :
<string>Maroc</string>
<string>Licence LPDW !</string>
<string>&amp;</string>
Le type normalizedString
142

◻ Le type normalizedString est basé sur le type string et représente une chaîne
de caractères normalisée,
◻ une chaîne de caractères qui peut contenir tout et n'importe quoi à l'exception
de tabulations, de sauts de ligne et de retours chariot.
◻ Dans la pratique, il n'est pas interdit de les écrire, mais ils seront
automatiquement remplacés par des espaces.
◻ toutes les règles du type string s'applique également au
type normalizedString.
les caractères spéciaux comme le & doivent être écrits avec leur notation HTML.
Le type token
143

◻ Le type token est basé sur le type normalizedString et représente une


chaîne de caractères normalisée sans espace au début ni à la fin.
◻ dans la pratique, il n'est pas interdit de les écrire.
Les espaces présents au début et à la fin seront automatiquement supprimés.
Le type language
144

◻ Le type language est basé sur le type token et représente une langue.
◻ Cette langue doit être identifiée par 2 lettres (selon la norme ISO 639 dont
la liste est disponible par sur wikipedia).
Ces 2 caractères peuvent éventuellement être suivi d'un code pays (selon la
norme ISO 3166)
Exemple: la règle suivante : <xsd:element name="langue" type="xsd:language" />
Les lignes XML suivantes sont alors valides :
<langue>fr</langue>
<langue>en</langue>
<langue>en-GB</langue>
<langue>en-US</langue>
Le type NMTOKEN
145

◻ Le type NMTOKEN est basé sur le type token et représente une chaîne de
caractères "simple",
une chaîne de caractères sans espace qui ne contient que les symboles suivants :
■ Des lettres.
■ Des chiffres.
■ Les caractères spéciaux .-_ et :
◻ Si la chaîne de caractères contient des espaces au début ou à la fin, ils seront
automatiquement supprimés.
◻ Afin d'assurer une compatibilité entre les Schémas XML et les DTD, il
convient de n'utiliser le type NMTOKEN que pour un attribut.
Le type NMTOKENS
146

◻ Le type NMTOKENS représente une liste de NMTOKEN séparés par un


espace.
◻ Afin d'assurer une compatibilité entre les Schémas XML et les DTD, il
convient de n'utiliser le type NMTOKENS seulement pour un attribut.
◻ Exemple: la règle suivante issue d'un Schéma XML :
<xsd:attribut name="list" type="xsd:NMTOKENS" />

◻ Les lignes XML suivantes sont alors valides :


<balise list="A:1_B C-2.">contenu de la balise</balise>
<balise list="AZERTY 123456 QSDFGH">contenu de la balise</balise>
Le type Name
147

◻ Le type Name est basé sur le type token et représente un nom XML,
une chaîne de caractères sans espace qui ne contient que les symboles suivants :
■ Des lettres.
■ Des chiffres.
■ Les caractères spéciaux .-_ et :
La différence avec le type NMTOKEN est qu'une chaîne de caractères de type
Name doit obligatoirement commencer par une lettre, ou l'un des 2 caractères
spéciaux suivants : _ et :
Le type NCName
148

◻ Le type NCName est basé sur le type Name.


◻ Il hérite donc de toutes les règles du type Name auxquelles une nouvelle
règles doit être ajoutée :
le type NCName ne peut pas contenir le caractère spécial :
Le type ID
149

◻ Le type ID est basé sur le type NCName,


◻ il hérite donc de toutes les règles de ce type.
◻ un ID représente un identifiant. Il doit donc contenir des valeurs uniques.
◻ il est impossible de lui définir une valeur fixe ou par défaut.
◻ un ID ne doit être utilisé qu'avec les attributs afin d'assurer une
compatibilité entre les Schémas XML et les DTD.
Le type IDREF
150

◻ Le type IDREF fait référence à un ID existant dans le document XML.


◻ il est basé sur le type NCName et hérite donc de toutes les règles de ce type.
◻ Puisque le type ID n'est utilisable qu'avec des attributs, il en est naturellement
de même pour le type IDREF.
Le type IDREFS
151

◻ le type IDREFS représente une liste de IDREF séparés par un espace.


◻ Afin d'assurer une compatibilité entre les Schémas XML et les DTD, il
convient de n'utiliser le type IDREFS que pour un attribut.
◻ Exemple: <xsd:attribut name="enfants" type="xsd:IDREFS" />

<personne num="P1">Paul</personne>
<personne num="P2">Marie</personne>
<personne enfants="P1 P2">Jeanne</personne>
Le type ENTITY
152

◻ Le type ENTITY permet de faire référence à une entité le plus souvent non
XML et déclaré dans des fichiers DTD.
◻ Ce type est basé sur le type NCName, il hérite donc de toutes ses règles.
◻ Afin d'assurer une compatibilité entre les Schémas XML et les DTD, il
convient de n'utiliser le type ENTITY que pour un attribut.
◻ Exemple:
<xsd:attribut name="marque" type="xsd:ENTITY" />

<!ENTITY samsung "Samsung">


<!ENTITY apple "Apple">
<telephone marque="apple">iPhone</telephone>
<telephone marque="samsung">Galaxy SII</telephone>
Le type ENTITIES
153

◻ Il permet de faire référence à une liste d'ENTITY séparés par un espace.


◻ ne doit être utilisé qu'avec un attribut.
Les types dates
154

Type Description
duration représente une durée
date représente une date
time représente une heure
dateTime représente une date et un temps
gYear représente une année
gYearMonth représente une année et un mois
gMonth représente un mois
gMonthDay représente un mois et un jour
gDay représente un jour
Le type duration
155

◻ représente une durée.


Cette durée s'exprime en nombre d'années, de mois, de jours, d'heures, de minutes
et de secondes selon une expression qui n'est pas des plus simples à savoir
PnYnMnDTnHnMnS.
■ P marque le début de l'expression.
■ nY représente le nombre d'années (year) où n est un nombre entier.
■ nM représente le nombre de mois (month) où n est un nombre entier.
■ nD représente le nombre de jours (day) où n est un nombre entier.
■ T permet de séparer la partie date de l'expression de sa partie heure.
■ nH représente le nombre d'heures (hour) où n est un nombre entier.
■ nM représente le nombre de minutes (minute) où n est un nombre entier.
■ nS représente le nombre de secondes (second) où n est un nombre entier ou décimal.
Le type duration
156

◻ L'expression peut-être précédé du signe - dans le cas où l'on souhaite


exprimer une durée négative.
◻ tous les champs ne doivent pas forcément être renseignés.
◻ il est possible de ne renseigner que les heures, les minutes, etc.
◻ Dans le cas où l'expression n'exprime qu'une date, le symbole T ne doit plus
figurer.
<duree>P42YT6M</duree>
◻ toutes ces règles ne sont pas facile à assimiler, <!-- -2 heures -->
◻ Exemples : <duree>-PT2H</duree>
<!-- 2 jours -->
<xsd:element name="duree" type="xsd:duration" /> <duree>P2D</duree>
<!-- 10.5 secondes -->
<duree>PT10.5S</duree>
Le type date
157

◻ Le type date permet d'exprimer une date.


une date s'exprime selon une expression bien spécifique à savoir
YYYY-MM-DD.
■ YYYY représente l'année (year) sur 4 chiffres ou plus.
■ MM représente le mois (month) sur 2 chiffres.
■ DD représente le jour (day) également sur 2 chiffres.
Exemples : <xsd:element name="madate" type="xsd:date" />

<madate>1924-01-13</madate>
<madate>-0034-12-12</madate>
<madate>12405-11-04</madate>
Le type time
158

◻ Le type time permet d'exprimer une heure.


◻ une expression bien spécifique doit être respectée : hh:mm:ss.
hh représente les heures (hour) sur 2 chiffres.
mm représente les minutes (minute) sur 2 chiffres.
ss représente les secondes (second) sur 2 chiffres entiers ou à virgule.
Exemples :
<xsd:element name="monheure" type="xsd:time" />

<!-- 10 heures et 24 minutes -->


<monheure>10:24:00</monheure>
<!-- 2,5 secondes -->
<monheure>00:00:02.5</monheure>
Le type dateTime
159

◻ Le type dateTime peut être considéré comme un mélange entre le


type date et le type time.
◻ permet donc de représenter une date ET une heure.
◻ une expression particulière doit être respectée :
YYYY-MM-DDThh:mm:ss.
◻ il s'agit des expressions du type date et du type time séparées par la
lettre T
Le type gYear
160

◻ Le type gYear représente une année sur 4 chiffres ou plus.


Le type gYearMonth
161

◻ Le type gYearMonth représente une année et un mois.


◻ le type gYearMonth doit respecter une expression particulière :
YYYY-MM.
Le type gMonth
162

◻ Le type gMonth représente un mois sur 2 chiffres précédés du symbole --.


◻ Exemple :
<xsd:element name="mois" type="xsd:gMonth" />

<!-- mars -->


<mois>--03</mois>
<!-- décembre -->
<mois>--12</mois>
Le type gMonthDay
163

◻ Le type gMonthDay représente un mois et un jour.


◻ une expression particulière doit être utilisée afin d'exprimer ce nouveau
type : --MM-DD.
◻ les règles sont les mêmes que celles qu’on a déjà utilisé précédemment
notamment pour le type date et me type gYearMonth.
Le type gDay
164

◻ le type gDay représente un jour sur 2 chiffres précédés du symbole ---.


◻ Exemples :
<xsd:element name="journee" type="xsd:gDay" />

<!-- le troisième jour du mois -->


<journee>---03</journee>
<!-- le douzième jour du mois -->
<journee>---12</journee>
Les types numériques
Type Description Commentaire
float représente un nombre flottant sur 32 bits
165 conforme à la norme IEEE 754
double représente un nombre flottant sur 64 bits
conforme à la norme IEEE 754
decimal représente une nombre décimal
integer représente un nombre entier basé sur le type decimal
long représente un nombre entier basé sur le type integer
int représente un nombre entier basé sur le type long
short représente un nombre entier basé sur le type int
byte représente un nombre entier basé sur le type short
nonPositiveInteger représente un nombre entier non positif basé sur le type integer
negativeInteger représente un nombre entier négatif basé sur le type nonPositiveInteger
nonNegativeInteger représente un nombre entier non négatif basé sur le type integer
positiveInteger représente un nombre entier positif basé sur le type nonNegativeInteger
unsignedLong représente un nombre entier positif basé sur le type nonNegativeInteger
unsignedInt représente un nombre entier positif basé sur le type unsignedLong
unsignedShort représente un nombre entier positif basé sur le type unsignedInt
unsignedByte représente un nombre entier positif basé sur le type unsignedShort
Le type float
166

◻ Il représente un nombre flottant, c'est-à-dire un nombre entier ou décimal, se


trouvant entre les valeurs 3.4x10^-38 et 3.4x10^38.
◻ A cette plage de valeurs, 3 autres peuvent être ajoutées :
-INF pour moins l'infini.
+INF pour plus l'infini.
NaN pour Not a Number, c'est-à-dire pour désigner une valeur non numérique.
◻ Il est tout à fait possible d'écrire un nombre de type float avec des exposants.
Il convient alors d'utiliser la notation E ou e.
<nombre>42</nombre>
◻ Exemples: <nombre>-42.25</nombre>
<xsd:element name="nombre" type="xsd:float" /> <nombre>3E4</nombre>
<nombre>10e-5</nombre>
Le type double
167

◻ un nombre de type double se trouve entre les valeurs 1.7x10^-308 et


1.7x10^308.
◻ les 3 valeurs suivantes peuvent être ajoutées à la liste :
-INF pour moins l'infini.
+INF pour plus l'infini.
NaN pour Not a Number, c'est-à-dire pour désigner une valeur non numérique.
Le type decimal
168

◻ un nombre qui peut-être entier ou à virgule.


◻ Ce nombre peut-être positif ou négatif et donc être précédé du symbole + ou
-.
◻ Dans le cas d'un nombre où la partie entière est égale à zéro, il n'est pas
obligatoire de l'écrire.
◻ Exemples: <xsd:element name="nombre" type="xsd:decimal" />

<nombre>42</nombre>
<nombre>-42.25</nombre>
<nombre>+.42</nombre>
<nombre>00042.420000</nombre>
Les autres types numériques
169

◻ Le type integer
basé sur le type decimal.
un nombre de type integer peut être précédé par le symbole + ou -.
◻ Le type long
basé sur le type integer
doit forcément être compris entre les valeurs -9 223 372 036 854 775 808 et 9
223 372 036 854 775 807.
◻ Le type int
basé sur le type long si ce n'est qu'un nombre de type int doit forcément être
compris entre les valeurs -2 147 483 648 et 2 147 483 647.
Les autres types numériques
170

◻ Le type short
basé sur le type int si ce n'est qu'un nombre de type short doit forcément être
compris entre les valeurs -32 768 et 32 768.
◻ Le type byte
basé sur le type short si ce n'est qu'un nombre de type byte doit forcément être
compris entre les valeurs -128 et 127.
◻ Le type nonPositiveInteger
Basé sur le type integer,
représente un nombre entier qui n'est pas positif. <nombre>-42</nombre>
<nombre>0</nombre>
cela correspond à un nombre négatif ou au nombre zéro.
<nombre>-00042</nombre>
Exemple:
<xsd:element name="nombre" type="xsd:nonPositiveInteger" />
Les autres types numériques
171

◻ Le type negativeInteger
Basé sur le type nonPositiveInteger,
représente un nombre entier strictement négatif, c'est-à-dire strictement inférieur
à zéro.
◻ Le type nonNegativeInteger
Basé sur le type integer,
représente un nombre entier qui n'est pas négatif, c'est-à-dire un nombre
supérieur ou égal à zéro.
Exemple:
<nombre>42</nombre>
<xsd:element name="nombre" type="xsd:nonPositiveInteger" /> <nombre>0</nombre>
<nombre>+00042</nombre>
Les autres types numériques
172

◻ Le type positiveInteger
Basé sur le type nonNegativeInteger, le type positiveIntegerreprésente un nombre entier
strictement positif, c'est-à-dire strictement supérieur à zéro.
◻ Le type unsignedLong
Le type unsignedLong est basé sur le type nonNegativeInteger et représente un entier compris
entre les valeurs 0 et 18 446 744 073 709 551 615.
◻ Le type unsignedInt
Le type unsignedInt est basé sur le type unsignedLong et représente un entier compris entre les
valeurs 0 et 4 294 967 295.
◻ Le type unsignedShort
Le type unsignedShort est basé sur le type unsignedInt et représente un entier compris entre les
valeurs 0 et 65 535.
◻ Le type unsignedByte
Le type unsignedByte est basé sur le type unsignedShort et représente un entier compris entre
les valeurs 0 et 255.
Les autres types
173

Type Description
boolean représente l'état vrai ou faux
QName représente un nom qualifié
NOTATION représente une notation
anyURI représente une URI
base64Binary représente une donnée binaire au format Base64
hexBinary représente une donnée binaire au format hexadecimal
Le type boolean
174

◻ 2 états sont possibles, 4 valeurs sont en réalités acceptées :


true qui représente l'état vrai.
false qui représente l'état faux.
1 qui représente l'état vrai.
0 qui représente l'état faux.
◻ Exemple: via un attribut, de savoir si une personne est un animal ou pas.
<xsd:attribute name="animal" type="xsd:boolean" />

<!-- Victor Hugo n'est pas un animal -->


<personne animal="false">Victor Hugo</personne>
<!-- Zozor est bien un animal -->
<personne animal="true">Zozor</personne>
Le type anyURI
175

◻ représente une URI (Uniform Resource Identifier).


◻ Une URI est une chaîne de caractère qui permet d'identifier une ressource.
◻ On distingue généralement 2 types d'URI :
Les URL (Uniform Resource Locator) est probablement la forme d'URI la plus
connue
■ les URL sont utilisés pour décrire l'adresse d'une ressource sur un réseau.
■ Par exemple http://www.uae.ma et ftp://ftp.rfc-editor.org/in-notes/rfc2396.txt .
Les URN (Uniform Resource Name) sont quant à eux utilisés pour identifier une
ressource dans un espace<xsd:attribute
de noms. name="adresse" type="xsd:anyURI"/>
Exemple:
<!-- URI absolu -->
<image adresse="http://www.uae.ma/bundles/common/images/spreadsheetV32.png" ></image>
<!-- URI relatif -->
<image adresse="../bundles/common/images/spreadsheetV32.png"></image>
176

Schéma XML : les types


complexes
Les éléments complexes
177

◻ Un élément complexe est un élément qui contient d'autres éléments ou des


attributs.
◻ les éléments contenus dans un élément peuvent également contenir des
éléments ou des attributs.
◻ quelques exemples d'éléments XML
<!-- la balise personne contient d'autres balises => élément complexe -->
<personne>
<!-- la balise nom est un élément simple -->
<nom>ROBERT</nom>
<!-- la balise prenom est un élément simple -->
<prenom>Axel</prenom>
</personne>
<!-- la balise personne possède un attribut => élément complexe -->
<personne sexe="feminin">Axel ROBERT</personne>
Déclarer un élément complexe
178

◻ le mot clef complexType qu'il faut utiliser associé à : element.


◻ N'oubliez pas de précéder son utilisation par xsd:
<xsd:element name="mon_nom">
<personne>
<xsd:complexType>
<nom>ROBERT</nom>
<!-- contenu ici -->
<prenom>Axel</prenom>
<xsd:complexType>
</personne>
</xsd:element>
◻ déclaration :
<xsd:element name="personne">
<xsd:complexType>
<!-- contenu ici -->
</xsd:complexType>
</xsd:element>
Les contenus des types complexes
179

◻ il existe 3 types de contenus possibles :


Les contenus simples.
Les contenus "standards".
Les contenus mixtes.
Les contenus simples
180

◻ le contenu d'un élément complexe qui n'est composé que d'attributs et d'un
texte de type simple.
<!-- contient un attribut et du texte -->
◻ Quelques exemples: <prix devise="euros">35</prix>
<!-- contient un attribut et du texte -->
<voiture marque="Renault">Clio</voiture>
◻ Du côté du Schéma XML
<xsd:element name="mon_nom">
La syntaxe <xsd:complexType>
■ Pour déclarer un élément complexe faisant référence à une balise contenant des attributs
<xsd:simpleContent>
et du texte: <xsd:extension base="mon_type">
<xsd:attribute name="mon_nom" type="mon_type" ></xsd:attribute>
</xsd:extension>
</xsd:simpleContent>
</xsd:complexType>
</xsd:element>
Les contenus simples
181

◻ Exemple : un prix prenant pour attribut une devise :


<prix devise="euros">35</prix>
◻ le schéma XML associé :

<xsd:element name="prix">
<xsd:complexType>
<xsd:simpleContent>
<xsd:extension base="xsd:positiveInteger">
<xsd:attribute name="devise" type="xsd:string" ></xsd:attribute>
</xsd:extension>
</xsd:simpleContent>
</xsd:complexType>
</xsd:element>
l'ordre dans lequel les attributs sont déclarés
Les contenus simples dans le Schéma XML n'a aucune importance.
182

◻ Dans le cas où la balise que l'on cherche à décrire contient plusieurs attributs,
il convient de tout simplement les lister entre les balises <xsd:extension/>
◻ Exemple : <voiture marque="Renault" type="essence">Clio</voiture>
<xsd:element name="voiture">
<xsd:complexType>
<xsd:simpleContent>
<xsd:extension base="xsd:string">
<xsd:attribute name="marque" type="xsd:string" ></xsd:attribute>
<xsd:attribute name="type" type="xsd:string" ></xsd:attribute>
</xsd:extension>
</xsd:simpleContent>
</xsd:complexType>
</xsd:element>
Les contenus "standards"
183

◻ le contenu d'un élément complexe qui n'est composé que d'autres éléments
(simples ou complexes) ou uniquement d'attributs.
◻ Quelques exemples

<!-- contient d'autres éléments -->


<personne>
<nom>DUPONT</nom>
<prenom>Robert</prenom>
</personne>
<!-- contient un attribut -->
<voiture marque="Renault" ></voiture>
Balise contenant un ou plusieurs attributs
184

◻ un élément complexe qui ne contient que des attributs.


◻ Exemple:
<voiture marque="Renault" ></voiture>

◻ le Schéma XML associé :


<xsd:element name="voiture">
<xsd:complexType>
<xsd:attribute name="marque" type="xsd:string" ></xsd:attribute>
</xsd:complexType>
</xsd:element>

◻ imbriquer une balise <xsd:attribute /> dans une balise <xsd:complexType/>.


Balise contenant un ou plusieurs attributs
185

◻ le cas d'une balise contenant plusieurs attributs :


<voiture marque="Renault" modele="Clio" ></voiture>
◻ le Schéma XML :
<xsd:element name="voiture">
<xsd:complexType>
<xsd:attribute name="marque" type="xsd:string" ></xsd:attribute>
<xsd:attribute name="modele" type="xsd:string" ></xsd:attribute>
</xsd:complexType>
</xsd:element>

◻ l'ordre dans lequel les balises <xsd:attribute /> sont placées n'a aucune
importance.
Balise contenant d'autres éléments
186

◻ La séquence :
Une séquence est utilisée lorsque l'on souhaite spécifier que les éléments contenus
dans un type complexe doivent apparaître dans un ordre précis.
déclaration d’une séquence au niveau d'un Schéma XML :
<xsd:element name="mon_nom">
<xsd:complexType>
<xsd:sequence>
<!-- liste des éléments -->
</xsd:sequence>
<!-- listes des attributs -->
</xsd:complexType>
</xsd:element>
Balise contenant d'autres éléments
187

◻ Exemple : <xsd:element name="personne">


<xsd:complexType>
<xsd:sequence>
<xsd:element name="nom" type="xsd:string"></xsd:element>
<xsd:element name="prenom" type="xsd:string"></xsd:element>
</xsd:sequence>
<xsd:attribute name="sexe" type="xsd:string" ></xsd:attribute>
</xsd:complexType>
</xsd:element>

◻ la balise <personne /> qui possède l'attribut sexe, contient les balises <nom
/> et <prenom /> dans cet ordre.
Balise contenant d'autres éléments
188

◻ Exemple:
<!-- valide -->
<personne sexe="masculin">
<nom>DUPONT</nom>
<prenom>Robert</prenom>
</personne>
<!-- invalide => les balises nom et prenom sont inversées -->
<personne sexe="masculin">
<prenom>Robert</prenom>
<nom>DUPONT</nom>
</personne>
Balise contenant d'autres éléments
189

◻ Le type all
Le type all est utilisé lorsque l'on veut spécifier que les éléments contenu dans un
type complexe peuvent apparaître dans n'importe quel ordre.
Ils doivent cependant tous apparaître une et une seule fois.
déclaration le type all au niveau d'un Schéma XML :
<xsd:element name="mon_nom">
<xsd:complexType>
<xsd:all>
<!-- liste des éléments -->
</xsd:all>
<!-- listes des attributs -->
</xsd:complexType>
</xsd:element>
Balise contenant d'autres éléments
190

◻ Exemple :
<xsd:element name="personne">
<xsd:complexType>
<xsd:all>
<xsd:element name="nom" type="xsd:string"></xsd:element>
<xsd:element name="prenom" type="xsd:string"></xsd:element>
</xsd:all>
</xsd:complexType>
</xsd:element>

◻ la balise <personne /> contient les balises <nom /> et <prenom /> dans
n'importe quel ordre.
Balise contenant d'autres éléments
191

◻ Exemple:
<!-- valide -->
<personne sexe="masculin">
<nom>DUPONT</nom>
<prenom>Robert</prenom>
</personne>
<!-- valide -->
<personne sexe="masculin">
<prenom>Robert</prenom>
<nom>DUPONT</nom>
</personne>
Balise contenant d'autres éléments
192

◻ Le choix
Un choix est utilisé lorsque l'on veut spécifier qu'un élément contenu dans un type
complexe soit choisi dans une liste pré-définie.
déclaration d’un choix au niveau d'un Schéma XML :
<xsd:element name="mon_nom">
<xsd:complexType >
<xsd:choice>
<!-- liste des éléments -->
</xsd:choice>
<!-- listes des attributs -->
</xsd:complexType>
</xsd:element>
Balise contenant d'autres éléments
193

◻ Exemple:
<xsd:element name="personne">
<xsd:complexType>
<xsd:choice>
<xsd:element name="nom" type="xsd:string"></xsd:element>
<xsd:element name="prenom" type="xsd:string"></xsd:element>
</xsd:choice>
</xsd:complexType>
</xsd:element>

◻ la balise <personne /> contient soit la balise <nom />, soit <prenom />.
Balise contenant d'autres éléments
194

◻ Exemple:
<!-- valide -->
<personne sexe="masculin">
<nom>DUPONT</nom>
</personne>
<!-- valide -->
<personne sexe="masculin">
<prenom>Robert</prenom>
</personne>
<!-- invalide => les 2 balises prenom et nom ne peuvent pas apparaître en même temps -->
<personne sexe="masculin">
<prenom>Robert</prenom>
<nom>DUPONT</nom>
</personne>
Cas d'un type complexe encapsulant un type complexe
195

◻ Exemple : document XML


<?xml version="1.0" encoding="UTF-8"?>
<personne>
<identite>
<nom>NORRIS</nom>
<prenom>Chuck</prenom>
</identite>
</personne>

◻ Ce document XML permet d'identifier une personne via son nom et son
prénom.
Cas d'un type complexe encapsulant un type complexe
196

<?xml version="1.0" encoding="UTF-8"?>


◻ le Schéma XML qui définit le document XML :
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="personne">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="identite">
<xsd:complexType>
lorsque l'on place un élément complexe au sein d'un autre
<xsd:sequence>
élément complexe, dans <xsd:element
notre name="nom" type="xsd:string"></xsd:element>
cas, une identité dans
<xsd:element name="prenom" type="xsd:string"></xsd:element>
une personne, il convient d'utiliser une séquence,
</xsd:sequence>
un choix ou un type all. </xsd:complexType>
</xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
Les contenus mixtes
197

◻ Un contenu mixte est le contenu d'un élément complexe qui est composé
d'attributs, d'éléments et de texte.
<balise1>
◻ Un exemple : Ceci est une chaîne de caractères
<balise2>10</balise2>
7.5
</balise1>
◻ Du côté du Schéma XML
La syntaxe
<xsd:element name="mon_nom">
■ Pour déclarer un élément complexe au contenu mixte, voici la syntaxe à utiliser
<xsd:complexType :
mixed="true">
■ La nouveauté est donc l'utilisation du mot clef mixed. <!-- liste des éléments -->
</xsd:complexType>
<!-- liste des attributs -->
</xsd:element>
Les contenus mixtes
198

◻ Un exemple:
une facture fictive dans laquelle on souhaite identifier l'acheteur et la somme qu'il
doit payer.
. <facture><acheteur>Zozor</acheteur>, doit payer <somme>1000</somme>€.</facture>
Schéma XML :
<xsd:element name="facture">
<xsd:complexType mixed="true">
<xsd:sequence>
<xsd:element name="acheteur" type="xsd:string" ></xsd:element>
<xsd:element name="somme" type="xsd:int" ></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
Les contenus mixtes
199

◻ On utilise la balise <xsd:sequence /> pour encapsuler la liste des balises


contenues dans la balise <facture />,
◻ On peut adapter à notre cas de figure et choisir parmi les balises qu’on a vu
dans la partie précédente:
<xsd:sequence />.
<xsd:all />.
<xsd:choice />.
En résumé
200

◻ Un élément complexe est un élément qui contient d'autres éléments ou des


attributs.
◻ Un élément complexe est décrit grâce à la balise <xsd:complexType />.
◻ Un élément complexe a 3 types de contenus possibles : les contenus
simples, "standards" et mixtes.
201

Le nombre
d'occurrences
Exemple (étudier un morceau de Schéma
202
XML)
◻ une personne qui possède un nom et un prénom :
<xsd:complexType name="personne">
<xsd:sequence>
<xsd:element name="nom" type="xsd:string" ></xsd:element>
<xsd:element name="prenom" type="xsd:string" ></xsd:element>
</xsd:sequence>
</xsd:complexType>

◻ signifie que la balise <personne/> contient les balises <nom /> et <prenom/>
dans cet ordre.
◻ La notion d'occurrence va nous permettre de préciser si les balises, dans le cas
de cet exemple<nom />et<prenom />, peuvent apparaître plusieurs fois, voire
pas du tout.
Le nombre d'occurrences
203

◻ Le cas par défaut


Lorsque le nombre d'occurrences n'est pas précisé, la balise doit apparaître une et une seule
fois.
◻ Le nombre minimum d'occurrences
Pour indiquer le nombre minimum d'occurrences d'un élément, on utilise l'attribut
minOccurs.
■ sa valeur par défaut est 1.
Dans le cas où nous souhaitons rendre optionnel un élément, il convient de lui affecter la valeur 0.
◻ Le nombre maximum d'occurrences
Pour indiquer le nombre maximum d'occurrences d'un élément, on utilise l'attribut maxOccurs.
la valeur par défaut est 1.
dans le cas où il est utilisé, sa valeur doit obligatoirement être supérieure à zéro.
il est possible de ne pas spécifier un nombre maximal d'occurrences grâce au mot clé unbounded.
Exemple
204

<xsd:complexType name="personne">
<xsd:sequence>
<xsd:element name="nom" type="xsd:string" ></xsd:element>
<xsd:element name="prenom" type="xsd:string" minOccurs="2" maxOccurs="unbounded" ></xsd:element>
</xsd:sequence>
</xsd:complexType>

◻ pour l'élément prenom, le nombre minimum d'occurrences est à 2 tandis qu'il


n'y a pas de maximum.
Exemple
205

◻ signifie, que dans le fichier XML, cette balise devra apparaître entre 2 et
une infinité de fois
<personne>
<nom>Zozor</nom>
<prenom>Robert</prenom>
<prenom>Bernard</prenom>
</personne>
<personne>
<nom>Zozor</nom>
<prenom>Robert</prenom>
<prenom>Bernard</prenom>
<prenom>Paul</prenom>
<prenom>Pierre</prenom>
</personne>

Vous aimerez peut-être aussi