-
Notifications
You must be signed in to change notification settings - Fork 157
/
Copy pathencoding.xml
75 lines (72 loc) · 2.76 KB
/
encoding.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
<?xml version="1.0" encoding="utf-8"?>
<!-- $Revision$ -->
<!-- EN-Revision: af4410a7e15898c3dbe83d6ea38246745ed9c6fb Maintainer: yannick Status: ready -->
<!-- Reviewed: yes -->
<article xml:id="xml.encoding" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
<title>Codage des caractères</title>
<para>
L'extension XML de PHP supporte les caractères
<link xlink:href="&url.unicode;">Unicode</link> grâce à
différents codages. Il y a deux types de codages de
caractères : le <glossterm>codage à la source</glossterm> et le
<glossterm>codage à la cible</glossterm>. PHP utilise le
<literal>UTF-8</literal> comme représentation interne.
</para>
<para>
L'encodage à la source est effectué lors de
<link linkend="function.xml-parse">l'analyse</link> du fichier par XML.
Lors de la <link linkend="function.xml-parser-create">création
d'un analyseur XML</link>), un type de codage à la
source peut être spécifié (et il ne pourra plus
être modifié jusqu'à la destruction de
l'analyseur). Les codages supportés sont :
<literal>ISO-8859-1</literal>, <literal>US-ASCII</literal> et
<literal>UTF-8</literal>. Les deux derniers sont des codages
à un seul octet, c'est-à-dire que les caractères
sont représentés sur un seul octet. <literal>UTF-8</literal>
peut représenter des caractères composés par un
nombre variable de bits (jusqu'à 21), allant de 1 à
quatre octets. Le codage par défaut utilisé par PHP
<literal>ISO-8859-1</literal>.
</para>
<para>
Le codage à la cible est effectué lorsque PHP transfert
les données aux gestionnaires XML. Lorsqu'un analyseur est
créé, le codage à la cible est spécifié
de la même façon que le codage à la source, mais
il peut être modifié à tout moment. Le codage
à la cible affectera les balises, tout comme les
données brutes, et les noms des instructions exécutables.
</para>
<para>
Si l'analyseur XML rencontre un caractère qu'il ne
connaît pas (hors limite, par exemple), il retournera une erreur.
</para>
<para>
Si PHP rencontre un caractère dans le document XML analysé,
qu'il ne peut pas représenter dans le codage à la cible
choisi, le caractère sera remplacé par un point
d'interrogation (cette attitude est susceptible de changer
ultérieurement).
</para>
</article>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->