„Entität (Auszeichnungssprache)“ – Versionsunterschied

[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Ebenenanordnung geändert
K wp ist immer heute
Markierungen: Mobile Bearbeitung Bearbeitung von einer mobilen Anwendung Bearbeitung mit Android-App
 
(25 dazwischenliegende Versionen von 19 Benutzern werden nicht angezeigt)
Zeile 1:
'''Entitäten''' ([[Englische Sprache{{enS|engl.]] ''entity'', ''entities''}}) werden in [[Auszeichnungssprache]]n (''engl. Markup{{enS|markup Languages''languages}}) wie [[SGML]], [[XML]], XHTML,[[Hypertext Markup Language|HTML]], [[XHTML]] und [[HTML5]] verwendet, um wiederkehrende Informationseinheiten zu verwalten und wiederzuverwenden.<ref> Die weit verbreitete Syntax für Entitäten basiert auf [[Standard Generalized Markup Language|SGML]]. Bei der Entwicklung von [[Extensible Markup Language|XML]] und [[HTML5|HTML]] Version 5 wurden Teile aus SGML übernommen, so auch einige Möglichkeiten zur Definition von Entitäten. Häufigster Vertreter ist die Zeichen-Entität, welche durch ein einzelnes Zeichen ersetzt werden soll. Dabei wird insbesondere eine [[Mnemotechnik|mnemotechnische]] Abkürzung (benannte Entität) ersetzt durch die dezimal oder hexadezimal angegebene Zeichencodierung (numerische Entität, Zeichenverweis).
Goldfarb u.a.: ''XML in Office 2003'', [[Mediengruppe Pearson|Pearson]], 2004, S. 320 [https://books.google.de/books?id=2TWti9Gy7ZwC&pg=PA320]</ref>
 
== {{Anker|Zeichen-Entitäten}} Benannte Entität ==
Die heute weit verbreitete Syntax für Entitäten basieren auf [[Standard Generalized Markup Language|SGML]]. Bei der Entwicklung [[Extensible Markup Language|XML]] und HTML Version 5 wurden Teile aus SGML übernommen, so auch einige Möglichkeiten zur Definition von Entitäten.
 
:''Namen (benannte Zeichenentitäten) sind für Menschen da, Zahlen für Maschinen.'' Computer können problemlos fünfstellige Zeichencodierungen verarbeiten – nur Menschen haben ihre Schwierigkeiten damit.
Häufigster Vertreter ist die Zeichen-Entität, welche durch ein einzelnes Zeichen ersetzt werden soll. Dabei wird insbesondere eine [[Mnemotechnik|mnemotechnische]] Abkürzung (benannte Entität) ersetzt durch die dezimal oder hexadezimal angegebene Zeichenkodierung (numerische Entität, Zeichenverweis).
 
Computer können problemlos fünfstellige Zeichencodierungen verarbeiten&nbsp;– nur Menschen haben ihre Schwierigkeiten damit. Benannte Entitäten verbessern die Lesbarkeit von Dokumenten durch den Benutzer. Mittels einer [[Dokumenttypdefinition]] (DTD) wird eine benannte Entität mit Name (Entitätsname) und Inhalt (Entitätsinhalt) deklariert. Wird im Dokumententext auf den Entitätsnamen referenziert, dann ersetzt der Parser die Referenz durch den Entitätsinhalt.<ref>Goldfarb u.&nbsp;a.: ''XML in Office 2003'', [[Mediengruppe Pearson|Pearson]], 2004, S. 320-322320–322</ref>
== Benannte Entität==
 
''Namen (benannte Zeichenentitäten) sind für Menschen da, Zahlen für Maschinen.'' Computer können problemlos fünfstellige Zeichencodierungen verarbeiten – nur Menschen haben ihre Schwierigkeiten damit.
 
Benannte Entitäten verbessern die Lesbarkeit von Dokumenten durch den Benutzer.
 
Mittels einer [[Dokumenttypdefinition]] (DTD) wird eine benannte Entität mit Name (Entitätsname) und Inhalt (Entitätsinhalt) deklariert. Wird im Dokumententext auf den Entitätsnamen referenziert, dann ersetzt der Parser die Referenz durch den Entitätsinhalt.<ref>Goldfarb u.a.: ''XML in Office 2003'', [[Mediengruppe Pearson|Pearson]], 2004, S. 320-322</ref>
 
: ''Beispiele:''
:* Hier wird vereinbart, alle ''&amp;amp;'' durch das Zeichen ''dezimal&nbsp;38'' zu ersetzen:
Zeile 45 ⟶ 39:
== Zeichenverweis (Numerische Entität) ==
 
In der [[SGML]]-Norm wurden ''numerische Entitäten'' als ''Zeichenverweise'' (engl. Character Reference) eingeführt.<ref>{{Internetquelle |url=http://www.din.de/en/getting-involved/standards-committees/nia/standards/wdc-beuth:din21:736498 |titel=ISO 8879:1986-10 |werk=www.din.de |zugriff=2016-12-04}}</ref> Auch in [[XML]] werden numerische Entitäten als Zeichenverweise definiert.<ref>{{Internetquelle |url=https://www.w3.org/TR/2008/PER-xml-20080205/#NT-Name |titel=Extensible Markup Language (XML) 1.0 (Fifth Edition) |werk=www.w3.org |zugriff=2016-12-04}}</ref> Bei der ''numerischen Entität'' wird der Zeichencode als Entität in das Dokument eingetragen als :
* <code>&amp;#''nnn'';</code>, wobei ''nnn'' die dezimale KodierungCodierung des einzusetzenden Zeichens ist, oder
* <code>&amp;#xhhhhx''hhhh'';</code>, wobei ''hhhh'' die hexadezimale KodierungCodierung des einzusetzenden Zeichens ist.
Der Parser ersetzt den Zeichencode durch das kodiertecodierte Zeichen (siehe auch [[HTML-Entität]]).
 
== Ersetzung von Entitäten durch Schriftzeichen ==
 
Der Ersatz einer Zeichenentität im Quelltext muss nicht zwingend 1:1 durch ein anderes Zeichen erfolgen.
In europäisch kodiertencodierten Sprachen (lateinisch, griechisch) sind [[Diakritisches Zeichen|diakritische Zeichen]] üblich.
 
: ''Beispiel:''
: Das Zeichen »é« kann wahlweise definiert sein als
:# <ttspan style="font-family:monospace;"><&lt;!ENTITY&nbsp;eacute&nbsp;"&amp;#233;"&gt;</ttspan>
:# <ttspan style="font-family:monospace;"><&lt;!ENTITY&nbsp;eacute&nbsp;"&amp;#xE9;"&gt;</ttspan> &nbsp;—&nbsp; ''([[Hexadezimalsystem|hexadezimal]])''
:# <ttspan style="font-family:monospace;"><&lt;!ENTITY&nbsp;eacute&nbsp;"é"&gt;</ttspan>
:# <ttspan style="font-family:monospace;"><&lt;!ENTITY&nbsp;eacute&nbsp;"e&amp;#x0301;"&gt;</ttspan>
:# <ttspan style="font-family:monospace;"><&lt;!ENTITY&nbsp;Kleines_E_mit_Strich_drüber_nach_rechts_oben&nbsp;"e&amp;#x02CA;"&gt;</ttspan>
: In den ersten beiden Definitionen wird das benannte durch eine numerische Entität ersetzt, im dritten durch ein einzelnes Unicode/ANSI-Zeichen und im vierten durch eine Kombination zweier Zeichen: ein [[Akut]] mit dem Grundbuchstaben &nbsp;<ttspan style="font-family:monospace;">e</ttspan>.
 
Es muss aber nicht immer so sein, dass ein Grundbuchstabe mit genau einem diakritischen Zeichen zusammentrifftzusammentreffen; mehrere solcher Modifikationen können über, unter und neben dem Grundbuchstaben erfolgen.
 
In außereuropäischen Schriftsystemen existieren außerdem vielfältige [[Ligatur (Typografie)|Ligaturen]], also unterschiedlichste Kombinationen zusammentreffender Einzelbuchstaben &nbsp;– als Beispiele sei [[Devanagari]] oder [[Tamilische Schrift|Tamilisch]] herausgegriffen.
In anderen Fällen (beispielsweise im [[Arabische Schrift|Arabischen]]) hängt die Gestalt des sich ergebenden Schriftzeichens vom Kontext, von der sprachlichen Bedeutung ab &nbsp; und nicht nur vom Zusammentreffen numerisch codierter Einzelzeichen, wie es leicht durch eine Software umgerechnet werden kann.
und nicht nur vom Zusammentreffen numerisch kodierter Einzelzeichen, wie es leicht durch eine Software umgerechnet werden kann.
Im Deutschen wäre als entsprechendes Beispiel die korrekte Verwendung des [[Langes s|langen ''s'' und runden ''s'']] zu nennen oder das Verbot von ''ff''-, ''fi''-, ''fl''-Ligaturen über Silbengrenzen hinweg.
 
Zeile 80 ⟶ 73:
:# <code><!ENTITY&nbsp;ko_37&nbsp;"¤Å"></code><br /><code><!ENTITY&nbsp;Encoding&nbsp;"EUC-KR"></code> &nbsp;—&nbsp; ''[[Extended UNIX Coding|EUC]]-KR''
:# <code><!ENTITY&nbsp;ko_37&nbsp;"&amp;#60;img src='ko_37.png'&amp;#62;"></code><br /><code><!ENTITY&nbsp;Encoding&nbsp;"graphic glyphs"></code> &nbsp;—&nbsp; ''Ersatzgrafik''
: In den vielen Nutztexten werden dann die Zeichen mittels der <ttspan style="font-family:monospace;">&amp;ko_</ttspan>''nn''<ttspan style="font-family:monospace;">;</ttspan> geschrieben. Zu Beginn jedes Textes kann ein Hinweis eingefügt sein wie etwa:
:: This document view is shown in <ttspan style="font-family:monospace;">&amp;Encoding;</ttspan> (version: <ttspan style="font-family:monospace;">&amp;koTXT-Version;</ttspan> - required: 1.2).
: Damit werden die Leser informiert, welches DTD zurzeit eingebunden wird und können bei Darstellungsproblemen Abhilfe schaffen.
 
== Zukunft der Zeichenentitäten ==
 
Mit der allmählichen Verbreitung von [[Unicode Transformation Format|UTF]]-8, UTF-16, [[Universal Coded Character Set|UCS]]-2 und UCS-4 in internationalen [[Informationstechnik|IT]]-Anwendungen nimmt die Notwendigkeit einer KodierungCodierung von Schriftzeichen mittels ''character entities'' allmählich ab.
Es wird aber noch viele Jahre dauern, bis weltweit das letzte Kommunikationsprotokoll und die letzte Software-Anwendung Multi-Byte-Zeichen fehlerfrei handhaben kann.
 
Daher bleibt die Notwendigkeit bestehen, für den '''Austausch''' mittels numerischer Entitäten selbst noch auf die Stufe <ttspan style="font-family:monospace;">[[American Standard Code for Information Interchange|us-ascii]]</ttspan> (7&nbsp;bit) zurückfallen zu können.
Die Konvertierung ist aber in beiden Richtungen verlustfrei möglich, sofern die ''general entities'' dabei nicht angetastet werden und sofern überhaupt eine spezifische KodierungCodierung im ''[[Unicode|Universal Character Set]]'' existiert.
 
Bedeutung wird die Darstellung als benannte Entity wohldefinierter Einzelzeichen langfristig nur für das Lesen und Schreiben von XML-Quelltext durch menschliche Bearbeiter behalten, wenn Zeichen außerhalb der jeweiligen Sprachwelt vorkommen (seien sie nun fremdsprachlich oder auch mathematisch).
Zeile 101 ⟶ 94:
Bei HTML –&nbsp;der häufigsten Anwendung&nbsp;– ist das der Fall.
 
== {{Anker|named }} ISO-genormte ZeichennnamenZeichennamen ==
 
; {{Anker|SGML.1986}} SGML (1986)
:: Latin Letters
::: <ttspan style="font-family:monospace;">isolat1</ttspan> &nbsp; Added Latin 1
::: <ttspan style="font-family:monospace;">isolat2</ttspan> &nbsp; Added Latin 2
::: <ttspan style="font-family:monospace;">isodia&nbsp;</ttspan> &nbsp; Diacritical Marks
:: Graphics and Symbols
::: <ttspan style="font-family:monospace;">isonum&nbsp;</ttspan> &nbsp; Numeric and Special Graphic
::: <ttspan style="font-family:monospace;">isopub&nbsp;</ttspan> &nbsp; Publishing (Typographic)
::: <ttspan style="font-family:monospace;">isotech</ttspan> &nbsp; General Technical
::: <ttspan style="font-family:monospace;">isobox&nbsp;</ttspan> &nbsp; Box and Line Drawing
:: Added Mathematical Symbols
::: <ttspan style="font-family:monospace;">isoamsa</ttspan> &nbsp; Arrow Relations
::: <ttspan style="font-family:monospace;">isoamsb</ttspan> &nbsp; Binary Operators
::: <ttspan style="font-family:monospace;">isoamsc</ttspan> &nbsp; Delimiters
::: <ttspan style="font-family:monospace;">isoamsn</ttspan> &nbsp; Negated Relations
::: <ttspan style="font-family:monospace;">isoamso</ttspan> &nbsp; Ordinary
::: <ttspan style="font-family:monospace;">isoamsr</ttspan> &nbsp; Relations
:: Greek Characters
::: <ttspan style="font-family:monospace;">isogrk1</ttspan> &nbsp; Greek Letters
::: <ttspan style="font-family:monospace;">isogrk2</ttspan> &nbsp; Monotoniko Greek
::: <ttspan style="font-family:monospace;">isogrk3</ttspan> &nbsp; Greek Symbols
::: <ttspan style="font-family:monospace;">isogrk4</ttspan> &nbsp; Alternative Greek Symbols
:: Cyrillic Characters
::: <ttspan style="font-family:monospace;">isocyr1</ttspan> &nbsp; Russian Cyrillic
::: <ttspan style="font-family:monospace;">isocyr2</ttspan> &nbsp; Non-Russian Cyrillic
: ''Dabei wurden nur die Namen und eine Beschreibung des Zeichens festgelegt; die Zuordnung von Codierungen konnte erst später mit [[Unicode]] erfolgen.''
:* Definition unter [https://www.w3.org/2003/entities/iso8879doc www.w3.org/2003/entities/iso8879doc]
; HTML&nbsp;2 (1995)
:* Ersatzzeichen für die HTML-Syntax: <ttspan style="font-family:monospace;">amp</ttspan>, <ttspan style="font-family:monospace;">lt</ttspan>, <ttspan style="font-family:monospace;">gt</ttspan>, <ttspan style="font-family:monospace;">quot</ttspan>
:* Benannte Zeichen für [[ISO 8859]]-1 (also Codierungen 160…255)
:: Deren Definition ist identisch mit SGML:isolat1, (wiedergegeben als: [//<code><nowiki>www.w3.org/TR/REC-html40/HTMLlat1.ent</nowiki></code>).<ref>{{Internetquelle |url=https://www.w3.org/TR/REC-html40/HTMLlat1.ent] |titel=HTMLlat1.ent |hrsg=w3.org |abruf=2019-03-29 |sprache=en}}</ref>
; HTML&nbsp;4 (1999)
: Wie HTML&nbsp;2, aber Definition 152 weiterer Codierungen &gt;255 &nbsp;– für die Darstellung [[Unicode]] erforderlich (UTF-8).
: Definitionen erhältlich<ref>Eine bequemer lesbare Ressource unter [https://www.w3.org/TR/html401/sgml/entities.html Character entity references in HTML 4] (ebenfalls [[W3C]]).</ref> unter
: Definitionen erhältlich unter
:* [http://www.w3.org/TR/REC-html40/HTMLlat1.ent www.w3.org/TR/REC-html40/HTMLlat1.ent]
:* [http://www.w3.org/TR/REC-html40/HTMLsymbol.ent www.w3.org/TR/REC-html40/HTMLsymbol.ent]
Zeile 150 ⟶ 143:
: Definiert sind Hunderte von Sonderzeichen, wie sie für mathematische Formeln benötigt werden. Überwiegend werden eigene Namen verwendet, die fast immer länger als die bei HTML und SGML sind.
; XML (2010)
: 2007–2010 wurden alle gebräuchlichen Namen zusammengetragen und in einem Entwurf vereinigt.<ref>Zuletzt: 10. April 2014, [https://www.w3.org/TR/xml-entity-names/#changes20100401 W3C Recommendation.] Das Dokument hatte also den Status einer Empfehlung.</ref> In einer DTD sind 2237 Namen auf ZeichenkodierungenZeichencodierungen abgebildet:
:* [https://www.w3.org/2003/entities/2007/w3centities-f.ent www.w3.org/2003/entities/2007/w3centities-f.ent]
: Insbesondere [[#SGML.1986|SGML (1986)]] und [[#MathML|MathML]] sind abgedeckt; damit ist auch HTML vollständig enthalten. Im Einzelfall wurde auch auf die praktikabelste Variante standardisiert, wo für den gleichen Zweck unterschiedliche Abbildungen auf mehrere Zeichencodes existierten.
 
Zeile 162 ⟶ 155:
|-
|rowspan="3" align="center" | 168<br />¨<br />U+00A8
| "<ttspan style="font-family:monospace;">die</ttspan>"
| SGML:isodia
|-
| "<ttspan style="font-family:monospace;">Dot</ttspan>"
| SGML:isotech
|-
| "<ttspan style="font-family:monospace;">uml</ttspan>"
| HTML.2, SGML:isodia
|-
|rowspan="2" align="center" | 913<br />Α<br />U+0391
| "<ttspan style="font-family:monospace;">Agr</ttspan>"
| SGML:isogrk1
|-
| "<ttspan style="font-family:monospace;">Alpha</ttspan>"
| HTML.4
|-
|rowspan="4" align="center" | 8598<br />↖<br />U+2196
| "<ttspan style="font-family:monospace;">nwarr</ttspan>"
| SGML:isoamsa ''north west arrow''
|-
| <ttspan style="font-family:monospace;">&amp;#x2196;</ttspan>
| HTML
|-
| "<ttspan style="font-family:monospace;">UpperLeftArrow</ttspan>"
| MathML
|-
| "<ttspan style="font-family:monospace;">nwarrow</ttspan>"
| MathML
|}
Zeile 194 ⟶ 187:
Dem Zeichen »Α« ist dabei nicht anzusehen, ob es ein griechisches großes Alpha oder ein lateinisches A ist.
 
=== Anmerkung ===
 
Gelegentlich erfolgt der Einwand, mnemonische Entitäten würden die Arbeit unnötig kompliziert machen, weil die entsprechenden DTDs vereinbart und bereitgestellt werden müssten und man solle doch gleich die richtigen Zeichen tippen bzw. nur mit den numerischen Entitäten arbeiten.
 
Dazu einfach ein Beispiel in <ttspan style="font-family:monospace;">SGML:isocyr1</ttspan> zum Vergleich:
 
: □&nbsp;□&nbsp;□&nbsp;□&nbsp;□&nbsp;□&nbsp;□ <!-- ;-) please do not edit -->
: <ttspan style="font-family:monospace;">&amp;'''R'''cy;&amp;'''u'''cy;&amp;'''s'''cy;&amp;'''s'''cy;&amp;'''k'''cy;&amp;'''i'''cy;&amp;'''j'''cy;</ttspan>
: =&nbsp;''Russkij''
: =&nbsp;<ttspan style="font-family:monospace;">&amp;#1056;&amp;#1091;&amp;#1089;&amp;#1089;&amp;#1082;&amp;#1080;&amp;#1081;</ttspan>
: =&nbsp;<ttspan style="font-family:monospace;">&amp;#x0420;&amp;#x0443;&amp;#x0441;&amp;#x0441;&amp;#x043A;&amp;#x0438;&amp;#x0439;</ttspan>
: =&nbsp;Русский
 
Es kann durchaus sinnvoll sein, nach dem Editieren die benannten Entitäten automatisch in die numerische Form umzuwandeln, in diesem Format an Andere weiterzugeben &nbsp; aber bei der nächsten Änderung durch menschliche Bearbeiter die numerischen Entitäten wieder mnemonisch darzustellen.
aber bei der nächsten Änderung durch menschliche Bearbeiter die numerischen Entitäten wieder mnemonisch darzustellen.
 
Die Darstellung als Entitäten hat weiterhin den Vorteil, dass unterschiedliche Zeichen mit unterschiedlicher Bedeutung, die sich bei der grafischen Darstellung sehr ähneln (z.&nbsp;B.: Hochkomma, Akzent, Apostroph, Anführungszeichen), eindeutig unterschieden werden können.
 
=== XHTML ===
 
XHTML enthält exakt alle Definitionen aus HTML&nbsp;4.0, und in jeder Implementierung müssen alle benannten Entitäten bekannt sein (und sind es auch, üblicherweise hard-coded).
Diese Weiterentwicklung betrifft inneres Format und Struktur der Elemente (''(tags)''), nicht aber den Nutztext und nicht die Entitäten. Allerdings traten Mitte der 2000er Jahre vermehrt Probleme in der Kommunikation mit [[Webserver]]n auf: Sie stellen die Dokumente nicht mehr mit dem [[Internet Media Type|MIME-Typ]] <span style="font-family:monospace;">text/html</span> bereit, sondern als <span style="font-family:monospace;">application/xml</span>, <span style="font-family:monospace;">text/xml</span> und andere. Dies führte damals tatsächlich zu Darstellungsproblemen, wenn (ältere) Browser daraufhin den Text nicht mehr als HTML erkennen.
 
Weiterhin gibt es XML-Anwendungen, die mit Textpassagen arbeiten und die dazu die vergleichbaren und bekannten HTML-Elemente nachempfunden haben. Aktuelles und häufigstes Beispiel sind schriftliche [[RSS (Web-Feed)|RSS]]-[[Web-Feed]]s ''(News)''. Sie enthalten wie HTML <span style="font-family:monospace;">&lt;p&gt;</span>, <span style="font-family:monospace;">&lt;span&gt;</span>, <span style="font-family:monospace;">&lt;div&gt;</span> und auch <span style="font-family:monospace;">&lt;head&gt;</span> / <span style="font-family:monospace;">&lt;body&gt;</span>. Der Quelltext sieht daher aus, ''als ob'' es sich um HTML handeln würde. Da dieses aber gar kein HTML-Dokument ist, können benannte Entitäten nicht benutzt werden&nbsp;– sofern die entsprechenden DTD nicht eingebunden wurden oder die Darstellungssoftware (meist der [[Webbrowser]]) die wohlbekannten Definitionen nicht von sich aus anwendet.
Allerdings traten Mitte der 2000er Jahre vermehrt Probleme in der Kommunikation mit [[Webserver]]n auf: Sie stellen die Dokumente nicht mehr mit dem [[Internet Media Type|MIME-Typ]] <tt>text/html</tt> bereit,
sondern als <tt>application/xml</tt>, <tt>text/xml</tt> und andere.
Dies führte damals tatsächlich zu Darstellungsproblemen, wenn (ältere) Browser daraufhin den Text nicht mehr als HTML erkennen.
 
Weiterhin gibt es XML-Anwendungen, die mit Textpassagen arbeiten und die dazu die vergleichbaren und bekannten HTML-Elemente nachempfunden haben.
Aktuelles und häufigstes Beispiel sind schriftliche [[RSS (Web-Feed)|RSS]]-[[Web-Feed]]s (''News'').
Sie enthalten wie HTML <tt>&lt;p&gt;</tt>, <tt>&lt;span&gt;</tt>, <tt>&lt;div&gt;</tt> und auch <tt>&lt;head&gt;</tt> / <tt>&lt;body&gt;</tt>.
Der Quelltext sieht daher aus, ''als ob'' es sich um HTML handeln würde.
Da es aber gar kein HTML-Dokument ist, können benannte Entitäten nicht benutzt werden&nbsp;– sofern die entsprechenden DTD nicht eingebunden wurden oder die Darstellungssoftware (meist [[Webbrowser]]) die wohlbekannten Definitionen nicht von sich aus anwendet.
 
== Parameter-Entitäten ==
Ein Sonderfall in [[SGML]], [[Extensible Markup Language|XML]] usw. sind ''parameter entities''. Sie dürfen nicht in Dokumenten, sondern nur innerhalb der [[Dokumenttypdefinition|DTD]] benutzt werden. Ansonsten haben sie die identische Syntax, jedoch steht statt <code>&amp;</code> ein <code>%</code> am Beginn.
 
Syntax der Deklaration:<syntaxhighlight lang="xml">
Ein Sonderfall in [[SGML]], [[Extensible Markup Language|XML]] usw. sind ''parameter entities''.
<syntaxhighlight lang="xml">
Sie dürfen nicht in Dokumenten, sondern nur innerhalb der [[Dokumenttypdefinition|DTD]] benutzt werden.
Ansonsten haben sie die identische Syntax, jedoch steht statt <code>&amp;</code> ein <code>%</code> am Beginn.
 
Syntax der Deklaration:<syntaxhighlight lang="xml">
<!ENTITY % Name SYSTEM "externe.datei" >
</syntaxhighlight>
Syntax der Referenz (Aufruf der Entität):
<syntaxhighlight lang="xml">
%Name;
</syntaxhighlight>
 
== Literatur ==
* [[Charles Goldfarb]], Priscilla Walmsley: ''XML in Office 2003: Daten managen mit Word, Excel, FrontPage und InfoPath'', [[Mediengruppe Pearson|Pearson]], 2004, ISBN 9783827321794978-3-8273-2179-4 [https://books.google.de/books?id=2TWti9Gy7ZwC books.google.de]
 
== Weblinks ==
Zeile 250 ⟶ 234:
<references />
 
[[Kategorie:BeschreibungsspracheSGML]]
[[Kategorie:XML]]