„Entität (Auszeichnungssprache)“ – Versionsunterschied

[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Thornard (Diskussion | Beiträge)
unnötige absätze entfernt
K wp ist immer heute
Markierungen: Mobile Bearbeitung Bearbeitung von einer mobilen Anwendung Bearbeitung mit Android-App
 
(3 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1:
'''Entitäten''' ({{enS|entity, entities}}) werden in [[Auszeichnungssprache]]n ({{enS|markup languages}}) wie [[SGML]], [[XML]], [[Hypertext Markup Language|HTML]], [[XHTML]] und [[HTML5]] verwendet, um wiederkehrende Informationseinheiten zu verwalten und wiederzuverwenden. Die heute weit verbreitete Syntax für Entitäten basiert auf [[Standard Generalized Markup Language|SGML]]. Bei der Entwicklung von [[Extensible Markup Language|XML]] und [[HTML5|HTML]] Version 5 wurden Teile aus SGML übernommen, so auch einige Möglichkeiten zur Definition von Entitäten. Häufigster Vertreter ist die Zeichen-Entität, welche durch ein einzelnes Zeichen ersetzt werden soll. Dabei wird insbesondere eine [[Mnemotechnik|mnemotechnische]] Abkürzung (benannte Entität) ersetzt durch die dezimal oder hexadezimal angegebene Zeichencodierung (numerische Entität, Zeichenverweis).
 
== {{Anker|Zeichen-Entitäten}} Benannte Entität ==
Zeile 42:
* <code>&amp;#''nnn'';</code>, wobei ''nnn'' die dezimale Codierung des einzusetzenden Zeichens ist, oder
* <code>&amp;#x''hhhh'';</code>, wobei ''hhhh'' die hexadezimale Codierung des einzusetzenden Zeichens ist.
Der Parser ersetzt den Zeichencode durch das codierte Zeichen (siehe auch [[HTML-Entität]]).
 
== Ersetzung von Entitäten durch Schriftzeichen ==
Zeile 56:
:# <span style="font-family:monospace;">&lt;!ENTITY&nbsp;eacute&nbsp;"e&amp;#x0301;"&gt;</span>
:# <span style="font-family:monospace;">&lt;!ENTITY&nbsp;Kleines_E_mit_Strich_drüber_nach_rechts_oben&nbsp;"e&amp;#x02CA;"&gt;</span>
: In den ersten beiden Definitionen wird das benannte durch eine numerische Entität ersetzt, im dritten durch ein einzelnes Unicode/ANSI-Zeichen und im vierten durch eine Kombination zweier Zeichen: ein [[Akut]] mit dem Grundbuchstaben &nbsp;<span style="font-family:monospace;">e</span>.
 
Es muss aber nicht immer ein Grundbuchstabe mit genau einem diakritischen Zeichen zusammentreffen; mehrere solcher Modifikationen können über, unter und neben dem Grundbuchstaben erfolgen.
Zeile 126:
:* Ersatzzeichen für die HTML-Syntax: <span style="font-family:monospace;">amp</span>, <span style="font-family:monospace;">lt</span>, <span style="font-family:monospace;">gt</span>, <span style="font-family:monospace;">quot</span>
:* Benannte Zeichen für [[ISO 8859]]-1 (also Codierungen 160…255)
:: Deren Definition ist identisch mit SGML:isolat1(wiedergegeben als <code><nowiki>www.w3.org/TR/REC-html40/HTMLlat1.ent</nowiki></code>).<ref>{{cite webInternetquelle | url=https://www.w3.org/TR/REC-html40/HTMLlat1.ent www.w3.org/TR/REC-html40/HTMLlat1.ent | titletitel=HTMLlat1.ent | publisherhrsg=w3.org | format=ENT | language=englisch | accessdateabruf=2019-03-29 |sprache=en}}</ref>
; HTML&nbsp;4 (1999)
: Wie HTML&nbsp;2, aber Definition 152 weiterer Codierungen &gt;255&nbsp;– für die Darstellung [[Unicode]] erforderlich (UTF-8).
Zeile 207:
 
XHTML enthält exakt alle Definitionen aus HTML&nbsp;4.0, und in jeder Implementierung müssen alle benannten Entitäten bekannt sein (und sind es auch, üblicherweise hard-coded).
Diese Weiterentwicklung betrifft inneres Format und Struktur der Elemente (''(tags)''), nicht aber den Nutztext und nicht die Entitäten. Allerdings traten Mitte der 2000er Jahre vermehrt Probleme in der Kommunikation mit [[Webserver]]n auf: Sie stellen die Dokumente nicht mehr mit dem [[Internet Media Type|MIME-Typ]] <span style="font-family:monospace;">text/html</span> bereit, sondern als <span style="font-family:monospace;">application/xml</span>, <span style="font-family:monospace;">text/xml</span> und andere. Dies führte damals tatsächlich zu Darstellungsproblemen, wenn (ältere) Browser daraufhin den Text nicht mehr als HTML erkennen.
sondern als <span style="font-family:monospace;">application/xml</span>, <span style="font-family:monospace;">text/xml</span> und andere. Dies führte damals tatsächlich zu Darstellungsproblemen, wenn (ältere) Browser daraufhin den Text nicht mehr als HTML erkennen.
 
Weiterhin gibt es XML-Anwendungen, die mit Textpassagen arbeiten und die dazu die vergleichbaren und bekannten HTML-Elemente nachempfunden haben. Aktuelles und häufigstes Beispiel sind schriftliche [[RSS (Web-Feed)|RSS]]-[[Web-Feed]]s (''(News)''). Sie enthalten wie HTML <span style="font-family:monospace;">&lt;p&gt;</span>, <span style="font-family:monospace;">&lt;span&gt;</span>, <span style="font-family:monospace;">&lt;div&gt;</span> und auch <span style="font-family:monospace;">&lt;head&gt;</span> / <span style="font-family:monospace;">&lt;body&gt;</span>. Der Quelltext sieht daher aus, ''als ob'' es sich um HTML handeln würde. Da dieses aber gar kein HTML-Dokument ist, können benannte Entitäten nicht benutzt werden&nbsp;– sofern die entsprechenden DTD nicht eingebunden wurden oder die Darstellungssoftware (meist der [[Webbrowser]]) die wohlbekannten Definitionen nicht von sich aus anwendet.
 
== Parameter-Entitäten ==