„Entität (Auszeichnungssprache)“ – Versionsunterschied

Versionsgeschichte interaktiv durchsuchen

[gesichtete Version]

← Zum vorherigen Versionsunterschied

Inhalt gelöscht Inhalt hinzugefügt

VisuellWikitext

Version vom 24. Dezember 2021, 00:57 Uhr Bearbeiten Thornard (Diskussion \| Beiträge) Sichter 17.534 Bearbeitungen unnötige absätze entfernt ← Zum vorherigen Versionsunterschied		Aktuelle Version vom 26. Januar 2023, 20:40 Uhr Bearbeiten rückgängig Boonekamp (Diskussion \| Beiträge) Passive Sichter, Sichter 68.782 Bearbeitungen K wp ist immer heute Markierungen: Mobile Bearbeitung Bearbeitung von einer mobilen Anwendung Bearbeitung mit Android-App
(3 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: '''Entitäten''' ({{enS\|entity, entities}}) werden in [[Auszeichnungssprache]]n ({{enS\|markup languages}}) wie [[SGML]], [[XML]], [[Hypertext Markup Language\|HTML]], [[XHTML]] und [[HTML5]] verwendet, um wiederkehrende Informationseinheiten zu verwalten und wiederzuverwenden. Die ~~heute~~ weit verbreitete Syntax für Entitäten basiert auf [[Standard Generalized Markup Language\|SGML]]. Bei der Entwicklung von [[Extensible Markup Language\|XML]] und [[HTML5\|HTML]] Version 5 wurden Teile aus SGML übernommen, so auch einige Möglichkeiten zur Definition von Entitäten. Häufigster Vertreter ist die Zeichen-Entität, welche durch ein einzelnes Zeichen ersetzt werden soll. Dabei wird insbesondere eine [[Mnemotechnik\|mnemotechnische]] Abkürzung (benannte Entität) ersetzt durch die dezimal oder hexadezimal angegebene Zeichencodierung (numerische Entität, Zeichenverweis). == {{Anker\|Zeichen-Entitäten}} Benannte Entität == Zeile 42: * <code>&#''nnn'';</code>, wobei ''nnn'' die dezimale Codierung des einzusetzenden Zeichens ist, oder * <code>&#x''hhhh'';</code>, wobei ''hhhh'' die hexadezimale Codierung des einzusetzenden Zeichens ist. Der Parser ersetzt den Zeichencode durch das codierte Zeichen (siehe auch [[HTML-Entität]]). == Ersetzung von Entitäten durch Schriftzeichen == Zeile 56: :# <span style="font-family:monospace;"><!ENTITY eacute "e&#x0301;"></span> :# <span style="font-family:monospace;"><!ENTITY Kleines_E_mit_Strich_drüber_nach_rechts_oben "e&#x02CA;"></span> : In den ersten beiden Definitionen wird das benannte durch eine numerische Entität ersetzt, im dritten durch ein einzelnes Unicode/ANSI-Zeichen und im vierten durch eine Kombination zweier Zeichen: ein [[Akut]] mit dem Grundbuchstaben  <span style="font-family:monospace;">e</span>. Es muss aber nicht immer ein Grundbuchstabe mit genau einem diakritischen Zeichen zusammentreffen; mehrere solcher Modifikationen können über, unter und neben dem Grundbuchstaben erfolgen. Zeile 126: :* Ersatzzeichen für die HTML-Syntax: <span style="font-family:monospace;">amp</span>, <span style="font-family:monospace;">lt</span>, <span style="font-family:monospace;">gt</span>, <span style="font-family:monospace;">quot</span> :* Benannte Zeichen für [[ISO 8859]]-1 (also Codierungen 160…255) :: Deren Definition ist identisch mit SGML:isolat1(wiedergegeben als <code><nowiki>www.w3.org/TR/REC-html40/HTMLlat1.ent</nowiki></code>).<ref>{{~~cite web~~Internetquelle \| url=https://~~www.w3.org/TR/REC-html40/HTMLlat1.ent~~ www.w3.org/TR/REC-html40/HTMLlat1.ent \| ~~title~~titel=HTMLlat1.ent \| ~~publisher~~hrsg=w3.org \| ~~format=ENT \| language=englisch \| accessdate~~abruf=2019-03-29 \|sprache=en}}</ref> ; HTML 4 (1999) : Wie HTML 2, aber Definition 152 weiterer Codierungen >255 – für die Darstellung [[Unicode]] erforderlich (UTF-8). Zeile 207: XHTML enthält exakt alle Definitionen aus HTML 4.0, und in jeder Implementierung müssen alle benannten Entitäten bekannt sein (und sind es auch, üblicherweise hard-coded). Diese Weiterentwicklung betrifft inneres Format und Struktur der Elemente (''(tags)''), nicht aber den Nutztext und nicht die Entitäten. Allerdings traten Mitte der 2000er Jahre vermehrt Probleme in der Kommunikation mit [[Webserver]]n auf: Sie stellen die Dokumente nicht mehr mit dem [[Internet Media Type\|MIME-Typ]] <span style="font-family:monospace;">text/html</span> bereit, sondern als <span style="font-family:monospace;">application/xml</span>, <span style="font-family:monospace;">text/xml</span> und andere. Dies führte damals tatsächlich zu Darstellungsproblemen, wenn (ältere) Browser daraufhin den Text nicht mehr als HTML erkennen. sondern als <span style="font-family:monospace;">application/xml</span>, <span style="font-family:monospace;">text/xml</span> und andere. Dies führte damals tatsächlich zu Darstellungsproblemen, wenn (ältere) Browser daraufhin den Text nicht mehr als HTML erkennen. Weiterhin gibt es XML-Anwendungen, die mit Textpassagen arbeiten und die dazu die vergleichbaren und bekannten HTML-Elemente nachempfunden haben. Aktuelles und häufigstes Beispiel sind schriftliche [[RSS (Web-Feed)\|RSS]]-[[Web-Feed]]s (''(News)''). Sie enthalten wie HTML <span style="font-family:monospace;"><p></span>, <span style="font-family:monospace;"><span></span>, <span style="font-family:monospace;"><div></span> und auch <span style="font-family:monospace;"><head></span> / <span style="font-family:monospace;"><body></span>. Der Quelltext sieht daher aus, ''als ob'' es sich um HTML handeln würde. Da dieses aber gar kein HTML-Dokument ist, können benannte Entitäten nicht benutzt werden – sofern die entsprechenden DTD nicht eingebunden wurden oder die Darstellungssoftware (meist der [[Webbrowser]]) die wohlbekannten Definitionen nicht von sich aus anwendet. == Parameter-Entitäten ==