UD1 - Introducción A Los Lenguajes de Marcas
UD1 - Introducción A Los Lenguajes de Marcas
UD1 - Introducción A Los Lenguajes de Marcas
Lenguajes de Marcas
Introducción a los Lenguajes de Marcas by Rafael Lozano is licensed under a Creative Commons
Reconocimiento-NoComercial-CompartirIgual 3.0 España License.
Tabla de contenidos
Tabla de contenido
1 Introducción....................................................................................................................................... 1
1.1 Anatomía de una marca............................................................................................................................1
1.2 Los lenguajes de marcas en un entorno web.....................................................................................3
1.3 Evolución histórica de los LM..................................................................................................................5
1.3.1 El origen: GML............................................................................................................................................ 6
1.3.2 La estandarización: SGML....................................................................................................................... 6
1.3.3 La popularización: HTML......................................................................................................................... 7
1.3.4 La madurez: XML....................................................................................................................................... 8
1.4 Características generales de los LM......................................................................................................8
1.4.1 Texto plano................................................................................................................................................. 8
1.4.2 Compactibilidad......................................................................................................................................... 9
1.4.3 Independencia del dispositivo final...................................................................................................... 9
1.4.4 Especialización........................................................................................................................................... 9
1.4.5 Flexibilidad.................................................................................................................................................. 9
1.5 Ventajas y desventajas de los LM...........................................................................................................9
1.6 Clasificación de los LM............................................................................................................................10
1.6.1 De presentación...................................................................................................................................... 10
1.6.2 Descriptivo, estructural o semántico.................................................................................................11
1.6.3 Híbrido....................................................................................................................................................... 11
1.7 Ámbitos de aplicación.............................................................................................................................12
2 Introducción a XML.........................................................................................................................13
2.1 Estructura de un documento XML.......................................................................................................14
2.2 Reglas sintácticas......................................................................................................................................15
2.3 Documento XML bien formado............................................................................................................15
2.4 Espacio de nombres................................................................................................................................16
3 Organizaciones y estándares.......................................................................................................16
4 Bibliografía........................................................................................................................................ 19
Índice I
Rafael Lozano Introducción a los Lenguajes de Marcas
Introducción a los
Lenguajes de Marcas
1 Introducción
Los documentos electrónicos constan de un conjunto de información al que se le ha
aplicado un determinado formato para hacerlos más atractivos y comprensibles. Utilizamos
tamaños de letra, estilos de letra, listas numeradas o con viñetas, tablas, colores, etc. La
forma de aplicar este formato dependerá del documento en si y de la aplicación que lo ha
generado, pero el principio básico es que un fragmento de texto del documento con un
determinado formato disponga de información añadida definiendo dicho formato.
En el caso de los documentos que intercambiamos a través de Internet, como las
páginas web, son los lenguajes de marcas (LM) quienes nos permiten aplicar dicho formato.
Un documento que contenga exclusivamente texto es perfectamente legible por
nosotros, aunque evidentemente, tedioso, soso e inapropiado para publicar páginas web. Si
le aplicamos formato mediante un LM, como por ejemplo HTML, obtenemos un archivo
también legible pero más difícil de interpretar. Sin embargo, a la hora de mostrarlo por
pantalla, la aplicación del formato al texto es tarea del agente de usuario (navegador web), el
cual interpreta las marcas de formato y las aplica convenientemente al texto para dar lugar a
una página web, que será mucho más agradable de leer que el texto original.
Una marca es una señal que delimita un fragmento de texto para realizar algún
procesamiento sobre ese texto.
Página 1
Rafael Lozano Introducción a los Lenguajes de Marcas
que describe su función encerrada entre los símbolos menor que (<) y mayor que (>) como
por ejemplo <table>. Dependiendo del tipo de marca, es muy habitual que aparezcan por
parejas, una de comienzo que precede a un fragmento de texto, y otra de fin justo después
de dicho fragmento de texto, para delimitar la aplicación de esa marca al fragmento
encerrado entre la apertura y el fin. Así, el fragmento de texto delimitado por la marca de
inicio y de fin será la parte del documento a la que se tenga que aplicar el formato o función
indicado por la marca en cuestión.
Vemos que la marca <sup> es el inicio y </sup> es la marca de final. Entre el inicio y
el fin se encuentra el texto 2. Esta marca se aplica únicamente al texto delimitado por el
inicio y el fin y, en este caso, provocará que el 2 se vea como un superíndice. El resultado
sería E=mc2.
Un documento de mayor tamaño combinará su contenido con múltiples marcas
diseminadas por todo el texto, las cuales indicarán algún tipo de procesamiento dentro del
documento y, como vimos en el ejemplo anterior, este procesamiento se aplicará a
fragmentos de texto concreto, aquellos delimitados por las marcas de inicio y final.
Por ejemplo, el siguiente documento es una página web realizada con uno de los
lenguajes de marcas más populares: HTML.
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8"/>
<title>Mi página de prueba</title>
</head>
<body>
<h1>Esto es un título de nivel 1</h1>
<p>Esto es un sencillo ejemplo de documento electrónico
realizado con un lenguaje de marcas como HTML. En el mismo
podemos apreciar diferentes elementos identificados con una
Página 2
Rafael Lozano Introducción a los Lenguajes de Marcas
marca o etiqueta.</p>
<p>A lo largo de estos capítulos veremos que estructura
tienen los documentos hechos con lenguajes de marcas y el
significado de cada etiqueta</p>
<img src="images/firefox-icon.png" alt="Icono de Firefox"/>
</body>
</html>
Vemos que hay una serie de marcas, como por ejemplo: <h1>Esto es un título
de nivel 1</h1> es un texto delimitado por una marca en la apertura (<h1>) y otra en el
cierre (</h1>) para delimitar al texto sobre el que se aplica.
Las marcas pueden incluir atributos, los cuales se emplean para añadir alguna
propiedad o característica al elemento de la marca. Los atributos generalmente tienen un
valor, el cual se encierra entre comillas y se separa del atributo por el símbolo =. Los
atributos solamente se incluyen, cuando proceda, en la marca de inicio, nunca en la de fin.
Su sintaxis sería:
<marca atributo=”valor”>Texto</marca>
Las marcas para elementos que no tienen contenido no tienen cierre, únicamente
apertura. A estos elementos se les conoce como elementos vacíos. En este caso la marca
incluye el símbolo / antes del >. Por ejemplo <img>
<img src=”imagenes/favicon.png”/>
Página 3
Rafael Lozano Introducción a los Lenguajes de Marcas
Un agente de usuario es una aplicación que actúa como cliente realizando solicitudes a
un servidor en un protocolo de red y encargándose de interpretar la respuesta recibida.
Página 4
Rafael Lozano Introducción a los Lenguajes de Marcas
Página 5
Rafael Lozano Introducción a los Lenguajes de Marcas
Página 6
Rafael Lozano Introducción a los Lenguajes de Marcas
El SGML tuvo una gran aceptación y hoy día se emplea en campos en los que se
requiere documentación a gran escala. A pesar de ello, resultó farragoso y difícil de
aprender, como consecuencia de la ambición de los objetivos previstos. Su gran potencia
era a la vez una ventaja y una desventaja. Por ejemplo, ciertas etiquetas podían tener solo
principio, o solo final, o incluso ser obviadas, pensando en que los textos serían redactados
a mano y que así se ahorrarían pulsaciones de teclas. Sin embargo fue un punto clave en el
desarrollo de los lenguajes de marcas actuales, ya que la gran mayoría derivan de este.
Página 7
Rafael Lozano Introducción a los Lenguajes de Marcas
Página 8
Rafael Lozano Introducción a los Lenguajes de Marcas
1.4.2 Compactibilidad
Las etiquetas de marcado se mezclan con el propio contenido, por ejemplo,
<h2>Contenido</h2>.
El código entre símbolos mayor y menor, como <h2>, son instrucciones de marcado,
también llamadas etiquetas. Esta etiqueta en concreto es una etiqueta de presentación,
indica que el texto comprendido debe tener el formato asignado a la cabecera de segundo
nivel. El texto entre las marcas es el propio contenido del documento.
1.4.4 Especialización
Inicialmente los lenguajes de marcas se idearon para visualizar documentos de texto,
pero progresivamente se han empezado a utilizar en muchas otras áreas como gráficos
vectoriales, sindicación de contenidos, notación científica, interfaces de usuario, síntesis de
voz, etc.
1.4.5 Flexibilidad
Los lenguajes de marcas se pueden combinar en el mismo archivo con otros lenguajes,
como HTML con PHP y JavaScript. Incluso hay etiquetas específicas para ello como es
<script>.
XML ha permitido que se puedan combinar varios lenguajes de marcas diferentes en
un mismo archivo, como en el caso de XHTML con MathML y SVG.
Página 9
Rafael Lozano Introducción a los Lenguajes de Marcas
1.6.1 De presentación
Indican el formato del texto o tipografía, sin especificar su estructura, por ejemplo
aumentar el tamaño de la fuente, centrar o cambiar a negrita.
Esta categoría incluye los lenguajes de procedimiento que agrupan varias marcas de
presentación en una macro. Por ejemplo, para formatear un título, debe haber una serie de
directivas inmediatamente antes del texto indicando: tamaño de letra 16p, fuente Anal,
negrita. Justo después del título debe haber etiquetas inversas que anulen el formato, para
continuar con el texto normal.
El software que representa el documento debe interpretar el código en el mismo orden
en que aparece. Los procesadores de texto y en general las aplicaciones de edición
profesional utilizan este tipo de marcado, como por ejemplo RTF y TeX
Página 10
Rafael Lozano Introducción a los Lenguajes de Marcas
1.6.3 Híbrido
Lenguajes que contienen marcas de los dos tipos anteriores indistintamente. Por
ejemplo HTML (derivado de SGML), XHTML, WML (derivados de XML). En este caso el
lenguaje permite tanto representar la estructura del documento como su presentación.
Página 11
Rafael Lozano Introducción a los Lenguajes de Marcas
Página 12
Rafael Lozano Introducción a los Lenguajes de Marcas
2 Introducción a XML
El lenguaje XML es una simplificación y adaptación del lenguaje SGML, el cual permite
definir lenguajes específicos. Por lo tanto, XML no es un lenguaje en particular, sino una
manera de definir lenguajes para diferentes necesidades, es decir, lo que hemos llamado un
metalenguaje. Para describir la relación con SGML a menudo se utiliza la regla 80/20: 80%
de funcionalidad y 20% de complejidad.
Algunos de los lenguajes que se basan en XML para su definición son XHTML, SVG,
MathML, RSS, etc.
Como características podemos citar:
✔ Extensible, se pueden definir nuevas etiquetas
✔ Versátil, separa contenido, estructura y presentación
✔ Estructurado, se pueden modelar datos a cualquier nivel de complejidad
✔ Validable, cada documento se puede validar frente a un DTD/Schema
✔ Abierto, independiente de empresas, sistemas operativos, lenguajes de
programación o entornos de desarrollo.
✔ Sencillo, fácil de aprender y de usar.
XML no se utiliza solo en Internet, sino que se está convirtiendo en un estándar para el
intercambio de información estructurada entre diferentes plataformas. Se puede usar en
bases de datos ligeras, editores de texto, hojas de cálculo, transacciones comerciales y en
general donde se necesite almacenar información sin las restricciones de un SGBD
relacional.
Página 13
Rafael Lozano Introducción a los Lenguajes de Marcas
Página 14
Rafael Lozano Introducción a los Lenguajes de Marcas
Página 15
Rafael Lozano Introducción a los Lenguajes de Marcas
No hay que confundir un documento XML bien formado con un documento válido. Un
documento XML válido es el que está bien formado, y además cumple con la definición de
un lenguaje de marcado particular especificado para el documento. Es decir, el cuerpo del
documento tiene una estructura de elementos compatible con el lenguaje concreto al que
corresponde. Así, todo documento XML válido es un documento bien formado (todos los
documentos XML tienen que estar bien formados), pero no ocurre al contrario.
Un procesador XML conforme con la especificación XML, comprobará que el
documento cumple estas restricciones de buena formación. Cualquier restricción no
cumplida será detectada y se tratará como un error fatal: el procesador informará a la
aplicación y dejará de trabajar de una manera normal. Fundamentalmente, el objetivo de
estas restricciones es asegurar que los documentos XML puedan ser interpretados por los
procesadores XML sin ninguna ambigüedad, de manera que todos los elementos (y
atributos) quedan perfectamente definidos.
3 Organizaciones y estándares
En el desarrollo de tecnologías relacionadas con los procesos industriales y
telemáticos es fundamental la existencia de estándares emitidos por organizaciones de
estandarización y reconocidos universalmente para garantizar la interoperabilidad de
sistemas heterogéneos.
Página 16
Rafael Lozano Introducción a los Lenguajes de Marcas
El World Wide Web Consortium (W3C) es una comunidad internacional que desarrolla
estándares que aseguran el crecimiento de la Web a largo plazo.
Página 17
Rafael Lozano Introducción a los Lenguajes de Marcas
4 Bibliografía
WIKIPEDIA, Espacio de nombres XML. [acceso septiembre 2020]. Disponible en
<https://es.wikipedia.org/wiki/Espacio_de_nombres_XML>
WIKIPEDIA, Lenguaje de marcado. [acceso septiembre 2020]. Disponible en
<https://es.wikipedia.org/wiki/Lenguaje_de_marcado#Historia>
TODOXML, Documentos XML bien formados [acceso septiembre 2020]. Disponible en
<https://sites.google.com/site/todoxmldtd/referencia/referencia-de-xml/07-xml-bien-
formados#:~:text=Un%20documento%20XML%20bien%20formado,formado%20con%20un
%20documento%20v%C3%A1lido.>
ARRANZ,D., Apuntes de HTML. [acceso septiembre 2020]. Disponible en
<https://www.dsi.uclm.es/personal/MiguelFGraciani/mikicurri/Docencia/
LenguajesInternet0910/web_LI/Teoria/XML/Programaci%C3%B3n%20en%20castellano_
%20Apuntes%20de%20XML.%20Escribir%20XML.htm>
CASTRO,J.M. y RODRÍGUEZ, J.R., Lenguajes de Marcas y Sistemas de Gestión de
Información. Ed Garceta 2012 – ISBN: 978-84-1545-217-1
Página 19