HTML
HTML
Capítulo 1. Introducción
¿Qué es HTML?
Definiéndolo de forma sencilla, "HTML es lo que se utiliza para crear todas las
páginas web de Internet". Más concretamente, HTML es el lenguaje con el que se
"escriben" la mayoría de páginas web.
Los diseñadores utilizan el lenguaje HTML para crear sus páginas web, los
programas que utilizan los diseñadores generan páginas escritas en HTML y los
navegadores que utilizamos los usuarios muestran las páginas web después de leer
su contenido HTML.
Aunque HTML es un lenguaje que utilizan los ordenadores y los programas de
diseño, es muy fácil de aprender y escribir por parte de las personas. En realidad,
HTML son las siglas de HyperText Markup Language y más adelante se verá el
significado de cada una de estas palabras.
El lenguaje HTML es un estándar reconocido en todo el mundo y cuyas normas
define un organismo sin ánimo de lucro llamado World Wide Web Consortium, más
conocido como W3C. Como se trata de un estándar reconocido por todas las
empresas relacionadas con el mundo de Internet, una misma página HTML se
visualiza de forma muy similar en cualquier navegador de cualquier sistema
operativo.
El propio W3C define el lenguaje HTML como "un lenguaje reconocido
universalmente y que permite publicar información de forma global". Desde su
creación, el lenguaje HTML ha pasado de ser un lenguaje utilizado exclusivamente
para crear documentos electrónicos a ser un lenguaje que se utiliza en muchas
aplicaciones electrónicas como buscadores, tiendas online y banca electrónica.
Breve historia de HTML
La historia completa de HTML es tan interesante como larga, por lo que a
continuación se muestra su historia resumida a partir de la información que se puede
encontrar en la Wikipedia.
El origen de HTML se remonta a 1980, cuando el físico Tim Berners-Lee, trabajador
del CERN (Organización Europea para la Investigación Nuclear) propuso un nuevo
sistema de "hipertexto" para compartir documentos.
Los sistemas de "hipertexto" habían sido desarrollados años antes. En el ámbito de
la informática, el "hipertexto" permitía que los usuarios accedieran a la información
relacionada con los documentos electrónicos que estaban visualizando. De cierta
manera, los primitivos sistemas de "hipertexto" podrían asimilarse a los enlaces de
las páginas web actuales.
HTML y CSS
Originalmente, las páginas HTML sólo incluían información sobre sus contenidos de
texto e imagenes. Con el desarrollo del estándar HTML, las páginas empezaron a
incluir también información sobre el aspecto de sus contenidos: tipos de letra,
colores y márgenes.
La posterior aparición de tecnologías como JavaScript, provocaron que las páginas
HTML también incluyeran el código de las aplicaciones (llamadas scripts) que se
utilizan para crear páginas web dinámicas.
Incluir en una misma página HTML los contenidos, el diseño y la programación
complica en exceso su mantenimiento. Normalmente, los contenidos y el diseño de
la página web son responsabilidad de diferentes personas, por lo que es
conveniente separarlos.
CSS es el mecanismo que permite separar los contenidos definidos mediante
XHTML y el aspecto que deben presentar esos contenidos:
Esquema de la separación de los contenidos y su presentación
Utilizar una tabla de conversión similar a las que se utilizan para textos sin formato
no es posible, ya que existen infinitos posibles estilos para aplicar al texto. Una
solución técnicamente viable consiste en almacenar la información sobre el formato
del texto en una zona especial reservada dentro del propio archivo. En esta zona se
podría indicar dónde comienza y dónde termina cada formato.
No obstante, la solución que realmente se emplea para guardar la información con
formato es mucho más sencilla: el archivo electrónico almacena tanto los contenidos
como la información sobre el formato de esos contenidos. Si por ejemplo se quiere
dividir el texto en párrafos y se desea dar especial importancia a algunas palabras,
se podría indicar de la siguiente manera:
<parrafo>
Contenido de texto con <importante>algunas palabras</importante> resaltadas
de forma especial.
</parrafo>
El principio de un párrafo se indica mediante la palabra <parrafo> y el final de un
párrafo se indica mediante la palabra </parrafo>. De la misma manera, para asignar
más importancia a ciertas palabras del texto, se encierran entre <importante> y
</importante>.
El proceso de indicar las diferentes partes que componen la información se
denomina marcar (markup en inglés). Cada una de las palabras que se emplean
para marcar el inicio y el final de una sección se denominan etiquetas.
Aunque existen algunas excepciones, en general las etiquetas se indican por pares
y se forman de la siguiente manera:
Etiqueta de apertura: carácter <, seguido del nombre de la etiqueta (sin espacios en
blanco) y terminado con el carácter >
Etiqueta de cierre: carácter <, seguido del carácter /, seguido del nombre de la
etiqueta (sin espacios en blanco) y terminado con el carácter >
Así, la estructura típica de las etiquetas HTML es:
Ejercicio 1
Determinar el código HTML correspondiente a la siguiente página:
Etiquetas y atributos
HTML define 91 etiquetas que los diseñadores pueden utilizar para marcar los
diferentes elementos que componen una página:
a, abbr, acronym, address, applet, area, b, base, basefont, bdo, big, blockquote,
body, br, button, caption, center, cite, code, col, colgroup, dd, del, dfn, dir, div, dl, dt,
em, fieldset, font, form, frame, frameset, h1, h2, h3, h4, h5, h6, head, hr, html, i,
iframe, img, input, ins, isindex, kbd, label, legend, li, link, map, menu, meta,
noframes, noscript, object, ol, optgroup, option, p, param, pre, q, s, samp, script,
select, small, span, strike, strong, style, sub, sup, table, tbody, td, textarea, tfoot, th,
thead, title, tr, tt, u, ul, var.
Atributos básicos
Los siguientes cuatro atributos básicos se pueden aplicar prácticamente a todas las
etiquetas HTML:
Atributo Descripción
class =
"texto"
Establece la clase CSS que se aplica a los estilos del elemento
style =
"texto"
Establece de forma directa los estilos CSS de un elemento
La mayoría de páginas web actuales utilizan los atributos id y class de forma masiva.
Sin embargo, estos atributos sólo son realmente útiles cuando se trabaja con CSS
y con Javascript.
Respecto al valor de los atributos id y class, sólo pueden contener guiones medios
(-), guiones bajos (_), letras y/o números, pero no pueden empezar por números.
Además, los navegadores distinguen mayúsculas de minúsculas y no se
recomienda utilizar letras como ñ y acentos, ya que no es seguro que funcionen
correctamente en todas las versiones de todos los navegadores.
Atributo Descripción
Atributos de eventos
Estos atributos sólo se utilizan en las páginas web que incluyen código JavaScript
para realizar acciones dinámicas sobre los elementos de la página. Cada vez que
el usuario pulsa una tecla, mueve su ratón o pulsa cualquier botón del ratón, se
produce un evento dentro del navegador. Utilizando JavaScript y los siguientes
atributos, es posible responder de forma adecuada a cada evento.
Deseleccionar un
onchange elemento que se ha <input>, <select>, <textarea>
modificado
La página se ha
onload <body>
cargado completamente
encima de otro
elemento)
El ratón "entra" en el
onmouseover elemento (pasa por Todos los elementos
encima del elemento)
Inicializar el formulario
onreset <form>
(borrar todos sus datos)
Se ha modificado el
onresize tamaño de la ventana <body>
del navegador
Se abandona la página
onunload (por ejemplo al cerrar el <body>
navegador)
Atributos de foco
Cuando el usuario selecciona un elemento en una aplicación, se dice que "el
elemento tiene el foco del programa". Si por ejemplo un usuario pincha con su ratón
sobre un cuadro de texto y comienza a escribir, ese cuadro de texto tiene el foco del
programa, llamado "focus" en inglés. Si el usuario selecciona después otro
elemento, el elemento original pierde el foco y el nuevo elemento es el que tiene el
foco del programa.
Los elementos de las páginas web también pueden obtener el foco de la aplicación
(en este caso, el foco del navegador) y HTML define algunos atributos específicos
para controlar cómo se seleccionan los elementos.
Atributo Descripción
accesskey =
"letra"
Establece una tecla de acceso rápido a un elemento HTML
Cuando se pulsa repetidamente la tecla del tabulador sobre una página web, el
navegador selecciona de forma alternativa todos los elementos de la página que se
pueden seleccionar (principalmente los enlaces y los elementos de formulario). El
atributo tabindex permite alterar el orden en el que se seleccionan los elementos,
por lo que es muy útil cuando se quiere controlar de forma precisa cómo se
seleccionan los campos de un formulario complejo.
Por su parte, el atributo accesskey permite establecer una tecla para acceder de
forma rápida a cualquier elemento. Aunque la tecla de acceso rápido se establece
mediante HTML, la combinación de teclas necesarias para activar ese acceso
rápido depende del navegador. En el navegador Internet Explorer se pulsa la tecla
ALT + la tecla definida; en el navegador Firefox se pulsa Alt + Shift + la tecla definida;
en el navegador Opera se pulsa Shift + Esc + la tecla definida; en el navegador
Safari se pulsa Ctrl + la tecla definida.
Elementos HTML
Además de etiquetas y atributos, HTML define el término elemento para referirse a
las partes que componen los documentos HTML.
Aunque en ocasiones se habla de forma indistinta de "elementos" y "etiquetas", en
realidad un elemento HTML es mucho más que una etiqueta, ya que está formado
por:
Una etiqueta de apertura.
Cero o más atributos.
Texto encerrado por la etiqueta.
Una etiqueta de cierre.
El texto encerrado por la etiqueta es opcional, ya que algunas etiquetas de HTML
no pueden encerrar ningún texto. El siguiente esquema muestra un elemento HTML,
formado por una etiqueta <p>, atributos y contenidos de texto:
El primer párrafo contiene un texto corto que sólo ocupa la mitad de la anchura de
la ventana del navegador. No obstante, el espacio reservado por el navegador para
el primer párrafo llega hasta el final de esa línea, por lo que resulta evidente que los
elementos <p> son elementos de bloque.
Por otra parte, el primer enlace del ejemplo anterior también tiene un texto corto que
ocupa solamente la mitad de la anchura de la ventana del navegador. En este caso,
el navegador sólo reserva para el enlace el sitio necesario para mostrar sus
contenidos. Si se añade otro enlace en esa misma línea, se mostraría a continuación
del primer enlace. Por tanto, los elementos <a> son elementos en línea.
Por último, el segundo párrafo sigue ocupando todo el espacio disponible hasta el
final de cada línea (por ser un elemento de bloque) y el enlace que se encuentra
dentro del párrafo sólo ocupa el sitio necesario para mostrar sus contenidos (por ser
un elemento en línea).
La mayoría de elementos de bloque pueden contener en su interior elementos en
línea y otros elementos de bloque. Los elementos en línea sólo pueden contener
texto u otros elementos en línea. En otras palabras, un elemento de bloque no
puede aparecer dentro de un elemento en línea. En cambio, un elemento en línea
puede aparecer dentro de un elemento de bloque y dentro de otro elemento en línea.
Los elementos en línea definidos por HTML son: a, abbr, acronym, b, basefont, bdo,
big, br, cite, code, dfn, em, font, i, img, input, kbd, label, q, s, samp, select, small,
span, strike, strong, sub, sup, textarea, tt, u, var.
Los elementos de bloque definidos por HTML son: address, blockquote, center, dir,
div, dl, fieldset, form, h1, h2, h3, h4, h5, h6, hr, isindex, menu, noframes, nos-cript,
ol, p, pre, table, ul.
Los siguientes elementos también se considera que son de bloque: dd, dt, frame-
set, li, tbody, td, tfoot, th, thead, tr.
Los siguientes elementos pueden ser en línea y de bloque según las circunstancias:
button, del, iframe, ins, map, object, script.
Este tipo de atributos en los que el nombre coincide con su valor no son muy
habituales.
Capítulo 3. Texto
La mayor parte del contenido de las páginas HTML habituales está formado por
texto, llegando a ser más del 90% del código de la página. Por este motivo, es muy
importante conocer los elementos y etiquetas que define HTML para el manejo del
texto.
El lenguaje HTML incorpora al tratamiento del texto muchas de las ideas y normas
establecidas en otros entornos de publicación de contenidos. De esta forma, HTML
define etiquetas para estructurar el contenido en secciones y párrafos y define otras
etiquetas para marcar elementos importantes dentro del texto.
La tarea inicial del editor de contenidos HTML consiste en estructurar el texto
original definiendo sus párrafos, titulares y títulos de sección, como se muestra en
la siguiente imagen:
ESTRUCTURAR
La forma más sencilla de estructurar un texto consiste en separarlo por párrafos.
Además, HTML permite incluir títulos que delimitan cada una de las secciones.
Párrafos
Una de las etiquetas más utilizadas de HTML es la etiqueta <p>, que permite definir
los párrafos que forman el texto de una página. Para delimitar el texto de un párrafo,
se encierra ese texto con la etiqueta <p>, como muestra el siguiente ejemplo:
Etiqueta <p>
Atributos
básicos, internacionalización y eventos
comunes
Atributos
-
propios
Tipo de
Bloque
elemento
Los párrafos creados con HTML son elementos de bloque, por lo que siempre
ocupan toda la anchura de la ventana del navegador. Además, no tienen atributos
específicos, pero sí que se les pueden asignar los atributos comunes de HTML
básicos, de internacionalización y de eventos.
Secciones
Las páginas HTML habituales suelen tener una estructura más compleja que la que
se puede crear solamente mediante párrafos. De hecho, es habitual que las páginas
se dividan en diferentes secciones jerárquicas.
Los títulos de sección se utilizan para delimitar el comienzo de cada sección de la
página. HTML permite crear secciones de hasta seis niveles de importancia. De esta
forma, aunque una página puede definir cualquier número de secciones, sólo puede
incluir seis niveles jerárquicos.
Las etiquetas que definen los títulos de sección son <h1>, <h2>, <h3>, <h4>, <h5>
y <h6>. La etiqueta <h1> es la de mayor importancia y por tanto se utiliza para definir
los titulares de la página. La importancia del resto de etiquetas es descendiente, de
forma que la etiqueta <h6> es la que se utiliza para delimitar las secciones menos
importantes de la página.
Etiqueta <h1>
Atributos
básicos, internacionalización y eventos
comunes
Atributos
-
propios
Tipo de
Bloque
elemento
Al igual que la etiqueta <p>, las etiquetas de título de sección son elementos de
bloque y no tienen atributos específicos.
Las etiquetas <h1>, ..., <h6> definen títulos de sección, no secciones completas.
Por este motivo, no es necesario encerrar los contenidos de una sección con su
etiqueta correspondiente. Solamente se debe encerrar con las etiquetas <h1>, ...,
<h6> los títulos de cada sección.
Evidentemente, el aspecto que los navegadores aplican por defecto a los títulos de
sección se puede modificar utilizando las hojas de estilos de CSS. La siguiente
imagen muestra el tamaño por defecto con el que los navegadores muestran cada
titular:
Etiqueta <em>
Atributos
básicos, internacionalización y eventos
comunes
Atributos
-
propios
Tipo de
En línea
elemento
Etiqueta <strong>
Atributos
básicos, internacionalización y eventos
comunes
Atributos
-
propios
Tipo de
En línea
elemento
Ejercicio 2
Los dos párrafos de la imagen anterior se ven idénticos, aunque el segundo párrafo
incluye varios espacios en blanco y está escrito en varias líneas diferentes. La razón
de este comportamiento es que HTML ignora todos los espacios en blanco
sobrantes, es decir, todos los espacios en blanco que no son el espacio en blanco
que separa las palabras.
No obstante, HTML proporciona varias alternativas para poder incluir tantos
espacios en blanco y tantas nuevas líneas como sean necesarias dentro del
contenido textual de las páginas.
Nuevas líneas
Para incluir una nueva línea en un punto y forzar a que el texto que sigue se muestre
en la línea inferior, se utiliza la etiqueta <br>. En cierta manera, insertar la etiqueta
<br> en un determinado punto del texto equivale a presionar la tecla ENTER (o Intro)
en ese mismo punto.
Etiqueta
<br>
Atributos
básicos
comunes
Atributos
-
propios
Tipo de
En línea y etiqueta vacía
elemento
Espacios en blanco
La solución al problema de los espacios en blanco no es tan sencilla como el de las
nuevas líneas. Para incluir espacios en blanco adicionales, se debe sustituir cada
nuevo espacio en blanco por el texto (es importante incluir el símbolo & al
principio y el símbolo ; al final).
Así, el código HTML del ejemplo anterior se debe rehacer para incluir los espacios
en blanco adicionales:
Cada texto solamente equivale a un espacio en blanco, por lo que se deben
escribir tantos seguidos como espacios en blanco seguidos existan en el
texto.
Texto preformateado
En ocasiones, es necesario mostrar los espacios en blanco de un texto que no se
puede modificar. Se trata de un caso habitual cuando una página web debe mostrar
directamente el texto generado por alguna aplicación.
En estos casos, se puede utilizar la etiqueta <pre>, que muestra el texto tal y como
se ha escrito, respetando todos los espacios en blanco y todas las nuevas líneas.
La definición formal de la etiqueta se muestra a continuación:
Etiqueta <pre>
Atributos
básicos, internacionalización y eventos
comunes
Atributos
-
propios
Tipo de
Bloque
elemento
Descripción Muestra el texto que encierra tal y como está escrito (respetando los
espacios en blanco)
El ejemplo anterior incluye el mismo texto (con espacios en blanco y varias líneas)
dentro de una etiqueta <pre> y dentro de una etiqueta <p>. Las diferencias visuales
en un navegador son muy evidentes
Ejercicio 3
Utilizando espacios en blanco y nuevas líneas hacer el siguiente documento HTML:
Enlaces
El lenguaje de marcado HTML se definió teniendo en cuenta algunas de las
características que existían en ese momento para la publicación digital de
contenidos. Entre los conceptos utilizados en su creación, se encuentra el
mecanismo de "hipertexto".
De hecho, las letras "HT" de la sigla HTML significan "hipertexto" (hypertext en
inglés), por lo que el significado completo de HTML podría traducirse como "lenguaje
de marcado para hipertexto".
La incorporación del hipertexto fue una de las claves del éxito del lenguaje HTML,
ya que permitió crear documentos interactivos que proporcionan información
adicional cuando se solicita. El elemento principal del hipertexto es el "hiperenlace",
también llamado "enlace web" o simplemente "enlace".
Los enlaces se utilizan para establecer relaciones entre dos recursos. Aunque la
mayoría de enlaces relacionan páginas web, también es posible enlazar otros
recursos como imágenes, documentos y archivos.
Una característica que no se suele tener en cuenta en los enlaces es que están
formados por dos extremos y un sentido. En otras palabras, el enlace comienza en
un recurso y apunta hacia otro recurso. Cada uno de los dos extremos se llaman
"anchors" en inglés, que se puede traducir literalmente como "anclas".
URL
Antes de empezar a crear enlaces, es necesario comprender y dominar el concepto
de URL. El acrónimo URL (del inglés Uniform Resource Locator) hace referencia al
identificador único de cada recurso disponible en Internet. Las URL son esenciales
para crear los enlaces, pero también se utilizan en otros elementos HTML como las
imágenes y los formularios.
La URL de un recurso tiene dos objetivos principales:
Identificar de forma única a ese recurso
Permitir localizar de forma eficiente ese recurso
En primer lugar, las URL permiten que cada página HTML publicada en Internet
tenga un nombre único que permita diferenciarla de las demás. De esta forma es
posible crear enlaces que apunten de forma inequívoca a una determinada página.
Si se accede a la página principal de Google, la dirección que muestra el navegador
es:
http://www.google.com
La cadena de texto http://www.google.com es la URL completa de la página principal
de Google. La URL de las páginas es imprescindible para crear los enlaces, ya que
permite distinguir una página de otra.
El segundo objetivo de las URL es el de permitir la localización eficiente de cada
recurso de Internet. Para ello es necesario comprender las diferentes partes que
forman las URL. Una URL sencilla siempre está formada por las mismas tres partes.
Si por ejemplo se considera la siguiente URL:
http://www.librosweb.es/xhtml/capitulo4.html
Las partes que componen la URL anterior son:
Protocolo (http://): el mecanismo que debe utilizar el navegador para acceder a
ese recurso. Todas las páginas web utilizan http://. Las páginas web seguras (por
ejemplo las de los bancos y las de los servicios de email) utilizan https:// (se añade
una letra s).
Servidor (www.librosweb.es): simplificando mucho su explicación, se trata del
ordenador en el que se encuentra guardada la página que se quiere acceder. Los
navegadores son capaces de obtener la dirección de cada servidor a partir de su
nombre.
Ruta (/xhtml/capitulo4.html): camino que se debe seguir, una vez que se ha
llegado al servidor, para localizar el recurso específico que se quiere acceder.
Por tanto, las URL no sólo identifican de forma única a cada recurso de Internet,
sino que también proporcionan a los navegadores la información necesaria para
poder llegar hasta ese recurso.
La mayoría de URL son tan sencillas como la URL mostrada anteriormente. No
obstante, existen URL complejas formadas por más partes:
http://www.alistapart.com/comments/webstandards2008?page=5#42
/ %2F ? %3F
: %3A @ %40
(espacio en
%20 # %23
blanco)
Por otra parte, aunque desde hace tiempo ya es posible incluir en las URL
caracteres de otros idiomas que no sean el inglés, aún no es completamente seguro
utilizar estos caracteres en las URL. Si se utilizan letras como ñ, á, é o ç, es posible
que algunos navegadores no las interpreten de forma correcta.
La solución consiste en codificar todos los caracteres que no existen en inglés. La
siguiente tabla muestra la codificación de los caracteres más utilizados:
ñ %F1 Ñ %D1
á %E1 Á %C1
é %E9 É %C9
í %ED Í %CD
ó %F3 Ó %D3
ú %FA Ú %DA
ç %E7 Ç %C7
Enlaces básicos
Los enlaces en HTML se crean mediante la etiqueta <a> (su nombre viene del inglés
"anchor", literalmente traducido como "ancla"). A continuación se muestra la
definición simplificada de <a> y más adelante se muestra su definición completa:
El atributo más importante de la etiqueta <a> es href, que se utiliza para indicar la
URL a la que apunta el enlace. Cuando el usuario pincha sobre un enlace, el
navegador se dirige a la URL del recurso indicado mediante href. Las URL de los
enlaces pueden ser absolutas, relativas, internas y externas.
Con la definición anterior, para crear un enlace que apunte a la página principal de
Google solamente habría que incluir lo siguiente en un documento HTML:
<a href="http://www.google.com">Página principal de Google</a>
Como el atributo href indica una URL, un enlace puede apuntar a cualquier tipo de
recurso al que pueda acceder el navegador. El siguiente enlace apunta a una
imagen, que se mostrará en el navegador cuando el usuario pinche sobre el enlace:
<a href="http://www.ejemplo.com/fondo_escritorio.jpg">Imagen interesante para un
fondo de escritorio</a>
El otro atributo básico de la etiqueta <a> es name, que permite definir enlaces dentro
de una misma página web. Si una página es muy larga, puede ser útil mostrar
enlaces de tipo "Saltar hasta la segunda sección", "Volver al principio de la página",
etc.
Este tipo de enlaces son especiales, ya que la URL de la página siempre es la
misma para todas las secciones y por tanto, debe añadirse otra parte a las URL
para identificar cada sección.
<a name="primera_seccion"></a>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Mauris id ligula eu felis
adipiscing ultrices. Duis gravida leo ut lectus. Praesent condimentum mattis
ligula.</p>
...
<a name="segunda_seccion"></a>
<p>Pellentesque malesuada. In in lacus. Phasellus erat erat, lacinia a, convallis eu,
nonummy et, odio. Aenean urna elit, ultrices id, placerat varius, facilisis eget,
dolor.</p>
...
El atributo name permite crear "enlaces vacíos" que hacen referencia a secciones
dentro de una misma página. Una vez definidos los "enlaces vacíos", es posible
crear un enlace que apunte directamente a una sección concreta de una página:
<!-- Enlace normal a la página -->
<a href="http://www.ejemplo.com/pagina1.html">Enlace a la página 1</a>
<!-- Enlace directo a la segunda sección de la página -->
<a href="http://www.ejemplo.com/pagina1.html#segunda_seccion">Enlace a la
sección 2 de la página 1</a>
La sintaxis que se utiliza con estos enlaces es la misma que con los enlaces
normales, salvo que se añade el símbolo # seguido del nombre de la sección a la
que se apunta. Cuando el usuario pincha sobre uno de estos enlaces, el navegador
También es posible utilizar este tipo de enlaces con URL relativas en una misma
página. El siguiente ejemplo añade enlaces de tipo "Volver al inicio de la página" en
varias secciones:
<a name="inicio"></a>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Mauris id ligula eu felis
adipiscing ultrices. Duis gravida leo ut lectus. Praesent condimentum mattis
ligula.</p>
<a href="#inicio">Volver al inicio de la página</a>
...
<p>Pellentesque malesuada. In in lacus. Phasellus erat erat, lacinia a, convallis eu,
nonummy et, odio. Aenean urna elit, ultrices id, placerat varius, facilisis eget,
dolor.</p>
<a href="#inicio">Volver al inicio de la página</a>
...
Los enlaces directos a secciones también funcionan con el atributo id de cualquier
elemento. El siguiente ejemplo es equivalente al ejemplo anterior:
<h1 id="inicio">Título de la página</h1>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Mauris id ligula eu felis
adipiscing ultrices. Duis gravida leo ut lectus. Praesent condimentum mattis
ligula.</p>
<a href="#inicio">Volver al inicio de la página</a>
...
<p>Pellentesque malesuada. In in lacus. Phasellus erat erat, lacinia a, convallis eu,
nonummy et, odio. Aenean urna elit, ultrices id, placerat varius, facilisis eget,
dolor.</p>
<a href="#inicio">Volver al inicio de la página</a>
...
El nombre de la sección que se indica después del símbolo # puede utilizar el valor
de los atributos id de cualquier elemento. De hecho, se recomienda utilizar los
Ejercicio 4
A partir de la estructura de directorios y archivos indicada en la siguiente imagen:
1) Crear la siguiente página llamada index.html que sirva como página principal
del sitio:
Listas
En ocasiones, es posible agrupar determinadas palabras o frases en un conjunto de
elementos que tienen más significado de forma conjunta. El menú de navegación
de un sitio web por ejemplo está formado por un grupo de palabras. Aunque cada
palabra por separado tiene sentido, de forma conjunta constituyen el menú de
navegación de la página, por lo que su significado conjunto es mayor que por
separado.
El lenguaje HTML define tres tipos diferentes de listas para agrupar los elementos:
listas no ordenadas (se trata de una colección simple de elementos en la que no
importa su orden) y listas ordenadas (similar a la anterior, pero los elementos están
numerados y por tanto, importa su orden).
Listas no ordenadas
Las listas no ordenadas son las más sencillas y las que más se utilizan. Una lista no
ordenada es un conjunto de elementos relacionados entre sí pero para los que no
El navegador por defecto muestra los elementos de la lista tabulados y con una
pequeña viñeta formada por un círculo negro.
Listas ordenadas
Las listas ordenadas son casi idénticas a las listas no ordenadas, salvo que en este
caso los elementos relacionados se muestran siguiendo un orden determinado.
Cuando se crea por ejemplo una lista con las instrucciones de un producto, es
importante el orden en el que se realiza cada paso. Cuando se muestra un índice o
tabla de contenidos en un libro, es importante el orden de cada elemento del índice.
En todos estos casos, la lista más adecuada es la lista ordenada, que se define
mediante la etiqueta <ol>. Los elementos de la lista se definen mediante la etiqueta
<li>, la misma que se utiliza en las listas no ordenadas.
Imágenes
Las imágenes son uno de los elementos más importantes de las páginas web. De
hecho, prácticamente todas las páginas web contienen alguna imagen y la mayoría
incluyen decenas de imágenes. Dentro de las imágenes que se pueden incluir en
una página HTML se deben distinguir dos tipos: las imágenes de contenido y las
imágenes de adorno.
Las imágenes de contenido son las que proporcionan información y complementan
la información textual. Las imágenes de adorno son las que se utilizan para hacer
bordes redondeados, para mostrar pequeños iconos en las listas de elementos, para
mostrar fondos de página, etc. Las imágenes de contenido se incluyen directamente
en el código HTML mediante la etiqueta <img> y las imágenes de adorno no se
deberían incluir en el código HTML, sino que deberían emplearse hojas de estilos
CSS para mostrarlas.
A continuación se muestra la definición de la etiqueta <img>, utilizada para incluir
las imágenes en las páginas HTML:
Los dos atributos requeridos son src y alt. El atributo src es similar al atributo href
de los enlaces, ya que establece la URL de la imagen que se va a mostrar en la
página. Las URL indicadas pueden ser absolutas o relativas. El atributo alt permite
describir el contenido de la imagen mediante un texto breve. Las descripciones
deben tener una longitud inferior a 1024 caracteres y son útiles para las personas y
dispositivos discapacitados que no pueden acceder a las imágenes.
Como <img> es una etiqueta vacía, no tiene etiqueta de cierre. No obstante, para
que la página XHTML sea válida, todas las etiquetas deben estar cerradas. Como
ya se explicó anteriormente, para cerrar una etiqueta vacía se incluyen los
caracteres /> al final de la etiqueta.
HTML no impone ninguna restricción sobre el formato gráfico que se puede utilizar
en las imágenes, por lo que en principio la etiqueta <img> puede incluir cualquier
formato gráfico existente. Sin embargo, si la imagen utiliza un formato poco habitual,
todos o algunos navegadores no serán capaces de mostrar esa imagen.
La recomendación es utilizar uno de los tres siguientes formatos gráficos que
entienden todos los navegadores modernos: GIF, JPG y PNG. El formato PNG
presenta el inconveniente de que los navegadores obsoletos como Internet Explorer
6 no muestran correctamente las imágenes con transparencias de 24 bits.
El atributo longdesc no se utiliza de forma habitual, pero permite indicar la URL en
la que se puede encontrar más información sobre la imagen. Como el atributo alt
sólo permite incluir descripciones de hasta 1024 caracteres, el atributo longdesc se
emplea con las imágenes complejas que necesitan mucha información para ser
descritas:
<img src="/imagenes/proyecto1.png" alt="Imagen del Proyecto 1"
longdesc="/portfolio/proyecto1.html" />
<img src="/imagenes/proyecto2.jpg" alt="Imagen del Proyecto 2"
longdesc="/mas_informacion.html" />
Ejercicio 5
Modificar la página de índice del portfolio del ejercicio 4 para mostrar directamente
las imágenes de los proyectos.
Tablas
Desde sus primeras versiones, HTML incluyó el soporte para crear tablas de datos
en las páginas web. Además de ser sencillo, el modelo definido por HTML es muy
flexible y bastante completo.
Las tablas en HTML utilizan los mismos conceptos de filas, columnas, cabeceras y
títulos que los que se utilizan en cualquier otro entorno de publicación de
documentos:
Tablas básicas
Las tablas más sencillas de HTML se definen con tres etiquetas: <table> para crear
la tabla, <tr> para crear cada fila y <td> para crear cada columna.
A continuación se muestra el código HTML de una tabla sencilla (ver página
siguiente)
La etiqueta <table> encierra todas las filas y columnas de la tabla. Las etiquetas
<tr> (del inglés "table row") definen cada fila de la tabla y encierran todas las
columnas. Por último, la etiqueta <td> (del inglés "table data cell") define cada una
de las columnas de las filas, aunque realmente HTML no define columnas sino
celdas de datos.
Al definir una tabla, se debe pensar en primer lugar en las filas que la forman y a
continuación en las columnas. El motivo es que HTML procesa primero las filas y
por eso las etiquetas <tr> aparecen antes que las etiquetas <td>.
De todos los atributos disponibles para las celdas, los más utilizados son rowspan
y colspan, que se emplean para construir tablas complejas como las que se ven
más adelante. Entre los demás atributos, sólo se utiliza de forma habitual el atributo
scope, sobre todo con las celdas de cabecera que se ven a continuación.
Normalmente, algunas de las celdas de la tabla se utilizan como cabecera de las
demás celdas de la fila o de la columna. En este caso, HTML define la etiqueta <th>
(del inglés "table header cell") para indicar que una celda es cabecera de otras
celdas.
Los atributos de la etiqueta <th> son idénticos que los atributos definidos para la
etiqueta <td>. En este caso, el atributo más utilizado es scope, que permite indicar
si la celda es cabecera de la fila o de la columna (<th scope="row"> y <th
scope="col"> respectivamente).
Por otra parte, HTML define la etiqueta <caption> para establecer la leyenda o título
de una tabla. La etiqueta debe colocarse inmediatamente después de la etiqueta
<table> y cada tabla sólo puede incluir una etiqueta <caption>.
Ejercicio 6
Determinar el código HTML necesario para crear la tabla que se muestra en la
siguiente imagen:
Ejercicio 7
Determinar el código HTML necesario para crear la tabla que se muestra en la
siguiente imagen. Utilizar las celdas de cabecera donde sea necesario y añadir
todos los atributos posibles.
(ver imagen página siguiente)
Descargar archivo ZIP con todas las imágenes
Tablas complejas
Las tablas complejas suelen disponer de una estructura irregular que junta varias
columnas para formar una columna ancha o une varias filas para formar una fila
más alta que las demás. Para fusionar filas o columnas, se utilizan los atributos
rowspan y colspan respectivamente.
La siguiente imagen muestra una tabla compleja que ha fusionado dos columnas
simples para formar una columna más ancha:
Para obtener una tabla como la de la imagen anterior, se debe utilizar el siguiente
código:
De forma equivalente, si se quiere diseñar una tabla HTML que fusiona filas como
la de la siguiente imagen:
El código HTML que se debe utilizar para obtener la tabla de la imagen anterior es:
Utilizando los atributos rowspan y colspan, es posible diseñar tablas tan complejas
como las que se muestran en los siguientes ejemplos.
El código HTML necesario para fusionar las filas de la tabla anterior se muestra a
continuación:
Ejercicio 8
Determinar el código HTML necesario para crear la tabla que se muestra en la
siguiente imagen:
Formularios
HTML es un lenguaje de marcado cuyo propósito principal consiste en estructurar
los contenidos de los documentos y páginas web. Sin embargo, HTML también
incluye elementos para crear aplicaciones web. El estándar HTML/XHTML permite
crear formularios para que los usuarios interactúen con las aplicaciones web.
Los años transcurridos desde la publicación de los estándares de HTML y XHTML
ha provocado que no estén disponibles todos los elementos utilizados por los
formularios más avanzados y modernos. No obstante, HTML/XHTML incluye los
suficientes elementos de formulario para crear desde los formularios sencillos que
utilizan los buscadores hasta los formularios complejos de las aplicaciones más
avanzadas.
Formularios básicos
Los formularios más sencillos se pueden crear utilizando solamente dos etiquetas:
<form> y <input>. Si se considera el formulario que muestra la siguiente imagen:
La etiqueta <form> encierra todos los contenidos del formulario (botones, cuadros
de texto, listas desplegables) y la etiqueta <input> permite definir varios tipos
diferentes de elementos (botones y cuadros de texto).
El atributo method establece la forma en la que se envian los datos del formulario al
servidor. Este atributo hace referencia al método HTTP, por lo que no es algo propio
de HTML. Los dos valores que se utilizan en los formularios son GET y POST. De
esta forma, casi todos los formularios incluyen el atributo method="get" o el atributo
method="post".
Al margen de otras diferencias técnicas, el método POST permite el envío de mucha
más información que el método GET. En general, el método GET admite como
máximo el envío de unos 500 bytes de información. La otra gran limitación del
método GET es que no permite el envío de archivos adjuntos con el formulario.
Además, los datos enviados mediante GET se ven en la barra de direcciones del
navegador (se añaden al final de la URL de la página), mientras que los datos
enviados mediante POST no se pueden ver tan fácilmente.
Si no sabes que método elegir para un formulario, existe una regla general que dice
que el método GET se debe utilizar en los formularios que no modifican la
información (por ejemplo en un formulario de búsqueda). Por su parte, el método
POST se debería utilizar cuando el formulario modifica la información original
(insertar, modificar o borrar alguna información).
El ejemplo más común de formulario con método GET es el de los buscadores. Si
realizas una búsqueda con tu buscador favorito, verás que las palabras que has
introducido en tu búsqueda aparecen como parte de la URL de la página de
resultados.
Del resto de atributos de la etiqueta <form>, el único que se utiliza ocasionalmente
es enctype, este atributo es imprescindible en los formularios que permiten adjuntar
archivos.
Elementos de formulario
Los elementos de formulario como botones y cuadros de texto también se
denominan "campos de formulario" y "controles de formulario". La mayoría de
controles se crean con la etiqueta <input>, por lo que su definición formal y su lista
de atributos es muy extensa:
A continuación se muestran ejemplos para los diez controles que se pueden crear
con la etiqueta <input>.
Cuadro de texto
Se trata del elemento más utilizado en los formularios. En el caso más sencillo, se
muestra un cuadro de texto vacío en el que el usuario puede escribir cualquier texto:
El atributo type diferencia a cada uno de los diez controles que se pueden crear con
la etiqueta <input>. Para los cuadros de texto, su valor es text. El atributo name es
el más importante en los campos del formulario. De hecho, si un campo no incluye
el atributo name, sus datos no se envían al servidor. El valor que se indica en el
atributo name es el nombre que utiliza la aplicación del servidor para obtener el valor
de este campo de formulario.
Cuando el usuario pulsa el botón de envío del formulario, el navegador envía los
datos a una aplicación del servidor para que procese la información y genere una
respuesta adecuada. En el servidor, la aplicación que procesa los datos debe
obtener en primer lugar toda la información introducida por el usuario. Para ello,
utiliza el valor del atributo name para obtener los datos de cada control del
formulario.
Como el valor del atributo name se utiliza en aplicaciones programadas, es esencial
ponerse de acuerdo con el programador de la aplicación, no se debe modificar su
valor sin modificar la aplicación y no se deben utilizar caracteres problemáticos en
programación (espacios en blanco, acentos y caracteres como ñ o ç).
El atributo value se emplea para establecer el valor inicial del cuadro de texto. Si se
crea un formulario para insertar datos, los cuadros de texto deberían estar vacíos.
Por lo tanto, o no se añade el atributo value o se incluye con un valor vacío value="".
Si por el contrario se crea un formulario para modificar datos, lo lógico es que se
muestren inicialmente los datos guardados en el sistema. En este caso, el atributo
value incluirá el valor que se desea mostrar: <input type="text" name="nombre"
value="Juan Pérez" />
Si no se especifica un tamaño, el navegador muestra el cuadro de texto con un
tamaño predeterminado. El atributo size permite establecer el tamaño, en
caracteres, con el que se muestra el cuadro de texto. Su uso es imprescindible en
muchos formularios, en los que algunos campos como la dirección deben mostrar
más caracteres de lo normal (<input size="100" ...) y otros campos como el código
postal deben mostrar menos caracteres de lo normal (<input size="5"...).
Además de controlar el tamaño con el que se muestra un cuadro de texto, también
se puede limitar el tamaño del texto introducido. El atributo maxlength permite
establecer el máximo número de caracteres que el usuario puede introducir en un
cuadro de texto. Su uso es imprescindible para campos como el código postal, el
número de la Seguridad Social y cualquier otro dato con formato predefinido y
limitado.
Por último, el atributo readonly permite que el usuario pueda ver los contenidos del
cuadro de texto pero no pueda modificarlos y el atributo disabled deshabilita un
cuadro de texto de forma que el usuario no pueda modificarlo y además, el
navegador no envía sus datos al servidor.
Cuadro de contraseña
La única diferencia entre este control y el cuadro de texto normal es que el texto que
el usuario escribe en un cuadro de contraseña no se ve en la pantalla. En su lugar,
los navegadores ocultan el texto utilizando asteriscos o círculos, por lo que es ideal
para escribir contraseñas y otros datos sensibles.
Contraseña <br/>
<input type="password" name="contrasena" value="" />
Cambiando el valor del atributo type por password se transforma el cuadro de texto
normal en un cuadro de contraseña. Todos los demás atributos se utilizan de la
misma forma y tienen el mismo significado.
Checkbox
Los checkbox o "casillas de verificación" son controles de formulario que permiten
al usuario seleccionar y deseleccionar opciones individualmente. Aunque en
ocasiones se muestran varios checkbox juntos, cada uno de ellos es completamente
independiente del resto. Por este motivo, se utilizan cuando el usuario puede activar
y desactivar varias opciones relacionadas pero no excluyentes.
etiqueta <input /> del checkbox, el usuario sólo ve un pequeño cuadrado sin ninguna
información relativa a la finalidad de ese checkbox.
El valor del atributo value, junto con el valor del atributo name, es la información que
llega al servidor cuando el usuario envía el formulario.
Si se quiere mostrar un checkbox seleccionado por defecto, se utiliza el atributo
checked. Si el valor del atributo es checked, el checkbox se muestra seleccionado.
En cualquier otro caso, el checkbox permanece sin seleccionar. Aunque resulta
redundante que el nombre y el valor del atributo sean idénticos, es obligatorio
indicarlo de esta forma porque los atributos en XHTML no pueden tener valores
vacíos:
<input type="checkbox" checked="checked" ... /> Checkbox seleccionado por
defecto
Radiobutton
Los controles de tipo radiobutton son similares a los controles de tipo checkbox,
pero presentan una diferencia muy importante: son mutuamente excluyentes. Los
radiobutton se utilizan cuando el usuario solamente puede escoger una opción entre
las distintas opciones relacionadas que se le presentan. Cada vez que se selecciona
una opción, automáticamente se deselecciona la otra opción que estaba
seleccionaba.
El valor del atributo type para estos controles de formulario es radio. El atributo name
se emplea para indicar los radiobutton que están relacionados. Por lo tanto, cuando
varios radiobutton tienen el mismo valor en su atributo name, el navegador sabe
que están relacionados y puede deseleccionar una opción del grupo de radiobutton
cuando se seleccione otra opción.
Botón de envío de formulario
La mayoría de formularios dispone de un botón para enviar al servidor los datos
introducidos por el usuario:
tipo de botón. El valor del atributo value es el texto que muestra el botón. Si no se
establece el atributo value, el navegador muestra el texto predefinido Enviar
consulta.
Botón de reseteo del formulario
Aunque su uso era muy popular hace unos años, la mayoría de formularios
modernos ya no utilizan este tipo de botón. Se trata de un botón especial que borra
todos los datos introducidos por el usuario y devuelve el formulario a su estado
original:
Fichero adjunto
<input type="file" name="adjunto" />
El valor del atributo type para este control de formulario es file. El navegador se
encarga de mostrar un cuadro de texto donde aparece el nombre del archivo
seleccionado y un botón que permite navegar por los directorios y archivos del
ordenador del usuario.
Botón
Algunos formularios complejos necesitan botones más avanzados que los de enviar
datos (type="submit") y resetear el formulario (type="reset"). Por ese motivo, el
estándar HTML/XHTML define un botón de tipo genérico:
La etiqueta <fieldset> agrupa todos los controles de formulario a los que encierra.
El navegador muestra por defecto un borde resaltado para cada agrupación. La
etiqueta <legend> se incluye dentro de cada etiqueta <fieldset> y establece el título
que muestra el navegador para cada agrupación de elementos.
Por otra parte, todos los controles de formulario salvo los botones presentan una
carencia muy importante: no disponen de la opción de establecer el título o texto
que se muestra junto al control. En el código HTML del ejemplo siguiente, el nombre
de cada campo se incluye en forma de texto normal, sin ninguna relación con el
campo al que hace referencia.
El único atributo que suele utilizarse con la etiqueta <label> es for, que indica el
identificador (atributo id) del campo de formulario para el que esta etiqueta hace de
título.
En el anterior ejemplo, el nombre de los campos de formulario se incluía mediante
un texto normal:
Nombre <br/>
<input type="text" name="nombre" value="" />
Apellidos <br/>
<input type="text" name="apellidos" value="" />
DNI <br/>
<input type="text" name="dni" value="" size="10" maxlength="9" />
Las áreas de texto son útiles cuando se debe introducir una gran cantidad de texto,
ya que es mucho más cómodo de introducir que en un campo de texto normal:
Los atributos más utilizados en las etiquetas <textarea> son los que controlan su
anchura y altura. La anchura del área de texto se controla mediante el atributo cols,
que indica las columnas o número de caracteres que se podrán escribir como
máximo en cada fila. La altura del área de texto se controla mediante rows, que
indica directamente las filas de texto que serán visibles.
El principal inconveniente de los elementos <textarea> es que el lenguaje HTML no
permite limitar el número máximo de caracteres que se pueden introducir. Mientras
los elementos <input type="text"> disponen del atributo maxlength, las áreas de
texto no disponen de un atributo equivalente, por lo que sólo es posible limitar el
número de caracteres mediante su programación con JavaScript.
Por otra parte, el otro control disponible para los formularios es el de las listas
desplegables:
Los tres tipos de listas desplegables se definen con la misma etiqueta <select> y
cada elemento de la lista se define mediante la etiqueta <option>:
La inmensa mayoría de listas desplegables que utilizan las aplicaciones web son
simples, por lo que el código HTML habitual de las listas desplegables es:
La etiqueta <select> define la lista y encierra todas las opciones que muestra la lista.
Cada una de las opciones de la lista se define mediante una etiqueta <option>. El
atributo value de cada opción es obligatorio, ya que es el dato que se envía al
servidor cuando el usuario envía el formulario. Para seleccionar por defecto una
opción al mostrar la lista, se añade el atributo selected a la opción deseada.
Ejercicio 10
Determinar el código HTML necesario para crear el formulario que se muestra en la
siguiente imagen:
Estructura y layout
Todas las etiquetas XHTML disponibles sirven para marcar y estructurar cada
elemento individual de las páginas web: tablas, listas, enlaces, párrafos, imágenes,
etc. Aunque combinando esas etiquetas es posible crear cualquier página web, no
es posible hacer que las páginas muestren estructuras complejas.
La mayoría de páginas HTML disponen de estructuras complejas formadas por
varias columnas de contenidos y otro tipo de divisiones. Utilizando exclusivamente
HTML no es posible crear estas estructuras complejas, ya que es imprescindible
emplear las hojas de estilos CSS.
No obstante, los estilos de CSS necesitan la ayuda de HTML/XHTML para crear los
diseños más avanzados. En concreto, el código HTML se encarga de agrupar los
elementos de la página en diferentes divisiones en función de su finalidad: la zona
de la cabecera de la página, la zona de contenidos, una zona lateral para el menú
y otras secciones menores, la zona del pie de página, etc.
La siguiente imagen muestra un ejemplo de las zonas definidas en una página web:
Para agrupar los elementos que forman cada zona o división de la página se utiliza
la etiqueta <div>:
...
<div id="contenedor">
<div id="cabecera">
...
</div>
<div id="contenido">
<div id="menu">
..
</div>
...
</div>
<div id="pie">
...
</div>
</div>
...
Ejercicio 11
1. Insertar en una página HTML un mapa de Google maps.
2. En la misma página anterior, insertar un video de Youtube.
El siguiente ejemplo define la altura y anchura del iframe, indica la URL que se debe
mostrar y mediante el atributo scrolling se indica que el iframe no debe mostrar
barras de scroll ni siquiera en el caso de que el contenido mostrado no quepa en el
iframe definido:
<iframe src="/ruta/documento.html" width="250" height="250" scrolling="no" />
Validador del W3C
World Wide Web Consortium (W3C). La validación de las páginas web no requiere
el uso de editores avanzados como Dreamweaver, ya que el organismo W3C ha
creado una herramienta que se puede utilizar gratuitamente a través de Internet:
http://validator.w3.org/