More
More
Artículos adicionales
Ilya Kantor
Hecho el 19 de marzo de 2023
Trabajamos constantemente para mejorar el tutorial. Si encuentra algún error, por favor escríbanos a nuestro github.
● Marcos y ventanas
● Ventanas emergentes y métodos de ventana
● Comunicación entre ventanas
●
El ataque de secuestro de clics
● Datos binarios y archivos
● ArrayBuffer, arrays binarios
● TextDecoder y TextEncoder
●
Blob
● File y FileReader
● Solicitudes de red
● Fetch
●
FormData
●
Fetch: Progreso de la descarga
●
Fetch: Abort
●
Fetch: Cross-Origin Requests
●
Fetch API
●
Objetos URL
● XMLHttpRequest
●
Carga de archivos reanudable
●
Sondeo largo
●
WebSocket
●
Eventos enviados por el servidor
●
Almacenando datos en el navegador
●
Cookies, document.cookie
● LocalStorage, sessionStorage
●
IndexedDB
●
Animaciones
●
Curva de Bézier
●
Animaciones CSS
● Animaciones JavaScript
●
Componentes Web
●
Desde la altura orbital
● Elementos personalizados
●
Shadow DOM
● Elemento template
●
Shadow DOM slots, composición
● Estilo Shadow DOM
●
Shadow DOM y eventos
● Expresiones Regulares
●
Patrones y banderas (flags)
● Clases de caracteres
●
Unicode: bandera "u" y clase \p{...}
● Anclas: inicio ^ y final $ de cadena
●
Modo multilínea de anclas ^ $, bandera "m"
● Límite de palabra: \b
●
Escapando, caracteres especiales
● Conjuntos y rangos [...]
● Cuantificadores +, *, ? y {n}
● Cuantificadores codiciosos y perezosos
1/220
● Grupos de captura
●
Referencias inversas en patrones: \N y \k<nombre>
● Alternancia (O) |
●
Lookahead y lookbehind (revisar delante/detrás)
● Backtracking catastrófico
●
Indicador adhesivo “y”, buscando en una posición.
● Métodos de RegExp y String
2/220
Marcos y ventanas
Ventanas emergentes y métodos de ventana
Una ventana emergente (popup window) es uno de los métodos más antiguos para mostrar documentos adicionales al
usuario.
window.open("https://javascript.info/");
…Y eso abrirá una nueva ventana con la URL dada. La mayoría de los navegadores modernos están configurados para abrir
pestañas nuevas en vez de ventanas separadas.
Los popups existen desde tiempos realmente antiguos. La idea inicial fue mostrar otro contenido sin cerrar la ventana
principal. Ahora hay otras formas de hacerlo: podemos cargar contenido dinámicamente con fetch y mostrarlo de forma
dinámica con <div> . Entonces, los popups no son algo que usamos todos los días.
Además, los popups son complicados en dispositivos móviles, que no muestran varias ventanas simultáneamente.
Aún así, hay tareas donde los popups todavía son usados, por ejemplo para autorización o autenticación (Ingreso con
Google/Facebook/…), porque:
1. Un popup es una ventana separada con su propio entorno JavaScript independiente. Por lo tanto es seguro abrir un popup
desde un sitio de terceros no confiable.
2. Es muy fácil abrir un popup.
3. Un popup puede navegar (cambiar URL) y enviar mensajes a la ventana que lo abrió.
En el pasado, sitios malvados abusaron mucho de las ventanas emergentes. Una página incorrecta podría abrir toneladas de
ventanas emergentes con anuncios. Entonces, la mayoría de los navegadores intentan bloquear las ventanas emergentes y
proteger al usuario.
La mayoría de los navegadores bloquean las ventanas emergentes si se llaman fuera de los controladores de
eventos activados por el usuario, como onclick .
Por ejemplo:
// popup blocked
window.open("https://javascript.info");
// popup allowed
button.onclick = () => {
window.open("https://javascript.info");
};
De esta manera, los usuarios están algo protegidos de ventanas emergentes no deseadas, pero la funcionalidad no está
totalmente deshabilitada.
window.open
La sintaxis para abrir una ventana emergente es: window.open(url, name, params) :
url
Una URL para cargar en la nueva ventana.
name
Un nombre de la nueva ventana. Cada ventana tiene un window.name , y aquí podemos especificar cuál ventana usar para
la ventana emergente. Si hay una ventana con ese nombre, la URL dada se abre en ella, de lo contrario abre una nueva
ventana.
params
3/220
La cadena de configuración para nueva ventana. Contiene configuraciones, delimitado por una coma. No debe haber
espacios en los parámetros, por ejemplo: width=200,height=100 .
Configuración de params :
● Posición:
●
left/top (numérico) – coordenadas de la esquina superior izquierda de la ventana en la pantalla.Hay una limitación:
no se puede colocar una nueva ventana fuera de la pantalla.
● width/height (numérico) – ancho y alto de una nueva ventana. Hay un límite mínimo de ancho/alto , así que es
imposible crear una ventana invisible.
● Características de la ventana:
● menubar (yes/no) – muestra u oculta el menú del navegador en la nueva ventana.
● toolbar (yes/no) – muestra u oculta la barra de navegación del navegador (atrás, adelante, recargar, etc.) en la
nueva ventana.
●
location (yes/no) – muestra u oculta el campo URL en la nueva ventana. FF e IE no permiten ocultarlo por defecto.
●
status (yes/no) – muestra u oculta la barra de estado. De nuevo, la mayoría de los navegadores lo obligan a mostrar.
● resizable (yes/no) – permite deshabilitar el cambio de tamaño para la nueva ventana. No recomendado.
● scrollbars (yes/no) – permite deshabilitar las barras de desplazamiento para la nueva ventana. No recomendado.
También hay una serie de características específicas del navegador menos compatibles, que generalmente no se usan.
Revisa window.open en MDN para ejemplos.
Abramos una ventana con un conjunto mínimo de características solo para ver cuál de ellos permite desactivar el navegador:
Aquí la mayoría de las “características de la ventana” están deshabilitadas y la ventana se coloca fuera de la pantalla.
Ejecútelo y vea lo que realmente sucede. La mayoría de los navegadores “arreglan” cosas extrañas como cero
ancho/alto y fuera de pantalla Izquierda/superior . Por ejemplo, Chrome abre una ventana con ancho/alto
completo, para que ocupe la pantalla completa.
Agreguemos opciones de posicionamiento normal y coordenadas razonables de ancho , altura , izquierda , arriba :
La llamada open devuelve una referencia a la nueva ventana. Se puede usar para manipular sus propiedades, cambiar de
ubicación y aún más.
4/220
let newWin = window.open("about:blank", "hello", "width=200,height=200");
newWin.document.write("Hello, world!");
newWindow.onload = function() {
let html = `<div style="font-size:30px">Welcome!</div>`;
newWindow.document.body.insertAdjacentHTML("afterbegin", html);
};
Por favor, tenga en cuenta: inmediatamente después de window.open la nueva ventana no está cargada aún. Esto queda
demostrado por el alert en la linea (*) . Así que esperamos a que onload lo modifique. También podríamos usar
DOMContentLoaded de los manejadores de newWin.document .
De lo contrario es imposible por razones de seguridad del usuario, por ejemplo si la ventana principal es de site.com y
la ventana emergente (popup) es de gmail.com . Para los detalles, ver capitulo Comunicación entre ventanas.
Un popup también puede acceder la ventana que lo abrió usando la referencia window.opener . Es null para todas las
ventanas excepto los popups.
Si ejecutas el código de abajo, reemplaza el contenido de la ventana del opener (actual) con “Test”:
newWin.document.write(
"<script>window.opener.document.body.innerHTML = 'Test'<\/script>"
);
Así que la conexión entre las ventanas es bidireccional: la ventana principal y el popup tienen una referencia entre sí.
Técnicamente, el close() es un método disponible para cualquier ventana , pero window.close() es ignorado por la
mayoría de los navegadores si window no es creada con window.open() . Así que solo funcionará en una popup.
El closed es una propiedad true si la ventana esta cerrada. Eso es usualmente para comprobar la popup (o la ventana
principal) está todavía abierta o no. Un usuario puede cerrarla en cualquier momento, y nuestro código debería tener esa
posibilidad en cuenta.
newWindow.onload = function () {
newWindow.close();
alert(newWindow.closed); // true
};
5/220
desplazamiento y cambio de tamaño
win.moveBy(x,y)
Mueve la ventana en relación con la posición actual x píxeles a la derecha y y píxeles hacia abajo. Valores negativos están
permitidos(para mover a la izquierda/arriba).
win.moveTo(x,y)
Mover la ventana por coordenadas (x,y) en la pantalla.
win.resizeBy(width,height)
Cambiar el tamaño de la ventana según el width/height dado en relación con el tamaño actual. Se permiten valores
negativos.
win.resizeTo(width,height)
Redimensionar la ventana al tamaño dado.
Solo Popup
Para evitar abusos, el navegador suele bloquear estos métodos. Solo funcionan de manera confiable en las ventanas
emergentes que abrimos, que no tienen pestañas adicionales.
No minification/maximization
JavaScript no tiene forma de minimizar o maximizar una ventana. Estas funciones de nivel de sistema operativo están
ocultas para los desarrolladores de frontend.
Ya hemos hablado sobre el desplazamiento de una ventana en el capítulo Tamaño de ventana y desplazamiento.
win.scrollBy(x,y)
Desplaza la ventana x píxeles a la derecha y y hacia abajo en relación con el actual desplazamiento. Se permiten valores
negativos.
win.scrollTo(x,y)
Desplaza la ventana a las coordenadas dadas (x,y) .
elem.scrollIntoView(top = true)
Desplaza la ventana para hacer que elem aparezca en la parte superior (la predeterminada) o en la parte inferior para
elem.scrollIntoView(false) .
Teóricamente, están los métodos window.focus() y window.blur() para poner/sacar el foco de una ventana. Y los
eventos focus/blur que permiten captar el momento en el que el visitante enfoca una ventana y en el que cambia a otro
lugar.
En la práctica estos métodos están severamente limitado, porque en el pasado las páginas malignas abusaban de ellos.
6/220
Cuando un usuario intenta salir de la ventana ( window.onblur ), lo vuelve a enfocar. La intención es “bloquear” al usuario
dentro de la window .
Entonces, hay limitaciones que prohíben el código así. Existen muchas limitaciones para proteger al usuario de anuncios y
páginas malignas. Ellos dependen del navegador.
Por ejemplo, un navegador móvil generalmente ignora esa llamada por completo. Además, el enfoque no funciona cuando se
abre una ventana emergente en una pestaña separada en lugar de en una nueva ventana.
Por ejemplo:
●
Cuando abrimos una popup, puede ser una buena idea ejecutar un newWindow.focus() en ella. Solo por si acaso.
Para algunas combinaciones de sistema-operativo/navegador, asegura que el usuario ahora esté en la nueva ventana.
●
Si queremos saber cuándo un visitante realmente usa nuestra aplicación web, podemos monitorear
window.onfocus/onblur . Esto nos permite suspender/reanudar las actividades en la página, animaciones etc. Pero
tenga en cuenta que el evento blur solamente significa que el visitante salió de la ventana. La ventana queda en
segundo plano, pero aún puede ser visible.
Resumen
Las ventanas emergentes se utilizan con poca frecuencia, ya que existen alternativas: cargar y mostrar información en la
página o en iframe.
Si vamos a abrir una ventana emergente, una buena práctica es informar al usuario al respecto. Un icono de “ventana que se
abre” cerca de un enlace o botón permitiría al visitante sobrevivir al cambio de enfoque y tener en cuenta ambas ventanas.
●
Se puede abrir una ventana emergente con la llamada open (url, name, params) . Devuelve la referencia a la
ventana recién abierta.
●
Los navegadores bloquean las llamadas open desde el código fuera de las acciones del usuario. Por lo general aparece
una notificación para que un usuario pueda permitirlos.
● Los navegadores abren una nueva pestaña de forma predeterminada, pero si se proporcionan tamaños, será una ventana
emergente.
● La ventana emergente puede acceder a la ventana que la abre usando la propiedad window.opener .
● La ventana principal y la ventana emergente pueden leerse y modificarse libremente entre sí si tienen el mismo origen. De
lo contrario, pueden cambiar de ubicación e intercambiar mensajes.
Para cerrar la ventana emergente: use close () . Además, el usuario puede cerrarlas (como cualquier otra ventana). El
window.closed es true después de eso.
●
Los métodos focus () y blur () permiten enfocar/desenfocar una ventana. Pero no funcionan todo el tiempo.
●
Los eventos focus y blur permiten rastrear el cambio dentro y fuera de la ventana. Pero tenga en cuenta que una
ventana puede seguir siendo visible incluso en el estado de fondo, después de “desenfoque”.
La política de “Mismo origen” (mismo sitio) limita el acceso de ventanas y marcos entre sí.
La idea es que si un usuario tiene dos páginas abiertas: una de john-smith.com , y otra es gmail.com , entonces no
querrán que un script de john-smith.com lea nuestro correo de gmail.com . Por lo tanto, el propósito de la política de
“Mismo origen” es proteger a los usuarios del robo de información.
Mismo origen
Se dice que dos URL tienen el “mismo origen” si tienen el mismo protocolo, dominio y puerto.
Estas no:
●
http://www.site.com (otro dominio: www. importa)
7/220
●
http://site.org (otro dominio: .org importa)
●
https://site.com (otro protocolo: https )
●
http://site.com:8080 (otro puerto: 8080 )
En acción: iframe
Una etiqueta <iframe> aloja una ventana incrustada por separado, con sus propios objetos document y window
separados.
Cuando accedemos a algo dentro de la ventana incrustada, el navegador comprueba si el iframe tiene el mismo origen. Si no
es así, se niega el acceso (escribir en location es una excepción, aún está permitido).
<script>
iframe.onload = function() {
// podemos obtener la referencia a la ventana interior
let iframeWindow = iframe.contentWindow; // OK
try {
// ...pero no al documento que contiene
let doc = iframe.contentDocument; // ERROR
} catch(e) {
alert(e); // Error de seguridad (otro origen)
}
iframe.onload = null; // borra el controlador para no ejecutarlo después del cambio de ubicación
};
</script>
Por el contrario, si el <iframe> tiene el mismo origen, podemos hacer cualquier cosa con él:
<script>
iframe.onload = function() {
// solo haz cualquier cosa
iframe.contentDocument.body.prepend("¡Hola, mundo!");
8/220
};
</script>
iframe.onload vs iframe.contentWindow.onload
El evento iframe.onload (en la etiqueta <iframe> ) es esencialmente el mismo que
iframe.contentWindow.onload (en el objeto de ventana incrustado). Se activa cuando la ventana incrustada se
carga completamente con todos los recursos.
… Pero no podemos acceder a iframe.contentWindow.onload para un iframe de otro origen, así que usamos
iframe.onload .
Por definición, dos URL con diferentes dominios tienen diferentes orígenes.
Pero si las ventanas comparten el mismo dominio de segundo nivel, por ejemplo, john.site.com , peter.site.com y
site.com (de modo que su dominio de segundo nivel común es site.com ), podemos hacer que el navegador ignore
esa diferencia, de modo que puedan tratarse como si vinieran del “mismo origen” para efecto de la comunicación entre
ventanas.
Para que funcione, cada una de estas ventanas debe ejecutar el código:
document.domain = 'site.com';
Eso es todo. Ahora pueden interactuar sin limitaciones. Nuevamente, eso solo es posible para páginas con el mismo dominio
de segundo nivel.
Dicho esto, hasta ahora todos los navegadores lo soportan. Y tal soporte será mantenido en el futuro, para no romper el
código existente que se apoya en document.domain .
Cuando un iframe proviene del mismo origen y podemos acceder a su document , existe una trampa. No está relacionado
con cross-origin, pero es importante saberlo.
Tras su creación, un iframe tiene inmediatamente un documento. ¡Pero ese documento es diferente del que se carga en él!
Aquí, mira:
<script>
let oldDoc = iframe.contentDocument;
iframe.onload = function() {
let newDoc = iframe.contentDocument;
// ¡el documento cargado no es el mismo que el inicial!
alert(oldDoc == newDoc); // false
};
</script>
No deberíamos trabajar con el documento de un iframe aún no cargado, porque ese es el documento incorrecto. Si
configuramos algún controlador de eventos en él, se ignorarán.
El documento correcto definitivamente está en su lugar cuando se activa iframe.onload . Pero solo se activa cuando se
carga todo el iframe con todos los recursos.
9/220
Podemos intentar capturar el momento anterior usando comprobaciones en setInterval :
<script>
let oldDoc = iframe.contentDocument;
Colección: window.frames
Una forma alternativa de obtener un objeto de ventana para <iframe> – es obtenerlo de la colección nombrada
window.frames :
●
Por número: window.frames[0] – el objeto de ventana para el primer marco del documento.
●
Por nombre: window.frames.iframeName – el objeto de ventana para el marco con name="iframeName" .
Por ejemplo:
<script>
alert(iframe.contentWindow == frames[0]); // true
alert(iframe.contentWindow == frames.win); // true
</script>
Un iframe puede tener otros iframes en su interior. Los objetos window correspondientes forman una jerarquía.
Por ejemplo:
Podemos usar la propiedad top para verificar si el documento actual está abierto dentro de un marco o no:
El atributo sandbox permite la exclusión de ciertas acciones dentro de un <iframe> para evitar que ejecute código no
confiable. Separa el iframe en un “sandbox” tratándolo como si procediera de otro origen y/o aplicando otras limitaciones.
Hay un “conjunto predeterminado” de restricciones aplicadas para <iframe sandbox src="..."> . Pero se puede
relajar si proporcionamos una lista de restricciones separadas por espacios que no deben aplicarse como un valor del
atributo, así: <iframe sandbox="allow-forms allow-popups"> .
10/220
En otras palabras, un atributo “sandbox” vacío pone las limitaciones más estrictas posibles, pero podemos poner una lista
delimitada por espacios de aquellas que queremos levantar.
allow-same-origin
Por defecto, “sandbox” fuerza la política de “origen diferente” para el iframe. En otras palabras, hace que el navegador trate
el iframe como si viniera de otro origen, incluso si su src apunta al mismo sitio. Con todas las restricciones implícitas
para los scripts. Esta opción elimina esa característica.
allow-top-navigation
Permite que el iframe cambie parent.location .
allow-forms
Permite enviar formularios desde iframe .
allow-scripts
Permite ejecutar scripts desde el iframe .
allow-popups
Permite window.open popups desde el iframe
El siguiente ejemplo muestra un iframe dentro de un entorno controlado con el conjunto de restricciones predeterminado:
<iframe sandbox src="..."> . Tiene algo de JavaScript y un formulario.
Tenga en cuenta que nada funciona. Entonces, el conjunto predeterminado es realmente duro:
https://plnkr.co/edit/Ph8oZDpoxUg24AGu?p=preview
La interfaz postMessage permite que las ventanas se comuniquen entre sí sin importar de qué origen sean.
Por lo tanto, es una forma de evitar la política del “mismo origen”. Permite a una ventana de john-smith.com hablar con
gmail.com e intercambiar información, pero solo si ambos están de acuerdo y llaman a las funciones de JavaScript
correspondientes. Eso lo hace seguro para los usuarios.
La interfaz tiene dos partes.
postMessage
La ventana que quiere enviar un mensaje llama al método postMessage de la ventana receptora. En otras palabras, si
queremos enviar el mensaje a win , debemos llamar a win.postMessage(data, targetOrigin) .
Argumentos:
data
Los datos a enviar. Puede ser cualquier objeto, los datos se clonan mediante el “algoritmo de clonación estructurada”. IE solo
admite strings, por lo que debemos usar JSON.stringify en objetos complejos para admitir ese navegador.
targetOrigin
Especifica el origen de la ventana de destino, de modo que solo una ventana del origen dado recibirá el mensaje.
El argumento “targetOrigin” es una medida de seguridad. Recuerde que si la ventana de destino proviene de otro origen, no
podemos leer su location en la ventana del remitente. Por lo tanto, no podemos estar seguros qué sitio está abierto en la
ventana deseada en este momento: el usuario podría navegar fuera del sitio y la ventana del remitente no tener idea de ello.
Especificar targetOrigin asegura que la ventana solo reciba los datos si todavía está en el sitio correcto. Importante
cuando los datos son sensibles.
11/220
Por ejemplo, aquí win solo recibirá el mensaje si tiene un documento del origen http://example.com :
<script>
let win = window.frames.example;
win.postMessage("message", "http://example.com");
</script>
<script>
let win = window.frames.example;
win.postMessage("message", "*");
</script>
onmessage
Para recibir un mensaje, la ventana destino debe tener un controlador en el evento message . Se activa cuando se llama a
postMessage (y la comprobación de targetOrigin es correcta).
data
Los datos de postMessage .
origin
El origen del remitente, por ejemplo, http://javascript.info .
source
La referencia a la ventana del remitente. Podemos llamar inmediatamente source.postMessage(...) de regreso si
queremos.
Para asignar ese controlador, debemos usar addEventListener , una sintaxis corta window.onmessage no funciona.
He aquí un ejemplo:
window.addEventListener("message", function(event) {
if (event.origin != 'http://javascript.info') {
// algo de un dominio desconocido, ignorémoslo
return;
}
El ejemplo completo:
https://plnkr.co/edit/eDoxBvzrEN3SjcaB?p=preview
Resumen
Para llamar a métodos y acceder al contenido de otra ventana, primero debemos tener una referencia a ella.
12/220
Para iframes, podemos acceder a las ventanas padres o hijas usando:
●
window.frames – una colección de objetos de ventana anidados,
●
window.parent , window.top son las referencias a las ventanas principales y superiores,
●
iframe.contentWindow es la ventana dentro de una etiqueta <iframe> .
Si las ventanas comparten el mismo origen (host, puerto, protocolo), las ventanas pueden hacer lo que quieran entre sí.
La interfaz postMessage permite que dos ventanas con cualquier origen hablen:
Deberíamos usar addEventListener para configurar el controlador para este evento dentro de la ventana de destino.
El ataque “secuestro de clics” permite que una página maligna haga clic en un “sitio víctima” * en nombre del visitante *.
Muchos sitios fueron pirateados de esta manera, incluidos Twitter, Facebook, Paypal y otros sitios. Todos han sido
arreglados, por supuesto.
La idea
La demostración
Así es como se ve la página malvada. Para aclarar las cosas, el <iframe> es semitransparente (en las páginas realmente
malvadas es completamente transparente):
<style>
iframe { /* iframe del sitio de la víctima */
width: 400px;
height: 100px;
position: absolute;
top:0; left:-20px;
opacity: 0.5; /* realmente opacity:0 */
13/220
z-index: 1;
}
</style>
https://plnkr.co/edit/b7ebSHKUARbAIqdo?p=preview
Aquí tenemos un <iframe src="facebook.html"> semitransparente, y en el ejemplo podemos verlo flotando sobre el
botón. Un clic en el botón realmente hace clic en el iframe, pero eso no es visible para el usuario, porque el iframe es
transparente.
Como resultado, si el visitante está autorizado en Facebook (“recordarme” generalmente está activado), entonces agrega un
“Me gusta”. En Twitter sería un botón “Seguir”.
Este es el mismo ejemplo, pero más cercano a la realidad, con opacity:0 para <iframe> :
https://plnkr.co/edit/UtEq0WPu7HKCx7Fj?p=preview
Todo lo que necesitamos para atacar es colocar el <iframe> en la página maligna de tal manera que el botón esté justo
sobre el enlace. De modo que cuando un usuario hace clic en el enlace, en realidad hace clic en el botón. Eso suele ser
posible con CSS.
La entrada del teclado es muy difícil de redirigir. Técnicamente, si tenemos un campo de texto para piratear, entonces
podemos colocar un iframe de tal manera que los campos de texto se superpongan entre sí. Entonces, cuando un
visitante intenta concentrarse en la entrada que ve en la página, en realidad se enfoca en la entrada dentro del iframe.
Pero luego hay un problema. Todo lo que escriba el visitante estará oculto, porque el iframe no es visible.
Las personas generalmente dejarán de escribir cuando no puedan ver sus nuevos caracteres impresos en la pantalla.
La defensa más antigua es un poco de JavaScript que prohíbe abrir la página en un marco (el llamado “framebusting”).
Eso se ve así:
if (top != window) {
top.location = window.location;
}
Es decir: si la ventana descubre que no está en la parte superior, automáticamente se convierte en la parte superior.
Esta no es una defensa confiable, porque hay muchas formas de esquivarla. Cubramos algunas.
La página superior (adjuntando una, que pertenece al pirata informático) establece un controlador de prevención, como este:
window.onbeforeunload = function() {
return false;
};
Cuando el iframe intenta cambiar top.location , el visitante recibe un mensaje preguntándole si quiere irse.
14/220
En la mayoría de los casos, el visitante respondería negativamente porque no conocen el iframe; todo lo que pueden ver es
la página superior, no hay razón para irse. ¡Así que top.location no cambiará!
En acción:
https://plnkr.co/edit/0CHIKO3ehOKtgrLM?p=preview
Atributo Sandbox
Una de las cosas restringidas por el atributo sandbox es la navegación. Un iframe de espacio aislado no puede cambiar
top.location .
Entonces podemos agregar el iframe con sandbox="allow-scripts allow-forms" . Eso relajaría las restricciones,
permitiendo guiones y formularios. Pero omitimos allow-top-navigation para que se prohíba cambiar
top.location .
X-Frame-Options
El encabezado del lado del servidor X-Frame-Options puede permitir o prohibir mostrar la página dentro de un marco.
Debe enviarse exactamente como encabezado HTTP: el navegador lo ignorará si se encuentra en la etiqueta HTML
<meta> . Entonces, <meta http-equiv="X-Frame-Options"...> no hará nada.
DENY
Nunca muestra la página dentro de un marco.
SAMEORIGIN
Permitir dentro de un marco si el documento principal proviene del mismo origen.
ALLOW-FROM domain
Permitir dentro de un marco si el documento principal es del dominio dado.
El encabezado X-Frame-Options tiene un efecto secundario. Otros sitios no podrán mostrar nuestra página en un marco,
incluso si tienen buenas razones para hacerlo.
Así que hay otras soluciones… Por ejemplo, podemos “cubrir” la página con un <div> con estilos height: 100%;
width: 100%; , de modo que interceptará todos los clics. Ese <div> debe eliminarse si window == top o si
descubrimos que no necesitamos la protección.
Algo como esto:
<style>
#protector {
height: 100%;
width: 100%;
position: absolute;
left: 0;
top: 0;
z-index: 99999999;
}
</style>
<div id="protector">
<a href="/" target="_blank">Ir al sitio</a>
</div>
<script>
15/220
// habrá un error si la ventana superior es de un origen diferente
// pero esta bien aquí
if (top.document.domain == document.domain) {
protector.remove();
}
</script>
La demostración:
https://plnkr.co/edit/8oe0eRfrOuCPeBr3?p=preview
Una cookie con dicho atributo solo se envía a un sitio web si se abre directamente, no a través de un marco o de otra
manera. Más información en el capítulo Cookies, document.cookie.
…Entonces dicha cookie no se enviaría cuando Facebook esté abierto en iframe desde otro sitio. Entonces el ataque
fracasaría.
El atributo samesite cookie no tendrá efecto cuando no se utilicen cookies. Esto puede permitir que otros sitios web
muestren fácilmente nuestras páginas públicas no autenticadas en iframes.
Sin embargo, esto también puede permitir que los ataques de secuestro de clics funcionen en algunos casos limitados. Un
sitio web de sondeo anónimo que evita la duplicación de votaciones al verificar las direcciones IP, por ejemplo, aún sería
vulnerable al secuestro de clics porque no autentica a los usuarios que usan cookies.
Resumen
El secuestro de clics es una forma de “engañar” a los usuarios para que hagan clic en el sitio de una víctima sin siquiera
saber qué está sucediendo. Eso es peligroso si hay acciones importantes activadas por clic.
Un pirata informático puede publicar un enlace a su página maligna en un mensaje o atraer visitantes a su página por otros
medios. Hay muchas variaciones.
Desde una perspectiva, el ataque “no es profundo”: todo lo que hace un pirata informático es interceptar un solo clic. Pero
desde otra perspectiva, si el pirata informático sabe que después del clic aparecerá otro control, entonces pueden usar
mensajes astutos para obligar al usuario a hacer clic en ellos también.
El ataque es bastante peligroso, porque cuando diseñamos la interfaz de usuario generalmente no anticipamos que un pirata
informático pueda hacer clic en nombre del visitante. Entonces, las vulnerabilidades se pueden encontrar en lugares
totalmente inesperados.
●
Se recomienda utilizar X-Frame-Options: SAMEORIGIN en páginas (o sitios web completos) que no están
destinados a verse dentro de marcos.
●
Usa una cubierta <div> si queremos permitir que nuestras páginas se muestren en iframes, pero aún así permanecer
seguras.
Todo esto es posible en JavaScript y las operaciones binarias son de alto rendimiento.
Aunque hay un poco de confusión porque hay muchas clases. Por nombrar algunas:
●
ArrayBuffer , Uint8Array , DataView , Blob , File , etc.
16/220
Los datos binarios en JavaScript se implementan de una manera no estándar en comparación con otros lenguajes. Pero
cuando ordenamos las cosas, todo se vuelve bastante sencillo.
El objeto binario básico es ArrayBuffer – una referencia a un área de memoria contigua de longitud fija.
Lo creamos así:
Esto asigna un área de memoria contigua de 16 bytes y la rellena previamente con ceros.
ArrayBuffer es un área de memoria. ¿Qué se almacena en ella? No tiene ninguna pista. Sólo una secuencia cruda de
bytes.
Para manipular un ArrayBuffer , necesitamos utilizar un objeto “vista”.
Un objeto vista no almacena nada por sí mismo. Son “gafas” que le dan una interpretación a los bytes almacenados en el
ArrayBuffer .
Por ejemplo:
●
Uint8Array : trata cada byte del ArrayBuffer como un número separado, con valores posibles de 0 a 255 (un byte
es de 8 bits, por lo que sólo puede contener esa cantidad). Este valor se denomina “entero sin signo de 8 bits”.
●
Uint16Array : trata cada 2 bytes como un entero, con valores posibles de 0 a 65535. Es lo que se llama un “entero sin
signo de 16 bits”.
●
Uint32Array : trata cada 4 bytes como un entero, con valores posibles de 0 a 4294967295. Eso se llama “entero sin
signo de 32 bits”.
●
Float64Array : trata cada 8 bytes como un número de punto flotante con valores posibles desde 5.0x10-324 hasta
1.8x10308 .
Así, los datos binarios de un ArrayBuffer de 16 bytes pueden interpretarse como 16 “números diminutos”, u 8 números
más grandes (2 bytes cada uno), o 4 aún más grandes (4 bytes cada uno), o 2 valores de punto flotante con alta precisión (8
bytes cada uno).
new ArrayBuffer(16)
Uint8Array 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Uint16Array 0 1 2 3 4 5 6 7
Uint32Array 0 1 2 3
Float64Array 0 1
Pero si vamos a escribir en él, o iterar sobre él (básicamente, para casi cualquier operación), debemos utilizar una vista. Por
ejemplo:
17/220
let view = new Uint32Array(buffer); // trata el buffer como una secuencia de enteros de 32 bits
// escribamos un valor
view[0] = 123456;
TypedArray
El término común para todas estas vistas ( Uint8Array , Uint32Array , etc) es TypedArray . Comparten el mismo
conjunto de métodos y propiedades.
Por favor ten en cuenta que no hay ningún constructor llamado TypedArray , es sólo un término “paraguas” común para
representar una de las vistas sobre ArrayBuffer : Int8Array , Uint8Array y así sucesivamente, la lista completa
seguirá pronto.
Cuando veas algo como new TypedArray , significa cualquiera de new Int8Array , new Uint8Array , etc.
Las matrices tipificadas se comportan como las matrices normales: tienen índices y son iterables.
Un constructor de array tipado (ya sea Int8Array o Float64Array ) se comporta de forma diferente dependiendo del
tipo de argumento.
1. Si se suministra un argumento ArrayBuffer , la vista se crea sobre él. Ya usamos esa sintaxis.
Opcionalmente podemos proporcionar byteOffset para empezar (0 por defecto) y la longitud o length (hasta el final
del buffer por defecto), entonces la vista cubrirá sólo una parte del buffer .
2. Si se da un Array , o cualquier objeto tipo array, se crea un array tipado de la misma longitud y se copia el contenido.
3. Si se suministra otro TypedArray hace lo mismo: crea un array tipado de la misma longitud y copia los valores. Los
valores se convierten al nuevo tipo en el proceso, si es necesario.
4. Para un argumento numérico length : crea el array tipado para contener ese número de elementos. Su longitud en
bytes será length multiplicada por el número de bytes de un solo elemento TypedArray.BYTES_PER_ELEMENT :
18/220
5. Sin argumentos crea un array tipado de longitud cero.
Podemos crear un TypedArray directamente sin mencionar ArrayBuffer . Pero una vista no puede existir sin un
ArrayBuffer subyacente, por lo que se crea automáticamente en todos estos casos excepto en el primero (cuando se
proporciona).
8-bit integer
256
8-bit integer
257
Esta es la demo:
19/220
let num = 256;
alert(num.toString(2)); // 100000000 (representación binaria)
uint8array[0] = 256;
uint8array[1] = 257;
alert(uint8array[0]); // 0
alert(uint8array[1]); // 1
Uint8ClampedArray es especial en este aspecto y su comportamiento es diferente. Guarda 255 para cualquier número
que sea mayor que 255, y 0 para cualquier número negativo. Este comportamiento es útil para el procesamiento de
imágenes.
Métodos TypedArray
Estos métodos nos permiten copiar arrays tipados, mezclarlos, crear nuevos arrays a partir de los existentes, etc.
DataView
DataView es una vista especial superflexible “no tipada” sobre ArrayBuffer . Permite acceder a los datos en cualquier
desplazamiento en cualquier formato.
●
En el caso de los arrays tipados, el constructor dicta cuál es el formato. Se supone que todo el array es uniforme. El
número i es arr[i] .
● Con DataView accedemos a los datos con métodos como .getUint8(i) o .getUint16(i) . Elegimos el formato
en el momento de la llamada al método en lugar de en el momento de la construcción.
La sintaxis:
● buffer : el ArrayBuffer subyacente. A diferencia de los arrays tipados, DataView no crea un buffer por sí mismo.
Necesitamos tenerlo preparado.
●
byteOffset : la posición inicial en bytes de la vista (por defecto 0).
●
byteLength : la longitud en bytes de la vista (por defecto hasta el final del buffer ).
Por ejemplo, aquí extraemos números en diferentes formatos del mismo buffer:
// ahora obtenemos un número de 16 bits en el offset 0, que consta de 2 bytes, que juntos se interpretan como 65535
20/220
alert( dataView.getUint16(0) ); // 65535 (mayor entero sin signo de 16 bits)
dataView.setUint32(0, 0); // poner a cero el número de 4 bytes, poniendo así todos los bytes a 0
DataView es genial cuando almacenamos datos de formato mixto en el mismo buffer. Por ejemplo, cuando almacenamos
una secuencia de pares (entero de 16 bits, flotante de 32 bits), DataView permite acceder a ellos fácilmente.
Resumen
ArrayBuffer es el objeto central, una referencia al área de memoria contigua de longitud fija.
Para hacer casi cualquier operación sobre ArrayBuffer , necesitamos una vista.
●
Puede ser un TypedArray :
●
Uint8Array , Uint16Array , Uint32Array : para enteros sin signo de 8, 16 y 32 bits.
● Uint8ClampedArray : para enteros de 8 bits, los “sujeta” en la asignación.
● Int8Array , Int16Array , Int32Array : para números enteros con signo (pueden ser negativos).
●
Float32Array , Float64Array : para números de punto flotante con signo de 32 y 64 bits.
●
O una DataView : la vista que utiliza métodos para especificar un formato, por ejemplo getUint8(offset) .
En la mayoría de los casos creamos y operamos directamente sobre arrays tipados, dejando el ArrayBuffer a cubierto,
como “denominador común”. Podemos acceder a él como .buffer y hacer otra vista si es necesario.
También hay dos términos adicionales, que se utilizan en las descripciones de los métodos que operan con datos binarios:
●
ArrayBufferView es un término paraguas para todos estos tipos de vistas.
● El término BufferSource es un término general para ArrayBuffer o ArrayBufferView .
Veremos estos términos en los próximos capítulos. El término BufferSource es uno de los más comunes, ya que significa
“cualquier tipo de datos binarios” : un ArrayBuffer o una vista sobre él.
Uint8Array
Int8Array 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Uint8ClampedArray
Uint16Array
0 1 2 3 4 5 6 7
Int16Array
ArrayBufferView
Uint32Array
Int32Array 0 1 2 3
Float32Array
Float64Array 0 1
Tareas
Dado un array de Uint8Array , escribir una función concat(arrays) que devuelva la concatenación de ellos en un
único array.
21/220
A solución
TextDecoder y TextEncoder
¿Qué pasa si los datos binarios son en realidad un string? Por ejemplo, recibimos un archivo con datos textuales.
El objeto incorporado TextDecoder nos permite leer el valor y convertirlo en un string de JavaScript, dados el búfer y la
codificación.
Primero necesitamos crearlo:
● label – la codificación, utf-8 por defecto, pero big5 , windows-1251 y muchos otros también son soportados.
●
options – objeto opcional:
● fatal – booleano, si es true arroja una excepción por caracteres inválidos (no-decodificable), de otra manera (por
defecto) son reemplazados con el carácter \uFFFD .
● ignoreBOM – booleano, si es true entonces ignora BOM (una marca Unicode de orden de bytes opcional),
raramente es necesario.
…Y luego decodificar:
Por ejemplo:
Podemos decodificar una parte del búfer al crear una vista de sub arreglo para ello:
TextEncoder
La sintaxis es:
22/220
La única codificación que soporta es “utf-8”.
Tiene dos métodos:
● encode(str) – regresa un dato de tipo Uint8Array de un string.
● encodeInto(str, destination) – codifica un str en destination , este último debe ser de tipo
Uint8Array .
Blob
Los ArrayBuffer y las vistas son parte del estándar ECMA, una parte de JavaScript.
En el navegador, hay objetos de alto nivel adicionales, descritas en la API de Archivo , en particular Blob .
Blob consta de un tipo especial de cadena (usualmente de tipo MIME), más partes Blob: una secuencia de otros objetos
Blob , cadenas y BufferSource .
type blobParts
●
blobParts es un array de valores Blob / BufferSource / String .
●
opciones objeto opcional:
● tipo – Blob , usualmente un tipo MIME, por ej. image/png ,
● endings – para transformar los finales de línea para hacer que el Blob coincida con los caracteres de nueva línea
del Sistema Operativo actual ( \r\n or \n ). Por omisión es "transparent" (no hacer nada), pero también puede
ser "native" (transformar).
Por ejemplo:
Los argumentos son similares a array.slice , los números negativos también son permitidos.
23/220
los objetos Blob son inmutables
No podemos cambiar datos directamente en un Blob , pero podemos obtener partes de un Blob , crear nuevos objetos
Blob a partir de ellos, mezclarlos en un nuevo Blob y así por el estilo.
Este comportamiento es similar a las cadenas de JavaScript: no podemos cambiar un carácter en una cadena, pero
podemos hacer una nueva, corregida.
Un Blob puede ser utilizado fácilmente como una URL para <a> , <img> u otras etiquetas, para mostrar su contenido.
Gracias al tipo , también podemos descargar/cargar objetos Blob , y el tipo se convierte naturalmente en Content-
Type en solicitudes de red.
Empecemos con un ejemplo simple. Al hacer click en un link, descargas un Blob dinámicamente generado con contenido
hello world en forma de archivo:
<script>
let blob = new Blob(["Hello, world!"], {type: 'text/plain'});
link.href = URL.createObjectURL(blob);
</script>
También podemos crear un link dinámicamente en JavaScript y simular un click con link.click() , y la descarga inicia
automáticamente.
Este es un código similar que permite al usuario descargar el Blob creado dinámicamente, sin HTML:
link.href = URL.createObjectURL(blob);
link.click();
URL.revokeObjectURL(link.href);
URL.createObjectURL toma un Blob y crea una URL única para él, con la forma blob:<origin>/<uuid> .
blob:https://javascript.info/1e67e00e-860d-40a5-89ae-6ab0cbee6273
Por cada URL generada por URL.createObjectURL el navegador almacena un URL → Blob mapeado internamente.
Así que las URLs son cortas, pero permiten acceder al Blob .
Una URL generada (y por lo tanto su enlace) solo es válida en el documento actual, mientras está abierto. Y este permite
referenciar al Blob en <img> , <a> , básicamente cualquier otro objeto que espera un URL.
También hay efectos secundarios. Mientras haya un mapeado para un Blob , el Blob en sí mismo se guarda en la
memoria. El navegador no puede liberarlo.
El mapeado se limpia automáticamente al vaciar un documento, así los objetos Blob son liberados. Pero si una aplicación
es de larga vida, entonces eso no va a pasar pronto.
Entonces, si creamos una URL, este Blob se mantendrá en la memoria, incluso si ya no se necesita.
URL.revokeObjectURL(url) elimina la referencia el mapeo interno, además de permitir que el Blob sea borrado (si
ya no hay otras referencias), y que la memoria sea liberada.
24/220
En el último ejemplo, intentamos que el Blob sea utilizado una sola vez, para descargas instantáneas, así llamamos
URL.revokeObjectURL(link.href) inmediatamente.
En el ejemplo anterior con el link HTML cliqueable, no llamamos URL.revokeObjectURL(link.href) , porque eso
puede hacer la URL del Blob inválido. Después de la revocación, como el mapeo es eliminado, la URL ya no volverá a
funcionar.
Blob a base64
Esa codificación representa datos binarios como una cadena ultra segura de caracteres “legibles” con códigos ASCII desde
el 0 al 64. Y lo que es más importante, podemos utilizar codificación en las “URLs de datos”.
Un URL de datos tiene la forma data:[<mediatype>][;base64],<data> . Podemos usar suficientes URLs por
doquier, junto a URLs “regulares”.
<img src="
Para transformar un Blob a base64, usaremos el objeto nativo FileReader . Puede leer datos de Blobs en múltiples
formatos. En el siguiente capítulo lo cubriremos en profundidad.
reader.onload = function() {
link.href = reader.result; // URL de datos
link.click();
};
Se pueden utilizar ambas maneras para hacer una URL de un Blob . Pero usualmente URL.createObjectURL(blob)
es más simple y rápido.
imagen a blob
Podemos crear un Blob de una imagen, una parte de una imagen, o incluso hacer una captura de la página. Es práctico
para subirlo a algún lugar.
En el ejemplo siguiente, un imagen se copia, pero no podemos cortarla o transformarla en el canvas hasta convertirla en
blob:
25/220
// tomar cualquier imagen
let img = document.querySelector('img');
link.href = URL.createObjectURL(blob);
link.click();
// borrar la referencia interna del blob, para permitir al navegador eliminarlo de la memoria
URL.revokeObjectURL(link.href);
}, 'image/png');
Para capturar la página, podemos utilizar una librería como https://github.com/niklasvh/html2canvas . Que lo que hace es
escanear toda la página y dibujarla en el <canvas> . Entonces podemos obtener un Blob de la misma manera que arriba.
De Blob a ArrayBuffer
El constructor de Blob permite crear un blob de casi cualquier cosa, incluyendo cualquier BufferSource .
Pero si queremos ejecutar un procesamiento de bajo nivel, podemos obtener el nivel más bajo de un ArrayBuffer desde
blob.arrayBuffer() :
// or
blob.arrayBuffer().then(buffer => /* process the ArrayBuffer */);
De Blob a stream
Cuando leemos y escribimos un blob de más de 2 GB , arrayBuffer hace un uso demasiado intensivo de la memoria
para nosotros. En este punto, podemos convertir directamente el blob a un stream.
Un stream (flujo, corriente) es un objeto especial que permite leer (o escribir) porción por porción. Está fuera de nuestro
objetivo aquí, pero este es un ejemplo que puedes leer https://developer.mozilla.org/en-US/docs/Web/API/Streams_API .
Los streams son convenientes para datos que son adecuados para el proceso pieza por pieza.
El método interfaz stream() de Blob devuelve un ReadableStream que al leerlo devuelve datos contenidos dentro
del Blob .
while (true) {
// para cada iteración: data es el siguiente fragmento del blob
let { done, value } = await stream.read();
26/220
if (done) {
// no hay más data en el stream
console.log('todo el blob procesado.');
break;
}
// hacer algo con la porción de datos que acabamos de leer del blob
console.log(value);
}
Resumen
Mientras ArrayBuffer , Uint8Array y otros BufferSource son “datos binarios”, un Blob representa “datos
binarios con tipo”.
Esto hace a los Blobs convenientes para operaciones de carga/descarga, estos son muy comunes en el navegador.
Los métodos que ejecutan solicitudes web, como XMLHttpRequest, fetch y otros, pueden trabajar nativamente con Blob ,
como con otros tipos binarios.
Podemos convertir fácilmente entre Blob y tipos de datos binarios de bajo nivel:
● Podemos crear un Blob desde un array tipado usando el constructor new Blob(...) .
● Podemos obtener de vuelta un ArrayBuffer desde un Blob usando blob.arrayBuffer() , y entonces crear una
vista sobre él para procesamiento binario de bajo nivel.
Los streams de conversión son muy útiles cuando necesitamos manejar grandes blob. Puedes crear un ReadableStream
desde un blob. El método interfaz stream() de Blob devuelve un ReadableStream que una vez leído devuelve los
datos contenido en el blob.
File y FileReader
Un objeto File hereda de Blob y extiende las capacidades relacionadas con el sistema de archivos.
Segundo, a menudo obtenemos un archivo mediante un <input type="file"> o arrastrar y soltar u otras interfaces del
navegador. En este caso el archivo obtiene la información del Sistema Operativo.
Como File (Archivo) hereda de Blob , objetos de tipo File tienen las mismas propiedades, mas:
● name – el nombre del archivo,
● lastModified – la marca de tiempo de la última modificación.
<script>
function showFile(input) {
let file = input.files[0];
27/220
Por favor tome nota:
El input puede seleccionar varios archivos, por lo que input.files es un array de dichos archivos . En este caso
tenemos un solo archivo por lo que solo es necesario usar input.files[0] .
FileReader
FileReader es un objeto con el único porpósito de leer datos desde objetos de tipo Blob (por lo tanto File también).
El entrega los datos usando eventos debido a que leerlos desde el disco puede tomar un tiempo.
El constructor:
La opción del método read* depende de qué formato preferimos y cómo vamos a usar los datos.
●
readAsArrayBuffer – para archivos binarios, en donde se hacen operaciones binarias de bajo nivel. Para
operaciones de alto nivel, como slicing, File hereda de Blob por lo que podemos llamarlas directamente sin tener que
leer.
●
readAsText – para archivos de texto, cuando necesitamos obtener una cadena.
●
readAsDataURL – cuando necesitamos usar estos datos como valores de src en img u otras etiquetas html. Hay
otra alternativa para leer archivos de ese tipo como discutimos en el capítulo Blob: URL.createObjectURL(file) .
<script>
function readFile(input) {
let file = input.files[0];
reader.readAsText(file);
reader.onload = function() {
console.log(reader.result);
};
28/220
reader.onerror = function() {
console.log(reader.error);
};
}
</script>
Sus metodos read* no generan eventos sino que devuelven un resultado como las funciones regulares.
Esto es solo dentro de un Web Worker, debido a que demoras en llamadas síncronas mientras se lee el archivo en Web
Worker no son tan importantes. No afectan la página.
Resumen
Además de los métodos y propiedades de Blob , los objetos File también tienen las propiedades name y
lastModified mas la habilidad interna de leer del sistema de archivos. Usualmente obtenemos los objetos File
mediante la entrada del el usuario con <input> o eventos Drag’n’Drop ( ondragend ).
Los objetos FileReader pueden leer desde un archivo o un blob en uno de estos tres formatos:
● String ( readAsText ) .
● ArrayBuffer ( readAsArrayBuffer ).
●
Datos URI codificado en base 64 ( readAsDataURL ).
En muchos casos no necesitamos leer el contenido de un archivo como hicimos con los blobs, podemos crear un enlace
corto con URL.createObjectURL(file) y asignárselo a un <a> o <img> . De esta manera el archivo puede ser
descargado, mostrado como una imagen o como parte de un canvas, etc.
Y si vamos a mandar un File por la red, es fácil utilizando APIs como XMLHttpRequest o fetch que aceptan
nativamente objetos File .
Solicitudes de red
Fetch
JavaScript puede enviar peticiones de red al servidor y cargar nueva información siempre que se necesite.
Se utiliza el término global “AJAX” (abreviado Asynchronous JavaScript And XML, en español: “JavaScript y XML
Asincrónico”) para referirse a las peticiones de red originadas desde JavaScript. Sin embargo, no estamos necesariamente
condicionados a utilizar XML dado que el término es antiguo y es por esto que el acrónimo XML se encuentra aquí.
Probablemente lo hayáis visto anteriormente.
29/220
Existen múltiples maneras de enviar peticiones de red y obtener información de un servidor.
Comenzaremos con el el método fetch() que es moderno y versátil. Este método no es soportado por navegadores
antiguos (sin embargo se puede incluir un polyfill), pero es perfectamente soportado por los navegadores actuales y
modernos.
Si no especificamos ningún options , se ejecutará una simple petición GET, la cual descargará el contenido de lo
especificado en el url .
El navegador lanzará la petición de inmediato y devolverá una promesa (promise) que luego será utilizada por el código
invocado para obtener el resultado.
Por lo general, obtener una respuesta es un proceso de dos pasos.
Primero, la promesa promise , devuelta por fetch , resuelve la respuesta con un objeto de la clase incorporada
Response tan pronto como el servidor responde con los encabezados de la petición.
En este paso, podemos chequear el status HTTP para poder ver si nuestra petición ha sido exitosa o no, y chequear los
encabezados, pero aún no disponemos del cuerpo de la misma.
La promesa es rechazada si el fetch no ha podido establecer la petición HTTP, por ejemplo, por problemas de red o si el
sitio especificado en la petición no existe. Estados HTTP anormales, como el 404 o 500 no generan errores.
Ejemplo:
Response provee múltiples métodos basados en promesas para acceder al cuerpo de la respuesta en distintos formatos:
●
response.text() – lee y devuelve la respuesta en formato texto,
● response.json() – convierte la respuesta como un JSON,
● response.formData() – devuelve la respuesta como un objeto FormData (explicado en el siguiente capítulo),
●
response.blob() – devuelve la respuesta como Blob (datos binarios tipados),
● response.arrayBuffer() – devuelve la respuesta como un objeto ArrayBuffer (representación binaria de datos de
bajo nivel),
●
Adicionalmente, response.body es un objeto ReadableStream , el cual nos permite acceder al cuerpo como si fuera
un stream y leerlo por partes. Veremos un ejemplo de esto más adelante.
Por ejemplo, si obtenemos un objeto de tipo JSON con los últimos commits de GitHub:
let commits = await response.json(); // leer respuesta del cuerpo y devolver como JSON
30/220
alert(commits[0].author.login);
fetch('https://api.github.com/repos/javascript-tutorial/en.javascript.info/commits')
.then(response => response.json())
.then(commits => alert(commits[0].author.login));
Como demostración de una lectura en formato binario, hagamos un fetch y mostremos una imagen del logotipo de
“especificación fetch” (ver capítulo Blob para más detalles acerca de las operaciones con Blob ):
// mostrar
img.src = URL.createObjectURL(blob);
Importante:
Podemos elegir un solo método de lectura para el cuerpo de la respuesta.
Encabezados de respuesta
Los encabezados de respuesta están disponibles como un objeto de tipo Map dentro del response.headers .
No es exactamente un Map, pero posee métodos similares para obtener de manera individual encabezados por nombre o si
quisiéramos recorrerlos como un objeto:
// obtenemos un encabezado
alert(response.headers.get('Content-Type')); // application/json; charset=utf-8
31/220
Encabezados de petición
Para especificar un encabezado en nuestro fetch , podemos utilizar la opción headers . La misma posee un objeto con
los encabezados salientes, como se muestra en el siguiente ejemplo:
Estos encabezados nos aseguran que nuestras peticiones HTTP sean controladas exclusivamente por el navegador, de
manera correcta y segura.
Peticiones POST
Para ejecutar una petición POST , o cualquier otro método, utilizaremos las opciones de fetch :
● method – método HTTP, por ej: POST ,
●
body – cuerpo de la respuesta, cualquiera de las siguientes:
● cadena de texto (ej. JSON-encoded),
● Objeto FormData , para enviar información como multipart/form-data ,
●
Blob / BufferSource para enviar información en formato binario,
●
URLSearchParams, para enviar información en cifrado x-www-form-urlencoded (no utilizado frecuentemente).
Por ejemplo, el código debajo envía la información user como un objeto JSON:
let user = {
nombre: 'Juan',
apellido: 'Perez'
};
32/220
let response = await fetch('/article/fetch/post/user', {
method: 'POST',
headers: {
'Content-Type': 'application/json;charset=utf-8'
},
body: JSON.stringify(user)
});
Tener en cuenta, si la respuesta del body es una cadena de texto, entonces el encabezado Content-Type será
especificado como text/plain;charset=UTF-8 por defecto.
Pero, cómo vamos a enviar un objeto JSON, en su lugar utilizaremos la opción headers especificada a
application/json , que es la opción correcta Content-Type para información en formato JSON.
También es posible enviar datos binarios con fetch , utilizando los objetos Blob o BufferSource .
En el siguiente ejemplo, utilizaremos un <canvas> donde podremos dibujar utilizando nuestro ratón. Haciendo click en el
botón “enviar” enviará la imagen al servidor:
<body style="margin:0">
<canvas id="canvasElem" width="100" height="80" style="border:1px solid"></canvas>
<script>
canvasElem.onmousemove = function(e) {
let ctx = canvasElem.getContext('2d');
ctx.lineTo(e.clientX, e.clientY);
ctx.stroke();
};
</script>
</body>
Enviar
Una aclaración, aquí no especificamos el Content-Type de manera manual, precisamente porque el objeto Blob posee
un tipo incorporado (en este caso image/png , el cual es generado por la función toBlob ). Para objetos Blob ese es el
valor por defecto del encabezado Content-Type .
function submit() {
canvasElem.toBlob(function(blob) {
fetch('/article/fetch/post/image', {
method: 'POST',
body: blob
})
.then(response => response.json())
.then(result => alert(JSON.stringify(result, null, 2)))
33/220
}, 'image/png');
}
Resumen
Una petición fetch típica está formada por dos llamadas await :
let response = await fetch(url, options); // resuelve con los encabezados de respuesta
let result = await response.json(); // accede al cuerpo de respuesta como json
fetch(url, options)
.then(response => response.json())
.then(result => /* procesa resultado */)
Propiedades de respuesta:
● response.status – Código HTTP de la respuesta.
●
response.ok – Devuelve true si el código HTTP es 200-299.
● response.headers – Objeto simil-Map que contiene los encabezados HTTP.
En los próximos capítulos veremos más sobre opciones y casos de uso para fetch .
Tareas
Crear una función async llamada getUsers(names) , que tome como parámetro un arreglo de logins de GitHub, obtenga
el listado de usuarios de GitHub indicado y devuelva un arreglo de usuarios de GitHub.
34/220
A solución
FormData
Este capítulo trata sobre el envío de formularios HTML: con o sin archivos, con campos adicionales y cosas similares.
Los objetos FormData pueden ser de ayuda en esta tarea. Tal como habrás supuesto, éste es el objeto encargado de
representar los datos de los formularios HTML.
El constructor es:
Lo que hace especial al objeto FormData es que los métodos de red, tales como fetch , pueden aceptar un objeto
FormData como el cuerpo. Es codificado y enviado como Content-Type: multipart/form-data .
<form id="formElem">
<input type="text" name="name" value="John">
<input type="text" name="surname" value="Smith">
<input type="submit">
</form>
<script>
formElem.onsubmit = async (e) => {
e.preventDefault();
alert(result.message);
};
</script>
En este ejemplo, el código del servidor no es representado ya que está fuera de nuestro alcance. El servidor acepta la
solicitud POST y responde “Usuario registrado”.
Métodos de FormData
Contamos con métodos para poder modificar los campos del FormData :
●
formData.append(name, value) – agrega un campo al formulario con el nombre name y el valor value ,
● formData.append(name, blob, fileName) – agrega un campo tal como si se tratara de un <input
type="file"> , el tercer argumento fileName establece el nombre del archivo (no el nombre del campo), tal como si
se tratara del nombre del archivo en el sistema de archivos del usuario,
● formData.delete(name) – elimina el campo de nombre name ,
● formData.get(name) – obtiene el valor del campo con el nombre name ,
●
formData.has(name) – en caso de que exista el campo con el nombre name , devuelve true , de lo contrario
false
35/220
Un formulario técnicamente tiene permitido contar con muchos campos con el mismo atributo name , por lo que múltiples
llamadas a append agregarán más campos con el mismo nombre.
Por otra parte existe un método set , con la misma sintaxis que append . La diferencia está en que .set remueve todos
los campos con el name que se le ha pasado, y luego agrega el nuevo campo. De este modo nos aseguramos de que
exista solamente un campo con determinado name , el resto es tal como en append :
● formData.set(name, value) ,
● formData.set(name, blob, fileName) .
También es posible iterar por los campos del objeto formData utilizando un bucle for..of :
El formulario siempre es enviado como Content-Type: multipart/form-data , esta codificación permite enviar
archivos. Por lo tanto los campos <input type="file"> también son enviados, tal como sucede en un envío normal.
<form id="formElem">
<input type="text" name="firstName" value="John">
Imagen: <input type="file" name="picture" accept="image/*">
<input type="submit">
</form>
<script>
formElem.onsubmit = async (e) => {
e.preventDefault();
alert(result.message);
};
</script>
Tal como pudimos ver en el capítulo Fetch, es fácil enviar datos binarios generados dinámicamente (por ejemplo una
imagen) como Blob . Podemos proporcionarlos directamente en un fetch con el parámetro body .
De todos modos, en la práctica suele ser conveniente enviar la imagen como parte del formulario junto a otra metadata tal
como el nombre y no de forma separada.
Además los servidores suelen ser más propensos a aceptar formularios multipart, en lugar de datos binarios sin procesar.
Este ejemplo envía una imagen desde un <canvas> junto con algunos campos más, como un formulario utilizando
FormData :
<body style="margin:0">
<canvas id="canvasElem" width="100" height="80" style="border:1px solid"></canvas>
36/220
<script>
canvasElem.onmousemove = function(e) {
let ctx = canvasElem.getContext('2d');
ctx.lineTo(e.clientX, e.clientY);
ctx.stroke();
};
</script>
</body>
Submit
Es lo mismo que si hubiera un campo <input type="file" name="image"> en el formulario, y el usuario enviara un
archivo con nombre "image.png" (3er argumento) con los datos imageBlob (2do argumento) desde su sistema de
archivos.
El servidor lee el formulario form-data y el archivo tal como si de un formulario regular se tratara.
Resumen
Los objetos FormData son utilizados para capturar un formulario HTML y enviarlo utilizando fetch u otro método de
red.
Podemos crear el objeto con new FormData(form) desde un formulario HTML, o crear un objeto sin un formulario en
absoluto y agregar los campos con los siguientes métodos:
●
formData.append(nombre, valor)
● formData.append(nombre, blob, nombreDeArchivo)
● formData.set(nombre, valor)
● formData.set(nombre, blob, nombreDeArchivo)
¡Esto es todo!
37/220
Fetch: Progreso de la descarga
Ten en cuenta: actualmente no hay forma de que fetch rastree el progreso de carga. Para ese propósito, utiliza
XMLHttpRequest, lo cubriremos más adelante.
Para rastrear el progreso de la descarga, podemos usar la propiedad response.body . Esta propiedad es un
ReadableStream , un objeto especial que proporciona la transmisión del cuerpo fragmento a fragmento tal como viene.
Estas se describen en la especificación de la API de transmisiones .
if (done) {
break;
}
Recibimos fragmentos de respuesta en el bucle, hasta que finaliza la carga, es decir: hasta que done se convierte en
true .
Para registrar el progreso, solo necesitamos que cada value de fragmento recibido agregue su longitud al contador.
Aquí está el ejemplo funcional completo que obtiene la respuesta y registra el progreso en la consola, seguido de su
explicación:
if (done) {
break;
}
chunks.push(value);
38/220
receivedLength += value.length;
// ¡Hemos terminado!
let commits = JSON.parse(result);
alert(commits[0].author.login);
1. Realizamos fetch como de costumbre, pero en lugar de llamar a response.json() , obtenemos un lector de
transmisión response.body.getReader() .
Ten en cuenta que no podemos usar ambos métodos para leer la misma respuesta: usa un lector o un método de
respuesta para obtener el resultado.
2. Antes de leer, podemos averiguar la longitud completa de la respuesta del encabezado Content-Length .
Puede estar ausente para solicitudes cross-origin (consulta el capítulo Fetch: Cross-Origin Requests) y, bueno,
técnicamente un servidor no tiene que configurarlo. Pero generalmente está en su lugar.
Recopilamos fragmentos de respuesta en la matriz chunks . Eso es importante, porque después de consumir la
respuesta, no podremos “releerla” usando response.json() u otra forma (puedes intentarlo, habrá un error).
4. Al final, tenemos chunks – una matriz de fragmentos de bytes Uint8Array . Necesitamos unirlos en un solo resultado.
Desafortunadamente, no hay un método simple que los concatene, por lo que hay un código para hacerlo:
1. Creamos chunksAll = new Uint8Array(selectedLength) – una matriz del mismo tipo con la longitud
combinada.
2. Luego usa el método .set(chunk, position) para copiar cada chunk uno tras otro en él.
5. Tenemos el resultado en chunksAll . Sin embargo, es una matriz de bytes, no un string.
Para crear un string, necesitamos interpretar estos bytes. El TextDecoder nativo hace exactamente eso. Luego podemos
usar el resultado en JSON.parse , si es necesario.
¿Qué pasa si necesitamos contenido binario en lugar de un string? Eso es aún más sencillo. Reemplaza los pasos 4 y 5
con una sola línea que crea un Blob de todos los fragmentos:
Al final tenemos el resultado (como un string o un blob, lo que sea conveniente) y el seguimiento del progreso en el proceso.
Una vez más, ten en cuenta que eso no es para el progreso de carga (hasta ahora eso no es posible con fetch ), solo para
el progreso de descarga.
Además, si el tamaño es desconocido, deberíamos chequear receivedLength en el bucle y cortarlo en cuanto alcance
cierto límite, así los chunks no agotarán la memoria.
Fetch: Abort
Como sabemos fetch devuelve una promesa. Y generalmente JavaScript no tiene un concepto de “abortar” una promesa.
Entonces, ¿cómo podemos abortar una llamada al método fetch ? Por ejemplo si las acciones del usuario en nuestro sitio
indican que fetch no se necesitará más.
Existe para esto de forma nativa un objeto especial: AbortController . Puede ser utilizado para abortar no solo fetch
sino otras tareas asincrónicas también.
39/220
Su uso es muy sencillo:
El objeto AbortController
Crear un controlador:
Como podemos ver, AbortController es simplemente la via para pasar eventos abort cuando abort() es llamado
sobre él.
Podríamos implementar alguna clase de escucha de evento en nuestro código por nuestra cuenta, sin el objeto
AbortController en absoluto.
Pero lo valioso es que fetch sabe cómo trabajar con el objeto AbortController , está integrado con él.
Para posibilitar la cancelación de fetch , pasa la propiedad signal de un AbortController como una opción de
fetch :
El método fetch conoce cómo trabajar con AbortController . Este escuchará eventos abort sobre signal .
controller.abort();
40/220
Cuando un fetch es abortado, su promesa es rechazada con un error AbortError , así podemos manejarlo, por ejemplo en
try..catch .
// Se abortara en un segundo
let controller = new AbortController();
setTimeout(() => controller.abort(), 1000);
try {
let response = await fetch('/article/fetch-abort/demo/hang', {
signal: controller.signal
});
} catch(err) {
if (err.name == 'AbortError') { // se maneja el abort()
alert("Aborted!");
} else {
throw err;
}
}
AbortController es escalable
Aquí hay un bosquejo de código que de muchos fetch de url en paralelo, y usa un simple controlador para abortarlos a
todos:
let urls = [...]; // una lista de urls para utilizar fetch en paralelo
// si controller.abort() es llamado,
// se abortaran todas las solicitudes fetch
En el caso de tener nuestras propias tareas asincrónicas aparte de fetch , podemos utilizar un único AbortController
para detenerlas junto con fetch.
Resumen
41/220
●
AbortController es un simple objeto que genera un evento abort sobre su propiedad signal cuando el método
abort() es llamado (y también establece signal.aborted en true ).
● fetch está integrado con él: pasamos la propiedad signal como opción, y entonces fetch la escucha, así se vuelve
posible abortar fetch .
●
Podemos usar AbortController en nuestro código. La interacción "llamar abort() " → "escuchar evento abort "
es simple y universal. Podemos usarla incluso sin fetch .
try {
await fetch('https://example.com');
} catch(err) {
alert(err); // Failed to fetch
}
Las solicitudes de origen cruzado Cross-origin requests (aquellas que son enviadas hacia otro dominio --incluso
subdominio–, protocolo o puerto), requieren de unas cabeceras especiales desde el sitio remoto.
Esta política es denominada “CORS”, por sus siglas en inglés Cross-Origin Resource Sharing.
Durante muchos años un script de un sitio no podía acceder al contenido de otro sitio.
Esta simple, pero poderosa regla, fue parte fundacional de la seguridad de Internet. Por ejemplo, un script malicioso desde el
sitio hacker.com no podía acceder a la casilla de correo en el sitio gmail.com . La gente se podía sentir segura.
Así mismo en ese momento, JavaScript no tenía ningún método especial para realizar solicitudes de red. Simplemente era
un lenguaje juguete para decorar páginas web.
Pero los desarrolladores web demandaron más poder. Una variedad de trucos fueron inventados para poder pasar por alto
las limitaciones, y realizar solicitudes a otros sitios.
Utilizando formularios
Una forma de comunicarse con otros servidores es y era utilizando un <form> . Se lo utilizaba para enviar el resultado hacia
un <iframe> , y de este modo mantenerse en el mismo sitio:
<!-- Un formulario puede ser generado de forma dinámica y ser enviado por JavaScript -->
<form target="iframe" method="POST" action="http://another.com/…">
...
</form>
Entonces, de este modo era posible realizar solicitudes GET/POST hacia otro sitio, incluso sin métodos de red, ya que los
formularios pueden enviar mensajes a cualquier sitio. Pero ya que no es posible acceder al contenido de un <iframe> de
otro sitio, esto evita que sea posible leer la respuesta.
Para ser precisos, en realidad había trucos para eso, requerían scripts especiales tanto en el iframe como en la página.
Entonces la comunicación con el iframe era técnicamente posible. Pero ya no hay necesidad de entrar en detalles, dejemos
a los dinosaurios descansar en paz.
Utilizando scripts
Otro truco es en el modo de utilizar la etiqueta script . Un script puede tener cualquier origen src , con cualquier dominio,
tal como <script src="http://another.com/…"> . De este modo es posible ejecutar un script de cualquier sitio web.
42/220
Si un sitio, por ejemplo, another.com requiere exponer datos con este tipo de acceso, se utilizaba el protocolo llamado en
ese entonces “JSONP (JSON con padding)” .
1. Primero, adelantándonos, creamos una función global para aceptar los datos, por ejemplo: gotWeather .
3. El servidor remoto another.com de forma dinámica genera un script que invoca el método gotWeather(...) con
los datos que nosotros necesitamos recibir.
4. Entonces el script remoto carga y es ejecutado, la función gotWeather se invoca, y ya que es nuestra función,
obtenemos los datos.
Esto funciona, y no viola la seguridad ya que ambos sitios acuerdan en intercambiar los datos de este modo. Y cuando
ambos lados concuerdan, definitivamente no se trata de un hackeo. Aún hay servicios que proveen este tipo de acceso, lo
que puede ser útil ya que funciona en navegadores obsoletos.
Solicitudes seguras
1. Solicitudes seguras.
2. Todas las demás.
Las solicitudes seguras son más fáciles de hacer, comencemos con ellas.
Una solicitud es segura si cumple dos condiciones:
Cualquier otra solicitud es considerada “insegura”. Por lo tanto, una solicitud con el método PUT o con una cabecera HTTP
API-Key no cumple con las limitaciones.
43/220
La diferencia esencial es que una solicitud segura puede ser realizada mediante un <form> o un <script> , sin la
necesidad de utilizar un método especial.
Por lo tanto, incluso un servidor obsoleto debería ser capaz de aceptar una solicitud segura.
Contrario a esto, las solicitudes con cabeceras no estándar o métodos como el DELETE no pueden ser creados de este
modo. Durante mucho tiempo no fue posible para JavaScript realizar este tipo de solicitudes. Por lo que un viejo servidor
podía asumir que ese tipo de solicitudes provenía desde una fuente privilegiada, “ya que una página web es incapaz de
enviarlas”.
Cuando intentamos realizar una solicitud insegura, el navegador envía una solicitud especial de “pre-vuelo” consultando al
servidor: ¿está de acuerdo en aceptar tal solicitud de origen cruzado o no?
Y, salvo que el servidor lo confirme de forma explícita, cualquier solicitud insegura no es enviada.
Si una solicitud es de origen cruzado, el navegador siempre le agregará una cabecera Origin .
GET /request
Host: anywhere.com
Origin: https://javascript.info
...
Tal como se puede ver, la cabecera Origin contiene exactamente el origen (protocolo/dominio/puerto), sin el path.
El servidor puede inspeccionar el origen Origin y, si esta de acuerdo en aceptar ese tipo de solicitudes, agrega una
cabecera especial Access-Control-Allow-Origin a la respuesta. Esta cabecera debe contener el origen permitido
(en nuestro caso https://javascript.info ), o un asterisco * . En ese caso la respuesta es satisfactoria, de otro
modo falla.
El navegador cumple el papel de mediador de confianza:
1. Ante una solicitud de origen cruzado, se asegura de que se envíe el origen correcto.
2. Chequea que la respuesta contenga la cabecera Access-Control-Allow-Origin , de ser así JavaScript tiene
permitido acceder a la respuesta, de no ser así la solicitud falla con un error.
fetch()
Solicitud HTTP
Origin: https://javascript.info
Respuesta HTTP
Access-Control-Allow-Origin: *
(or https://javascript.info)
si el encabezado lo permite, entonces éxito
de lo contrario fallo
200 OK
Content-Type:text/html; charset=UTF-8
Access-Control-Allow-Origin: https://javascript.info
44/220
Cabeceras de respuesta
Para las respuestas de origen cruzado, por defecto JavaScript sólo puede acceder a las cabeceras llamadas “seguras”:
●
Cache-Control
● Content-Language
●
Content-Length
● Content-Type
●
Expires
●
Last-Modified
● Pragma
200 OK
Content-Type:text/html; charset=UTF-8
Content-Length: 12345
Content-Encoding: gzip
API-Key: 2c9de507f2c54aa1
Access-Control-Allow-Origin: https://javascript.info
Access-Control-Expose-Headers: Content-Encoding,API-Key
Con tal cabecera, Access-Control-Expose-Headers , el script tendrá permitido acceder a los valores de las cabeceras
Content-Encoding y API-Key de la respuesta.
Solicitudes “inseguras”
Podemos utilizar cualquier método HTTP: no únicamente GET/POST , sino también PATCH , DELETE y otros.
Hace algún tiempo nadie podía siquiera imaginar que un sitio web pudiera realizar ese tipo de solicitudes. Por lo que aún
existen servicios web que cuando reciben un método no estándar los consideran como una señal de que: “Del otro lado no
hay un navegador”. Ellos pueden tener en cuenta esto cuando revisan los derechos de acceso.
Por lo tanto, para evitar malentendidos, cualquier solicitud “insegura” (Estas que no podían ser realizadas en los viejos
tiempos), no será realizada por el navegador en forma directa. Antes, enviará una solicitud preliminar llamada solicitud de
“pre-vuelo”, solicitando que se le concedan los permisos.
Una solicitud de “pre-vuelo” utiliza el método OPTIONS , sin contenido en el cuerpo y con tres cabeceras:
● Access-Control-Request-Method , cabecera que contiene el método de la solicitud “insegura”.
●
Access-Control-Request-Headers provee una lista separada por comas de las cabeceras inseguras de la
solicitud.
●
Origin cabecera que informa de dónde viene la solicitud. (como https://javascript.info )
Si el servidor está de acuerdo con lo solicitado, entonces responderá con el código de estado 200 y un cuerpo vacío:
●
Access-Control-Allow-Origin debe ser * o el origen de la solicitud, tal como https://javascript.info ,
para permitir el acceso.
●
Access-Control-Allow-Methods contiene el método permitido.
●
Access-Control-Allow-Headers contiene un listado de las cabeceras permitidas.
● Además, la cabecera Access-Control-Max-Age puede especificar el número máximo de segundos que puede
recordar los permisos. Por lo que el navegador no necesita volver a requerirlos en las próximas solicitudes.
45/220
JavaScript Navegador Servidor
fetch()
OPTIONS
antes del lanzamiento 1
Origin
Access-Control-Request-Method
Access-Control-Request-Headers
200 OK
Access-Control-Allow-Origin 2
Access-Control-Allow-Method
Access-Control-Allow-Headers
Access-Control-Max-Age
Vamos a ver cómo funciona paso a paso, mediante un ejemplo para una solicitud de origen cruzado PATCH (este método
suele utilizarse para actualizar datos):
Hay tres motivos por los cuales esta solicitud no es segura (una es suficiente):
●
Método PATCH
● Content-Type no es del tipo: application/x-www-form-urlencoded , multipart/form-data ,
text/plain .
● Cabecera API-Key “insegura”.
OPTIONS /service.json
Host: site.com
Origin: https://javascript.info
Access-Control-Request-Method: PATCH
Access-Control-Request-Headers: Content-Type,API-Key
●
Método: OPTIONS .
●
El path – exactamente el mismo que el de la solicitud principal: /service.json .
● Cabeceras especiales de origen cruzado (Cross-origin):
●
Origin – el origen de la fuente.
●
Access-Control-Request-Method – método solicitado.
●
Access-Control-Request-Headers – listado separado por comas de las cabeceras “inseguras”.
46/220
El servidor debe responder con el código de estado 200 y las cabeceras:
●
Access-Control-Allow-Origin: https://javascript.info
● Access-Control-Allow-Methods: PATCH
●
Access-Control-Allow-Headers: Content-Type,API-Key .
Por ejemplo, esta respuesta habilita además los métodos PUT , DELETE y otras cabeceras:
200 OK
Access-Control-Allow-Origin: https://javascript.info
Access-Control-Allow-Methods: PUT,PATCH,DELETE
Access-Control-Allow-Headers: API-Key,Content-Type,If-Modified-Since,Cache-Control
Access-Control-Max-Age: 86400
Ahora el navegador puede ver que PATCH se encuentra dentro de la cabecera Access-Control-Allow-Methods y
Content-Type,API-Key dentro de la lista Access-Control-Allow-Headers , por lo que permitirá enviar la solicitud
principal.
Si se encuentra con una cabecera Access-Control-Max-Age con determinada cantidad de segundos, entonces los
permisos son almacenados en el caché por ese determinado tiempo. La solicitud anterior será cacheada por 86400
segundos (un día). Durante ese marco de tiempo, las solicitudes siguientes no requerirán la solicitud de pre-vuelo.
Asumiendo que están dentro de lo permitido en la respuesta cacheada, serán enviadas de forma directa.
PATCH /service.json
Host: site.com
Content-Type: application/json
API-Key: secret
Origin: https://javascript.info
Access-Control-Allow-Origin: https://javascript.info
Credenciales
Una solicitud de origen cruzado realizada por código JavaScript, por defecto no provee ningún tipo de credenciales (cookies
o autenticación HTTP).
Esto es poco común para solicitudes HTTP. Usualmente una solicitud a un sitio http://site.com es acompañada por
todas las cookies de ese dominio. Pero una solicitud de origen cruzado realizada por métodos de JavaScript son una
excepción.
Por ejemplo, fetch('http://another.com') no enviará ninguna cookie, ni siquiera (!) esas que pertenecen al dominio
another.com .
47/220
¿Por qué?
El motivo de esto es que una solicitud con credenciales es mucho más poderosa que sin ellas. Si se permitiera, esto
garantizaría a JavaScript el completo poder de actuar en representación del usuario y de acceder a información sensible
utilizando sus credenciales.
¿En verdad el servidor confía lo suficiente en el script? En ese caso el servidor debera enviar explicitamente que permite
solicitudes con credenciales mediante otra cabecera especial.
Para permitir el envío de credenciales en fetch , necesitamos agregar la opción credentials: "include" , de este
modo:
fetch('http://another.com', {
credentials: "include"
});
Ahora fetch envía cookies originadas desde another.com con las solicitudes a ese sitio.
Si el servidor está de acuerdo en aceptar solicitudes con credenciales, debe agregar la cabecera Access-Control-
Allow-Credentials: true a la respuesta, además de Access-Control-Allow-Origin .
Por ejemplo:
200 OK
Access-Control-Allow-Origin: https://javascript.info
Access-Control-Allow-Credentials: true
Cabe destacar que: Access-Control-Allow-Origin no se puede utilizar con un asterisco * para solicitudes con
credenciales. Tal como se muestra a arriba debe proveer el origen exacto. Esto es una medida adicional de seguridad, para
asegurar de que el servidor conozca exactamente en quién confiar para que le envíe este tipo de solicitudes.
Resumen
Desde el punto de vista del navegador, existen dos tipos de solicitudes de origen cruzado: solicitudes “seguras” y todas las
demás.
La diferencia esencial es que las solicitudes seguras eran posibles desde los viejos tiempos utilizando las etiquetas <form>
o <script> , mientras que las solicitudes “inseguras” fueron imposibles para el navegador durante mucho tiempo.
Por lo tanto, en la práctica, la diferencia se encuentra en que las solicitudes seguras son realizadas de forma directa,
utilizando la cabecera Origin , mientras que para las otras el navegador realiza una solicitud extra de “pre-vuelo” para
requerir la autorización.
Adicionalmente, para garantizar a JavaScript acceso a cualquier cabecera de la respuesta, con excepción de Cache-
Control , Content-Language , Content-Type , Expires , Last-Modified o Pragma , el servidor debe
48/220
agregarlas como permitidas en la lista de la cabecera Access-Control-Expose-Headers .
Para solicitudes inseguras, se utiliza una solicitud preliminar “pre-vuelo” antes de la solicitud principal:
●
→ El navegador envía una solicitud del tipo OPTIONS a la misma URL, con las cabeceras:
●
Access-Control-Request-Method con el método requerido.
●
Access-Control-Request-Headers listado de las cabeceras inseguras.
●
← El servidor debe responder con el código de estado 200 y las cabeceras:
● Access-Control-Allow-Methods con la lista de todos los métodos permitidos,
●
Access-Control-Allow-Headers con una lista de cabeceras permitidas,
●
Access-Control-Max-Age con los segundos en los que se podrá almacenar la autorización en caché.
● Tras lo cual la solicitud es enviada, y se aplica el esquema previo “seguro”.
Tareas
Como seguramente ya sepas, existe la cabecera HTTP Referer , la cual por lo general contiene la url del sitio que generó
la solicitud.
Accept: */*
Accept-Charset: utf-8
Accept-Encoding: gzip,deflate,sdch
Connection: keep-alive
Host: google.com
Origin: http://javascript.info
Referer: http://javascript.info/alguna/url
Tal como se puede ver, tanto Referer como Origin están presentes.
Las preguntas:
1. ¿Por qué la cabecera Origin es necesaria, si Referer contiene incluso más información?
2. ¿Es posible que no se incluya Referer u Origin , o que contengan datos incorrectos?
A solución
Fetch API
Hasta ahora, sabemos bastante sobre fetch .
Aún así, es bueno saber lo que puede hacer fetch , por lo que si surge la necesidad, puedes regresar y leer los
detalles.
Aquí está la lista completa de todas las posibles opciones de fetch con sus valores predeterminados (alternativas en los
comentarios):
49/220
// dependiendo del cuerpo de la solicitud
"Content-Type": "text/plain;charset=UTF-8"
},
body: undefined, // string, FormData, Blob, BufferSource, o URLSearchParams
referrer: "about:client", // o "" para no enviar encabezado de Referrer,
// o una URL del origen actual
referrerPolicy: "strict-origin-when-cross-origin", // no-referrer-when-downgrade, no-referrer, origin, same-origin...
mode: "cors", // same-origin, no-cors
credentials: "same-origin", // omit, include
cache: "default", // no-store, reload, no-cache, force-cache, o only-if-cached
redirect: "follow", // manual, error
integrity: "", // un hash, como "sha256-abcdef1234567890"
keepalive: false, // true
signal: undefined, // AbortController para cancelar la solicitud
window: window // null
});
referrer, referrerPolicy
Por lo general, ese encabezado se establece automáticamente y contiene la URL de la página que realizó la solicitud. En la
mayoría de los escenarios, no es importante en absoluto, a veces, por motivos de seguridad, tiene sentido eliminarlo o
acortarlo.
La opción referrer permite establecer cualquier Referer (dentro del origen actual) o eliminarlo.
fetch('/page', {
referrer: "" // sin encabezado Referrer
});
fetch('/page', {
// asumiendo que estamos en https://javascript.info
// podemos establecer cualquier encabezado Referer, pero solo dentro del origen actual
referrer: "https://javascript.info/anotherpage"
});
A diferencia de la opción referrer que permite establecer el valor exacto de Referer , referrerPolicy indica al
navegador las reglas generales para cada tipo de solicitud.
50/220
"origin" – solo envía el origen en Referer , no la URL de la página completa. Por ejemplo, solo
●
http://site.com en lugar de http://site.com/path .
●
"origin-when-cross-origin" – envía el Referrer completo al mismo origen, pero solo la parte de origen para
solicitudes cross-origin (como se indica arriba).
●
"same-origin" – envía un Referer completo al mismo origen, pero no un Referer para solicitudes cross-origin.
●
"strict-origin" – envía solo el origen, no envía Referer para solicitudes HTTPS→HTTP.
●
"unsafe-url" – envía siempre la URL completa en Referer , incluso para solicitudes HTTPS→HTTP.
"no-referrer" - - -
"same-origin" completo - -
Digamos que tenemos una zona de administración con una estructura de URL que no debería conocerse desde fuera del
sitio.
Si enviamos un fetch , entonces de forma predeterminada siempre envía el encabezado Referer con la URL completa
de nuestra página (excepto cuando solicitamos de HTTPS a HTTP, entonces no hay Referer ).
Si queremos que otros sitios web solo conozcan la parte del origen, no la ruta de la URL, podemos configurar la opción:
fetch('https://another.com/page', {
// ...
referrerPolicy: "origin-when-cross-origin" // Referer: https://javascript.info
});
Podemos ponerlo en todas las llamadas fetch , tal vez integrarlo en la biblioteca JavaScript de nuestro proyecto que hace
todas las solicitudes y que usa fetch por dentro.
Su única diferencia en comparación con el comportamiento predeterminado es que para las solicitudes a otro origen, fetch
envía solo la parte de origen de la URL (por ejemplo, https://javascript.info , sin ruta). Para las solicitudes a
nuestro origen, todavía obtenemos el Referer completo (quizás útil para fines de depuración).
En particular, es posible establecer la política predeterminada para toda la página utilizando el encabezado HTTP
Referrer-Policy , o por enlace, con <a rel="noreferrer"> .
mode
Esta opción puede ser útil cuando la URL de fetch proviene de un tercero y queremos un “interruptor de apagado” para
limitar las capacidades cross-origin.
51/220
credentials
La opción credentials especifica si fetch debe enviar cookies y encabezados de autorización HTTP con la solicitud.
● "same-origin" – el valor predeterminado, no enviar solicitudes cross-origin,
●
"include" – enviar siempre, requiere Access-Control-Allow-Credentials del servidor cross-origin para que
JavaScript acceda a la respuesta, que se cubrió en el capítulo Fetch: Cross-Origin Requests,
● "omit" – nunca enviar, incluso para solicitudes del mismo origen.
cache
De forma predeterminada, las solicitudes fetch utilizan el almacenamiento en caché HTTP estándar. Es decir, respeta los
encabezados Expires , Cache-Control , envía If-Modified-Since , y así sucesivamente. Al igual que lo hacen las
solicitudes HTTP habituales.
redirect
Normalmente, fetch sigue de forma transparente las redirecciones HTTP, como 301, 302, etc.
integrity
Como se describe en la especificación , las funciones hash admitidas son SHA-256, SHA-384 y SHA-512. Puede haber
otras dependiendo de un navegador.
Por ejemplo, estamos descargando un archivo y sabemos que su checksum SHA-256 es “abcdef” (un checksum real es más
largo, por supuesto).
fetch('http://site.com/file', {
integrity: 'sha256-abcdef'
});
Luego, fetch calculará SHA-256 por sí solo y lo comparará con nuestro string. En caso de discrepancia, se activa un error.
keepalive
La opción keepalive indica que la solicitud puede “vivir más allá” de la página web que la inició.
52/220
Por ejemplo, recopilamos estadísticas sobre cómo el visitante actual usa nuestra página (clics del mouse, fragmentos de
página que ve), para analizar y mejorar la experiencia del usuario.
Cuando el visitante abandona nuestra página, nos gustaría guardar los datos en nuestro servidor.
window.onunload = function() {
fetch('/analytics', {
method: 'POST',
body: "statistics",
keepalive: true
});
};
Normalmente, cuando se descarga un documento, se cancelan todas las solicitudes de red asociadas. Pero la opción
keepalive le dice al navegador que realice la solicitud en segundo plano, incluso después de salir de la página. Por tanto,
esta opción es fundamental para que nuestra solicitud tenga éxito.
Tiene algunas limitaciones:
●
No podemos enviar megabytes: el límite de cuerpo para las solicitudes keepalive es de 64 KB.
●
Si necesitamos recopilar muchas estadísticas sobre la visita, deberíamos enviarlas regularmente en paquetes, de modo
que no quede mucho para la última solicitud onunload .
●
Este límite se aplica a todas las solicitudes keepalive juntas. En otras palabras, podemos realizar múltiples
solicitudes keepalive en paralelo, pero la suma de las longitudes de sus cuerpos no debe exceder los 64 KB.
●
No podemos manejar la respuesta del servidor si el documento no está cargado. Entonces, en nuestro ejemplo, fetch
tendrá éxito debido a keepalive , pero las funciones posteriores no funcionarán.
● En la mayoría de los casos, como enviar estadísticas, no es un problema, ya que el servidor simplemente acepta los
datos y generalmente envía una respuesta vacía a tales solicitudes.
Objetos URL
La clase URL incorporada brinda una interfaz conveniente para crear y analizar URLs.
No hay métodos de networking que requieran exactamente un objeto URL , los strings son suficientemente buenos para eso.
Así que técnicamente no tenemos que usar URL . Pero a veces puede ser realmente útil.
●
url – La URL completa o ruta única (si se establece base, mira a continuación),
●
base – una URL base opcional: si se establece y el argumento url solo tiene una ruta, entonces la URL se genera
relativa a base .
Por ejemplo:
alert(url1); // https://javascript.info/profile/admin
alert(url2); // https://javascript.info/profile/admin
Fácilmente podemos crear una nueva URL basada en la ruta relativa a una URL existente:
53/220
let url = new URL('https://javascript.info/profile/admin');
let newUrl = new URL('tester', url);
alert(newUrl); // https://javascript.info/profile/tester
El objeto URL inmediatamente nos permite acceder a sus componentes, por lo que es una buena manera de analizar la url,
por ej.:
alert(url.protocol); // https:
alert(url.host); // javascript.info
alert(url.pathname); // /url
href
origin
host
●
href es la url completa, igual que url.toString()
●
protocol acaba con el carácter dos puntos :
● search – un string de parámetros, comienza con el signo de interrogación ?
●
hash comienza con el carácter de hash #
● También puede haber propiedades user y password si la autenticación HTTP esta presente:
http://login:[email protected] (no mostrados arriba, raramente usados)
Podemos pasar objetos URL a métodos de red (y la mayoría de los demás) en lugar de un string
Podemos usar un objeto URL en fetch o XMLHttpRequest , casi en todas partes donde se espera un URL-string.
Generalmente, un objeto URL puede pasarse a cualquier método en lugar de un string, ya que la mayoría de métodos
llevarán a cabo la conversión del string, eso convierte un objeto URL en un string con URL completa.
Digamos que queremos crear una url con determinados parámetros de búsqueda, por ejemplo,
https://google.com/search?query=JavaScript .
new URL('https://google.com/search?query=JavaScript')
…Pero los parámetros necesitan estar codificados si contienen espacios, letras no latinas, entre otros (Más sobre eso
debajo).
Por lo que existe una propiedad URL para eso: url.searchParams , un objeto de tipo URLSearchParams .
54/220
●
getAll(name) – obtiene todos los parámetros con el mismo name (Eso es posible, por ej. ?
user=John&user=Pete ),
●
has(name) – comprueba la existencia del parámetro por name ,
●
set(name, value) – establece/reemplaza el parámetro,
● sort() – ordena parámetros por name , raramente necesitado,
●
…y además es iterable, similar a Map .
alert(url); // https://google.com/search?q=test+me%21
Codificación
Existe un estándar RFC3986 que define cuales caracteres son permitidos en URLs y cuales no.
Esos que no son permitidos, deben ser codificados, por ejemplo letras no latinas y espacios – reemplazados con sus códigos
UTF-8, con el prefijo % , tal como %20 (un espacio puede ser codificado con + , por razones históricas, pero esa es una
excepción).
La buena noticia es que los objetos URL manejan todo eso automáticamente. Nosotros sólo proporcionamos todos los
parámetros sin codificar, y luego convertimos la URL a string:
url.searchParams.set('key', 'ъ');
alert(url); //https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82?key=%D1%8A
Como puedes ver, ambos Тест en la ruta url y ъ en el parámetro están codificados.
La URL se alarga, ya que cada letra cirílica es representada con dos bytes en UTF-8, por lo que hay dos entidades %.. .
Codificando strings
En los viejos tiempos, antes de que los objetos URL aparecieran, la gente usaba strings para las URL.
A partir de ahora, los objetos URL son frecuentemente más convenientes, pero también aún pueden usarse los strings. En
muchos casos usando un string se acorta el código.
Aunque si usamos un string, necesitamos codificar/decodificar caracteres especiales manualmente.
Una pregunta natural es: "¿Cuál es la diferencia entre encodeURIComponent y encodeURI ?¿Cuándo deberíamos usar
una u otra?
Eso es fácil de entender si miramos a la URL, que está separada en componentes en la imagen de arriba:
55/220
https://site.com:8080/path/page?p1=v1&p2=v2#hash
Como podemos ver, caracteres tales como : , ? , = , & , # son admitidos en URL.
…Por otra parte, si miramos a un único componente URL, como un parámetro de búsqueda, estos caracteres deben estar
codificados, para no romper el formateo.
● encodeURI Codifica solo caracteres que están totalmente prohibidos en URL
●
encodeURIComponent Codifica los mismos caracteres, y, en adición a ellos, los caracteres # , $ , & , + , , , / , : ,
;, =, ? y @.
alert(url); // http://site.com/%D0%BF%D1%80%D0%B8%D0%B2%D0%B5%D1%82
Como podemos ver, encodeURI no codifica & , ya que este es un carácter legítimo en la URL como un todo.
Pero debemos codificar & dentro de un parámetro de búsqueda, de otra manera, obtendremos q=Rock&Roll - que es
realmente q=Rock más algún parámetro Roll oscuro. No según lo previsto.
Así que debemos usar solo encodeURIComponent para cada parámetro de búsqueda, para insertarlo correctamente en el
string URL. Lo más seguro es codificar tanto nombre como valor, a menos que estemos absolutamente seguros de que solo
haya admitido caracteres
Existen algunas diferencias, por ej. las direcciones IPv6 se codifican de otra forma:
alert(encodeURI(url)); // http://%5B2607:f8b0:4005:802::1007%5D/
alert(new URL(url)); // http://[2607:f8b0:4005:802::1007]/
Como podemos ver, encodeURI reemplazó los corchetes [...] , eso es incorrecto, la razón es: las urls IPv6 no
existían en el tiempo de RFC2396 (August 1998).
Tales casos son raros, las funciones encode* mayormente funcionan bien.
XMLHttpRequest
XMLHttpRequest es un objeto nativo del navegador que permite hacer solicitudes HTTP desde JavaScript.
56/220
A pesar de tener la palabra “XML” en su nombre, se puede operar sobre cualquier dato, no solo en formato XML. Podemos
cargar y descargar archivos, dar seguimiento y mucho más.
Ahora hay un método más moderno fetch que en algún sentido hace obsoleto a XMLHttpRequest .
¿Te suena familiar? Si es así, está bien, adelante con XMLHttpRequest . De otra forma, por favor, dirígete a Fetch.
Lo básico
Por favor, toma en cuenta que la llamada a open , contrario a su nombre, no abre la conexión. Solo configura la solicitud,
pero la actividad de red solo empieza con la llamada del método send .
3. Enviar.
xhr.send([body])
Este método abre la conexión y envía ka solicitud al servidor. El parámetro adicional body contiene el cuerpo de la
solicitud.
Algunos métodos como GET no tienen un cuerpo. Y otros como POST usan el parámetro body para enviar datos al
servidor. Vamos a ver unos ejemplos de eso más tarde.
4. Escuchar los eventos de respuesta xhr .
xhr.onload = function() {
alert(`Cargado: ${xhr.status} ${xhr.response}`);
};
57/220
xhr.onerror = function() { // solo se activa si la solicitud no se puede realizar
alert(`Error de red`);
};
xhr.onprogress = function(event) {
if (event.lengthComputable) {
alert(`Recibidos ${event.loaded} de ${event.total} bytes`);
} else {
alert(`Recibidos ${event.loaded} bytes`); // sin Content-Length
}
};
xhr.onerror = function() {
alert("Solicitud fallida");
};
Una vez el servidor haya respondido, podemos recibir el resultado en las siguientes propiedades de xhr :
status
Código del estado HTTP (un número): 200 , 404 , 403 y así por el estilo, puede ser 0 en caso de una falla no HTTP.
statusText
Mensaje del estado HTTP (una cadena): usualmente OK para 200 , Not Found para 404 , Forbidden para 403 y así
por el estilo.
Si la solicitud no es realizada con éxito dentro del tiempo dado, se cancela y el evento timeout se activa.
58/220
Parámetros de búsqueda URL
Para agregar los parámetros a la URL, como ?nombre=valor , y asegurar la codificación adecuada, podemos utilizar
un objeto URL:
Tipo de respuesta
xhr.open('GET', '/article/xmlhttprequest/example/json');
xhr.responseType = 'json';
xhr.send();
Existen por razones históricas, para obtener ya sea una cadena o un documento XML. Hoy en día, debemos seleccionar
el formato en xhr.responseType y obtener xhr.response como se demuestra debajo.
Estados
XMLHttpRequest cambia entre estados a medida que avanza. El estado actual es accesible como xhr.readyState .
59/220
Podemos seguirlos usando el evento readystatechange :
xhr.onreadystatechange = function() {
if (xhr.readyState == 3) {
// cargando
}
if (xhr.readyState == 4) {
// solicitud finalizada
}
};
Puedes encontrar oyentes del evento readystatechange en código realmente viejo, está ahí por razones históricas,
había un tiempo cuando no existían load y otros eventos. Hoy en día los manipuladores load/error/progress lo
hacen obsoleto.
Abortando solicitudes
Solicitudes sincrónicas
Si en el método open el tercer parámetro async se asigna como false , la solicitud se hace sincrónicamente.
En otras palabras, la ejecución de JavaScript se pausa en el send() y se reanuda cuando la respuesta es recibida. Algo
como los comandos alert o prompt .
try {
xhr.send();
if (xhr.status != 200) {
alert(`Error ${xhr.status}: ${xhr.statusText}`);
} else {
alert(xhr.response);
}
} catch(err) { // en lugar de onerror
alert("Solicitud fallida");
}
Puede verse bien, pero las llamadas sincrónicas son rara vez utilizadas porque bloquean todo el JavaScript de la página
hasta que la carga está completa. En algunos navegadores se hace imposible hacer scroll. Si una llamada síncrona toma
mucho tiempo, el navegador puede sugerir cerrar el sitio web “colgado”.
Algunas capacidades avanzadas de XMLHttpRequest , como solicitar desde otro dominio o especificar un tiempo límite,
no están disponibles para solicitudes síncronas. Tampoco, como puedes ver, la indicación de progreso.
La razón de esto es que las solicitudes sincrónicas son utilizadas muy escasamente, casi nunca. No hablaremos más sobre
ellas.
Cabeceras HTTP
XMLHttpRequest permite tanto enviar cabeceras personalizadas como leer cabeceras de la respuesta.
setRequestHeader(name, value)
Asigna la cabecera de la solicitud con los valores name y value provistos.
60/220
Por ejemplo:
xhr.setRequestHeader('Content-Type', 'application/json');
Limitaciones de cabeceras
Muchas cabeceras se administran exclusivamente por el navegador, ej. Referer y Host . La lista completa está en la
especificación .
XMLHttpRequest no está permitido cambiarlos, por motivos de seguridad del usuario y la exactitud de la solicitud.
Una vez que una cabecera es asignada, ya está asignada. Llamadas adicionales agregan información a la cabecera, no
la sobreescriben.
Por ejemplo:
xhr.setRequestHeader('X-Auth', '123');
xhr.setRequestHeader('X-Auth', '456');
// la cabecera será:
// X-Auth: 123, 456
getResponseHeader(name)
Obtiene la cabecera de la respuesta con el name dado (excepto Set-Cookie y Set-Cookie2 ).
Por ejemplo:
xhr.getResponseHeader('Content-Type')
getAllResponseHeaders()
Devuelve todas las cabeceras de la respuesta, excepto por Set-Cookie y Set-Cookie2 .
Cache-Control: max-age=31536000
Content-Length: 4260
Content-Type: image/png
Date: Sat, 08 Sep 2012 16:53:16 GMT
El salto de línea entre las cabeceras siempre es un "\r\n" (independiente del SO), así podemos dividirlas en cabeceras
individuales. El separador entre el nombre y el valor siempre es dos puntos seguido de un espacio ": " . Eso quedó
establecido en la especificación.
Así, si queremos obtener un objeto con pares nombre/valor, necesitamos tratarlas con un poco de JS.
Como esto (asumiendo que si dos cabeceras tienen el mismo nombre, entonces el último sobreescribe al primero):
// headers['Content-Type'] = 'image/png'
61/220
POST, Formularios
Para hacer una solicitud POST, podemos utilizar el objeto FormData nativo.
La sintaxis:
let formData = new FormData([form]); // crea un objeto, opcionalmente se completa con un <form>
formData.append(name, value); // añade un campo
Lo creamos, opcionalmente lleno desde un formulario, append (agrega) más campos si se necesitan, y entonces:
Por ejemplo:
<form name="person">
<input name="name" value="John">
<input name="surname" value="Smith">
</form>
<script>
// pre llenado del objeto FormData desde el formulario
let formData = new FormData(document.forms.person);
// lo enviamos
let xhr = new XMLHttpRequest();
xhr.open("POST", "/article/xmlhttprequest/post/user");
xhr.send(formData);
Solo no te olvides de asignar la cabecera Content-Type: application/json , muchos frameworks del lado del
servidor decodifican automáticamente JSON con este:
xhr.open("POST", '/submit')
xhr.setRequestHeader('Content-type', 'application/json; charset=utf-8');
xhr.send(json);
El método .send(body) es bastante omnívoro. Puede enviar casi cualquier body , incluyendo objetos Blob y
BufferSource .
Progreso de carga
Esto es: si hacemos un POST de algo, XMLHttpRequest primero sube nuestros datos (el cuerpo de la respuesta),
entonces descarga la respuesta.
Si estamos subiendo algo grande, entonces seguramente estaremos interesados en rastrear el progreso de nuestra carga.
Pero xhr.onprogress no ayuda aquí.
62/220
Hay otro objeto, sin métodos, exclusivamente para rastrear los eventos de subida: xhr.upload .
Este genera eventos similares a xhr , pero xhr.upload se dispara solo en las subidas:
● loadstart – carga iniciada.
●
progress – se dispara periódicamente durante la subida.
●
abort – carga abortada.
● error – error no HTTP.
●
load – carga finalizada con éxito.
●
timeout – carga caducada (si la propiedad timeout está asignada).
● loadend – carga finalizada con éxito o error.
Ejemplos de manejadores:
xhr.upload.onprogress = function(event) {
alert(`Uploaded ${event.loaded} of ${event.total} bytes`);
};
xhr.upload.onload = function() {
alert(`Upload finished successfully.`);
};
xhr.upload.onerror = function() {
alert(`Error durante la carga: ${xhr.status}`);
};
<script>
function upload(file) {
let xhr = new XMLHttpRequest();
xhr.open("POST", "/article/xmlhttprequest/post/upload");
xhr.send(file);
}
</script>
XMLHttpRequest puede hacer solicitudes de origen cruzado, utilizando la misma política CORS que se solicita.
Tal como fetch , no envía cookies ni autorización HTTP a otro origen por omisión. Para activarlas, asigna
xhr.withCredentials como true :
xhr.open('POST', 'http://anywhere.com/request');
...
63/220
Ve el capítulo Fetch: Cross-Origin Requests para detalles sobre las cabeceras de origen cruzado.
Resumen
xhr.open('GET', '/my/url');
xhr.send();
xhr.onload = function() {
if (xhr.status != 200) { // error HTTP?
// maneja el error
alert( 'Error: ' + xhr.status);
return;
}
xhr.onprogress = function(event) {
// reporta progreso
alert(`Loaded ${event.loaded} of ${event.total}`);
};
xhr.onerror = function() {
// manejo de un error no HTTP (ej. red caída)
};
De hecho hay más eventos, la especificación moderna los lista (en el orden del ciclo de vida):
●
loadstart – la solicitud ha empezado.
● progress – un paquete de datos de la respuesta ha llegado, el cuerpo completo de la respuesta al momento está en
response .
●
abort – la solicitud ha sido cancelada por la llamada de xhr.abort() .
●
error – un error de conexión ha ocurrido, ej. nombre de dominio incorrecto. No pasa con errores HTTP como 404.
●
load – la solicitud se ha completado satisfactoriamente.
● timeout – la solicitud fue cancelada debido a que caducó (solo pasa si fue configurado).
●
loadend – se dispara después de load , error , timeout o abort .
Los eventos error , abort , timeout , y load son mutuamente exclusivos. Solo uno de ellos puede pasar.
Los eventos más usados son la carga terminada ( load ), falla de carga ( error ), o podemos usar un solo manejador
loadend y comprobar las propiedades del objeto solicitado xhr para ver qué ha pasado.
Ya hemos visto otro evento: readystatechange . Históricamente, apareció hace mucho tiempo, antes de que la
especificación fuera publicada. Hoy en día no es necesario usarlo; podemos reemplazarlo con eventos más nuevos, pero
puede ser encontrado a menudo en scripts viejos.
Si necesitamos rastrear específicamente, entonces debemos escuchar a los mismos eventos en el objeto xhr.upload .
¿Cómo reanudar la carga de un archivo despues de perder la conexión? No hay una opción incorporada para eso, pero
tenemos las piezas para implementarlo.
Las cargas reanudables deberían venir con indicación de progreso, ya que esperamos archivos grandes (Si necesitamos
reanudar). Entonces, ya que fetch no permite rastrear el progreso de carga, usaremos XMLHttpRequest.
Para reanudar la carga, necesitamos saber cuánto fue cargado hasta la pérdida de la conexión.
64/220
Disponemos de xhr.upload.onprogress para rastrear el progreso de carga.
Desafortunadamente, esto no nos ayudará a reanudar la descarga, Ya que se origina cuando los datos son enviados, ¿pero
fue recibida por el servidor? el navegador no lo sabe.
Tal vez fue almacenada por un proxy de la red local, o quizá el proceso del servidor remoto solo murió y no pudo procesarla,
o solo se perdió en el medio y no alcanzó al receptor.
Es por eso que este evento solo es útil para mostrar una barra de progreso bonita.
Para reanudar una carga, necesitamos saber exactamente el número de bytes recibidos por el servidor. Y eso solo lo sabe el
servidor, por lo tanto haremos una solicitud adicional.
Algoritmos
1. Primero, crear un archivo id, para únicamente identificar el archivo que vamos a subir:
Eso es necesario para reanudar la carga, para decirle al servidor lo que estamos reanudando.
Si el nombre o tamaño de la última fecha de modificación cambia, entonces habrá otro fileId .
Esto asume que el servidor rastrea archivos cargados por el encabezado X-File-Id . Debe ser implementado en el lado
del servidor.
Si el archivo no existe aún en el servidor, entonces su respuesta debe ser 0 .
3. Entonces, podemos usar el método Blob slice para enviar el archivo desde startByte :
xhr.open("POST", "upload");
// El byte desde el que estamos reanudando, así el servidor sabe que estamos reanudando
xhr.setRequestHeader('X-Start-Byte', startByte);
Aquí enviamos al servidor ambos archivos id como X-File-Id , para que de esa manera sepa que archivos estamos
cargando, y el byte inicial como X-Start-Byte , para que sepa que no lo estamos cargando inicialmente, si no
reanudándolo.
El servidor debe verificar sus registros, y si hubo una carga de ese archivo, y si el tamaño de carga actual es exactamente
X-Start-Byte , entonces agregarle los datos.
Aquí esta la demostración con el código tanto del cliente como del servidor, escrito en Node.js.
Esto funciona solo parcialmente en este sitio, ya que Node.js esta detrás de otro servidor llamado Nginx, que almacena
cargas, pasándolas a Node.js cuando esta completamente lleno.
Pero puedes cargarlo y ejecutarlo localmente para la demostración completa:
65/220
https://plnkr.co/edit/jAV1UjbuOz4ZJSZr?p=preview
Como podemos ver, los métodos de red modernos estan cerca de los gestores de archivos en sus capacidades – control
sobre header, indicador de progreso, enviar partes de archivos, etc.
Podemos implementar la carga reanudable y mucho mas.
Sondeo largo
El “sondeo largo” es la forma más sencilla de tener una conexión persistente con el servidor. No utiliza ningún protocolo
específico como “WebSocket” o “SSE”.
Es muy fácil de implementar, y es suficientemente bueno en muchos casos.
Sondeo regular
La forma más sencilla de obtener información nueva desde el servidor es un sondeo periódico. Es decir, solicitudes regulares
al servidor: “Hola, estoy aquí, ¿tienes información para mí?”. Por ejemplo, una vez cada 10 segundos.
En respuesta, el servidor primero se da cuenta de que el cliente está en línea, y segundo, envía un paquete con los
mensajes que recibió hasta ese momento.
Esto funciona, pero tiene sus desventajas:
1. Los mensajes desde el servidor se transmiten con un retraso de hasta 10 segundos (el tiempo entre solicitudes de nuestro
ejemplo).
2. El servidor es bombardeado con solicitudes cada 10 segundos aunque no haya mensajes, incluso si el usuario cambió a
otro lugar o está dormido. En términos de rendimiento, esto es bastante difícil de manejar.
Entonces: si hablamos de un servicio muy pequeño, este enfoque es viable. Pero en general, se necesita algo mejor.
Sondeo largo
Esta situación, en la que el navegador envió una solicitud y se mantiene abierta una conexión con el servidor, es estándar
para este método. En cuanto se entrega un mensaje, la conexión se cierra y restablece.
Navegador
solicit
solicit
solicit
n
n
mació
mació
u
ud
ud
d
infor
infor
Si se pierde la conexión (debido a un error de red, por ejemplo), el navegador envía inmediatamente una nueva solicitud.
Este es el esquema, del lado del cliente, de una función de suscripción que realiza solicitudes largas:
66/220
if (response.status == 502) {
// El estado 502 es un error de "tiempo de espera agotado" en la conexión,
// puede suceder cuando la conexión estuvo pendiente durante demasiado tiempo,
// y el servidor remoto o un proxy la cerró
// vamos a reconectarnos
subscribe();
} else if (response.status != 200) {
// Un error : vamos a mostrarlo
showMessage(response.statusText);
// Vuelve a conectar en un segundo
await new Promise(resolve => setTimeout(resolve, 1000));
subscribe();
} else {
// Recibe y muestra el mensaje
let message = await response.text();
showMessage(message);
// Llama a subscribe () nuevamente para obtener el siguiente mensaje
subscribe();
}
}
subscribe();
Como puedes ver, la función subscribe realiza una búsqueda, espera la respuesta, la maneja, y se llama a sí misma
nuevamente.
Dicho esto, no es un problema del lenguaje sino de la implementación. La mayoría de los lenguajes modernos,
incluyendo PHP y Ruby, permiten la implementación de un backend adecuado. Por favor, asegúrate de que la
arquitectura del servidor funcione bien con múltiples conexiones simultáneas.
Demostración: un chat
Este es un chat de demostración, que también puedes descargar y ejecutar localmente (si estás familiarizado con Node.js y
puedes instalar módulos):
https://plnkr.co/edit/BN2crU323159RXIJ?p=preview
Área de uso
El sondeo largo funciona muy bien en situaciones en las que los mensajes son escasos.
Pero si los mensajes llegan con mucha frecuencia, entonces el gráfico de arriba, mensajes solicitados/recibidos, se vuelve
en forma de “diente de sierra”.
Cada mensaje es una solicitud separada: provista de encabezados, sobrecarga de autenticación, etc.
En este caso se prefieren otros métodos, como Websocket, o SSE (Eventos enviados por el servidor).
WebSocket
El protocolo WebSocket , descrito en la especificación RFC 6455 , brinda una forma de intercambiar datos entre el
navegador y el servidor por medio de una conexión persistente. Los datos pueden ser pasados en ambas direcciones como
paquetes “packets”, sin cortar la conexión y sin pedidos adicionales de HTTP “HTTP-requests”.
WebSocket es especialmente bueno para servicios que requieren intercambio de información continua, por ejemplo juegos
en línea, sistemas de negocios en tiempo real, entre otros.
67/220
Un ejemplo simple
Para abrir una conexión websocket, necesitamos crearla new WebSocket usando el protocolo especial ws en la url:
También hay una versión encriptada wss:// . Equivale al HTTPS para los websockets.
Esto es porque los datos en ws:// no están encriptados y son visibles para cualquier intermediario. Entonces los
servidores proxy viejos que no reconocen el protocolo WebSocket podrían interpretar los datos como cabeceras
“extrañas” y abortar la conexión.
En cambio wss:// es WebSocket sobre TLS (al igual que HTTPS es HTTP sobre TLS), la seguridad de la capa de
transporte encripta los datos en el envío y los desencripta en el destino. Así, los paquetes de datos pasan encriptados a
través de los proxy, estos servidores no pueden ver lo que hay dentro y los dejan pasar.
Una vez que el socket es creado, debemos escuchar los eventos que ocurren en él. Hay en total 4 eventos:
●
open – conexión establecida,
●
message – datos recibidos,
● error – error en websocket,
●
close – conexión cerrada.
Aquí un ejemplo:
socket.onopen = function(e) {
alert("[open] Conexión establecida");
alert("Enviando al servidor");
socket.send("Mi nombre es John");
};
socket.onmessage = function(event) {
alert(`[message] Datos recibidos del servidor: ${event.data}`);
};
socket.onclose = function(event) {
if (event.wasClean) {
alert(`[close] Conexión cerrada limpiamente, código=${event.code} motivo=${event.reason}`);
} else {
// ej. El proceso del servidor se detuvo o la red está caída
// event.code es usualmente 1006 en este caso
alert('[close] La conexión se cayó');
}
};
socket.onerror = function(error) {
alert(`[error]`);
};
Para propósitos de demostración, tenemos un pequeño servidor server.js, escrito en Node.js, ejecutándose para el ejemplo
de arriba. Este responde con “Hello from server, John”, espera 5 segundos, y cierra la conexión.
Eso es realmente todo, ya podemos conversar con WebSocket. Bastante simple, ¿no es cierto?
Abriendo un websocket
68/220
Cuando se crea new WebSocket(url) , comienza la conexión de inmediato.
Durante la conexión, el navegador (usando cabeceras o “header”) le pregunta al servidor: “¿Soportas Websockets?” y si si el
servidor responde “Sí”, la comunicación continúa en el protocolo WebSocket, que no es HTTP en absoluto.
Navegador Servidor
Solicitud HTTP
Respuesta HTTP
Ok!
Protocolo WebSocket
Aquí hay un ejemplo de cabeceras de navegador para una petición hecha por new
WebSocket("wss://javascript.info/chat") .
GET /chat
Host: javascript.info
Origin: https://javascript.info
Connection: Upgrade
Upgrade: websocket
Sec-WebSocket-Key: Iv8io/9s+lYFgZWcXczP8Q==
Sec-WebSocket-Version: 13
● Origin – La página de origen del cliente, ej. https://javascript.info . Los objetos WebSocket son cross-origin
por naturaleza. No existen las cabeceras especiales ni otras limitaciones. De cualquier manera los servidores viejos son
incapaces de manejar WebSocket, asi que no hay problemas de compatibilidad. Pero la cabecera Origin es importante,
pues habilita al servidor decidir si permite o no la comunicación WebSocket con el sitio web.
●
Connection: Upgrade – señaliza que el cliente quiere cambiar el protocolo.
●
Upgrade: websocket – el protocolo requerido es “websocket”.
● Sec-WebSocket-Key – una clave de aleatoria generada por el navegador, usada para asegurar que el servidor soporta
el protocolo WebSocket. Es aleatoria para evitar que servidores proxy almacenen en cache la comunicación que sigue.
●
Sec-WebSocket-Version – Versión del protocolo WebSocket, 13 es la actual.
Extensiones y subprotocolos
Puede tener las cabeceras adicionales Sec-WebSocket-Extensions y Sec-WebSocket-Protocol que describen
extensiones y subprotocolos.
69/220
Por ejemplo:
●
Sec-WebSocket-Extensions: deflate-frame significa que el navegador soporta compresión de datos. una
extensión es algo relacionado a la transferencia de datos, funcionalidad que extiende el protocolo WebSocket. La
cabecera Sec-WebSocket-Extensions es enviada automáticamente por el navegador, con la lista de todas las
extensiones que soporta.
●
Sec-WebSocket-Protocol: soap, wamp significa que queremos transferir no cualquier dato, sino datos en
protocolos SOAP o WAMP (“The WebSocket Application Messaging Protocol”). Los subprotocolos de WebSocket están
registrados en el catálogo IANA . Entonces, esta cabecera describe los formatos de datos que vamos a usar.
Esta cabecera opcional se establece usando el segundo parámetro de new WebSocket , que es el array de
subprotocolos. Por ejemplo, si queremos usar SOAP o WAMP:
El servidor debería responder con una lista de protocolos o extensiones que acepta usar.
Por ejemplo, la petición:
GET /chat
Host: javascript.info
Upgrade: websocket
Connection: Upgrade
Origin: https://javascript.info
Sec-WebSocket-Key: Iv8io/9s+lYFgZWcXczP8Q==
Sec-WebSocket-Version: 13
Sec-WebSocket-Extensions: deflate-frame
Sec-WebSocket-Protocol: soap, wamp
Respuesta:
Aquí el servidor responde que soporta la extensión “deflate-frame”, y únicamente SOAP de los subprotocolos solicitados.
Transferencia de datos
La comunicación WebSocket consiste de “frames” (cuadros) de fragmentos de datos, que pueden ser enviados de ambos
lados y pueden ser de varias clases:
●
“text frames” – contiene datos de texto que las partes se mandan entre sí.
●
“binary data frames” – contiene datos binarios que las partes se mandan entre sí.
●
“ping/pong frames” son usados para testear la conexión; enviados desde el servidor, el navegador responde
automáticamente.
● También existe “connection close frame”, y algunos otros frames de servicio.
Una llamada socket.send(body) permite en body datos en formato string o binarios, incluyendo Blob ,
ArrayBuffer , etc. No se requiere configuración: simplemente se envían en cualquier formato.
Cuando recibimos datos, el texto siempre viene como string. Y para datos binarios, podemos elegir entre los
formatos Blob y ArrayBuffer .
Esto se establece en la propiedad socket.binaryType , que es "blob" por defecto y entonces los datos binarios
vienen como objetos Blob .
70/220
Blob es un objeto binario de alto nivel que se integra directamente con <a> , <img> y otras etiquetas, así que es una
opción predeterminada saludable. Pero para procesamiento binario, para acceder a bytes individuales, podemos cambiarlo a
"arraybuffer" :
socket.binaryType = "arraybuffer";
socket.onmessage = (event) => {
// event.data puede ser string (si es texto) o arraybuffer (si es binario)
};
Limitaciones de velocidad
Supongamos que nuestra app está generando un montón de datos para enviar. Pero el usuario tiene una conexión de red
lenta, posiblemente internet móvil fuera de la ciudad.
Podemos llamar socket.send(data) una y otra vez. Pero los datos serán acumulados en memoria (en un “buffer”) y
enviados solamente tan rápido como la velocidad de la red lo permita.
La propiedad socket.bufferedAmount registra cuántos bytes quedan almacenados (“buffered”) hasta el momento
esperando a ser enviados a la red.
Podemos examinarla para ver si el “socket” está disponible para transmitir.
Cierre de conexión
Normalmente, cuando una parte quiere cerrar la conexión (servidor o navegador, ambos tienen el mismo derecho), envía un
“frame de cierre de conexión” con un código numérico y un texto con el motivo.
El método para eso es:
socket.close([code], [reason]);
●
code es un código especial de cierre de WebSocket (opcional)
● reason es un string que describe el motivo de cierre (opcional)
Entonces el manejador del evento close de la otra parte obtiene el código y el motivo, por ejemplo:
// la otra parte:
socket.onclose = event => {
// event.code === 1000
// event.reason === "Work complete"
// event.wasClean === true (clean close)
};
71/220
●
…y así.
Los códigos de WebSocket son como los que hay de HTTP, pero diferentes. En particular, los códigos menores a 1000 son
reservados, habrá un error si tratamos de establecerlos.
Estado de la conexión
Para obtener el estado (state) de la conexión, tenemos la propiedad socket.readyState con valores:
● 0 – “CONNECTING”: la conexión aún no fue establecida,
●
1 – “OPEN”: comunicando,
●
2 – “CLOSING”: la conexión se está cerrando,
●
3 – “CLOSED”: la conexión está cerrada.
Ejemplo Chat
Revisemos un ejemplo de chat usando la API WebSocket del navegador y el módulo WebSocket de Node.js
https://github.com/websockets/ws . Prestaremos atención al lado del cliente, pero el servidor es igual de simple.
HTML: necesitamos un <form> para enviar mensajes y un <div> para los mensajes entrantes:
Aquí el código:
socket.send(outgoingMessage);
return false;
};
72/220
El código de servidor está fuera de nuestro objetivo. Aquí usaremos Node.js, pero no necesitas hacerlo. Otras plataformas
también tienen sus formas de trabajar con WebSocket.
El algoritmo de lado de servidor será:
function onSocketConnect(ws) {
clients.add(ws);
ws.on('message', function(message) {
message = message.slice(0, 50); // la longitud máxima del mensaje será 50
ws.on('close', function() {
clients.delete(ws);
});
}
Send
Puedes descargarlo (botón arriba/derecha en el iframe) y ejecutarlo localmente. No olvides instalar Node.js y npm
install ws antes de hacerlo.
Resumen
La API es simple.
Métodos:
●
socket.send(data) ,
● socket.close([code], [reason]) .
Eventos:
●
open ,
● message ,
●
error ,
●
close .
73/220
El WebSocket por sí mismo no incluye reconexión, autenticación ni otros mecanismos de alto nivel. Hay librerías
cliente/servidor para eso, y también es posible implementar esas capacidades manualmente.
A veces, para integrar WebSocket a un proyecto existente, se ejecuta un servidor WebSocket en paralelo con el servidor
HTTP principal compartiendo la misma base de datos. Las peticiones a WebSocket usan wss://ws.site.com , un
subdominio que se dirige al servidor de WebSocket mientras que https://site.com va al servidor HTTP principal.
La especificación de los Eventos enviados por el servidor describe una clase incorporada EventSource , que mantiene
la conexión con el servidor y permite recibir eventos de él.
Similar a WebSocket , la conexión es persistente.
WebSocket EventSource
Bidireccional: tanto el cliente como el servidor pueden intercambiar mensajes Unidireccional: solo el servidor envía datos
EventSource es una forma menos poderosa de comunicarse con el servidor que WebSocket .
Necesitamos recibir un flujo de datos del servidor: tal vez mensajes de chat o precios de mercado, o lo que sea. Para eso es
bueno EventSource . También admite la reconexión automática, algo que debemos implementar manualmente con
WebSocket . Además, es HTTP común, no un protocolo nuevo.
Recibir mensajes
data: Mensaje 1
data: Mensaje 2
data: Mensaje 3
data: de dos líneas
● Un mensaje de texto va después de data: , el espacio después de los dos puntos es opcional.
●
Los mensajes están delimitados con saltos de línea dobles \n\n .
● Para enviar un salto de línea \n , podemos enviar inmediatamente un data: (tercer mensaje arriba) más.
En la práctica, los mensajes complejos generalmente se envían codificados en JSON. Los saltos de línea están codificados
así \n dentro de los mensajes, por lo que los mensajes data: multilínea no son necesarios.
Por ejemplo:
74/220
let eventSource = new EventSource("/events/subscribe");
eventSource.onmessage = function(event) {
console.log("Nuevo mensaje", event.data);
// registrará apuntes 3 veces para el flujo de datos anterior
};
// o eventSource.addEventListener('message', ...)
Solicitudes Cross-origin
EventSource admite solicitudes cross-origin, como fetch o cualquier otro método de red. Podemos utilizar cualquier
URL:
El servidor remoto obtendrá el encabezado Origin y debe responder con Access-Control-Allow-Origin para
continuar.
Para pasar las credenciales, debemos configurar la opción adicional withCredentials , así:
Consulte el capítulo Fetch: Cross-Origin Requests para obtener más detalles sobre los encabezados cross-origin.
Reconexión
Tras la creación con new EventSource , el cliente se conecta al servidor y, si la conexión se interrumpe, se vuelve a
conectar.
Eso es muy conveniente, ya que no tenemos que preocuparnos por eso.
Hay un pequeño retraso entre las reconexiones, unos segundos por defecto.
El servidor puede establecer la demora recomendada usando retry: dentro de la respuesta (en milisegundos):
retry: 15000
data: Hola, configuré el retraso de reconexión en 15 segundos
El retry: puede venir junto con algunos datos, o como un mensaje independiente.
El navegador debe esperar esa cantidad de milisegundos antes de volver a conectarse. O más, por ejemplo: si el navegador
sabe (desde el sistema operativo) que no hay conexión de red en este momento, puede esperar hasta que aparezca la
conexión y luego volver a intentarlo.
● Si el servidor desea que el navegador deje de volver a conectarse, debería responder con el estado HTTP 204.
●
Si el navegador quiere cerrar la conexión, debe llamar a eventSource.close() :
eventSource.close();
Además, no habrá reconexión si la respuesta tiene un Content-Type incorrecto o su estado HTTP difiere de 301, 307,
200 y 204. En tales casos, se emitirá el evento "error" y el navegador no se volverá a conectar.
ID del mensaje
75/220
Cuando una conexión se interrumpe debido a problemas de red, ninguna de las partes puede estar segura de qué mensajes
se recibieron y cuáles no.
Para reanudar correctamente la conexión, cada mensaje debe tener un campo id , así:
data: Mensaje 1
id: 1
data: Mensaje 2
id: 2
data: Mensaje 3
data: de dos líneas
id: 3
El objeto EventSource tiene la propiedad readyState , que tiene uno de tres valores:
Tipos de eventos
El servidor puede especificar otro tipo de evento con event: ... al inicio del evento.
Por ejemplo:
event: join
data: Bob
data: Hola
event: leave
data: Bob
76/220
eventSource.addEventListener('message', event => {
alert(`Dijo: ${event.data}`);
});
Ejemplo completo
Aquí está el servidor que envía mensajes con 1 , 2 , 3 , luego bye y cierra la conexión.
Resumen
El objeto EventSource establece automáticamente una conexión persistente y permite al servidor enviar mensajes a
través de él.
Ofrece:
●
Reconexión automática, con tiempo de espera de reintento ajustable.
● IDs en cada mensaje para reanudar los eventos, el último identificador recibido se envía en el encabezado Last-
Event-ID al volver a conectarse.
●
El estado actual está en la propiedad readyState .
Eso hace que EventSource sea una alternativa viable a WebSocket , ya que es de un nivel más bajo y carece de esas
características integradas (aunque se pueden implementar).
En muchas aplicaciones de la vida real, el poder de EventSource es suficiente.
El segundo argumento tiene solo una opción posible: {withCredentials: true} , permite enviar credenciales de cross-
origin.
La seguridad general de cross-origin es la misma que para fetch y otros métodos de red.
readyState
El estado de conexión actual: EventSource.CONNECTING (=0) , EventSource.OPEN (=1) o
EventSource.CLOSED (=2) .
lastEventId
El último id recibido. Tras la reconexión, el navegador lo envía en el encabezado Last-Event-ID .
Métodos
close()
Cierra la conexión.
Eventos
message
Mensaje recibido, los datos están en event.data .
open
Se establece la conexión.
77/220
error
En caso de error, se incluyen tanto la pérdida de conexión (se reconectará automáticamente) como los errores fatales.
Podemos comprobar readyState para ver si se está intentando la reconexión.
El servidor puede establecer un nombre de evento personalizado en event: . Tales eventos deben manejarse usando
addEventListener , no on<evento> .
Un mensaje puede incluir uno o más campos en cualquier orden, pero id: suele ser el último.
Las cookies son pequeñas cadenas de datos que se almacenan directamente en el navegador. Son parte del protocolo
HTTP, definido por la especificación RFC 6265 .
Las cookies son usualmente establecidos por un servidor web utilizando la cabecera de respuesta HTTP Set-Cookie .
Entonces, el navegador los agrega automáticamente a (casi) toda solicitud del mismo dominio usando la cabecera HTTP
Cookie .
1. Al iniciar sesión, el servidor usa la cabecera HTTP Set-Cookie en respuesta para establecer una cookie con un
“identificador de sesión” único.
2. Al enviar la siguiente solicitud al mismo dominio, el navegador envía la cookie usando la cabecera HTTP Cookie .
3. Así el servidor sabe quién hizo la solicitud.
También podemos acceder a las cookies desde el navegador usando la propiedad document.cookie .
Hay muchas cosas intrincadas acerca de las cookies y sus opciones. En este artículo las vamos a ver en detalle.
Leyendo a document.cookie
Asumiendo que estás en un sitio web, es posible ver sus cookies así:
El valor de document.cookie consiste de pares name=value delimitados por ; . Cada uno es una cookie separada.
Para encontrar una cookie particular, podemos separar (split) document.cookie por ; y encontrar el nombre correcto.
Podemos usar tanto una expresión regular como funciones de array para ello.
Lo dejamos como ejercicio para el lector. Al final del artículo encontrarás funciones de ayuda para manipular cookies.
Escribiendo en document.cookie
Podemos escribir en document.cookie . Pero no es una propiedad de datos, es un accessor (getter/setter). Una
asignación a él se trata especialmente.
Una operación de escritura a document.cookie actualiza solo las cookies mencionadas en ella, y no toca las
demás.
78/220
Por ejemplo, este llamado establece una cookie con el nombre user y el valor John :
Si lo ejecutas, probablemente verás múltiples cookies. Esto es porque la operación document.cookie= no sobrescribe
todas las cookies. Solo configura la cookie mencionada user .
Técnicamente, nombre y valor pueden tener cualquier carácter. Pero para mantener un formato válido, los caracteres
especiales deben escaparse usando la función integrada encodeURIComponent :
Limitaciones
Hay algunas limitaciones:
●
El par name=value , después de encodeURIComponent , no debe exceder 4KB. Así que no podemos almacenar
algo enorme en una cookie.
● La cantidad total de cookies por dominio está limitada a alrededor de 20+, el límite exacto depende del navegador.
Las cookies tienen varias opciones, muchas de ellas importantes y deberían ser configuradas.
Las opciones son listadas después de key=value , delimitadas por un ; :
path
●
path=/mypath
La ruta del prefijo path debe ser absoluto. Esto hace la cookie accesible a las páginas bajo esa ruta. La forma
predeterminada es la ruta actual.
Si una cookie es establecida con path=/admin , será visible en las páginas /admin y /admin/something , pero no en
/home o /adminpage .
Usualmente, debemos configurarlo en la raíz: path=/ para hacer la cookie accesible a todas las páginas del sitio web.
domain
●
domain=site.com
Un dominio define dónde la cookie es accesible. Aunque en la práctica hay limitaciones y no podemos configurar cualquier
dominio.
No hay forma de hacer que una cookie sea accesible desde otro dominio de segundo nivel, entonces other.com
nunca recibirá una cookie establecida en site.com .
Es una restricción de seguridad, para permitirnos almacenar datos sensibles en cookies que deben estar disponibles para un
único sitio solamente.
De forma predeterminada, una cookie solo es accesible en el dominio que la establece.
Pero por favor toma nota: de forma predeterminada una cookie tampoco es compartida por un subdominio, como
forum.site.com .
79/220
// en site.com
document.cookie = "user=John"
// en forum.site.com
alert(document.cookie); // no user
…aunque esto puede cambiarse. Si queremos permitir que un subdominio como forum.site.com obtenga una cookie
establecida por site.com , eso es posible.
Para ello, cuando establecemos una cookie en site.com , debemos configurar explícitamente la raíz del dominio en la
opción domain : domain=site.com . Entonces todos los subdominios verán la cookie.
Por ejemplo:
// en site.com
// hacer la cookie accesible en cualquier subdominio *.site.com:
document.cookie = "user=John; domain=site.com"
// ...luego
// en forum.site.com
alert(document.cookie); // tiene la cookie user=John
Por razones históricas, domain=.site.com (con un punto antes de site.com ) también funciona de la misma forma,
permitiendo acceso a la cookie desde subdominios. Esto es una vieja notación y debe ser usada si necesitamos dar soporte
a navegadores muy viejos.
Entonces: la opción domain permite que las cookies sean accesibles en los subdominios.
expires, max-age
De forma predeterminada, si una cookie no tiene una de estas opciones, desaparece cuando el navegador se cierra. Tales
cookies se denominan “cookies de sesión”.
Para que las cookies sobrevivan al cierre del navegador, podemos usar las opciones expires o max-age .
●
expires=Tue, 19 Jan 2038 03:14:07 GMT
max-age es una alternativa a expires , y especifica la expiración de la cookie en segundos desde el momento actual.
secure
● secure
80/220
De forma predeterminada, si establecemos una cookie en http://site.com , entonces también aparece en
https://site.com y viceversa.
Esto es, las cookies están basadas en el dominio, no distinguen entre protocolos.
Con la opción secure , si una cookie se establece por https://site.com , entonces no aparecerá cuando el mismo
sitio es accedido por HTTP, como http://site.com . Entonces, si una cookie tiene información sensible que nunca debe
ser enviada sobre HTTP sin encriptar, debe configurarse secure .
samesite
Este es otro atributo de seguridad. samesite sirve para proteger contra los ataques llamados XSRF (falsificación de
solicitud entre sitios, cross-site request forgery).
Para entender cómo funciona y su utilidad, veamos primero los ataques XSRF.
ataque XSRF
Imagina que tienes una sesión en el sitio bank.com . Esto es: tienes una cookie de autenticación para ese sitio. Tu
navegador lo envía a bank.com en cada solicitud, así aquel te reconoce y ejecuta todas las operaciones financieras
sensibles.
Ahora, mientras navegas la red en otra ventana, accidentalmente entras en otro sitio evil.com . Este sitio tiene código
JavaScript que envía un formulario <form action="https://bank.com/pay"> a bank.com con los campos que
inician una transacción a la cuenta el hacker.
El navegador envía cookies cada vez que visitas el sitio bank.com , incluso si el form fue enviado desde evil.com .
Entonces el banco te reconoce y realmente ejecuta el pago.
evil.com bank.com
Los bancos reales están protegidos contra esto por supuesto. Todos los formularios generados por bank.com tienen un
campo especial, llamado “token de protección XSRF”, que una página maliciosa no puede generar o extraer desde una
página remota. Puede enviar el form, pero no obtiene respuesta a la solicitud. El sitio bank.com verifica tal token en cada
form que recibe.
Tal protección toma tiempo para implementarla. Necesitamos asegurarnos de que cada form tiene dicho campo token, y
debemos verificar todas las solicitudes.
Una cookie con samesite=strict nunca es enviada si el usuario viene desde fuera del mismo sitio.
En otras palabras, si el usuario sigue un enlace desde su correo, envía un form desde evil.com , o hace cualquier
operación originada desde otro dominio, la cookie no será enviada.
Si las cookies de autenticación tienen la opción samesite , un ataque XSRF no tiene posibilidad de éxito porque el envío
de evil.com llega sin cookies. Así bank.com no reconoce el usuario y no procederá con el pago.
La protección es muy confiable. Solo las operaciones que vienen de bank.com enviarán la cookie samesite , por ejemplo
un form desde otra página de bank.com .
81/220
Cuando el usuario sigue un enlace legítimo a bank.com , por ejemplo desde sus propio correo, será sorprendido con que
bank.com no lo reconoce. Efectivamente, las cookies samesite=strict no son enviadas en ese caso.
Podemos sortear esto usando dos cookies: una para el “reconocimiento general”, con el solo propósito de decir: “Hola,
John”, y la otra para operaciones de datos con samesite=strict . Entonces, la persona que venga desde fuera del sitio
llega a la página de bienvenida, pero los pagos serán iniciados desde dentro del sitio web del banco, entonces la segunda
cookie sí será enviada.
●
samesite=lax
Un enfoque más laxo que también protege de ataques XSRF y no afecta la experiencia de usuario.
El modo lax , como strict , prohíbe al navegador enviar cookies cuando viene desde fuera del sitio, pero agrega una
excepción.
Una cookie samesite=lax es enviada si se cumplen dos condiciones:
Entonces, lo que hace samesite=lax es básicamente permitir la operación más común “ir a URL” para obtener cookies.
Por ejemplo, abrir un sitio desde la agenda satisface estas condiciones.
Pero cualquier cosa más complicada, como solicitudes de red desde otro sitio, o un “form submit”, pierde las cookies.
Si esto es adecuado para ti, entonces agregar samesite=lax probablemente no dañe la experiencia de usuario y agrega
protección.
Por sobre todo, samesite es una excelente opción.
Así que si solo confiamos en samesite para brindar protección, habrá navegadores que serán vulnerables.
Pero con seguridad podemos usar samesite , junto con otras medidas de protección como los tokens xsrf, para agregar
una capa adicional de defensa. En el futuro probablemente podamos descartar la necesidad de tokens xsrf.
httpOnly
Esta opción no tiene nada que ver con JavaScript, pero tenemos que mencionarla para completar la guía.
El servidor web usa la cabecera Set-Cookie para establecer la cookie. También puede configurar la opción httpOnly .
Esta opción impide a JavaScript el acceso a la cookie. No podemos ver ni manipular tal cookie usando
document.cookie .
Esto es usado como medida de precaución, para proteger de ciertos ataques donde el hacker inyecta su propio código en
una página y espera que el usuario visite esa página. Esto no debería ser posible en absoluto, los hackers bo deberían poder
insertar su código en nuestro sitio, pero puede haber bugs que les permite hacerlo.
Normalmente, si eso sucede y el usuario visita una página web con el código JavaScript del hacker, entonces ese código se
ejecuta y gana acceso a document.cookie con las cookies del usuario conteniendo información de autenticación. Eso es
malo.
Aquí hay un pequeño conjunto de funciones para trabajar con cookies, más conveniente que la modificación manual de
document.cookie .
Existen muchas librerías de cookies para eso, asi que estas son para demostración solamente. Aunque completamente
funcionales.
82/220
getCookie(name)
La forma más corta de acceder a una cookie es usar una expresión regular.
La función getCookie(name) devuelve la cookie con el nombre name dado:
Nota que el valor de una cookie está codificado, entonces getCookie usa una función integrada decodeURIComponent
para decodificarla.
options = {
path: '/',
// agregar otros valores predeterminados si es necesario
...options
};
document.cookie = updatedCookie;
}
// Ejemplo de uso:
setCookie('user', 'John', {secure: true, 'max-age': 3600});
deleteCookie(name)
Para borrar una cookie, podemos llamarla con una fecha de expiración negativa:
function deleteCookie(name) {
setCookie(name, "", {
'max-age': -1
})
}
Completo: cookie.js.
83/220
Una cookie es llamada “third-party” o “de terceros” si es colocada por un dominio distinto al de la página que el usuario está
visitando.
Por ejemplo:
1. Una página en site.com carga un banner desde otro sitio: <img src="https://ads.com/banner.png"> .
2. Junto con el banner, el servidor remoto en ads.com puede configurar la cabecera Set-Cookie con una cookie como
id=1234 . Tal cookie tiene origen en el dominio ads.com , y será visible solamente en ads.com :
site.com ads.com
id=123
Set-Cookie:
3. La próxima vez que se accede a ads.com , el servidor remoto obtiene la cookie id y reconoce al usuario:
site.com ads.com
4. Lo que es más importante aquí, cuando el usuario cambia de site.com a otro sitio other.com que también tiene un
banner, entonces ads.com obtiene la cookie porque pertenece a ads.com , reconociendo al visitante y su movimiento
entre sitios:
other.com ads.com
Las cookies de terceros son tradicionalmente usados para rastreo y servicios de publicidad (ads) debido a su naturaleza.
Ellas están vinculadas al dominio de origen, entonces ads.com puede rastrear al mismo usuario a través de diferentes
sitios si ellos los acceden.
Naturalmente, a algunos no les gusta ser seguidos, así que los navegadores permiten deshabilitar tales cookies.
Además, algunos navegadores modernos emplean políticas especiales para tales cookies:
●
Safari no permite cookies de terceros en absoluto.
● Firefox viene con una “lista negra” de dominios de terceros y bloquea las cookies de tales orígenes.
Si un script configura una cookie, no importa de dónde viene el script: la cookie pertenece al dominio de la página web
actual.
Apéndice: GDPR
Este tópico no está relacionado a JavaScript en absoluto, solo es algo para tener en mente cuando configuramos cookies.
84/220
Hay una legislación en Europa llamada GDPR que es un conjunto de reglas que fuerza a los sitios web a respetar la
privacidad del usuario. Una de estas reglas es requerir un permiso explícito del usuario para el uso de cookies de
seguimiento.
Pero si vamos a configurar una cookie con una sesión de autenticación o un id de seguimiento, el usuario debe dar su
permiso.
Los sitios web generalmente tienen dos variantes para cumplir con el GDPR. Debes de haberlas visto en la web:
1. Si un sitio web quiere establecer cookies de seguimiento solo para usuarios autenticados.
Para hacerlo, el form de registro debe tener un checkbox como: “aceptar la política de privacidad” (que describe cómo las
cookies son usadas), el usuario debe marcarlo, entonces el sitio web es libre para establecer cookies de autenticación.
El GDPR no trata solo de cookies, también es acerca de otros problemas relacionados a la privacidad, pero eso va más allá
de nuestro objetivo.
Resumen
Opciones de Cookie:
● path=/ , por defecto la ruta actual, hace la cookie visible solo bajo esa ruta.
●
domain=site.com , por defecto una cookie es visible solo en el dominio actual. Si el domino se establece
explícitamente, la cookie se hace visible a los subdominios.
● expires o max-age configuran el tiempo de expiración de la cookie. Sin ellas la cookie muere cuando el navegador es
cerrado.
●
secure hace la cookie solo para HTTPS.
● samesite prohíbe al navegador enviar la cookie a solicitudes que vengan desde fuera del sitio. Esto ayuda a prevenir
ataques XSRF.
Adicionalmente:
● Las cookies de terceros pueden estar prohibidas por el navegador, por ejemplo Safari lo hace por defecto.
●
Cuando se configuran cookies de seguimiento para ciudadanos de la UE, la regulación GDPR requiere la autorización del
usuario.
LocalStorage, sessionStorage
Los objetos de almacenaje web localStorage y sessionStorage permiten guardar pares de clave/valor en el
navegador.
Lo que es interesante sobre ellos es que los datos sobreviven a una recarga de página (en el caso de sessionStorage ) y
hasta un reinicio completo de navegador (en el caso de localStorage ). Lo veremos en breve.
85/220
● También diferente de las cookies es que el servidor no puede manipular los objetos de almacenaje via cabeceras HTTP,
todo se hace via JavaScript.
● El almacenaje está vinculado al orígen (al triplete dominio/protocolo/puerto). Esto significa que distintos protocolos o
subdominios tienen distintos objetos de almacenaje, no pueden acceder a otros datos que no sean los suyos.
Como puedes ver, es como una colección Map ( setItem/getItem/removeItem ), pero también permite el acceso a
través de index con key(index) .
Demo de localStorage
localStorage.setItem('test', 1);
… y cierras/abres el navegador, o simplemente abres la misma página en otra ventana, puedes coger el ítem que hemos
guardado de este modo:
alert( localStorage.getItem('test') ); // 1
Solo tenemos que estar en el mismo dominio/puerto/protocolo, la url puede ser distinta.
localStorage es compartido por toda las ventanas del mismo origen, de modo que si guardamos datos en una ventana,
el cambio es visible en la otra.
También podemos utilizar un modo de acceder/guardar claves del mismo modo que se hace con objetos, así:
Esto se permite por razones históricas, y principalmente funciona, pero en general no se recomienda por dos motivos:
1. Si la clave es generada por el usuario, puede ser cualquier cosa, como length o toString , u otro método propio de
localStorage . En este caso getItem/setItem funcionan correctamente, pero el acceso de simil-objeto falla;
86/220
2. Existe un evento storage , que se dispara cuando modificamos los datos. Este evento no se dispara si utilizamos el
acceso tipo objeto. Lo veremos más tarde en este capítulo.
Los métodos proporcionan la funcionalidad get / set / remove. ¿Pero cómo conseguimos todas las claves o valores
guardados?
Otra opción es utilizar el loop específico para objetos for key in localStorage tal como hacemos en objetos
comunes.
Esta opción itera sobre las claves, pero también devuelve campos propios de localStorage que no necesitamos:
// mal intento
for(let key in localStorage) {
alert(key); // muestra getItem, setItem y otros campos que no nos interesan
}
… De modo que necesitamos o bien filtrar campos des del prototipo con la validación hasOwnProperty :
… O simplemente acceder a las claves “propias” con Object.keys y iterar sobre éstas si es necesario:
Esta última opción funciona, ya que Object.keys solo devuelve las claves que pertenecen al objeto, ignorando el
prototipo.
Solo strings
Hay que tener en cuenta que tanto la clave como el valor deben ser strings.
Si fueran de cualquier otro tipo, como un número o un objeto, se convertirían a cadena de texto automáticamente:
87/220
También es posible pasar a texto todo el objeto de almacenaje, por ejemplo para debugear:
sessionStorage
Las propiedades y métodos son los mismos, pero es mucho más limitado:
● sessionStorage solo existe dentro de la pestaña actual del navegador.
●
Otra pestaña con la misma página tendrá un almacenaje distinto.
●
Pero se comparte entre iframes en la pestaña (asumiendo que tengan el mismo orígen).
● Los datos sobreviven un refresco de página, pero no cerrar/abrir la pestaña.
sessionStorage.setItem('test', 1);
… Pero si abres la misma página en otra pestaña, y lo intentas de nuevo, el código anterior devuelve null , que significa
que no se ha encontrado nada.
Esto es exactamente porque sessionStorage no está vinculado solamente al orígen, sino también a la pestaña del
navegador. Por ésta razón sessionStorage se usa relativamente poco.
Evento storage
Cuando los datos se actualizan en localStorage o en sessionStorage , se dispara el evento storage con las
propiedades:
● key – la clave que ha cambiado, ( null si se llama .clear() ).
● oldValue – el anterior valor ( null si se añade una clave).
● newValue – el nuevo valor ( null si se borra una clave).
● url – la url del documento donde ha pasado la actualización.
● storageArea – bien el objeto localStorage o sessionStorage , donde se ha producido la actualización.
El hecho importante es: el evento se dispara en todos los objetos window donde el almacenaje es accesible, excepto en el
que lo ha causado.
Vamos a desarrollarlo.
Imagina que tienes dos ventanas con el mismo sitio en cada una, de modo que localStorage es compartido entre ellas.
Si ambas ventanas están escuchando el evento window.onstorage , cada una reaccionará a las actualizaciones que
pasen en la otra.
localStorage.setItem('now', Date.now());
88/220
Hay que tener en cuenta que el evento también contiene: event.url – la url del documento en que se actualizaron los
datos.
También que event.storageArea contiene el objeto de almacenaje – el evento es el mismo para sessionStorage y
localStorage --, de modo que storageArea referencia el que se modificó. Podemos hasta querer cambiar datos en él,
para “responder” a un cambio.
Esto permite que distintas ventanas del mismo orígen puedan intercambiar mensajes.
Los navegadores modernos también soportan la API de Broadcast channel API , la API específica para la comunicación
entre ventanas del mismo orígen. Es más completa, pero tiene menos soporte. Hay librerías que añaden polyfills para ésta
API basados en localStorage para que se pueda utilizar en cualquier entorno.
Resumen
Los objetos de almacenaje web localStorage y sessionStorage permiten guardar pares de clave/valor en el
navegador.
● Tanto la clave como el valor deben ser strings.
● El límite es de más de 5mb+, dependiendo del navegador.
● No expiran.
●
Los datos están vinculados al origen (dominio/puerto/protocolo).
localStorage sessionStorage
Compartida entre todas las pestañas y ventanas que tengan el mismo orígen Accesible en una pestaña del navegador, incluyendo iframes del mismo origen
API:
● setItem(clave, valor) – guarda pares clave/valor.
● getItem(clave) – coge el valor de una clave.
● removeItem(clave) – borra una clave con su valor.
●
clear() – borra todo.
● key(índice) – coge la clave en una posición determinada.
●
length – el número de ítems almacenados.
● Utiliza Object.keys para conseguir todas las claves.
●
Puede utilizar las claves como propiedades de objetor, pero en ese caso el evento storage no se dispara
Evento storage:
● Se dispara en las llamadas a setItem , removeItem , clear .
● Contiene todos los datos relativos a la operación ( key/oldValue/newValue ), la url del documento y el objeto de
almacenaje.
● Se dispara en todos los objetos window que tienen acceso al almacenaje excepto el que ha generado el evento (en una
pestaña en el caso de sessionStorage o globalmente en el caso de localStorage ).
Tareas
Entonces, si el usuario cierra accidentalmente la página y la abre de nuevo, encontrará su entrada inacabada en su lugar.
Como esto:
Write here
Clear
89/220
Abrir un entorno controlado para la tarea.
A solución
IndexedDB
IndexedDB es una base de datos construida dentro del navegador, mucho más potente que localStorage .
●
Almacena casi todo tipo de valores por claves, tipos de clave múltiple.
●
Soporta transacciones para confiabilidad.
● Soporta consultas de rango por clave, e índices.
● Puede almacenar mucho mayor volumen de datos que localStorage .
Toda esta potencia es normalmente excesiva para las aplicaciones cliente-servidor tradicionales. IndexedDB está previsto
para aplicaciones fuera de línea, para ser combinado con ServiceWorkers y otras tecnologías.
La interfaz nativa de IndexedDB, descrita en la https://www.w3.org/TR/IndexedDB , está basada en eventos.
También podemos usar async/await con la ayuda de un contenedor basado en promesas como idb
https://github.com/jakearchibald/idb . Aunque esto es muy conveniente, hay que tener en cuenta que el contenedor no es
perfecto y no puede reemplazar a los eventos en todos los casos. Así que comenzaremos con eventos y, cuando hayamos
avanzado en el entendimiento de IndexedDb, usaremos el contenedor.
Para empezar a trabajar con IndexedDB, primero necesitamos conectarnos o “abrir” ( open ) una base de datos.
La sintaxis:
Podemos tener muchas bases de datos con nombres diferentes, pero todas ellas existen dentro del mismo origen
(dominio/protocolo/puerto). Un sitio web no puede acceder bases de datos de otro.
IndexedDB tiene incorporado un mecanismo de “versión de esquema”, ausente en bases de datos de servidor.
A diferencia de las bases de datos del lado del servidor, IndexedDB se ejecuta en el lado del cliente y los datos son
almacenados en el navegador, así que nosotros, desarrolladores, no tenemos acceso permanente a esas bases. Entonces,
cuando publicamos una nueva versión de nuestra app y el usuario visita nuestra página web, podemos necesitar actualizar la
estructura de su base de datos.
Si la versión de la base es menor a la especificada en open , entonces se dispara un evento especial upgradeneeded
(actualización-requerida), donde podemos comparar versiones y hacer la actualización de la estructura de datos que se
necesite.
El evento upgradeneeded también se dispara cuando la base aún no existe (técnicamente, su versión es 0 ), lo cual nos
permite llevar a cabo su inicialización.
90/220
Digamos que publicamos la primera versión de nuestra app.
Entonces podemos abrir la base con version 1 y hacer la inicialización en un manejador upgradeneeded :
openRequest.onupgradeneeded = function() {
// se dispara si el cliente no tiene la base de datos
// ...ejecuta la inicialización...
};
openRequest.onerror = function() {
console.error("Error", openRequest.error);
};
openRequest.onsuccess = function() {
let db = openRequest.result;
// continúa trabajando con la base de datos usando el objeto db
};
openRequest.onupgradeneeded = function(event) {
// la versión de la base existente es menor que 2 (o ni siquiera existe)
let db = openRequest.result;
switch(event.oldVersion) { // versión de db existente
case 0:
// version 0 significa que el cliente no tiene base de datos
// ejecutar inicialización
case 1:
// el cliente tiene la versión 1
// actualizar
}
};
Tenlo en cuenta: como nuestra versión actual es 2 , el manejador onupgradeneeded tiene una rama de código para la
versión 0 , adecuada para usuarios que acceden por primera vez y no tienen una base de datos, y otra rama para la versión
1 , para su actualización.
No se puede abrir una base de datos usando una versión más vieja de open
Si la base del usuario tiene una versión mayor que el open que la abre, por ejemplo: la base existente tiene versión 3 e
intentamos open(...2) , se producirá un error que disparará openRequest.onerror .
Es una situación rara, pero puede ocurrir cuando un visitante carga código JavaScript viejo (por ejemplo desde un caché
proxy). Así el código es viejo, pero la base de datos nueva.
Para prevenir errores, debemos verificar db.version y sugerir la recarga de página. Usa cabeceras HTTP de caché
apropiadas para evitar la carga de código viejo, así nunca tendrás tales problemas.
1. Un visitante, en una pestaña de su navegador, abrió nuestro sitio con un base de datos con la versión 1 .
91/220
2. Luego publicamos una actualización, así que nuestro código es más reciente.
3. Y el mismo visitante abre nuestro sitio en otra pestaña.
Entonces hay una primera pestaña con una conexión abierta a una base con versión 1 , mientras la segunda intenta
actualizarla a la versión 2 en su manejador upgradeneeded .
El problema es que la misma base está compartida entre las dos pestañas, por ser del mismo sitio y origen. Y no puede ser
versión 1 y 2 al mismo tiempo. Para ejecutar la actualización a la versión 2 , todas las conexiones a la versión 1 deben ser
cerradas, incluyendo las de la primera pestaña.
Para detectar estas situaciones, se dispara automáticamente el evento versionchange (cambio-de-versión) en el objeto
de base de datos. Debemos escuchar dicho evento y cerrar la conexión vieja (y probablemente sugerir una recarga de
página, para cargar el código actualizado).
Si no escuchamos el evento versionchange y no cerramos la conexión vieja, entonces la segunda y más nueva no se
podrá hacer. El objeto openRequest emitirá el evento blocked en lugar de success . Entonces la segunda pestaña no
funcionará.
Aquí tenemos el código para manejar correctamente la actualización paralela. Este instala un manejador
onversionchange que se dispara si la conexión actual queda obsoleta y la cierra (la versión se actualiza en algún otro
lado):
openRequest.onupgradeneeded = ...;
openRequest.onerror = ...;
openRequest.onsuccess = function() {
let db = openRequest.result;
db.onversionchange = function() {
db.close();
alert("La base de datos está desactualizada, por favor recargue la página.")
};
openRequest.onblocked = function() {
// este evento no debería dispararse si hemos manejado onversionchange correctamente
Podemos manejar las cosas más suavemente en db.onversionchange , como pedirle al visitante que guarde los datos
antes de cerrar la conexión.
Como alternativa podríamos no cerrar la base en db.onversionchange sino usar onblocked de la nueva pestaña para
advertirle que no puede crear una nueva conexión hasta que cierre las viejas.
Estas colisiones ocurren raramente, pero deberíamos tener algún manejo de ella, como mínimo un manejador onblocked
para evitar que nuestro script muera silenciosamente.
92/220
Podemos almacenar casi cualquier valor, incluyendo objetos complejos.
IndexedDB usa el algoritmo de serialización estándar para clonar-y-almacenar un objeto. Es como JSON.stringify ;
pero más poderoso, capaz de almacenar muchos tipos de datos más.
Hay objetos que no pueden ser almacenados, por ejemplo los que tienen referencias circulares. Tales objetos no son
serializables. JSON.stringify también falla con ellos.
Debe haber una clave key única para cada valor del almacén.
Una clave debe ser de uno de estos tipos: number, date, string, binary, o array. Es un identificador único, así podemos
buscar/borrar/modificar valores por medio de la clave.
Database
objectStore objectStore
key1: value1 key1: value1
objectStore
key2: value2 key1: value1 key2: value2
key3: value3 key2: value2 key3: value3
key4: value4 key3: value3 key4: value4
key5: value5 key4: value4 key5: value5
key5: value5
Como veremos pronto, cuando agregamos un valor al almacén podemos proporcionarle una clave, de forma similar a
localStorage . Pero cuando lo que almacenamos son objetos, IndexedDB permite asignar una propiedad del objeto como
clave, lo que es mucho más conveniente. También podemos usar claves que se generan automáticamente.
Pero primero, necesitamos crear el almacén de objetos.
db.createObjectStore(name[, keyOptions]);
Si no establecemos keyOptions , necesitaremos proporcionar una clave explícitamente más tarde: al momento de
almacenar un objeto.
Por ejemplo, este objeto usa la propiedad id como clave:
Un almacén de objetos solo puede ser creado o modificado durante la actualización de su versión, esto es, en el
manejador upgradeneeded .
Esto es una limitación técnica. Fuera del manejador podremos agregar/borrar/modificar los datos, pero los almacenes de
objetos solo pueden ser creados/borrados/alterados durante la actualización de versión.
Para hacer una actualización de base de datos, hay principalmente dos enfoques:
1. Podemos implementar una función de actualización por versión: desde 1 a 2, de 2 a 3, de 3 a 4, etc. Así en
upgradeneeded podemos comparar versiones (ejemplo: vieja 2, ahora 4) y ejecutar actualizaciones por versión paso a
paso para cada versión intermedia (en el ejemplo: 2 a 3, luego 3 a 4).
2. O podemos simplemente examinar la base y alterarla en un paso. Obtenemos una lista de los almacenes existentes como
db.objectStoreNames . Este objeto es un DOMStringList que brinda el método contains(name) para chequear
existencias. Y podemos entonces hacer actualizaciones dependiendo de lo que existe y lo que no.
93/220
Aquí hay un demo del segundo enfoque:
db.deleteObjectStore('books')
Transacciones
Sería muy malo que si se completara la primera operación y algo saliera mal (como un corte de luz), fallara la segunda.
Ambas deberían ser exitosas (compra completa, ¡bien!) o ambas fallar (al menos la persona mantuvo su dinero y puede
reintentar).
Las transacciones garantizan eso.
Todas las operaciones deben ser hechas dentro de una transacción en IndexedDB.
db.transaction(store[, type]);
●
store – el nombre de almacén al que la transacción va a acceder, por ejemplo "books" . Puede ser un array de
nombres de almacenes si vamos a acceder a múltiples almacenes.
●
type – el tipo de transacción, uno de estos dos:
●
readonly – solo puede leer (es el predeterminado).
● readwrite – puede leer o escribir datos (pero no crear/quitar/alterar almacenes de objetos).
También existe el tipo de transacción versionchange : tal transacción puede hacer de todo, pero no podemos crearla
nosotros a mano. IndexedDB la crea automáticamente cuando abre la base de datos para el manejador upgradeneeded .
Por ello, es el único lugar donde podemos actualizar la estructura de base de datos, crear o quitar almacenes de objetos.
Muchas transacciones readonly pueden leer en un mismo almacén concurrentemente, en cambio las transacciones
de escritura readwrite , no. Una transacción readwrite bloquea el almacén para escribir en él. La siguiente
transacción debe esperar a que la anterior termine antes de acceder al mismo almacén.
Una vez que la transacción ha sido creada, podemos agregar un ítem al almacén:
94/220
let book = {
id: 'js',
price: 10,
created: new Date()
};
request.onerror = function() {
console.log("Error", request.error);
};
Al igual que al abrir una base de datos, podemos enviar una petición: books.add(book) y quedar a la espera de los
eventos success/error .
●
El resultado request.result de add es la clave del nuevo objeto.
●
El error, si lo hay, está en request.error .
En el ejemplo anterior, empezamos la transacción e hicimos una petición add . Pero, como explicamos antes, una
transacción puede tener muchas peticiones asociadas, que deben todas ser exitosas o todas fallar. ¿Cómo marcamos que
una transacción se da por finalizada, que no tendrá más peticiones asociadas?
Respuesta corta: no lo hacemos.
En la siguiente versión 3.0 de la especificación, probablemente haya una manera de finalizarla manualmente, pero ahora
mismo en la 2.0 no la hay.
Cuando todas las peticiones de una transacción terminaron y la cola de microtareas está vacía, se hace un commit
(consumación) automático.
De forma general, podemos asumir que una transacción se consuma cuando todas sus peticiones fueron completadas y el
código actual finaliza.
Entonces, en el ejemplo anterior no se necesita una llamada especial para finalizar la transacción.
El principio de auto-commit de las transacciones tiene un efecto colateral importante. No podemos insertar una operación
asincrónica como fetch , setTimeout en mitad de una transacción. IndexedDB no mantendrá la transacción esperando
a que terminen.
En el siguiente código, request2 en la línea (*) falla, porque la transacción ya está finalizada y no podemos hacer más
peticiones sobre ella:
request1.onsuccess = function() {
fetch('/').then(response => {
let request2 = books.add(anotherBook); // (*)
request2.onerror = function() {
95/220
console.log(request2.error.name); // TransactionInactiveError
};
});
};
Esto es porque fetch es una operación asincrónica, una macrotarea. Las transacciones se cierran antes de que el
navegador comience con las macrotareas.
Los autores de la especificación de IndexedDB creen que las transacciones deben ser de corta vida. Mayormente por
razones de rendimiento.
Es de notar que las transacciones readwrite “traban” los almacenes para escritura. Entonces si una parte de la aplicación
inició readwrite en el almacén books , cuando otra parte quiera hacer lo mismo tendrá que esperar: la nueva
transacción “se cuelga” hasta que la primera termine. Esto puede llevar a extraños retardos si las transacciones toman un
tiempo largo.
Entonces, ¿qué hacer?
En el ejemplo de arriba podemos hacer una nueva db.transaction justo antes de la nueva petición (*) .
Pero, si queremos mantener las operaciones juntas en una transacción, será mucho mejor separar las transacciones
IndexedDB de la parte asincrónica.
Primero, hacer fetch y preparar todos los datos que fueran necesarios y, solo entonces, crear una transacción y ejecutar
todas las peticiones de base de datos. Así, funcionaría.
Para detectar el momento de finalización exitosa, podemos escuchar al evento transaction.oncomplete :
transaction.oncomplete = function() {
console.log("Transacción completa");
};
Solo complete garantiza que la transacción fue guardada como un todo. Las peticiones individuales pueden ser exitosas,
pero la operación final de escritura puede ir mal (por ejemplo por un error de Entrada/Salida u otra cosa).
Para abortar una transacción manualmente:
transaction.abort();
Esto cancela todas las modificaciones hechas por las peticiones y dispara el evento transaction.onabort .
Manejo de error
En el ejemplo que sigue, un libro nuevo es agregado con la misma clave ( id ) que otro existente. El método store.add
genera un "ConstraintError" en ese caso. Lo manejamos sin cancelar la transacción:
request.onerror = function(event) {
96/220
// ConstraintError ocurre cuando un objeto con el mismo id ya existe
if (request.error.name == "ConstraintError") {
console.log("Ya existe un libro con ese id"); // manejo del error
event.preventDefault(); // no abortar la transacción
// ¿usar otra clave para el libro?
} else {
// error inesperado, no podemos manejarlo
// la transacción se abortará
}
};
transaction.onabort = function() {
console.log("Error", transaction.error);
};
Delegación de eventos
¿Necesitamos onerror/onsuccess en cada petición? No siempre. En su lugar podemos usar la delegación de eventos.
Propagación de eventos IndexedDB: request → transaction → database .
Todos los eventos son eventos DOM, con captura y propagación, pero generalmente solo se usa el escenario de la
propagación.
Así que podemos capturar todos los errores usando el manejador db.onerror , para reportarlos u otros propósitos:
db.onerror = function(event) {
let request = event.target; // la petición (request) que causó el error
console.log("Error", request.error);
};
request.onerror = function(event) {
if (request.error.name == "ConstraintError") {
console.log("Ya existe un libro con ese id"); // manejo de error
event.preventDefault(); // no abortar la transacción
event.stopPropagation(); // no propagar el error
} else {
// no hacer nada
// la transacción será abortada
// podemos encargarnos del error en transaction.onabort
}
};
Búsquedas
Por clave
Veamos el primer tipo de búsqueda: por clave.
Los métodos de búsqueda soportan tanto las claves exactas como las denominadas “consultas por rango” que son objetos
IDBKeyRange que especifican un “rango de claves” aceptable.
97/220
● IDBKeyRange.bound(lower, upper, [lowerOpen], [upperOpen]) significa: entre lower y upper . Si el
indicador “open” es true, la clave correspondiente no es incluida en el rango.
●
IDBKeyRange.only(key) – es un rango compuesto solamente por una clave key , es raramente usado.
Para efectuar la búsqueda, existen los siguientes métodos. Ellos aceptan un argumento query que puede ser una clave
exacta o un rango de claves:
● store.get(query) – busca el primer valor, por clave o por rango.
●
store.getAll([query], [count]) – busca todos los valores, limitado a la cantidad count si esta se especifica.
● store.getKey(query) – busca la primera clave que satisface la consulta, usualmente un rango.
●
store.getAllKeys([query], [count]) – busca todas las claves que satisfacen la consulta, usualmente un rango,
hasta la cantidad count si es suministrada.
● store.count([query]) – obtiene la cantidad de claves que satisfacen la consulta, usualmente un rango.
Por ejemplo, tenemos un montón de libros en nuestro almacén. Recuerda, el campo id es la clave, así que todos estos
métodos pueden buscar por id .
Ejemplos de peticiones:
// obtiene un libro
books.get('js')
Para buscar por otro campo del objeto, necesitamos crear una estructura de datos adicional llamada “índice (index)”.
Un índice es un agregado al almacén que rastrea un campo determinado del objeto dado. Para cada valor de ese campo,
almacena una lista de claves de objetos que tienen ese valor. Veremos una imagen más detallada abajo.
La sintaxis:
98/220
Digamos que queremos buscar por precio price .
Primero necesitamos crear un índice. Esto debe hacerse en upgradeneeded , al igual que hacíamos la creación del
almacén de objetos.
openRequest.onupgradeneeded = function() {
// debemos crear el índice aquí, en la transacción versionchange
let books = db.createObjectStore('books', {keyPath: 'id'});
let index = books.createIndex('price_idx', 'price');
};
Imagine que nuestro inventory tiene 4 libros. Aquí la imagen muestra exactamente lo que es el índice :
books index
3: ['html']
id: 'html'
price: 3 5: ['css']
id: 'js'
price: 10
id: 'nodejs'
price: 10
Como se dijo, el índice para cada valor de price (segundo argumento) mantiene la lista de claves que tienen ese precio.
request.onsuccess = function() {
if (request.result !== undefined) {
console.log("Books", request.result); // array de libros con precio = 10
} else {
console.log("No hay libros así");
}
};
También podemos usar IDBKeyRange para crear rangos y vistas de libros baratos/caros:
Los índices están ordenados internamente por el campo del índice, en nuestro caso price . Entonces cuando hacemos la
búsqueda, los resultados también estarán ordenados por price .
El método delete (eliminar) busca a través de una consulta valores para borrarlos. El formato de la llamada es similar a
getAll :
●
delete(query) – elimina valores coincidentes con una consulta (query).
99/220
Por ejemplo:
Si queremos borrar libros basados en un precio u otro campo del objeto, debemos primero encontrar la clave en el índice,
luego llamar a delete con dicha clave:
request.onsuccess = function() {
let id = request.result;
let deleteRequest = books.delete(id);
};
Cursores
Pero un almacén de objetos puede ser enorme, incluso más que la memoria disponible. Entonces getAll fallaría al tratar
de llenar de registros el array.
¿Qué hacer?
● query (consulta) es una clave o un rango de claves, al igual que para getAll .
●
direction es un argumento opcional, el orden que se va a usar:
● "next" – el predeterminado: el cursor recorre en orden ascendente comenzando por la clave más baja.
● "prev" – el orden inverso: decrece comenzando con el registro con la clave más alta.
● "nextunique" , "prevunique" – igual que las anteriores, pero saltando los registros con la misma clave (válido
solo para cursores sobre índices; por ejemplo, de múltiples libros con price=5, solamente el primero será devuelto).
La diferencia principal del cursor es que request.onsuccess se dispara múltiples veces: una por cada resultado.
100/220
let key = cursor.key; // clave del libro (el campo id)
let value = cursor.value; // el objeto libro
console.log(key, value);
cursor.continue();
} else {
console.log("No hay más libros");
}
};
El evento onsuccess será llamado haya o no más valores coincidentes, y en result obtenemos el cursor apuntando al
siguiente registro o undefined .
Contenedor promisificador
Agregar onsuccess/onerror a cada petición es una tarea agobiante. A veces podemos hacernos la vida más fácil
usando delegación de eventos (por ejemplo, estableciendo manejadores para las transacciones completas), pero
async/await es mucho más conveniente.
Usemos en adelante para este capítulo un contenedor (wrapper) liviano que añade promesas
https://github.com/jakearchibald/idb . Este contenedor crea un objeto global idb con métodos IndexedDB promisificados.
try {
await books.add(...);
await books.add(...);
await transaction.complete;
101/220
console.log('jsbook saved');
} catch(err) {
console.log('error', err.message);
}
Manejo de Error
Si no atrapamos un error, este se propaga hasta el try..catch externo más cercano.
Un error no atrapado se vuelve un evento “rechazo de promesa no manejado” sobre el objeto window .
await inventory.add({ id: 'js', price: 10, created: new Date() });
await inventory.add({ id: 'js', price: 10, created: new Date() }); // Error
El inventory.add que sigue a fetch (*) falla con el error “transacción inactiva”, porque la transacción se
autocompletó y, llegado ese momento, ya está cerrada.
La forma de sortear esto es la misma que con el IndexedDB nativo: Hacer una nueva transacción o simplemente partir las
cosas.
1. Preparar los datos y buscar todo lo que sea necesario primero.
2. Solo entonces, grabar en la base de datos.
En algunos raros casos necesitamos el objeto request original. Podemos accederlo con la propiedad
promise.request de la promesa:
let promise = books.add(book); // obtiene una promesa (no espera por su resultado)
Resumen
102/220
IndexedDB puede considerarse como “localStorage con esteroides”. Es una simple base de datos de clave-valor,
suficientemente poderosa para apps fuera de línea y fácil de usar.
El mejor manual es la especificación, la actual es 2.0, pero algunos métodos de 3.0 (no muy diferente) están
soportados parcialmente.
Animaciones
Animaciones con CSS y JavaScript.
Curva de Bézier
Las curvas de Bézier se utilizan en gráficos por ordenador para dibujar formas, para animación CSS y en muchos otros
lugares.
En realidad, son algo muy sencillo, vale la pena estudiarlos una vez y luego sentirse cómodo en el mundo de los gráficos
vectoriales y las animaciones avanzadas.
Puntos de Control
103/220
2
1 3
3 4
1 2
1. Los puntos no siempre están en la curva. Eso es perfectamente normal, luego veremos cómo se construye la curva.
2. El orden de la curva es igual al número de puntos menos uno. Para dos puntos tenemos una curva lineal (que es una
línea recta), para tres puntos – curva cuadrática (parabólica), para cuatro puntos – curva cúbica.
3. Una curva siempre está dentro del casco convexo de los puntos de control:
3 4 2
1 2 1 3
Debido a esa última propiedad, en gráficos por ordenador es posible optimizar las pruebas de intersección. Si los cascos
convexos no se intersecan, las curvas tampoco. Por tanto, comprobar primero la intersección de los cascos convexos puede
dar un resultado “sin intersección” muy rápido. La comprobación de la intersección o los cascos convexos es mucho más
fácil, porque son rectángulos, triángulos, etc. (vea la imagen de arriba), figuras mucho más simples que la curva.
El valor principal de las curvas de Bézier para dibujar: al mover los puntos, la curva cambia de manera intuitiva.
Intenta mover los puntos de control con el ratón en el siguiente ejemplo:
3 4
1 2
104/220
Algoritmo de De Casteljau
Hay una fórmula matemática para las curvas de Bézier, pero la veremos un poco más tarde, porque el algoritmo de De
Casteljau es idéntico a la definición matemática y muestra visualmente cómo se construye.
t:1
2
1 3
2. Construir segmentos entre los puntos de control 1 → 2 → 3. En la demo anterior son marrones.
3. El parámetro t se mueve de 0 a 1 . En el ejemplo de arriba se usa el paso 0.05 : el bucle pasa por 0, 0.05, 0.1,
0.15, ... 0.95, 1 .
105/220
Para t=0.25 Para t=0.5
2 2
0.25
t = 0.5 0.5
0.5
0.25
t = 0.25
1 3 1 3
4. Ahora, en el segmento azul, toma un punto en la distancia proporcional al mismo valor de t . Es decir, para t=0.25 (la
imagen de la izquierda) tenemos un punto al final del cuarto izquierdo del segmento, y para t=0.5 (la imagen de la
derecha) – en la mitad del segmento. En las imágenes de arriba ese punto es rojo.
5. Como t va de 0 a 1 , cada valor de t añade un punto a la curva. El conjunto de tales puntos forma la curva de Bézier.
Es rojo y parabólico en las imágenes de arriba.
t:1
3 4
1 2
106/220
Una curva que se parece a y=1/t :
t:1
3 4
t:1
4
3 2
t:1
3
1 4
107/220
t:1
3 2
1 4
Como el algoritmo es recursivo, podemos construir curvas de Bézier de cualquier orden, es decir, usando 5, 6 o más puntos
de control. Pero en la práctica muchos puntos son menos útiles. Por lo general, tomamos 2-3 puntos, y para líneas
complejas pegamos varias curvas juntas. Eso es más simple de desarrollar y calcular.
Hay fórmulas matemáticas para tales curvas, por ejemplo el polinomio de Lagrange . En gráficos por ordenador la
interpolación de spline se usa a menudo para construir curvas suaves que conectan muchos puntos.
Matemáticas
Dadas las coordenadas de los puntos de control Pi : el primer punto de control tiene las coordenadas P1 = (x1, y1) , el
segundo: P2 = (x2, y2) , y así sucesivamente, las coordenadas de la curva se describen mediante la ecuación que
depende del parámetro t del segmento [0,1] .
●
La fórmula para una curva de 2 puntos:
P = (1-t)P1 + tP2
Estas son las ecuaciones vectoriales. En otras palabras, podemos poner x e y en lugar de P para obtener las
coordenadas correspondientes.
Por ejemplo, la curva de 3 puntos está formada por puntos (x, y) calculados como:
●
x = (1−t)2x1 + 2(1−t)tx2 + t2x3
●
y = (1−t)2y1 + 2(1−t)ty2 + t2y3
En lugar de x1, y1, x2, y2, x3, y3 deberíamos poner coordenadas de 3 puntos de control, y luego a medida que te
t se mueve de 0 a 1 , para cada valor de t tendremos (x,y) de la curva.
Por ejemplo, si los puntos de control son (0,0) , (0.5, 1) y (1, 0) , las ecuaciones se convierten en:
108/220
●
x = (1−t)2 * 0 + 2(1−t)t * 0.5 + t2 * 1 = (1-t)t + t2 = t
●
y = (1−t)2 * 0 + 2(1−t)t * 1 + t2 * 0 = 2(1-t)t = –2t2 + 2t
Ahora como t se ejecuta desde 0 a 1 , el conjunto de valores (x,y) para cada t forman la curva para dichos puntos de
control.
Resumen
Uso:
●
En gráficos por ordenador, modelado, editores gráficos vectoriales. Las fuentes están descritas por curvas de Bézier.
●
En desarrollo web – para gráficos en Canvas y en formato SVG. Por cierto, los ejemplos “en vivo” de arriba están escritos
en SVG. En realidad, son un solo documento SVG que recibe diferentes puntos como parámetros. Puede abrirlo en una
ventana separada y ver el código fuente: demo.svg.
●
En animación CSS para describir la trayectoria y la velocidad de la animación.
Animaciones CSS
Las animaciones CSS permiten hacer animaciones simples sin JavaScript en absoluto.
Se puede utilizar JavaScript para controlar la animación CSS y mejorarla con un poco de código.
Transiciones CSS
La idea de las transiciones CSS es simple. Describimos una propiedad y cómo se deberían animar sus cambios. Cuando la
propiedad cambia, el navegador pinta la animación.
Es decir: todo lo que necesitamos es cambiar la propiedad, y la transición fluida la hará el navegador.
Por ejemplo, el CSS a continuación anima los cambios de background-color durante 3 segundos:
.animated {
transition-property: background-color;
transition-duration: 3s;
}
Ahora, si un elemento tiene la clase .animated , cualquier cambio de background-color es animado durante 3
segundos.
Haz clic en el botón de abajo para animar el fondo:
<style>
#color {
transition-property: background-color;
transition-duration: 3s;
}
</style>
<script>
color.onclick = function() {
this.style.backgroundColor = 'red';
};
</script>
109/220
Haz clic en mi
Las cubriremos en un momento, por ahora tengamos en cuenta que la propiedad común transition permite declararlas
juntas en el orden: property duration timing-function delay , y también animar múltiples propiedades a la vez.
<style>
#growing {
transition: font-size 3s, color 2s;
}
</style>
<script>
growing.onclick = function() {
this.style.fontSize = '36px';
this.style.color = 'red';
};
</script>
Haz clic en mi
transition-property
En transition-property escribimos una lista de propiedades para animar, por ejemplo: left , margin-left ,
height , color . O podemos escribir all , que significa “animar todas las propiedades”.
No todas las propiedades pueden ser animadas, pero sí la mayoría de las generalmente usadas .
transition-duration
En transition-duration podemos especificar cuánto tiempo debe durar la animación. El tiempo debe estar en formato
de tiempo CSS : en segundos s o milisegundos ms .
transition-delay
https://plnkr.co/edit/3OpQT3blzipKDAdP?p=preview
#stripe.animate {
transform: translate(-90%);
110/220
transition-property: transform;
transition-duration: 9s;
}
stripe.classList.add('animate');
También podemos comenzar “desde el medio”, desde el número exacto, p. ej. correspondiente al segundo actual, usando el
negativo transition-delay .
stripe.onclick = function() {
let sec = new Date().getSeconds() % 10;
// por ejemplo, -3s aquí comienza la animación desde el 3er segundo
stripe.style.transitionDelay = '-' + sec + 's';
stripe.classList.add('animate');
};
transition-timing-function
La función de temporización describe cómo se distribuye el proceso de animación a lo largo del tiempo. Comenzará
lentamente y luego irá rápido o viceversa.
Es la propiedad más complicada a primera vista. Pero se vuelve muy simple si le dedicamos un poco de tiempo.
Esa propiedad acepta dos tipos de valores: una curva de Bézier o pasos. Comencemos por la curva, ya que se usa con más
frecuencia.
Curva de Bézier
La función de temporización se puede establecer como una curva de Bézier con 4 puntos de control que satisfacen las
condiciones:
1. Primer punto de control: (0,0) .
2. Último punto de control: (1,1) .
3. Para los puntos intermedios, los valores de x deben estar en el intervalo 0..1 , y puede ser cualquier cosa.
La sintaxis de una curva de Bézier en CSS: cubic-bezier(x2, y2, x3, y3) . Aquí necesitamos especificar solo los
puntos de control segundo y tercero, porque el primero está fijado a (0,0) y el cuarto es (1,1) .
La variante más simple es cuando la animación es uniforme, con la misma velocidad lineal. Eso puede especificarse
mediante la curva cubic-bezier(0, 0, 1, 1) .
… Como podemos ver, es solo una línea recta. A medida que pasa el tiempo ( x ), la finalización ( y ) de la animación pasa
constantemente de 0 a 1 .
El tren, en el ejemplo a continuación, va de izquierda a derecha con velocidad constante (haz clic en él):
111/220
https://plnkr.co/edit/RIjV9tj7atIBrDE2?p=preview
.train {
left: 0;
transition: left 5s cubic-bezier(0, 0, 1, 1);
/* el clic en un tren establece left a 450px, disparando la animación */
}
La gráfica:
3 4
Como podemos ver, el proceso comienza rápido: la curva se eleva mucho, y luego más y más despacio.
Aquí está la función de temporización en acción (haz clic en el tren):
https://plnkr.co/edit/9rIVfsxLkBooVvZI?p=preview
CSS:
.train {
left: 0;
transition: left 5s cubic-bezier(0, .5, .5, 1);
/* el clic en un tren establece left a 450px, disparando la animación */
}
(0.25, 0.1, 0.25, 1.0) (0.42, 0, 1.0, 1.0) (0, 0, 0.58, 1.0) (0.42, 0, 0.58, 1.0)
3 4 3 4 3 4 3 4
2
1 1 2 1 2 1 2
.train {
left: 0;
transition: left 5s ease-out;
/* igual que transition: left 5s cubic-bezier(0, .5, .5, 1); */
}
112/220
Pero se ve un poco diferente.
Una curva de Bézier puede hacer que la animación exceda su rango.
Los puntos de control en la curva pueden tener cualquier coordenada y : incluso negativa o enorme. Entonces la curva de
Bézier también saltaría muy bajo o alto, haciendo que la animación vaya más allá de su rango normal.
En el siguiente ejemplo, el código de animación es:
.train {
left: 100px;
transition: left 5s cubic-bezier(.5, -1, .5, 2);
/* clic en un tren establece left a 400px */
}
https://plnkr.co/edit/OmerUCXgNrO8u3va?p=preview
¿Por qué sucede? es bastante obvio si miramos la gráfica de la curva de Bézier dada:
(0,1) (1,1)
4
(0,0) (1,0)
Movimos la coordenada y del segundo punto por debajo de cero, y para el tercer punto lo colocamos sobre 1 , de modo
que la curva sale del cuadrante “regular”. La y está fuera del rango “estándar” 0..1 .
Como sabemos, y mide “la finalización del proceso de animación”. El valor y = 0 corresponde al valor inicial de la
propiedad e y = 1 al valor final. Por lo tanto, los valores y<0 mueven la propiedad por debajo del left inicial e y>1 por
encima del left final.
Esa es una variante “suave” sin duda. Si ponemos valores y como -99 y 99 , entonces el tren saltaría mucho más fuera
del rango.
Pero, ¿cómo hacer la curva de Bézier para una tarea específica? Hay muchas herramientas.
● Por ejemplo, podemos hacerlo en el sitio http://cubic-bezier.com/ .
●
El navegador también tiene soporte especial para curvas Bezier en CSS:
1. Abre las herramientas de desarrollador con F12 (Mac: Cmd+Opt+I ).
2. Selecciona la pestaña Elementos y presta atención al subpanel Estilos .
3. Las propiedades CSS que contengan la palabra cubic-bezier tendrán un icono antes de esta palabra.
4. Haz clic en este icono para editar la curva.
Pasos
La función de temporización steps(number of steps[, start/end]) permite dividir la animación en múltiples
pasos.
Veamos eso en un ejemplo con dígitos.
113/220
Aquí tenemos una lista de dígitos, sin animaciones, solo como fuente:
https://plnkr.co/edit/SHMPwMBWcOj5e7VG?p=preview
En el HTML, una línea de dígitos está encerrada en un div de largo fijo <div id="digits"> :
<div id="digit">
<div id="stripe">0123456789</div>
</div>
El div #digit tiene ancho fijo y un borde, entonces se ve como una ventana roja.
Haremos un temporizador: los dígitos aparecerán uno por uno, de una manera discreta.
Para lograr esto, ocultaremos el #stripe fuera de #digit usando overflow: hidden , y luego desplazamos el
#stripe a la izquierda paso a paso.
#stripe.animate {
transform: translate(-90%);
transition: transform 9s steps(9, start);
}
El primer argumento de steps(9, start) es el número de pasos. La transformación se dividirá en 9 partes (10% cada
una). El intervalo de tiempo también se divide automáticamente en 9 partes, por lo que transition: 9s nos da 9
segundos para toda la animación: 1 segundo por dígito.
El start significa que al comienzo de la animación debemos hacer el primer paso de inmediato.
En acción:
https://plnkr.co/edit/8YXVGHc6jf0G3Fsj?p=preview
Un clic en el dígito lo cambia a 1 (el primer paso) inmediatamente, y luego cambia al comienzo del siguiente segundo.
El valor alternativo ‘end’ haría que el cambio se aplicara no al principio sino al final de cada segundo.
Entonces el proceso para steps(9, end) sería así:
●
0s – 0 (durante el primer segundo nada cambia)
● 1s – -10% (primer cambio al final del primer segundo)
● 2s – -20%
● …
● 9s – -90%
Aquí está el step(9, end) en acción (observa la pausa antes del primer cambio de dígitos):
https://plnkr.co/edit/A9eNaFJ1OXrOmmkd?p=preview
114/220
Estos valores rara vez se usan porque no representan una verdadera animación sino un cambio de un solo paso.
Evento transitionend
Es ampliamente utilizado para hacer una acción después de que se realiza la animación. También podemos unir
animaciones.
Por ejemplo, el barco a continuación comienza a navegar ida y vuelta al hacer clic, cada vez más y más a la derecha:
La animación se inicia mediante la función go que se vuelve a ejecutar cada vez que finaliza la transición y cambia la
dirección:
boat.onclick = function() {
//...
let times = 1;
function go() {
if (times % 2) {
// navegar a la derecha
boat.classList.remove('back');
boat.style.marginLeft = 100 * times + 200 + 'px';
} else {
// navegar a la izquierda
boat.classList.add('back');
boat.style.marginLeft = 100 * times - 200 + 'px';
}
go();
boat.addEventListener('transitionend', function() {
times++;
go();
});
};
event.propertyName
La propiedad que ha terminado de animarse. Puede ser bueno si animamos múltiples propiedades simultáneamente.
event.elapsedTime
El tiempo (en segundos) que duró la animación, sin transition-delay .
Podemos unir múltiples animaciones simples juntas usando la regla CSS @keyframes .
Especifica el “nombre” de la animación y las reglas: qué, cuándo y dónde animar. Luego, usando la propiedad animation ,
adjuntamos la animación al elemento y especificamos parámetros adicionales para él.
Aquí tenemos un ejemplo con explicaciones:
115/220
<div class="progress"></div>
<style>
@keyframes go-left-right { /* dale un nombre: "go-left-right" */
from { left: 0px; } /* animar desde la izquierda: 0px */
to { left: calc(100% - 50px); } /* animar a la izquierda: 100%-50px */
}
.progress {
animation: go-left-right 3s infinite alternate;
/* aplicar la animación "go-left-right" al elemento
duración 3 segundos
número de veces: infinitas
alternar la dirección cada vez
*/
position: relative;
border: 2px solid green;
width: 50px;
height: 20px;
background: lime;
}
</style>
Probablemente no necesitarás @keyframes a menudo, a menos que todo esté en constante movimiento en tus sitios.
Performance
La mayoría de las propiedades CSS pueden ser animadas, porque la mayoría son valores numéricos. Por ejemplo width ,
color , font-size son todas números. Cuando las animamos, el navegador cambia estos valores gradualmente grama
por grama, creando un efecto suave.
Sin embargo, no todas las animaciones se verán tan suaves como quisieras, porque diferentes propiedades CSS tienen
diferente costo para cambiar.
En detalles más técnicos, cuando hay un cambio de estilo, el navegador atraviesa 3 pasos para renderizar la nueva vista:
1. Layout: (diagrama) recalcula la geometría y posición de cada elemento, luego
2. Paint: (dibuja) recalcula cómo debe verse todo en sus lugares, incluyendo background, colores,
3. Composite: (render) despliega el resultado final en pixels de la pantalla, aplicando transformaciones CSS si existen.
Durante una animación CSS , este proceso se repite para cada frame. Sin embargo las propiedades CSS que nunca afectan
geometría o posición, como color , pueden saltar el paso “Layout”. Si un color cambia, el navegador no recalcula
geometría, va a Paint → Composite. Y hay unas pocas propiedades que saltan directo a “Composite”. Puedes encontrar la
lista de propiedades CSS y cuáles estados disparan en https://csstriggers.com .
Los cálculos pueden tomar un tiempo, especialmente en páginas con muchos elementos y diagramación compleja. Y los
retrasos pueden ser notorios en muchos dispositivos, provocando “jitter”: animaciones irregulares, menos fluidas.
La animación de propiedades que salten el paso “Layout” son más rápidas. Mucho mejor si el paso “Paint” se salta también.
La propiedad transform es una excelente opción porque:
●
CSS transform afecta el elemento objetivo como un todo (rotar, tornar, estirar, desplazar).
● CSS transform nunca afecta a los elementos vecinos.
…entonces los navegadores aplican transform “por encima” de “Layout” y “Paint” ya calculados, en el paso “Composite”.
En otras palabras, el navegador calcula la diagramación en la etapa Layout (tamaños, posiciones); lo dibuja con colores,
backgrounds, etc., en la etapa “Paint”; y luego aplica transform a los elementos que lo necesitan.
Cambios (animaciones) de la propiedad transform nunca disparan los pasos Layout y Paint. Aún más, el navegador
delega las transformaciones CSS en el acelerador gráfico (un chip especial en la CPU o placa gráfica), haciéndolas muy
eficientes.
116/220
Afortunadamente la propiedad transform es muy poderosa. Usando transform en un elemento, puedes rotarlo, darlo
vuelta, estirarlo o comprimirlo, desplazarlo y mucho más . Así que en lugar de las propiedades left/margin-left
podemos usar transform: translateX(…) , o usar transform: scale para incrementar su tamaño, etc.
La propiedad opacity tampoco dispara “Layout” (también se salta “Paint” en Gecko de Mozilla). Podemos usarlo para
efectos de mostrar/ocultar o desvanecer/aparecer.
Aparear transform con opacity puede usualmente resolver la mayoría de nuestras necesidades brindando
animaciones vistosas y fluidas.
Aquí por ejemplo, clic en el elemento #boat le agrega la clase con transform: translateX(300) y opacity: 0 ,
haciendo que se mueva 300px a la derecha y desaparezca:
<style>
#boat {
cursor: pointer;
transition: transform 2s ease-in-out, opacity 2s ease-in-out;
}
.move {
transform: translateX(300px);
opacity: 0;
}
</style>
<script>
boat.onclick = () => boat.classList.add('move');
</script>
117/220
Resumen
Las animaciones CSS permiten animar, suavemente o por pasos, los cambios de una o varias propiedades CSS.
Son buenas para la mayoría de las tareas de animación. También podemos usar JavaScript para animaciones, el siguiente
capítulo está dedicado a eso.
Limitaciones de las animaciones CSS en comparación con las animaciones JavaScript:
+ Cosas simples hechas simplemente.
+ Rápido y ligero para la CPU.
- Las animaciones de JavaScript son flexibles. Pueden implementar cualquier lógica de animación, como una "explosión
- No solo cambios de propiedad. Podemos crear nuevos elementos en JavaScript para fines de animación.
En los ejemplos de este artículo animamos font-size , left , width , height , etc. En proyectos de la vida real es
preferible usar transform: scale() y transform: translate() para obtener mejor performance.
La mayoría de las animaciones se pueden implementar usando CSS como se describe en este capítulo. Y el evento
transitionend permite ejecutar JavaScript después de la animación, por lo que se integra bien con el código.
Pero en el próximo capítulo haremos algunas animaciones en JavaScript para cubrir casos más complejos.
Tareas
● La imagen crece al hacer clic de 40x24px a 400x240px (10 veces más grande).
● La animación dura 3 segundos.
● Al final muestra: “¡Listo!”.
● Durante el proceso de animación, puede haber más clics en el avión. No deberían “romper” nada.
A solución
Modifica la solución de la tarea anterior Animar un avión (CSS) para hacer que el avión crezca más que su tamaño original
400x240px (saltar fuera), y luego vuelva a ese tamaño.
118/220
Toma la solución de la tarea anterior como punto de partida.
A solución
Círculo animado
importancia: 5
Crea una función showCircle(cx, cy, radius) que muestre un círculo animado creciendo.
El documento fuente tiene un ejemplo de un círculo con estilos correctos, por lo que la tarea es precisamente hacer la
animación correctamente.
A solución
Ahora digamos que necesitamos no solo un círculo, sino mostrar un mensaje dentro de él. El mensaje debería aparecer
después de que la animación esté completa (el círculo es desarrollado completamente), de lo contrario se vería feo.
En la solución de la tarea, la función showCircle(cx, cy, radius) dibuja el círculo, pero no hay forma de saber
cuando lo termina.
Agrega un argumento callback: showCircle(cx, cy, radius, callback) que se llamará cuando se complete la
animación. El callback debería recibir el círculo <div> como argumento.
Aqui el ejemplo:
119/220
div.classList.add('message-ball');
div.append("Hola, mundo!");
});
Demostración:
Pruébame
A solución
Animaciones JavaScript
Usando setInterval
Una animación se puede implementar como una secuencia de frames, generalmente pequeños cambios en las propiedades
de HTML/CSS.
Por ejemplo, cambiar style.left de 0px a 100px mueve el elemento. Y si lo aumentamos en setInterval ,
cambiando en 2px con un pequeño retraso, como 50 veces por segundo, entonces se ve suave. Ese es el mismo principio
que en el cine: 24 frames por segundo son suficientes para que se vea suave.
El pseudocódigo puede verse así:
}, 20);
120/220
train.style.left = timePassed / 5 + 'px';
}
Usando requestAnimationFrame
Si las ejecutamos por separado, aunque cada una tenga setInterval (..., 20) , el navegador tendría que volver a
pintar con mucha más frecuencia que cada 20ms .
Eso es porque tienen un tiempo de inicio diferente, por lo que “cada 20ms” difiere entre las diferentes animaciones. Los
intervalos no están alineados. Así que tendremos varias ejecuciones independientes dentro de 20ms .
setInterval(function() {
animate1();
animate2();
animate3();
}, 20)
Estos varios redibujos independientes deben agruparse para facilitar el redibujado al navegador y, por lo tanto, cargar menos
CPU y verse más fluido.
Hay una cosa más a tener en cuenta. A veces, cuando el CPU está sobrecargado, o hay otras razones para volver a dibujar
con menos frecuencia (como cuando la pestaña del navegador está oculta), no deberíamos ejecutarlo cada 20ms .
Pero, ¿cómo sabemos eso en JavaScript? Hay una especificación Sincronización de animación que proporciona la
función requestAnimationFrame . Aborda todos estos problemas y aún más.
La sintaxis:
Eso programa la función callback para que se ejecute en el tiempo más cercano cuando el navegador quiera hacer una
animación.
Si hacemos cambios en los elementos dentro de callback , entonces se agruparán con otros callbacks de
requestAnimationFrame y con animaciones CSS. Así que habrá un recálculo y repintado de geometría en lugar de
muchos.
El valor devuelto requestId se puede utilizar para cancelar la llamada:
El callback obtiene un argumento: el tiempo transcurrido desde el inicio de la carga de la página en microsegundos. Este
tiempo también se puede obtener llamando a performance.now() .
Por lo general, el callback se ejecuta muy pronto, a menos que el CPU esté sobrecargado o la batería de la laptop esté
casi descargada, o haya otra razón.
El siguiente código muestra el tiempo entre las primeras 10 ejecuciones de requestAnimationFrame . Por lo general,
son 10-20ms:
121/220
<script>
let prev = performance.now();
let times = 0;
requestAnimationFrame(function measure(time) {
document.body.insertAdjacentHTML("beforeEnd", Math.floor(time - prev) + " ");
prev = time;
Animación estructurada
Ahora podemos hacer una función de animación más universal basada en requestAnimationFrame :
requestAnimationFrame(function animate(time) {
// timeFraction va de 0 a 1
let timeFraction = (time - start) / duration;
if (timeFraction > 1) timeFraction = 1;
draw(progress); // dibujar
if (timeFraction < 1) {
requestAnimationFrame(animate);
}
});
}
duration
Tiempo total de animación. Como: 1000 .
timing(timeFraction)
Función de sincronización, como la propiedad CSS transition-timing-function que obtiene la fracción de tiempo
que pasó ( 0 al inicio, 1 al final) y devuelve la finalización de la animación (como y en la curva de Bézier).
Por ejemplo, una función lineal significa que la animación continúa uniformemente con la misma velocidad:
function linear(timeFraction) {
return timeFraction;
}
0 1
Su gráfico:
Eso es como transition-timing-function: linear . A continuación se muestran variantes más interesantes.
draw(progress)
122/220
La función que toma el estado de finalización de la animación y la dibuja. El valor progress=0 denota el estado inicial de
la animación y progress=1 – el estado final.
function draw(progress) {
train.style.left = progress + 'px';
}
…O hacer cualquier otra cosa, podemos animar cualquier cosa, de cualquier forma.
animate({
duration: 1000,
timing(timeFraction) {
return timeFraction;
},
draw(progress) {
elem.style.width = progress * 100 + '%';
}
});
A diferencia de la animación CSS, aquí podemos hacer cualquier función de sincronización y cualquier función de dibujo. La
función de sincronización no está limitada por las curvas de Bézier. Y draw puede ir más allá de las propiedades, crear
nuevos elementos para la animación de fuegos artificiales o algo así.
Funciones de sincronización
Veamos más de ellas. Intentaremos animaciones de movimiento con diferentes funciones de sincronización para ver cómo
funcionan.
Potencia de n
Si queremos acelerar la animación, podemos usar progress en la potencia n .
function quad(timeFraction) {
return Math.pow(timeFraction, 2)
}
La gráfica:
0 1
123/220
…O la curva cúbica o incluso mayor n . Aumentar la potencia hace que se acelere más rápido.
0 1
En acción:
El arco
Función:
function circ(timeFraction) {
return 1 - Math.sin(Math.acos(timeFraction));
}
La gráfica:
0 1
124/220
1
0 1
Rebotar
Imagina que dejamos caer una pelota. Se cae, luego rebota unas cuantas veces y se detiene.
La función bounce hace lo mismo, pero en orden inverso: el “rebote” comienza inmediatamente. Utiliza algunos
coeficientes especiales para eso:
function bounce(timeFraction) {
for (let a = 0, b = 1; 1; a += b, b /= 2) {
if (timeFraction >= (7 - 4 * a) / 11) {
return -Math.pow((11 - 6 * a - 11 * timeFraction) / 4, 2) + Math.pow(b, 2)
}
}
}
En acción:
Animación elástica
Una función “elástica” más que acepta un parámetro adicional x para el “rango inicial”.
0 1
Inversión: ease*
Entonces tenemos una colección de funciones de sincronización. Su aplicación directa se llama “easyIn”.
125/220
A veces necesitamos mostrar la animación en orden inverso. Eso se hace con la transformación “easyOut”.
easeOut
En el modo “easyOut”, la función de sincronización se coloca en un wrapper timingEaseOut :
En otras palabras, tenemos una función de “transformación” makeEaseOut que toma una función de sincronización
“regular” y devuelve el wrapper envolviéndola:
https://plnkr.co/edit/v6NSfMa0ypglZabT?p=preview
0 1
easeInOut
También podemos mostrar el efecto tanto al principio como al final de la animación. La transformación se llama “easyInOut”.
Dada la función de tiempo, calculamos el estado de la animación de la siguiente manera:
El código wrapper:
function makeEaseInOut(timing) {
return function(timeFraction) {
if (timeFraction < .5)
return timing(2 * timeFraction) / 2;
else
return (2 - timing(2 * (1 - timeFraction))) / 2;
126/220
}
}
bounceEaseInOut = makeEaseInOut(bounce);
En acción, bounceEaseInOut :
https://plnkr.co/edit/Vh0Q3ShC7IOHEyQN?p=preview
La transformación “easyInOut” une dos gráficos en uno: easyIn (regular) para la primera mitad de la animación y
easyOut (invertido) – para la segunda parte.
0 1
Como podemos ver, el gráfico de la primera mitad de la animación es el easyIn reducido y la segunda mitad es el
easyOut reducido. Como resultado, la animación comienza y termina con el mismo efecto.
En lugar de mover el elemento podemos hacer otra cosa. Todo lo que necesitamos es escribir la función draw adecuada.
https://plnkr.co/edit/pzNmYk0GHZZgqXhw?p=preview
Resumen
Para animaciones que CSS no puede manejar bien, o aquellas que necesitan un control estricto, JavaScript puede ayudar.
Las animaciones de JavaScript deben implementarse a través de requestAnimationFrame . Ese método integrado
permite configurar una función callback para que se ejecute cuando el navegador esté preparando un repintado. Por lo
general, es muy pronto, pero el tiempo exacto depende del navegador.
Cuando una página está en segundo plano, no se repinta en absoluto, por lo que el callback no se ejecutará: la animación se
suspenderá y no consumirá recursos. Eso es genial.
Aquí está la función auxiliar animate para configurar la mayoría de las animaciones:
requestAnimationFrame(function animate(time) {
// timeFraction va de 0 a 1
let timeFraction = (time - start) / duration;
if (timeFraction > 1) timeFraction = 1;
draw(progress); // dibujar
if (timeFraction < 1) {
127/220
requestAnimationFrame(animate);
}
});
}
Opciones:
●
duration – el tiempo total de animación en ms.
● timing – la función para calcular el progreso de la animación. Obtiene una fracción de tiempo de 0 a 1, devuelve el
progreso de la animación, generalmente de 0 a 1.
●
draw – la función para dibujar la animación.
Seguramente podríamos mejorarlo, agregar más campanas y silbidos, pero las animaciones de JavaScript no se aplican a
diario. Se utilizan para hacer algo interesante y no estándar. Por lo tanto, querrás agregar las funciones que necesitas
cuando las necesites.
Las animaciones JavaScript pueden utilizar cualquier función de sincronización. Cubrimos muchos ejemplos y
transformaciones para hacerlos aún más versátiles. A diferencia de CSS, aquí no estamos limitados a las curvas de Bézier.
Lo mismo ocurre con draw : podemos animar cualquier cosa, no solo propiedades CSS.
Tareas
Haz una pelota que rebote. Haz clic para ver cómo debería verse:
A solución
Toma la solución de la tarea anterior Animar la pelota que rebota como fuente.
128/220
A solución
Componentes Web
Los componentes web son un conjunto de estándares para crear componentes autónomos: elementos HTML personalizados
con sus propias propiedades y métodos, DOM encapsulado y estilos.
En esta sección se describe un conjunto de normas modernas para los “web components”.
En la actualidad, estos estándares están en desarrollo. Algunas características están bien apoyadas e integradas en el
standard moderno HTML/DOM, mientras que otras están aún en fase de borrador. Puedes probar algunos ejemplos en
cualquier navegador, Google Chrome es probablemente el que más actualizado esté con estas características. Suponemos
que eso se debe a que los compañeros de Google están detrás de muchas de las especificaciones relacionadas.
La idea del componente completo no es nada nuevo. Se usa en muchos frameworks y en otros lugares.
Antes de pasar a los detalles de implementación, echemos un vistazo a este gran logro de la humanidad:
129/220
La Estación Espacial Internacional:
●
Está formada por muchos componentes.
● Cada componente, a su vez, tiene muchos detalles más pequeños en su interior.
●
Los componentes son muy complejos, mucho más complicados que la mayoría de los sitios web.
●
Los componentes han sido desarrollados internacionalmente, por equipos de diferentes países, que hablan diferentes
idiomas.
Arquitectura de componentes
La regla más conocida para desarrollar software complejo es: no hacer software complejo.
Si algo se vuelve complejo – divídelo en partes más simples y conéctalas de la manera más obvia.
2 4
3 6
130/220
1. Navegación superior.
2. Información usuario.
3. Sugerencias de seguimiento.
4. Envío de formulario.
5. (y también 6, 7) – mensajes.
Los componentes pueden tener subcomponentes, p.ej. los mensajes pueden ser parte de un componente “lista de mensajes”
de nivel superior. Una imagen de usuario en sí puede ser un componente, y así sucesivamente.
¿Cómo decidimos qué es un componente? Eso viene de la intuición, la experiencia y el sentido común. Normalmente es una
entidad visual separada que podemos describir en términos de lo que hace y cómo interactúa con la página. En el caso
anterior, la página tiene bloques, cada uno de ellos juega su propio papel, es lógico crear esos componentes.
Un componente tiene:
●
Su propia clase de JavaScript.
●
La estructura DOM, gestionada únicamente por su clase, el código externo no accede a ella (principio de “encapsulación”).
●
Estilos CSS, aplicados al componente.
● API: eventos, métodos de clase etc, para interactuar con otros componentes.
Existen muchos frameworks y metodologías de desarrollos para construirlos, cada uno con sus propias características y
reglas. Normalmente, se utilizan clases y convenciones CSS para proporcionar la “sensación de componente” – alcance de
CSS y encapsulación de DOM.
“Web components” proporcionan capacidades de navegación incorporadas para eso, así que ya no tenemos que emularlos.
● Custom elements – para definir elementos HTML personalizados.
● Shadow DOM – para crear un DOM interno para el componente, oculto a los demás componentes.
● CSS Scoping – para declarar estilos que sólo se aplican dentro del Shadow DOM del componente.
● Event retargeting y otras cosas menores para hacer que los componentes se ajusten mejor al desarrollo.
En el próximo capítulo entraremos en detalles en los “Custom Elements” – la característica fundamental y bien soportada de
los componentes web, buena por sí misma.
Elementos personalizados
Podemos crear elementos HTML personalizados con nuestras propias clases; con sus propios métodos, propiedades,
eventos y demás.
Una vez que definimos el elemento personalizado, podemos usarlo a la par de elementos HTML nativos.
Esto es grandioso, porque el el diccionario HTML es rico, pero no infinito. No hay <aletas-faciles> , <gira-
carrusel> , <bella-descarga> … Solo piensa en cualquier otra etiqueta que puedas necesitar.
Podemos definirlos con una clase especial, y luego usarlos como si siempre hubieran sido parte del HTML.
Hay dos clases de elementos personalizados:
1. Elementos personalizados autónomos – son elementos “todo-nuevo”, extensiones de la clase abstracta
HTMLElement .
2. Elementos nativos personalizados – son extensiones de elementos nativos, por ejemplo un botón personalizado
basado en HTMLButtonElement .
Primero cubriremos los elementos autónomos, luego pasaremos a la personalización de elementos nativos.
Para crear un elemento personalizado, necesitamos decirle al navegador varios detalles acerca de él: cómo mostrarlo, qué
hacer cuando el elemento es agregado o quitado de la página, etc.
Eso se logra creando una clase con métodos especiales. Es fácil, son unos pocos métodos y todos ellos son opcionales.
131/220
}
connectedCallback() {
// el navegador llama a este método cuando el elemento es agregado al documento
// (puede ser llamado varias veces si un elemento es agregado y quitado repetidamente)
}
disconnectedCallback() {
// el navegador llama a este método cuando el elemento es quitado del documento
// (puede ser llamado varias veces si un elemento es agregado y quitado repetidamente)
}
adoptedCallback() {
// es llamado cuando el elemento es movido a un nuevo documento
// (ocurre en document.adoptNode, muy raramente usado)
}
// hacer saber al navegador que <my-element> es servido por nuestra nueva clase
customElements.define("my-element", MyElement);
A partir de ello, para cada elemento HTML con la etiqueta <my-element> se crea una instancia de MyElement y se
llaman los métodos mencionados. También podemos insertarlo con JavaScript: document.createElement('my-
element') .
Esto se hace para asegurar que no haya conflicto de nombres entre los elementos nativos y los personalizados.
Ejemplo: “time-formatted”
Ya existe un elemento <time> en HTML para presentar fecha y hora, pero este no hace ningún formateo por sí mismo.
Construyamos el elemento <time-formatted> que muestre la hora en un bonito formato y reconozca la configuración de
lengua local:
<script>
class TimeFormatted extends HTMLElement { // (1)
connectedCallback() {
let date = new Date(this.getAttribute('datetime') || Date.now());
132/220
customElements.define("time-formatted", TimeFormatted); // (2)
</script>
1. La clase tiene un solo método, connectedCallback() , que es llamado por el navegador cuando se agrega el
elemento <time-formatted> a la página o cuando el analizador HTML lo detecta. Este método usa el formateador de
datos nativo Intl.DateTimeFormat , bien soportado por los navegadores, para mostrar una agradable hora formateada.
2. Necesitamos registrar nuestro nuevo elemento con customElements.define(tag, class) .
3. Y podremos usarlo por doquier.
Una vez que customElement.define es llamado, estos elementos son “actualizados”: para cada elemento, una
nueva instancia de TimeFormatted es creada y connectedCallback es llamado. Se vuelven :defined .
Para obtener información acerca de los elementos personalizados, tenemos los métodos:
●
customElements.get(name) – devuelve la clase del elemento personalizado con el name dado,
● customElements.whenDefined(name) – devuelve una promesa que se resuelve (sin valor) cuando un elemento
personalizado con el name dado se vuelve defined .
La razón es simple: cuando el constructor es llamado, es aún demasiado pronto. El elemento es creado, pero el
navegador aún no procesó ni asignó atributos en este estado, entonces las llamadas a getAttribute devolverían
null . Así que no podemos renderizar ahora.
Por otra parte, si lo piensas, es más adecuado en términos de performance: demorar el trabajo hasta que realmente se lo
necesite.
El connectedCallback se dispara cuando el elemento es agregado al documento. No apenas agregado a otro
elemento como hijo, sino cuando realmente se vuelve parte de la página. Así podemos construir un DOM separado, crear
elementos y prepararlos para uso futuro. Ellos serán realmente renderizados una vez que estén dentro de la página.
Observando atributos
En la implementación actual de <time-formatted> , después de que el elemento fue renderizado, cambios posteriores
en sus atributos no tendrán ningún efecto. Eso es extraño para un elemento HTML, porque cuando cambiamos un atributo
(como en a.href ) esperamos que dicho cambio sea visible de inmediato. Corrijamos esto.
Podemos observar atributos suministrando la lista de ellos al getter estático observedAttributes() . Cuando esos
atributos son modificados, se dispara attributeChangedCallback . No se dispara para los atributos no incluidos en la
lista, por razones de performance.
A continuación, el nuevo <time-formatted> que se actualiza cuando los atributos cambian:
<script>
class TimeFormatted extends HTMLElement {
render() { // (1)
133/220
let date = new Date(this.getAttribute('datetime') || Date.now());
connectedCallback() { // (2)
if (!this.rendered) {
this.render();
this.rendered = true;
}
}
customElements.define("time-formatted", TimeFormatted);
</script>
<script>
setInterval(() => elem.setAttribute('datetime', new Date()), 1000); // (5)
</script>
5:12:43 AM
Orden de renderizado
Cuando el “parser” construye el DOM, los elementos son procesados uno tras otro, padres antes que hijos. Por ejemplo si
tenemos <outer><inner></inner></outer> , el elemento <outer> es creado y conectado al DOM primero, y luego
<inner> .
Por ejemplo, si un elemento personalizado trata de acceder a innerHTML en connectedCallback , no obtiene nada:
<script>
customElements.define('user-info', class extends HTMLElement {
connectedCallback() {
alert(this.innerHTML); // vacío (*)
}
});
</script>
<user-info>John</user-info>
134/220
Esto es porque no hay hijos en aquel estadio, pues el DOM no está finalizado. Se conectó el elemento personalizado
<user-info> y está por proceder con sus hijos, pero no lo hizo aún.
Si queremos pasar información al elemento personalizado, podemos usar atributos. Estos están disponibles inmediatamente.
O, si realmente necesitamos acceder a los hijos, podemos demorar el acceso a ellos con un setTimeout de tiempo cero.
Esto funciona:
<script>
customElements.define('user-info', class extends HTMLElement {
connectedCallback() {
setTimeout(() => alert(this.innerHTML)); // John (*)
}
});
</script>
<user-info>John</user-info>
Ahora el alert en la línea (*) muestra “John” porque lo corremos asincrónicamente, después de que el armado HTML
está completo. Podemos procesar los hijos si lo necesitamos y finalizar la inicialización.
Por otro lado, la solución tampoco es perfecta. Si los elementos anidados también usan setTimeout para inicializarse,
entonces van a la cola: el setTimeout externo se dispara primero y luego el interno.
<script>
customElements.define('user-info', class extends HTMLElement {
connectedCallback() {
alert(`${this.id} connected.`);
setTimeout(() => alert(`${this.id} initialized.`));
}
});
</script>
<user-info id="outer">
<user-info id="inner"></user-info>
</user-info>
Orden de salida:
1. outer conectado.
2. inner conectado.
3. outer inicializado.
4. inner inicializado.
Claramente vemos que el elemento finaliza su inicialización (3) antes que el interno (4) .
No existe un callback nativo que se dispare después de que los elementos anidados estén listos. Si es necesario, podemos
implementarlo nosotros mismos. Por ejemplo, los elementos internos pueden disparar eventos como initialized , y los
externos pueden escucharlos para reaccionar a ellos.
Los elementos nuevos que creamos, tales como <time-formatted> , no tienen ninguna semántica asociada. Para los
motores de búsqueda son desconocidos, y los dispositivos de accesibilidad tampoco pueden manejarlos.
Pero estas cosas son importantes. Por ejemplo, un motor de búsqueda podría estar interesado en saber que realmente
mostramos la hora. y si hacemos una clase especial de botón, ¿por qué no reusar la funcionalidad ya existente de
<button> ?
Podemos extender y personalizar elementos HTML nativos, heredando desde sus clases.
Por ejemplo, los botones son instancias de HTMLButtonElement , construyamos sobre ello.
135/220
1. Extender HTMLButtonElement con nuestra clase:
Puede haber diferentes etiquetas que comparten la misma clase DOM, por eso se necesita especificar extends .
3. Por último, para usar nuestro elemento personalizado, insertamos una etiqueta común <button> , pero le agregamos
is="hello-button" :
<button is="hello-button">...</button>
El ejemplo completo:
<script>
// El botón que dice "hello" al hacer clic
class HelloButton extends HTMLButtonElement {
constructor() {
super();
this.addEventListener('click', () => alert("Hello!"));
}
}
Click me Disabled
Nuestro nuevo botón extiende el ‘button’ nativo. Así mantenemos los mismos estilos y características estándar, como por
ejemplo el atributo disabled .
Referencias
●
HTML estándar vivo: https://html.spec.whatwg.org/#custom-elements .
●
Compatibilidad: https://caniuse.com/#feat=custom-elementsv1 .
Resumen
Esquema de definición:
136/220
Requiere un argumento más .define , y is="..." en HTML:
Los elementos personalizados tienen muy buen soporte entre los navegadores. Existe un polyfill
https://github.com/webcomponents/polyfills/tree/master/packages/webcomponentsjs .
Tareas
Uso:
<live-timer id="elem"></live-timer>
<script>
elem.addEventListener('tick', event => console.log(event.detail));
</script>
Demo:
5:12:43 AM
A solución
Shadow DOM
Shadow DOM sirve para el encapsulamiento. Le permite a un componente tener su propio árbol DOM oculto, que no puede
ser accedido por accidente desde el documento principal, puede tener reglas de estilo locales, y más.
¿Alguna vez pensó cómo los controles complejos del navegador se crean y se les aplica estilo?
Tales como <input type="range"> :
El navegador usa DOM/CSS internamente para dibujarlos. Esa estructura DOM normalmente está oculta para nosotros, pero
podemos verla con herramientas de desarrollo. Por ejemplo, en Chrome, necesitamos habilitar la opción “Show user agent
shadow DOM” en las herramientas de desarrollo.
Entonces <input type="range"> se ve algo así:
137/220
Lo que ves bajo #shadow-root se llama “shadow DOM”.
No podemos obtener los elementos de shadow DOM incorporados con llamadas normales a JavaScript o selectores. Estos
no son hijos normales sino una poderosa técnica de encapsulamiento.
En el ejemplo de abajo podemos ver un útil atributo pseudo . No es estándar, existe por razones históricas. Podemos usarlo
para aplicar estilo a subelementos con CSS como aquí:
<style>
/* hace el control deslizable rojo */
input::-webkit-slider-runnable-track {
background: red;
}
</style>
<input type="range">
De nuevo: pseudo no es un atributo estándar. Cronológicamente, los navegadores primero comenzaron a experimentar
con estructuras DOM internas para implementar controles, y luego, con el tiempo, fue estandarizado shadow DOM que nos
permite, a nosotros desarrolladores, hacer algo similar.
Si un elemento tiene ambos, el navegador solamente construye el árbol shadow. Pero también podemos establecer un tipo
de composición entre árboles shadow y light. Veremos los detalles en el capítulo Shadow DOM slots, composición.
El árbol shadow puede ser usado en elementos personalizados para ocultar los componentes internos y aplicarles estilos
locales.
Por ejemplo, este elemento <show-hello> oculta su DOM interno en un shadow tree:
<script>
customElements.define('show-hello', class extends HTMLElement {
connectedCallback() {
const shadow = this.attachShadow({mode: 'open'});
shadow.innerHTML = `<p>
Hello, ${this.getAttribute('name')}
</p>`;
}
});
</script>
<show-hello name="John"></show-hello>
Hello, John
Así es como el DOM resultante se ve en las herramientas de desarrollador de Chrome, todo el contenido está bajo
“#shadow-root”:
138/220
Primero, el llamado a elem.attachShadow({mode: …}) crea un árbol shadow.
La opción mode establece el nivel de encapsulamiento. Debe tener uno de estos dos valores:
●
"open" – Abierto: la raíz shadow está disponible como elem.shadowRoot .
Solamente podemos acceder al shadow DOM por medio de la referencia devuelta por attachShadow (y probablemente
oculta dentro de un class). Árboles shadow nativos del navegador, tales como <input type="range"> , son “closed”.
No hay forma de accederlos.
La raíz shadow root , devuelta por attachShadow , es como un elemento: podemos usar innerHTML o métodos DOM
tales como append para llenarlo.
El elemento con una raíz shadow es llamado “shadow tree host” (anfitrión de árbol shadow), y está disponible como la
propiedad host de shadow root:
Encapsulamiento
Shadow DOM está fuertemente delimitado del documento principal “main document”:
1. Los elementos Shadow DOM no son visibles para querySelector desde el DOM visible (light DOM). En particular, los
elementos Shadow DOM pueden tener ids en conflicto con aquellos en el DOM visible. Estos deben ser únicos solamente
dentro del árbol shadow.
2. El Shadow DOM tiene stylesheets propios. Las reglas de estilo del exterior DOM no se le aplican.
Por ejemplo:
<style>
/* document style no será aplicado al árbol shadow dentro de #elem (1) */
p { color: red; }
</style>
<div id="elem"></div>
<script>
elem.attachShadow({mode: 'open'});
// el árbol shadow tiene su propio style (2)
elem.shadowRoot.innerHTML = `
<style> p { font-weight: bold; } </style>
<p>Hello, John!</p>
`;
// <p> solo es visible en consultas "query" dentro del árbol shadow (3)
alert(document.querySelectorAll('p').length); // 0
alert(elem.shadowRoot.querySelectorAll('p').length); // 1
</script>
139/220
Referencias
●
DOM: https://dom.spec.whatwg.org/#shadow-trees
●
Compatibilidad: https://caniuse.com/#feat=shadowdomv1
● Shadow DOM es mencionado en muchas otras especificaciones, por ejemplo DOM Parsing especifica que el shadow
root tiene innerHTML .
Resumen
El Shadow DOM, si existe, es construido por el navegador en lugar del DOM visible llamado “light DOM” (hijo regular). En el
capítulo Shadow DOM slots, composición veremos cómo se componen.
Elemento template
El elemento incorporado <template> sirve como almacenamiento para plantillas de markup de HTML. El navegador
ignora su contenido, solo verifica la validez de la sintaxis, pero podemos acceder a él y usarlo en JavaScript para crear otros
elementos.
En teoría, podríamos crear cualquier elemento invisible en algún lugar de HTML par fines de almacenamiento de HTML
markup. ¿Qué hay de especial en <template> ?
En primer lugar, su contenido puede ser cualquier HTML válido, incluso si normalmente requiere una etiqueta adjunta
adecuada.
Por ejemplo, podemos poner una fila de tabla <tr> :
<template>
<tr>
<td>Contenidos</td>
</tr>
</template>
Normalmente, si intentamos poner <tr> dentro, digamos, de un <div> , el navegador detecta la estructura DOM como
inválida y la “arregla”, y añade un <table> alrededor. Eso no es lo que queremos. Sin embargo, <template> mantiene
exactamente lo que ponemos allí.
También podemos poner estilos y scripts dentro de <template> :
<template>
<style>
p { font-weight: bold; }
</style>
<script>
alert("Hola");
</script>
</template>
El navegador considera al contenido <template> “fuera del documento”: Los estilos no son aplicados, los scripts no son
ejecutados, <video autoplay> no es ejecutado, etc.
El contenido cobra vida (estilos aplicados, scripts, etc) cuando los insertamos dentro del documento.
140/220
Insertando template
El contenido template está disponible en su propiedad content como un DocumentFragment: un tipo especial de nodo
DOM.
Podemos tratarlo como a cualquier otro nodo DOM, excepto por una propiedad especial: cuando lo insertamos en algún
lugar, sus hijos son insertados en su lugar.
Por ejemplo:
<template id="tmpl">
<script>
alert("Hola");
</script>
<div class="message">¡Hola mundo!</div>
</template>
<script>
let elem = document.createElement('div');
document.body.append(elem);
// Ahora el script de <template> se ejecuta
</script>
<template id="tmpl">
<style> p { font-weight: bold; } </style>
<p id="message"></p>
</template>
<script>
elem.onclick = function() {
elem.attachShadow({mode: 'open'});
elem.shadowRoot.append(tmpl.content.cloneNode(true)); // (*)
En la línea (*) , cuando clonamos e insertamos tmpl.content como su DocumentFragment , sus hijos ( <style> ,
<p> ) se insertan en su lugar.
<div id="elem">
#shadow-root
<style> p { font-weight: bold; } </style>
<p id="message"></p>
</div>
Resumen
Para resumir:
● El contenido <template> puede ser cualquier HTML sintácticamente correcto.
● El contenido <template> es considerado “fuera del documento”, para que no afecte a nada.
● Podemos acceder a template.content desde JavaScript, y clonarlo para reusarlo en un nuevo componente.
141/220
La etiqueta <template> es bastante única, ya que:
● El navegador comprueba la sintaxis HTML dentro de él (lo opuesto a usar una plantilla string dentro de un script).
● …Pero aún permite el uso de cualquier etiqueta HTML de alto nivel, incluso aquellas que no tienen sentido sin un
envoltorio adecuado (por ej. <tr> ).
●
El contenido se vuelve interactivo cuando es insertado en el documento: los scripts se ejecutan, <video autoplay> se
reproduce, etc.
El elemento <template> no ofrece ningún mecanismo de iteración, enlazamiento de datos o sustitución de variables, pero
podemos implementar los que están por encima.
<custom-menu>
<title>Menú de dulces</title>
<item>Paletas</item>
<item>Tostada de frutas</item>
<item>Magdalenas</item>
</custom-menu>
…Entonces nuestro componente debería renderizar correctamente, como un agradable menú con un título y elementos
dados, manejar eventos de menú, etc.
¿Cómo implementarlo?
Podríamos intentar analizar el contenido del elemento y copiar y reorganizar dinámicamente los nodos del DOM. Esto es
posible, pero si estamos moviendo elementos al shadow DOM, entonces los estilos CSS del documento no se aplican allí,
por lo que se puede perder el estilo visual. También eso requiere algo de programación.
Afortunadamente, no tenemos que hacerlo. Shadow DOM soporta elementos <slot> , que se llenan automáticamente con
el contenido del light DOM.
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `
<div>Nombre:
<slot name="username"></slot>
</div>
<div>Cumpleaños:
<slot name="birthday"></slot>
</div>
`;
}
});
</script>
<user-card>
<span slot="username">John Smith</span>
<span slot="birthday">01.01.2001</span>
</user-card>
142/220
Nombre: John Smith
Cumpleaños: 01.01.2001
En el shadow DOM, <slot name="X"> define un “punto de inserción”, un lugar donde se renderizan los elementos con
slot="X" .
Luego, el navegador realiza la “composición”: toma elementos del light DOM y los renderiza en los slots correspondientes del
shadow DOM. Al final, tenemos exactamente lo que queremos: un componente que se puede llenar con datos.
Aquí está la estructura del DOM después del script, sin tener en cuenta la composición:
<user-card>
#shadow-root
<div>Nombre:
<slot name="username"></slot>
</div>
<div>Cumpleaños:
<slot name="birthday"></slot>
</div>
<span slot="username">John Smith</span>
<span slot="birthday">01.01.2001</span>
</user-card>
Creamos el shadow DOM, así que aquí está, en #shadow-root . Ahora el elemento tiene ambos, light DOM y shadow
DOM.
Para fines de renderizado, para cada <slot name="..."> en el shadow DOM, el navegador busca slot="..." con el
mismo nombre en el light DOM. Estos elementos se renderizan dentro de los slots:
<user-card>
#shadow-root
<div>Nombre:
<slot name="username">
<!-- el elemento esloteado se inserta en el slot -->
<span slot="username">John Smith</span>
</slot>
</div>
<div>Cumpleaños:
<slot name="birthday">
<span slot="birthday">01.01.2001</span>
</slot>
</div>
</user-card>
…Pero el flattened DOM existe solo para fines de procesamiento y manejo de eventos. Es una especie de “virtual DOM”. Así
se muestran las cosas. Pero los nodos del documento en realidad no se mueven!
Eso se puede comprobar fácilmente si ejecutamos querySelectorAll : los nodos todavía están en sus lugares.
143/220
Entonces, el flattened DOM se deriva del shadow DOM insertando slots. El navegador lo renderiza y lo usa para la herencia
de estilo, la propagación de eventos (más sobre esto más adelante). Pero JavaScript todavía ve el documento “tal cual”,
antes de acoplarlo.
Solo los nodos hijos de alto nivel pueden tener el atributo slot="…"
El atributo slot =" ... " solo es válido para los hijos directos del shadow host (en nuestro ejemplo, el elemento
<user-card> ). Para los elementos anidados, se ignora.
Por ejemplo, el segundo <span> aquí se ignora (ya que no es un elemento hijo de nivel superior de <user-card> ):
<user-card>
<span slot="username">John Smith</span>
<div>
<!-- slot no válido, debe ser hijo directo de user-card -->
<span slot="birthday">01.01.2001</span>
</div>
</user-card>
Si hay varios elementos en el light DOM con el mismo nombre de slot, se añaden al slot, uno tras otro.
Por ejemplo, este:
<user-card>
<span slot="username">John</span>
<span slot="username">Smith</span>
</user-card>
<user-card>
#shadow-root
<div>Nombre:
<slot name="username">
<span slot="username">John</span>
<span slot="username">Smith</span>
</slot>
</div>
<div>Cumpleaños:
<slot name="birthday"></slot>
</div>
</user-card>
Si ponemos algo dentro de un <slot> , se convierte en el contenido alternativo, “predeterminado”. El navegador lo muestra
si no tiene un equivalente en el Light DOM desde donde llenarlo.
Por ejemplo, en esta parte del shadow DOM, se representa Anónimo si no hay slot="username" en el light DOM.
<div>Name:
<slot name="username">anónimo</slot>
</div>
El primer <slot> en el shadow DOM que no tiene un nombre es un slot “predeterminado”. Obtiene todos los nodos del light
DOM que no están ubicados en otro lugar.
Por ejemplo, agreguemos el slot predeterminado a nuestro <user-card> que muestra toda la información sin slotear
sobre el usuario:
<script>
144/220
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `
<div>Nombre:
<slot name="username"></slot>
</div>
<div>Cumpleaños:
<slot name="birthday"></slot>
</div>
<fieldset>
<legend>Otra información</legend>
<slot></slot>
</fieldset>
`;
}
});
</script>
<user-card>
<div>Me gusta nadar.</div>
<span slot="username">John Smith</span>
<span slot="birthday">01.01.2001</span>
<div>...Y jugar volleyball también!</div>
</user-card>
Todo el contenido del light DOM sin slotear entra en el conjunto de campos “Otra información”.
Los elementos se agregan a un slot uno tras otro, por lo que ambas piezas de información sin slotear se encuentran juntas
en el slot predeterminado.
<user-card>
#shadow-root
<div>Nombre:
<slot name="username">
<span slot="username">John Smith</span>
</slot>
</div>
<div>Cumpleaños:
<slot name="birthday">
<span slot="birthday">01.01.2001</span>
</slot>
</div>
<fieldset>
<legend>Otra información</legend>
<slot>
<div>Me gusta nadar.</div>
<div>...Y jugar volleyball también!</div>
</slot>
</fieldset>
</user-card>
Ejemplo de menú
<custom-menu>
<span slot="title">Menú de dulces</span>
<li slot="item">Paletas</li>
145/220
<li slot="item">Tostada de frutas</li>
<li slot="item">Magdalenas</li>
</custom-menu>
<template id="tmpl">
<style> /* estilos del menu */ </style>
<div class="menu">
<slot name="title"></slot>
<ul><slot name="item"></slot></ul>
</div>
</template>
<custom-menu>
#shadow-root
<style> /* estilos del menu */ </style>
<div class="menu">
<slot name="title">
<span slot="title">Menú de dulces</span>
</slot>
<ul>
<slot name="item">
<li slot="item">Paletas</li>
<li slot="item">Tostada de frutas</li>
<li slot="item">Magdalenas</li>
</slot>
</ul>
</div>
</custom-menu>
Uno podría notar que, en un DOM válido, <li> debe ser un hijo directo de <ul> . Pero esto es flattened DOM, describe
cómo se representa el componente, tal cosa sucede naturalmente aquí.
Solo necesitamos agregar un manejador de click para abrir/cerrar la lista, y el <custom-menu> está listo:
// no podemos seleccionar nodos del light DOM, así que manejemos los clics en el slot
this.shadowRoot.querySelector('slot[name="title"]').onclick = () => {
// abrir/cerrar el menú
this.shadowRoot.querySelector('.menu').classList.toggle('closed');
};
}
});
📂Candy menu
Lollipop
Fruit Toast
Cup Cake
146/220
Actualizar slots
Por ejemplo, aquí el elemento del menú se inserta dinámicamente después de 1 segundo y el título cambia después de 2
segundos.:
<custom-menu id="menu">
<span slot="title">Menú de dulces</span>
</custom-menu>
<script>
customElements.define('custom-menu', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `<div class="menu">
<slot name="title"></slot>
<ul><slot name="item"></slot></ul>
</div>`;
// shadowRoot no puede tener controladores de eventos, por lo que se usa el primer hijo
this.shadowRoot.firstElementChild.addEventListener('slotchange',
e => alert("slotchange: " + e.target.name)
);
}
});
setTimeout(() => {
menu.insertAdjacentHTML('beforeEnd', '<li slot="item">Paletas</li>')
}, 1000);
setTimeout(() => {
menu.querySelector('[slot="title"]').innerHTML = "Nuevo menú";
}, 2000);
</script>
1. En la inicialización:
slotchange: title se dispara inmediatamente, cuando el slot="title" desde el light DOM entra en el slot
correspondiente.
2. Después de 1 segundo:
Observa que no hay ningún evento slotchange después de 2 segundos, cuando se modifica el contenido de slot =
"title" . Eso es porque no hay cambio en el slot. Modificamos el contenido dentro del elemento esloteado, eso es otra
cosa.
Si quisiéramos rastrear las modificaciones internas del Light DOM desde JavaScript, eso también es posible usando un
mecanismo más genérico: MutationObserver.
Slot API
Como hemos visto antes, JavaScript busca en el DOM “real”, sin aplanar. Pero, si el shadow tree tiene {mode: 'open'} ,
podemos averiguar qué elementos hay asignados a un slot y, viceversa, averiguar el slot por el elemento dentro de el:
● node.assignedSlot – retorna el elemento <slot> al que está asignado el nodo .
147/220
● slot.assignedNodes({flatten: true/false}) – Nodos DOM, asignados al slot. La opción flatten es
false por defecto. Si se establece explícitamente a true , entonces mira más profundamente en el flattened DOM,
retornando slots anidadas en caso de componentes anidados y el contenido de respaldo si ningún node está asignado.
● slot.assignedElements({flatten: true/false}) – Elementos DOM, asignados al slot (igual que arriba, pero
solo nodos de elementos).
Estos métodos son útiles cuando no solo necesitamos mostrar el contenido esloteado, sino también rastrearlo en JavaScript.
Por ejemplo, si el componente <custom-menu> quiere saber qué muestra, entonces podría rastrear slotchange y
obtener los elementos de slot.assignedElements :
<custom-menu id="menu">
<span slot="title">Menú de dulces</span>
<li slot="item">Paletas</li>
<li slot="item">Tostada de frutas</li>
</custom-menu>
<script>
customElements.define('custom-menu', class extends HTMLElement {
items = []
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `<div class="menu">
<slot name="title"></slot>
<ul><slot name="item"></slot></ul>
</div>`;
Resumen
Por lo general, si un elemento tiene shadow DOM, no se muestra su light DOM. Los slots permiten mostrar elementos del
light DOM en lugares específicos del shadow DOM.
Hay dos tipos de slots:
● Named slots: <slot name="X">...</slot> – consigue los light children con slot="X" .
●
Default slot: el primer <slot> sin un nombre (los slots subsiguientes sin nombre se ignoran) – obtiene light children sin
slotear.
● Si hay muchos elementos para el mismo slot, se añaden uno tras otro.
● El contenido del elemento <slot> se utiliza como respaldo. Se muestra si no hay light children para el slot.
El proceso de renderizar elementos sloteados dentro de sus slots se llama “composición”. El resultado se denomina
“flattened DOM”.
La composición no mueve realmente los nodos, desde el punto de vista de JavaScript, el DOM sigue siendo el mismo.
JavaScript puede acceder a los slots mediante estos métodos:
● slot.assignedNodes/Elements() – retorna nodos/elementos dentro del slot .
●
node.assignedSlot – la propiedad inversa, retorna el slot por un nodo.
148/220
●
slotchange event – se activa la primera vez que se llena un slot, y en cualquier operación de agregar/quitar/reemplazar
del elemento esloteado, pero no sus hijos. El slot es event.target .
● MutationObserver para profundizar en el contenido del slot, observar los cambios en su interior.
Ahora que, como sabemos cómo mostrar elementos del light DOM en el shadow DOM, veamos cómo diseñarlos
correctamente. La regla básica es que los elementos shadow se diseñan en el interior y los elementos light se diseñan
afuera, pero hay notables excepciones.
Veremos los detalles en el próximo capítulo.
Shadow DOM puede incluir las etiquetas <style> y <link rel="stylesheet" href="…"> . En este último caso, las
hojas de estilo se almacenan en la caché HTTP, por lo que no se vuelven a descargar para varios de los componentes que
usan la misma plantilla.
Como regla general, los estilos locales solo funcionan dentro del shadow tree, y los estilos de documentos funcionan fuera
de él. Pero hay pocas excepciones.
:host
El selector :host permite seleccionar el shadow host (el elemento que contiene el shadow tree).
Por ejemplo, estamos creando un elemento <custom-dialog> que debería estar centrado. Para eso necesitamos diseñar
el elemento <custom-dialog> .
<template id="tmpl">
<style>
/* el estilo se aplicará desde el interior al elemento de diálogo personalizado */
:host {
position: fixed;
left: 50%;
top: 50%;
transform: translate(-50%, -50%);
display: inline-block;
border: 1px solid red;
padding: 10px;
}
</style>
<slot></slot>
</template>
<script>
customElements.define('custom-dialog', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'}).append(tmpl.content.cloneNode(true));
}
});
</script>
<custom-dialog>
Hello!
</custom-dialog>
Hello!
Cascada
El shadow host ( <custom-dialog> en sí) reside en el light DOM, por lo que se ve afectado por las reglas de CSS del
documento.
Si hay una propiedad con estilo tanto en el :host localmente, y en el documento, entonces el estilo del documento tiene
prioridad.
Por ejemplo, si en el documento tenemos:
149/220
<style>
custom-dialog {
padding: 0;
}
</style>
Es muy conveniente, ya que podemos configurar estilos de componentes “predeterminados” en su regla :host , y luego
sobreescribirlos fácilmente en el documento.
La excepción es cuando una propiedad local está etiquetada como !important . Para tales propiedades, los estilos
locales tienen prioridad.
:host(selector)
Igual que :host , pero se aplica solo si el shadow host coincide con el selector .
Por ejemplo, nos gustaría centrar el <custom-dialog> solo si tiene el atributo centered :
<template id="tmpl">
<style>
:host([centered]) {
position: fixed;
left: 50%;
top: 50%;
transform: translate(-50%, -50%);
border-color: blue;
}
:host {
display: inline-block;
border: 1px solid red;
padding: 10px;
}
</style>
<slot></slot>
</template>
<script>
customElements.define('custom-dialog', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'}).append(tmpl.content.cloneNode(true));
}
});
</script>
<custom-dialog centered>
¡Centrado!
</custom-dialog>
<custom-dialog>
No centrado.
</custom-dialog>
No centrado.
¡Centrado!
Ahora los estilos de centrado adicionales solo se aplican al primer diálogo: <custom-dialog centered> .
Para resumir, podemos usar la familia de selectores :host para aplicar estilos al elemento principal del componente. Estos
estilos (a menos que sea !important ) pueden ser sobreescritos por el documento.
Estilo de contenido eslotado(cuando un elemento ha sido insertado en un slot, se dice que fue
eslotado por su término en inglés slotted)
150/220
Los elementos eslotados vienen del light DOM, por lo que usan estilos del documento. Los estilos locales no afectan al
contenido de los elementos eslotados.
En el siguiente ejemplo, el elemento eslotado <span> está en bold, según el estilo del documento, pero no toma el
background del estilo local:
<style>
span { font-weight: bold }
</style>
<user-card>
<div slot="username"><span>John Smith</span></div>
</user-card>
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `
<style>
span { background: red; }
</style>
Name: <slot name="username"></slot>
`;
}
});
</script>
Name:
John Smith
Primero, podemos aplicarle el estilo al elemento <slot> en sí mismo y confiar en la herencia CSS:
<user-card>
<div slot="username"><span>John Smith</span></div>
</user-card>
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `
<style>
slot[name="username"] { font-weight: bold; }
</style>
Name: <slot name="username"></slot>
`;
}
});
</script>
Name:
John Smith
Aquí <p>John Smith</p> se vuelve bold, porque la herencia CSS está en efecto entre el <slot> y su contenido. Pero
en el propio CSS no todas las propiedades se heredan.
Otra opción es usar la pseudoclase ::slotted(selector) . Coincide con elementos en función de 2 condiciones.
1. Eso es un elemento eslotado, que viene del light DOM. El nombre del slot no importa. Cualquier elemento eslotado, pero
solo el elemento en si, no sus hijos.
2. El elemento coincide con el selector .
En nuestro ejemplo, ::slotted(div) selecciona exactamente <div slot="username"> , pero no sus hijos:
151/220
<user-card>
<div slot="username">
<div>John Smith</div>
</div>
</user-card>
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `
<style>
::slotted(div) { border: 1px solid red; }
</style>
Name: <slot name="username"></slot>
`;
}
});
</script>
Name:
John Smith
Tenga en cuenta, que el selector ::slotted no puede descender más en el slot. Estos selectores no son válidos:
::slotted(div span) {
/* nuestro slotted <div> no coincide con esto */
}
::slotted(div) p {
/* No puede entrar en light DOM */
}
<style>
.field {
color: var(--user-card-field-color, black);
/* si --user-card-field-color no esta definido, usar color negro */
}
</style>
<div class="field">Name: <slot name="username"></slot></div>
<div class="field">Birthday: <slot name="birthday"></slot></div>
user-card {
--user-card-field-color: green;
}
152/220
Las propiedades personalizadas CSS atraviesan el shadow DOM, son visibles en todas partes, por lo que la regla interna
.field hará uso de ella.
<style>
user-card {
--user-card-field-color: green;
}
</style>
<template id="tmpl">
<style>
.field {
color: var(--user-card-field-color, black);
}
</style>
<div class="field">Name: <slot name="username"></slot></div>
<div class="field">Birthday: <slot name="birthday"></slot></div>
</template>
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.append(document.getElementById('tmpl').content.cloneNode(true));
}
});
</script>
<user-card>
<span slot="username">John Smith</span>
<span slot="birthday">01.01.2001</span>
</user-card>
Resumen
Cuando las propiedades CSS entran en conflicto, normalmente los estilos del documento tienen prioridad, a menos que la
propiedad esté etiquetada como !important . Entonces, los estilos locales tienen prioridad.
Las propiedades CSS personalizadas atraviesan el shadow DOM. Se utilizan como “hooks” para aplicar estilos al
componente:
1. El componente utiliza una propiedad CSS personalizada para aplicar estilos a elementos clave, como var(--
component-name-title, <default value>) .
2. El autor del componente publica estas propiedades para los desarrolladores, son tan importantes como otros métodos de
componentes públicos.
3. Cuando un desarrollador desea aplicar un estilo a un título, asigna la propiedad CSS --component-name-title para
el shadow host o superior.
4. ¡Beneficio!
153/220
Shadow DOM y eventos
La idea detrás del shadow tree es encapsular los detalles internos de implementación de un componente.
Digamos que ocurre un evento click dentro de un shadow DOM del componente <user-card> . Pero los scripts en el
documento principal no tienen idea acerca del interior del shadow DOM, especialmente si el componente es de una librería
de terceros.
Entonces, para mantener los detalles encapsulados, el navegador redirige el evento.
Los eventos que ocurren en el shadow DOM tienen el elemento host como objetivo cuando son atrapados fuera del
componente.
Un ejemplo simple:
<user-card></user-card>
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `<p>
<button>Click me</button>
</p>`;
this.shadowRoot.firstElementChild.onclick =
e => alert("Inner target: " + e.target.tagName);
}
});
document.onclick =
e => alert("Outer target: " + e.target.tagName);
</script>
Click me
Tener la “redirección de eventos” es muy bueno, porque el documento externo no necesita tener conocimiento acerca del
interior del componente. Desde su punto de vista, el evento ocurrió sobre <user-card> .
No hay redirección si el evento ocurre en un elemento eslotado (slot element), que físicamente se aloja en el “light
DOM”, el DOM visible.
Por ejemplo, si un usuario hace clic en <span slot="username"> en el ejemplo siguiente, el objetivo del evento es
precisamente ese elemento span para ambos manejadores, shadow y light.
<user-card id="userCard">
<span slot="username">John Smith</span>
</user-card>
<script>
customElements.define('user-card', class extends HTMLElement {
connectedCallback() {
this.attachShadow({mode: 'open'});
this.shadowRoot.innerHTML = `<div>
<b>Name:</b> <slot name="username"></slot>
</div>`;
this.shadowRoot.firstElementChild.onclick =
e => alert("Inner target: " + e.target.tagName);
}
});
154/220
Name: John Smith
Si un clic ocurre en "John Smith" , el target es <span slot="username"> para ambos manejadores: el interno y el
externo. Es un elemento del light DOM, entonces no hay redirección.
Por otro lado, si el clic ocurre en un elemento originalmente del shadow DOM, ej. en <b>Name</b> , entonces, como se
propaga hacia fuera del shadow DOM, su event.target se reestablece a <user-card> .
Propagación, event.composedPath()
Para el propósito de propagación de eventos, es usado un “flattened DOM” (DOM aplanado, fusión de light y shadow).
Así, si tenemos un elemento eslotado y un evento ocurre dentro, entonces se propaga hacia arriba a <slot> y más allá.
La ruta completa del destino original “event target”, con todos sus elementos shadow, puede ser obtenida usando
event.composedPath() . Como podemos ver del nombre del método, la ruta se toma despúes de la composición.
<user-card id="userCard">
#shadow-root
<div>
<b>Name:</b>
<slot name="username">
<span slot="username">John Smith</span>
</slot>
</div>
</user-card>
Entonces, para un clic sobre <span slot="username"> , una llamada a event.composedPath() devuelve un array:
[ span , slot , div , shadow-root , user-card , body , html , document , window ]. Que es precisamente la
cadena de padres desde el elemento target en el flattened DOM, después de la composición.
Los detalles del árbol Shadow solo son provistos en árboles con {mode:'open'}
Si el árbol shadow fue creado con {mode: 'closed'} , la ruta compuesta comienza desde el host: user-card en
adelante.
Este principio es similar a otros métodos que trabajan con el shadow DOM. El interior de árboles cerrados está
completamente oculto.
event.composed
La mayoría de los eventos se propagan exitosamente a través de los límites de un shadow DOM. Hay unos pocos eventos
que no.
Esto está gobernado por la propiedad composed del objeto de evento. Si es true , el evento cruza los límites. Si no,
solamente puede ser capturado dentro del shadow DOM.
Vemos en la especificación UI Events que la mayoría de los eventos tienen composed: true :
●
blur , focus , focusin , focusout ,
● click , dblclick ,
●
mousedown , mouseup mousemove , mouseout , mouseover ,
● wheel ,
●
beforeinput , input , keydown , keyup .
155/220
Estos eventos solo pueden ser capturados dentro del mismo DOM, donde reside el evento target.
Eventos personalizados
Cuando enviamos eventos personalizados, necesitamos establecer ambas propiedades bubbles y composed a true
para que se propague hacia arriba y afuera del componente.
Por ejemplo, aquí creamos div#inner en el shadow DOM de div#outer y disparamos dos eventos en él. Solo el que
tiene composed: true logra salir hacia el documento:
<div id="outer"></div>
<script>
outer.attachShadow({mode: 'open'});
/*
div(id=outer)
#shadow-dom
div(id=inner)
*/
inner.dispatchEvent(new CustomEvent('test', {
bubbles: true,
composed: true,
detail: "composed"
}));
inner.dispatchEvent(new CustomEvent('test', {
bubbles: true,
composed: false,
detail: "not composed"
}));
</script>
Resumen
Los eventos solo cruzan los límites de shadow DOM si su bandera composed se establece como true .
La mayoría de los eventos nativos tienen composed: true , tal como se describe en las especificaciones relevantes:
●
Eventos UI https://www.w3.org/TR/uievents .
●
Eventos Touch https://w3c.github.io/touch-events .
●
Eventos Pointer https://www.w3.org/TR/pointerevents .
● …y así.
Estos eventos solo pueden ser capturados en elementos dentro del mismo DOM.
Si enviamos un evento personalizado CustomEvent , debemos establecer explícitamente composed: true .
Tenga en cuenta que en caso de componentes anidados, un shadow DOM puede estar anidado dentro de otro. En ese caso
los eventos se propagan a través de los límites de todos los shadow DOM. Entonces, si se pretende que un evento sea solo
para el componente inmediato que lo encierra, podemos enviarlo también en el shadow host y establecer composed:
false . Entonces saldrá al shadow DOM del componente, pero no se propagará hacia un DOM de mayor nivel.
Expresiones Regulares
156/220
Las expresiones regulares son una forma poderosa de hacer búsqueda y reemplazo de cadenas.
Las expresiones regulares son patrones que proporcionan una forma poderosa de buscar y reemplazar texto.
En JavaScript, están disponibles a través del objeto RegExp , además de integrarse en métodos de cadenas.
Expresiones Regulares
Una expresión regular (también “regexp”, o simplemente “reg”) consiste en un patrón y banderas opcionales.
Hay dos sintaxis que se pueden usar para crear un objeto de expresión regular.
La sintaxis “larga”:
Las barras /.../ le dicen a JavaScript que estamos creando una expresión regular. Juegan el mismo papel que las
comillas para las cadenas.
En ambos casos, regexp se convierte en una instancia de la clase incorporada RegExp .
La principal diferencia entre estas dos sintaxis es que el patrón que utiliza barras /.../ no permite que se inserten
expresiones (como los literales de plantilla de cadena con ${...} ). Son completamente estáticos.
Las barras se utilizan cuando conocemos la expresión regular en el momento de escribir el código, y esa es la situación más
común. Mientras que new RegExp , se usa con mayor frecuencia cuando necesitamos crear una expresión regular “sobre
la marcha” a partir de una cadena generada dinámicamente. Por ejemplo:
Banderas
i
Con esta bandera, la búsqueda no distingue entre mayúsculas y minúsculas: no hay diferencia entre A y a (consulte el
ejemplo a continuación).
g
Con esta bandera, la búsqueda encuentra todas las coincidencias, sin ella, solo se devuelve la primera coincidencia.
m
Modo multilínea (cubierto en el capítulo Modo multilínea de anclas ^ $, bandera "m").
s
Habilita el modo “dotall”, que permite que un punto . coincida con el carácter de línea nueva \n (cubierto en el capítulo
Clases de caracteres).
u
Permite el soporte completo de Unicode. La bandera permite el procesamiento correcto de pares sustitutos. Más del tema en
el capítulo Unicode: bandera "u" y clase \p{...}.
157/220
y
Modo “adhesivo”: búsqueda en la posición exacta del texto (cubierto en el capítulo Indicador adhesivo “y”, buscando en una
posición.)
Colores
A partir de aquí, el esquema de color es:
● regexp – red
●
cadena (donde buscamos) – blue
● resulta – green
Buscando: str.match
Como se mencionó anteriormente, las expresiones regulares se integran con los métodos de cadena.
El método str.match(regex) busca todas las coincidencias de regex en la cadena str .
Tenga en cuenta que tanto We como we se encuentran, porque la bandera i hace que la expresión regular no distinga
entre mayúsculas y minúsculas.
2. Si no existe dicha bandera, solo devuelve la primera coincidencia en forma de arreglo, con la coincidencia completa en el
índice 0 y algunos detalles adicionales en las propiedades:
// Detalles:
alert( result.index ); // 0 (posición de la coincidencia)
alert( result.input ); // We will, we will rock you (cadena fuente)
El arreglo puede tener otros índices, además de 0 si una parte de la expresión regular está encerrada entre paréntesis.
Cubriremos eso en el capítulo Grupos de captura.
3. Y, finalmente, si no hay coincidencias, se devuelve null (no importa si hay una bandera g o no).
Este es un matiz muy importante. Si no hay coincidencias, no recibimos un arreglo vacío, sino que recibimos null .
Olvidar eso puede conducir a errores, por ejemplo:
Si queremos que el resultado sea siempre un arreglo, podemos escribirlo de esta manera:
if (!matches.length) {
alert("Sin coincidencias"); // ahora si trabaja
}
158/220
Reemplazando: str.replace
Por ejemplo:
// sin la bandera g
alert( "We will, we will".replace(/we/i, "I") ); // I will, we will
// con la bandera g
alert( "We will, we will".replace(/we/ig, "I") ); // I will, I will
El segundo argumento es la cadena de replacement . Podemos usar combinaciones de caracteres especiales para
insertar fragmentos de la coincidencia:
$n si n es un número de 1-2 dígitos, entonces inserta el contenido de los paréntesis n-ésimo, más del tema en el capítulo Grupos de captura
$<name> inserta el contenido de los paréntesis con el nombre dado, más del tema en el capítulo Grupos de captura
$$ inserta el carácter $
Pruebas: regexp.test
El método regexp.test(str) busca al menos una coincidencia, si se encuentra, devuelve true , de lo contrario
false .
Más adelante en este capítulo estudiaremos más expresiones regulares, exploraremos más ejemplos y también
conoceremos otros métodos.
La información completa sobre métodos se proporciona en el artículo No se encontró el artículo "regexp-method".
Resumen
●
Una expresión regular consiste en un patrón y banderas opcionales: g , i , m , u , s , y .
● Sin banderas y símbolos especiales (que estudiaremos más adelante), la búsqueda por expresión regular es lo mismo que
una búsqueda de subcadena.
● El método str.match(regexp) busca coincidencias: devuelve todas si hay una bandera g , de lo contrario, solo la
primera.
● El método str.replace(regexp, replacement) reemplaza las coincidencias encontradas usando regexp con
replacement : devuelve todas si hay una bandera g , de lo contrario solo la primera.
● El método regexp.test(str) devuelve true si hay al menos una coincidencia, de lo contrario, devuelve false .
Clases de caracteres
159/220
Considera una tarea práctica: tenemos un número de teléfono como "+7(903)-123-45-67" , y debemos convertirlo en
número puro: 79031234567 .
Para hacerlo, podemos encontrar y eliminar cualquier cosa que no sea un número. La clase de caracteres pueden ayudar
con eso.
Una clase de caracteres es una notación especial que coincide con cualquier símbolo de un determinado conjunto.
Para empezar, exploremos la clase “dígito”. Está escrito como \d y corresponde a “cualquier dígito”.
alert( str.match(regexp) ); // 7
Sin la bandera (flag) g , la expresión regular solo busca la primera coincidencia, es decir, el primer dígito \d .
Esa fue una clase de caracteres para los dígitos. También hay otras.
Las más usadas son:
\d (“d” es de dígito")
Un dígito: es un caracter de 0 a 9 .
\s (“s” es un espacio)
Un símbolo de espacio: incluye espacios, tabulaciones \t , líneas nuevas \n y algunos otros caracteres raros, como \v ,
\f y \r .
Por ejemplo, \d\s\w significa un “dígito” seguido de un “carácter de espacio” seguido de un “carácter de palabra”, como 1
a.
La coincidencia (cada clase de carácter de la expresión regular tiene el carácter resultante correspondiente):
160/220
Clases inversas
Para cada clase de caracteres existe una “clase inversa”, denotada con la misma letra, pero en mayúscula.
El “inverso” significa que coincide con todos los demás caracteres, por ejemplo:
\D
Sin dígitos: cualquier carácter excepto \d , por ejemplo, una letra.
\S
Sin espacio: cualquier carácter excepto \s , por ejemplo, una letra.
\W
Sin carácter de palabra: cualquier cosa menos \w , por ejemplo, una letra no latina o un espacio.
Al comienzo del capítulo vimos cómo hacer un número de teléfono solo de números a partir de una cadena como
+7(903)-123-45-67 : encontrar todos los dígitos y unirlos.
Una forma alternativa y más corta es usar el patrón sin dígito \D para encontrarlos y eliminarlos de la cadena:
El patrón punto ( . ) es una clase de caracteres especial que coincide con “cualquier carácter excepto una nueva línea”.
Por ejemplo:
alert( "Z".match(/./) ); // Z
Tenga en cuenta que un punto significa “cualquier carácter”, pero no la “ausencia de un carácter”. Debe haber un carácter
para que coincida:
Por ejemplo, la expresión regular A.B coincide con A , y luego B con cualquier carácter entre ellos, excepto una línea
nueva \n :
161/220
Hay muchas situaciones en las que nos gustaría que punto signifique literalmente “cualquier carácter”, incluida la línea
nueva.
Eso es lo que hace la bandera s . Si una expresión regular la tiene, entonces . coincide literalmente con cualquier carácter:
No soportado en IE
La bandera s no está soportada en IE.
Afortunadamente, hay una alternativa, que funciona en todas partes. Podemos usar una expresión regular como
[\s\S] para que coincida con “cualquier carácter”. (Este patrón será cubierto en el artículo Conjuntos y rangos [...]).
El patrón [\s\S] literalmente dice: “con carácter de espacio O sin carácter de espacio”. En otras palabras, “cualquier
cosa”. Podríamos usar otro par de clases complementarias, como [\d\D] , eso no importa. O incluso [^] , que
significa que coincide con cualquier carácter excepto nada.
También podemos usar este truco si queremos ambos tipos de “puntos” en el mismo patrón: el patrón actual .
comportándose de la manera regular (“sin incluir una línea nueva”), y la forma de hacer coincidir “cualquier carácter” con
el patrón [\s\S] o similar.
Pero si una expresión regular no tiene en cuenta los espacios, puede que no funcione.
Intentemos encontrar dígitos separados por un guión:
Resumen
162/220
Se pueden hacer búsquedas usando esas propiedades. Y se requiere la bandera u , analizada en el siguiente artículo.
JavaScript utiliza codificación Unicode para las cadenas. La mayoría de los caracteres están codificados con 2 bytes, esto
permite representar un máximo de 65536 caracteres.
Ese rango no es lo suficientemente grande como para codificar todos los caracteres posibles, es por eso que algunos
caracteres raros se codifican con 4 bytes, por ejemplo como 𝒳 (X matemática) o 😄 (una sonrisa), algunos sinogramas,
etc.
Aquí los valores unicode de algunos caracteres:
a 0x0061 2
≈ 0x2248 2
𝒳 0x1d4b3 4
𝒴 0x1d4b4 4
😄 0x1f604 4
Entonces los caracteres como a e ≈ ocupan 2 bytes, mientras que los códigos para 𝒳 , 𝒴 y 😄 son más largos, tienen 4
bytes.
Hace mucho tiempo, cuando se creó el lenguaje JavaScript, la codificación Unicode era más simple: no había caracteres de
4 bytes. Por lo tanto, algunas características del lenguaje aún los manejan incorrectamente.
Por ejemplo, aquí length interpreta que hay dos caracteres:
alert('😄'.length); // 2
alert('𝒳'.length); // 2
…Pero podemos ver que solo hay uno, ¿verdad? El punto es que length maneja 4 bytes como dos caracteres de 2 bytes.
Eso es incorrecto, porque debe considerarse como uno solo (el llamado “par sustituto”, puede leer sobre ellos en el artículo
Strings).
Por defecto, las expresiones regulares manejan los “caracteres largos” de 4 bytes como un par de caracteres de 2 bytes
cada uno. Y, como sucede con las cadenas, eso puede conducir a resultados extraños. Lo veremos un poco más tarde, en el
artículo No se encontró el artículo "regexp-character-sets-and-range".
A diferencia de las cadenas, las expresiones regulares tienen la bandera u que soluciona tales problemas. Con dicha
bandera, una expresión regular maneja correctamente los caracteres de 4 bytes. Y podemos usar la búsqueda de
propiedades Unicode, que veremos a continuación.
Cada carácter en Unicode tiene varias propiedades. Describen a qué “categoría” pertenece el carácter, contienen
información diversa al respecto.
Por ejemplo, si un carácter tiene la propiedad Letter , significa que pertenece a un alfabeto (de cualquier idioma). Y la
propiedad Number significa que es un dígito: tal vez árabe o chino, y así sucesivamente.
Podemos buscar caracteres por su propiedad, usando \p{...} . Para usar \p{...} , una expresión regular debe usar
también u .
Por ejemplo, \p{Letter} denota una letra en cualquiera de los idiomas. También podemos usar \p{L} , ya que L es un
alias de Letter . Casi todas las propiedades tienen alias cortos.
163/220
Estas son las principales categorías y subcategorías de caracteres:
● Letter (Letra) L :
● lowercase (minúscula) Ll
● modifier (modificador) Lm ,
● titlecase (capitales) Lt ,
● uppercase (mayúscula) Lu ,
● other (otro) Lo .
●
Number (número) N :
●
decimal digit (dígito decimal) Nd ,
● letter number (número de letras) Nl ,
●
other (otro) No .
● Punctuation (puntuación) P :
● connector (conector) Pc ,
● dash (guión) Pd ,
● initial quote (comilla inicial) Pi ,
●
final quote (comilla final) Pf ,
●
open (abre) Ps ,
● close (cierra) Pe ,
●
other (otro) Po .
● Mark (marca) M (acentos etc):
● spacing combining (combinación de espacios) Mc ,
● enclosing (encerrado) Me ,
● non-spacing (sin espaciado) Mn .
● Symbol (símbolo) S :
●
currency (moneda) Sc ,
● modifier (modificador) Sk ,
●
math (matemática) Sm ,
● other (otro) So .
●
Separator (separador) Z :
● line (línea) Zl ,
● paragraph (párrafo) Zp ,
● space (espacio) Zs .
●
Other (otros) C :
● control Cc ,
●
format (formato) Cf ,
● not assigned (sin asignación) Cn ,
●
private use (uso privado) Co ,
● surrogate (sustituto) Cs .
Entonces, por ejemplo si necesitamos letras en minúsculas, podemos escribir \p{Ll} , signos de puntuación: \p{P} y así
sucesivamente.
También hay otras categorías derivadas, como:
● Alphabetic (alfabético) ( Alfa ), incluye letras L , más números de letras Nl (por ejemplo, Ⅻ – un carácter para el
número romano 12), y otros símbolos Other_Alphabetic ( OAlpha ).
● Hex_Digit incluye dígitos hexadecimales: 0-9 , a-f .
●
…Y así.
Unicode admite muchas propiedades diferentes, la lista completa es muy grande, estas son las referencias:
●
Lista de todas las propiedades por carácter: https://unicode.org/cldr/utility/character.jsp (enlace no disponible).
● Lista de caracteres por propiedad: https://unicode.org/cldr/utility/list-unicodeset.jsp . (enlace no disponible)
●
Alias cortos para propiedades: https://www.unicode.org/Public/UCD/latest/ucd/PropertyValueAliases.txt .
164/220
●
Aquí una base completa de caracteres Unicode en formato de texto, con todas las propiedades:
https://www.unicode.org/Public/UCD/latest/ucd/ .
Para buscar caracteres de un sistema de escritura dado, debemos usar Script=<value> , por ejemplo para letras
cirílicas: \p{sc=Cyrillic} , para sinogramas chinos: \p{sc=Han} , y así sucesivamente:
Ejemplo: moneda
Los caracteres que denotan una moneda, como $ , € , ¥ , tienen la propiedad unicode \p{Currency_Symbol} , el alias
corto: \p{Sc} .
Más adelante, en el artículo Cuantificadores +, *, ? y {n} veremos cómo buscar números que contengan muchos dígitos.
Resumen
Con las propiedades Unicode podemos buscar palabras en determinados idiomas, caracteres especiales (comillas,
monedas), etc.
Los patrones caret (del latín carece) ^ y dólar $ tienen un significado especial en una expresión regular. Se llaman
“anclas”.
El patrón caret ^ coincide con el principio del texto y dólar $ con el final.
165/220
El patrón ^Mary significa: “inicio de cadena y luego Mary”.
Similar a esto, podemos probar si la cadena termina con nieve usando nieve$ :
En estos casos particulares, en su lugar podríamos usar métodos de cadena beginWith/endsWith . Las expresiones
regulares deben usarse para pruebas más complejas.
Ambos anclajes ^...$ se usan juntos a menudo para probar si una cadena coincide completamente con el patrón. Por
ejemplo, para verificar si la entrada del usuario está en el formato correcto.
Verifiquemos si una cadena esta o no en formato de hora 12:34 . Es decir: dos dígitos, luego dos puntos y luego otros dos
dígitos.
En el idioma de las expresiones regulares eso es \d\d:\d\d :
La coincidencia para \d\d:\d\d debe comenzar exactamente después del inicio de texto ^ , y seguido inmediatamente, el
final $ .
Toda la cadena debe estar exactamente en este formato. Si hay alguna desviación o un carácter adicional, el resultado es
falso .
Las anclas se comportan de manera diferente si la bandera m está presente. Lo veremos en el próximo artículo.
En otras palabras, no coinciden con un carácter, sino que obligan al motor regexp a verificar la condición (inicio/fin de
texto).
Tareas
Regexp ^$
A solución
En el modo multilínea, coinciden no solo al principio y al final de la cadena, sino también al inicio/final de la línea.
En el siguiente ejemplo, el texto tiene varias líneas. El patrón /^\d/gm toma un dígito desde el principio de cada línea:
166/220
2do lugar: Piglet
3er lugar: Eeyore`;
console.log( str.match(/^\d/gm) ); // 1, 2, 3
console.log( str.match(/^\d/g) ); // 1
Esto se debe a que, de forma predeterminada, un caret ^ solo coincide al inicio del texto y en el modo multilínea, al inicio de
cualquier línea.
Sin la bandera m , dólar $ solo coincidiría con el final del texto completo, por lo que solo se encontraría el último dígito.
Buscando \n en lugar de ^ $
Para encontrar una línea nueva, podemos usar no solo las anclas ^ y $ , sino también el carácter de línea nueva \n .
Otra diferencia: ahora cada coincidencia incluye un carácter de línea nueva \n . A diferencia de las anclas ^ $ , que solo
prueban la condición (inicio/final de una línea), \n es un carácter, por lo que se hace parte del resultado.
167/220
Entonces, un \n en el patrón se usa cuando necesitamos encontrar caracteres de línea nueva, mientras que las anclas se
usan para encontrar algo “al principio/al final” de una línea.
Límite de palabra: \b
Cuando el motor regex (módulo de programa que implementa la búsqueda de expresiones regulares) se encuentra con \b ,
comprueba que la posición en la cadena es un límite de palabra.
Hay tres posiciones diferentes que califican como límites de palabras:
● Al comienzo de la cadena, si el primer carácter de cadena es un carácter de palabra \w .
● Entre dos caracteres en la cadena, donde uno es un carácter de palabra \w y el otro no.
●
Al final de la cadena, si el último carácter de la cadena es un carácter de palabra \w .
Por ejemplo, la expresión regular \bJava\b se encontrará en Hello, Java! , donde Java es una palabra
independiente, pero no en Hello, JavaScript! .
En la cadena Hello, Java! las flechas que se muestran corresponden a \b , ver imagen:
El patrón \bHello\b también coincidiría. Pero no \bHel\b (porque no hay límite de palabras después de l ) y tampoco
Java!\b (porque el signo de exclamación no es un carácter común \w , entonces no hay límite de palabras después de
eso).
Por ejemplo, el patrón \b\d\d\b busca números independientes de 2 dígitos. En otras palabras, busca números de 2
dígitos que están rodeados por caracteres diferentes de \w , como espacios o signos de puntuación (o texto de inicio/fin).
Pero \w significa una letra latina a-z (o un dígito o un guión bajo), por lo que la prueba no funciona para otros
caracteres, p.ej.: letras cirílicas o jeroglíficos.
Tareas
Encuentra la hora
168/220
La hora tiene un formato: horas:minutos . Tanto las horas como los minutos tienen dos dígitos, como 09:00 .
Haz una expresión regular para encontrar el tiempo en la cadena: Desayuno a las 09:00 en la habitación
123:456.
P.D.: En esta tarea todavía no hay necesidad de verificar la corrección del tiempo, por lo que 25:99 también puede ser un
resultado válido.
A solución
Como hemos visto, una barra invertida \ se usa para denotar clases de caracteres, p.ej. \d . Por lo tanto, es un carácter
especial en expresiones regulares (al igual que en las cadenas regulares).
También hay otros caracteres especiales que tienen un significado especial en una expresión regular, tales como [ ] { }
( ) \ ^ $ . | ? * + . Se utilizan para hacer búsquedas más potentes.
No intentes recordar la lista: pronto nos ocuparemos de cada uno de ellos por separado y los recordarás fácilmente.
Escapando
Digamos que queremos encontrar literalmente un punto. No “cualquier carácter”, sino solo un punto.
Para usar un carácter especial como uno normal, agrégalo con una barra invertida: \. .
Los paréntesis también son caracteres especiales, por lo que si los buscamos, deberíamos usar \( . El siguiente ejemplo
busca una cadena "g()" :
Si estamos buscando una barra invertida \ , como es un carácter especial tanto en cadenas regulares como en expresiones
regulares, debemos duplicarlo.
Una barra
Un símbolo de barra '/' no es un carácter especial, pero en JavaScript se usa para abrir y cerrar expresiones regulares:
/...pattern.../ , por lo que también debemos escaparlo.
Por otro lado, si no estamos usando /.../ , pero creamos una expresión regular usando new RegExp , entonces no
necesitamos escaparla:
169/220
new RegExp
Si estamos creando una expresión regular con new RegExp , entonces no tenemos que escapar la barra / , pero sí otros
caracteres especiales.
Por ejemplo, considere esto:
En uno de los ejemplos anteriores funcionó la búsqueda con /\d\.\d/ , pero new RegExp ("\d\.\d") no funciona,
¿por qué?
La razón es que las barras invertidas son “consumidas” por una cadena. Como podemos recordar, las cadenas regulares
tienen sus propios caracteres especiales, como \n , y se usa una barra invertida para escapar esos caracteres especiales
de cadena.
alert("\d\.\d"); // d.d
Las comillas de cadenas “consumen” barras invertidas y las interpretan como propias, por ejemplo:
● \n – se convierte en un carácter de línea nueva,
●
\u1234 – se convierte en el carácter Unicode con dicho código,
● …Y cuando no hay un significado especial: como \d o \z , entonces la barra invertida simplemente se elimina.
Así que new RegExp toma una cadena sin barras invertidas. ¡Por eso la búsqueda no funciona!
Para solucionarlo, debemos duplicar las barras invertidas, porque las comillas de cadena convierten \\ en \ :
Resumen
● Para buscar literalmente caracteres especiales [ \ ^ $ . | ? * + ( ) , se les antepone una barra invertida \
(“escaparlos”).
● Se debe escapar / si estamos dentro de /.../ (pero no dentro de new RegExp ).
● Al pasar una cadena a new RegExp , se deben duplicar las barras invertidas \\ , porque las comillas de cadena
consumen una.
Conjuntos
Por ejemplo, [eao] significa cualquiera de los 3 caracteres: 'a' , 'e' , o 'o' .
A esto se le llama conjunto. Los conjuntos se pueden usar en una expresión regular junto con los caracteres normales:
Tenga en cuenta que aunque hay varios caracteres en el conjunto, corresponden exactamente a un carácter en la
coincidencia.
170/220
Entonces, en el siguiente ejemplo no hay coincidencias:
El patrón busca:
● V,
●
después una de las letras [oi] ,
● después la .
Rangos
Aquí [0-9A-F] tiene dos rangos: busca un carácter que sea un dígito de 0 a 9 o una letra de A a F .
Si también queremos buscar letras minúsculas, podemos agregar el rango a-f : [0-9A-Fa-f] . O se puede agregar la
bandera i .
Por ejemplo, si quisiéramos buscar un carácter de palabra \w o un guion - , entonces el conjunto es [\w-] .
También es posible combinar varias clases, p.ej.: [\s\d] significa “un carácter de espacio o un dígito”.
Las clases de caracteres son abreviaturas (o atajos) para ciertos conjuntos de caracteres.
Por ejemplo:
● \d – es lo mismo que [0-9] ,
● \w – es lo mismo que [a-zA-Z0-9_] ,
●
\s – es lo mismo que [\t\n\v\f\r ] , además de otros caracteres de espacio raros de unicode.
Ejemplo: multi-idioma \w
Como la clase de caracteres \w es una abreviatura de [a-zA-Z0-9_] , no puede coincidir con sinogramas chinos, letras
cirílicas, etc.
Podemos escribir un patrón más universal, que busque caracteres de palabra en cualquier idioma. Eso es fácil con las
propiedades unicode: [\p{Alpha}\p{M}\p{Nd}\p{Pc}\p{Join_C}] .
Decifrémoslo. Similar a \w , estamos creando un conjunto propio que incluye caracteres con las siguientes propiedades
unicode:
● Alfabético ( Alpha ) – para letras,
● Marca ( M ) – para acentos,
● Numero_Decimal ( Nd ) – para dígitos,
● Conector_Puntuación ( Pc ) – para guion bajo '_' y caracteres similares,
● Control_Unión ( Join_C ) – dos códigos especiales 200c and 200d , utilizado en ligaduras, p.ej. en árabe.
Un ejemplo de uso:
171/220
// encuentra todas las letras y dígitos:
alert( str.match(regexp) ); // H,o,l,a,你,好,1,2
Por supuesto, podemos editar este patrón: agregar propiedades unicode o eliminarlas. Las propiedades Unicode se cubren
con más detalle en el artículo Unicode: bandera "u" y clase \p{...}.
O simplemente usa rangos de caracteres en el idioma de tu interés, p.ej. [а-я] para letras cirílicas.
Excluyendo rangos
Además de los rangos normales, hay rangos “excluyentes” que se parecen a [^…] .
Están denotados por un carácter caret ^ al inicio y coinciden con cualquier carácter excepto los dados.
Por ejemplo:
● [^aeyo] – cualquier carácter excepto 'a' , 'e' , 'y' u 'o' .
● [^0-9] – cualquier carácter excepto un dígito, igual que \D .
●
[^\s] – cualquiere carácter sin espacio, igual que \S .
alert( "[email protected]".match(/[^\d\sA-Z]/gi) ); // @ y .
Por lo general, cuando queremos encontrar exactamente un carácter especial, necesitamos escaparlo con \. . Y si
necesitamos una barra invertida, entonces usamos \\ , y así sucesivamente.
Entre corchetes podemos usar la gran mayoría de caracteres especiales sin escaparlos:
● Los símbolos . + ( ) nunca necesitan escape.
● Un guion - no se escapa al principio ni al final (donde no define un rango).
● Un carácter caret ^ solo se escapa al principio (donde significa exclusión).
● El corchete de cierre ] siempre se escapa (si se necesita buscarlo).
En otras palabras, todos los caracteres especiales están permitidos sin escapar, excepto cuando significan algo entre
corchetes.
Un punto . dentro de corchetes significa solo un punto. El patrón [.,] Buscaría uno de los caracteres: un punto o una
coma.
En el siguiente ejemplo, la expresión regular [-().^+] busca uno de los caracteres -().^+ :
// no es necesario escaparlos
let regexp = /[-().^+]/g;
// Todo escapado
let regexp = /[\-\(\)\.\^\+]/g;
172/220
Si hay pares sustitutos en el conjunto, se requiere la flag u para que funcionen correctamente.
El resultado es incorrecto porque, por defecto, las expresiones regulares “no saben” sobre pares sustitutos.
El motor de expresión regular piensa que la cadena [𝒳𝒴] no son dos, sino cuatro caracteres:
alert( '𝒳'.match(/[𝒳𝒴]/u) ); // 𝒳
La razón es que sin la bandera u los pares sustitutos se perciben como dos caracteres, por lo que [𝒳-𝒴] se interpreta
como [<55349><56499>-<55349><56500>] (cada par sustituto se reemplaza con sus códigos). Ahora es fácil ver que
el rango 56499-55349 es inválido: su código de inicio 56499 es mayor que el último 55349 . Esa es la razón formal del
error.
Tareas
Java[^script]
A solución
La hora puede estar en el formato horas:minutos u horas-minutos . Tanto las horas como los minutos tienen 2
dígitos: 09:00 ó 21-30 .
173/220
let regexp = /tu regexp/g;
alert( "El desayuno es a las 09:00. La cena es a las 21-30".match(regexp) ); // 09:00, 21-30
En esta tarea asumimos que el tiempo siempre es correcto, no hay necesidad de filtrar cadenas malas como “45:67”. Más
tarde nos ocuparemos de eso también.
A solución
Cuantificadores +, *, ? y {n}
Digamos que tenemos una cadena como +7 (903) -123-45-67 y queremos encontrar todos los números en ella. Pero
contrastando el ejemplo anterior, no estamos interesados en un solo dígito, sino en números completos: 7, 903, 123,
45, 67 .
Un número es una secuencia de 1 o más dígitos \d . Para marcar cuántos necesitamos, podemos agregar un cuantificador.
Cantidad {n}
Se agrega un cuantificador a un carácter (o a una clase de caracteres, o a un conjunto [...] , etc) y especifica cuántos
necesitamos.
Un número es una secuencia de uno o más dígitos continuos. Entonces la expresión regular es \d{1,} :
alert(numbers); // 7,903,123,45,67
Abreviaciones
174/220
Significa “uno o más”, igual que {1,} .
?
Significa “cero o uno”, igual que {0,1} . En otras palabras, hace que el símbolo sea opcional.
*
Significa “cero o más”, igual que {0,} . Es decir, el carácter puede repetirse muchas veces o estar ausente.
Por ejemplo, \d0* busca un dígito seguido de cualquier número de ceros (puede ser muchos o ninguno):
Más ejemplos
Los cuantificadores se usan con mucha frecuencia. Sirven como el “bloque de construcción” principal de expresiones
regulares complejas, así que veamos más ejemplos.
Regexp para fracciones decimales (un número con coma flotante): \d+\.\d+
En acción:
Regexp para una “etiqueta HTML de apertura sin atributos”, tales como <span> o <p> .
La regexp busca el carácter '<' seguido de una o más letras latinas, y el carácter '>' .
2. Mejorada: /<[a-z][a-z0-9]*>/i
De acuerdo al estándar, el nombre de una etiqueta HTML puede tener un dígito en cualquier posición excepto al inicio, tal
como <h1> .
Agregamos una barra opcional /? cerca del comienzo del patrón. Se tiene que escapar con una barra diagonal inversa, de
lo contrario, JavaScript pensaría que es el final del patrón.
175/220
alert( "<h1>Hola!</h1>".match(/<\/?[a-z][a-z0-9]*>/gi) ); // <h1>, </h1>
Para hacer más precisa una regexp, a menudo necesitamos hacerla más compleja
Podemos ver una regla común en estos ejemplos: cuanto más precisa es la expresión regular, es más larga y compleja.
Por ejemplo, para las etiquetas HTML debemos usar una regexp más simple: <\w+> . Pero como HTML tiene normas
estrictas para los nombres de etiqueta, <[a-z][a-z0-9]*> es más confiable.
En la vida real, ambas variantes son aceptables. Depende de cuán tolerantes podamos ser a las coincidencias
“adicionales” y si es difícil o no eliminarlas del resultado por otros medios.
Tareas
Escriba una regexp para encontrar puntos suspensivos: 3 (¿o más?) puntos en una fila.
Revísalo:
A solución
Escribe una regexp para encontrar colores HTML escritos como #ABCDEF : primero # y luego 6 caracteres hexadecimales.
Un ejemplo de uso:
P.D. En esta tarea no necesitamos otro formato de color como #123 o rgb(1,2,3) , etc.
A solución
Los cuantificadores son muy simples a primera vista, pero de hecho pueden ser complicados.
Debemos entender muy bien cómo funciona la búsqueda si planeamos buscar algo más complejo que /\d+/ .
Tenemos un texto y necesitamos reemplazar todas las comillas "..." con comillas latinas: «...» . En muchos paises los
tipógrafos las prefieren.
Por ejemplo: "Hola, mundo" debe convertirse en «Hola, mundo» . Existen otras comillas, como „Witaj,
świecie!” (Polaco) o 「你好,世界」 (Chino), pero para nuestra tarea elegimos «...» .
Lo primero que debe hacer es ubicar las cadenas entre comillas, y luego podemos reemplazarlas.
Una expresión regular como /".+"/g (una comilla, después algo, luego otra comilla) Puede parecer una buena opción,
¡pero no lo es!
Vamos a intentarlo:
176/220
let regexp = /".+"/g;
Búsqueda codiciosa
Para encontrar una coincidencia, el motor de expresión regular utiliza el siguiente algoritmo:
●
Para cada posición en la cadena
● Prueba si el patrón coincide en esta posición.
● Si no hay coincidencia, ir a la siguiente posición.
Estas palabras comunes no son tan obvias para determinar por qué la regexp falla, así que elaboremos el funcionamiento de
la búsqueda del patrón ".+" .
El motor de expresión regular intenta encontrarla en la posición cero de la cadena fuente una "bruja" y su
"escoba" son una , pero hay una u allí, por lo que inmediatamente no hay coincidencia.
Entonces avanza: va a la siguiente posición en la cadena fuente y prueba encontrar el primer carácter del patrón allí, falla
de nuevo, y finalmente encuentra la comilla doble en la 3ra posición:
2. La comilla doble es detectada, y después el motor prueba encontrar una coincidencia para el resto del patrón. Prueba ver
si el resto de la cadena objetivo satisface a .+" .
En nuestro caso el próximo carácter de patrón es . (un punto). Que denota “cualquiere carácter excepto línea nueva”,
entonces la próxima letra de la cadena encaja 'w' :
3. Entonces el punto (.) se repite por el cuantificador .+ . El motor de expresión regular agrega a la coincidencia un carácter
uno después de otro.
…¿Hasta cuando? Todos los caracteres coinciden con el punto, entonces se detiene hasta que alcanza el final de la
cadena:
4. Ahora el motor finalizó el ciclo de .+ y prueba encontrar el próximo carácter del patrón. El cual es la comilla doble " .
Pero hay un problema: la cadena ha finalizado, ¡no hay más caracteres!
177/220
a "witch" and her "broom" is one
Ahora se supone que .+ finaliza un carácter antes del final de la cadena e intenta hacer coincidir el resto del patrón
desde esa posición.
Si hubiera comillas doble allí, entonces la búsqueda terminaría, pero el último carácter es 'a' , por lo que no hay
coincidencia.
6. El motor continua reiniciando la lectura de la cadena: decrementa el contador de repeticiones para '.' hasta que el resto
del patrón (en nuestro caso '"' ) coincida:
8. Entonces la primera coincidencia es "bruja" y su "escoba" . Si la expresión regular tiene la bandera g , entonces
la búsqueda continuará desde donde termina la primera coincidencia. No hay más comillas dobles en el resto de la
cadena son una , entonces no hay más resultados.
El motor de regexp agrega a la coincidencia tantos caracteres como pueda abarcar el patrón .+ , y luego los abrevia uno por
uno si el resto del patrón no coincide.
En nuestro caso queremos otra cosa. Es entonces donde el modo perezoso puede ayudar.
Modo perezoso
El modo perezoso de los cuantificadores es lo opuesto del modo codicioso. Eso significa: “repite el mínimo número de
veces”.
Podemos habilitarlo poniendo un signo de interrogación '?' después del cuantificador, entonces tendríamos *? o +? o
incluso ?? para '?' .
Aclarando las cosas: generalmente un signo de interrogación ? es un cuantificador por si mismo (cero o uno), pero si se
agrega despues de otro cuantificador (o incluso el mismo) toma otro significado, alterna el modo de coincidencia de
codicioso a perezoso.
178/220
1. El primer paso es el mismo: encuentra el inicio del patrón '"' en la 5ta posición:
2. El siguiente paso también es similar: el motor encuentra una coincidencia para el punto '.' :
3. Y ahora la búsqueda es diferente. Porque tenemos el modo perezoso activado en +? , el motor no prueba coincidir un
punto una vez más, se detiene y prueba coincidir el resto del patrón ( '"' ) ahora mismo :
Si hubiera comillas dobles allí, entonces la búsqueda terminaría, pero hay una 'r' , entonces no hay coincidencia.
4. Después el motor de expresión regular incrementa el número de repeticiones para el punto y prueba una vez más:
6. La próxima busqueda inicia desde el final de la coincidencia actual y produce un resultado más:
En este ejemplo vimos cómo funciona el modo perezoso para +? . Los cuantificadores *? y ?? funcionan de manera
similar, el motor regexp incrementa el número de repticiones solo si el resto del patrón no coincide en la posición dada.
179/220
1. El patrón \d+ intenta hacer coincidir tantos dígitos como sea posible (modo codicioso), por lo que encuentra 123 y se
detiene, porque el siguiente carácter es un espacio ' ' .
El modo perezoso no repite nada sin necesidad. El patrón terminó, así que terminamos. Tenemos una coincidencia 123
4.
Optimizaciones
Los motores modernos de expresiones regulares pueden optimizar algoritmos internos para trabajar más rápido. Estos
trabajan un poco diferente del algoritmo descrito.
Pero para comprender como funcionan las expresiones regulares y construirlas, no necesitamos saber nada al respecto.
Solo se usan internamente para optimizar cosas.
Las expresiones regulares complejas son difíciles de optimizar, por lo que la búsqueda también puede funcionar
exactamente como se describe.
Enfoque alternativo
Con las regexps, por lo general hay muchas formas de hacer la misma cosa.
En nuestro caso podemos encontrar cadenas entre comillas sin el modo perezoso usando la regexp "[^"]+" :
La regexp "[^"]+" devuelve el resultado correcto, porque busca una comilla doble '"' seguida por uno o más
caracteres no comilla doble [^"] , y luego la comilla doble de cierre.
Cuando la máquina de regexp busca el carácter no comilla [^"]+ se detiene la repetición cuando encuentra la comilla
doble de cierre,y terminamos.
Nótese, ¡esta lógica no reemplaza al cuantificador perezoso!
Veamos un ejemplo donde los cuantificadores perezosos fallan y la variante funciona correctamente.
Por ejemplo, queremos encontrar enlaces en la forma <a href="..." class="doc"> , con cualquier href .
Veámoslo:
// ¡Funciona!
alert( str.match(regexp) ); // <a href="link" class="doc">
180/220
Ahora el resultado es incorrecto por la misma razón del ejemplo de la bruja. El cuantificador .* toma demasiados
caracteres.
La coincidencia se ve así:
// ¡Funciona!
alert( str.match(regexp) ); // <a href="link1" class="doc">, <a href="link2" class="doc">
// ¡Coincidencia incorrecta!
alert( str.match(regexp) ); // <a href="link1" class="wrong">... <p style="" class="doc">
Ahora falla. La coincidencia no solo incluye el enlace, sino también mucho texto después, incluyendo <p...> .
¿Por qué?
Pero el problema es que: eso ya está más allá del enlace <a...> , en otra etiqueta <p> . No es lo que queremos.
Entonces, necesitamos un patrón que busque <a href="...algo..." class="doc"> , pero ambas variantes,
codiciosa y perezosa, tienen problemas.
La variante correcta puede ser: href="[^"]*" . Esta tomará todos los caracteres dentro del atributo href hasta la
comilla doble más cercana, justo lo que necesitamos.
Un ejemplo funcional:
// ¡Funciona!
alert( str1.match(regexp) ); // null, sin coincidencia, eso es correcto
alert( str2.match(regexp) ); // <a href="link1" class="doc">, <a href="link2" class="doc">
181/220
Resumen
Codiciosa
Por defecto el motor de expresión regular prueba repetir el carácter cuantificado tantas veces como sea posible. Por ejemplo,
\d+ consume todos los posibles dígitos. Cuando es imposible consumir más (no hay más dígitos o es el fin de la cadena),
entonces continúa hasta coincidir con el resto del patrón. Si no hay coincidencia entonces se decrementa el número de
repeticiones (reinicios) y prueba de nuevo.
Perezoso
Habilitado por el signo de interrogación ? después de un cuantificador. El motor de regexp prueba la coincidencia para el
resto del patrón antes de cada repetición del carácter cuantificado.
Como vimos, el modo perezoso no es una “panacea” de la búsqueda codiciosa. Una alternativa es una búsqueda codiciosa
refinada, con exclusiones, como en el patrón "[^"]+" .
Tareas
A solución
A solución
Crear una expresión regular para encontrar todas las etiquetas HTML (de apertura y cierre) con sus atributos.
Un ejemplo de uso:
let str = '<> <a href="/"> <input type="radio" checked > <b>';
Asumimos que los atributos de etiqueta no deben contener < ni > (dentro de comillas dobles también), esto simplifica un
poco las cosas.
A solución
Grupos de captura
Una parte de un patrón se puede incluir entre paréntesis (...) . Esto se llama “grupo de captura”.
182/220
Esto tiene dos resultados:
1. Permite obtener una parte de la coincidencia como un elemento separado en la matriz de resultados.
2. Si colocamos un cuantificador después del paréntesis, se aplica a los paréntesis en su conjunto.
Ejemplos
Ejemplo: gogogo
Sin paréntesis, el patrón go+ significa el carácter g , seguido por o repetido una o más veces. Por ejemplo, goooo o
gooooooooo .
Los paréntesis agrupan los carácteres juntos, por lo tanto (go)+ significa go , gogo , gogogo etcétera.
Ejemplo: dominio
Hagamos algo más complejo: una expresión regular para buscar un dominio de sitio web.
Por ejemplo:
mail.com
users.mail.com
smith.users.mail.com
Como podemos ver, un dominio consta de palabras repetidas, un punto después de cada una excepto la última.
En expresiones regulares eso es (\w+\.)+\w+ :
La búsqueda funciona, pero el patrón no puede coincidir con un dominio con un guión, por ejemplo, my-site.com , porque
el guión no pertenece a la clase \w .
Podemos arreglarlo al reemplazar \w con [\w-] en cada palabra excepto el último: ([\w-]+\.)+\w+ .
Ejemplo: email
El ejemplo anterior puede ser extendido. Podemos crear una expresión regular para emails en base a esto.
El formato de email es: name@domain . Cualquier palabra puede ser el nombre, guiones y puntos están permitidos. En
expresiones regulares esto es [-.\w]+ .
El patrón:
Esa expresión regular no es perfecta, pero sobre todo funciona y ayuda a corregir errores de escritura accidentales. La única
verificación verdaderamente confiable para un correo electrónico solo se puede realizar enviando una carta.
Los paréntesis están numerados de izquierda a derecha. El buscador memoriza el contenido que coincide con cada uno de
ellos y permite obtenerlo en el resultado.
El método str.match(regexp) , si regexp no tiene indicador (flag) g , busca la primera coincidencia y lo devuelve
como un array:
183/220
3. En el índice 2 : el contenido del segundo paréntesis.
4. …etcétera…
Por ejemplo, nos gustaría encontrar etiquetas HTML <.*?> , y procesarlas. Sería conveniente tener el contenido de la
etiqueta (lo que está dentro de los ángulos), en una variable por separado.
Grupos anidados
Los paréntesis pueden ser anidados. En este caso la numeración también va de izquierda a derecha.
Por ejemplo, al buscar una etiqueta en <span class="my"> tal vez nos pueda interesar:
span class="my"
1
<(( [a-z]+ ) \s* ( [^>]* )) >
2 3
span class="my"
En acción:
Luego los grupos, numerados de izquierda a derecha por un paréntesis de apertura. El primer grupo se devuelve como
result[1] . Aquí se encierra todo el contenido de la etiqueta.
Luego en result[2] va el grupo desde el segundo paréntesis de apertura ([a-z]+) – nombre de etiqueta, luego en
result[3] la etiqueta: ([^>]*) .
span class="my"
1
<(( [a-z]+ ) \s* ( [^>]* )) >
2 3
span class="my"
Grupos opcionales
184/220
Incluso si un grupo es opcional y no existe en la coincidencia (p.ej. tiene el cuantificador (...)? ), el elemento array
result correspondiente está presente y es igual a undefined .
Por ejemplo, consideremos la expresión regular a(z)?(c)? . Busca "a" seguida por opcionalmente "z" , seguido por
"c" opcionalmente.
alert( match.length ); // 3
alert( match[0] ); // a (coincidencia completa)
alert( match[1] ); // undefined
alert( match[2] ); // undefined
alert( match.length ); // 3
alert( match[0] ); // ac (coincidencia completa)
alert( match[1] ); // undefined, ¿porque no hay nada para (z)?
alert( match[2] ); // c
La longitud del array es permanente: 3 . Pero no hay nada para el grupo (z)? , por lo tanto el resultado es ["ac",
undefined, "c"] .
Cuando buscamos todas las coincidencias (flag g ), el método match no devuelve contenido para los grupos.
El resultado es un array de coincidencias, pero sin detalles sobre cada uno de ellos. Pero en la práctica normalmente
necesitamos contenidos de los grupos de captura en el resultado.
Para obtenerlos tenemos que buscar utilizando el método str.matchAll(regexp) .
Fue incluido a JavaScript mucho después de match , como su versión “nueva y mejorada”.
Por ejemplo:
185/220
alert(results[0]); // undefined (*)
Como podemos ver, la primera diferencia es muy importante, como se demuestra en la línea (*) . No podemos obtener la
coincidencia como results[0] , porque ese objeto no es pseudo array. Lo podemos convertir en un Array real utilizando
Array.from . Hay más detalles sobre pseudo arrays e iterables en el artículo. Iterables.
…O utilizando desestructurización:
Cada coincidencia devuelta por matchAll tiene el mismo formato que el devuelto por match sin el flag g : es un array
con propiedades adicionales index (coincide índice en el string) e input (fuente string):
El llamado a matchAll no realiza la búsqueda. En cambio devuelve un objeto iterable, en un principio sin los
resultados. La búsqueda es realizada cada vez que iteramos sobre ella, es decir, en el bucle.
Es difícil recordar a los grupos por su número. Para patrones simples, es factible, pero para los más complejos, contar los
paréntesis es inconveniente. Tenemos una opción mucho mejor: poner nombres entre paréntesis.
Eso se hace poniendo ?<name> inmediatamente después del paréntesis de apertura.
alert(groups.year); // 2019
186/220
alert(groups.month); // 04
alert(groups.day); // 30
También vamos a necesitar matchAll para obtener coincidencias completas, junto con los grupos:
alert(`${day}.${month}.${year}`);
// primer alert: 30.10.2019
// segundo: 01.01.2020
}
El método str.replace(regexp, replacement) que reemplaza todas las coincidencias con regexp en str nos
permite utilizar el contenido de los paréntesis en el string replacement . Esto se hace utilizando $n , donde n es el
número de grupo.
Por ejemplo,
Por ejemplo, volvamos a darle formato a las fechas desde “year-month-day” a “day.month.year”:
A veces necesitamos paréntesis para aplicar correctamente un cuantificador, pero no queremos su contenido en los
resultados.
Por ejemplo, si queremos encontrar (go)+ , pero no queremos el contenido del paréntesis ( go ) como un ítem separado del
array, podemos escribir: (?:go)+ .
En el ejemplo de arriba solamente obtenemos el nombre John como un miembro separado de la coincidencia:
187/220
alert( result[1] ); // John
alert( result.length ); // 2 (no hay más ítems en el array)
Resumen
Los paréntesis agrupan una parte de la expresión regular, de modo que el cuantificador se aplique a ella como un todo.
Los grupos de paréntesis se numeran de izquierda a derecha y, opcionalmente, se pueden nombrar con (?<name>...) .
Si el paréntesis no tiene nombre, entonces su contenido está disponible en el array de coincidencias por su número. Los
paréntesis con nombre también están disponible en la propiedad groups .
También podemos utilizar el contenido del paréntesis en el string de reemplazo de str.replace : por el número $n o el
nombre $<name> .
Un grupo puede ser excluido de la enumeración al agregar ?: en el inicio. Eso se usa cuando necesitamos aplicar un
cuantificador a todo el grupo, pero no lo queremos como un elemento separado en el array de resultados. Tampoco podemos
hacer referencia a tales paréntesis en el string de reemplazo.
Tareas
La Dirección MAC de una interfaz de red consiste en 6 números hexadecimales de dos dígitos separados por dos puntos.
Escriba una expresión regular que verifique si una cadena es una Dirección MAC.
Uso:
A solución
Escriba una expresión regular que haga coincidir los colores en el formato #abc o #abcdef . Esto es: # seguido por 3 o 6
dígitos hexadecimales.
P.D. Esto debe ser exactamente 3 o 6 dígitos hexadecimales. Valores con 4 dígitos, tales como #abcd , no deben coincidir.
A solución
188/220
Encuentre todos los números
Escribe una expresión regular que busque todos los números decimales, incluidos los enteros, con el punto flotante y los
negativos.
Un ejemplo de uso:
A solución
Una expresión aritmética consta de 2 números y un operador entre ellos, por ejemplo:
● 1 + 2
● 1.2 * 3.4
● -3 / -6
● -2 - 2
Crea una función parse(expr) que tome una expresión y devuelva un array de 3 ítems:
1. El primer número.
2. El operador.
3. El segundo número.
Por ejemplo:
alert(a); // 1.2
alert(op); // *
alert(b); // 3.4
A solución
Necesitamos encontrar una cadena entre comillas: con cualquiera de los dos tipos, comillas simples '...' o comillas
dobles "..." – ambas variantes deben coincidir.
¿Cómo encontrarlas?
Ambos tipos de comillas se pueden poner entre corchetes: ['"](.*?)['"] , pero encontrará cadenas con comillas mixtas,
como "...' y '..." . Eso conduciría a coincidencias incorrectas cuando una cita aparece dentro de otra., como en la
189/220
cadena "She's the one!" (en este ejemplo los strings no se traducen por el uso de la comilla simple):
Como podemos ver, el patrón encontró una cita abierta " , luego se consume el texto hasta encontrar la siguiente comilla ' ,
esta cierra la coincidencia.
Para asegurar que el patrón busque la comilla de cierre exactamente igual que la de apertura, se pone dentro de un grupo
de captura y se hace referencia inversa al 1ero: (['"])(.*?)\1 .
¡Ahora funciona! El motor de expresiones regulares encuentra la primera comilla (['"]) y memoriza su contenido. Este es
el primer grupo de captura.
Continuando en el patrón, \1 significa “encuentra el mismo texto que en el primer grupo”, en nuestro caso exactamente la
misma comilla.
Similar a esto, \2 debería significar: el contenido del segundo grupo, \3 – del tercer grupo, y así sucesivamente.
En el siguiente ejemplo, el grupo con comillas se llama ?<quote> , entonces la referencia inversa es \k<quote> :
Alternancia (O) |
Alternancia es un término en expresión regular que simplemente significa “O”.
Por ejemplo, necesitamos encontrar lenguajes de programación: HTML, PHP, Java o JavaScript.
La expresión regular correspondiente es: html|php|java(script)? .
Un ejemplo de uso:
190/220
let regexp = /html|php|css|java(script)?/gi;
Ya vimos algo similar: corchetes. Permiten elegir entre varios caracteres, por ejemplo gr[ae]y coincide con gray o
grey .
Los corchetes solo permiten caracteres o conjuntos de caracteres. La alternancia permite cualquier expresión. Una expresión
regular A|B|C significa una de las expresiones A , B o C .
Por ejemplo:
● gr(a|e)y significa exactamente lo mismo que gr[ae]y .
● gra|ey significa gra o ey .
Para aplicar la alternancia a una parte elegida del patrón, podemos encerrarla entre paréntesis:
●
I love HTML|CSS coincide con I love HTML o CSS .
●
I love (HTML|CSS) coincide con I love HTML o I love CSS .
En artículos anteriores había una tarea para construir una expresión regular para buscar un horario en la forma hh:mm , por
ejemplo 12:00 . Pero esta simple expresión \d\d:\d\d es muy vaga. Acepta 25:99 como tiempo (ya que 99 segundos
coinciden con el patrón, pero ese tiempo no es válido).
Podemos escribir ambas variantes en una expresión regular usando alternancia: [01]\d|2[0-3] .
A continuación, los minutos deben estar comprendidos entre 00 y 59 . En el lenguaje de expresiones regulares se puede
escribir como [0-5]\d : el primer dígito 0-5 , y luego cualquier otro.
Ya casi terminamos, pero hay un problema. La alternancia | ahora pasa a estar entre [01]\d y 2[0-3]:[0-5]\d .
Es decir: se agregan minutos a la segunda variante de alternancia, aquí hay una imagen clara:
[01]\d | 2[0-3]:[0-5]\d
Pero eso es incorrecto, la alternancia solo debe usarse en la parte “horas” de la expresión regular, para permitir [01]\d O
2[0-3] . Corregiremos eso encerrando las “horas” entre paréntesis: ([01]\d|2[0-3]):[0-5]\d .
Tareas
Hay muchos lenguajes de programación, por ejemplo, Java, JavaScript, PHP, C, C ++.
Crea una expresión regular que los encuentre en la cadena Java JavaScript PHP C++ C :
191/220
let regexp = /your regexp/g;
A solución
Por ejemplo:
[b]text[/b]
[url]http://google.com[/url]
BB-tags se puede anidar. Pero una etiqueta no se puede anidar en sí misma, por ejemplo:
Normal:
[url] [b]http://google.com[/b] [/url]
[quote] [b]text[/b] [/quote]
No puede suceder:
[b][b]text[/b][/b]
[quote]
[b]text[/b]
[/quote]
Cree una expresión regular para encontrar todas las BB-tags con su contenido.
Por ejemplo:
Si las etiquetas están anidadas, entonces necesitamos la etiqueta externa (si queremos podemos continuar la búsqueda en
su contenido):
A solución
Crea una expresión regular para encontrar cadenas entre comillas dobles "..." .
Las cadenas deben admitir el escape, de la misma manera que lo hacen las cadenas de JavaScript. Por ejemplo, las
comillas se pueden insertar como \" , una nueva línea como \n , y la barra invertida misma como \\ .
Tenga en cuenta, en particular, que una comilla escapada \" no termina una cadena.
Por lo tanto, deberíamos buscar de una comilla a otra (la de cierre), ignorando las comillas escapadas en el camino.
192/220
Esa es la parte esencial de la tarea, de lo contrario sería trivial.
.. "test me" ..
.. "Say \"Hello\"!" ... (comillas escapadas dentro)
.. "\\" .. (doble barra invertida dentro)
.. "\\ \"" .. (doble barra y comilla escapada dentro.)
En JavaScript, necesitamos duplicar las barras para pasarlas directamente a la cadena, así:
let str = ' .. "test me" .. "Say \\"Hello\\"!" .. "\\\\ \\"" .. ';
A solución
Escriba una expresión regular para encontrar la etiqueta <style...> . Debe coincidir con la etiqueta completa: puede no
tener atributos <style> o tener varios de ellos <style type="..." id="..."> .
Por ejemplo:
A solución
A veces necesitamos buscar únicamente aquellas coincidencias donde un patrón es precedido o seguido por otro patrón.
Existe una sintaxis especial para eso llamadas “lookahead” y “lookbehind” (“ver delante” y “ver detrás”), juntas son conocidas
como “lookaround” (“ver alrededor”).
Para empezar, busquemos el precio de la cadena siguiente 1 pavo cuesta 30€ . Eso es: un número, seguido por el
signo € .
Lookahead
La sintaxis es: X(?=Y) . Esto significa "buscar X , pero considerarlo una coincidencia solo si es seguido por Y ". Puede
haber cualquier patrón en X y Y .
Tenga en cuenta que “lookahead” es solamente una prueba, lo contenido en los paréntesis (?=...) no es incluido en el
resultado 30 .
Cuando buscamos X(?=Y) , el motor de expresión regular encuentra X y luego verifica si existe Y inmediatamente
después de él. Si no existe, entonces la coincidencia potencial es omitida y la búsqueda continúa.
1. Encuentra X .
193/220
2. Verifica si Y está inmediatamente después de X (omite si no es así).
3. Verifica si Z está también inmediatamente después de X (omite si no es así).
4. Si ambas verificaciones se cumplen, el X es una coincidencia. De lo contrario continúa buscando.
En otras palabras, dicho patrón significa que estamos buscando por X seguido de Y y Z al mismo tiempo.
Por ejemplo, \d+(?=\s)(?=.*30) busca un \d+ que sea seguido por un espacio (?=\s) y que también tenga un 30
en algún lugar después de él (?=.*30) :
alert( str.match(/\d+(?=\s)(?=.*30)/) ); // 1
Lookahead negativo
Digamos que queremos una cantidad, no un precio de la misma cadena. Eso es el número \d+ NO seguido por € .
Lookbehind
“Lookbehind” es similar. Permite coincidir un patrón solo si hay algo anterior a él.
La sintaxis es:
● Lookbehind positivo: (?<=Y)X , coincide X , pero solo si hay Y antes de él.
●
Lookbehind negativo: (?<!Y)X , coincide X , pero solo si no hay Y antes de él.
Por ejemplo, cambiemos el precio a dólares estadounidenses. El signo de dólar usualmente va antes del número, entonces
para buscar $30 usaremos (?<=\$)\d+ : una cantidad precedida por $ :
Y si necesitamos la cantidad (un número no precedida por $ ), podemos usar “lookbehind negativo” (?<!\$)\d+ :
Atrapando grupos
Generalmente, los contenidos dentro de los paréntesis de “lookaround” (ver alrededor) no se convierten en parte del
resultado.
194/220
Ejemplo en el patrón \d+(?=€) , el signo € no es capturado como parte de la coincidencia. Eso es esperado: buscamos
un número \d+ , mientras (?=€) es solo una prueba que indica que debe ser seguida por € .
Pero en algunas situaciones nosotros podríamos querer capturar también la expresión en “lookaround”, o parte de ella. Eso
es posible: solo hay que rodear esa parte con paréntesis adicionales.
En los ejemplos de abajo el signo de divisa (€|kr) es capturado junto con la cantidad:
Resumen
Lookahead y lookbehind (en conjunto conocidos como “lookaround”) son útiles cuando queremos hacer coincidir algo
dependiendo del contexto antes/después.
Para expresiones regulares simples podemos hacer lo mismo manualmente. Esto es: coincidir todo, en cualquier contexto, y
luego filtrar por contexto en el bucle.
Recuerda, str.match (sin el indicador g ) y str.matchAll (siempre) devuelven las coincidencias como un array con la
propiedad index , así que sabemos exactamente dónde están dentro del texto y podemos comprobar su contexto.
Tipos de “lookaround”:
Tareas
Crea una expresión regular que encuentre solamente los no negativos (el cero está permitido).
Un ejemplo de uso:
A solución
195/220
Escribe una expresión regular que inserte <h1>Hello</h1> inmediatamente después de la etiqueta <body> . La etiqueta
puede tener atributos.
Por ejemplo:
let str = `
<html>
<body style="height: 200px">
...
</body>
</html>
`;
<html>
<body style="height: 200px"><h1>Hello</h1>
...
</body>
</html>
A solución
Backtracking catastrófico
Algunas expresiones regulares parecen simples, pero pueden ejecutarse durante demasiado tiempo e incluso “colgar” el
motor de JavaScript.
Tarde o temprano la mayoría de los desarrolladores se enfrentan ocasionalmente a este comportamiento. El síntoma típico:
una expresión regular funciona bien a veces, pero para ciertas cadenas se “cuelga” consumiendo el 100% de la CPU.
En este caso el navegador sugiere matar el script y recargar la página. No es algo bueno, sin duda.
Para el lado del servidor de JavaScript tal regexp puede colgar el proceso del servidor, que es aún peor. Así que
definitivamente deberíamos echarle un vistazo.
Ejemplo
Supongamos que tenemos una cadena y queremos comprobar si está formada por palabras \w+ con un espacio opcional
\s? después de cada una.
Una forma obvia de construir una regexp sería tomar una palabra seguida de un espacio opcional \w+\s? y luego repetirla
con * .
Esto nos lleva a la regexp ^(\w+\s?)*$ que especifica cero o más palabras de este tipo, que comienzan al principio ^ y
terminan al final $ de la línea.
En la práctica:
La regexp parece funcionar. El resultado es correcto. Aunque en ciertas cadenas tarda mucho tiempo. Tanto tiempo que el
motor de JavaScript se “cuelga” con un consumo del 100% de la CPU.
Si ejecuta el ejemplo de abajo probablemente no se verá nada ya que JavaScript simplemente se “colgará”. El navegador
dejará de reaccionar a los eventos, la interfaz de usuario dejará de funcionar (la mayoría de los navegadores sólo permiten el
desplazamiento). Después de algún tiempo se sugerirá recargar la página. Así que ten cuidado con esto:
196/220
let regexp = /^(\w+\s?)*$/;
let str = "An input string that takes a long time or even makes this regexp hang!";
Para ser justos observemos que algunos motores de expresión regular pueden manejar este tipo de búsqueda con eficacia,
por ejemplo, la versión del motor V8 a partir de la 8.8 puede hacerlo (por lo que Google Chrome 88 no se cuelga aquí)
mientras que el navegador Firefox sí se cuelga.
Ejemplo simplificado
Para entenderlo simplifiquemos el ejemplo: elimine los espacios \s? . Entonces se convierte en ^(\w+)*$ .
Y, para hacer las cosas más obvias sustituyamos \w por \d . La expresión regular resultante sigue colgando, por ejemplo:
En primer lugar uno puede notar que la regexp (\d+)* es un poco extraña. El cuantificador * parece extraño. Si
queremos un número podemos utilizar \d+ .
Efectivamente la regexp es artificial; la hemos obtenido simplificando el ejemplo anterior. Pero la razón por la que es lenta es
la misma. Así que vamos a entenderlo y entonces el ejemplo anterior se hará evidente.
¿Qué sucede durante la búsqueda de ^(\d+)*$ en la línea 123456789z (acortada un poco para mayor claridad, por
favor tenga en cuenta un carácter no numérico z al final, es importante) que tarda tanto?
\d+.......
(123456789)z
Una vez consumidos todos los dígitos se considera que se ha encontrado el d+ (como 123456789 ).
Entonces se aplica el cuantificador de asterisco (\d+)* . Pero no hay más dígitos en el texto, así que el asterisco no da
nada.
El siguiente carácter del patrón es el final de la cadena $ . Pero en el texto tenemos z en su lugar, por lo que no hay
coincidencia:
X
\d+........$
(123456789)z
2. Como no hay ninguna coincidencia, el cuantificador codicioso + disminuye el recuento de repeticiones, retrocede un
carácter.
\d+.......
(12345678)9z
3. Entonces el motor intenta continuar la búsqueda desde la siguiente posición (justo después de 12345678 ).
197/220
Se puede aplicar el asterisco patrón:(\d+)* : da una coincidencia más de patrón:\d+ , el número 9 :
\d+.......\d+
(12345678)(9)z
El motor intenta coincidir con $ de nuevo, pero falla, porque encuentra z en su lugar:
X
\d+.......\d+
(12345678)(9)z
4. No hay coincidencia así que el motor continuará con el retroceso disminuyendo el número de repeticiones. El retroceso
generalmente funciona así: el último cuantificador codicioso disminuye el número de repeticiones hasta llegar al mínimo.
Entonces el cuantificador codicioso anterior disminuye, y así sucesivamente.
X
\d+......\d+
(1234567)(89)z
El primer número tiene 7 dígitos y luego dos números de 1 dígito cada uno:
X
\d+......\d+\d+
(1234567)(8)(9)z
X
\d+.......\d+
(123456)(789)z
X
\d+.....\d+ \d+
(123456)(78)(9)z
…Y así sucesivamente.
Hay muchas formas de dividir una secuencia de dígitos 123456789 en números. Para ser precisos, hay 2n-1 , donde n
es la longitud de la secuencia.
● Para 123456789 tenemos n=9 , lo que da 511 combinaciones.
●
Para una secuencia más larga con “n=20” hay alrededor de un millón (1048575) de combinaciones.
● Para n=30 – mil veces más (1073741823 combinaciones).
Probar cada una de ellas es precisamente la razón por la que la búsqueda lleva tanto tiempo.
Lo mismo ocurre en nuestro primer ejemplo, cuando buscamos palabras por el patrón ^(\w+\s?)*$ en la cadena An
input that hangs! .
(input)
198/220
(inpu)(t)
(inp)(u)(t)
(in)(p)(ut)
...
Para un humano es obvio que puede no haber coincidencia porque la cadena termina con un signo de exclamación ! pero
la expresión regular espera un carácter denominativo \w o un espacio \s al final. Pero el motor no lo sabe.
El motor prueba todas las combinaciones de cómo la regexp (\w+\s?)* puede “consumir” la cadena, incluyendo las
variantes con espacios (\w+\s)* y sin ellos (\w+)* (porque los espacios \s? son opcionales). Como hay muchas
combinaciones de este tipo (lo hemos visto con dígitos), la búsqueda lleva muchísimo tiempo.
¿Qué hacer?
Desgraciadamente eso no ayudará: si sustituimos \w+ por \w+? la regexp seguirá colgada. El orden de las combinaciones
cambiará, pero no su número total.
Algunos motores de expresiones regulares hacen análisis complicados y automatizaciones finitas que permiten evitar pasar
por todas las combinaciones o hacerlo mucho más rápido, pero la mayoría de los motores no lo hacen. Además, eso no
siempre ayuda.
¿Cómo solucionarlo?
Hagamos que el espacio no sea opcional reescribiendo la expresión regular como ^(\w+\s)*\w*$ buscaremos cualquier
número de palabras seguidas de un espacio (\w+\s)* , y luego (opcionalmente) una palabra final \w* .
La regexp anterior, si omitimos el espacio, se convierte en (\w+)* , dando lugar a muchas combinaciones de \w+ dentro
de una misma palabra
\w+ \w+
(inp)(ut)
El nuevo patrón es diferente: (\w+\s)* especifica repeticiones de palabras seguidas de un espacio. La cadena input no
puede coincidir con dos repeticiones de \w+\s , porque el espacio es obligatorio.
Ahora se ahorra el tiempo necesario para probar un montón de combinaciones (en realidad la mayoría).
Previniendo el backtracking
Sin embargo no siempre es conveniente reescribir una regexp. En el ejemplo anterior era fácil, pero no siempre es obvio
cómo hacerlo.
Además una regexp reescrita suele ser más compleja y eso no es bueno. Las regexps son suficientemente complejas sin
necesidad de esfuerzos adicionales.
Por suerte hay un enfoque alternativo. Podemos prohibir el retroceso para el cuantificador.
La raíz del problema es que el motor de regexp intenta muchas combinaciones que son obviamente erróneas para un
humano.
199/220
Por ejemplo, en la regexp (\d+)*$ es obvio para un humano que patrón:+ no debería retroceder. Si sustituimos un
patrón:\d+ por dos \d+\d+ separados nada cambia:
\d+........
(123456789)!
\d+...\d+....
(1234)(56789)!
Y en el ejemplo original ^(\w+\s?)*$ podemos querer prohibir el backtracking en \w+ . Es decir: \w+ debe coincidir con
una palabra entera, con la máxima longitud posible. No es necesario reducir el número de repeticiones en \w+ o dividirlo en
dos palabras \w+\w+ y así sucesivamente.
Los motores de expresiones regulares modernos admiten cuantificadores posesivos para ello. Los cuantificadores regulares
se convierten en posesivos si añadimos + después de ellos. Es decir, usamos \d++ en lugar de \d+ para evitar que +
retroceda.
Los cuantificadores posesivos son de hecho más simples que los “regulares”. Simplemente coinciden con todos los que
pueden sin ningún tipo de retroceso. El proceso de búsqueda sin retroceso es más sencillo.
También existen los llamados “grupos de captura atómicos”, una forma de desactivar el retroceso dentro de los paréntesis.
Lookahead al rescate!
Así que hemos llegado a temas realmente avanzados. Nos gustaría que un cuantificador como + no retrocediera porque a
veces retroceder no tiene sentido.
El patrón para tomar tantas repeticiones de \w como sea posible sin retroceder es: (?=(\w+))\1 . Por supuesto,
podríamos tomar otro patrón en lugar de \w .
Vamos a descifrarla:
●
Lookahead ?= busca la palabra más larga \w+ a partir de la posición actual.
● El contenido de los paréntesis con ?=... no es memorizado por el motor así que envuelva \w+ en paréntesis.
Entonces el motor memorizará su contenido
●
…y nos permitirá hacer referencia a él en el patrón como \1 .
Es decir: miramos hacia adelante y si hay una palabra \w+ , entonces la emparejamos como \1 .
¿Por qué? Porque el lookahead encuentra una palabra \w+ como un todo y la capturamos en el patrón con \1 . Así que
esencialmente implementamos un cuantificador posesivo más + . Captura sólo la palabra entera patrón:\w+ , no una
parte de ella.
Por ejemplo, en la palabra JavaScript no sólo puede coincidir con Java sino que deja fuera Script para que coincida
con el resto del patrón.
1. En la primera variante, \w+ captura primero la palabra completa JavaScript , pero luego + retrocede carácter por
carácter, para intentar coincidir con el resto del patrón, hasta que finalmente tiene éxito (cuando \w+ coincide con
Java ).
2. En la segunda variante (?=(\w+)) mira hacia adelante y encuentra la palabra JavaScript , que está incluida en el
patrón como un todo por \1 , por lo que no hay manera de encontrar Script después de ella.
Podemos poner una expresión regular más compleja en (?=(\w+))\1 en lugar de \w , cuando necesitemos prohibir el
retroceso para + después de ella.
200/220
Por favor tome nota:
Hay más (en inglés) acerca de la relación entre los cuantificadores posesivos y lookahead en los artículos Regex:
Emulate Atomic Grouping (and Possessive Quantifiers) with LookAhead y Mimicking Atomic Groups .
let str = "An input string that takes a long time or even makes this regex hang!";
Aquí se utiliza \2 en lugar de \1 porque hay paréntesis exteriores adicionales. Para evitar enredarnos con los números,
podríamos dar a los paréntesis un nombre, por ejemplo (?<word>\w+) .
let str = "An input string that takes a long time or even makes this regex hang!";
Una tarea común para regexps es el “Análisis léxico”: tomar un texto (como el de un lenguaje de programación), y analizar
sus elementos estructurales. Por ejemplo, HTML tiene etiquetas y atributos, el código JavaScript tiene funciones, variables,
etc.
Escribir analizadores léxicos es un área especial, con sus propias herramientas y algoritmos, así que no profundizaremos en
ello; pero existe una tarea común: leer algo en una posición dada.
Por ej. tenemos una cadena de código let varName = "value" , y necesitamos leer el nombre de su variable, que
comienza en la posición 4 .
Buscaremos el nombre de la variable usando regexp \w+ . En realidad, el nombre de la variable de JavaScript necesita un
regexp un poco más complejo para un emparejamiento más preciso, pero aquí eso no importa.
Una llamada a str.match(/\w+/) solo encontrará la primera palabra de la línea ( let ). No es la que queremos.
Podríamos añadir el indicador g , pero al llamar a str.match(/\w+/g) buscará todas las palabras del texto y solo
necesitamos una y en la posición 4 . De nuevo, no es lo que necesitamos.
Para un regexp sin los indicadores g y y , este método busca la primera coincidencia y funciona exactamente igual a
str.match(regexp) .
…Pero si existe el indicador g , realiza la búsqueda en str empezando desde la posición almacenada en su propiedad
regexp.lastIndex . Y si encuentra una coincidencia, establece regexp.lastIndex en el index inmediatamente
posterior a la coincidencia.
201/220
En otras palabras, regexp.lastIndex funciona como punto de partida para la búsqueda, cada llamada lo reestablece a
un nuevo valor: el posterior a la última coincidencia.
let str = 'let varName'; // encontremos todas las palabras del string
let regexp = /\w+/g;
let result;
Tal uso de regexp.exec es una alternativa al método str.match bAll , con más control sobre el proceso.
Podemos establecer manualmente lastIndex a 4 , para comenzar la búsqueda desde la posición dada.
Como aquí:
regexp.lastIndex = 4;
¡Problema resuelto!
El resultado es correcto.
…Pero espera, no tan rápido.
Nota que la búsqueda comienza en la posición lastIndex y luego sigue adelante. Si no hay ninguna palabra en la
posición lastIndex pero la hay en algún lugar posterior, entonces será encontrada:
202/220
// comenzando desde la posición 3
regexp.lastIndex = 3;
Para algunas tareas, incluido el análisis léxico, esto está mal. Necesitamos la coincidencia en la posición exacta, y para ello
es el flag y .
El indicador y hace que regexp.exec busque “exactamente en” la posición lastIndex , no “comenzando en”
ella.
regexp.lastIndex = 3;
alert( regexp.exec(str) ); // null (Hay un espacio en la posición 3, no una palabra)
regexp.lastIndex = 4;
alert( regexp.exec(str) ); // varName (Una palabra en la posición 4)
Como podemos ver, el /\w+/y de regexp no coincide en la posición 3 (a diferencia del indicador g ), pero coincide en la
posición 4 .
Imagina que tenemos un texto largo, y no hay coincidencias en él. Entonces la búsqueda con el indicador g irá hasta el final
del texto, y esto tomará significativamente más tiempo que la búsqueda con el indicador y .
En tareas tales como el análisis léxico, normalmente hay muchas búsquedas en una posición exacta. Usar el indicador y es
la clave para un buen desempeño.
En este artículo vamos a abordar varios métodos que funcionan con expresiones regulares a fondo.
str.match(regexp)
El método str.match(regexp) encuentra coincidencias para las expresiones regulares ( regexp ) en la cadena ( str ).
Tiene 3 modos:
1. Si la expresión regular ( regexp ) no tiene la bandera g , retorna un array con los grupos capturados y las propiedades
index (posición de la coincidencia), input (cadena de entrada, igual a str ):
// Additional information:
alert( result.index ); // 7 (match position)
alert( result.input ); // I love JavaScript (cadena de entrada)
2. Si la expresión regular ( regexp ) tiene la bandera g , retorna un array de todas las coincidencias como cadenas, sin
capturar grupos y otros detalles.
203/220
alert( result[0] ); // JavaScript
alert( result.length ); // 1
Esto es algo muy importante. Si no hay coincidencias, no vamos a obtener un array vacío, pero sí un null . Es fácil
cometer un error olvidándolo, ej.:
alert(result); // null
alert(result.length); // Error: Cannot read property 'length' of null
str.matchAll(regexp)
Es usado principalmente para buscar por todas las coincidencias con todos los grupos.
Hay 3 diferencias con match :
1. Retorna un objeto iterable con las coincidencias en lugar de un array. Podemos convertirlo en un array usando el método
Array.from .
2. Cada coincidencia es retornada como un array con los grupos capturados (el mismo formato de str.match sin la
bandera g ).
3. Si no hay resultados devuelve un objeto iterable vacío en lugar de null .
Ejemplo de uso:
Si usamos for..of para iterar todas las coincidencias de matchAll , no necesitamos Array.from .
str.split(regexp|substr, limit)
204/220
O también dividir una cadena usando una expresión regular de la misma forma:
str.search(regexp)
Si necesitamos las posiciones de las demás coincidencias, deberíamos usar otros medios, como encontrar todos con
str.matchAll(regexp) .
str.replace(str|regexp, str|func)
Este es un método genérico para buscar y reemplazar, uno de los más útiles. La navaja suiza para buscar y reemplazar.
Podemos usarlo sin expresiones regulares, para buscar y reemplazar una sub-cadena:
Cuando el primer argumento de replace es una cadena, solo reemplaza la primera coincidencia.
Puedes ver eso en el ejemplo anterior: solo el primer "-" es reemplazado por ":" .
Para encontrar todos los guiones, no necesitamos usar un cadena "-" sino una expresión regular /-/g con la bandera g
obligatoria:
$n si n es un número, inserta el contenido del enésimo grupo capturado, para más detalles ver Grupos de captura
$<nombre> inserta el contenido de los paréntesis con el nombre dado, para más detalles ver Grupos de captura
$$ inserta el carácter $
Por ejemplo:
Para situaciones que requieran reemplazos “inteligentes”, el segundo argumento puede ser una función.
Puede ser llamado por cada coincidencia y el valor retornado puede ser insertado como un reemplazo.
205/220
La función es llamada con los siguientes argumentos func(match, p1, p2, ..., pn, offset, input,
groups) :
1. match – la coincidencia,
2. p1, p2, ..., pn – contenido de los grupos capturados (si hay alguno),
3. offset – posición de la coincidencia,
4. input – la cadena de entrada,
5. groups – un objeto con los grupos nombrados.
Si hay paréntesis en la expresión regular, entonces solo son 3 argumentos: func(str, offset, input) .
En el ejemplo anterior hay dos paréntesis, entonces la función de reemplazo es llamada con 5 argumentos: el primero es
toda la coincidencia, luego dos paréntesis, y después (no usado en el ejemplo) la posición de la coincidencia y la cadena de
entrada:
let result = str.replace(/(\w+) (\w+)/, (match, name, surname) => `${surname}, ${name}`);
Si hay muchos grupos, es conveniente usar parámetros rest para acceder a ellos:
O, si estamos usando grupos nombrados, entonces el objeto groups con ellos es siempre el último, por lo que podemos
obtenerlos así:
Usando una función nos da todo el poder del reemplazo, porque obtiene toda la información de la coincidencia, ya que tiene
acceso a las variables externas y se puede hacer de todo.
str.replaceAll(str|regexp, str|func)
Este método es esencialmente el mismo que str.replace , con dos diferencias principales:
206/220
1. Si el primer argumento es un string, reemplaza todas las ocurrencias del string, mientras que replace solamente
reemplaza la primera ocurrencia.
2. Si el primer argumento es una expresión regular sin la bandera g , habrá un error. Con la bandera g , funciona igual que
replace .
El caso de uso principal para replaceAll es el reemplazo de todas las ocurrencias de un string.
Como esto:
regexp.exec(str)
El método regexp.exec(str) retorna una coincidencia por expresión regular regexp en la cadena str . A diferencia
de los métodos anteriores, se llama en una expresión regular en lugar de en una cadena.
Si no está la bandera g , entonces regexp.exec(str) retorna la primera coincidencia igual que str.match(regexp) .
Este comportamiento no trae nada nuevo.
Entonces, repetidas llamadas retornan todas las coincidencias una tras otra, usando la propiedad regexp.lastIndex
para realizar el rastreo de la posición actual de la búsqueda.
En el pasado, antes de que el método str.matchAll fuera agregado a JavaScript, se utilizaban llamadas de
regexp.exec en el ciclo para obtener todas las coincidencias con sus grupos:
let result;
Esto también funciona, aunque para navegadores modernos str.matchAll usualmente es lo más conveniente.
Podemos usar regexp.exec para buscar desde una posición dada configurando manualmente el lastIndex .
Por ejemplo:
Si la expresión regular tiene la bandera y , entonces la búsqueda se realizará exactamente en la posición del
regexp.lastIndex , no más adelante.
Vamos a reemplazar la bandera g con y en el ejemplo anterior. No habrá coincidencias, ya que no hay palabra en la
posición 5 :
207/220
let str = 'Hello, world!';
Esto es conveniente cuando con una expresión regular necesitamos “leer” algo de la cadena en una posición exacta, no en
otro lugar.
regexp.test(str)
Por ejemplo:
La misma expresión regular probada (de manera global) repetidamente en diferentes lugares puede fallar
Si nosotros aplicamos la misma expresión regular (de manera global) a diferentes entradas, puede causar resultados
incorrectos, porque regexp.test anticipa las llamadas usando la propiedad regexp.lastIndex , por lo que la
búsqueda en otra cadena puede comenzar desde una posición distinta a cero.
Por ejemplo, aquí llamamos regexp.test dos veces en el mismo texto y en la segunda vez falla:
Para solucionarlo, podemos establecer regexp.lastIndex = 0 antes de cada búsqueda. O en lugar de llamar a los
métodos en la expresión regular usar los métodos de cadena str.match/search/... , ellos no usan el
lastIndex .
Soluciones
208/220
ArrayBuffer, arrays binarios
function concat(arrays) {
// suma de las longitudes de array individuales
let totalLength = arrays.reduce((acc, value) => acc + value.length, 0);
return result;
}
A formulación
Fetch
Si la respuesta contiene el status 200 , utilizamos el método .json() para leer el objeto JS.
Por el contrario, si el fetch falla o la respuesta no contiene un status 200, devolvemos null en el resultado del
arreglo.
Código:
return results;
}
209/220
Nota: la función .then está directamente vinculada al fetch . Por lo tanto, cuando se obtiene la respuesta se
procede a ejecutar la función .json() inmediatamente en lugar de esperar a las otras peticiones.
Esto es un ejemplo de cómo la API de Promesas puede ser útil aunque mayormente se utilice async/await .
A formulación
Necesitamos la cabecera Origin , ya que en algunos casos Referer no está presente. Por ejemplo, cuando
realizamos un fetch a una página HTTP desde una HTTPS (acceder a un sitio menos seguro desde uno más
seguro), en ese caso no tendremos el campo Referer .
Como veremos, fetch tiene opciones con las que es posible evitar el envío de Referer e incluso permite su
modificación (dentro del mismo sitio).
Por el hecho de que Referer no es confiable, la cabecera Origin ha sido creada. El navegador garantiza el
envío correcto de Origin para las solicitudes de origen cruzado.
A formulación
LocalStorage, sessionStorage
A formulación
Animaciones CSS
/* clase original */
#flyjet {
transition: all 3s;
}
/* JS añade .growing */
#flyjet.growing {
width: 400px;
210/220
height: 240px;
}
Ten en cuenta que transitionend se dispara dos veces, una para cada propiedad. Entonces, si no realizamos
una verificación adicional, el mensaje aparecería 2 veces.
A formulación
Necesitamos elegir la curva de Bézier correcta para esa animación. Debe tener y>1 en algún punto para que el
avión “salte”.
Por ejemplo, podemos tomar ambos puntos de control con y>1 , como: cubic-bezier(0.25, 1.5, 0.75,
1.5) .
La gráfica:
2 3
A formulación
Círculo animado
A formulación
A formulación
Animaciones JavaScript
Para rebotar podemos usar la propiedad CSS top y position:absolute para la pelota dentro del campo con
position:relative .
La coordenada inferior del campo es field.clientHeight . La propiedad CSS top se refiere al borde superior
de la bola. Por lo tanto, debe ir desde 0 hasta field.clientHeight - ball.clientHeight , que es la
posición final más baja del borde superior de la pelota.
Para obtener el efecto de “rebote”, podemos usar la función de sincronización bounce en el modo easeOut .
211/220
let to = field.clientHeight - ball.clientHeight;
animate({
duration: 2000,
timing: makeEaseOut(bounce),
draw(progress) {
ball.style.top = to * progress + 'px'
}
});
A formulación
En la tarea Animar la pelota que rebota solo teníamos una propiedad para animar. Ahora necesitamos una más:
elem.style.left .
La coordenada horizontal cambia por otra ley: no “rebota”, sino que aumenta gradualmente desplazando la pelota
hacia la derecha.
Como función de tiempo podríamos usar linear , pero algo como makeEaseOut(quad) se ve mucho mejor.
El código:
A formulación
Elementos personalizados
1. Borramos el temporizador setInterval cuando el elemento es quitado del documento. Esto es importante,
de otro modo continuará ejecutando aunque no se lo necesite más, y el navegador no puede liberar la memoria
asignada a este elemento.
2. Podemos acceder a la fecha actual con la propiedad elem.date . Todos los métodos y propiedades de clase
son naturalmente métodos y propiedades del elemento.
212/220
Abrir la solución en un entorno controlado.
A formulación
Regexp ^$
Esta tarea demuestra una vez más que los anclajes no son caracteres, sino pruebas.
La cadena está vacía "" . El motor primero coincide con ^ (inicio de entrada), sí, está allí, y luego inmediatamente
el final $ , también está. Entonces hay una coincidencia.
A formulación
Límite de palabra: \b
Encuentra la hora
La respuesta: \b\d\d:\d\d\b .
A formulación
Java[^script]
● En el script Java no coincide con nada, porque [^script] significa “cualquier carácter excepto los dados”.
Entonces, la expresión regular busca "Java" seguido de uno de esos símbolos, pero hay un final de cadena, sin
símbolos posteriores.
● Sí, porque la sección [^script] en parte coincide con el carácter "S" . No está en script . Como el regexp
distingue entre mayúsculas y minúsculas (sin flag i ), procesa a "S" como un carácter diferente de "s" .
A formulación
Respuesta: \d\d[-:]\d\d .
213/220
Tenga en cuenta que el guión '-' tiene un significado especial entre corchetes, pero solo entre otros caracteres, no
al principio o al final, por lo que no necesitamos escaparlo.
A formulación
Cuantificadores +, *, ? y {n}
Solución:
Tenga en cuenta que el punto es un carácter especial, por lo que debemos escaparlo e insertarlo como \. .
A formulación
// color
alert( "#123456".match( /#[a-f0-9]{6}\b/gi ) ); // #123456
// sin color
alert( "#12345678".match( /#[a-f0-9]{6}\b/gi ) ); // null
A formulación
Primero el perezoso \d+? trata de tomar la menor cantidad de dígitos posible, pero tiene que llegar al espacio, por
lo que toma 123 .
214/220
Después el segundo \d+? toma solo un dígito, porque es sufuciente.
A formulación
Necesitamos encontrar el inicio del comentario <!-- , después todo hasta el fin de --> .
Una variante aceptable es <!--.*?--> – el cuantificador perezoso detiene el punto justo antes de --> . También
necesitamos agregar la bandera s al punto para incluir líneas nuevas.
A formulación
La solución es <[^<>]+> .
let str = '<> <a href="/"> <input type="radio" checked > <b>';
A formulación
Grupos de captura
Ahora demostremos que la coincidencia debe capturar todo el texto: comience por el principio y termine por el final.
Eso se hace envolviendo el patrón en ^...$ .
Finalmente:
A formulación
215/220
Encuentra el color en el formato #abc o #abcdef
Podemos agregar exactamente 3 dígitos hexadecimales opcionales más. No necesitamos más ni menos. El color
tiene 3 o 6 dígitos.
Aquí el patrón [a-f0-9]{3} está rodeado en paréntesis para aplicar el cuantificador {1,2} .
En acción:
Hay un pequeño problema aquí: el patrón encontrado #abc en #abcd . Para prevenir esto podemos agregar \b al
final:
A formulación
A formulación
Una expresión regular para un número es: -?\d+(\.\d+)? . La creamos en tareas anteriores.
Un operador es [-+*/] . El guión - va primero dentro de los corchetes porque colocado en el medio significaría un
rango de caracteres, cuando nosotros queremos solamente un carácter - .
La barra inclinada / debe ser escapada dentro de una expresión regular de JavaScript /.../ , eso lo haremos más
tarde.
Necesitamos un número, un operador y luego otro número. Y espacios opcionales entre ellos.
216/220
3. -?\d+(\.\d+)? – el segundo número.
Para hacer que cada una de estas partes sea un elemento separado del array de resultados, encerrémoslas entre
paréntesis: (-?\d+(\.\d+)?)\s*([-+*/])\s*(-?\d+(\.\d+)?) .
En acción:
El resultado incluye:
Solo queremos los números y el operador, sin la coincidencia completa o las partes decimales, así que “limpiemos”
un poco el resultado.
La coincidencia completa (el primer elemento del array) se puede eliminar cambiando el array result.shift() .
Los grupos que contengan partes decimales (número 2 y 4) (.\d+) pueden ser excluídos al agregar ?: al
comienzo: (?:\.\d+)? .
La solución final:
function parse(expr) {
let regexp = /(-?\d+(?:\.\d+)?)\s*([-+*\/])\s*(-?\d+(?:\.\d+)?)/;
return result;
}
Como alternativa al uso de la exclusión de captura ?: , podemos dar nombre a los grupos:
function parse(expr) {
let regexp = /(?<a>-?\d+(?:\.\d+)?)\s*(?<operator>[-+*\/])\s*(?<b>-?\d+(?:\.\d+)?)/;
A formulación
Alternancia (O) |
217/220
La primera idea puede ser listar los idiomas con | en el medio.
El motor de expresiones regulares busca las alternancias una por una. Es decir: primero verifica si tenemos Java ,
de lo contrario – busca JavaScript y así sucesivamente.
Como resultado, nunca se puede encontrar JavaScript , simplemente porque encuentra primero Java .
En acción:
A formulación
Luego, para encontrar todo hasta la etiqueta de cierre, usemos el patrón .*? con la bandera s para que coincida
con cualquier carácter, incluida la nueva línea, y luego agreguemos una referencia inversa a la etiqueta de cierre.
En acción:
let str = `
[b]hello![/b]
[quote]
[url]http://google.com[/url]
[/quote]
`;
Tenga en cuenta que además de escapar [ tuvimos que escapar de una barra para la etiqueta de cierre [\/\1] ,
porque normalmente la barra cierra el patrón.
A formulación
La solución: /"(\\.|[^"\\])*"/g .
El paso a paso:
218/220
● Primero buscamos una comilla de apertura "
● Luego, si tenemos una barra invertida \\ (tenemos que duplicarla en el patrón porque es un carácter especial).
Luego, cualquier carácter está bien después de él (un punto).
● De lo contrario, tomamos cualquier carácter excepto una comilla (que significaría el final de la cadena) y una barra
invertida (para evitar barras invertidas solitarias, la barra invertida solo se usa con algún otro símbolo después):
[^"\\]
● …Y así sucesivamente hasta la comilla de cierre.
En acción:
A formulación
Necesitamos un espacio después <style y luego, opcionalmente, algo más o el final > .
En acción:
A formulación
Como puedes ver, hay coincidencia de 8 , con -18 . Para excluirla necesitamos asegurarnos de que regexp no
comience la búsqueda desde el medio de otro número (no coincidente).
Podemos hacerlo especificando otra precedencia “lookbehind negativo”: (?<!-)(?<!\d)\d+ . Ahora (?<!\d)
asegura que la coicidencia no comienza después de otro dígito, justo lo que necesitamos.
219/220
let str = "0 12 -5 123 -18";
A formulación
Para insertar algo después de la etiqueta <body> , primero debemos encontrarla. Para ello podemos usar la
expresión regular <body.*?> .
En esta tarea no necesitamos modificar la etiqueta <body> . Solamente agregar texto después de ella.
En el string de reemplazo, $& significa la coincidencia misma, la parte del texto original que corresponde a
<body.*?> . Es reemplazada por sí misma más <h1>Hello</h1> .
Como puedes ver, solo está presente la parte “lookbehind” en esta expresión regular.
La etiqueta <body.*?> no será devuelta. El resultado de esta expresión regular es un string vacío, pero coincide
solo en las posiciones precedidas por <body.*?> .
Entonces reemplaza la “linea vacía”, precedida por <body.*?> , con <h1>Hello</h1> . Esto es, la inserción
después de <body> .
P.S. Los indicadores de Regexp tales como s y i también nos pueden ser útiles: /<body.*?>/si . El indicador
s hace que que el punto . coincida también con el carácter de salto de línea, y el indicador i hace que <body>
también acepte coincidencias <BODY> en mayúsculas y minúsculas.
A formulación
220/220