Javascript Zero Hero Programming
Javascript Zero Hero Programming
En este capítulo, aprenderás sobre las expresiones regulares y más sobre las cadenas. También
cubriremos los métodos que utilizamos para procesar las cadenas. Como sabes, los tipos de
JavaScript pueden dividirse en dos categorías: primitivos y no primitivos (tipo objeto). Las
cadenas, al igual que los números y los booleanos, se consideran tipos primitivos de JavaScript.
Las cadenas son una serie de caracteres encerrados entre comillas simples o dobles.
Unicode
¿Por qué necesitamos utilizar caracteres Unicode en primer lugar? Lo diré de forma sencilla: la
máquina del ordenador no entiende las letras inglesas, pero sí la secuencia de caracteres. Por
eso necesitamos utilizar Unicode, porque nos proporcionará una lista de conjuntos de
caracteres y asignará a cada carácter un punto de código único. Unicode es un conjunto de
caracteres universal y proporciona un número único para cada carácter. La versión 1.0 de
Unicode se publicó en 1991, y la última versión actualizada se publicó en 2021, e incluye
códigos para 144.667 caracteres. Son muchos códigos, y sin la programación Unicode, todo lo
que hagamos será muy difícil.
Ya he mencionado que Unicode asigna un punto de código único para cada carácter. Un punto
de código es un número asignado a un único carácter. Estos números pueden ir desde U+0000
hasta U+10FFFF. Como puedes ver, tenemos que usar U+, un prefijo que significa Unicode, y
después del plus, tenemos el <hex>, que significa un número hexadecimal. Y ahí lo tienes. El
Unicode gestiona este punto de código y los marea con un carácter específico. Otra parte
importante que debes entender es que JavaScript utiliza la codificación UTF-16 del conjunto de
caracteres Unicode. Según la especificación ECMAScript, las cadenas son:
"El tipo String es el conjunto de todas las secuencias ordenadas de cero o más valores enteros
sin signo de 16 bits ("elementos"). El tipo String se utiliza generalmente para representar datos
textuales en un programa ECMAScript en ejecución, en cuyo caso cada elemento del String se
trata como un valor de unidad de código UTF-16. "
En el ejemplo anterior, podemos ver que en la variable mensaje, tenemos una cadena que
consta de 5 caracteres. Ahora bien, siempre asociamos las cadenas como una secuencia de
caracteres visibles porque contamos las letras a la derecha, los números, o incluso los signos
de puntuación, ¿si los hay? Este enfoque funcionará si utilizamos caracteres simples conocidos
como caracteres ASCII y que pertenecen al bloque latino básico.