Criptografia y Seguridad en Computadores - Lucena, M PDF
Criptografia y Seguridad en Computadores - Lucena, M PDF
Criptografia y Seguridad en Computadores - Lucena, M PDF
EN
C OMPUTADORES
Versión 4-0.9.0 27 de mayo de 2011
U NIVERSIDAD DE J A ÉN
2
—¿Y qué? —preguntó un visitante de Washington—. ¿Qué significan otros números primos
más?
—Tal vez significa que nos están enviando un dibujo. Este mensaje está compuesto por una
enorme cantidad de bits de información. Supongamos que esa cantidad es el producto de tres
números más pequeños (. . . ). Entonces, el mensaje tendrı́a tres dimensiones.
Aviso Importante
Este libro está en constante evolución. Por ello, le aconsejo que consulte la siguien-
te página web:
http://wwwdi.ujaen.es/∼mlucena/lcripto.html
En ella podrá:
Consultar la Fe de Erratas.
Al reutilizar o distribuir la obra, tiene que dejar bien claro los términos de la
licencia de esta obra.
Nada en esta licencia menoscaba o restringe los derechos morales del autor.
Los derechos derivados de usos legı́timos u otras limitaciones reconocidas por ley
no se ven afectados por lo anterior.
Esto es un resumen legible por humanos del texto legal (la licencia completa)
disponible en la siguiente dirección:
http://creativecommons.org/licenses/by-nc/2.5/es/legalcode.es
I Preliminares 21
1. Introducción 23
1.1. Cómo Leer esta Obra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2. Algunas notas sobre la Historia de la Criptografı́a . . . . . . . . . . . . 24
1.3. Números Grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4. Acerca de la Terminologı́a Empleada . . . . . . . . . . . . . . . . . . . . 29
1.5. Notación Algorı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2. Conceptos Básicos 31
2.1. Criptografı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2. Criptosistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3. Esteganografı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.4. Criptoanálisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5. Compromiso entre Criptosistema y Criptoanálisis . . . . . . . . . . . . 36
2.6. Seguridad en Sistemas Informáticos . . . . . . . . . . . . . . . . . . . . 37
2.6.1. Tipos de Autentificación . . . . . . . . . . . . . . . . . . . . . . . 39
3. Teorı́a de la Información 43
3.1. Cantidad de Información . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2. Entropı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3. Entropı́a Condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4. Cantidad de Información entre dos Variables . . . . . . . . . . . . . . . 48
3.5. Criptosistema Seguro de Shannon . . . . . . . . . . . . . . . . . . . . . 49
3.6. Redundancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7. Desinformación y Distancia de Unicidad . . . . . . . . . . . . . . . . . 52
3.8. Confusión y Difusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.9. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.10. Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4. Complejidad Algorı́tmica 59
4.1. Concepto de Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2. Complejidad Algorı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.1. Operaciones Elementales . . . . . . . . . . . . . . . . . . . . . . . 62
4.3. Algoritmos Polinomiales, Exponenciales y Subexponenciales . . . . . . 63
4.4. Clases de Complejidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.5. Algoritmos Probabilı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5. Aritmética Modular 69
5.1. Concepto de Aritmética Modular . . . . . . . . . . . . . . . . . . . . . . 69
5.1.1. Algoritmo de Euclides . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1.2. Complejidad de las Operaciones Aritméticas en Zn . . . . . . . 72
5.2. Cálculo de Inversas en Zn . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.2.1. Existencia de la Inversa . . . . . . . . . . . . . . . . . . . . . . . 72
5.2.2. Función de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2.3. Algoritmo Extendido de Euclides . . . . . . . . . . . . . . . . . 74
5.3. Teorema Chino del Resto . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.4. Exponenciación. Logaritmos Discretos . . . . . . . . . . . . . . . . . . . 77
VI Apéndices 271
Bibliografı́a 301
Preliminares
Introducción
6. Apéndices.
Este texto no tiene necesariamente que ser leı́do capı́tulo por capı́tulo, aunque se
ha organizado de manera que los contenidos más básicos aparezcan primero. La parte
de fundamentos teóricos está orientada a personas con unos conocimientos mı́nimos
sobre Álgebra y Programación, pero puede ser ignorada si el lector está dispuesto
a prescindir de las justificaciones matemáticas de lo que encuentre en posteriores
capı́tulos. La recomendación del autor en este sentido es clara: si es su primer contac-
to con la Criptografı́a, deje los fundamentos teóricos justo para el final, o correrá el
riesgo de perderse entre conceptos que, si de una parte son necesarios para una com-
prensión profunda del tema, no son imprescindibles a la hora de empezar a adentrar-
se en este apasionante mundo.
Se ha pretendido que todos los conceptos queden suficientemente claros con la
sola lectura de este libro, pero se recomienda vivamente que si el lector tiene interés
por profundizar en cualquiera de los aspectos tratados aquı́, consulte la bibliografı́a
para ampliar sus conocimientos, pudiendo emplear como punto de partida las pro-
pias referencias que aparecen al final de este libro, aunque por desgracia, algunas de
las más interesantes están en inglés.
contenidos multimedia. Esta dualidad civil–militar ha dado lugar a una curiosa doble
historia de la Criptografı́a, en la que los mismos algoritmos eran descubiertos, con
pocos años de diferencia, por equipos de anónimos militares y posteriormente por
matemáticos civiles, alcanzando únicamente estos últimos el reconocimiento público
por sus trabajos.
Muchas son las voces que claman por la disponibilidad pública de la Criptografı́a.
La experiencia ha demostrado que la única manera de tener buenos algoritmos es que
éstos sean accesibles, para que puedan ser sometidos al escrutinio de toda la comuni-
dad cientı́fica. Existe una máxima en Criptografı́a que afirma que cualquier persona
—o equipo— es capaz de desarrollar un algoritmo criptográfico que él mismo no sea
capaz de romper. Si la seguridad de nuestro sistema se basa en que nadie conozca su
funcionamiento tiene varias implicaciones perversas: por un lado, aquellos que quie-
ran conocer su verdadera resistencia tendrán que confiar en nuestra palabra, y por
otro, provoca una falsa sensación de seguridad, ya que si algún enemigo encuentra un
agujero, es bastante probable que no lo publique. En consecuencia, el único secreto
que debe tener un sistema criptográfico es la clave. Ejemplos a lo largo de la historia
sobre fracasos de esta polı́tica de seguridad basada en la oscuridad, por desgracia, hay
muchos, algunos de ellos en ámbitos tan delicados como el Voto Electrónico.
Salvo honrosas excepciones1 , la Criptografı́a llega hasta nosotros en forma de pro-
gramas informáticos. Un programa mal diseñado puede echar por tierra la seguridad
de un buen algoritmo criptográfico, por lo que es necesario conocer cómo está escrito
el programa en cuestión, para poder detectar y eliminar los fallos que aparezcan en
él. En este sentido, el Sofware Libre, cuyo código fuente está a disposición de los usua-
rios —a diferencia del software privativo, que mantiene el código fuente en secreto—
quizás sea el que brinda mejores resultados, ya que permite a cualquiera, además de
asegurarse de que no contiene puertas traseras, estudiar y eventualmente corregir el
código si encuentra fallos en él. Actualmente, una de las mayores amenazas sobre el
software libre es la pretensión de establecer sistemas de patentes sobre los programas
informáticos, con un claro perjuicio tanto para los usuarios como para las pequeñas
empresas frente al poder de las grandes corporaciones. Por desgracia, parece que a
nuestros gobiernos les interesan más los beneficios de las multinacionales que los
intereses de los ciudadanos.
Es imposible desligar la Criptografı́a moderna de todas las consideraciones polı́ti-
cas, filosóficas y morales que suscita. Hoy por hoy, tiene más poder quien más infor-
mación controla, por lo que permitir que los ciudadanos empleen técnicas criptográfi-
cas para proteger su intimidad limita de forma efectiva ese poder. Con el pretexto de
la seguridad se están aplicando medidas para ralentizar el acceso de los ciudadanos
1
Como el algoritmo Solitaire, desarrollado por Bruce Schneier, para el que únicamente se necesita
papel, lápiz, una baraja y algo de paciencia.
Valor Número
Probabilidad de ser fulminado por un rayo (por dı́a) 1 entre 9.000.000.000 (233 )
Probabilidad de ganar la Loterı́a Primitiva Española 1 entre 13.983.816 (223 )
Probabilidad de ganar la Primitiva y caer fulminado 1 entre 256
por un rayo el mismo dı́a
Conceptos Básicos
2.1. Criptografı́a
2.2. Criptosistema
Definiremos un criptosistema como una quı́ntupla (M, C, K, E, D), donde:
M representa el conjunto de todos los mensajes sin cifrar (lo que se denomina
texto claro, o plaintext) que pueden ser enviados.
Criptosistemas asimétricos o de llave pública, que emplean una doble clave (kp , kP ).
kp se conoce como clave privada y kP se conoce como clave pública. Una de ellas
sirve para la transformación E de cifrado y la otra para la transformación D
de descifrado. En muchos casos son intercambiables, esto es, si empleamos una
para cifrar la otra sirve para descifrar y viceversa. Estos criptosistemas deben
Claves Débiles
2.3. Esteganografı́a
2.4. Criptoanálisis
En la sección 3.5 (pág. 49) veremos que pueden existir sistemas idealmente se-
guros, capaces de resistir cualquier ataque. También veremos que estos sistemas en
la práctica carecen de interés, lo cual nos lleva a tener que adoptar un compromiso
entre el coste del sistema —tanto computacional como de almacenamiento, e incluso
económico— frente a su resistencia a diferentes ataques criptográficos.
La información posee un tiempo de vida, y pierde su valor transcurrido éste. Los
datos sobre la estrategia de inversiones a largo plazo de una gran empresa, por ejem-
plo, tienen un mayor periodo de validez que la exclusiva periodı́stica de una senten-
cia judicial que se va a hacer pública al dı́a siguiente. Será suficiente, pues, tener un
sistema que garantice que el tiempo que se puede tardar en comprometer su seguri-
dad es mayor que el tiempo de vida de la propia información que éste alberga. Esto
no suele ser fácil, sobre todo porque no tardará lo mismo un oponente que disponga
de una única computadora de capacidad modesta, que otro que emplee una red de
supercomputadores. Por eso también ha de tenerse en cuenta si la información que
queremos proteger vale más que el esfuerzo de criptoanálisis que va a necesitar, por-
que entonces puede que no esté segura. La seguridad de los criptosistemas se suele
medir en términos del número de computadoras y del tiempo necesarios para rom-
perlos, y a veces simplemente en función del dinero necesario para llevar a cabo esta
tarea con garantı́as de éxito.
En cualquier caso hoy por hoy existen sistemas que son muy poco costosos —o
incluso gratuitos, como algunas versiones de PGP—, y que nos garantizan un nivel
de protección tal que toda la potencia de cálculo que actualmente hay en el planeta
serı́a insuficiente para romperlos.
Tampoco conviene depositar excesiva confianza en el algoritmo de cifrado, pues-
to que en el proceso de protección de la información existen otros puntos débiles que
deben ser tratados con un cuidado exquisito. Por ejemplo, no tiene sentido emplear
1. Sistemas aislados. Son los que no tienen acceso a ningún tipo de red. De unos
años a esta parte se han convertido en minorı́a, debido al auge que han expe-
rimentado las redes, especialmente Internet. En ellos suele ser suficiente la im-
plementación de mecanismos de control de acceso fı́sico —cerraduras, videovi-
gilancia, etc.—, junto con protocolos adecuados de gestión de los privilegios de
cada usuario, si es que hay más de uno.
1. Seguridad fı́sica. Englobaremos dentro de esta categorı́a a todos los asuntos re-
lacionados con la salvaguarda de los soportes fı́sicos de la información, más
que de la información propiamente dicha. En este nivel estarı́an, entre otras,
las medidas contra incendios y sobrecargas eléctricas, la prevención de ataques
terroristas, las polı́ticas de copias de respaldo (backups), etc. También se suelen
tener en cuenta dentro de este punto aspectos relacionados con la restricción
del acceso fı́sico a las computadoras.
3. Control de acceso a los datos. Como ya hemos dicho, un sistema informático debe
permitir acceder a la información únicamente a agentes autorizados. General-
mente, diferentes usuarios tendrán acceso a distinta información, por lo que una
simple restricción del acceso al sistema no será suficiente, sino que habrá que
establecer privilegios individualizados, ası́ como mecanismos que, como el ci-
frado, permitan preservar la confidencialidad incluso frente a accesos fı́sicos a
los dispositivos de almacenamiento.
por sı́ mismo para interactuar con el sistema, o tratarse de una llave electróni-
ca que sustituya o complemente a la contraseña para facilitar la entrada a un
usuario.
Fundamentos Teóricos de la
Criptografı́a
Teorı́a de la Información
Vamos a introducir este concepto partiendo de su idea intuitiva. Para ello anali-
zaremos el siguiente ejemplo: supongamos que tenemos una bolsa con nueve bolas
negras y una blanca. ¿Cuánta información obtenemos si alguien nos dice que ha sa-
cado una bola blanca de la bolsa? ¿Y cuánta obtenemos si después saca otra y nos
dice que es negra?
Obviamente, la respuesta a la primera pregunta es que aporta bastante informa-
ción, puesto que estábamos casi seguros de que la bola tenı́a que salir negra. Análoga-
mente si hubiera salido negra dirı́amos que ese suceso no nos extraña (nos suministra
poca información). En cuanto a la segunda pregunta, claramente podemos contestar
que el suceso no proporciona ninguna información, ya que al no quedar bolas blancas
sabı́amos que iba a salir negra.
Podemos fijarnos en la cantidad de información como una medida de la disminu-
ción de incertidumbre acerca de un suceso. Por ejemplo, si nos dicen que el número
que ha salido en un dado es menor que dos, estamos recibiendo más información que
si nos dicen que el número que ha salido es par.
3.2. Entropı́a
Efectuando una suma ponderada de las cantidades de información de todos los
posibles estados de una variable aleatoria V , obtenemos:
n n
X X 1
H(V ) = − P (xi ) log2 [P (xi )] = P (xi ) log2 (3.2)
i=1 i=1
P (xi )
I. 0 ≤ H(V ) ≤ log2 N
II . H(V ) = 0 ⇐⇒ ∃i tal que P (xi ) = 1 y P (xj ) = 0 ∀j 6= i
III . H(x1 , x2 . . . xn ) = H(x1 , x2 . . . xn , xn+1 ) si P (xn+1 ) = 0
Como ejercicio vamos a demostrar la propiedad (I). Para ello emplearemos el Lema
de Gibbs, que dice que dados dos sistemas de números p1 , . . . pn y q1 , . . . qn no negati-
vos tales que
n
X n
X
pi = qi
i=1 i=1
se verifica que
n
X n
X
− pi log2 (pi ) ≤ − pi log2 (qi ) (3.3)
i=1 i=1
1
Entonces, si tomamos pi = P (xi ) y qi = N
, resulta que
n n
X X 1
− pi log2 (pi ) ≤ − pi log2
i=1 i=1
N
y por lo tanto
n
X
1
H(X) ≤ − log2 pi = log2 (N )
N i=1
10
X 1 1 1
H=− log2 = − log2 = 3,32bits
i=1
10 10 10
3·6+4·4
= 3,4bits
10
para representar cada mensaje. Nótese que este esquema permite codificar una se-
cuencia de números por simple yuxtaposición, sin ambigüedades, por lo que no ne-
cesitaremos sı́mbolos que actúen de separadores, ya que éstos alargarı́an la longitud
media de los mensajes. El denominado Método de Huffman, uno de los más utilizados
en transmisión de datos, permite obtener codificaciones binarias que se aproximan
bastante al óptimo teórico de una forma sencilla y eficiente.
P (xi , yj )
2. Distribuciones marginales de X e Y :
m
X n
X
P (xi ) = P (xi , yj ) P (yj ) = P (xi , yj )
j=1 i=1
P (xi , yj ) P (xi , yj )
P (xi /yj ) = P (yj /xi ) =
P (yj ) P (xi )
n X
X m
H(X, Y ) = − P (xi , yj ) log2 (P (xi , yj ))
i=1 j=1
n
X
H(X/Y = yj ) = − P (xi /yj ) log2 (P (xi /yj ))
i=1
n X
X m
H(X/Y ) = − P (yj )P (xi /yj ) log2 (P (xi /yj )) =
i=1 j=1
Xn X m
= − P (xi , yj ) log2 (P (xi /yj )) (3.4)
i=1 j=1
Ası́ como existe una Ley de la Probabilidad Total, análogamente se define la Ley de
Entropı́as Totales:
I. I(X, Y ) = I(Y, X)
II . I(X, Y ) ≥ 0
I(C, M ) = 0 (3.8)
3.6. Redundancia
Si una persona lee un mensaje en el que faltan algunas letras, normalmente puede
reconstruirlo. Esto ocurre porque casi todos los sı́mbolos de un mensaje en lengua-
je natural contienen información que se puede extraer de los sı́mbolos de alrededor
—información que, en la práctica, se está enviando dos o más veces—, o en otras pala-
bras, porque el lenguaje natural es redundante. Puesto que tenemos mecanismos para
definir la cantidad de información que presenta un suceso, podemos intentar medir
el exceso de información (redundancia) de un lenguaje. Para ello vamos a dar una
serie de definiciones:
D
I=
R
Hn (M )
r∞ = lı́m (3.10)
n→∞ n
Hay principalmente dos aplicaciones fundamentales de la Teorı́a de la Informa-
ción, relacionadas directamente con la redundancia:
XX
H(M/C) = − P (c)P (m/c)log2 (P (m/c)) (3.11)
m∈M c∈C
Esta expresión permite saber la incertidumbre que queda sobre cuál ha sido el
mensaje enviado m, suponiendo que conocemos su criptograma asociado c. Si esa
incertidumbre fuera la misma que tenı́amos cuando desconocı́amos el valor de c —en
cuyo caso se cumplirı́a que H(M ) = H(M/C)—, nos encontrarı́amos con que C y
M son variables estadı́sticamente independientes, y por lo tanto estarı́amos frente
a un criptosistema seguro de Shannon, ya que jamás podrı́amos disminuir nuestra
incertidumbre acerca de m a partir de los valores de c. Lo habitual no obstante es que
exista relación estadı́stica entre C y M (a través del espacio de claves K), por lo que
H(M/C) < H(M ).
Adicionalmente, si el valor de H(M/C) fuera muy pequeño con respecto a H(M ),
significarı́a que el hecho de conocer c proporciona mucha información sobre m, lo
cual quiere decir que nuestro criptosistema es inseguro. El peor de los casos serı́a
que H(M/C) = 0, puesto que entonces, conociendo el valor de c tendrı́amos absoluta
certeza sobre el valor de m.
XX
H(K/C) = − P (c)P (k/c)log2 (P (k/c)) (3.12)
k∈K c∈C
Confusión. Trata de ocultar la relación entre el texto claro y el texto cifrado. Re-
cordemos que esa relación existe y se da a partir de la clave k empleada, puesto
que si no existiera jamás podrı́amos descifrar los mensajes. El mecanismo más
simple de confusión es la sustitución, que consiste en cambiar cada ocurrencia
de un sı́mbolo en el texto claro por otro. La sustitución puede ser tan simple o
tan compleja como queramos.
Difusión. Diluye la redundancia del texto claro repartiéndola a lo largo de todo el
texto cifrado. El mecanismo más elemental para llevar a cabo una difusión es la
transposición, que consiste en cambiar de sitio elementos individuales del texto
claro.
1
Ipar = − log2 = 1 bit
2
2. Calcule la entropı́a que tiene un dado que presenta doble probabilidad para el
número tres que para el resto.
Solución: El dado presenta la siguiente distribución de probabilidad:
2 1
P (x = 3) = ; P (x 6= 3) =
7 7
Su entropı́a será, pues
2 2 1 1
H(X) = − log2 − 5 · log2 = 0,5163 + 2,0052 = 2,5215
7 7 7 7
q
Solución: Sea el cociente pii . Puesto que tanto pi como qi son positivos, su cociente
también lo será, luego
qi qi
log2 = log2 (qi ) − log2 (pi ) ≤ − 1
pi pi
n
X n
X n
X n
X
pi log2 (qi ) − pi log2 (pi ) ≤ qi − pi = 0
i=1 i=1 i=1 i=1
n
X n
X
− pi log2 (pi ) ≤ − pi log2 (qi )
i=1 i=1
" m X
n
# " n m
#
X X X
P (xi , yj ) log2 (P (xi )) = log2 (P (xi )) P (xi , yj ) =
j=1 i=1 i=1 j=1
" n
#
X
= log2 (P (xi ))P (xi ) = −H(X)
i=1
Luego H(Y /X) = H(X, Y ) − H(X). Reorganizando los términos, llegamos fi-
nalmente a la expresión de la Ley de Entropı́as Totales:
5. Suponga un equipo de fútbol que nunca empata, que cuando no llueve vence el
65 % de sus partidos, y que si llueve sólo gana el 35 % de las veces. La probabili-
dad de que llueva en un partido es del 15 %. ¿Cuál es la cantidad de información
que aporta la variable aleatoria lluvia sobre la variable ganar un partido?
Solución: Sea G la variable aleatoria que representa los partidos. Sea gs el suceso
correspondiente a que el equipo gane el partido, y gn el suceso asociado a que
lo pierda. Análogamente, definiremos la variable L, asociada a que llueva o no.
Tendremos, pues:
P (ls ) = 0,15
P (ln ) = 0,85
P (gs , ls ) = 0,35 · 0,15 = 0,0525
P (gs , ln ) = 0,65 · 0,85 = 0,5525
P (gn , ls ) = 0,65 · 0,15 = 0,0975
P (gn , ln ) = 0,35 · 0,85 = 0,2975
P (gs /L = ls ) = 0,35
P (gs /L = ln ) = 0,65
P (gn /L = ls ) = 0,65
P (gn /L = ln ) = 0,35
P (gs ) = P (ln ) · P (gs /L = ln ) + P (ls ) · P (gs /L = ls ) = 0,605
P (gn ) = P (ln ) · P (gn /L = ln ) + P (ls ) · P (gn /L = ls ) = 0,395
Una posible codificación, con una longitud media de 4,4 bits por mensaje, serı́a
la siguiente:
2. Suponga que lanzamos dos dados y sumamos las puntuaciones obtenidas. Cal-
cule la entropı́a asociada a dicho experimento.
Complejidad Algorı́tmica
Caso promedio: Muchas veces, hay algoritmos que en el peor caso no funcionan
bien, pero en la mayorı́a de los casos que se presentan habitualmente tienen un
comportamiento razonablemente eficiente. De hecho, algunos algoritmos tı́pi-
cos de ordenación necesitan el mismo número de operaciones en el peor caso,
pero se diferencian considerablemente en el caso promedio.
Factoriales: n! = Ω(2n ).
Nótese que el hecho de que un problema sea NP, no quiere decir necesariamen-
te que el certificado correspondiente sea fácil de obtener, sino que, dado éste últi-
mo, puede verificarse la respuesta afirmativa en tiempo polinomial. Una observación
análoga puede llevarse a cabo sobre los problemas co–NP.
Sabemos que P ⊆ NP y que P ⊆ co-NP. Sin embargo, aún no se sabe si P = NP,
si NP = co–NP, o si P = NP ∩ co–NP. Si bien muchos expertos consideran que nin-
guna de estas tres igualdades se cumple, este punto no ha podido ser demostrado
matemáticamente.
Dentro de la clase NP, existe un subconjunto de problemas que se llaman NP–
completos, y cuya clase se nota como NPC. Estos problemas tienen la peculiaridad
de que todos ellos son equivalentes, es decir, se pueden reducir unos en otros, y si
lográramos resolver alguno de ellos en tiempo polinomial, los habrı́amos resuelto
todos. También se puede decir que cualquier problema NP–completo es al menos tan
difı́cil de resolver como cualquier otro problema NP, lo cual hace a la clase NPC la
de los problemas más difı́ciles de resolver computacionalmente.
Sea A = {a1 , a2 , . . . an } un conjunto de números enteros positivos, y s otro núme-
ro entero positivo. El problema de determinar si existe un subconjunto de A cuyos
elementos sumen s es un problema NP–completo, y, como ya se ha dicho, todos los
problemas de esta clase pueden ser reducidos a una instancia de este. Nótese que da-
do un subconjunto de A, es muy fácil verificar si suma s, y que dado un subconjunto
de A que sume s —que desempeñarı́a el papel de certificado—, se puede verificar
fácilmente que la respuesta al problema es afirmativa.
Figura 4.1: Relación entre las clases de complejidad P, NP, co–NP y NPC.
En la figura 4.1 puede observarse gráficamente la relación existente entre las dis-
tintas clases de complejidad que acabamos de definir.
Finalmente, apuntaremos que existe una clase de problemas, los denominados
NP–duros —esta clase se define sobre los problemas en general, no sólo sobre los
de decisión—, y que contiene la versión computacional del problema definido ante-
riormente, que consistirı́a en encontrar el subconjunto de A cuyos elementos suman
s.
Clase ZPP: conjunto de todos los problemas de decisión para los cuales existe un
algoritmo de tipo error nulo que se ejecuta en un tiempo esperado de ejecución
polinomial.
Clase RP: conjunto de los problemas de decisión para los cuales existe un algo-
ritmo de tipo error simple que se ejecuta en el peor caso en tiempo polinomial.
Clase BPP: conjunto de los problemas de decisión para los cuales existe un al-
goritmo de tipo error doble que se ejecuta en el peor caso en tiempo polinomial.
4.6. Conclusiones
En este capı́tulo hemos contemplado únicamente aquellos problemas para los que
existe una solución algorı́tmica —el programa finaliza siempre, aunque necesite un
número astronómico de operaciones elementales—, y hemos dejado a un lado deli-
beradamente aquellos problemas para los cuales no existen algoritmos cuya finali-
zación esté garantizada (problemas no–decidibles y semidecicibles), ya que en principio
escapan al propósito de este libro.
Se han repasado las clases genéricas de problemas que se pueden afrontar, en
función del tipo de algoritmos que permiten resolverlos, y se ha descrito una notación
general para expresar de forma precisa la complejidad de un algoritmo concreto. Se
ha puesto de manifiesto asimismo que un algoritmo ineficiente, cuando el tamaño
de la entrada es lo suficientemente grande, es totalmente inabordable incluso para la
más potente de las computadoras, al menos con la tecnologı́a actual.
Aritmética Modular
si se cumple:
a = b + kn, para algún k ∈ Z
cada clase de equivalencia por un número comprendido entre 0 y n−1. De esta forma,
en nuestro ejemplo (módulo 8) tendremos el conjunto de clases de equivalencia {0,
1, 2, 3, 4, 5, 6, 7}, al que denominaremos Z8 . Podemos definir ahora las operaciones
suma y producto en este tipo de conjuntos:
a + b ≡ c (mód n) ⇐⇒ a + b = c + kn k∈Z
ab ≡ c (mód n) ⇐⇒ ab = c + kn k∈Z
Propiedades de la suma:
Quizá sea el algoritmo más antiguo que se conoce, y a la vez es uno de los más
útiles. Permite obtener de forma eficiente el máximo común divisor de dos números.
Sean a y b dos números enteros de los que queremos calcular su máximo común
divisor m. El Algoritmo de Euclides explota la siguiente propiedad:
a|b quiere decir que a divide a b, o en otras palabras, que b es múltiplo de a, mientras
que (a mód b) representa el resto de dividir a entre b. En esencia estamos diciendo,
que, puesto que m divide tanto a a como a b, debe dividir a su diferencia. Entonces si
restamos k veces b de a, llegará un momento en el que obtengamos el resto de dividir
a por b, o sea a mód b.
Si llamamos c a (a mód b), podemos aplicar de nuevo la propiedad anterior y te-
nemos:
m|(b mód c)
Sabemos, pues, que m tiene que dividir a todos los restos que vayamos obtenien-
do. Es evidente que el último de ellos será cero, puesto que los restos siempre son
inferiores al divisor. El penúltimo valor obtenido es el mayor número que divide
tanto a a como a b, o sea, el máximo común divisor de ambos. El algoritmo queda
entonces como sigue:
g[0]=a;
g[1]=b;
i=1;
while (g[i]!=0)
{ g[i+1]=g[i-1]%g[i];
i++;
}
return(g[i-1]);
}
Suma modular ((a + b) mód n): O(log2 (a) + log2 (b)) = O(log2 (n))
Resta modular ((a − b) mód n): O(log2 (a) + log2 (b)) = O(log2 (n))
Multiplicación modular ((a · b) mód n): O(log2 (a) · log2 (b)) = O((log2 (n))2 )
Hemos comentado en la sección 5.1 que los elementos de un grupo finito no tie-
nen por qué tener inversa —elemento simétrico para el producto—. En este apartado
veremos qué condiciones han de cumplirse para que exista la inversa de un número
dentro de un grupo finito.
Definición: Dos números enteros a y b se denominan primos entre sı́ (o coprimos), si
mcd(a, b) = 1.
Lema: Dados a,n ∈ N
n|(i − j) =⇒ i ≡ j (mód n)
Existe una expresión que permite calcular el número de elementos —el cardinal—
del conjunto reducido de residuos módulo n:
n
Y
|Z∗n | = piei −1 (pi − 1) (5.2)
i=1
Teorema: Si mcd(a, n) = 1:
Demostración: Puesto que a y n son primos entre sı́, a multiplicado por cualquier
elemento del conjunto reducido de residuos módulo n {r1 , . . . , rφ(n) } ha de ser tam-
bién primo con n, por lo tanto el conjunto {ar1 , . . . , arφ(n) } no es más que una permu-
tación del conjunto anterior, lo cual nos lleva a:
1 = nui + avi
o sea,
avi ≡ 1 (mód n)
g[0]=n; g[1]=a;
u[0]=1; u[1]=0;
v[0]=0; v[1]=1;
i=1;
while (g[i]!=0)
{ c=g[i-1]/g[i];
g[i+1]=g[i-1]%g[i];
u[i+1]=u[i-1]-c*u[i];
v[i+1]=v[i-1]-c*v[i];
i++;
}
while (v[i-1]<0) v[i-1]=v[i-1]+n;
return(v[i-1]%n);
}
El Teorema Chino del Resto es una potente herramienta matemática, que posee
interesantes aplicaciones criptográficas.
Teorema: Sea p1 , . . . pr una serie de números primos entre sı́, y n = p1 · p2 · . . . · pr ,
entonces el sistema de ecuaciones en congruencias
x ≡ xi (mód pi ) i = 1, . . . , r (5.5)
tiene una única solución común en [0, n − 1], que viene dada por la expresión:
r
X n
(n/pi )−1
x= (mód pi ) xi (mód n) (5.6)
p
i=1 i
h i
Demostración: Para cada i, mcd pi , pni = 1. Por lo tanto, cada pni debe tener una
inversa yi tal que
n
yi ≡ 1 (mód pi )
pi
También se cumple
n
yi ≡ 0 (mód pj ) ∀i 6= j
pi
X n n
x= yk xk + yi xi = 0 + 1 · xi ≡ xi (mód pi ).
k6=i
pk pi
Como puede apreciarse, esta demostración nos proporciona además una solución
al sistema de ecuaciones (5.5), lo cual puede resultarnos de gran utilidad para ciertas
aplicaciones, como por ejemplo, el algoritmo RSA (ver sección 12.3).
b = 20 b0 + 21 b1 + 22 b2 + . . . + 2n bn
recordemos que los bi sólo pueden valer 0 ó 1, por tanto para calcular ab sólo hemos
i
de multiplicar los a2 correspondientes a los dı́gitos binarios de b que valgan 1.
i i−1
Nótese, además, que a2 = (a2 )2 , por lo que, partiendo de a, podemos calcular
el siguiente valor de esta serie elevando al cuadrado el anterior. El Algoritmo Rápido
de Exponenciación queda como sigue:
z=b;
x=a;
resul=1;
while (z>0)
{ if (z%2==1)
resul=resul*x;
x=x*x;
z=z/2;
}
return(resul);
}
cada átomo del universo le asignáramos mil millones de números primos cada mi-
crosegundo desde su origen hasta hoy, harı́an falta un total de 10109 números primos
diferentes, mientras que el total estimado de números primos de 512 bits o menos es
aproximadamente de 10151 .
También podrı́amos pensar en calcular indiscriminadamente números primos pa-
ra luego emplearlos en algún algoritmo de factorización rápida. Por desgracia, si qui-
siéramos construir un disco duro que albergara diez mil GBytes por cada gramo de
masa y milı́metro cúbico para almacenar todos los primos de 512 bits o menos, el
artilugio pesarı́a más de 10135 Kg y ocuparı́a casi 10130 metros cúbicos, es decir, serı́a
miles de billones de veces más grande y pesado que la Vı́a Láctea.
n = x2 − y 2 (5.8)
n = (x + y)(x − y) = a · b
x0 = 22 y0 = 3 2x0 + 1 = 45
x1 = 23 y1 = 48 2x1 + 1 = 47
x2 = 24 y2 = 95 2x2 + 1 = 49
x3 = 25 y3 = 144
Este método permite aún varios refinamientos, pero en cualquier caso resulta in-
viable cuando el número n a factorizar es lo suficientemente grande, ya que presenta
un orden de complejidad para el peor caso de O(n) —nótese que al ser lineal en n,
resulta exponencial en el tamaño de n—.
Adicionalmente, puesto que tanto x como y son menores que n, n no puede ser divi-
sor de (x + y) ni de (x − y). En consecuencia, n ha de tener factores comunes tanto con
(x+y) como con (x−y), por lo que el valor d = mcd(n, x−y) debe ser un divisor de n.
Se puede demostrar que si n es impar, no potencia de primo y compuesto, entonces
siempre se pueden encontrar x e y.
Para localizar un par de números satisfactorio, en primer lugar elegiremos un
conjunto
F = {p0 , p1 , . . . , pt−1 }
formado por t números primos diferentes, con la salvedad de que p0 puede ser igual
a −1. Buscaremos ahora ecuaciones en congruencias con la forma
Criba Cuadrática
q(x) = (x + m)2 − n
√
siendo m = b nc, donde bxc representa la parte entera de x. Puede comprobarse que
obteniendo una o dos series —dependiendo del número de soluciones que tenga la
ecuación— de valores y tales que p divide a q(y).
La criba propiamente dicha se lleva a cabo definiendo un vector Q[x], con −M ≤
x ≤ M , que se inicializa según la expresión Q[x] = blog |q(x)|c. Sean x1 , x2 las solu-
ciones a (5.12). Entonces restamos el valor blog(p)c a aquellas entradas Q[x] tales que
x sea igual a algún valor de las series de soluciones obtenidas en el paso anterior. Fi-
nalmente, los valores de Q[x] que se aproximen a cero son los más susceptibles de ser
descompuestos con los elementos de F , propiedad que se puede verificar de forma
directa tratando de dividirlos.
Hoy por hoy es el algoritmo de factorización más rápido que se conoce, y fue em-
pleado con éxito en 1996 para factorizar un número de 130 dı́gitos decimales. Es una
extensión de la criba cuadrática, que emplea una segunda base de factores, esta vez
formada por polinomios irreducibles. Los detalles de este método de factorización
requieren unos conocimientos algebraicos que escapan a los contenidos de este libro,
por lo que se recomienda al lector que acuda a la bibliografı́a si desea conocer más a
fondo este algoritmo de factorización.
4. Si j > 0 y z = 1, p no es primo.
5. Sea j = j + 1. Si j = b y z 6= p − 1, p no es primo.
8. p no es primo.
Debido a que muchos algoritmos de tipo asimétrico (ver capı́tulo 12) basan su po-
tencia en la dificultad para factorizar números enteros grandes, a lo largo de los años
se propusieron diversas condiciones que debı́an cumplir los números empleados en
aplicaciones criptográficas para que no fueran fáciles de factorizar. Se empezó enton-
ces a hablar de números primos fuertes.
Sin embargo, en diciembre de 1998, Ronald Rivest y Robert Silverman publicaron
un trabajo en el que quedaba demostrado que no era necesario emplear primos fuertes
para los algoritmos asimétricos. En él se argumentaba que la supuesta necesidad de
números de este tipo surgió para dificultar la factorización mediante ciertos métodos
—como por ejemplo, el método “p−1”—, pero la aparición de técnicas más modernas
como la de Lenstra, basada en curvas elı́pticas, o la criba cuadrática, hacı́a que se
ganase poco o nada con el empleo de este tipo de números primos.
cr xr , donde ci = ai + bi .
P
Suma: f (x) + g(x) =
cr xr , donde ci =
P P
Producto: f (x) · g(x) = aj bk , tal que j + k = i.
si
g(x) = h(x) + k(x)f (x), para algún k(x) ∈ R[x]
5.8.1. Polinomios en Zn
(x5 + x) · (x4 + x3 + x2 + 1) = x9 + x8 + x7 + x5 + x5 + x4 + x3 + x =
= x9 + x8 + x7 + x4 + x3 + x
Nótese que x5 + x5 = 0, dado que los coeficientes están en Z2 . Ahora hemos de tomar
el resto módulo f (x). Para ello emplearemos el siguiente truco:
luego
x9 + x8 + x7 + x4 + x3 + x = x(x8 ) + x8 + x7 + x4 + x3 + x =
= x(x4 + x3 + x + 1) + (x4 + x3 + x + 1) + x7 + x4 + x3 + x =
= x5 + x4 + x2 + x + x4 + x3 + x + 1 + x7 + x4 + x3 + x =
= x7 + x5 + x4 + x4 + x4 + x3 + x 3 + x2 + x + x + x + 1 =
= x7 + x5 + x 4 + x2 + x + 1
La ventaja esencial que posee este tipo de conjuntos es que permite llevar a cabo
implementaciones muy sencillas y paralelizables de los algoritmos aritméticos. En
a + b = b + a + k · n si k = 0, luego
a + b ≡ b + a (mód n)
a + (b + c) = (a + b) + c + k · n si k = 0, luego
a + (b + c) ≡ (a + b) + c (mód n)
a + 0 = a + k · n si k = 0, luego
a + 0 ≡ a (mód n)
por lo tanto, 0 es el elemento neutro para la suma.
Elemento simétrico: Sea a ∈ Zn y b = n − a, tenemos
a + b = a + (n − a) = k · n si k = 1, luego
a+b≡0 (mód n)
por tanto, b es el inverso de a para la suma.
a · b = b · a + k · n si k = 0, luego
a · b ≡ b · a (mód n)
a · (b · c) = (a · b) · c + k · n si k = 0, luego
a · (b · c) ≡ (a · b) · c (mód n)
a · 1 = a + k · n si k = 0, luego
a · 1 ≡ a (mód n)
por lo tanto, 1 es el elemento neutro para el producto.
3. Calcular el valor de la función φ de Euler para los siguientes números: 64, 611,
2197, 5, 10000.
Solución: Para calcular el valor de la función φ emplearemos la expresión (5.2):
64 = 26 φ(64) = 25 · (2 − 1) = 32
611 = 13 · 47 φ(611) = (13 − 1) · (47 − 1) = 552
2197 = 133 φ(2197) = 132 · 12 = 2028
5 es primo φ(5) = 5 − 1 = 4
10000 = 24 · 54 φ(10000) = 23 · 1 · 53 · 4 = 4000
x ≡ 12 (mód 17)
x ≡ 13 (mód 64)
x ≡ 8 (mód 27)
x ≡ 12 (mód 17)
x ≡ 13 (mód 64)
x ≡ 8 (mód 27)
5. ¿Cómo calcuları́a el valor de (210368 mód 187), empleando únicamente lápiz, pa-
pel y calculadora?
Solución: Para calcular el valor de (210368 mód 187), se puede emplear el algorit-
mo de exponenciación rápida (apartado 5.4.1):
r = 1 z = 10368 x = 2
r = 1 z = 5184 x = 4
r = 1 z = 2592 x = 16
r = 1 z = 1296 x = 256 (mód 187) = 69
r = 1 z = 648 x = 4761 (mód 187) = 86
r = 1 z = 324 x = 7396 (mód 187) = 103
r = 1 z = 162 x = 10609 (mód 187) = 137
r = 1 z = 81 x = 18769 (mód 187) = 69
r = 69 z = 40 x = 4761 (mód 187) = 86
r = 69 z = 20 x = 7396 (mód 187) = 103
r = 69 z = 10 x = 10609 (mód 187) = 137
r = 69 z = 5 x = 18769 (mód 187) = 69
r = 4761 (mód 187) = 86 z = 2 x = 4761 (mód 187) = 86
r = 86 z = 1 x = 7396 (mód 187) = 103
r = 8858 (mód 187) = 69
(x5 + x2 + 1)(x3 + x + 1) = x8 + x6 + x5 + x5 + x3 + x2 + x3 + x + 1 =
= x8 + x6 + x2 + x + 1
x8 + x6 + x2 + x + 1 = x2 · x6 + x6 + x2 + x + 1 =
= x2 (x + 1) + (x + 1) + x2 + x + 1 = x3 + x2 + x + 1 + x2 + x + 1 =
= x3
x ≡ 1 (mód 13)
x ≡ 2 (mód 24)
x ≡ 20 (mód 125)
Definición: Una curva elı́ptica sobre R es el conjunto de puntos del plano (x, y) que
cumplen la siguiente ecuación:
y 2 = x3 + ax + b (6.1)
Ya tenemos un conjunto sobre el que trabajar. Nuestro siguiente paso será definir
una ley de composición interna que, dados dos elementos cualesquiera, nos devuel-
va otro que también pertenezca al conjunto. Denominaremos suma a esta operación
y la representaremos mediante el signo ‘+’, de forma totalmente análoga a lo que
hacı́amos con Z.
Sean los puntos r = (rx , ry ), s = (sx , sy ), p = (px , py ), t = (tx , ty ) ∈ E(R), la
operación suma se define de la siguiente forma:
Si r 6= s y r 6= −s, entonces para sumarlos se traza la recta que une r con s. Dicha
recta cortará la curva en un punto. La suma t de r y s será el opuesto de dicho
punto (ver figura 6.2a).
2r = r + r = O
3r = 2r + r = O + r = r
4r = 3r + r = r + r = O
...
-t -t
p
t t
a) b)
Figura 6.2: Interpretación gráfica de la suma de dos puntos en una curva elı́ptica.
ry − s y
d= ; tx = d2 − rx − sx ; ty = −ry + d(rx − tx ) (6.2)
rx − sx
3p2x + a
d= ; tx = d2 − 2px ; ty = −py + d(px − tx ) (6.3)
2py
4 · 73 + 27 · 42 = 2 (mód 17)
Seguidamente, vamos a ver qué puntos pertenecen a la curva elı́ptica. Si hacemos los
cálculos pertinentes, tenemos los siguientes:
Nótese que dado un punto de la curva (x, y), el valor (x, −y) (mod n) también
pertenece a ésta. Calculemos ahora la suma de dos puntos cualesquiera, por ejemplo
(2, 3) y (3, 16), empleando la expresiones de (6.2):
luego (2, 3) + (3, 16) = (11, 1). Como cabrı́a esperar, nos da como resultado un punto
que también pertenece a la curva.
Sean los puntos r = (rx , ry ), s = (sx , sy ), p = (px , py ), t = (tx , ty ) ∈ E(GF (2n )), la
operación suma se define de la siguiente forma:
Finalmente, si px = 0, 2p = O.
x3 + ax + b = (x − q)2 (x − r)
x3 + ax + b = (x − q)2 (x − r)
Igualando los coeficientes del mismo grado tenemos las siguientes relaciones:
0 = −2q − r
a = q 2 + 2qr
b = q2r
a = −3q 2
b = −2q 3
Elevando al cuadrado la primera expresión y al cubo la segunda, podemos des-
pejar q 6 en ambas e igualar:
a3 b2
q6 = =
−27 4
Para que el sistema de ecuaciones tenga solución, la igualdad anterior debe
cumplirse; si la desarrollamos, finalmente nos queda
a3 b2
= =⇒ 4a3 = −27b2 =⇒ 4a3 + 27b2 = 0
−27 4
2. En el ejemplo de la sección 6.2, calcule el conjunto hpi con p = (11, 16).
Solución: Emplearemos la expresión (6.3) para calcular 2p y (6.2) para el resto:
2p = p + p:
hpi = {O, (11, 16), (16, 8), (15, 4), (0, 2), (2, 14), (3, 16),
(3, 1), (2, 3), (0, 15), (15, 13), (16, 9), (11, 1)}
Como se puede observar, en este caso hpi contiene todos los puntos de la curva
elı́ptica en cuestión.
En este capı́tulo daremos una serie de nociones básicas y algoritmos sobre aritmé-
tica entera de múltiple precisión, disciplina que ha cobrado un gran interés debido
al uso extensivo que hacen de ella sobre todo los algoritmos asimétricos de cifrado y
autentificación.
Llamaremos número largo a aquel que posee gran cantidad de dı́gitos significati-
vos, normalmente más de los que los tipos de dato convencionales de los lenguajes
de programación clásicos pueden soportar. En este apartado vamos a indicar cómo
representarlos y operar con ellos empleando tipos de dato de menor precisión.
Todos conocemos la representación tradicional en base 10 de los números reales,
en la que cada cifra contiene únicamente valores de 0 a 9. Esta representación no es
más que un caso particular (B = 10) de la siguiente expresión general:
∞
X
n = (−) ai B i
−∞
donde los términos con ı́ndice negativo corresponden a la parte no entera (decimal)
del número real n. Sabemos que, dado el valor de B, dicha representación es única, y
que significa que n en base B se escribe:
Donde cada ai está comprendido entre 0 y B − 1. Por ejemplo, en base 10, el número
3,1415926 corresponderı́a a la expresión:
3 · 100 + 1 · 10−1 + 4 · 10−2 + 1 · 10−3 + 5 · 10−4 + 9 · 10−5 + 2 · 10−6 + 6 · 10−7
7.2.1. Suma
siendo
0 para i = 0
ci =
(ai−1 + bi−1 + ci−1 ) div B para i = 1 . . . n
El resultado se devuelve en s.
7.2.2. Resta
La resta es muy parecida a la suma, salvo que en este caso los acarreos se restan.
Suponiendo que a > b:
siendo
(
0 para i = 0
ri =
1 − (ai−1 − bi−1 − ri−1 + B) div B para i = 1 . . . n
ri representa el acarreo de la resta (borrow), que puede valer 0 ó 1 según la resta parcial
salga positiva o negativa. Nótese que, como a > b, el último acarreo siempre ha de
valer 0.
7.2.3. Producto
m−1
X
ab = ai B i b
i=0
acarreo=0;
for (k=0; k<m; k++)
{ prod=ai*b[k]+s[i+k]+acarreo;
s[i+k]=prod%BASE;
acarreo=prod/BASE;
}
k=m+i;
while (acarreo!=0)
{ sum=s[k]+acarreo;
s[k]=sum%BASE;
acarreo=sum/BASE;
k++;
}
}
for (k=0;k<=m+n;k++)
p[k]=0;
for (k=0;k<m;k++)
summult(a[k],k,b,n,p);
}
El resultado se devuelve en p.
Existe otra propiedad de la multiplicación de enteros que nos va a permitir efec-
tuar estas operaciones de manera más eficiente. Tomemos un número entero cual-
quiera a de k dı́gitos en base B. Dicho número puede ser representado mediante la
de la siguiente expresión:
k
a = al B 2 + ar
Hasta ahora no hemos aportado nada nuevo. El truco para que este desarrollo nos
proporcione un aumento de eficiencia consiste en hacer uso de la siguiente propie-
dad:
al br + ar bl = al br + ar bl + al bl − al bl + ar br − ar br = (al + ar )(bl + br ) − al bl − ar br
x = al b l y = (al + ar )(bl + br ) z = ar b r
ab = xBk2 + (y − x − z)Bk + z
Hemos reducido los cuatro productos y tres sumas del principio a tres productos
y seis sumas. Como es lógico, esta técnica debe emplearse dentro de una estrategia
divide y vencerás.
7.2.4. División
El algoritmo más simple para dividir dos números se consigue a partir de su re-
presentación binaria:
m=Bits_Significativos(c);
n=Bits_Significativos(d);
b=c;
a=0;
d1=d*pow(2,m-n); /* Desplazamos a la izquierda d */
for (i=m-n;i>=0;i--)
{ if (b>d1)
{ Poner_bit_a_1(a,i);
b=b-d1;
}
else Poner_bit_a_0(a,i);
d1=d1/2;
}
}
5. b = 010
Este algoritmo resulta muy lento, ya que opera a nivel de bit, por lo que intenta-
remos encontrar otro más rápido —aunque con el mismo orden de eficiencia—. Nos
basaremos en el algoritmo tradicional de la división. Suponiendo que queremos di-
vidir c por d, obteniendo su cociente (a) y resto (b), iremos calculando cada dı́gito del
cociente en base B de un solo golpe. Nuestro objetivo será estimar a la baja el valor
de cada uno de los dı́gitos a, e incrementarlo hasta alcanzar el valor correcto. Para
que la estimación se quede lo más cerca posible del valor correcto efectuaremos una
normalización de los números, de forma que el dı́gito más significativo d tenga su bit
de mayor peso a 1. Esto se consigue multiplicando c y d por 2k , siendo k el número de
ceros a la izquierda del bit más significativo del divisor d. Posteriormente habremos
de tener en cuenta lo siguiente:
c = ad + b ⇐⇒ 2k c = a(2k d) + 2k b
luego el cociente será el mismo pero el resto habrá que dividirlo por el factor de
normalización. Llamaremos c̄, d¯ a los valores de c y d normalizados.
Para hacer la estimación a la baja de los ai , dividiremos cj B + cj−1 por d¯m + 1 (cj
es el dı́gito más significativo de c en el paso i, y d¯m es el dı́gito más significativo de
¯ Luego actualizamos c̄ con c̄ − da
d). ¯ i B i y vamos incrementando ai (y actualizando c̄)
mientras nos quedemos cortos. Finalmente, habremos calculado el valor del cociente
(a) y el valor del resto será
b̄
b=
2k
El algoritmo podrı́a quedar como sigue:
*/
despl=Num_bits_digito -
Bits_significativos(Digito_Mas_Significativo(d));
t=Digito_Mas_Significativo(dd);
Poner_a_cero(a);
else ai=(cc[i+Digitos(dd)]*B+cc[i+Digitos(dd)-1])/(t+1);
/* La estimacion es el cociente
entre los dos primeros digitos
de cc y t+1
*/
cc=cc-ai*dd*pow(B,i); /* Restar a cc */
Aunque a primera vista pueda parecer un algoritmo muy complejo, vamos a ver
que no es tan complicado siguiendo su funcionamiento para un ejemplo concreto,
con B = 16, c = 3F BA2, y d = 47:
Para sumar dos números módulo n basta con efectuar su suma entera y, si el
resultado es mayor que n, restar el módulo.
Para restar basta con comprobar que el minuendo es mayor que el sustraendo,
en cuyo caso aplicamos directamente el algoritmo de la resta. Si, por el contra-
rio, el sustraendo fuera mayor que el minuendo, sumamos a este último el valor
de n antes de hacer la resta.
t = 4
a2 = 07 ÷ 5 = 1 cc = 72500 − 1 · 47000 = 23500
a1 = 25 ÷ 5 = 3 cc = 23500 − 3 · 4700 = 5000
a1 = a1 + 1 = 4 cc = 5000 − 4700 = 100
a0 = 1÷5=0 cc = 100 − 0 · 470 = 100
Llegados a este punto parece claro que nuestro objetivo en la mayor parte de las
ocasiones no va a consistir en generar secuencias aleatorias puras, sino más bien se-
cuencias impredecibles e irreproducibles para un atacante. De hecho, habrá dos esce-
narios tı́picos en los que nos vamos a encontrar:
estudiados con mayor detalle en el capı́tulo 11. Nuestro objetivo será, pues, la obten-
ción de secuencias impredecibles e irreproducibles. Podemos obtener directamente
dichas secuencias del exterior, y tratarlas para que no presenten ningún sesgo es-
tadı́stico, o emplearlas como semilla para alimentar algoritmos pseudoaleatorios, que
también pueden hacer uso a su vez de valores difı́cilmente reproducibles, como el re-
loj del sistema.
Como hemos dicho antes, las operaciones aritméticas y lógicas que realiza una
computadora son completamente deterministas. Sin embargo, como veremos a con-
tinuación, los ordenadores suelen ir acompañados de dispositivos no tan predecibles
que pueden resultar útiles para nuestros propósitos. En cualquier caso, cada vez re-
sulta más frecuente la inclusión de hardware especı́fico en los ordenadores modernos
para la obtención de información aleatoria.
Aunque lo ideal es disponer de elementos especı́ficos, existen valores obtenidos
del hardware convencional de una computadora que suelen proporcionar algunos bits
de aleatoriedad. Parece razonable que leer en un momento dado el valor de un reloj
interno de alta precisión proporcione un resultado más o menos impredecible, por
lo que podrı́amos emplearlo para recolectar valores aleatorios. Diferentes pruebas
han demostrado sin embargo que mecanismos de este tipo, que pueden ser útiles
en ciertas arquitecturas y sistemas operativos, dejan de servir en otras versiones del
mismo sistema o en arquitecturas muy similares, por lo que hemos de tener mucho
cuidado con esto.
Algunas veces se ha propuesto el uso de los números de serie de los componen-
tes fı́sicos de un sistema, pero recordemos que estos números tienen una estructura
muy rı́gida, y a veces conociendo simplemente el fabricante y la fecha aproximada de
fabricación podemos adivinar casi todos sus dı́gitos, por lo que van a ser demasiado
predecibles. Tampoco son útiles las fuentes públicas de información, como por ejem-
plo los bits de un CD de audio, puesto que nuestros atacantes pueden disponer de
ellas, con lo que el único resto de aleatoriedad que nos va a quedar es la posición que
escojamos dentro del CD para extraer los bits.
Algoritmos de cifrado por Bloques (ver capı́tulo 10). Un algoritmo simétrico de ci-
frado por bloques puede ser útil como función de mezcla de la siguiente forma:
supongamos que usa una clave de n bits, y que tanto su entrada como su sali-
da son bloques de m bits. Si disponemos de n + m bits inicialmente, podemos
codificar m bits usando como clave los n restantes, y ası́ obtener como salida
un bloque de m bits con mejor aleatoriedad. Ası́, por ejemplo, si usamos DES,
podemos reducir a 64 bits un bloque de 120.
Funciones Resumen (ver capı́tulo 13) . Una función resumen puede ser empleada
para obtener un número fijo de bits a partir de una cantidad arbitraria de bits
de entrada.
En la mayorı́a de los casos, los bits obtenidos de las fuentes aleatorias están sesga-
dos, es decir, que hay más unos que ceros o viceversa. Esta situación no es deseable,
puesto que necesitamos una fuente aleatoria no sesgada, que presente igual probabi-
lidad tanto para el 0 como para el 1. Como veremos a continuación, esta circunstancia
no constituye un problema serio, ya que existen diversas técnicas para solucionarla.
Bits de Paridad
Si tenemos una secuencia de valores cero y uno, con un sesgo arbitrario, podemos
emplear el bit de paridad2 de la secuencia para obtener una distribución con una
desviación tan pequeña como queramos. Para comprobarlo, supongamos que d es el
sesgo, luego las probabilidades que tenemos para los bits de la secuencia son:
p = 0,5 + d q = 0,5 − d
1 1
r= ((p + q)n + (p − q)n ) s= ((p + q)n − (p − q)n )
2 2
1 1
r = (1 + (2d)n ) s = (1 − (2d)n )
2 2
log2 (2)
Siempre que n > el sesgo de la paridad será menor que , por lo que
log2 (2d)
bastará con coger esos n bits. Por ejemplo, si una secuencia de bits tiene p = 0,01 y
q = 0,99, basta con coger la paridad de cada 308 bits para obtener un bit con sesgo
inferior a 0,001.
2
El bit de paridad de una secuencia vale 1 si el número de unos de dicha secuencia es par (paridad
impar) o impar (paridad par).
El método que propuso Von Neumann para eliminar el sesgo de una cadena de
bits consiste simplemente en examinar la secuencia de dos en dos bits. Eliminamos
los pares 00 y 11, e interpretamos 01 como 0 y 10 como 1. Por ejemplo, la serie
00.10.10.01.01.10.10.10.11 darı́a lugar a 1.1.0.0.1.1.1.
Es fácil comprobar que, siendo d el sesgo de la distribución inicial
Si calculamos la entropı́a de una secuencia sesgada (ecuación 3.2, página 45), ob-
tendremos el número n de bits reales de información que transporta. Entonces podre-
mos aplicar una función resumen (capı́tulo 13) y quedarnos exactamente con los n
bits menos significativos del resultado obtenido.
Veamos un ejemplo: sea una secuencia de 300 bits con una probabilidad P (1) =
0,99. La entropı́a de cada bit será
Luego los 300 bits originales aportarán 300 × 0,08079 ' 24 bits de información
real. Podemos calcular la firma MD5 o SHA de dicha secuencia y considerar los 24
bits menos significativos del resultado como bits aleatorios válidos.
Generador X9.17
gn = DES(k, DES(k, t) ⊕ sn )
sn+1 = DES(k, DES(k, t) ⊕ gn )
p ≡ 3(mód 4) q ≡ 3(mód 4)
Sea entonces n = pq. Escogemos un número x aleatorio primo relativo con n, que
será nuestra semilla inicial. Al contrario que x, que debe ser mantenido en secreto, n
puede ser público. Calculamos los valores si de la serie de la siguiente forma:
s0 = (x2 )(mód n)
si+1 = (s2i )(mód n)
Hay que tener cuidado de emplear únicamente como salida unos pocos de los bits
menos significativos de cada si . De hecho, si cogemos no más que log2 (log2 (si )) bits
en cada caso podemos asegurar que predecir el siguiente valor de la serie es al menos
tan difı́cil como factorizar n.
Algoritmos Criptográficos
Criptografı́a Clásica
Los algoritmos engolobados dentro de esta familia se basan en cambiar por otros
los sı́mbolos del mensaje, sin alterar su orden relativo. Cada uno de ellos vendrá defi-
nido por el mecanismo concreto empleado para efectuar dicho cambio, pudiendo ser
independiente de la posición que ocupa el sı́mbolo el el mensaje (cifrados monoalfabéti-
cos), o venir determinado por ésta (cifrados polialfabéticos). Como vimos en la sección
3.8, esta transformación se corresponde con el concepto de confusión.
Cifrados Monoalfabéticos
Se engloban dentro de este apartado todos los algoritmos criptográficos que, sin
desordenar los sı́mbolos dentro del mensaje, establecen una única función de susti-
tución para todos ellos a lo largo del texto. Es decir, si al sı́mbolo A le corresponde el
sı́mbolo D, esta correspondencia se mantiene para todo el mensaje.
c = (m + 3) mód 26
obsérvese que este algoritmo ni siquiera posee clave, puesto que la transformación
siempre es la misma. Obviamente, para descifrar basta con restar 3 al número de
orden de las letras del criptograma.
siendo a y b dos números enteros menores que el cardinal N del alfabeto, y cumplien-
do que mcd(a, N ) = 1. La clave de cifrado k viene entonces dada por el par (a, b). El
algoritmo de César será pues una transformación afı́n con k = (1, 3).
H(K) log2 (N !)
S= = (9.1)
D D
donde D es la redundancia del lenguaje empleado en el mensaje original, y N es el
número de sı́mbolos de dicho lenguaje. Como es lógico, suponemos que las N ! claves
diferentes son equiprobables en principio.
En casos más restringidos, como el afı́n, el criptoanálisis es aún más simple, puesto
que el emparejamiento de todos los sı́mbolos debe responder a alguna combinación
de coeficientes (a, b).
Cifrados Polialfabéticos
siendo mi el i−ésimo sı́mbolo del texto claro y n el cardinal del alfabeto de entrada.
Criptoanálisis. Para criptoanalizar este tipo de claves basta con efectuar d análisis
estadı́sticos independientes agrupando los sı́mbolos según la ki empleada para codi-
ficarlos. Necesitaremos al menos d veces más cantidad de texto que con los métodos
monoalfabéticos.
En lo que respecta a la estimación del valor de d, podemos emplear el método
propuesto por Friedrich Kasiski en 1863, que consiste en buscar subcadenas de tres o
más letras repetidas dentro del texto cifrado, y anotar las distancias si que las separan.
Lo más probable es que los patrones encontrados se correspondan con subcadenas
repetidas también en el texto claro, separadas por un número de caracteres múltiplo
de d. Podremos, por tanto, estimar d calculando el máximo común divisor de todos
los si que hayamos localizado.
α con probabilidad 1/2
E(a) =
β con probabilidad 1/2
E(b) = γ
E(c) = δ
E(d) =
En el texto cifrado ahora todos los sı́mbolos aparecen con igual probabilidad, ma-
ximizando su entropı́a y eliminando su redundancia, lo que en principio imposibilita
un ataque basado en frecuencias. A pesar de su gran potencial, este método necesita
un alfabeto de salida mayor que el de entrada —y tanto más grande cuanto mejor
queramos aplanar el histograma de frecuencias del criptograma—, lo cual representa
un problema, especialmente en lo que a aplicaciones informáticas se refiere.
Este tipo de mecanismos de cifrado no sustituye unos sı́mbolos por otros, sino
que cambia su orden dentro del texto, siguiendo el concepto de difusión definido
por Shannon. Quizás el más antiguo conocido sea el escitalo, empleado en la Anti-
gua Grecia, especialmente en Esparta. Este dispositivo estaba formado por un bastón
cilı́ndrico con un radio particular y una tira de piel que se enrollaba alrededor de
aquél. El texto se escribı́a a lo largo del bastón y sólo podı́a ser leı́do si se disponı́a de
otro bastón de dimensiones similares. Un mecanismo de transposición sencillo, que
no precisa otra cosa que lápiz y papel, consiste en colocar el texto en una tabla de
n columnas, y dar como texto cifrado los sı́mbolos de una columna —ordenados de
arriba abajo— concatenados con los de otra, etc. La clave k se compone del número n
junto con el orden en el que se deben leer las columnas.
Por ejemplo, supongamos que queremos cifrar el texto “El perro de San Roque no
tiene rabo”, con n = 5 y la permutación {3, 2, 5, 1, 4} como clave. Colocamos el texto
en una tabla y obtenemos:
1 2 3 4 5
E L P E
R R O D
E S A N
R O Q U
E N O
T I E N E
R A B O
En el año 1923, un ingeniero alemán llamado Arthur Scherbius patentó una má-
quina especı́ficamente diseñada para facilitar las comunicaciones seguras. Se trataba
de un instrumento de apariencia simple, parecido a una máquina de escribir. Quien
deseara codificar un mensaje sólo tenı́a que teclearlo y las letras correspondientes al
texto cifrado se irı́an iluminando en un panel. El destinatario copiaba dichas letras
en su propia máquina y el mensaje original aparecı́a de nuevo. La clave la constituı́an
las posiciones iniciales de tres tambores o rotores que el ingenio poseı́a en su parte
frontal.
En la figura 9.1 podemos apreciar un esquema de esta máquina, llamada ENIG-
MA. Los rotores no son más que tambores con contactos en su superficie y cableados
en su interior, de forma que con cada pulsación del teclado, la posición de éstos de-
termina cuál es la letra que se ha de iluminar. Cada vez que se pulsa una tecla el
primer rotor avanza una posición; el segundo avanza cuando el anterior ha dado una
vuelta completa y ası́ sucesivamente. El reflector no existı́a en los primeros modelos,
se introdujo posteriormente para permitir que la misma máquina sirviera tanto para
cifrar como para descifrar, como veremos más adelante.
ENIGMA pronto llamó la atención del ejército alemán, que la utilizó de forma
intensiva a lo largo de la II Guerra Mundial. Además se le aplicaron varias mejoras,
como incluir un pequeño sistema previo de permutación, llamado stecker o clavijero
—que permitı́a escoger seis pares de letras para ser intercambiadas previamente al
cifrado—, hacer que los rotores fueran intercambiables —se podı́an elegir y colocar
en cualquier orden tres de entre cinco disponibles—, e incluso ampliar a cuatro el
número de rotores.
Aunque ENIGMA parecı́a virtualmente imposible de romper, presentaba una se-
rie de debilidades, tanto en su diseño como en los mecanismos empleados para utili-
zarla, que fueron aprovechadas por el ejército aliado. El primero en conseguir avances
significativos fue el servicio de inteligencia polaco, ya que en 1931 los franceses, en
virtud de un acuerdo de cooperación firmado diez años antes, les facilitaron informa-
ción detallada sobre la máquina1 , que ellos a su vez habı́an obtenido sobornando a un
miembro de la oficina de cifras alemana. De hecho, los espı́as franceses consideraban
esta información totalmente inútil, ya que pensaban que ENIGMA era, sencillamente,
indescifrable.
El conocimiento preciso de la máquina permitió a un equipo de tres matemáticos
1
En anteriores ediciones de este libro se mencionaba el envı́o por error a Polonia de una máquina,
pero parece que se trata simplemente de una leyenda.
de coincidir con ninguna del texto cifrado. La Bomba de Turing partı́a de una palabra
adivinada —en contra de las normas de uso de ENIGMA, la mayorı́a de los mensajes
que enviaba el ejército alemán comenzaban de igual forma, lo cual facilitó la tarea del
equipo aliado enormemente—, y buscaba un emparejamiento con el mensaje cifrado
tal que el supuesto texto claro y el fragmento de criptograma asociado no coincidie-
ran en ninguna letra. A partir de ahı́ la Bomba realizaba una búsqueda exhaustiva
de la configuración inicial de la máquina para decodificar el mensaje, mediante un
ingenioso sistema que permitı́a ignorar la posición del stecker.
Un hecho bastante poco conocido es que Alemania regaló al régimen de Franco
casi una veintena de máquinas ENIGMA, que fueron utilizadas para comunicacio-
nes secretas hasta entrados los años cincuenta, suponemos que para regocijo de los
servicios de espionaje británico y norteamericano.
Observemos que un rotor no es más que una permutación dentro del alfabeto
de entrada. El cableado hace que cada una de las letras se haga corresponder con
otra. Todas las letras tienen imagen y no hay dos letras con la misma imagen. Si
notamos una permutación como π, podemos escribir que la permutación resultante
de combinar todos los rotores en un instante dado es:
de forma que sólo bastaba con rastrear dentro del espacio de posibles configuraciones
para encontrar aquella que llevara a cabo la transformación esperada. No disponer
de dicho emparejamiento hubiera complicado enormemente el criptoanálisis, tal vez
hasta el punto de hacerlo fracasar.
La Máquina SIGABA
Esta máquina de rotores, también conocida como ECM Mark II, Converter M-134
y CSP-889, fue empleada por el ejército de los EE.UU. durante la Segunda Guerra
Mundial. A diferencia de la máquina Enigma, en la que los rotores avanzan una posi-
ción cada vez que se pulsa una tecla, SIGABA incorpora un segundo juego de rotores,
que se encarga de decidir qué rotores principales avanzan cada vez que se pulsa una
tecla. Esto aumenta considerablemente la longitud de ciclo de la máquina, y complica
la localización de posibles patrones en los textos cifrados.
El principal inconveniente de esta máquina era su excesivo peso y tamaño, sin
contar con su complejidad mecánica, dificultad de manejo y fragilidad. Esto supuso
que, en la práctica, no pudiera ser utilizada en muchas situaciones a lo largo de la
guerra, a diferencia de la máquina Enigma, mucho más ligera y resistente. En su lu-
gar, se usaba, entre otros, el famoso código consistente en emplear indios navajos, que
simplemente se comunicaban por radio en su propio idioma, demasiado desconocido
y complejo como para ser comprendido por el enemigo.
La Máquina PURPLE
Esta máquina, bautizada como PURPLE por los EE.UU., fue empleada por el go-
bierno japonés desde poco antes de iniciarse la Segunda Guerra Mundial, con fines
diplomáticos. Se trata de la sucesora de otra máquina, denominada RED, y fue di-
señada por un capitán de la armada japonesa. Criptoanalizada durante la II Gue-
rra Mundial por un equipo del Servicio de Inteligencia de Señales de la Armada de
EE.UU., dirigido por William Friedman, debió su caı́da más a una mala polı́tica de
elección de claves, que a debilidades intrı́nsecas de la propia máquina.
2
No confundir con John Von Neumann, que también hizo aportaciones cruciales en los inicios de
la Informática, pero nunca estuvo en Bletchley Park.
a b c d e f g h i j k l m
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 1 1 1 1
0 0 0 0 1 1 1 1 0 0 0 0 1
0 0 1 1 0 0 1 1 0 0 1 1 0
0 1 0 1 0 1 0 1 0 1 0 1 0
n o p q r s t u v w x y z
0 0 0 1 1 1 1 1 1 1 1 1 1
1 1 1 0 0 0 0 0 0 0 0 1 1
1 1 1 0 0 0 0 1 1 1 1 0 0
0 1 1 0 0 1 1 0 0 1 1 0 0
1 0 1 0 1 0 1 0 1 0 1 0 1
podemos generar las 1.024 combinaciones posibles de 10 bits, y tratar de descifrar las
dos primeras letras de cada mensaje. Nos quedaremos únicamente con aquellas com-
binaciones de bits que den lugar a sı́labas (o partes de sı́labas) legales en castellano
en ambos mensajes. Por ejemplo, la cadena 1010101010 da lugar a las letras BS para el
primer mensaje, y FS para el segundo, ambas con muy poca probabilidad de aparecer
al principio de un mensaje correcto en castellano.
Si, por el contrario, contáramos con un único mensaje cifrado, este análisis resul-
tarı́a imposible, ya que para todos y cada uno de los mensajes posibles en castellano
existirá una secuencia de bits que lo genera. La clave está en que existirán muy pocas
secuencias —tal vez solo una— que den lugar, en ambos mensajes cifrados, a textos
claros válidos.
La tarea es tediosa, pero da resultado, incluso si la secuencia empleada para cifrar
es totalmente aleatoria. En consecuencia, los fallos sobre los que se cimentó el éxito
del criptoanálisis del cifrado de Lorenz fueron dos: en primer lugar, el cifrado acci-
dental de dos mensajes distintos con la misma secuencia, y en segundo, el carácter
poco aleatorio de la secuencia en cuestión.
10.1. Introducción
Una gran parte de los algoritmos de cifrado simétrico operan dividiendo el men-
saje que se pretende codificar en bloques de tamaño fijo, y aplican sobre cada uno
de ellos una combinación más o menos compleja de operaciones de confusión —
sustituciones— y difusión —transposiciones— (ver sección 3.8). Estos algoritmos se
denominan, en general, cifrados por bloques.
Recordemos que la confusión consiste en tratar de ocultar la relación que exis-
te entre el texto claro, el texto cifrado y la clave. Un buen mecanismo de confusión
hará demasiado complicado extraer relaciones estadı́sticas entre las tres cosas. Por su
parte la difusión trata de repartir la influencia de cada bit del mensaje original lo más
posible entre el mensaje cifrado.
Un hecho digno de ser tenido en cuenta es que la confusión por sı́ sola resulta
suficiente, ya que si establecemos una tabla de sustitución completamente diferente
para cada clave con todos los textos claros posibles tendremos un sistema extrema-
damente seguro. Sin embargo, dichas tablas ocuparı́an cantidades astronómicas de
memoria, por lo que en la práctica resultan inviables. Por ejemplo, un algoritmo que
codificara bloques de 128 bits empleando una clave de 80 bits necesitarı́a una tabla
de sustitución con un tamaño del orden de 1064 bits.
Lo que en realidad se hace para conseguir algoritmos fuertes sin necesidad de al-
macenar tablas enormes es intercalar la confusión (sustituciones simples, con tablas
pequeñas) y la difusión (permutaciones). Esta combinación se conoce como cifrado de
producto. La mayorı́a de los algoritmos se basan en diferentes capas de sustituciones
y permutaciones, estructura que denominaremos Red de Sustitución-Permutación. En
DnL (EnL (L, R), EnR (L, R)) = L y DnR (EnL (L, R), EnR (L, R)) = R
Si n = 1 tenemos:
E1L (A, B) = A ⊕ f (B, K1 )
E1R (A, B) = B
y
L
D1 (A, B) = A ⊕ f (B, K1 )
D1R (A, B) = B
luego
D1L E1L (L, R), E1R (L, R) = E1L (L, R) ⊕ f E1R (L, R), K1 =
= L ⊕ f (R, K1 ) ⊕ f (R, K1 ) = L
y
D1R E1L (L, R), E1R (L, R) = E1R (L, R) = R
1
Este principio garantiza que si demostramos el caso correspondiente a n = 1, y luego demostra-
mos el caso n + 1 suponiendo cierto el caso n, la propiedad en cuestión ha de cumplirse para cualquier
valor entero de n igual o superior a 1
L R
Sustituyendo En+1 (L, R) y En+1 (L, R) en la parte derecha de la anterior expre-
sión nos queda:
L R
Dn+1 En+1 (L, R), En+1 (L, R) =
L R L L
= Dn En (L, R), En (L, R) ⊕ f (En (L, R), Kn+1 ) ⊕ f (En (L, R), Kn+1 )
o sea,
L L R
Dn+1 En+1 (L, R), En+1 (L, R) = DnL EnL (L, R), EnR (L, R) = L
L R R
Dn+1 En+1 (L, R), En+1 (L, R) = DnR EnL (L, R), EnR (L, R) = R
esto es, si hacemos dos cifrados encadenados con k1 y k2 , existe una clave k3 que
realiza la transformación equivalente.
Es interesante que un algoritmo criptográfico carezca de este tipo de estructura,
ya que si ciframos un mensaje primero con la clave k1 y el resultado con la clave
k2 , es como si hubiéramos empleado una clave de longitud doble, aumentando la
seguridad del sistema. Si, por el contrario, la transformación criptográfica presentara
estructura de grupo, esto hubiera sido equivalente a cifrar el mensaje una única vez
con una tercera clave, con lo que no habrı́amos ganado nada.
10.1.3. S-Cajas
Hemos dicho antes que para poder construir buenos algoritmos de producto, in-
tercalaremos sustituciones sencillas (confusión), con tablas pequeñas, y permutacio-
nes (difusión). Estas tablas pequeñas de sustitución se denominan de forma genérica
S-Cajas.
Una S-Caja de m × n bits (ver figura 10.2) es una tabla de sustitución que toma
como entrada cadenas de m bits y da como salida cadenas de n bits. DES, por ejemplo,
emplea ocho S-Cajas de 6 × 4 bits. La utilización de las S-Cajas es sencilla: se divide
el bloque original en trozos de m bits y cada uno de ellos se sustituye por otro de n
bits, haciendo uso de la S-Caja correspondiente. Normalmente, cuanto más grandes
sean las S-Cajas, más resistente será el algoritmo resultante, aunque la elección de los
valores de salida para que den lugar a un buen algoritmo no es en absoluto trivial.
Existe un algoritmo criptográfico, llamado CAST, que emplea seis S-Cajas de 8×32
bits. CAST codifica bloques de 64 bits empleando claves de 64 bits, consta de ocho
rondas y deposita prácticamente toda su fuerza en las S-Cajas. De hecho, existen mu-
chas variedades de CAST, cada una con sus S-Cajas correspondientes —algunas de
ellas secretas—. Este algoritmo se ha demostrado resistente a las técnicas habituales
de criptoanálisis, y sólo se conoce la fuerza bruta como mecanismo para atacarlo.
Figura 10.4: Cálculo de las Ki para el algoritmo DES. EP1 representa la primera elec-
ción permutada, que sólo conserva 56 bits de los 64 de entrada, y EP2 representa la
segunda, que se queda con 48 bits.
Se calcula un total de 16 valores de Ki (figura 10.4), uno para cada ronda, efec-
tuando primero una permutación inicial EP1 sobre la clave de 64 bits, llevando a
cabo desplazamientos a la izquierda de cada una de las dos mitades —de 28 bits—
resultantes, y realizando finalmente una elección permutada (EP2) de 48 bits en cada
ronda, que será la Ki . Los desplazamientos a la izquierda son de dos bits, salvo para
las rondas 1, 2, 9 y 16, en las que se desplaza sólo un bit. Nótese que aunque la clave
para el algoritmo DES tiene en principio 64 bits, se ignoran ocho de ellos —un bit de
paridad por cada byte de la clave—, por lo que en la práctica se usan sólo 56 bits.
Para descifrar basta con usar el mismo algoritmo (ya que Pi = Pf−1 ) empleando
las Ki en orden inverso.
El algoritmo DES presenta algunas claves débiles. En general, todos aquellos valo-
res de la llave que conducen a una secuencia inadecuada de Ki serán poco recomen-
dables. Distinguiremos entre claves débiles (cuadro 10.1), que son aquellas que gene-
Cuadro 10.1: Claves débiles para el algoritmo DES (64 bits), expresadas en hexadeci-
mal.
Cuadro 10.2: Claves semi-débiles para el algoritmo DES (64 bits), expresadas en he-
xadecimal.
A mediados de julio de 1998, una empresa sin ánimo de lucro, llamada EFF (Elec-
tronic Frontier Foundation), logró fabricar una máquina capaz de descifrar un men-
saje DES en menos de tres dı́as. Curiosamente, pocas semanas antes, un alto cargo
de la NSA habı́a declarado que dicho algoritmo seguı́a siendo seguro, y que desci-
Consiste en aplicar varias veces el algoritmo DES con diferentes claves al mensaje
original. Se puede hacer ya que DES no presenta estructura de grupo (ecuación 10.2).
El más común de todos ellos es el Triple-DES, que responde a la siguiente estructura:
C = Ek1 (Ek−1
2
(Ek1 (M )))
Consiste en emplear subclaves diferentes para cada una de las 16 rondas de DES.
Puesto que estas subclaves son de 48 bits, la clave resultante tendrı́a 768 bits en total.
No es nuestro objetivo entrar en detalles, pero empleando criptoanálisis diferencial,
esta variante podrı́a ser rota con 261 textos claros escogidos, por lo que en la práctica
no presenta un avance sustancial sobre DES estándar.
Esta variante emplea n trozos de 32 bits en cada ronda en lugar de dos, por lo que
aumentamos tanto la longitud de la clave como el tamaño de mensaje que se puede
XOR.
Suma módulo 216 .
Producto módulo 216 + 1.
dichos registros se empleará el criterio big endian, lo cual significa que el primer byte
es el más significativo. Denominaremos Zi a cada una de las 52 subclaves de 16 bits
que vamos a necesitar. Las operaciones que llevaremos a cabo en cada ronda son las
siguientes:
1. Multiplicar X1 por Z1 .
2. Sumar X2 con Z2 .
3. Sumar X3 con Z3 .
4. Multiplicar X4 por Z4 .
La salida de cada iteración serán los cuatro sub-bloques obtenidos en los pasos
11, 12, 13 y 14, que serán la entrada del siguiente ciclo, en el que emplearemos las
siguientes seis subclaves, hasta un total de 48. Al final de todo intercambiaremos los
dos bloques centrales (en realidad con eso deshacemos el intercambio que llevamos a
cabo en los pasos 12 y 13).
Después de la octava iteración, se realiza la siguiente transformación:
los belgas Joan Daemen y Vincent Rijmen. Su interés radica en que todo el proceso de
selección, revisión y estudio tanto de este algoritmo como de los restantes candidatos,
se ha efectuado de forma pública y abierta, por lo que, prácticamente por primera
vez, toda la comunidad criptográfica mundial ha participado en su análisis, lo cual
convierte a Rijndael en un algoritmo perfectamente digno de la confianza de todos.
AES es un sistema de cifrado por bloques, diseñado para manejar longitudes de
clave y de bloque variables, ambas comprendidas entre los 128 y los 256 bits. Reali-
za varias de sus operaciones internas a nivel de byte, interpretando éstos como ele-
mentos de un cuerpo de Galois GF (28 ) (ver sección 5.8.1). El resto de operaciones se
efectúan en términos de registros de 32 bits. Sin embargo, en algunos casos, una se-
cuencia de 32 bits se toma como un polinomio de grado inferior a 4, cuyos coeficientes
son a su vez polinomios en GF (28 ).
Si bien, como ya se ha dicho, este algoritmo soporta diferentes tamaños de bloque
y clave, en el estándar adoptado por el Gobierno Estadounidense en noviembre de
2001 (FIPS PUB 197), se especifica una longitud fija de bloque de 128 bits (Nb = 4,
como se verá más adelante), y la longitud de clave a escoger entre 128, 192 y 256 bits.
mediante una matriz rectangular de bytes, que posee cuatro filas, y Nb columnas.
Ası́, por ejemplo, si nuestro bloque tiene 160 bits (cuadro 10.4), Nb será igual a 5.
La clave tiene una estructura análoga a la del estado, y se representará mediante
una tabla con cuatro filas y Nk columnas. Si nuestra clave tiene, por ejemplo, 128 bits,
Nk será igual a 4 (cuadro 10.5).
En algunos casos, tanto el estado como la clave se consideran como vectores de
registros de 32 bits, estando cada registro constituido por los bytes de la columna
correspondiente, ordenados de arriba a abajo.
El bloque que se pretende cifrar o descifrar se traslada directamente byte a byte
sobre la matriz de estado, siguiendo la secuencia a0,0 , a1,0 , a2,0 , a3,0 , a0,1 . . ., y análoga-
mente, los bytes de la clave se copian sobre la matriz de clave en el mismo orden, a
saber, k0,0 , k1,0 , k2,0 , k3,0 , k0,1 . . ..
Siendo B el bloque que queremos cifrar, y S la matriz de estado, el algoritmo AES
con n rondas queda como sigue:
Cuadro 10.6: Número de rondas para AES en función de los tamaños de clave y blo-
que.
contrario, y utilizar los mismos Ki que en el cifrado, sólo que comenzando por el
último.
Puesto que AES permite emplear diferentes longitudes tanto de bloque como de
clave, el número de rondas requerido en cada caso es variable. En el cuadro 10.6 se
especifica cuántas rondas son necesarias en función de Nb y Nk .
Siendo S la matriz de estado, y Ki la subclave correspondiente a la ronda i–ésima,
cada una de las rondas posee la siguiente estructura:
1. S ←−ByteSub(S)
2. S ←−DesplazarFila(S)
3. S ←−MezclarColumnas(S)
4. S ←− Ki ⊕ S
Función ByteSub
1. Cada byte es considerado como un elemento del GF (28 ) que genera el poli-
nomio irreducible m(x) = x8 + x4 + x3 + x + 1, y sustituido por su inversa
multiplicativa. El valor cero queda inalterado.
Función DesplazarFila
Nb c1 c2 c3
4 1 2 3
6 1 2 3
8 1 3 4
ci diferente. Mientras que c0 siempre es igual a cero (esta fila siempre permanece
inalterada), el resto de valores viene en función de Nb y se refleja en el cuadro 10.7.
La función inversa de DesplazarFila será, obviamente, un desplazamiento de las
filas de la matriz de estado el mismo número de posiciones que en el cuadro 10.7,
pero a la derecha.
Función MezclarColumnas
Para aplicar esta función (ver figura 10.5), cada columna del vector de estado se
considera un polinomio cuyos coeficientes pertenecen a GF (28 ) —es decir, son tam-
bién polinomios– y se multiplica módulo x4 + 1 por:
a) Si Nk ≤ 6:
b) Si Nk > 6:
Rc(j) = (R(j), 0, 0, 0)
Según sus autores, es altamente improbable que existan claves débiles o semidébi-
les en AES, debido a la estructura de su diseño, que busca eliminar la simetrı́a en las
subclaves. También se ha comprobado que es resistente a criptoanálisis tanto lineal
como diferencial (ver sección 10.7). En efecto, el método más eficiente conocido has-
ta la fecha para recuperar la clave a partir de un par texto cifrado–texto claro es la
búsqueda exhaustiva, por lo que podemos considerar este algoritmo como uno de
los más seguros en la actualidad. Otro hecho que viene a corroborar la fortaleza de
AES es que en junio de 2003 fue aprobado por la NSA para cifrar información clasifi-
cada como alto secreto.
En esta sección comentaremos algunos métodos para aplicar cifrados por bloques
a mensajes de gran longitud. En general, habrá que subdividir el mensaje original
en trozos del mismo tamaño pero, ¿que ocurre cuando la longitud de la cadena que
queremos cifrar no es un múltiplo exacto del tamaño de bloque? En ese caso será ne-
cesario añadir información de relleno (padding) al final de la misma para que sı́ lo sea,
de forma que el mensaje pueda recuperar su longitud original, una vez descifrado.
El mecanismo más sencillo consiste en rellenar con ceros (o algún otro patrón) el últi-
mo bloque que se codifica. El problema ahora estriba en saber el tamaño exacto del
relleno para eliminarlo posteriormente. Lo que se suele hacer es añadir como último
byte del último bloque el número de bytes que se han añadido (ver figura 10.6). Esto
tiene el inconveniente de que si el tamaño original es múltiplo del bloque, hay que
alargarlo con otro bloque entero. Por ejemplo, si el tamaño de bloque fuera 64 bits, y
nos sobraran cinco bytes al final, añadirı́amos dos ceros y un tres, para completar los
ocho bytes necesarios en el último bloque. Si por contra no sobrara nada, tendrı́amos
que añadir siete ceros y un ocho.
A favor de este método podemos decir que permite codificar los bloques indepen-
dientemente de su orden, lo cual es adecuado para cifrar bases de datos o ficheros en
los que se requiera un acceso aleatorio. También es resistente a errores, pues si uno
de los bloques sufriera una alteración, el resto quedarı́a intacto.
Por contra, si el mensaje presenta patrones repetitivos, el texto cifrado también
los presentará, y eso es peligroso, sobre todo cuando se codifica información muy
redundante (como ficheros de texto), o con patrones comunes al inicio y final (como
el correo electrónico). Un atacante puede en estos casos efectuar un ataque estadı́stico
y extraer bastante información.
Otro riesgo bastante importante que presenta el modo ECB es el de la sustitución
de bloques. El atacante puede cambiar un bloque sin mayores problemas, y alterar los
mensajes incluso desconociendo la clave y el algoritmo empleados. Simplemente se
escucha una comunicación de la que se conozca el contenido, como por ejemplo una
transacción bancaria a nuestra cuenta corriente. Luego se escuchan otras comunica-
ciones y se sustituyen los bloques correspondientes al número de cuenta del benefi-
ciario de la transacción por la versión codificada de nuestro número (que ni siquiera
nos habremos molestado en descifrar). En cuestión de horas nos habremos hecho ri-
cos.
Figura 10.7: Modo de operación CBC. A: cifrado, B: descifrado. V.I.: Vector de Inicia-
cización.
Figura 10.8: Esquema del modo de operación CFB. A: cifrado, B: descifrado. V.I.:
Vector de Iniciacización.
Descubierto por Biham y Shamir en 1990, aunque ya conocido en 1974 por IBM y
la NSA, permite efectuar un ataque de texto claro escogido que resulta más eficiente
que la fuerza bruta para DES. Para ello se generan pares de mensajes idénticos, que
difieren en una serie de bits fijados de antemano. Después se calcula la diferencia
entre los dos criptogramas asociados, con la esperanza de detectar patrones estadı́sti-
cos. Por ejemplo, podemos definir ∆M como la diferencia entre dos textos claros M1
y M2 , de manera que ∆M = M1 ⊕ M2 . Cifrando entonces M1 y M2 obtendrı́amos la
∆C = Ek (M1 ) ⊕ Ek (M2 )
Propuesta por Eli Biham en 1998, esta estrategia de criptoanálisis permitió atacar
con éxito una versión del algoritmo Skipjack, reducida a 31 rondas de las 32 origina-
les. Se basa en buscar diferenciales (ver sección 10.7.1) que, para una clave k dada,
nunca puedan darse, o lo que es lo mismo, que resulten imposibles. De esta mane-
ra, si desciframos un par de mensajes empleando una clave tentativa kt y obtenemos
uno de esos diferenciales, podremos afirmar que kt no es la clave que buscamos.
Cifrados de Flujo
si+1 = g(si , k)
oi = h(si , k) (11.1)
ci = w(mi , oi )
el receptor un xor con la misma secuencia, por lo que el resto del mensaje será impo-
sible de descifrar. Esto nos obliga a emplear tanto técnicas de verificación como de
restablecimiento de la sincronı́a.
Otro problema muy común con este tipo de técnicas es que si algún bit del cripto-
grama es alterado, la sincronización no se pierde, pero el texto claro se verá modifica-
do en la misma posición. Esta caracterı́stica podrı́a permitir a un atacante introducir
cambios en nuestros mensajes, simplemente conociendo qué bits debe alterar. Para
evitar esto, deben emplearse mecanismos de verificación que garanticen la integri-
dad del mensaje recibido, como las funciones resumen (ver capı́tulo 13).
Existe también una debilidad intrı́nseca a los métodos de cifrado de flujo basados
en generadores sı́ncronos que vale la pena destacar: si un atacante conoce parte del
texto claro, podrá sustituirlo por otro sin que lo advierta el legı́timo destinatario.
Supongamos que mi es una porción del mensaje original conocida por el atacante, y
ci el trozo de mensaje cifrado correspondiente a él. Sabemos que
ci = w(mi , oi )
c0i = w(m0i , oi )
siendo m0i un mensaje falso de nuestra elección. Seguidamente sustituimos los ci ori-
ginales por los c0i que acabamos de obtener. Cuando el destinatario descifre el mensaje
alterado, obtendrá la porción de mensaje m0i , en lugar del original, de forma total-
mente inadvertida. Esta circunstancia aconseja emplear estos métodos de cifrado en
combinación con técnicas que garanticen la integridad del mensaje (ver capı́tulo 13).
Donde k es la clave, mi y ci son la i–ésima porción del texto claro y cifrado respecti-
vamente y w es una función reversible. Los valores c−t , c−t+1 , . . . , c−1 constituyen el
estado inicial del generador.
Esta familia de generadores es resistente a la pérdida o inserción de información,
ya que acaba por volver a sincronizarse automáticamente, en cuanto llegan t bloques
correctos de forma consecutiva. También será sensible a la alteración de un mensaje,
ya que si se modifica la unidad de información ci , el receptor tendrá valores erróneos
de entrada en su función h hasta que se alcance el bloque ci+t , momento a partir del
cual la transmisión habrá recuperado la sincronización. En cualquier caso, al igual
que con los generadores sı́ncronos, habrá que introducir mecanismos de verificación.
Una propiedad interesante de estos generadores es la dispersión de las propieda-
des estadı́sticas del texto claro a lo largo de todo el mensaje cifrado, ya que cada dı́gito
del mensaje influye en todo el criptograma. Esto hace que los generadores ası́ncronos
se consideren en general más resistentes frente a ataques basados en la redundancia
del texto en claro.
Estos registros, debido a que permiten generar secuencias con perı́odos muy gran-
des y con buenas propiedades estadı́sticas, además de su bien conocida estructura al-
gebraica y su facilidad para ser implementados por hardware, se encuentran presentes
en muchos de los generadores de secuencia propuestos en la literatura.
Un registro de desplazamiento retroalimentado lineal L es un conjunto de L estados,
{S0 , S1 , . . . , SL−1 }, capaces de almacenar un bit cada uno (fig 11.2.a). Esta estructura
viene controlada por un reloj que coordina los flujos de información entre los estados.
Durante cada unidad de tiempo se efectúan las siguientes operaciones:
f (R1 , R2 , . . . , Rn ) (11.3)
Figura 11.3: Esquema del modo de operación OFB, para emplear algoritmos de cifra-
do por bloques como generadores de secuencia sı́ncronos para cifrados de flujo.
Si bien los registros de desplazamiento son muy interesantes para generar secuen-
cias mediante hardware, en realidad no son especialmente fáciles de implementar, ni
eficientes, si se usan por software. Esto ha llevado a la comunidad a proponer algorit-
mos de generación de secuencia especialmente pensados para ser incorporados por
software. Nosotros vamos a comentar dos de ellos: RC4 y SEAL.
Existe un modo de operación (ver sección 10.6) sobre algoritmos de cifrado por
bloques que puede usarse como generador sı́ncrono, ya que genera, de forma to-
talmente independiente del mensaje, una secuencia pseudoaleatoria basada en una
clave. En la figura 11.3 podemos ver cómo a partir de una clave K, y de un vector de
inicialización (V.I.), estos algoritmos nos permiten generar una secuencia oi de blo-
ques perfectamente válida para ser empleada dentro de un esquema de cifrado de
flujo sı́ncrono.
El algoritmo RC4 fue diseñado por Ron Rivest en 1987 para la compañı́a RSA Data
Security. Su implementación es extremadamente sencilla y rápida, y está orientado a
generar secuencias en unidades de un byte, además de permitir claves de diferentes
longitudes. Por desgracia es un algoritmo propietario, lo cual implica que no puede
ser incluido en aplicaciones de tipo comercial sin pagar los royalties correspondientes.
El código del algoritmo no se ha publicado nunca oficialmente, pero en 1994 al-
guien difundió en los grupos de noticias de Internet una descripción que, como poste-
riormente se ha comprobado, genera las mismas secuencias. Dicha descripción consta
de una S-Caja de 8*8, que almacenará una permutación del conjunto {0, . . . , 255}. Dos
contadores i y j se ponen a cero. Luego, cada byte Or de la secuencia se calcula como
sigue:
1. i = (i + 1) mód 256
2. j = (j + Si ) mód 256
3. Intercambiar los valores de Si y Sj
4. t = (Si + Sj ) mód 256
5. Or = St
Para calcular los valores iniciales de la S-Caja, se hace lo siguiente:
1. Si = i ∀0 ≤ i ≤ 255
2. Rellenar el array K0 a K255 repitiendo la clave tantas veces
como sea necesario.
3. j = 0
4. Para i = 0 hasta 255 hacer:
j = (j + Si + Ki ) mód 256
Intercambiar Si y Sj .
El algoritmo RC4 genera secuencias en las que los ciclos son bastante grandes, y
es inmune a los criptoanálisis diferencial y lineal, si bien algunos estudios indican
que puede poseer claves débiles, y que es sensible a estudios analı́ticos del contenido
de la S-Caja. De hecho, algunos afirman que en una de cada 256 claves posibles, los
bytes que se generan tienen una fuerte correlación con un subconjunto de los bytes
de la clave, lo cual es un comportamiento muy poco recomendable.
A pesar de las dudas que existen en la actualidad sobre su seguridad, es un algo-
ritmo ampliamente utilizado en muchas aplicaciones de tipo comercial.
SEAL es un generador de secuencia diseñado en 1993 para IBM por Phil Rogaway
y Don Coppersmith, cuya estructura está especialmente pensada para funcionar de
manera eficiente en computadores con una longitud de palabra de 32 bits. Su fun-
cionamiento se basa en un proceso inicial en el que se calculan los valores para unas
tablas a partir de la clave, de forma que el cifrado propiamente dicho puede llevarse a
cabo de una manera realmente rápida. Por desgracia, también es un algoritmo sujeto
a patentes.
Una caracterı́stica muy útil de este algoritmo es que no se basa en un sistema
lineal de generación, sino que define una familia de funciones pseudoaleatorias, de tal
forma que se puede calcular cualquier porción de la secuencia suministrando única-
mente un número entero n de 32 bits. La idea es que, dado ese número, junto con la
clave k de 160 bits, el algoritmo genera un bloque k(n) de L bits de longitud. De esa
forma, cada valor de k da lugar a una secuencia total de L · 232 bits, compuesta por la
yuxtaposición de los bloques k(0), k(1), . . . , k(232 − 1).
SEAL se basa en el empleo del algoritmo SHA (ver sección 13.5) para generar las
tablas que usa internamente. De hecho, existen dos versiones del algoritmo, la 1.0 y
la 2.0, que se diferencian precisamente en que la primera emplea SHA y la segunda
su versión revisada, SHA-1.
Cifrados Asimétricos
Los algoritmos asimétricos o de clave pública han demostrado su interés para ser
empleados en redes de comunicación inseguras (Internet). Introducidos por Whit-
field Diffie y Martin Hellman a mediados de los años 70, su novedad fundamental
con respecto a la criptografı́a simétrica es que las claves no son únicas, sino que
forman pares. Hasta la fecha han aparecido multitud de algoritmos asimétricos, la
mayorı́a de los cuales son inseguros; otros son poco prácticos, bien sea porque el
criptograma es considerablemente mayor que el mensaje original, bien sea porque
la longitud de la clave es enorme. Se basan en general en plantear al atacante pro-
blemas matemáticos difı́ciles de resolver (ver capı́tulo 5). En la práctica muy pocos
algoritmos son realmente útiles. El más popular por su sencillez es RSA, que ha so-
brevivido a multitud de ataques, si bien necesita una longitud de clave considerable.
Otros algoritmos son los de ElGamal y Rabin.
Los algoritmos asimétricos emplean generalmente longitudes de clave mucho ma-
yores que los simétricos. Por ejemplo, mientras que para algoritmos simétricos se
considera segura una clave de 128 bits, para algoritmos asimétricos —si exceptua-
mos aquellos basados en curvas elı́pticas— se recomiendan claves de al menos 2048
bits. Además, la complejidad de cálculo que comportan estos últimos los hace consi-
derablemente más lentos que los algoritmos de cifrado simétricos. En la práctica los
métodos asimétricos se emplean únicamente para codificar la clave de sesión (simétri-
ca) de cada mensaje o transacción particular.
12.1.2. Autentificación
En muchos algoritmos asimétricos ambas claves sirven tanto para cifrar como
para descifrar, de manera que si empleamos una para codificar, la otra permitirá de-
codificar y viceversa. Esto ocurre con el algoritmo RSA, en el que un único par de
claves es suficiente tanto para cifrar información como para autentificarla.
El ataque de intermediario (figura 12.3) puede darse con cualquier algoritmo asi-
métrico, dando lugar a un grave peligro del que hay que ser consciente, y tratar de
evitar a toda costa. Supongamos que A quiere establecer una comunicación con B, y
que C quiere espiarla. Cuando A le solicite a B su clave pública KB , C se interpone,
obteniendo la clave de B y enviando a A una clave falsa KC creada por él. A partir
de ese momento puede pasar lo siguiente:
La única manera de evitar esto consiste en buscar mecanismos para poder garan-
tizar que la clave pública que recibe A pertenece realmente a B. Para ello la solución
más obvia consiste en que KB esté firmada digitalmente por un amigo común, que
certifique la autenticidad de la clave. Si A y B carecen de amigos comunes, pueden
recurrir a los llamados anillos de confianza, que permiten certificar la autenticidad de
las claves a través de redes sociales, en las que cada usuario está relacionado con unos
cuantos y decide en quiénes confı́a, sin necesidad de centralizar el proceso. Por eso
se nos suele recomendar, cuando instalamos paquetes de cifrado asimétrico, como
PGP (capı́tulo 18), que firmemos todas las claves sobre las que tengamos certeza de
su autenticidad, y únicamente esas.
De entre todos los algoritmos asimétricos, quizá RSA sea el más sencillo de com-
prender e implementar. Como ya se ha dicho, sus claves sirven indistintamente tanto
para codificar como para autentificar. Debe su nombre a sus tres inventores: Ronald
Rivest, Adi Shamir y Leonard Adleman, y estuvo bajo patente de los Laboratorios
RSA hasta el 20 de septiembre de 2000, por lo que su uso comercial estuvo restrin-
gido hasta esa fecha. De hecho, las primeras versiones de PGP (ver capı́tulo 18) lo
incorporaban como método de cifrado y firma digital, pero se desaconsejó su uso a
partir de la versión 5 en favor de otros algoritmos, que por entonces sı́ eran libres.
Sujeto a múltiples controversias, desde su nacimiento nadie ha conseguido probar
o rebatir su seguridad, pero se le tiene como uno de los algoritmos asimétricos más
seguros.
RSA se basa en la dificultad para factorizar grandes números. Las claves pública
y privada se calculan a partir de un número que se obtiene como producto de dos
primos grandes. El atacante se enfrentará, si quiere recuperar un texto claro a partir
del criptograma y la clave pública, a un problema de factorización (ver sección 5.6) o
tendrá que resolver un logaritmo discreto (ver sección 5.4.2).
Para generar un par de claves (KP , Kp ), en primer lugar se eligen aleatoriamente
dos números primos grandes, p y q. Después se calcula el producto n = pq.
Escogeremos ahora un número e primo relativo con (p − 1)(q − 1). (e, n) será la
clave pública. Nótese que e debe tener inversa módulo (p − 1)(q − 1), por lo que
existirá un número d tal que
es decir, que d es la inversa de e módulo (p−1)(q −1). (d, n) será la clave privada. Esta
inversa puede calcularse fácilmente empleando el Algoritmo Extendido de Euclides.
Nótese que si desconocemos los factores de n, este cálculo resulta prácticamente im-
posible.
La operación de cifrado se lleva a cabo según la expresión:
c = me (mód n) (12.1)
m = cd (mód n) (12.2)
ya que
Recordemos que φ(n) = (p − 1)(q − 1), por lo que, según la ecuación (5.3),
(mk )(p−1)(q−1) = 1,
ma ≡ 1 (mód n)
con lo que obtendremos valores más pequeños, y por lo tanto más manejables, para
la clave de descifrado.
En muchos casos, se suele utilizar el Teorema Chino del Resto (sección 5.3) para
facilitar los cálculos a la hora de descifrar un mensaje. Para ello se incluyen p y q en
la clave privada, se calcula p1 = p−1 (mód q), y cuando se desea descifrar un mensaje
c, se plantea el siguiente sistema de congruencias:
260 : resulta más fácil que nos toque la primitiva y que simultáneamente nos parta
un rayo (cuadro 1.1). Por otra parte, si p o q fueran compuestos, el algoritmo RSA
simplemente no funcionarı́a correctamente.
Se puede demostrar matemáticamente que existen ciertos casos para los cuales el
algoritmo RSA deja el mensaje original tal cual, es decir
me ≡ m (mód n) (12.3)
En realidad, siempre hay mensajes que quedan inalterados al ser codificados me-
diante RSA, sea cual sea el valor de n. Nuestro objetivo será reducir al mı́nimo el
número de éstos. Se puede comprobar que, siendo n = pq y e el exponente para codi-
ficar,
Actualmente se considera segura una clave RSA con una longitud de n de al me-
nos 1024 bits, si bien se recomienda el uso de claves no inferiores a 2048 bits. Hasta
hace relativamente poco se recomendaban 512 bits, pero en mayo de 1999, Adi Shamir
presentó el denominado dispositivo Twinkle, un ingenio capaz de factorizar números
de manera muy rápida, aprovechando los últimos avances en la optimización de al-
goritmos especı́ficos para esta tarea. Este dispositivo, aún no construido, podrı́a ser
incorporado en ordenadores de bajo coste y pondrı́a en serio peligro los mensajes
cifrados con claves de 512 bits o menos.
Teniendo en cuenta los avances de la tecnologı́a, y suponiendo que el algoritmo
RSA no sea roto analı́ticamente, deberemos escoger la longitud de la clave en función
del tiempo que queramos que nuestra información permanezca en secreto. Efecti-
vamente, una clave de 1024 bits parece a todas luces demasiado corta como para
proteger información por más de unos pocos años.
Existe una familia de ataques a RSA que explotan la posibilidad de que un usuario
codifique y firme un único mensaje empleando el mismo par de claves. Para que
el ataque surta efecto, la firma debe hacerse codificando el mensaje completo, no
el resultado de una función MDC aplicada sobre él. Por ello se recomienda que las
firmas digitales se lleven a cabo siempre sobre la signatura del mensaje, nunca sobre
el mensaje en sı́.
Otro tipo de ataque con texto claro escogido podrı́a ser el siguiente: para falsificar
una firma sobre un mensaje m, se pueden calcular dos mensajes individuales m1 y
m2 , aparentemente inofensivos, tales que m1 m2 = m, y enviárselos a la vı́ctima pa-
ra que los firme. Entonces obtendrı́amos un md1 y md2 . Aunque desconozcamos d, si
calculamos
Podrı́a pensarse que, una vez generados p y q, será más rápido generar tantos
pares de claves como queramos, en lugar de tener que emplear dos números primos
diferentes en cada caso. Sin embargo, si lo hacemos ası́, un atacante podrá decodificar
nuestros mensajes sin necesidad de la clave privada. Sea m el texto claro, que codi-
ficamos empleando dos claves de cifrado diferentes e1 y e2 . Los criptogramas que
obtenemos son los siguientes:
c1 = me1 (mód n)
c2 = me2 (mód n)
re1 + se2 = 1
Recordemos que esto sólo se cumple si e1 y e2 son números primos relativos, pero
precisamente eso es lo que suele ocurrir en la gran mayorı́a de los casos. Por lo tanto,
se deben generar p y q diferentes para cada par de claves.
se cifre, los bits aleatorios citados en el anterior párrafo. De esta forma reducimos la
probabilidad de que se emplee exactamente el mismo valor de m en los tres casos.
También existen ataques que se aprovechan de valores bajos en el exponente
de descifrado d, por lo que se recomienda que d tenga aproximadamente el mismo
número de bits que n.
Firmar y Codificar
y = px (mód n)
Para firmar un mensaje m basta con escoger un número k aleatorio, que sea primo
relativo con n − 1, y calcular
a = pk (mód n)
(12.4)
b = (m − xa)k −1 (mód (n − 1))
La firma la constituye el par (a, b). En cuanto al valor k, debe mantenerse en se-
creto y ser diferente cada vez. La firma se verifica comprobando que
y a ab = p m (mód n) (12.5)
Cifrado de ElGamal
a = pk (mód n)
(12.6)
b = y k m (mód n)
El par (a, b) es el texto cifrado, de doble longitud que el texto original. Para decodificar
se calcula
c = m2 (mód n) (12.8)
m1 = c(p+1)/4 (mód p)
m2 = (p − c(p+1)/4 ) (mód p)
m3 = c(q+1)/4 (mód q)
m4 = (q − c(q+1)/4 ) (mód q)
Luego se escogen a y b tales que a = q(q −1 (mód p)) y b = p(p−1 (mód q)). Los
cuatro posibles mensajes originales son
2. Escoger t tal que 0 ≤ t ≤ 8, y seleccionar un número primo p tal que 2511+64t <
p < 2512+64t , y que además q sea divisor de (p − 1).
4. Si α = 1 volver al paso 3.
6. Calcular y = αa mód p.
3. Calcular k −1 mód q.
1. Verificar que 0 < r < q y 0 < s < q. En caso contrario, rechazar la firma.
Como vimos en la sección 6.4, para curvas elı́pticas existe un problema análogo
al de los logaritmos discretos en grupos finitos de enteros. Esto nos va a permitir
trasladar cualquier algoritmo criptográfico definido sobre enteros, y que se apoye en
este problema, al ámbito de las curvas elı́pticas. La ventaja que se obtiene es que, con
claves más pequeñas, se alcanza un nivel de seguridad equiparable.
Debido a la relación existente entre ambos, muchos algoritmos que se apoyan en
el problema de la factorización pueden ser replanteados para descansar sobre los
logaritmos discretos. De hecho, existen versiones de curva elı́ptica de muchos de los
algoritmos asimétricos más populares. A modo de ejemplo, en esta sección veremos
cómo se redefine el algoritmo de cifrado de ElGamal.
y = xp (12.10)
La clave pública vendrá dada por (p, y, n), y la clave privada será x.
El cifrado se hará escogiendo un número aleatorio k primo relativo con n. Segui-
damente calculamos las expresiones
a = kp
(12.11)
b = m + ky
m = −(xa) + b (12.12)
N = 44173
KP = 25277
C = 8767, 18584, 7557, 4510, 40818, 39760, 4510, 39760, 6813, 7557, 14747
a) Factorizar el módulo N .
b) Calcular la clave privada Kp .
c) Descifrar el mensaje C.
Solución:
Funciones Resumen
13.1. Propiedades
Sabemos que un mensaje m puede ser autentificado codificando con la llave pri-
vada Kp el resultado de aplicarle una función resumen, EKp (r(m)). Esa información
(que denominaremos firma del mensaje m) sólo puede ser generada por el poseedor
de la clave privada Kp . Cualquiera que tenga la llave pública correspondiente es-
tará en condiciones de decodificar y verificar la firma. Para que sea segura, la función
resumen r(x) debe cumplir además ciertas caracterı́sticas:
Estas propiedades son válidas tanto para los MDC como para los MAC, con la
dificultad añadida para estos últimos de que el atacante deberá averiguar además la
clave correspondiente. De hecho, conocida la clave, un MAC se comporta exactamen-
te igual que un MDC.
Para decidir cuál debe ser la longitud apropiada de una signatura, veamos prime-
ro el siguiente ejemplo: ¿Cuál es la cantidad n de personas que hay que poner en una
habitación para que la probabilidad P de que el cumpleaños de una de ellas sea el
1
mismo dı́a que el mı́o supere el 50 %? Sabemos que cuando n = 1, P = 365 . Cuando
n = 2, la probabilidad de que ningún cumpleaños coincida con el nuestro es el produc-
to de la probabilidad de que no coincida el primero, por la probabilidad de que no
coincida el segundo, luego:
364 364
P =1− ·
365 365
En el caso general,
n
364
P =1−
365
Para que P > 0,5, n debe ser al menos igual a 253. Sin embargo, ¿cuál serı́a la canti-
dad de gente necesaria para que la probabilidad Q de que dos personas cualesquie-
ra tengan el mismo cumpleaños supere el 50 %? Las dos primeras personas (o sea,
cuando n = 2) tienen una probabilidad 364
365
de no compartir el cumpleaños; una terce-
363
ra, supuesto que las dos primeras no lo comparten, tiene una probabilidad 365 de no
compartirlo con las otras dos, por lo que tenemos 364·363
365·365
, y ası́ sucesivamente. En el
caso general nos queda
364 · 363 . . . (365 − n + 1)
Q=1− con n ≥ 2
365(n−1)
Si hacemos los cálculos, veremos que Q > 0,5 si n > 22, una cantidad sorprendente-
mente mucho menor que 253.
Debe ser difı́cil encontrar dos mensajes aleatorios, m y m0 , tales que r(m) =
r(m0 ).
Hoy por hoy se recomienda emplear signaturas de al menos 128 bits, siendo 160
bits el valor más usado.
A = 67452301
B = EF CDAB89
C = 98BADCF E
D = 10325476
Posteriormente comienza el lazo principal del algoritmo, que se repetirá para cada
bloque de 512 bits del mensaje. En primer lugar copiaremos los valores de A,B,C y D
en otras cuatro variables, a,b,c y d. Luego definiremos las siguientes cuatro funciones:
F (X, Y, Z) = (X ∧ Y ) ∨ ((¬X) ∧ Z)
G(X, Y, Z) = (X ∧ Z) ∨ ((Y ∧ (¬Z))
H(X, Y, Z) = X ⊕Y ⊕Z
I(X, Y, Z) = Y ⊕ (X ∨ (¬Z))
Primera Ronda:
F F (a, b, c, d, m0 , 7, D76AA478)
F F (d, a, b, c, m1 , 12, E8C7B756)
F F (c, d, a, b, m2 , 17, 242070DB)
F F (b, c, d, a, m3 , 22, C1BDCEEE)
F F (a, b, c, d, m4 , 7, F 57C0F AF )
F F (d, a, b, c, m5 , 12, 4787C62A)
F F (c, d, a, b, m6 , 17, A8304613)
F F (b, c, d, a, m7 , 22, F D469501)
F F (a, b, c, d, m8 , 7, 698098D8)
F F (d, a, b, c, m9 , 12, 8B44F 7AF )
F F (c, d, a, b, m10 , 17, F F F F 5BB1)
F F (b, c, d, a, m11 , 22, 895CD7BE)
F F (a, b, c, d, m12 , 7, 6B901122)
F F (d, a, b, c, m13 , 12, F D987193)
F F (c, d, a, b, m14 , 17, A679438E)
F F (b, c, d, a, m15 , 22, 49B40821)
Segunda Ronda:
GG(a, b, c, d, m1 , 5, F 61E2562)
GG(d, a, b, c, m6 , 9, C040B340)
GG(c, d, a, b, m11 , 14, 265E5A51)
Tercera Ronda:
HH(a, b, c, d, m5 , 4, F F F A3942)
HH(d, a, b, c, m8 , 11, 8771F 681)
HH(c, d, a, b, m11 , 16, 6D9D6122)
HH(b, c, d, a, m14 , 23, F DE5380C)
HH(a, b, c, d, m1 , 4, A4BEEA44)
HH(d, a, b, c, m4 , 11, 4BDECF A9)
HH(c, d, a, b, m7 , 16, F 6BB4B60)
HH(b, c, d, a, m10 , 23, BEBF BC70)
HH(a, b, c, d, m13 , 4, 289B7EC6)
HH(d, a, b, c, m0 , 11, EAA127F A)
HH(c, d, a, b, m3 , 16, D4EF 3085)
HH(b, c, d, a, m6 , 23, 04881D05)
HH(a, b, c, d, m9 , 4, D9D4D039)
HH(d, a, b, c, m12 , 11, E6DB99E5)
HH(c, d, a, b, m15 , 16, 1F A27CF 8)
HH(b, c, d, a, m2 , 23, C4AC5665)
Cuarta Ronda:
II(a, b, c, d, m0 , 6, F 4292244)
II(d, a, b, c, m7 , 10, 432AF F 97)
II(c, d, a, b, m14 , 15, AB9423A7)
II(b, c, d, a, m5 , 21, F C93A039)
II(a, b, c, d, m12 , 6, 655B59C3)
II(d, a, b, c, m3 , 10, 8F 0CCC92)
II(c, d, a, b, m10 , 15, F F EF F 47D)
II(b, c, d, a, m1 , 21, 85845DD1)
II(a, b, c, d, m8 , 6, 6F A87E4F )
II(d, a, b, c, m15 , 10, F E2CE6E0)
II(c, d, a, b, m6 , 15, A3014314)
II(b, c, d, a, m13 , 21, 4E0811A1)
II(a, b, c, d, m4 , 6, F 7537E82)
II(d, a, b, c, m11 , 10, BD3AF 235)
II(c, d, a, b, m2 , 15, 2AD7D2BB)
II(b, c, d, a, m9 , 21, EB86D391)
Finalmente, los valores resultantes de a,b,c y d son sumados con A,B,C y D, que-
dando listos para procesar el siguiente bloque de datos. El resultado final del algorit-
mo es la concatenación de A,B,C y D.
A modo de curiosidad, diremos que las constantes ti empleadas en cada paso son
la parte entera del resultado de la operación 232 · abs(sin(i)), estando i representado
en radianes.
El algoritmo SHA-1 fue desarrollado por la NSA, para ser incluido en el estándar
DSS (Digital Signature Standard). Al contrario que los algoritmos de cifrado propues-
tos por esta organización, SHA-1 se considera seguro1 y libre de puertas traseras, ya
que el hecho de que el algoritmo sea realmente seguro favorece a los propios intere-
ses de la NSA. Produce firmas de 160 bits, a partir de bloques de 512 bits del mensaje
original.
El algoritmo es similar a MD5, con la diferencia de que usa la ordenación big
endian. Se inicializa de igual manera, es decir, añadiendo al final del mensaje un uno
seguido de tantos ceros como sea necesario hasta completar 448 bits en el último
bloque, para luego yuxtaponer la longitud en bits del propio mensaje —en este caso,
el primer byte de la secuencia será el más significativo—. A diferencia de MD5, SHA-1
emplea cinco registros de 32 bits en lugar de cuatro, que deben ser inicializados antes
de procesar el primer bloque con los siguientes valores:
1
Desafortunadamente, la seguridad de SHA-1 ha quedado puesta en entredicho debido a los avan-
ces conseguidos en 2004 y 2005 por un equipo de criptólogos chinos, liderado por Xiaoyun Wang.
A = 67452301
B = EF CDAB89
C = 98BADCF E
D = 10325476
E = C3D2E1F 0
Una vez que los cinco valores están inicializados, se copian en cinco variables, a,
b, c, d y e. El lazo principal tiene cuatro rondas con 20 operaciones cada una:
F (X, Y, Z) = (X ∧ Y ) ∨ ((¬X) ∧ Z)
G(X, Y, Z) = X ⊕ Y ⊕ Z
H(X, Y, Z) = (X ∧ Y ) ∨ (X ∧ Z) ∨ (Y ∧ Z)
K0 = 5A827999
K1 = 6ED9EBA1
K2 = 8F 1BBCDC
K3 = CA62C1D6
wt = mt para t = 0 . . . 15
wt = (wt−3 ⊕ wt−8 ⊕ wt−14 ⊕ wt−16 ) / 1 para t = 16 . . . 79
Todos los mi obtenidos se interpretan como enteros en las operaciones del algo-
ritmo empleando la ordenación big endian. Como curiosidad, diremos que la NSA
introdujo en 1995 el desplazamiento a la izquierda para corregir una debilidad del al-
goritmo, que no fue descubierta por los criptógrafos civiles hasta 2004, lo cual supuso
modificar el nombre del mismo para llamar a partir de entonces SHA-0 a la versión
original, y SHA-1 a la modificada.
El lazo principal del algoritmo es entonces el siguiente:
FOR t = 0 TO 79
i = t div 20
T mp = (a / 5) + A(b, c, d) + e + wt + Ki
e=d
d=c
c = b / 30
b=a
a = T mp
siendo A la función F , G o H según el valor de t (F para t ∈ [0, 19], G para t ∈ [20, 39]
y [60, 79], H para t ∈ [40, 59]). Después los valores de a a e son sumados a los registros
A a E y el algoritmo continúa con el siguiente bloque de datos. Finalmente, el valor
de la función resumen será la concatenación de los contenidos de los registros A a E
resultantes de procesar el último bloque del mensaje.
Basados en cifrados por bloques: Son los más comunes, y consisten en cifrar el men-
saje empleando un algoritmo por bloques en modo de operación CBC (sección
10.6). El valor del MAC será entonces el resultado de cifrar el último bloque del
mensaje.
donde k es la clave —alargada con ceros por la derecha hasta tener 64 bytes de
longitud—, opad es el byte con valor hexadecimal 5C repetido 64 veces, ipad es
el valor hexadecimal 36 repetido 64 veces, m es el mensaje, y la coma representa
la concatenación.
Esteganografı́a
y lo modifica hasta encontrar otro mensaje diferente con el mismo significado1 . Ese
proceso de modificación se hace a partir del mensaje huésped que queremos ocultar,
de forma que únicamente aquellos que conozcan el proceso seguido para su ocul-
tación puedan recuperarlo de manera satisfactoria. En función de la naturaleza del
mensaje anfitrión (un texto ASCII, una imagen JPEG, un fragmento de sonido MP3,
etc.), cambiará radicalmente el concepto de significado, y por lo tanto los procesos de
modificación que permitirán alojar el huésped sin despertar sospechas.
Una combinación adecuada de criptografı́a y esteganografı́a puede permitir que,
aunque el atacante conozca por completo el mecanismo de ocultación del huésped
en el anfitrión, únicamente recupere algo cuyas propiedades estadı́sticas son iguales
a las del ruido blanco, por lo que el autor del mensaje podrá repudiarlo (ver sección
2.6), evitando que se le obligue a facilitar sus claves criptográficas o se le someta a
represalias, ya que resultará matemáticamente imposible demostrar la propia exis-
tencia del mensaje.
En un archivo de texto, en general, cada byte viene asociado a una letra, un núme-
ro, un sı́mbolo o un carácter de control. Por ejemplo, si empleamos la codificación
ASCII, la letra “a” se corresponde con el valor numérico 97. Es posible por tanto con-
siderar el mensaje anfitrión como una secuencia de caracteres, en lugar de tomarlo
colmo una secuencia de bits. Podemos entonces actuar de dos maneras: modificar un
1
En algunos casos, el mensaje anfitrión puede ser generado a partir del mensaje que se pretende
ocultar. En esas situaciones, la única condición que el mensaje generado debe cumplir es que posea
algún sentido, al menos aparentemente.
texto existente en función del mensaje que queremos ocultar, sin alterar su significa-
do, o bien generar un texto aparentemente inocuo a partir del mensaje huésped.
En el primer caso podemos jugar con los caracteres de control, introduciendo es-
pacios o retornos de carro superfluos que no alteren el significado del mensaje anfi-
trión. Por ejemplo, si queremos codificar un 1, podrı́amos introducir un espacio doble
entre dos palabras consecutivas, y un espacio simple si queremos representar un 0.
De esta forma será relativamente fácil introducir un mensaje huésped de tantos bits
de longitud como huecos entre palabras contenga el mensaje anfitrión.
En el segundo caso haremos uso un generador de frases, programado con una
serie de reglas gramaticales y un vocabulario más o menos extenso, que empleará el
mensaje huésped como guı́a para generar oraciones correctas gramaticalmente. El
destinatario utilizarı́a un analizador léxico–sintáctico para deshacer la operación.
Existen aplicaciones que generan, a través de este método, mensajes con aparien-
cia de correos basura (spam), capaces de pasar desapercibidos entre los cientos de
millones de correos de este tipo que cada dı́a viajan por Internet.
Con pérdida. El algoritmo no permite recuperar con exactitud los valores de cada
muestra, y por lo tanto da lugar a una imagen o sonido distintos del original,
aunque para el ojo u oı́do humanos la diferencia es apenas perceptible. Estas
técnicas permiten obtener grados de compresión mucho mayores que las ante-
riores, e incluso establecer un nivel de compromiso entre el tamaño del archivo
resultante y el grado de degradación de la imagen o sonido originales.
Hasta ahora hemos comentado una serie de métodos más o menos sutiles para
ocultar información en diferentes tipos de archivo, pero la cuestión realmente impor-
tante es la siguiente: ¿es posible detectar si un mensaje cualquiera alberga informa-
ción esteganografiada? Esta pregunta resulta crucial, ya que a la postre el objetivo de
las técnicas esteganográficas es impedir –o al menos dificultar– esa detección.
Para decidir si un mensaje cualquiera es en realidad el anfitrión de otro, tendre-
mos que ponernos en el lugar de quien lo generó, y seleccionar en él los bits que
consideremos más adecuados para ocultar información. Una vez aislados, habrá que
realizar un estudio acerca de su distribución estadı́stica tı́pica en un mensaje nor-
mal, y comparar los resultados con los valores extraı́dos del archivo sospechoso. Po-
dremos considerar que hemos encontrado un indicio de la presencia de un mensaje
oculto si los resultados obtenidos difieren de los que presenta un mensaje limpio. Esto
nos obliga a conocer, al menos a grandes rasgos, qué métodos esteganográficos ha
podido usar nuestro adversario, y a diseñar pruebas especı́ficas para detectar cada
uno de ellos.
Evidentemente, la recuperación completa del mensaje huésped es una prueba irre-
futable de que éste existe, que siempre puede llegar a conseguirse. No obstante, si el
mensaje huésped se encuentra cifrado, podemos considerar esa posibilidad fuera del
alcance de quien analiza el mensaje anfitrión. En ese caso, la prueba de la presencia de
un mensaje oculto dentro de otro tendrá que basarse en las propiedades estadı́sticas
de la información analizada. En general, se puede conseguir que resulte imposible,
3
El espectro de una señal es el rango de los coeficientes no nulos de su transformada.
1. Analizar estadı́sticamente los bits del mensaje anfitrión que van a ser alterados
durante el proceso de esteganografiado.
3. Manipular el mensaje huésped, una vez cifrado, para que presente una distri-
bución estadı́stica similar a la de los bits analizados previamente.
15.1. Introducción
Cuando un agente A pretende convencer a otro B de que posee una cierta infor-
mación X, la estrategia más simple e intuitiva consiste en que A proporcione a B
el valor de X. Sin embargo, a partir de ese momento, B conocerá el secreto de A y
podrá contárselo a todo el mundo. O lo que es peor: un atacante C puede espiar la
comunicación entre A y B y robar el secreto.
Si bien este problema puede ser resuelto a partir de criptografı́a asimétrica (capı́tu-
lo 12) o de funciones resumen (capı́tulo 13), como veremos en el capı́tulo 17, existe
un mecanismo que, a través de un proceso interactivo, permite a A probar a B que
posee el secreto en cuestión, sin revelar ningún tipo de información acerca de X en
el proceso. En general, estas técnicas, conocidas como Pruebas de Conocimiento Cero,
suelen tener modestos requerimientos computacionales en comparación con otros
protocolos, de ahı́ su interés.
Una prueba de conocimiento cero se basa en la formulación por parte de B de una
serie de preguntas. Si A conoce el valor de X, podrá responder correctamente a todas
ellas; en caso contrario, tendrá una probabilidad determinada de acertar la respuesta
en cada caso —usualmente del 50 %—. De esta forma, la probabilidad de que un
impostor logre superar una prueba de n preguntas es de 1/2n . Otra caracterı́stica
importante es que ninguno de los mensajes que intercambian A y B a lo largo del
proceso aporta información a un eventual espı́a C sobre el valor de X. Finalmente,
es necesario recalcar que la secuencia de preguntas debe ser diferente y aleatoria en
cada caso, de forma que C no pueda memorizar la secuencia concreta de respuestas y
ası́ engañar a B.
15.2. Elementos
A la hora de describir el funcionamiento de una prueba de conocimiento cero, es
interesante definir los distintos elementos que la componen, con objeto de facilitar su
comprensión:
Un Secreto X, que puede ser una contraseña, una clave privada, o cualquier otra
información cuya posesión se quiera demostrar.
Un Demostrador (al que llamaremos David a partir de ahora), que es quien pre-
tende demostrar que posee el secreto X.
Un Verificador (al que llamaremos Vı́ctor), que es quien debe asegurarse de que
David está en posesión de X.
15.3. Desarrollo
Un ejemplo tı́pico en la literatura para explicar las pruebas de conocimiento ce-
ro se basa en una variante circular de la cueva de Alı́ Babá (figura 15.1), tal que la
entrada se bifurca y las dos ramas resultantes quedan comunicadas por una puerta.
Supongamos que David conoce la contraseña que abre la puerta, y quiere convencer
a Vı́ctor de ello sin decı́rsela. David se introducirı́a por una de las ramas de la cue-
va sin que Vı́ctor supiera cuál, seguidamente Vı́ctor entrarı́a y pedirı́a a David que
saliera por una de las ramas, escogida de forma aleatoria. Si David conoce la contra-
seña podrá abrir la puerta cuando lo necesite para salir por el lugar solicitado, pero
si la ignora sólo podrá salir por el lugar correcto la mitad de las veces. Tras repetir un
número razonable de veces este proceso, Vı́ctor quedará convencido de que David
posee la contraseña correcta, sin conocerla él mismo. Además, la observación de todo
el proceso por parte de un tercero no servirá a nadie para poder hacerse pasar por
David.
Este ejemplo no es más que una analogı́a para entender mejor una prueba de
conocimiento cero. De hecho, a David le hubiera bastado con entrar por una rama y
salir por la otra para convencer a Vı́ctor. Veamos ahora el proceso desde un punto de
vista más completo y formal. David, para demostrar que se encuentra en posesión
del secreto X, construye un problema matemático M , computacionalmente difı́cil de
resolver, de forma que X constituya una solución para M —nótese que David parte
de la solución para elaborar el problema—. Se produce entonces el siguiente diálogo:
3. Si:
Observando el protocolo con atención, puede verse que la única forma de que
David pueda responder correctamente a ambas preguntas es que posea la solución
X. David únicamente revela, o bien la relación entre M y M 0 , o bien el valor de X 0 , y
que cada una de estas cosas por separado resulta inútil para calcular X.
1. Andrés, haciéndose pasar por David, solicita a Vı́ctor realizar la prueba de co-
nocimiento cero.
2. Andrés, haciéndose pasar por Vı́ctor, informa a David de que debe realizar la
prueba.
Como resultado tenemos que Andrés ha logrado convencer a Vı́ctor de que posee
el mismo secreto que David, —aunque no lo conce, ni ha ganado información sobre
él—. Este ataque resulta indetectable, y puede dar lugar a importantes brechas de
seguridad, especialmente cuando la prueba de conocimiento cero se usa para com-
probar la identidad de alguien.
Aplicaciones Criptográficas
16.1. Introducción
Alteraciones en el mensaje. Este problema puede llegar a ser mucho peor que el
anterior, ya que si recibimos un mensaje que ha sido modificado y lo damos por
bueno, las consecuencias para la comunicación pueden ser catastróficas. En este
Figura 16.1: Esquema del conjunto de protocolos TCP/IP, en los que se basa la red
Internet.
Capa de Red. En ella se ubica el protocolo IP, cuyo propósito consiste en hacer
llegar los paquetes a su destino a través de una única red. Existen algunos pro-
tocolos de mayor nivel, como ICMP o IGMP, que aunque se construyen sobre IP,
también pertenecen a la capa de red, a diferencia de lo que ocurre en el modelo
OSI.
VPN (Virtual Private Network) es una red de comunicaciones privada construida so-
bre una red pública. Hacia los usuarios se comporta como si de una red interna se
tratase, ofreciendo acceso únicamente a aquellos que estén autorizados, y resultan-
do inaccesible para los demás, cuando en realidad todas las conexiones se realizan a
través de Internet.
Si bien el método usado con más frecuencia para establecer conexiones seguras a
través de Internet sigue siendo SSL, cabe esperar que con el tiempo sea paulatinamen-
te reemplazado por TLS, y que este último se convierta en el estándar de seguridad
para las comunicaciones cifradas en Internet.
Modo túnel: Se realiza entre dos pasarelas de seguridad, de forma que éstas se
encargan de crear una ruta segura entre dos ordenadores conectados a ellas, a
través de la cual viajan los paquetes. De este modo se puede disponer dentro
de una red local de un ordenador que desempeñe las labores de pasarela, al
que las computadoras de la propia red envı́en los paquetes, para que éste les
aplique los protocolos IPsec antes de remitirlos al destinatario —o a su pasare-
la de seguridad asociada—. Este modo permite interconectar de forma segura
ordenadores que no incorporen IPsec, con la única condición de que existan
pasarelas de seguridad en las redes locales de cada uno de ellos.
Modo transporte: En este caso los cálculos criptográficos relativos a los protocolos
IPsec se realizan en cada extremo de la comunicación.
Básicamente, IPsec se compone a su vez de dos protocolos, cada uno de los cuales
añade una serie de campos, o modifica los ya existentes, a los paquetes IP:
Debido a que algunos de los servicios que IPsec proporciona necesitan de la dis-
tribución e intercambio de las claves necesarias para cifrar, autentificar y verificar la
integridad de los paquetes, es necesario que éste trabaje en consonancia con un con-
junto externo de mecanismos que permita llevar a cabo esta tarea, tales como IKE,
SKIP o Kerberos.
17.1. Introducción
La forma más extendida de calcular firmas digitales consiste en emplear una com-
binación de cifrado asimétrico (capı́tulo 12) y funciones resumen (capı́tulo 13). El es-
quema de funcionamiento queda ilustrado en la figura 17.1.
Clave Privada
Cifrado
Asimétrico Descifrado
Firma Firma
Asimétrico
Digital Digital
Clave Pública
A B
Figura 17.1: Esquema de una firma digital basada en funciones resumen y algoritmos
de cifrado asimétricos. A: generación de la firma; B: verificación.
lidad.
El estándar X.509 sólo define la sintaxis de los certificados, por lo que no está atado
a ningún algoritmo en particular, y contempla los siguientes campos:
Versión.
Número de serie.
Identificador del algoritmo empleado para la firma digital.
Nombre del certificador.
Periodo de validez.
Nombre del sujeto.
Clave pública del sujeto.
Identificador único del certificador.
Identificador único del sujeto.
Extensiones.
Firma digital de todo lo anterior generada por el certificador.
Cuando una clave pública pierde su validez —por destrucción o robo de la clave
privada correspondiente, por ejemplo—, es necesario anularla. Para ello se emplean
los denominados certificados de revocación que no son más que un mensaje que identifi-
ca a la clave pública que se desea anular, firmada por la clave privada correspondien-
te. De esta forma se garantiza que una clave pública únicamente puede ser revocada
por su legı́timo propietario —si la clave privada resulta comprometida, al atacante
no le interesará revocarla, ya que entonces el material robado perderı́a su valor—.
Como puede verse, para revocar una clave pública es necesario estar en posesión de
la privada, por lo que si perdemos esta última, jamás podremos hacer la revocación.
Para evitar estos problemas, conviene seguir una serie de pautas:
Generar los pares de claves con un perı́odo limitado de validez. De esta forma,
si no podemos revocar una clave, expirará por sı́ misma.
Si una clave ha sido anulada por alguna causa, las autoridades que la hubieran
certificado deben cancelar todos sus certificados asociados. Esto hace que todas las
autoridades dispongan de listas de revocación de certificados (CRL), que actualizan pe-
riódicamente, además de un servicio de consulta de las mismas. Dicho servicio suele
permitir tanto la consulta de la validez de un certificado concreto, como la descarga
total o parcial de la CRL correspondiente.
tidades de sus clientes. De lo contrario, alguien podrı́a crear una autoridad de certi-
ficación, obtener el correspondiente certificado digital de niveles superiores, y luego
emitir certificados falsos.
El esquema jerárquico es realmente simple y efectivo, pero presenta un problema
importante: si uno de los certificadores resulta comprometido, todos sus descendien-
tes en el árbol quedan invalidados. Esto obliga, por un lado, a que las autoridades
de certificación sean lo más transparentes posible, y por otro a que se mantengan
siempre al dı́a las listas de revocación de certificados.
Certificar aquellas claves sobre las que tenga absoluta certeza de que pertenecen
a sus propietarios.
Según el grado de confianza que presente un usuario, uno puede elegir creerse
todos sus certificados, no aceptar ninguno —piénsese en un usuario que certifica todo
lo que cae en sus manos, sin hacer ninguna comprobación—, o aceptar aquellos que,
además, posean firmas de otros usuarios.
Como puede comprobarse, en este esquema la confianza en una entidad certifi-
cadora puede tomar muchos valores, frente a los dos —confiable y no confiable—
que puede tomar en un esquema jerárquico. Se establece, de hecho, una gradación de
niveles de confianza que, como resultado, proporciona a su vez grados de confian-
za sobre las claves públicas que nos encontremos, variando desde desconfianza total
hasta confianza absoluta.
Ataque de diccionario
Un usuario malicioso puede construir una base de datos con millones de contra-
señas —un diccionario—, obtenidas a partir de palabras, nombres, fechas, combina-
ciones numéricas más o menos habituales, etc., y calcular la signatura de cada una de
ellas. Una vez obtenido el archivo que contiene las signaturas de las contraseñas de
cada usuario, bastará con buscar en la base de datos el valor correcto. Este dicciona-
rio puede construirse de forma previa e independiente al sistema informático que se
pretenda atacar, y ser reutilizado tantas veces como se desee.
Para protegerse de los ataques de diccionario existen dos estrategias básicas:
Además de estar bien salvaguardadas, cabrı́a seguir las siguientes directrices para
que nuestras palabras clave puedan considerarse seguras:
1. Deben permanecer a salvo de terceros. Una contraseña jamás debe ser conocida
por un extraño, lo cual desaconseja llevarla escrita en algún sitio, o bien obliga
a custodiar cuidadosamente el lugar donde esté anotada. Existen autores que
abogan por llevar las contraseñas escritas en una tarjeta, y cuidar de ella como
de nuestro dinero o las llaves de nuestra casa.
2. No utilizar la misma clave en diferentes lugares, ya que si uno resulta comprome-
tido, el resto también caerá. Hay aplicaciones que, a partir de una contraseña
maestra, permiten almacenar todas nuestras contraseñas de uso diario, lo cual
facilitará sin duda nuestro dı́a a dı́a, permitiéndonos gestionar todas las pala-
bras clave que necesitemos.
3. Ser lo suficientemente complejas. Una buena contraseña debe constar de al menos
ocho letras. Pensemos que si empleamos únicamente seis caracteres alfanuméri-
cos (números y letras), tenemos solo unos dos mil millones de posibilidades.
Teniendo en cuenta que hay programas para PC capaces de probar más de cua-
renta mil claves en un segundo, una clave de estas caracterı́sticas podrı́a ser
descubierta en menos de quince horas.
4. Carecer de significado. Una contraseña jamás debe significar nada, puesto que
entonces aumentará la probabilidad de que aparezca en algún diccionario. Evi-
temos los nombres propios, en especial aquellos que pertenezcan a lugares o
personajes de ficción.
5. Ser fáciles de recordar. Si pretendemos memorizar nuestras claves, carecerá de
sentido emplear contraseñas difı́ciles de recordar. Para esto podemos seguir re-
glas como que la palabra se pueda pronunciar en voz alta, o que responda a
algún acrónimo más o menos complejo. En este punto no debemos olvidar que
hay que evitar a toda costa palabras que signifiquen algo.
6. Deben ser modificadas con frecuencia. Hemos de partir de la premisa de que toda
palabra clave será comprometida tarde o temprano, por lo que será muy re-
comendable que nuestras contraseñas sean cambiadas periódicamente. La fre-
cuencia con la que se produzca el cambio dependerá de la complejidad de las
claves y del nivel de seguridad que se desee alcanzar. Y lo más importante: ante
cualquier sospecha, cambiar todas las claves.
ción MAC correspondiente para cada uno de ellos. Posteriormente se realizanban los
cálculos fuera de lı́nea, obteniéndose como resultado el valor de K, suficiente para
clonar la tarjeta SIM en cuestión.
También es necesario que los valores de X que se generen en cada realización
del algoritmo sean criptográficamente aleatorios, ya que en caso contrario un atacan-
te podrı́a predecir el valor de X para la siguiente realización del protocolo, luego
suplantarı́a al servidor usando ese valor, se pondrı́a en contacto con el dispositivo
para que éste le devolviera el valor de M ACK (X). Con esta información en su poder,
podrı́a solicitar al servidor ser autentificado, y lograrı́a suplantar con éxito al dispo-
sitivo.
PGP
El nombre PGP responde a las siglas pretty good privacy (privacidad bastante bue-
na), y se trata de un proyecto iniciado a principios de los 90 por Phil Zimmermann.
La total ausencia por aquel entonces de herramientas sencillas, potentes y baratas que
acercaran la criptografı́a seria al usuario movió a su autor a desarrollar una aplicación
que llenara este hueco.
Con el paso de los años, PGP se ha convertido en uno de los mecanismos más
populares y fiables para mantener la seguridad y privacidad en las comunicaciones,
especialmente a través del correo electrónico, tanto para pequeños usuarios como
para grandes empresas.
Actualmente PGP se ha convertido en un estándar internacional (RFC 2440), lo
cual está dando lugar a la aparición de múltiples productos PGP, que permiten desde
cifrar correo electrónico hasta codificar particiones enteras del disco duro (PGPDisk),
pasando por la codificación automática y transparente de todo el tráfico TCP/IP
(PGPnet).
PGP trabaja con criptografı́a asimétrica, y por ello tal vez su punto más fuerte
sea precisamente la gran facilidad que ofrece al usuario a la hora de gestionar sus
claves públicas y privadas. Si uno emplea algoritmos asimétricos, debe poseer las
claves públicas de todos sus interlocutores, además de la clave privada propia. Con
PGP surge el concepto de anillo de claves (o llavero), que no es ni más ni menos que el
lugar que este programa proporciona para que el usuario guarde todas las claves que
posee. El anillo de claves es un único fichero en el que se pueden efectuar operaciones
1
Algunas implementaciones de PGP emplean otras fuentes de aleatoriedad, como ocurre con
GnuPG, por lo que no necesitan almacenar una semilla aleatoria.
que muchas pasarelas de correo no admiten caracteres por encima de 127, y además
truncan las lı́neas demasiado largas, por lo que podrı́an alterar los mensajes si viajaran
en otro formato.
Como ejemplo incluyo mi clave pública PGP —firmada con la de Kriptópolis—
en formato ASCII:
mQGiBDRkk6kRBADKYHrNnFeXlggr14IVGy6FudLG2Cd1wb3yKOaNnodyjZa0a5oi
Ls9jDfDfEdq8K+W6QBLv06w7oVFPNMYsU+ufb0pa/bHWq6IrHxKkTVH4o4PUYTmH
W0jfGjoXEtAUZ0vp9wYR0Yqi7wXO3L/N5KuVNjLj7rXOT7rOmHsOjmY1cQCg//2w
OcyAnkaDCODFNif/VdowntcD/j5midszzU6M7BWmeDJoqEEGzSuxfmRSNyNZe6/6
5k8TFXIVpB0vnxwsZSh0POSlNgz1cmX6VbEmmUXoYsMRfq7iXHSAZ3DLB333yR2b
QUbkrH5WZF75G2vvTO7rKS5KtmROJ8E+vX/py6PGz1f3tBZJ94KwM787g6j43F4X
IYTAA/9L5GZzClHOGt01BtZkioH5YoHnDGHKC8mMXcykXA5KdJvl+9jGz3InUHiG
04StaMxMcDcWLzL5FVLz3LBzlOXGs7jikgH3BYBI3p7dIExfRADucDHyKL/CpIl5
zqHBI+5bxY3Tysu3UlA1UkQloJMsSInlkkjQhwihNYsj8Avr9LQmTWFudWVsIEx1
Y2VuYSBMb3BleiA8bWx1Y2VuYUB1amFlbi5lcz6IXwQTEQIAIAIXgAIZAQUCScPL
PAYLCQgHAwIEFQIIAwQWAgMBAh4BAAoJEEiyUWFpq1eE8i0AmPtKiqRykOhhSdd0
eErIiEsC0o8An3BGAqEiXHCIGkDjzWKtuG8kojKBtC1NYW51ZWwgTHVjZW5hIExv
cGV6IDxtYW5vbG8ubHVjZW5hQGdtYWlsLmNvbT6IYAQTEQIAIAIbAwIeAQIXgAUC
ScPLTAYLCQgHAwIEFQIIAwQWAgMBAAoJEEiyUWFpq1eEsBMAn1ERLe/GIh2XOGqU
v6G6sgLBvD+UAJ0YLBWgKf7fIVGXpDIS1tU9ZrmEz7QsTWFudWVsIEx1Y2VuYSBM
b3BleiA8bWx1Y2VuYUBhcG9sby51amFlbi5lcz6ISQQwEQIACQUCQnNG3AIdIAAK
CRBIslFhaatXhIuJAKCcWHs5Ss6J2FBTu/P9rp1lBGLNcQCgqOY1TAZ+Hsdl0FMj
fv1SfHBymYC0LU1hbnVlbCBMdWNlbmEgTG9wZXogPG1sdWNlbmFAa3JpcHRvcG9s
aXMuY29tPohJBDARAgAJBQJCc0bJAh0gAAoJEEiyUWFpq1eEaGkAn3MNGfcE0xnA
Nw+XObqX9rNaDyWpAKCEtCwFgtwvUJxJb1N3y1J+a40vSrkCDQQ0ZJRfEAgAw/iG
bTW9OaTyfV4RNZdg1HRDGEyasZdEPCM9ihPkfvQyK44nH13OseaikIYoyoA/BFiW
eTNcHvb/4KOuCK2GnO/p/6ohFcAOK5anEygGrhUUttUw8kYZ0rUBFIJnurtDcxwa
wugbPFv3qA+sn756q7XUxjnTtpou+lWyj6VkN/EvrZDf9E7ikPUqRuIsHzJ5PUwy
pWtXaKg2HfClKkZlYFqzdPDCssrXOfjZDx2q6GSek6Sgj5Ph3X4opoXIx6Cfmp4E
LYmvdmnDu4oe6A6l/XIQ8NNhj+GxdtOgTq8QKDRWl2f6M3pQgPnYzBHoDIqnr/ie
8jK4seDezRPtL1/TlQACAgf+JXw03Q1opLBAaO/WZlcs2SiEzqv+gCkFW9vk2bJb
SY4PQHwiLc0HwcPEDi7jIu9QxJfZcHkax8XgXkCvfFJFFmqgqarIOzXp/BgiYyma
6GVAmXcI6lI9ZSgzPvvaNFGe0/7R6Yroee7nJ/9RyxF89SI++5tZY+/bpLuKAbnX
9SA3PEnUWiHD2ah3cC3VXNrus3lsKA7MEh3q9xnoF/8Z7vwldrKUyLZdaDqSM7is
yI5Fe0PWn/mtW4+7/rjboaY7PGJCAqtn8cHDvByRYCZ8kLRlobQHzL8XN1fsdfBv
6WDNeS9IqBCXcPME7R21wytsi2WMDnYL7rQWU/CgLqFx2Ig/AwUYNGSUX0iyUWFp
q1eEEQL3JACfTfvh6A70A9N2SbnRBmktuRBp9NsAn2ZQbpg0eaeVRuzejA2QM7ld
rz53
=r7oL
Como puede verse, los únicos sı́mbolos empleados son las letras mayúsculas y
minúsculas, los números, y los signos ‘/’y ‘+’; el resto de sı́mbolos y caracteres de
control simplemente será ignorado. Cualquiera podrı́a copiar esta clave pública a
mano (¡!) o emplear una aplicación OCR2 para introducirla en su anillo de claves
correspondiente, aunque es mejor descargarla a través de Internet.
9E2B 9D14 CBCE FE12 16A8 C103 48B2 5161 69AB 5784
Firmar sólo las claves de cuya autenticidad estemos seguros. Es la única manera de
que las redes de confianza puedan funcionar, ya que si todos firmáramos las
claves alegremente, podrı́amos estar certificando claves falsas.
Seguridad en Computadores
Introducción a la Seguridad
Informática
Hay ciertas cosas que un sistema que maneja información no puede permitirse.
Por ejemplo, resultarı́a inaceptable que los datos que introducimos en el mismo su-
frieran alteraciones cuando vamos a recuperarlos, o que fuera posible para terceros
acceder a la información sin permiso. En general, se definen tres propiedades de la
Confidencialidad
Integridad
La integridad garantiza que los datos almacenados en nuestro sistema —o los colo-
camos en un extremo de un canal de comunicaciones—, van a ser exactamente iguales
cuando los recuperemos —o al llegar al otro extremo del canal—. Es fácil imaginar
situaciones en las que una información corrompida o manipulada puede llegar a ser
altamente dañina.
Para garantizar la integridad se emplean desde mecanismos de bajo nivel, que evi-
tan que los datos se pierdan o se corrompan accidentalmente —discos duros RAID,
sistemas de alimentación ininterrumpida—, hasta mecanismos basados en funciones
resumen (capı́tulo 13), códigos CRC, o firmas digitales (capı́tulo 17).
Existen principalmente dos familias de técnicas orientadas a la integridad. La pri-
mera de ellas busca evitar que se produzcan alteraciones en los datos, mientras que
la segunda tiene como objetivo la detección —y eventual corrección— de dichas alte-
raciones.
Disponibilidad
Daño
Ataque
Riesgo
Una vez que hemos definido el concepto de daño, nuestro objetivo será proteger
el sistema frente al mayor número posible de situaciones de este tipo. Sin embargo, la
cantidad de recursos que podremos asignar a esta tarea estará siempre limitada, por
lo que a la hora de priorizar nuestro trabajo tendremos que medir de alguna manera
el peligro asociado a cada situación de daño.
Definiremos el riesgo (R) como el producto entre la magnitud de un daño (d), y la
probabilidad de que éste tenga lugar (pd ):
R = d · pd (19.1)
A la vista de esta definición, es fácil observar que una situación con un elevado
nivel de daño, pero muy poco probable, puede suponer menor riesgo —y, por tanto,
merecer menos atención— que una situación con un nivel de daño moderado, pero
mucho más probable. Siempre y cuando hagamos una buena estimación de los daños
y las probabilidades de que se produzcan, obtendremos unos valores de riesgo útiles.
Amenaza
Vulnerabilidad
Exploit
son publicados como prueba de concepto, para demostrar que una vulnerabilidad
es capaz de dar lugar a un daño determinado. De hecho, es muy habitual encontrar
vulnerabilidades potenciales en los sistemas, que aunque pueden suponer un riesgo,
en realidad se desconoce si son realmente útiles para perpetrar un ataque.
Habitualmente, a las personas que buscan vulnerabilidades en los sistemas, ası́ co-
mo métodos de ataque para aprovecharlas, se les suele denominar genéricamente
hackers. Sin embargo, esta actividad puede realizarse con dos enfoques bien distin-
tos: buscar formas para hacer realmente daño a los sistemas, sin prestar atención a
(o buscando deliberadamente) que sus descubrimientos puedan usarse para delin-
quir —robos, ciberterrorismo, espionaje, etc.—, o bien mejorar los propios sistemas de
seguridad. A los primeros se les llama black hats, mientras que a los segundos se les
conoce como white hats. Si bien la actividad de los white hats resulta positiva e incluso
necesaria para la sociedad, en ocasiones la lı́nea divisoria entre ambas comunidades
resulta demasiado difusa.
Debidas al diseño: Suelen ser las más delicadas, ya que su corrección puede tener
impacto a todos los niveles, complicando el sistema y aumentando los costes de
manera inaceptable, o incluso pueden resultar imposibles de eliminar. Por esta
razón es esencial que los temas de seguridad sean tenidos en cuenta a la hora
de diseñar un sistema informático.
Pensemos, por ejemplo, en un sistema operativo diseñado sin tener en cuenta la
posibilidad de existencia de múltiples usuarios. Esto da en la práctica unos pri-
vilegios excesivos de uso, al no separar las tareas administrativas —que pueden
ser potencialmente dañinas si se realizan mal o de manera maliciosa— de las
actividades diarias, lo cual representa una clara vulnerabilidad. Lo ideal serı́a
modificar el diseño para incorporar esta caracterı́stica, pero eso probablemente
hará que muchos programas escritos para el sistema antiguo dejen de funcionar.
Debidas al uso: De nada sirve tener el mejor sistema de contraseñas del mundo
si luego anotamos nuestra palabra clave en un papelito y lo pegamos al moni-
tor con cinta adhesiva. Aunque suele dejarse de lado en demasiados casos, las
condiciones concretas y los protocolos especı́ficos de utilización de cualquier
sistema informático deben ser diseñados cuidadosamente por un lado, y segui-
dos escrupulosamente por otro. En caso contrario, un sistema bien diseñado e
implementado puede volverse del todo inseguro.
Otra situación muy común, especialmente en el software comercial, es la inclu-
sión, en aras de la usabilidad, de opciones y configuraciones inseguras por defec-
to. Una instalación apresurada o poco cuidadosa del sistema puede por lo tanto
dar lugar a una configuración claramente vulnerable.
Negación de las vulnerabilidades: Afortunadamente, cada vez son menos las em-
presas que niegan ciertas vulnerabilidades en sus productos, e incluso atacan a
quienes las descubren y hacen públicas alegando que violan su propiedad inte-
lectual. Es un hecho que esta inaceptable actitud acaba pasando factura a largo
plazo.
El diseño. Incluimos aquı́ tanto el diseño de cada uno de los elementos hardware y
software que integrarán el sistema, sobre los que en la mayor parte de los casos el
La definición de cómo debe usarse el sistema. Esto implica decidir qué cosas van a
estar permitidas y cuáles no, ası́ como qué elementos deberán ser supervisados,
de qué manera y con qué frecuencia.
Hay que dar por hecho que, tarde o temprano, se van a producir fallos.
Es necesario tener previsto cómo enfrentarse a los problemas, antes de que estos
se manifiesten.
nada sirve ignorar determinados riesgos, dedicar demasiados recursos a los menos
probables, o carecer de un plan de contingencias adecuado.
Definiremos pues, las Expectativas de Seguridad como el funcionamiento real espe-
rado de un sistema, incluyendo los posibles riesgos de seguridad. Por lo tanto, las
polı́ticas de seguridad serán el resultado de documentar las expectativas de seguridad
de un sistema.
Dependiendo del método que se emplee para analizar y documentar las expecta-
tivas de seguridad, las polı́ticas de seguridad pueden ser de dos tipos: procesales o
formales.
La práctica: Definición precisa de cada una de las tareas individuales que cons-
tituyen el procedimiento.
Apéndices
Criptografı́a Cuántica
Estas ideas, que datan de los años 80, se han barajado más bien como simples en-
tretenimientos para mentes inquietas, hasta que a mediados de los 90 se propuso el
primer algoritmo capaz de ser ejecutado en una computadora cuántica. Dicho algorit-
mo podrı́a, de forma eficiente, factorizar números enteros muy grandes. Imagı́nense
las implicaciones que esto tiene para la Criptografı́a moderna, ya que supondrı́a la
caı́da de la gran mayorı́a de los algoritmos asimétricos, que basan su funcionamiento
en el problema de la factorización de grandes enteros, y la necesidad inmediata de
alargar considerablemente las longitudes de claves para algoritmos simétricos. Evi-
dentemente, estos resultados han provocado que mucha gente tome muy en serio este
tipo de computadoras, y que en la actualidad haya importantes grupos dedicados a
la investigación en este campo.
Ayudas a la Implementación
B.1. DES
En el capı́tulo dedicado a algoritmos simétricos por bloques se ha hecho una des-
cripción completa del algoritmo DES, pero se han omitido deliberadamente algunos
detalles que sólo son útiles de cara a la implementación, como pueden ser los valores
concretos de las S-Cajas y de las permutaciones que se emplean en este algoritmo.
B.1.1. S-Cajas
La tabla B.1 representa las ocho S-Cajas 6*4 que posee DES. Para aplicarlas basta
con coger el número de seis bits de entrada b0 b1 b2 b3 b4 b5 , y buscar la entrada corres-
pondiente a la fila b0 b5 , columna b1 b2 b3 b4 . Por ejemplo, el valor de la tercera S-Caja
para 110010 corresponde a la fila 2 (10), columna 9 (1001), es decir, 1 (0001).
B.1.2. Permutaciones
DES lleva a cabo permutaciones a nivel de bit en diferentes momentos. Las tablas
que aquı́ se incluyen deben leerse por filas de arriba a abajo, y sus entradas corres-
Columna
Fila 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 S-Caja
0 14 4 13 1 2 15 11 8 3 10 6 12 5 9 0 7
1 0 15 7 4 14 2 13 1 10 6 12 11 9 5 3 8 S1
2 4 1 14 8 13 6 2 11 15 12 9 7 3 10 5 0
3 15 12 8 2 4 9 1 7 5 11 3 14 10 0 6 13
0 15 1 8 14 6 11 3 4 9 7 2 13 12 0 5 10
1 3 13 4 7 15 2 8 14 12 0 1 10 6 9 11 5 S2
2 0 14 7 11 10 4 13 1 5 8 12 6 9 3 2 15
3 13 8 10 1 3 15 4 2 11 6 7 12 0 5 14 9
0 10 0 9 14 6 3 15 5 1 13 12 7 11 4 2 8
1 13 7 0 9 3 4 6 10 2 8 5 14 12 11 15 1 S3
2 13 6 4 9 8 15 3 0 11 1 2 12 5 10 14 7
3 1 10 13 0 6 9 8 7 4 15 14 3 11 5 2 12
0 7 13 14 3 0 6 9 10 1 2 8 5 11 12 4 15
1 13 8 11 5 6 15 0 3 4 7 2 12 1 10 14 9 S4
2 10 6 9 0 12 11 7 13 15 1 3 14 5 2 8 4
3 3 15 0 6 10 1 13 8 9 4 5 11 12 7 2 14
0 2 12 4 1 7 10 11 6 8 5 3 15 13 0 14 9
1 14 11 2 12 4 7 13 1 5 0 15 10 3 9 8 6 S5
2 4 2 1 11 10 13 7 8 15 9 12 5 6 3 0 14
3 11 8 12 7 1 14 2 13 6 15 0 9 10 4 5 3
0 12 1 10 15 9 2 6 8 0 13 3 4 14 7 5 11
1 10 15 4 2 7 12 9 5 6 1 13 14 0 11 3 8 S6
2 9 14 15 5 2 8 12 3 7 0 4 10 1 13 11 6
3 4 3 2 12 9 5 15 10 11 14 1 7 6 0 8 13
0 4 11 2 14 15 0 8 13 3 12 9 7 5 10 6 1
1 13 0 11 7 4 9 1 10 14 3 5 12 2 15 8 6 S7
2 1 4 11 13 12 3 7 14 10 15 6 8 0 5 9 2
3 6 11 13 8 1 4 10 7 9 5 0 15 14 2 3 12
0 13 2 8 4 6 15 11 1 10 9 3 14 5 0 12 7
1 1 15 13 8 10 3 7 4 12 5 6 11 0 14 9 2 S8
2 7 11 4 1 9 12 14 2 0 6 10 13 15 3 5 8
3 2 1 14 7 4 10 8 13 15 12 9 0 3 5 6 11
Permutación Inicial Pi
58 50 42 34 26 18 10 2 60 52 44 36 28 20 12 4
62 54 46 38 30 22 14 6 64 56 48 40 32 24 16 8
57 49 41 33 25 17 9 1 59 51 43 35 27 19 11 3
61 53 45 37 29 21 13 5 63 55 47 39 31 23 15 7
Permutación Final Pf
40 8 48 16 56 24 64 32 39 7 47 15 55 23 63 31
38 6 46 14 54 22 62 30 37 5 45 13 53 21 61 29
36 4 44 12 52 20 60 28 35 3 43 11 51 19 59 27
34 2 42 10 50 18 58 26 33 1 41 9 49 17 57 25
Cuadro B.2: Permutaciones Inicial (Pi ) y Final (Pf ) del algoritmo DES.
ponden al número de bit del valor inicial (empezando por el 1) que debe aparecer
en la posición correspondiente. Por ejemplo, la primera tabla de B.2 lleva el valor
b1 b2 b3 . . . b64 en b58 b50 b42 . . . b7 .
La tabla B.2 contiene las permutaciones inicial y final Pi y Pf del algoritmo DES.
La primera de ellas se lleva a cabo justo al principio, antes de la primera ronda, y la
segunda se aplica justo al final. Nótese que cada una de estas permutaciones es la
inversa de la otra.
Función f
Generación de las Ki
Permutación E
32 1 2 3 4 5
4 5 6 7 8 9 8 9 10 11
12 13 12 13 14 15
16 17 16 17 18 19 20 21 20 21
22 23 24 25 24 25
26 27 28 29 28 29 30 31 32 1
Permutación P
16 7 20 21 29 12 28 17 1 15 23 26 5 18 31 10
2 8 24 14 32 27 3 9 19 13 30 6 22 11 4 25
Permutación EP1
57 49 41 33 25 17 9 1 58 50 42 34 26 18
10 2 59 51 43 35 27 19 11 3 60 52 44 36
63 55 47 39 31 23 15 7 62 54 46 38 30 22
14 6 61 53 45 37 29 21 13 5 28 20 12 4
Permutación EP2
14 17 11 24 1 5 3 28 15 6 21 10 23 19 12 4
26 8 16 7 27 20 13 2 41 52 31 37 47 55 30 40
51 45 33 48 44 49 39 56 34 53 46 42 50 36 29 32
Una vez que tengamos implementado nuestro algoritmo DES, conviene asegurar-
se de que funciona adecuadamente. Se incluyen en esta sección algunos valores de
prueba, que contienen todos los datos intermedios que se emplean en el algoritmo,
para que el lector pueda compararlos y asegurarse de que su programa es correcto.
Los datos están representados en hexadecimal, de izquierda a derecha.
Subclaves
Clave : 0123456789ABCDEF
-----
Clave : 23FE536344578A49
Codificación
-----
-----
Decodificación
-----
-----
B.2. IDEA
Incluimos ahora valores de prueba para el algoritmo IDEA, tanto para las claves
intermedias Zi de codificación y decodificación, como para los valores de las Xi en
cada ronda. Los datos, al igual que en el caso de DES, están representados en he-
xadecimal. Nótese que la interpretación numérica de cada registro de 16 bits es, a
diferencia de algoritmos como MD5, de tipo big endian. Esto significa que el primer
byte en la memoria es el más significativo.
Subclaves
-----
-----
Codificación
Codificando con Clave: 0123 4567 89AB CDEF 0123 4567 89AB CDEF
X1 X2 X3 X4
Texto Claro: 0000 0000 0000 0000
Ronda 1 : 101C 6769 FD5D 8A28
Ronda 2 : 5F13 2568 288F 1326
Ronda 3 : BA0B A218 1F43 D376
Ronda 4 : 700D 8CE7 C7EE 4315
Ronda 5 : 7EC9 402F 8593 58EE
Ronda 6 : 478C FFA0 EBFF 2668
Ronda 7 : 348A 5D2B DFD1 E289
Ronda 8 : 5500 73E7 FAD6 5353
Resultado : EC29 65C9 EFA7 4710
-----
Codificando con Clave: 6382 6F7E 8AB1 0453 BFED 93DC D810 9472
X1 X2 X3 X4
Texto Claro: 0123 4567 89AB CDEF
Ronda 1 : 14E6 1CEF 9EE7 5701
Ronda 2 : E7A7 30E6 FFE5 B63C
Ronda 3 : 79A2 D4C4 EDCA 4B56
Ronda 4 : 095B 4ACF B0B8 B584
Ronda 5 : C6B0 D5D9 CCF4 C359
Ronda 6 : 4FB9 7BFD BF7A BB4E
Ronda 7 : 8219 6501 11EB B6EC
Ronda 8 : F2A5 C848 9746 6910
-----
Codificando con Clave: 1111 2222 3333 4444 5555 6666 7777 8888
X1 X2 X3 X4
Texto Claro: 6E63 7F8A 8B8C 8394
Ronda 1 : B370 EDF7 C835 49A3
Ronda 2 : E798 CE57 118E 94EA
Ronda 3 : 6A74 FE29 618B 52D9
Ronda 4 : 8C64 BCB9 5E6C 0DE6
Ronda 5 : 1DE0 615A FB09 D5CD
Ronda 6 : 1872 CF37 E332 557B
Ronda 7 : A47C 34B1 F343 A473
Ronda 8 : C87D F1BD 131B 6E87
Resultado : A16D DFEC 02D2 1B16
Decodificación
Decodificando con Clave: 0123 4567 89AB CDEF 0123 4567 89AB CDEF
X1 X2 X3 X4
Texto Cifrado: 0000 0000 0000 0000
Ronda 1 : 39EB 36B0 E85D 3959
Ronda 2 : 9FDD 04DB B915 178F
Ronda 3 : C190 33CE 5D6F D44F
Ronda 4 : 3AB1 172A CDBE 744D
Ronda 5 : B874 B1F9 2D7B 9A42
Ronda 6 : 4A76 9475 6BA5 B114
Ronda 7 : BFB0 1DD6 83A0 F4A3
Ronda 8 : 02DE 8519 C980 CBD8
Resultado : DCD3 8419 FB6E A1E1
-----
Decodificando con Clave: 6382 6F7E 8AB1 0453 BFED 93DC D810 9472
X1 X2 X3 X4
Texto Cifrado: 0123 4567 89AB CDEF
Ronda 1 : 4490 2B63 85DB 5A10
Ronda 2 : 61D8 C3DB 881D 2404
-----
Decodificando con Clave: 1111 2222 3333 4444 5555 6666 7777 8888
X1 X2 X3 X4
Texto Cifrado: 6E63 7F8A 8B8C 8394
Ronda 1 : F4C7 EB12 C708 F851
Ronda 2 : 19DF 90E0 E5F2 B16B
Ronda 3 : 6C8A 4D53 8F75 C3EB
Ronda 4 : 497E BA5D E167 26BB
Ronda 5 : C558 D308 3327 BA26
Ronda 6 : 9114 9FD0 784A 2A59
Ronda 7 : 8C36 FE0F D3B9 420F
Ronda 8 : E658 1F85 E165 736D
Resultado : 4073 BF43 EC52 8795
B.3. AES
Para el algoritmo AES vamos a representar, en primer lugar, los conjuntos de sub-
claves Ki para ejemplos de claves de cifrado de 128, 192 y 256 bits respectivamente.
Cada subclave se ha representado como un conjunto de números hexadecimales de
ocho dı́gitos, cada uno de los cuales corresponderı́a a una columna de la matriz de
clave (ver cuadro 10.5, en la página 154), de forma que los dos primeros dı́gitos del
primer número corresponden al valor k0,0 , los dos siguientes a k1,0 , y ası́ sucesiva-
mente
Subclaves de cifrado:
K00 : 67452301 EFCDAB89 67452301 EFCDAB89
K01 : C09A9E62 2F5735EB 481216EA A7DFBD63
Subclaves de cifrado:
K00 : 76F46587 E794855A 69D83546 3284B750
K01 : 5A3656C7 0E6D3215 2F5F59A5 C8CBDCFF
K02 : A113E9B9 93975EE9 C9A1082E C7CC3A3B
K03 : CD991227 0552CED8 A4412761 37D67988
K04 : FE7771A6 39BB4B9D 938BF890 96D93648
K05 : 32981129 054E68A1 FB391907 C282529A
K06 : 2BAEEB98 BD77DDD0 8FEFCCF9 8AA1A458
K07 : 7198BD5F B31AEFC5 8DC34957 30B49487
K08 : BF5B587E 35FAFC26 44624179 F778AEBC
K09 : E8ABF593 D81F6114 6744396A 52BEC54C
K10 : 16DC8435 E1A42A89 4F53BC36 974CDD22
K11 : F008E448 A2B62104 B46AA531 55CE8FB8
K12 : 23AF37C5 B4E3EAE7 44EB0EAF E65D2FAB
Clave : 8765F4765A8594E74635D86950B78432
C756365A15326DE012345678E214320A (256 bits)
Total rondas : 14
Subclaves de cifrado:
K00 : 76F46587 E794855A 69D83546 3284B750
K01 : 5A3656C7 E06D3215 78563412 0A3214E2
K02 : EE93467C 0907C326 60DFF660 525B4130
K03 : 5A0FD5C3 BA62E7D6 C234D3C4 C806C726
K04 : 197B29B8 107CEA9E 70A31CFE 22F85DCE
K05 : C94E9948 732C7E9E B118AD5A 791E6A7C
K06 : 09CD5BBE 19B1B120 6912ADDE 4BEAF010
K07 : 7AC91582 09E56B1C B8FDC646 C1E3AC3A
CIFRADO:
Bloque : 7563957A 7C6E9274 6E87F937 A2F4AB04 (128 bits)
Ronda 01 : 201D4467 70B06937 8FBFA93C 1D4757CF
Ronda 02 : 0486AEC2 951CEAA5 87BCD35D CE92939C
Ronda 03 : EDEF12D7 E6C5DB1E E2E45A51 8D1F89E9
Ronda 04 : C398674B C9822958 E84F1592 0C4556C0
Ronda 05 : C707CA8E A5C9F7EE C2BB119F D177A68A
Ronda 06 : D4D13E6C 46952EB2 F24BAAEC 6D5929FE
Ronda 07 : 508F2AEF 746D34C0 D13BF25D 288DCBBA
Ronda 08 : E500843A 4302ADE4 5E7E684E DE924E02
Ronda 09 : 5585CDD0 43ADC584 1B81F49C 1EBB3594
Ronda 10 : 74B460BC 4496A083 BDBF6D1A 5B297D80
Cifrado : 74B460BC 4496A083 BDBF6D1A 5B297D80
DESCIFRADO:
CIFRADO:
Bloque : 7563957A 7C6E9274 6E87F937 A2F4AB04 (128 bits)
Ronda 01 : 160FB8C4 526A9EC9 D0AFCB25 70621BF8
Ronda 02 : 6FCAABF7 D15A8F7D 9A5EDF3E 37A5BC37
Ronda 03 : B1FE1D21 418746AA 9DCA21F6 FA2C13FA
Ronda 04 : C4A63E0D 9C5AAA4F B71F18E7 DCDA3D84
Ronda 05 : 3AD99ABB AD937C2E 81572FED D9E7C4E8
Ronda 06 : 726C6E54 FA30A491 CF114FD5 289E7E5A
Ronda 07 : E9DC1656 D1F328F5 5BEEFF85 55D84773
Ronda 08 : CCE9EE83 33D87F86 099585FE 6D8EC86F
Ronda 09 : 99765788 F3391287 2F36C0DD 7F13F5B7
Ronda 10 : D732AFDE BED82C86 D7A9B478 DDFE7792
Ronda 11 : 35EBB790 C52B1D57 C609E1EC 8927113C
Ronda 12 : 53C657C8 41EB61D4 1BC2421F 0CC6F928
Cifrado : 53C657C8 41EB61D4 1BC2421F 0CC6F928
DESCIFRADO:
Clave : 8765F4765A8594E74635D86950B78432
C756365A15326DE012345678E214320A (256 bits)
CIFRADO:
Bloque : 7563957A 7C6E9274 6E87F937 A2F4AB04 (128 bits)
Ronda 01 : 160FB8C4 526A9E27 67C2C272 6DAAE23A
DESCIFRADO:
B.4. MD5
En esta sección detallaremos todos los valores intermedios que se obtienen al apli-
car el algoritmo MD5 a cuatro ejemplos diferentes. El primer campo es la cadena que
se va a procesar, excluyendo las comillas. El segundo es el bloque de 512 bits de
entrada —todos los ejemplos que se han incluido producen un único bloque— escri-
to en hexadecimal, que dicha cadena genera, en el que se puede apreciar cómo tras
los códigos ASCII correspondientes aparece el valor 80, es decir, un uno seguido de
ceros, y cómo los últimos 64 bits —correspondientes a los dieciséis últimos dı́gitos
hexadecimales— representan la longitud total, en bits, de la cadena. Seguidamente,
se especifican los valores de los registros a, b, c y d que se obtienen en cada paso, y
para terminar se da el resultado final de 128 bits, en formato hexadecimal. Nótese
que, en este caso, la representación como valores enteros de los registros de 32 bits es
de tipo little endian, es decir, que el byte que primero aparece en el bloque es el menos
significativo del valor entero correspondiente.
B.5. SHA-1
Se incluyen aquı́ los valores intermedios del algoritmo SHA-1 para las mismas
cuatro cadenas de la sección anterior. Recordemos que en este caso el orden de los
bytes a la hora de representar enteros es big endian, de forma que, por ejemplo, en la
representación de la longitud b del mensaje total el último byte es el menos significa-
tivo.
[1] Bruce Schneier. Applied Cryptography. Second Edition. John Wiley & sons, 1996.
[2] Alfred J. Menezes, Paul C. van Oorschot y Scott A. Vanstone. Handbook of Applied
Cryptography. CRC Press, 1996.
[4] Wikipedia.
http://www.wikipedia.org
[5] Juan Manuel Velázquez y Arturo Quirantes. Manual de PGP 5.53i. 1998.
Variable Aleatoria, 44
Vector de Inicialización, 161
Ventana de Exposición, 262
Vernam, Cifrado de, 167
Vigenère, Cifrado de, 130
VPN, Virtual Private Network, 225
Vulnerabilidad, 258
Vulnerabilidades
Detección de, 261
Identificación de, 259
Tipos de, 260
Watermarking, 213
White Hat, 259