5BRoberto Torretti 5D El Paraiso de Can

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 605

El฀Paraíso฀de฀Cantor

El฀ Par aíso฀ de฀ CANtor


La฀ tr adición฀ conjuntista
en฀la฀filosofía฀matemática

Roberto฀Torretti
© Roberto Torretti, 1998
A JOAQUÍN CORDUA Y ENRIQUE DʼÉTIGNY
SUMARIO

Prefacio xi .....................................................................................................
1 CONJUNTOS
1.1 La palabra ʻconjuntoʼ en la matemática del siglo XX ..............1
1.2 ʻConjuntoʼ (ʻMengeʼ) en el vocabulario de Cantor ...................7
1.3 Series trigonométricas ...............................................................13
1.4 Diversos infinitos .......................................................................21
1.5 Aritmética transfinita .................................................................29
1.6 Paradojas y filosofemas .............................................................49
1.7 El Teorema del Buen Orden y el Axioma de Selección .......63
1.8 Axiomas para una teoría de conjuntos .....................................71
1.8.1 Zermelo (1908) ......................................................................71
1.8.2 ¿Qué está ʻbien definidoʼ? ....................................................80
1.8.3 El Axioma de Reemplazo .....................................................87
1.8.4 Aportes de von Neumann .....................................................90
1.8.5 Zermelo (1930) ....................................................................102

2 CÁLCULOS
2.1 El programa de Hilbert ........................................................... 115
2.2 Escritura conceptual.................................................................129
2.3 Fundamentos de la aritmética .................................................145
2.3.1 Peano (1889)........................................................................145
2.3.2 Dedekind (1888) ..................................................................151
2.3.3 Frege (1884) ........................................................................159
2.4 La teoría de los tipos lógicos .................................................177
2.5 Aritmética finitista ................................................................... 211
2.6 Pruebas de consistencia ...........................................................219
2.6.1 Ackermann (1925) ...............................................................219
2.6.2 Von Neumann (1927) ..........................................................232
2.6.3 Herbrand (1931b) ................................................................241
2.7 El Entscheidungsproblem y el Teorema de Herbrand ...........247
Sumario viii

2.8 El cálculo predicativo de primer orden es completo.............273


2.9 El programa de Hilbert visto más de cerca ...........................295
2.9.1 Axiomatización y formalización .........................................295
2.9.2 Balbuceos formales (Hilbert 1904) ....................................297
2.9.3 Teoría de la prueba .............................................................304
2.9.4 La investigación de la consistencia de la matemática
formalizada, a la luz del descubrimiento de Gödel ..........316
2.10 Los Teoremas de Incompletud de Gödel ...............................321
2.10.1 Preliminares .........................................................................321
2.10.2 La incompletud de la aritmética .........................................326
2.10.3 La indemostrabilidad de la consistencia ............................354
2.11 Funciones computables ..........................................................359
2.11.1 Funciones recursivas generales ...........................................361
2.11.2 La Tesis y el Teorema de Church ......................................369
2.11.3 Las máquinas de Turing .....................................................381
2.11.4 Diagramas y ejemplos .........................................................383
2.11.5 Demostración de resultados ................................................407
2.12 Consistencia de la aritmética: la prueba de Gentzen ............421
2.12.1 Un cálculo aritmético ..........................................................423
2.12.2 Reducciones .........................................................................429
2.12.3 Orden de las derivaciones e inducción transfinita.............441

APÉNDICES
I Las definiciones cantorianas de ʻconjunto bien ordenadoʼ ...........459
II Más sobre el buen orden ................................................................461
III La cardinalidad de la segunda clase de ordinales .........................463
IV El argumento de Burali-Forti..........................................................465
V La segunda demostración del Teorema del Buen Orden
(Zermelo 1908) ................................................................................468
VI Los axiomas de Zermelo (1908a) ..................................................471
VII Independencia del Axioma de Selección (Fraenkel 1922a) ..........472
VIII Definición por inducción transfinita (von Neumann 1928) ..........476
IX El cálculo predicativo .....................................................................480
X Axiomas de la lógica (Frege 1879) ...............................................502
XI Definiciones recursivas (Dedekind 1888) ......................................504
XII Extensión y recorrido (Frege 1891, 1893a) ...................................509
Sumario ix

XIII Fórmulas prenexas ...........................................................................516


XIV El cálculo de predicados monádicos es decidible .........................522
XV El cálculo proposicional es completo ............................................525
XVI Una forma abstracta del Primer Teorema de
Incompletud de Gödel (Smullyan 1992) ........................................527
XVII Números de Gödel: Una alternativa ...............................................529
XVIII Los axiomas del cálculo de primer orden investigado por
Gödel (1930) son derivables en el cálculo de secuentes
propuesto por Gentzen (1938) ........................................................531
XIX Algunas ideas de Brouwer ..............................................................535

GLOSARIO .................................................................................................541
OBRAS CITADAS ......................................................................................551
ABREVIATURAS Y SÍMBOLOS .............................................................573
ÍNDICE DE PERSONAS Y CONCEPTOS ..............................................575
PREFACIO

En los siglos XIX y XX la matemática prolifera y florece como quizás ningún


otro quehacer del espíritu. Movidos por la misma riqueza y audacia de sus
invenciones, algunos matemáticos notables se ponen a reflexionar sobre la
naturaleza y alcance de su actividad. Su reflexión es lo que se llama filosófica,
y así la entienden; pero la conducen como matemáticos que son, aunando
libertad y rigor, fantasía ubérrima y precisión pedante, en el estilo propio de
su disciplina. Esta filosofía matemática de la matemática existe de dos mane-
ras. Por una parte, hay una corriente más o menos unitaria de pensamiento
que ejerce una enorme influencia sobre la investigación matemática y ha
llegado a dominar la enseñanza universitaria. Esta corriente se autodenomina
“clásica”, pero la llamaré “conjuntista” porque coloca al centro de la mate-
mática, en una forma u otra, la noción de conjunto y trabaja en fortalecerla.
Iniciada por Dedekind (1831-1916) y Cantor (1845-1918), incorpora logros
de Frege (1848-1925), Peano (1858-1932), Whitehead (1861-1947) y Russell
(1872-1970), y recibe aportes de Hilbert (1862-1943), Zermelo (1871-1953),
Tarski (1902-1983), von Neumann (1903-1957), Gödel (1906-1978), Gent-
zen (1909-1945), y muchos otros. Por otra parte, están los adversarios del
conjuntismo —ilustres matemáticos como Kronecker (1823-1891), Poincaré
(1854-1912), Brouwer (1881-1955) y Weyl (1885-1955), filósofos como
Wittgenstein (1889-1951) y Lorenzen (1915-1994)— que impugnan con
poderosas razones sus ideas y prácticas más arraigadas, sin que la masa de
los matemáticos les preste mucha atención.
Este libro es una historia razonada de la tradición conjuntista, desde los
primeros escritos de Cantor hasta la publicación de los teoremas de Cohen
(1963) y su impacto inmediato. Hago una que otra alusión a Kronecker y
me ocupo, cuando hace falta, de Poincaré, pero la importante oposición de
Brouwer y Weyl sólo la menciono al paso, sin analizarla, porque el propio
Hilbert, que explícitamente define su empresa filosófica como una defensa de
las matemáticas contra ellos, no se dio el trabajo de estudiarlos. Con todo,
para el lector curioso, explico brevemente en el Apéndice XIX algunas ideas

xi
Prefacio xii

de Brouwer que preceden y motivan la declaración de guerra de Hilbert. En


cambio, no me ha parecido oportuno examinar en el presente contexto la
fundamentación constructivista del análisis, propuesta inicialmente por Weyl
(1918), poco antes de su conversión al brouwerismo, y desarrollada mucho
más tarde por Lorenzen (1965) y Bishop (1967).
El libro consta de tres partes, correspondientes a tres etapas en la historia
del conjuntismo. El presente volumen contiene las partes 1 y 2. La parte 3
todavía no está escrita. La parte 1, titulada “Conjuntos”, se refiere a la fun-
dación de la teoría de conjuntos por Cantor, las paradojas que se le enrostran,
y la axiomatización de la teoría por Zermelo (1908) y sus continuadores. La
parte 2, titulada “Cálculos” gira en torno al programa de Hilbert para darle
a la teoría de conjuntos un fundamento intuitivo incontestable, garantizando
así a los matemáticos el disfrute del paraíso que —según frase del mismo
Hilbert— Cantor ha creado para ellos. Estudia los antecedentes de dicho
programa en las obras de Frege, Peano, Dedekind, Russell y Whitehead, y
Skolem; su desarrollo en la década de 1920 por Hilbert y sus seguidores; y
el inesperado escollo que le salió al encuentro con los hallazgos de Gödel.
La parte 3, “Modelos”, examinará la contribución al conjuntismo de los
métodos semánticos introducidos desde 1930 por Gödel y Tarski.
Pienso que el libro puede servir como introducción histórica al tema.
Para leerlo, no es preciso tener conocimientos previos al respecto, pero sí
el hábito de leer definiciones y demostraciones matemáticas. Cualquiera que
haya seguido cursos universitarios de matemáticas por más de un año tiene
ese hábito en la medida requerida aquí. Por otra parte, creo que una persona
acostumbrada a leer prosa filosófica puede adquirirlo directamente en este
mismo libro. Supongo, sí, que el lector filósofo que se interese en él habrá
hecho estudios de lógica. Por otra parte, confío en que el lector con educa-
ción matemática pero sin estudios de lógica podrá extraer del Apéndice IX
(pp. 480-502) toda la información requerida.
En general explico cada término técnico la primera vez que lo uso. (El
índice analítico permitirá ubicar rápidamente tales explicaciones). Pero la
terminología lógica se presenta sistemáticamente en el Apéndice IX, y en el
Glosario que sigue a los apéndices defino algunos términos de uso común
entre los matemáticos, que los lectores que vienen de la filosofía tal vez
desconocen (estos términos se señalan con una †). Con rarísimas excepcio-
nes, expresamente señaladas, me atengo a la terminología estándar, aunque
Prefacio xiii

no me parece afortunada en todos los casos. Si las investigaciones lógico-


matemáticas a que se refiere este libro hubiesen sido conducidas principal-
mente por personas de habla castellana, con seguridad estaríamos usando
términos más eufónicos o elocuentes. Tal como han sido las cosas, tenemos
que arreglárnoslas con palabras tan feas como ʻcompletudʼ (para nombrar la
propiedad de ser o estar completo) o tan opacas como ʻconsistenciaʼ (para
decir ausencia de contradicción).
Las referencias bibliográficas se dan en forma abreviada. Las abreviaturas
se explican en la lista de obras citadas que va al final. Constan, generalmente,
del nombre del autor y el año de publicación. Cuando se cita más de una
obra de un autor aparecida en el mismo año, la segunda, tercera, etc., se
distinguen con las letras ʻaʼ, ʻbʼ,… Cuando el año de la edición citada no
informa sobre la cronología de la obra, la referencia abreviada contiene, en
vez de la fecha, una sigla alusiva al título.

El libro se publica con el patrocinio de la Universidad Nacional Andrés


Bello. Estoy muy agradecido a esta Universidad, y especialmente al Rector
Joaquín Barceló, por su decisivo apoyo. Agradezco también a la Editorial
Universitaria y en particular al editor, Sr. Braulio Fernández, por su interés
en la pronta aparición del libro.
Escribí un borrador, muy próximo ya al presente texto, entre 1990 y 1994,
cuando aún ocupaba una cátedra de filosofía en el Recinto de Río Piedras
de la Universidad de Puerto Rico. Hago público aquí mi agradecimiento al
Rector y la Junta Universitaria por la liberalidad con que me concedieron el
tiempo necesario para este proyecto. Doy asimismo las gracias a las bibliote-
carias y bibliotecarios del Recinto que adquirieron y catalogaron de urgencia
publicaciones nuevas que me hacían falta, hicieron venir en préstamo desde
bibliotecas del continente otras ya agotadas, y con invariable amabilidad y
diligencia atendieron a mi voraz demanda de fotocopias.
Jorge López Fernández, Francisco Rodríguez Consuegra y Matthias Schirn
leyeron el susodicho borrador y propusieron importantes mejoras. Atendiendo
a las indicaciones de Rodríguez Consuegra redacté nuevamente buena parte
del capítulo sobre la teoría de los tipos de Russell (§ 2.4), y siguiendo el
consejo de Schirn amplié bastante —aunque no tanto, quizás, como él que-
ría— la discusión filosófica del programa de Hilbert (§ 2.9). Doy aquí las
gracias a estos buenos amigos por su valiosa ayuda. Como ninguno de ellos
xiv

ha visto la versión final, no puede caberles responsabilidad alguna por los


errores que todavía contiene.
Este libro, al igual que otros que he publicado anteriormente, no habría
sido posible sin el apoyo continuo de Carla Cordua. Por la índole del texto,
esta vez fueron pocos los pasajes que le infligí a medio redactar, pidiéndole
que me puliera el estilo. Pero es claro que, de no ser por ella, todo este
trabajo no me hubiera valido la pena.
Aunque mi afición a la filosofía de las matemáticas (y la física) data de
los años cuarenta, no habría alcanzado nunca la intensidad que se advertirá
en estas páginas, si Enrique dʼÉtigny y Joaquín Cordua no hubieran tenido
la idea de llevarme, en los años sesenta, a enseñar filosofía a la Facultad de
Ciencias Físicas y Matemáticas de la Universidad de Chile. En recuerdo de
esos buenos tiempos, les dedico el libro, con gratitud y afecto.

Santiago de Chile, 31 de mayo de 1998.


1

CONJUNTOS
1.1 LA PALABRA ʻCONJUNTOʼ
EN LA MATEMÁTICA DEL SIGLO XX

La palabra ʻconjuntoʼ (alemán, ʻMengeʼ; francés, ʻensembleʼ; inglés, ʻsetʼ)


figura destacadamente en la literatura matemática contemporánea. Los cur-
sos y manuales universitarios suelen presentar su respectivo campo como
una especie de “conjuntos”, caracterizada por ciertas condiciones que han
de cumplir los “elementos” —por lo demás indeterminados— de cualquier
“conjunto” de esa especie, o de ciertos otros “conjuntos” generados desde
él mediante operaciones estándar. El estudio de ese campo consiste entonces
en determinar las consecuencias de tales condiciones generales, o de otras,
más estrechas, mediante las cuales se caracterizan una o más subespecies
interesantes de la especie inicial.1
Aunque los matemáticos ceden de buen grado a la tentación de usar pala-
bras corrientes del idioma en acepciones peculiarísimas inventadas por ellos,
parece que toman la palabra ʻconjuntoʼ en su significado habitual o, en todo
caso, en uno muy próximo a éste.2 Salvo por las dos excepciones que co-
mentaré en los próximos párrafos, la palabra ʻconjuntoʼ normalmente designa
en la literatura matemática una colección de objetos de cualquier clase —los

1 Véanse en el Glosario las definiciones de ʻespacio topológicoʼ, ʻgrupoʼ, ʻgrupo abelianoʼ.


En lo sucesivo, el símbolo † a continuación de una palabra, o al comienzo y al final
de una expresión, sirve para advertir que esa palabra o expresión está explicada en el
Glosario.
2 En su útil Introducción filosófica a la teoría de conjuntos (1990), Stephen Pollard
combate este parecer. Según él, “es una locura” suponer que los conjuntos de los
matemáticos son objetos familiares a todo el mundo (p. 12) y la creencia de que “el
desarrollo de la teoría matemática de conjuntos ha sido significativamente influenciado
por nociones tomadas directamente del pensamiento cotidiano” es un “mito” (p. 14).
Como reacción contra la manía pedagógica de enseñarle teoría de conjuntos a los
párvulos estas aseveraciones de Pollard son muy comprensibles, pero pervierten los
hechos. El geómetra que habla del grupo formado por el conjunto de las simetrías
del cubo y el aficionado a la música que habla de tal o cual conjunto instrumental no
emplean la palabra ʻconjuntoʼ en acepciones radicalmente diferentes.

1
2 El Paraíso de Cantor

elementos del conjunto— reunidos en la realidad o en el pensamiento del


estudioso. ʻObjetoʼ debe entenderse aquí en el sentido más amplio posible,
sin hacer diferencias entre lo real y lo imaginario, o entre lo sustancial y lo
accidental. La reunión de tales o cuales elementos en un mismo conjunto
puede fundarse en una propiedad común o en una relación entre ellos, pero
no tiene que ser así. El conjunto de las tres virtudes teologales es sin duda
más interesante, pero no más legítimo, matemáticamente hablando, que aquél
cuyos elementos son el perro de Las Meninas, el Peñón de Gibraltar y la raíz
cuadrada de 2. La identidad de un conjunto depende total y exclusivamente
de la identidad de sus elementos, la cual tiene que estar cabal y exactamente
determinada para que el conjunto esté definido. Esencial es que el conjunto
formado reuniendo determinados objetos constituya a su vez un objeto —en
el amplio sentido indicado— y pueda, por lo tanto, entrar como elemento
en un nuevo conjunto.3 Los matemáticos distinguen, sí, entre los elementos
contenidos en un conjunto y las partes (subconjuntos) incluidas en él. Por
definición, x es parte de y si y sólo si todo elemento z de x es también un
elemento de y (simbólicamente: x ⊆฀ y ↔฀ (z ∈฀ x → z ∈ y)). Obsérvese que
según esta definición todo conjunto es una parte de sí mismo, y ⊆฀ y. Si x
⊆฀ y pero x ≠฀ y decimos que x es una parte propia de฀ y (simbólicamente: x
⊂฀ y). En la conversación ordinaria no distinguiríamos con tanto celo entre
ʻcontener un elementoʼ e ʻincluir una parteʼ, pero, una vez que se lo explica,
el distingo ciertamente parece razonable.
Paso a describir las dos excepciones a que aludí. Consíderese un con-
junto con, digamos, cuatro elementos, a, b, c y d. Conforme a la práctica
usual lo llamaré el conjunto {a,b,c,d}. Los conjuntos {b,c} y {b,c,d} son
obviamente partes de {a,b,c,d}. El complemento de {b,c} en {a,b,c,d} es
el conjunto {a,d} formado al quitar de {a,b,c,d} los elementos de {b,c}
(simbólicamente: {a,b,c,d}\{b,c} = {a,d}). ¿Cuál es el complemento de

3 Como se puede ver, la noción matemática de conjunto nada tiene que ver con la no-
ción lógica de clase o extensión de un concepto. Contrastando esta última con lo que
Schröder llamó ʻdominioʼ (Gebiet) —y que corresponde casi exactamente a nuestra
noción de ʻconjuntoʼ— Frege (1895, p. 455) escribe: “Considero fallido el intento de
basar la extensión del concepto como clase no sobre el concepto sino sobre los objetos
individuales. […] La extensión de un concepto no consta de los objetos que caen
bajo el concepto, como un bosque de árboles, sino que tiene en el concepto mismo su
único sostén (Halt). Así, el concepto tiene primacía lógica sobre su extensión.”
1.1 La palabra ʻconjuntoʼ 3

{b,c,d} en {a,b,c,d}? Para el matemático la respuesta natural es {a}, el


conjunto cuyo único elemento es a. Tal respuesta desafía el uso ordinario
del castellano, que respetábamos hasta hace un momento, cuando decíamos
que un conjunto era una colección de objetos (así, en plural). Por otra parte,
hablar de conjuntos de un solo elemento o conjuntos unitarios (como diré
en lo sucesivo) no es un abuso de lenguaje muy grave y tiene la ventaja
de permitirnos definir la complementación (esto es, la operación de tomar
el complemento) como una †operación algebraica† sobre el conjunto de las
partes de un conjunto dado.
La segunda excepción es más inquietante: la matemática contemporánea
acepta unánimemente un objeto al que llama “conjunto” pero que no tiene
elementos: el conjunto vacío, designado por el símbolo ∅. Es evidente que, si
∅ existe, está incluido en todos los conjuntos (puesto que, si x es un conjunto
cualquiera, no hay ningún elemento de ∅ que no sea a la vez un elemento
de x). Este resultado, en virtud del cual todos los conjuntos, por heterogé-
neos que sean, incluyen una “parte” común, exacerba la desconfianza que
inspira al sano sentido común la idea misma de un conjunto sin elementos.
Me parece que el principal motivo que induce a los matemáticos a aceptar
el conjunto vacío ∅ es algebraico: en presencia de ∅ —y sólo gracias a
ella— es posible conferir la estructura de un †álgebra de Boole† al conjunto
de las partes de un conjunto cualquiera K (en adelante, PK). Consideremos
la operación de intersección que asigna a dos conjuntos cualesquiera el con-
junto de los elementos comunes a ambos. Volviendo a nuestro ejemplo del
conjunto {a,b,c,d}, comprobamos que la intersección de sus partes {b,c} y
{a,c,d} es el conjunto unitario {c}, que también es una parte de {a,b,c,d}
(simbólicamente: {b,c} ∩ {a,c,d} = {c}). ¿Cuál es, empero, la intersección
de dos partes disjuntas de {a,b,c,d} (esto es, de dos partes que no tienen
un elemento común)? ¿Diremos que la ecuación x = {b,c} ∩ {a,d} no tiene
solución? ¿que la intersección no está definida sobre pares disjuntos? Eso
es lo que diría, seguramente, cualquier persona sin educación matemática.
Pero el matemático puede eludir esta incómoda irregularidad gracias a que
acepta la existencia del conjunto sin elementos ∅, el cual por definición
es parte de cualquier conjunto y constituye la intersección de cualquier par
de conjuntos disjuntos. La matemática había dado ya pasos aparentemente
mucho más audaces cuando aceptó la existencia de soluciones para ciertas
ecuaciones numéricas tales como x = 5 – 9, 8x = 3, x2 = 2, ó x2 + 1 = 0.
4 El Paraíso de Cantor

Por otra parte, no se trata de conjurar la existencia de un objeto inexistente


por un acto de hechicería intelectual.4 Basta fijar cualquier objeto que no
sea un conjunto y que por lo tanto no tenga elementos —por ejemplo, el
Polo Sur o la ira de Aquiles— y decidir que se lo llamará ʻconjuntoʼ. Con
esta sola sencillísima convención hacemos de ese objeto una parte (vacía)
de todo conjunto, que funciona como cero en el álgebra de Boole definible
en el conjunto de todas las partes de un conjunto dado: Si k es una de esas
partes, tenemos que k ∪฀ ∅฀ = k y k ∩฀ ∅ = ∅.5
Históricamente hubo también otro motivo —aunque inválido— para acep-
tar el conjunto vacío ∅. Para entender y apreciar este motivo hay que tener
presente que un conjunto puede identificarse dando una lista de sus elementos
(como hicimos con {a,b,c,d}) o especificando una o más condiciones que
satisfacen todos los miembros del conjunto y sólo ellos. Simbólicamente, el
conjunto de todos los objetos x que cumplen una condición K se escribe ʻ{x:
Kx}ʼ. Por ejemplo, {x:x es un número primo y x < 16} = {2,3,5,7,11,13}.
En las postrimerías del siglo XIX algunos filósofos pensaron por eso que un
“conjunto”, en el sentido en que esta palabra empezaba a usarse en ciertas
publicaciones matemáticas, era lisa y llanamente lo mismo que en lógica
se conoce como la extensión de un concepto. (Evidentemente, los números
contenidos en {2,3,5,7,11,13} constituyen la extensión del concepto ʻnúmero
primo menor que 16ʼ). Visto de este modo, el conjunto ∅ coincide con la

4 Aunque algunos grandes matemáticos se han expresado como si se tratara justamente


de eso. Así Dedekind (1888, p. 2) anuncia que en ese escrito no admitirá el conjunto
vacío “aunque para otras investigaciones puede ser cómodo inventarlo”. (“[Wir wollen]
das leere System, welches gar kein Element enthält, aus gewissen Gründen hier ganz
ausschließen, obwohl es für andere Untersuchungen bequem sein kann, ein solches zu
erdichten”.) En la primera axiomatización de la teoría de los conjuntos, Ernst Zermelo
se toma esta libertad. Postula allí el siguiente:
Axioma II. Hay un conjunto (impropio), el “conjunto cero” 0, que no contiene
ningún elemento.
(Zermelo 1908a, p. 263)

Lewis (1991) arbitrariamente define el conjunto vacío ∅ como la fusión de todos los
objetos individuales existentes (esto es, el objeto individual que comprende a todos
los demás dentro de sí). Esta definición asegura que ∅ existe y está bien determinado
como quiera que esté constituido el universo.
5 George Boole introdujo el álgebra que lleva su nombre como una estructura discer-
nible en el sistema lógico de las clases (extensiones de conceptos). Para ello tuvo
1.1 La palabra ʻconjuntoʼ 5

extensión de cualquier concepto contradictorio (∅ = {x:x ≠ x} = {x:x es un


cuadrado redondo}, etc.). Pero, como veremos en el Capítulo 1.6, si bien
todo conjunto identificado mediante una condición tiene como elementos
exactamente los objetos que caen en la extensión del concepto definido por
ella, no toda condición expresable en buen castellano identifica un conjunto.
No puede, entonces, darse por descontado que haya un conjunto que iden-
tifican las condiciones contradictorias.

que completar dicho sistema, por convención terminológica, con dos “objetos” que
normalmente no se habrían considerado como clases, a saber, el “universo” y la “clase
sin miembros”:
Por clase se entiende usualmente una colección de individuos, a cada uno de los
cuales se puede aplicar un nombre o descripción particular; pero en esta obra el
significado del término se extenderá de modo que incluya el caso en que no existe
más que un solo individuo que responde al nombre o descripción requeridos,
así como los casos denotados por los términos “nada” y “universo”, los cuales,
considerados como “clases”, debe entenderse que comprenden, respectivamente,
“ningún ente” (“no beings”) y “todos los entes”.
(Boole 1854, p. 28)
1.2 ʻCONJUNTOʼ (ʻMENGEʼ) EN EL VOCABULARIO DE CANTOR

Desde una perspectiva actual, podemos ver el conjuntismo en acción ya


desde el comienzo mismo de la matemática moderna en la Geometría de
Descartes (1637). Al caracterizar cada figura geométrica por la ecuación que
satisfacen las coordenadas de sus puntos, la geometría cartesiana representa
en efecto la figura mediante el conjunto de los puntos incidentes en ella,
seleccionados de entre todos los puntos del espacio por la condición impuesta
a sus coordenadas. Pero sólo a fines del siglo XIX y principios del XX el
enfoque conjuntista se hará sentir con toda su fuerza gracias a la obra de
Georg Cantor y a la influencia que ejerce sobre las siguientes generaciones
de matemáticos.
En el Capítulo 1.3 veremos cómo un problema clásico de la matemática
decimonónica llevó a Cantor a considerar ciertos conjuntos de puntos de la
recta, y de ahí a la investigación de tales conjuntos en general. Les dedica
seis trabajos “Über unendliche lineare Punktmannigfaltigkeiten” (“Sobre va-
riedades lineales infinitas de puntos”) publicados en Mathematische Annalen
entre 1879 y 1884. Ya en el tercero de ellos introduce consideraciones sobre
“una variedad (un agregado, un conjunto) de elementos pertenecientes a
cualquier esfera conceptual” (Cantor, GA, p. 150; citado infra), y el quinto
versa sobre los “Fundamentos de una teoría general de las variedades”, título
bajo el cual circula como folleto separado. Como puede verse por la frase
recién citada, Cantor usa la palabra ʻconjuntoʼ (Menge) como un sinónimo
de lo que solía llamarse en su tiempo ʻvariedadʼ o ʻmultiplicidadʼ (Mannig-
faltigkeit).1 Otros sinónimos utilizados por él son Gesamtheit (ʻtotalidadʼ) e
Inbegriff (arriba traducido ʻagregadoʼ). La connotación de estos vocablos se
1 La matemática alemana toma el término ʻMannigfaltigkeitʼ del vocabulario filosófico
de Kant, probablemente a través de Fries. Kant llamaba así a la variedad concreta de
los datos de los sentidos, y también a la variedad, pluralidad o multiplicidad compren-
didas en el espacio de la geometría, por una parte, y en el tiempo de la mecánica, por
otra. En su lección inaugural Sobre las hipótesis que están en la base de la geometría
(1854), Riemann usa el término con la misma amplitud con que luego lo empleará
Cantor. Riemann distingue entre “variedades discretas” (diskrete Mannigfaltigkeiten),

7
8 El Paraíso de Cantor

explica al comienzo del último trabajo que Cantor dedica al tema, “Con-
tribuciones a la fundamentación de la teoría de los conjuntos transfinitos”
(Cantor 1895/97):

Unter einer “Menge” verstehen wir jede Zusammenfassung M von be-


stimmten wohlunterschiedenen Objekten m unsrer Anschauung oder un-
seres Denkens (welche die “Elemente” von M genannt werden) zu einem
Ganzen.
Entendemos por ʻconjuntoʼ cualquier reunión en un todo M de determinados
objetos bien distinguidos m de nuestra intuición o nuestro pensamiento
(llamados ʻelementosʼ de M).
(Cantor, GA, p. 282)2

que constan de “elementos”, y “variedades continuas” (stetige Mannigfaltigkeiten),


que constan de “puntos”. Sin embargo, en la literatura matemática actual, el término
alemán y sus equivalentes en otros idiomas (E. ʻvariedadʼ; F. ʻvariétéʼ; I. ʻmanifoldʼ;
IT. ʻvarietàʼ) se usan exclusivamente para referirse a objetos afines a las variedades
continuas de Riemann.
2 En “Fundamentos de una teoría general de las variedades”, § 1, nota 1, Cantor había
dicho:
Por “variedad” (Mannigfaltigkeit) o “conjunto” (Menge) entiendo en general
cualquier pluralidad que se deja concebir como unidad (jedes Viele, welches sich
als Eines denken läßt), es decir, cualquier agregado (Inbegriff) de elementos de-
terminados que en virtud de una ley pueden ser combinados en un todo.
(Cantor, GA, p. 204)

Bernhard Bolzano había utilizado el término ʻMengeʼ en una acepción similar en su


obra póstuma Paradojas del Infinito (1851):
Einen Inbegriff, den wir einem […] Begriffe unterstellen, bei dem die Anordnung
seiner Teile gleichgültig ist […], nenne ich eine Menge.
Llamo conjunto a un agregado subordinado a un concepto, cuando no importa el
orden de sus partes.
(Bolzano 1964, p. 4)

El concepto que gobierna la formación de un conjunto en el sentido de Bolzano puede


equipararse a la ley que según Cantor preside la combinación de los elementos del
conjunto en un todo. Es significativo que en sus caracterizaciones más tardías de la
noción de conjunto Cantor no haga alusión a la existencia de una ley tal. Veo aquí
una evolución comparable a la del concepto matemático de función de dʼAlembert a
Dirichlet (esbozada al comienzo del Capítulo 1.3).
1.2 ʻConjuntoʼ en el vocabulario de Cantor 9

La frase “reunión en un todo” expresa, me parece, que un conjunto es él


mismo un objeto, “concebido como una cosa de por sí”, como dice Cantor
en un pasaje paralelo (Cantor, GA, p. 411). La indicación de que consta de
objetos de “nuestra intuición o nuestro pensamiento” no debe interpretarse
como una restricción encaminada a subordinar la noción de conjunto al
alcance de nuestras facultades mentales. Se dirige más bien a subrayar que
la índole variopinta de los objetos reunidos en un conjunto en nada afecta
su viabilidad. En el citado pasaje paralelo expresa la misma idea diciendo
que dichos objetos pueden ser “cosas concretas o conceptos abstractos”.
Estas dos categorías ontológicas presumiblemente agotaban el reino de lo
posible a ojos de Cantor. Ahora bien, “intuición” y “pensamiento” son las
facultades cognitivas tradicionalmente asociadas por la filosofía alemana a
lo concreto y lo abstracto. Por otra parte, es esencial que los elementos de
un conjunto estén exactamente determinados y no se confundan entre ellos,
ni con otras cosas que no son elementos del conjunto. En el pasaje arriba
aludido del tercer trabajo sobre las variedades lineales infinitas de puntos,
esto se traducía en la exigencia de que los conjuntos bajo consideración
estuviesen “bien definidos” (wohldefiniert):

Llamo bien definida una variedad (una totalidad, un conjunto) de ele-


mentos pertenecientes a cualquier esfera conceptual si sobre la base de su
definición y como consecuencia del principio lógico del tercero excluido
hay que considerar internamente determinado, por una parte, si un objeto
cualquiera de la misma esfera conceptual pertenece o no como elemento
a dicha variedad, y, por otra, si dos objetos pertenecientes al conjunto,
no obstante diferencias formales en el modo como son dados, son o no
iguales entre sí.
(Cantor, GA, p. 150).

Cantor agrega que la decisión acerca de si un objeto dado a pertenece o


no a un conjunto bien definido M, o es o no idéntico a un objeto dado b
“generalmente no puede efectuarse con seguridad y precisión mediante los
métodos y aptitudes disponibles”. Pero lo que importa no es esto, sino “sólo
la determinación interna, que en casos concretos, cuando los fines buscados
lo requieran, se articulará, perfeccionando los medios auxiliares, como una
determinación efectiva (externa).” Cantor nada dice sobre los medios auxi-
liares que permiten articular la determinación efectiva de los elementos de
10 El Paraíso de Cantor

un conjunto bien definido; pero supongo que en todo caso serán variantes
de los dos que mencioné al final del Capítulo 1.1: o bien se da una lista de
todos los elementos del conjunto, nombrando o describiendo a cada uno de
una manera inequívoca; o bien se establece una condición que cumplen todos
los elementos del conjunto y sólo ellos y un procedimiento para decidir si un
objeto cualquiera satisface o no dicha condición. El requisito de “determina-
ción interna” podría entonces suponerse cumplido con sólo prescribir tal con-
dición, aunque no se conozca el procedimiento de decisión correspondiente.
La caracterización de ʻconjuntoʼ que trascribí de las “Contribuciones” (GA,
p. 282) significa, a mi modo de ver, que la teoría general de los conjuntos
concierne solamente a conjuntos bien definidos, en este sentido.
En suma, un conjunto en el sentido de Cantor es un objeto constituido
por otros objetos —los elementos del conjunto— de tal modo que su iden-
tidad depende de la determinación precisa de cuáles objetos son elementos
suyos y cuáles no.3 Esta noción de conjunto concuerda en lo esencial con la
expuesta en el Capitulo 1.1. De hecho, a pesar de su explícita insistencia en
que los conjuntos constan de “elementos bien distinguidos”, Cantor se refiere
ocasionalmente a un conjunto que consiste de un solo elemento (GA, p. 98).
En cambio, su postura con respecto al conjunto vacío es menos clara. En
el Nº 1 de la serie “Sobre variedades lineales infinitas de puntos” dice que
“conviene tener un símbolo que exprese la ausencia de puntos, para lo cual
elegimos la letra O. P = O significa entonces que el conjunto de puntos P
no contiene ni un solo punto, o sea que, estrictamente hablando, no existe
como tal” (GA, p. 146). Así, pues, al mismo tiempo que niega la existencia
del conjunto vacío, Cantor le pone un nombre, lo cual es quizás la vía más

3 La misma noción de conjunto es adoptada por Dedekind en el influyente ensayo que


dedica por esos años a la fundamentación conjuntista de la aritmética (aunque Dedekind
dice ʻsistemaʼ —ʻSystemʼ— en vez de ʻconjuntoʼ —ʻMengeʼ):
Ocurre muy a menudo que diversas cosas a, b, c… por algún motivo son con-
cebidas bajo un punto de vista común y reunidas en la mente. Se dice entonces
que forman un sistema S. […] Como objeto de nuestro pensamiento, tal sistema
S (o sea una colección, o una variedad, o una totalidad [oder ein Inbegriff, oder
Mannigfaltigkeit, oder Gesamtheit]) también es una cosa; está completamente
determinado, cuando está determinado respecto de cada cosa si es o no un ele-
mento de S.
(Dedekind 1888, pp. 1s.)
1.2 ʻConjuntoʼ en el vocabulario de Cantor 11

segura —en matemáticas como en literatura— para darle realidad a una fic-
ción. En el Nº 6 de la misma serie da un paso más hacia el reconocimiento
del conjunto ∅. Cantor considera allí un conjunto de puntos P incluido en
una región H de un espacio n-dimensional G. Si H se descompone en un
número finito o infinito de regiones conexas disjuntas H1, H2,…฀ Hk,…,
P también se divide en “un número correspondiente” de partes disjuntas P1,
P2,…฀ Pk,…, donde Pν = Hν ∩ P (ν = 1, 2,…). Cantor comenta que
“Pν฀ puede, entonces, ser igual a cero (Null), en caso de que ningún punto
de P caiga dentro de la región Hν” (GA, p. 210). Cantor no dice que el cero
que aquí se nombra sea un conjunto, pero lo ve sin duda como un objeto
por derecho propio, y además lo equipara a una parte de un conjunto. El
lector advertirá que el ∅ se presenta aquí justamente como la intersección
de dos conjuntos disjuntos. El pasaje sugiere, además, que la letra O se le
impuso a Cantor como símbolo cuando escribía el Nº1 por su parecido con
el número 0.
1.3 SERIES TRIGONOMÉTRICAS

El problema matemático que lleva a Cantor a ocuparse con determinados


conjuntos de puntos de la recta concierne a la representación de funciones
reales mediante series trigonométricas. Una función real es una aplicación†
cuyos argumentos y valores son números reales. Las definiciones modernas
de número real datan de la época de Cantor, y como él mismo fue el autor
de una de ellas, es de suponer que no le contentaron las anteriores. Luego
bosquejaré la teoría de los números reales de Cantor. Entre tanto, para no
pecar de excesivo anacronismo, entenderemos que una función real es una
correspondencia ƒ entre las distancias (orientadas) determinables en dos rectas
λ1 y λ2 en que se ha marcado un punto 0 y un punto a distancia +1 del 0.
Diremos que tales rectas han sido parametrizadas. ƒ asigna a cada distancia
x medida desde el 0 en la recta parametrizada λ1 una distancia y = ƒ(x) me-
dida desde el 0 en λ2. Como hay un y sólo un punto sobre cada recta a una
dada distancia (orientada) del respectivo 0, ƒ se concibe naturalmente como
una correspondencia entre puntos, una aplicación del conjunto de los puntos
situados en λ1 en el conjunto de los puntos situados en λ2. (La función ƒ
puede también estar definida sólo sobre una parte propia —por ejemplo, un
intervalo— de la recta λ1.)
Aunque los matemáticos anteriores a Cantor no se expresaban en estos
términos, es difícil eludir la impresión de que pensaban de esta manera. En
el siglo XVIII, algunos autores, como dʼAlembert, entienden al parecer que
una función real ƒ tiene que definirse mediante operaciones algebraicas sobre
la “variable independiente” x (y constantes); mientras que otros, más atentos
a las aplicaciones físicas, piensan que ella puede ser cualquier correspon-
dencia x Å ƒ(x) que represente una curva plana arbitraria (conforme a la
convención habitual que mide los argumentos x sobre el eje horizontal de
las abscisas y los valores y = ƒ(x) sobre el eje vertical de las ordenadas).
Estas dos nociones —algebraica y geométrica— de una función real son
demasiado estrechas en comparación con la idea generalizada de función
que Dirichlet introduce en 1837:

13
14 El Paraíso de Cantor

Sean a y b dos valores fijos y sea x una cantidad variable tal que x
toma paulatinamente todos los valores entre a y b. Si un único y finito
corresponde a cada x de modo que, mientras x recorre continuamente el
intervalo desde a hasta b, y = ƒ(x) también varía gradualmente, se dice
que y es una función continua o regular de x sobre este intervalo. No es
necesario que y esté sujeta a la misma regla con respecto a x a través de
todo el intervalo. Ni siquiera es necesario que la relación pueda expresarse
mediante operaciones matemáticas.1

Dirichlet admite además que la variación paulatina concomitante de x y ƒ(x)


se interrumpa para uno o más valores de x. En otras palabras, ƒ puede tener
una o más discontinuidades. La matemática posterior fue aún más liberal:
la continuidad, interrumpida o no, no es un rasgo esencial del concepto de
función.
Es de suponer que Joseph Fourier partía de la idea geométrica de función
cuando anunció en 1807 que cualquier función ƒ definida en un intervalo
finito de la recta real —digamos, en [–π, π]— puede representarse mediante
una serie trigonométrica de este modo:

a0 ∞
f (x) = + ∑ ( an cos nx + bn sen nx )
2 n=1 (1)

donde los coeficientes an (para n ≥ 0) y bn (para n ≥ 1) están dados por:

1 π
π ∫− π
an = f ( x )cos nx dx
(2)
y
1 π
π ∫− π
bn = f ( x )sen nx dx
(3)

Fourier demostró su tesis para algunos casos especiales y esbozó, con escaso
rigor, una demostración general.2 Años más tarde, Dirichlet, en el escrito

1 Dirichlet, “Über die Darstellung ganz willkürlicher Functionen durch Sinus und Cosinus-
reihen”, Repertorium der Physik, Berlin: Veit, 1837, vol. I, p. 152; citado por Mannheim
1964, pp. 52s.
2 Fourier, Théorie analytique de la chaleur (1822).
1.3 Series trigonométricas 15

arriba citado, estableció ciertas condiciones suficientes para que una función
ƒ pueda representarse de este modo y Riemann, en su Habilitationschrift de
1854, intentó establecer condiciones necesarias. En este trabajo, Riemann dio
la definición de integral que todavía sirve de base a la enseñanza elemental
del cálculo y demostró varios resultados importantes. Pero la cuestión de
las condiciones necesarias y suficientes de la representación (1) quedó —y
sigue— pendiente.
Aunque no se sepan exactamente las condiciones en que una función
real admite la representación (1), es importante saber si esa representación
es única, cuando existe, o si, por el contrario, una misma función puede
representarse mediante dos o más series trigonómetricas diferentes. Esta
es la cuestión que Cantor abordó y resolvió en varios artículos publicados
entre 1870 y 1872.3 Cantor (1870) considera una función real ƒ definida en
un intervalo finito I y representable mediante una serie trigonométrica de la
forma (1), convergente para todo x ∈฀ I. No presupone que ƒ sea integrable
o que los coeficientes de la serie (1) estén dados por (2) y (3). Tampoco
requiere la convergencia uniforme de la serie (1) en I.4 La unicidad de la
representación (1) es un corolario del siguiente teorema:

[T1] La serie trigonométrica en el lado derecho de la ecuación (1) repre-


senta la función constante ƒ(x) = 0 si y sólo si an = bn = 0 para
todo número no negativo n.

En efecto, si hay dos representaciones de una misma función g mediante


series de la forma (1), la diferencia de las dos series, tomada término a
término, representa la función ƒ(x) = 0. Pero esto supone, según el teorema
citado, que la diferencia entre coeficientes homólogos de ambas series sea en

3 Los trabajos de Cantor aludidos a continuación —como todos sus escritos más impor-
tantes— han sido resumidos en inglés por Dauben (1979), pero en esta parte, como en
otras, la exposición de Dauben tiene mucho que envidiarle a la claridad del original.
J. Marshall Ash (1989) ofrece una demostración rigurosa y detallada de los resultados
de Cantor (1870).


4 Decimos que la serie k =1
ƒ k ( x ) converge uniformemente al límite ƒ(x) en el intervalo
I, si para cada número real positivo ε hay un entero positivo N(ε) tal que, para todo

n
x ∈฀ I y todo n > N(ε), |ƒ(x) – k =1
ƒ k ( x )| < ε.
16 El Paraíso de Cantor

cada caso igual a 0 o, en otras palabras, que las dos representaciones sean
idénticas. El teorema T1 se deduce fácilmente del siguiente resultado, que
Cantor demuestra utilizando un ingenioso artificio aprendido de Riemann:

[T2] Si para todo x en el intervalo finito I,

lim(an sen nx + bn cos nx ) = 0 (4)


n →∞

entonces, lim an = 0 y lim bn = 0 .


n →∞ n →∞

En trabajos posteriores Cantor simplifica la demostración de esta proposi-


ción conforme a una sugerencia que le hizo Kronecker y establece que ella
sigue siendo válida aunque haya valores excepcionales de x para los cuales
la secuencia (4) no converge en absoluto o converge a un límite distinto de
0. Es justamente a este propósito que presta atención a ciertos conjuntos de
puntos en el intervalo I, a fin de determinar con precisión el conjunto de
esos valores excepcionales. Cantor (1871) demuestra T2 —y por lo tanto
la unicidad de la representación (1)— para el caso de que haya un número
arbitrariamente grande pero finito de valores excepcionales de x en cualquier
intervalo finito dado. Cantor (1872) extiende las demostraciones anteriores a
una familia de casos en que el intervalo finito I incluye un subconjunto infi-
nito de puntos x donde la secuencia (4) no converge o converge a un límite
diferente de 0. En dicho trabajo —y al servicio de ese resultado— Cantor
introduce su teoría de los números reales —que llama ʻmagnitudes numéricasʼ
(Zahlengrößen)— y hace sus primeras consideraciones sobre conjuntos de
puntos. Paso a explicarlas.
Cantor dice que “los números racionales constituyen el fundamento para
la determinación del concepto más amplio de magnitud numérica”. Los
racionales forman “el dominio A” (Cantor, GA, p. 92). Sea a0, a1,… una
secuencia infinita de racionales, tal que para cada número racional ε > 0
hay un entero positivo N, de suerte que |am – an| < ε siempre que N < m
< n. Diremos que a1, a2,… es una secuencia fundamental en el dominio
A, y la designaremos (ai). (En vez de ʻsecuencia fundamentalʼ suele decirse
ʻsecuencia de Cauchyʼ.) Cantor asocia a cada secuencia fundamental en A
un índice sujeto a la condición siguiente: Si (ai) y (bi) son dos secuencias
fundamentales en A y para cada número racional ε > 0 hay un entero positivo
1.3 Series trigonométricas 17

N tal que |an – bn| < ε si N < n, se asocia un mismo índice a las secuencias
(ai) y (bi). Diremos en tal caso que (ai) y (bi) son secuencias equivalentes.5
Si (ai) y (bi) son dos secuencias fundamentales en A asociadas a dos índices
diferentes α y β, decimos que α < β฀ si hay un número racional positivo
q y un entero positivo N tales que q < (bn – an) si N < n. Cantor llama
B al dominio formado por los índices de las secuencias fundamentales de
racionales. Claramente, la relación < establece un orden lineal en B. Cantor
define asimismo la adición y la multiplicación en B:

ADICIÓN: Sean α y β los índices asociados respectivamente a las secuencias


(ai) y (bi). Entonces, la suma α + β es el índice correspondiente a la se-
cuencia (ai + bi), formada sumando esas dos secuencias término a término.

MULTIPLICACIÓN: Sean α y β los índices asociados respectivamente a las se-


cuencias (ai) y (bi). Entonces, el producto αβ es el índice correspondiente
a la secuencia (aibi), formada multiplicando esas dos secuencias término a
término.

En virtud de estas definiciones, los objetos que forman el dominio B merecen


llamarse “magnitudes numéricas”. Las operaciones así definidas confieren a
B la estructura de un cuerpo† ordenado (aunque Cantor no se expresa así).
Su próximo paso consiste en formar secuencias fundamentales con elementos
tomados de A y B. Ahora bien, el concepto de secuencia fundamental ex-
plicado arriba puede sin duda extenderse al dominio B utilizando la adición
y el orden definidos en éste;6 pero sería preferible evitar la promiscuidad
entre A y B. Esto se logra reemplazando cada elemento a de A incluido en

5 Como fácilmente se puede comprobar, la relación entre (ai) y (bi) es una genuina
relación de equivalencia, puesto que es una relación simétrica, transitiva y reflexiva.
Cabe, pues, entender que el índice asociado a cada secuencia fundamental no es otra
cosa que la clase de equivalencia a la que pertenece en virtud de esta relación.
6 La adición determina el 0 en B, a saber, aquel objeto cuya suma con cualquier otro es
igual a este último. Los demás objetos de B quedan entonces clasificados en positivos y
negativos, según sean mayores o menores que el 0. Si α y β están en B, α – β designa
la suma de α y el único objeto de B cuya suma con β es igual a 0. Una secuencia
fundamental en B puede entonces definirse en los mismos términos utilizados arriba
para definir una secuencia fundamental en A, con una sola diferencia: ε฀ > 0 debe ser
un objeto de B, no de A.
18 El Paraíso de Cantor

una secuencia promiscua por el elemento de B correspondiente a la secuen-


cia constante (a, a,…) — esto es, a la secuencia (ak) tal que ak = a para
cada entero positivo k. Mediante un procedimiento análogo al seguido para
formar el dominio B, Cantor forma un dominio C de índices asociados a
las secuencias fundamentales en B, un dominio D de índices asociados a las
secuencias fundamentales en C, etc. La equivalencia de secuencias funda-
mentales, así como el orden, la adición y la multiplicación de los índices
pertinentes se definen en cada nuevo dominio de una manera similar a la
indicada en la construcción de B.
Es claro que el dominio B, aunque dotado de una estructura algebraica pa-
recida a la de A, es esencialmente más rico que éste. En efecto, si bien cada
elemento de A corresponde, del modo explicado, a un elemento único de B,
hay elementos de B que no corresponden de este modo a ningún elemento
de A. Por ejemplo, si (ai) es una secuencia en A tal que la secuencia de
productos (aiai) es equivalente a la secuencia constante (2, 2,…), no hay
un número racional q tal que (ai) sea equivalente a la secuencia constante (q,
q,…) y por lo tanto el índice de la secuencia (ai) no corresponde del modo
antedicho a ningún elemento de A. En cambio, toda secuencia fundamental
(αi) de elementos de B equivale a alguna secuencia constante (α, α,…) en
B, y otro tanto puede decirse de las secuencias fundamentales en C, D, etc.
Por esta razón, los dominios C, D,… son todos estructuralmente idénticos
a B. Sea K uno cualquiera de estos dominios. Entonces hay una aplicación
biyectiva única de B en K que respeta la relación < y todas las relaciones
determinadas por la adición y la multiplicación.7 Dicha aplicación es lo que
se llama un isomorfismo† (porque retrata fielmente una estructura en la otra)
canónico (porque es único en su género). Salvo una particular afición a la
recurrencia infinita, no veo qué pueda haber inducido a Cantor a reconocer
los dominios C, D,… como diferentes de B.
Por último, Cantor coordina los elementos del dominio B con los puntos
de una recta (parametrizada) cualquiera. Recuerda que, una vez que se ha
fijado el punto 0, las direcciones positiva y negativa desde el 0 y la unidad
de distancia, cada punto p queda perfectamente individualizado por su dis-

7 Sea ϕ: B →฀ K la aplicación en cuestión. Entonces, para cada α, β ∈ B, ϕ(α)฀ <฀ ϕ(β)฀


si y sólo si α฀ <฀ β; ϕ(α฀ +฀ β)฀ =฀ ϕ(α)฀ +฀ ϕ(β), y ϕ(αβ)฀ =฀ ϕ(α)ϕ(β). En particular, ϕ(0)฀
es el 0 de K y ϕ(1)฀ es el 1 de K.
1.3 Series trigonométricas 19

tancia (orientada) al punto 0. Si esa distancia es un número racional a, el


punto p queda asociado unívocamente a ese elemento de A. (Y también, por
ende, al elemento único de B que es el índice de la secuencia constante (a,
a,…)). Pero si la distancia orientada de p al 0 no es un número racional,
siempre habrá una secuencia fundamental de racionales (ai) tal que (i) para
cada entero positivo k hay un punto pk a distancia ak del 0, y (ii) todo in-
tervalo centrado en p, por pequeño que sea, encierra infinitos puntos de la
secuencia (pi). Cantor resume esto diciendo que la distancia de p al punto 0
es igual a b, donde b es el índice de la secuencia (ai). De este modo, a cada
punto de la recta corresponde una y sólo una “magnitud numérica” en B.
Cantor reconoce que no es posible demostrar que exista la correspondencia
inversa, en virtud de la cual “a cada magnitud numérica le pertenece un
determinado punto de la recta, cuya coordenada es igual a esa magnitud nu-
mérica, en el sentido aquí explicado”. Por eso la acepta simplemente como
“axioma”. En virtud de este axioma, “las magnitudes numéricas obtienen una
cierta objetividad, de la cual, sin embargo, son enteramente independientes”
(Cantor, GA, p. 97).
Establecida así —por decreto— la correspondencia entre las “magnitudes
numéricas” (números reales) y los puntos de la recta, Cantor advierte que
en lo sucesivo cuando hable de puntos se referirá a las magnitudes numéri-
cas correspondientes. En aras de la brevedad llamará “conjunto de valores”
(Wertmenge) a una multitud dada de tales magnitudes, y “conjunto de puntos”
(Punktmenge) a la correspondiente multitud de puntos. Si P es un conjunto
cualquiera de puntos contenidos en un intervalo finito, P determina otros
conjuntos de puntos, que Cantor llama “conjuntos derivados” (abgeleitete
Punktmengen). Se definen así. Un entorno de un punto p es un intervalo que
contiene a p. Si cada entorno de p contiene infinitos puntos del conjunto P,
diremos que p es un punto límite (Grenzpunkt — también se dice ʻpunto de
acumulaciónʼ) de P. El primer conjunto derivado P′ es el conjunto de todos
los puntos límite del conjunto P. El (ν฀+1)-ésimo conjunto derivado P(ν+1) es
el conjunto de todos los puntos límite del ν-ésimo conjunto derivado P(ν). Por

8 Sea dicho de paso, aquí tenemos un ejemplo de conjunto unitario, propuesto por
Cantor mismo. El texto, traducido, dice así: “Si el conjunto P consiste de los puntos
correspondientes a las abscisas 1, 1/2, 1/3,…,1/n,… el conjunto P´ consiste del solo
punto 0 y no tiene un conjunto derivado.” (Cantor, GA, p. 98).
20 El Paraíso de Cantor

ejemplo, si P es el conjunto de puntos a distancia 1, 1/2, 1/3, 1/4,… del


0, el primer conjunto derivado P′ es el conjunto {0}.8 Evidentemente, si el
ν-ésimo conjunto derivado P(ν) de un conjunto de puntos P contiene sólo un
número finito de puntos, su (ν฀ +1)-ésimo conjunto derivado P(ν+1) no contiene
ninguno. Hoy diríamos que en tal caso P(ν+1) = ∅, pero lo que dice Cantor es
que si P(ν) contiene sólo un número finito de puntos, entonces P(ν) no tiene
conjunto derivado. El conjunto original P es entonces lo que Cantor llama
un “conjunto de puntos de la ν-ésima especie” (Punktmenge νter Art).
Recurriendo a estos conceptos, Cantor demuestra que la proposición T2
sigue siendo válida aunque sus condiciones no se cumplan en un conjunto de
puntos de la ν-ésima especie incluido en el intervalo I, cualquiera que sea el
entero positivo ν (siempre, claro está, que esas condiciones estén satisfechas
en el resto de I). Ello implica el siguiente teorema sobre la unicidad de la
representación (1):

Si la serie trigonométrica

a0 ∞

ƒ( x ) = + ∑ (an cos nx + bn sen nx )


2 n =1

representa a la función real ƒ en todos los puntos x del conjunto I\P,


donde I es un intervalo finito de la recta real y P ⊂฀ I es un conjunto de
puntos tal que su conjunto derivado P(n)฀ = ∅ para algún entero positivo
n, entonces dicha representación es única.
1.4 DIVERSOS INFINITOS

Como veremos en el Capítulo 1.5, con sus reflexiones sobre los conjuntos
derivados Cantor dio un primer paso decisivo para la construcción de la
aritmética del infinito expuesta en los trabajos “Sobre variedades lineales
infinitas de puntos” de 1879–1884. Pero antes explicaré ciertos hallazgos
sobre conjuntos infinitos que Cantor publicó en 1874 y 1878 y que contri-
buyeron poderosamente a motivar sus estudios posteriores. Se refieren a lo
que Cantor llama la “potencia” (Mächtigkeit), esto es, la numerosidad de
un conjunto, que es la única propiedad que lo caracteriza si se hace caso
omiso de su estructura y de la naturaleza de sus miembros.1 Decimos que
dos conjuntos a y b son equinumerosos, o que tienen la misma potencia, si
hay una aplicación† biyectiva de a sobre b. En cambio, si hay una aplica-
ción inyectiva de a en b, pero no hay una aplicación biyectiva de a sobre
b, diremos que b es más numeroso que a, o que su potencia es mayor que
la de a. Evidentemente, estas definiciones prescinden de la índole de a y b,
y de sus respectivos elementos. Utilizando estos conceptos, Cantor (1874)
demuestra las proposiciones siguientes:

1 Tras explicar con admirable claridad y concisión la médula de las investigaciones de


Cantor sobre la representación única de funciones reales mediante series trigonométricas,
Maddy indica sugestivamente de qué modo el descubrimiento del teorema enunciado al
final del Capitulo 1.3 pudo conducirle a reflexionar sobre la numerosidad de los conjun-
tos infinitos. Una vez que definió los reales en términos de secuencias fundamentales,
Cantor pudo extender su teorema de unicidad de 1870 a funciones que convergen sólo
en el complemento de un conjunto infinito, aunque excepcional, de puntos.
Pero ¡qué curioso conjunto de puntos era éste! Finito y bastante complejo, y
sin embargo en cierto modo tan pequeño o tan bien portado con respecto a la
totalidad de los reales, que resultaba inofensivo. Al parecer, esto puso a Cantor
a pensar de cómo era que los conjuntos continuos, tales como los reales, se re-
lacionan con conjuntos infinitos discretos y al parecer más pequeños, tales como
los números naturales.
(Maddy 1990, p. 108)

21
22 El Paraíso de Cantor

(I) El conjunto de todos los números algebraicos y el conjunto de los


enteros positivos {1, 2,…} son equinumerosos.
(II) El conjunto de los números reales comprendidos en un intervalo
finito cualquiera es más numeroso que el conjunto de los enteros
positivos.

Cantor (1878) demuestra que:

(III) El conjunto de los puntos contenidos en un segmento recto es equi-


numeroso con el conjunto de los puntos contenidos en un cuadrado
o en un cubo o, en general, en cualquier hipercubo de dimensión
arbitraria n.

Se llama número algebraico a cualquier número real que sea una solución
de una ecuación con coeficientes enteros, de la forma:

α0 + α1x + α2x2 +…+ αnxn = 0 (1)

El índice más alto para el cual αn ≠ 0 se llama el grado de la ecuación (1).


Una ecuación de grado n admite a lo sumo n soluciones reales. Para que cada
solución corresponda a una sola ecuación de la forma (1), Cantor requiere
además que α0 sea positivo y que todos los coeficientes sean primos entre
sí (es decir, que no tengan un divisor común). Digamos que una ecuación
que reúne estas características es una ecuación simplificada. Cantor asigna a
cada número algebraico un entero positivo que llama su altura (Höhe) y que
determina así: Sea u una solución de una ecuación simplificada de grado n
con coeficientes α0, α1,…, αn. Entonces la altura de u es igual a n – 1 +
|α0| + |α1| +…+ |αn|. Se comprueba fácilmente que no hay más que una
cantidad finita de números algebraicos de una misma altura. Cantor observa
que hay sólo uno con altura 1, dos con altura 2, cuatro con altura 3. Digamos
que el número algebraico u precede al número algebraico v si u tiene menor
altura que v, o, en el caso de que tengan la misma altura, si u es menor que
v. Evidentemente, los números algebraicos ordenados de esta manera forman
una secuencia infinita, u1, u2,…, en correspondencia biunívoca con los
enteros positivos. Este resultado llama la atención, ya que en cada entorno
1.4 Diversos infinitos 23

de cualquier número real p hay infinitos números algebraicos.


Para probar que todo intervalo real (α,฀ β) es más numeroso que el conjunto
de los enteros positivos, Cantor considera una secuencia infinita arbitraria σ
de números reales, todos diferentes, p1, p2,…, y muestra que en cualquier
intervalo (α,฀β) hay por lo menos un número real que no pertenece a esa se-
cuencia. Esto significa que ninguna aplicación inyectiva del conjunto de los
enteros positivos en el conjunto de los reales cubre todo el intervalo (α,฀ β).
Vamos a recorrer en orden la secuencia σ hasta encontrar dos números conte-
nidos en (α,฀ β). Desígnemoslos α1 y β1, de tal modo que α1 < β1. (Notamos
que si no hubiera más que un número pr en σ contenido en (α,฀ β), cualquier
elemento del interior de (α,฀ pr) sería un número real que no pertenece a σ).
Sigamos recorriendo la secuencia σ, hasta hallar dos números contenidos en
el intervalo (α1,฀β1). Llamémoslos α2 y β2, de modo que α2฀< β2. Esta opera-
ción se repetirá tantas veces como dé un resultado, designándose, en general,
con αn+1 y βn+1 a los dos primeros miembros de la secuencia σ contenidos
en el intervalo (αn,฀βn) y tales que αn+1 < βn+1. Hay dos posibilidades: o bien
(P1) hay un entero positivo k tal que el interior de (αk,฀ βk) no contiene dos
números de σ, en cuyo caso ninguno de los infinitos números reales mayores
que αk y menores que βk pertenece a σ; o bien (P2), no importa cuán grande
sea k, el intervalo (αk,฀ βk) siempre contiene por lo menos dos números de
σ, en cuyo caso la secuencia infinita creciente α1, α2,…, acotada arriba
por los βi, converge a un límite α*, y la secuencia infinita decreciente β1,
β2,…, acotada abajo por los αi, converge a un límite β*. Si α* < β*, cual-
quier número contenido en el intervalo (α*,฀ β*) es un número real que no
pertenece a σ. Si α* = β*, entonces α* no pertenece a σ, puesto que, si α*
perteneciera a σ, tendríamos que α* = pr para cierto entero positivo r y las
secuencias α1, α2,… y β1, β2,… son subsecuencias de σ definidas de tal
modo que pr no puede estar contenido en el intervalo (αr,฀ βr) (en el mejor
de los casos, {α1,฀ β1} = {p1,฀ p2} y el primer miembro de σ que puede estar
contenido en (α1,฀ β1) es p3); en cambio, α* está contenido en (αr,฀ βr), cual-
quiera que sea el entero positivo r. Por lo tanto, existe al menos un número
real en el intervalo (α,฀ β) que no pertenece a la secuencia σ.
Cantor (1874) habla de los enteros positivos, de los números algebraicos
y de los números reales en cierto intervalo finito como si cada una de estas
24 El Paraíso de Cantor

clases infinitas de números estuviera presente en su totalidad.2 El supuesto


de que la investigación matemática se ocupa con conjuntos bien definidos
que constan de infinitos elementos está, por cierto, implícito ya en su teoría
de los números reales, según la cual cada uno de estos corresponde a una
secuencia fundamental infinita bien definida de números racionales; o, para
ser más exacto, a una clase infinita de tales secuencias.3 Este supuesto es
contrario a la concepción tradicional, heredada de Aristóteles, según la cual
la infinitud de los números y otras clases de objetos matemáticos —que se
manifiesta en la posibilidad de producir otros nuevos, interminablemente, cada
vez que se ha fijado una cierta cantidad de ellos— excluye el que pueda
concebírselos como formando una totalidad acabada. Más adelante veremos
como Cantor defiende en sus escritos filosóficos la actualidad del infinito
matemático, contra esta idea aristotélica de un infinito meramente potencial.
Pero conviene examinar desde ya en qué medida la concepción cantoriana
del infinito afecta no sólo el enunciado sino también la demostración de las
proposiciones I y II.
Pienso que la demostración de la proposición I no presupone un infinito
actual. Cantor propone un método para enumerar los números algebraicos
de modo que ninguno se omita. Para ello no es menester que los enteros
positivos formen una totalidad dada de antemano. Basta irlos tomando en
orden, uno a uno, de una fuente virtualmente inagotable, y asignarlos a los
números algebraicos conforme a una regla que asegure que ninguno de éstos
será pasado por alto. Esto es lo que se logra con el método propuesto. Su-
pongamos que cuando enumeramos cierto número a cierto número algebraico
b no ha sido enumerado todavía. En tal caso, o bien b tiene mayor altura
que a, o, si tiene la misma altura, es simplemente mayor que a. En ambos
casos, le corresponde ser enumerado después que a y, por consiguiente,

2 Cantor, GA, pp. 115, 116, menciona expresamente “der Inbegriff aller ganzen positi-
ven Zahlen”, “die reellen algebraischen Zahlen in ihrer Gesamtheit” y “die sämtlichen
reellen Zahlen, welche ≥฀ 0 und ≤฀ 1 sind”.
3 Adviértase que si σ es una secuencia fundamental y se modifican de cualquier manera
los n primeros términos de σ, donde n es un entero determinado, tan grande como se
desee, se obtiene una secuencia fundamental σ′ equivalente a σ. Así, la identidad de
cada número real, según la teoría de Cantor, depende de la última parte —infinita— de
la secuencia fundamental que lo representa (esto es, de lo que resta de la secuencia
después de remover los n primeros términos, para n fijo, pero arbitrario).
1.4 Diversos infinitos 25

su ausencia de entre los números algebraicos enumerados antes que a no


constituye una omisión.
En cambio, parece que la demostración de la proposición II depende esen-
cialmente de que el conjunto de los enteros positivos esté ya dado. Se trata
de mostrar que, como quiera que este conjunto se inyecte en el dominio de
los reales, la imagen de la inyección excluye por lo menos un número real
de un determinado intervalo.4 Para probar la proposición II Cantor considera,
como vimos, una inyección cualquiera σ, cuya imagen realiza una de las
alternativas que arriba llamé P1 y P2. Ahora bien, sólo se puede decidir que
estamos frente a la alternativa P1 si hemos recorrido todos los valores de
σ. De otro modo ¿cómo se podría establecer que a lo sumo hay sólo uno
de esos valores dentro de cierto intervalo (αk, βk), determinado como se
explicó? Sin embargo, sería errado creer que la prueba de la proposición II
requiere que se sepa cuál de las dos alternativas se cumple. Sólo hace falta
saber que, cualquiera que sea la aplicación inyectiva σ de los enteros posi-
tivos en los reales, tiene que cumplirse una de las dos. La argumentación de
Cantor va dirigida a mostrar que, en ambos casos, hay dentro del intervalo
(α, β) por lo menos un número real que no es un valor de σ. Como P1 es
la negación de P2, el principio lógico del “tercero excluido” implica que
una tercera alternativa es imposible.5 (Según L. E. J. Brouwer, la matemática
cantoriana es inaceptable justamente porque dicho principio lógico no vale
en los dominios infinitos; cf. Apéndice XIX).
La demostración de la proposición III publicada por Cantor en 1878 es
demasiado larga para reproducirla aquí.6 Pero una carta suya a Dedekind de
1877 contiene otra demostración más sencilla que voy a parafrasear. Inyec-
taremos el interior de un cuadrado Q en el interior de un segmento S. Con
este propósito le asignamos a cada punto en éste último un número real x

4 Si el conjunto de los enteros positivos existe, no cabe duda de que hay por lo menos
una aplicación inyectiva del mismo en el dominio de los reales, a saber, la inclusión
canónica que asigna a cada entero positivo z el número real correspondiente a la se-
cuencia constante (z, z,…).
5 P1 se cumple si para todo entero positivo k hay dos valores de la secuencia σ en el
intervalo (αk, βk). P2 se cumple si hay un entero positivo k tal que en el intervalo
(αk, βk) no hay dos valores de σ.
6 El texto alemán original aparece en Cantor, GA, pp. 119–133. Dauben 1979, pp. 58–66,
da una buena paráfrasis en inglés.
26 El Paraíso de Cantor

en el intervalo (0,1) y a cada punto en Q un par de coordenadas 〈y,z〉฀ del


mismo intervalo. Cualquier número de ese intervalo puede expresarse de
una sola manera como un decimal infinito 0,α1α2α3…, donde cada αi es
un dígito y para cada entero positivo k hay otro entero h tal que αk+h > 0.
Algunos de esos números pueden además representarse mediante decimales
finitos —por ejemplo, 0,273999… = 0,274— pero excluiremos esta forma
de expresión para evitar duplicaciones. Nuestra aplicación inyectiva asigna al
punto de Q con coordenadas y = 0,α1α2α3… y z = 0,β1β2β3… el punto
de S correspondiente al número x = 0,α1β1α2β2α3β3… Dedekind objetó a
Cantor que esta aplicación no es biyectiva. En efecto, su imagen no incluye
ningún punto de S cuya coordenada se exprese mediante un decimal infinito
de la forma 0,ξ1ξ2…ξk0ξk+20ξk+40… (en el cual, indefinidamente, a partir
de cierto dígito, hay, dígito por medio, un cero). Cantor aceptó esta crítica y
elaboró otra demostración más engorrosa. Sin embargo, a la luz de un teo-
rema demostrado (independientemente) por E. Schröder y F. Bernstein casi
veinte años más tarde, el argumento original de Cantor resulta suficiente para
probar la proposición III. Según ese teorema, si un conjunto a es inyectable
en un conjunto b y b es inyectable en a, a y b son equinumerosos.7 Como
es claro que el segmento S se puede inyectar en el cuadrado Q (por ejemplo,
mediante la aplicación x Å 〈x,x〉), la existencia de una aplicación inyectiva
de Q en S prueba que tienen la misma potencia. El método seguido para
definir la inyección de Q en S se deja extender fácilmente al caso en que Q
sea un hipervolumen de cualquier dimensión.
La publicación de la proposición III vino a agravar la llamada crisis de
la intuición matemática en el último tercio del siglo XIX.8 Intuitivamente
parece haber una diferencia irreductible entre un recta y una superficie o un
volumen. Los matemáticos conceptualizaban esa diferencia relacionándola
con el número de coordenadas requerido para identificar cada punto de estos
“continuos” (una, dos y tres, respectivamente). Por esta vía, se hacía fácil
concebir los “hiperespacios” de más de tres dimensiones: era cosa de incre-

7 Las primeras demostraciones del teorema de Schröder y Bernstein solían aducir premi-
sas más fuertes de lo necesario. Se hallará una demostración más económica en Levy
1980, pp. 85s.
8 Se agrega a la “curva sin dirección” de Weierstraß, una función real continua pero
no diferenciable. Precede a la “curva que llena una superficie” de Peano, aplicación
continua de un segmento recto sobre un cuadrado.
1.4 Diversos infinitos 27

mentar el número de coordenadas asignadas a sus puntos. Pero la proposición


III muestra que basta con una sola coordenada para identificar los puntos de
un continuo de cualquier número de dimensiones. Dedekind sugirió que sólo
podía haber biyecciones continuas entre dominios equidimensionales. Pero
trascurrirán más de 30 años antes de que Brouwer (1911, 1913) demuestre
este teorema.9 Para ello hubo que encontrar primero una caracterización viable
del concepto de número de dimensiones. (Cf. D. M. Johnson 1978/81).
Las proposiciones I y II distinguen dos clases de infinito: el infinito denu-
merable de los enteros positivos y algebraicos, y el infinito mayor de los
números reales. Cantor pronto conjurará una sucesión hiperinfinita de infi-
nitos, cada cual más numeroso que los anteriores. Junto a su demostración
de que todos los continuos son equinumerosos publicó una conjetura que
luego intentará sin éxito demostrar: “Entre las variedades lineales infinitas
no se encuentran más que dos potencias” (Cantor, GA, p. 133), a saber, la
de los enteros y la de los reales. En otras palabras: un continuo C nunca
incluirá un subconjunto D que sea a la vez menos numeroso que C y más
numeroso que los enteros positivos. Esta es la célebre Hipótesis del Conti-
nuo de Cantor.

9 Cantor (1878) subraya que su rotulación de cada punto del plano mediante una sola
coordenada supone que la parametrización no sea continua, pero expresamente deja
abierta la cuestión que será resuelta por Brouwer (GA, p. 121).
1.5 ARITMÉTICA TRANSFINITA

Al comienzo del Nº 5 de la serie “Sobre variedades lineales infinitas de pun-


tos”, publicado en 1883, Cantor declara que sus investigaciones acerca de ese
tema han alcanzado un punto desde el cual no puede dar ni un paso más con
naturalidad (zwanglos) si no extiende el concepto de número entero más allá
de sus límites acostumbrados. Esta es su justificación o, “si fuese menester”,
su excusa para introducir en ese escrito “ideas aparentemente extrañas”. Como
explica enseguida, se trata de ampliar o, más bien, de continuar la serie de
los números enteros “más allá del infinito” (GA, p. 165).
Cantor sabía muy bien que la matemática tradicional —lo que habrían
llamado “matemática clásica” en 1880 si este modo de expresarse hubiera
sido corriente a la sazón— admitía el infinito sólo como una potencialidad
inalcanzable y rechazaba de plano el infinito actual.

Me parece que el infinito matemático, en la medida en que ha encontrado


en la ciencia hasta la fecha una aplicación justificada y provechosa, se
presenta ante todo en la acepción de una cantidad variable que, o bien
crece más allá de todo límite, o bien decrece hasta ser arbitrariamente
pequeña, pero que siempre sigue siendo finita. Llamo a este infinito, el
infinito impropio (das Uneigentlich-unendliche).
(Cantor, GA, p. 165)

Cantor patrocina, en cambio, una concepción del infinito matemático como


algo completamente determinado. Aduce como ejemplo el “punto en el
infinito” utilizado ya entonces en la teoría de la funciones de una variable
compleja. Pero, nos advierte,

mientras el punto en el infinito del plano complejo se yergue solo frente


a todos los puntos del dominio finito, aquí obtendremos no tan sólo un
número entero infinito único, sino una secuencia infinita de tales números,
que se distinguen bien unos de otros y sostienen relaciones aritméticas
regulares entre sí y con los números enteros finitos.
(Cantor, GA, p. 165)

29
30 El Paraíso de Cantor

El avance al transfinito procede en dos frentes. Ya conocemos uno. Vimos


como Cantor demostraba que el conjunto  de los números reales (o de los
puntos de la recta) incluye subconjuntos tales como el conjunto de los núme-
ros enteros y el de los números algebraicos (respectivamente, los puntos con
coordenadas enteras y con coordenadas algebraicas), que son infinitos pero
menos numerosos que Â. Según esto, en  hay por lo menos dos modos o
niveles diferentes de infinitud. Cantor (1890/91) mostrará que, dado un con-
junto cualquiera K, el conjunto de sus partes PK es siempre más numeroso
que K. Resulta entonces que, si sobreentendemos con Cantor que, dado un
conjunto, también está dado el conjunto de sus partes, basta que haya una
numerosidad infinita, para que haya infinitas otras mayores que ella. Cantor
elaborará una aritmética de tales numerosidades, con reglas precisas para
la adición, la multiplicación, la exponenciación. Esta línea de avance tiene,
con todo, un inconveniente: las numerosidades generadas por la operación
K Å฀ PK se suceden, sí, de menor a mayor, pero no hay cómo saber si no
existen numerosidades intermedias entre la numerosidad de un conjunto K y
la numerosidad de฀ PK. Pero Cantor avanzará al transfinito también por otro
frente en el cual ese inconveniente no se presenta (al menos, si se acepta
una hipótesis que él juzga verdadera).
Cuando comparamos la numerosidad de dos conjuntos infinitos M1 y
M2 con los métodos de la Capitulo 1.4 lo que hacemos puede describirse
así: Los elementos del conjunto M1 se emplean como índices para enumerar
los elementos del conjunto M2; si alcanzan para todos, M1 no es menos
numeroso que M2; pero si, como quiera que se marquen los elementos de
M2 con índices tomados de M1, necesariamente queda alguno sin marcar,
es claro que M2 es más numeroso que M1. Si luego queremos comparar la
numerosidad de M2 con la de un tercer conjunto M3 no podemos usar a M1
como conjunto de índices, sino que tenemos que valernos de los elementos
de M2 o M3. No es así como comparamos ordinariamente la numerosidad
de conjuntos finitos. Antes bien, la serie de los enteros positivos, ordenada
de menor a mayor, nos sirve aquí como único sistema de índices, con el
cual enumeramos los elementos de cada uno de los conjuntos que queremos
comparar. Por esta vía, junto con averiguar que uno de los conjuntos así
enumerados es más numeroso que otro, se establece exactamente cuántas
numerosidades intermedias hay entre las de esos dos conjuntos. La segunda
línea de avance seguida por Cantor provee una continuación transfinita de
la sucesión ordenada de los enteros.
1.5 Aritmética transfinita 31

La idea de una tal continuación surge con toda naturalidad del estudio de
los conjuntos derivados de un conjunto de puntos. Cuando hablé de ellos
en el Capítulo 1.3 me referí expresamente sólo a conjuntos de la n-ésima
especie, cuyo n-ésimo conjunto derivado es finito, de suerte que el conjunto
derivado (n + 1)-ésimo está vacío. Pero la recta incluye por cierto más de un
conjunto de puntos P tal que, para cualquier entero positivo n, el conjunto
derivado P(n) ≠ ∅. Tenemos además que, si bien P(1) generalmente no es
una parte de P (por ejemplo, si P es el conjunto de los puntos con coorde-
nadas algebraicas, P(1) = Â), en cambio, P(n+1) ⊆฀ P(n) para todo n ≥ 1. Por

ende, P(n) ≠ ∅, la intersección infinita ∩ i=1 P ( i ) ≠ ∅ . Cantor llama a esta
intersección “la derivación de orden ∞” y la designa con el símbolo P(∞).
Considera en seguida la serie de sus conjuntos derivados P(∞+1), P(∞+2),…
También P(∞) tiene su derivación de orden ∞, generalmente no vacía. Cantor
la designa con P(2∞). “Prosiguiendo con estas construcciones conceptuales
uno llega a derivaciones que es consecuente designar con P(n∞+m),฀ donde n

y m son números enteros positivos” (GA, p.147). La intersección ∩ k =1 P ( k∞ )
2
debe llamarse entonces P(∞ ). El próximo paso natural es formar derivacio-
nes cuyo orden está dado por un polinomio en ∞ de grado n (n > 1). La

intersección infinita de tales derivaciones es, lógicamente, P(∞ ).

Avanzando de modo consecuente se ganan sucesivamente los ulteriores


conceptos:

∞ ∞+1) ∞+n) n∞ ∞n ∞∞)


P(∞ ), P(∞ , P(∞ , P(∞ ), P(∞ ), P(∞ , etc.;

vemos aquí una generación dialéctica de conceptos que conduce cada


vez más lejos, manteniéndose libre de toda arbitrariedad, como algo en
sí mismo necesario y consecuente.
(Cantor, GA, p. 148)

Como el símbolo ∞ se utiliza tradicionalmente en matemáticas para significar


el infinito potencial a que tiende una cantidad variable no acotada, Cantor lo
reemplazó en 1883, en su nuevo uso, por el símbolo ω, que emplearemos
en adelante (GA, p. 195n.). El objeto ω surge, pues, como el primer índice
transfinito en la serie de las derivaciones de un conjunto de puntos. Pero,
al igual que los índices finitos, ω y sus sucesores pueden separarse de esta
32 El Paraíso de Cantor

función y usarse para enumerar los elementos de otros conjuntos. Tomados


así en abstracto constituyen, según Cantor, una continuación natural de la
serie de los enteros positivos, suficiente para medir “todas las diversas nu-
merosidades, en sucesión ascendente, presentes en la naturaleza corpórea y
espiritual” (GA, p. 199).
Antes de hacer esta asombrosa aseveración, Cantor explica ciertos concep-
tos que precisan su sentido y alcance. Para facilitar la exposición adoptaré
ciertas convenciones. Llamaré ʻordinalesʼ a los elementos —finitos y trans-
finitos— de la serie cantoriana de enteros (este término, de uso corriente,
corresponde al alemán Ordnungszahlen que Cantor emplea en sus publi-
caciones desde 1887; GA, p. 388). Siguiendo la práctica actual, entenderé
que el primer ordinal es el 0, no el 1 (cf. Cantor, GA, p. 445). Para denotar
ordinales en general usaré las minúsculas del alfabeto griego, aunque recurriré
a la cursiva minúscula de nuestro alfabeto cuando quiera referirme especí-
ficamente a un ordinal finito, esto es, a un predecesor de ω. La expresión
ʻα < βʼ significa que α precede a β en la sucesión de los ordinales. Puede
leérsela ʻα es menor que βʼ o ʻβ es mayor que αʼ. Por ahora —hasta el
Capítulo 1.8— designaré con [α] al conjunto de todos los ordinales menores
que un cierto ordinal α. (Hoy día no se necesita un símbolo especial para
designarlo, desde que von Neumann caracterizó los ordinales de tal modo
que α = [α] = {ξ:ξ < α}, por definición; véase la Sección 1.8.4.) Tenemos,
entonces, que [α] ⊆฀ [β] si α < β. Si los elementos de un conjunto K se
dejan enumerar exhaustivamente utilizando en orden todos los predecesores
del ordinal κ, diré que κ es un enumerador de K. (Con este término artificial
traduzco aquí el vocablo alemán Anzahl, que Cantor usa en esta acepción).
Obviamente, si κ es un enumerador de K, los conjuntos K y [κ] son
equinumerosos. Si K es un conjunto finito, es decir, si algún k < ω฀ es un
enumerador de K, entonces, no importa cómo K se enumere, su enumerador
es siempre el mismo. Cabe afirmar, pues, que k mide la numerosidad de K
o, como decimos ordinariamente en castellano, que k es el número de los
elementos de K. (Así, por ejemplo, 4 es el número de los evangelios porque,
en cualquier orden que se los tome, se los puede enumerar con los ordina-
les del conjunto [4] = {0, 1, 2, 3}). Pero si K es infinito, admitirá distintos
enumeradores según el orden en que se enumeren sus elementos. Por ejem-
plo, si K = [ω], su enumerador es ω si los elementos de K se toman en el
orden habitual; pero es ω2 si se los enumera en el orden siguiente: primero
1.5 Aritmética transfinita 33

el 0 y el 1, seguidos de todos los números primos, 2, 3, 5, 7,…; luego los


cuadrados de los números primos; luego sus respectivos cubos;…; luego
la n-ésima potencia de cada primo, en orden ascendente;…฀ luego… Por
eso, Cantor cree necesario distinguir entre el número (Zahl) y el enumerador
(Anzahl) de un conjunto.1
Evidentemente, una vez determinado el orden en que debe enumerarse un
conjunto K, se fija de modo inequívoco su enumerador. De hecho, la enumera-
ción exhaustiva de K por el conjunto ordenado [κ] introduce (o presupone)
en K un orden particularísimo, a saber, el orden de los predecesores de κ
en la sucesión de los ordinales. Dicho orden tiene ciertas características ge-
nerales, cualquiera que sea κ. Desde luego, reúne todos los requisitos de lo
que se llama un orden lineal, a saber, (i) si α,฀ β฀ ∈฀ [κ], se cumple en todo
caso una y sólo una de estas tres alternativas: α < β,฀o β < α, o α = β; (ii)
si α,฀ β,฀ γ฀ ∈฀ κ, α < β y β < γ, entonces α < γ.2 Pero no todo orden lineal
concuerda con el orden de sucesión de los elementos de [κ], para algún
ordinal κ. Considérese, por ejemplo, el conjunto de los enteros negativos,
ordenados de menor a mayor, o el conjunto {cos x: 0 ≤ x ≤ π}, ordenado
por la magnitud del argumento x. Si κ es un ordinal cualquiera, el conjunto

1 Conviene observar que este distingo es tan ajeno al alemán como al castellano. En la vida
diaria, ʻAnzahlʼ se usa en frases como “eine große Anzahl Kinder” (“un gran número
de niños”), “eine Anzahl von 100” (ʻun centenar”). El uso matemático en tiempos de
Cantor puede ilustrarse con el siguiente pasaje de Lipschitz, que Kronecker cita con
aprobación en “Sobre el concepto de número” (1887, p. 342n.; cursiva mía):
Wenn man bei der Betrachtung getrennter Dinge von der Merkmalen absieht,
durch welche sich die Dinge unterscheiden, so bleibt der Begriff der Anzahl der
betrachteten Dinge zurück.
Cuando en la consideración de cosas separadas se prescinde de los caracteres que
las distinguen resta el concepto del número de las cosas consideradas.

ʻAnzahlʼ se caracteriza aquí prácticamente en los mismos términos en que Cantor


(1895/97, § 1; GA, p. 282) define ʻKardinalzahlʼ (ʻnúmero cardinalʼ). Por esos mis-
mos años, Frege confirió a ʻAnzahlʼ un significado técnico especial distinto del que le
da Cantor, mediante esta definición: “La Anzahl correspondiente al concepto F es la
extensión del concepto ʻequinumeroso con el concepto Fʼ” (1884, § 68; pp. 79–80).
También esta noción es afín a la cantoriana de ʻnúmero cardinalʼ.
2 El orden lineal así definido concuerda con lo que Cantor llama un “orden simple” (GA,
pp. 296, 444). Sus definiciones tardías de conjunto bien ordenado presuponen explíci-
tamente que se trata de un conjunto ordenado simplemente (GA, pp. 312, 444).
34 El Paraíso de Cantor

[κ] es lo que Cantor llama un conjunto bien ordenado por la relación <.3
En el referido escrito Nº 5 Cantor explica que un conjunto bien ordenado
(eine wohlgeordnete Menge) es un conjunto bien definido cuyos elementos
están ordenados linealmente de tal modo que:

BO1 Hay un primer elemento, esto es, un elemento que precede a todos
los otros.
BO2 Todo elemento que precede a otros tiene un sucesor inmediato, esto
es, un elemento que le sigue y precede a cualquier otro elemento
precedido por él.
BO3 Si A es una parte no vacía —finita o infinita— del conjunto y los
elementos del conjunto que siguen a todos los elementos de A
forman otra parte no vacía B, entonces B tiene un primer elemento
(esto es, hay un elemento de B que precede a cualquier otro ele-
mento de B).

Esta definición de conjunto bien ordenado (GA, p. 168) equivale a la defi-


nición más sencilla que Cantor propuso en una carta a Dedekind el 28 de
julio de 1899 (GA, p. 444) y que figura en los libros de texto actuales:4

3 Como luego se verá, las condiciones BO1–3 con que Cantor inicialmente define el
concepto de buen orden están calculadas para garantizar que el mismo sea aplicable
a la sucesión de ordinales resultante de los “principios generadores” enunciados en
Cantor 1883 (vide infra, pp. 36 s.). Por eso, quizás, Cantor no se molesta en demos-
trar que la sucesión de los ordinales —y, por ende, cada segmento inicial suyo— está
bien ordenada por la relación <. Para los lectores a quienes esto no les parezca obvio,
Zermelo prueba —en una nota a su edición de los escritos de Cantor— que la sucesión
de los ordinales cumple la condición BO (Cantor, GA, p. 208, n.4). Sea K cualquier
conjunto de ordinales. Sea K* = {ξ: ∀ζ(ζ฀ ∈฀ Κ฀ →฀ ξ < ζ)} (K* es el conjunto de los
ordinales menores que cada elemento de K). Entonces, o bien K contiene el primer
ordinal y éste es su primer elemento; o bien no lo contiene, y entonces K* ≠ ∅.฀ En
este caso, o bien K* tiene un elemento máximo µ, y el ordinal µ + 1, determinado
por el primer principio generador, es el primer elemento de K; o bien K* no tiene un
elemento máximo, en cuyo caso el segundo principio generador determina un ordinal
límite, sucesor próximo de todos los elementos de K*, que es el primer elemento de
K. Así, en las tres alternativas posibles, K tiene un primer elemento.
4 Demuestro la equivalencia de ambas definiciones en el Apéndice I. El lector habrá
advertido que la condición BO1 presupone que el conjunto en cuestión no está vacío.
Por otra parte, ∅ cumple trivialmente la condición BO: como ∅ no tiene ninguna parte
1.5 Aritmética transfinita 35

BO Un conjunto linealmente ordenado M se dice bien ordenado si cada


parte no vacía A ⊆ M tiene un primer elemento.

Como es obvio, un conjunto infinito numerable, esto es, un conjunto equi-


numeroso con el conjunto [ω] de los enteros positivos finitos, queda bien
ordenado por cualquier aplicación biyectiva de [ω] sobre él. Pero ello, evi-
dentemente, no implica que cualquier conjunto admita un ordenamiento de
este tipo. Por ejemplo, como el lector fácilmente adivinará, no se conoce
ningún procedimiento para bien ordenar el conjunto infinito de los puntos de
un cuadrado. Ello no obstante, a la citada explicación del concepto de buen
orden por Cantor sigue la siguiente extraordinaria declaración:

El concepto de conjunto bien ordenado resulta ser fundamental para toda


la teoría de las variedades (Mannigfaltigkeitslehre). Que siempre es posi-
ble reducir cada conjunto bien definido a la forma de un conjunto bien
ordenado es una ley del pensamiento, a mi modo de ver, básica y fecunda,
y especialmente notable por su universalidad, a la cual retornaré en un
trabajo posterior.
(Cantor, GA, p. 169).

Más tarde, Cantor no volverá a calificar esta proposición tan poco evidente
como “ley del pensamiento”, y hasta hará un intento por demostrarla, que
explico en el Capitulo 1.6. En el Capítulo 1.7 y en el Apéndice VI consideraré
las demostraciones publicadas por Zermelo en 1904 y 1908. Desde entonces
la proposición se conoce como el Teorema del Buen Orden y así me referiré
a ella en lo sucesivo. Veremos que, al igual que el célebre Postulado V de
Euclides, no puede demostrársela a menos que se acepte otra proposición
que no es más obvia. Me parece, por eso, que Cantor puso de manifiesto
un certero instinto matemático cuando intentó hacer pasar el Teorema del
Buen Orden por un principio del pensamiento que no requiere demostración
(así como Euclides mostró su genio al dar rango axiomático al Postulado
V). Para su programa, el Teorema del Buen Orden era indispensable: la
sucesión de los ordinales alcanza para enumerar todo lo que se presente en

no vacía, no tiene una que carezca de un primer elemento. BO equivale a BO1 ∧ BO2
∧ BO3 si y sólo si M ≠ ∅. Como Cantor no contemplaba la existencia de ∅ entendía
seguramente que el conjunto al que se refiere la condición BO no estaba vacío.
36 El Paraíso de Cantor

la naturaleza corpórea y espiritual si —pero sólo si— cada conjunto puede


ordenarse bien. A menos que todo conjunto sea bien ordenable no se justifica
el tono triunfalista del siguiente pasaje:

Una de las tareas más importantes de la teoría de los conjuntos, que


creo haber resuelto en lo principal en [el escrito Nº 5 de 1883], consiste
en la exigencia de determinar las distintas valencias o potencias [esto
es, las numerosidades] de las variedades presentes en la totalidad de la
naturaleza, en la medida en que ésta se abre a nuestro conocimiento. Lo
he logrado mediante la formación del concepto general del enumerador
de un conjunto bien ordenado, o, lo que es lo mismo, del concepto de
número ordinal.
(Cantor 1887; GA, pp. 387s.)

En el citado escrito Nº 5 Cantor formula tres principios que según él presiden


la generación de los ordinales. Observa que la serie de los enteros positivos
finitos 1, 2, 3,…, n,…฀ surge del repetido “postular y reunir” (Setzung und
Vereinigung) unidades que se consideran iguales. “El número n es a la vez la
expresión de un determinado número finito de tales postulaciones sucesivas y
de la reunión de las unidades postuladas en un todo” (GA, p. 195). La doble
operación descrita ilustra un primer principio generador (Erzeugungsprinzip):
“el principio de la adición de una unidad a un número ya formado”, el cual,
según Cantor, desempeña también un papel esencial en la generación de los
enteros transfinitos. Los números formados de este modo constituyen lo que
Cantor llama la primera clase de números o la Clase (I).

Aunque sería contradictorio hablar de un número máximo de la Clase (I),


no hay nada chocante (nichts Anstößiges) en concebir un nuevo número,
que llamaremos ω, y que ha de ser la expresión de que todo el agregado
(I) está dado en su sucesión natural conforme a la ley (al modo como n
es la expresión de que un cierto número finito de unidades está reunido
en un todo).
(Cantor, GA, p. 195)

Si a la postulación del número ω siguen nuevas postulaciones de la unidad


se obtienen, mediante el primer principio, los nuevos números ω + 1, ω
+ 2,…, ω + n,…฀ No habrá entre ellos un número máximo que siga a
todos los otros, pero se puede pensar en un número nuevo 2ω, que exprese
1.5 Aritmética transfinita 37

la reunión de aquéllos en un todo. Aplicando el primer principio a 2ω se


obtienen los números 2ω + 1, 2ω + 2,…, 2ω + n,…5฀ Al lector des-
prevenido esta proliferación de números le parecerá un truco de ilusionista,
pero vimos arriba, a propósito de la formación de los conjuntos derivados
de ciertos conjuntos de puntos, que la sucesión descrita aquí en abstracto por
Cantor admite aplicaciones perfectamente bien definidas. (Piénsese también
en esto: ω es el enumerador del conjunto de los números pares; si a ese
conjunto vamos agregando los impares 1, 3, 5,… y prescribimos que se
los enumere “en orden de llegada”, es claro que se necesitarán los enume-
radores ω + 1, ω + 2, ω + 3,…).

La función lógica que nos ha suministrado los dos números ω y 2ω es


manifiestamente distinta de la del primer principio generador. La llamo
el segundo principio generador de números reales enteros, que defino
con más precisión así: cuando hay una sucesión determinada cualquiera
de números enteros reales definidos, ninguno de los cuales es el mayor
de todos ellos, se crea en virtud de este segundo principio generador un
número nuevo, que se concibe como límite de todos esos números, vale
decir, se lo define como el próximo sucesor de todos ellos (als die ihnen
allen nächst größere Zahl).
(Cantor, GA, p. 196)

Corrientemente se llama ordinal sucesor a uno generado conforme al primer


principio y ordinal límite a uno generado conforme al segundo. Un ordinal
límite no es el sucesor inmediato de otro ordinal; en cambio, cabe describir-
lo como el sucesor próximo de los ordinales que le preceden, en cuanto él
mismo precede a cualquier otro ordinal mayor que todos sus predecesores.
Cantor observa que el ordinal ω y los primeros ordinales sucesores y ordi-
nales límites que le siguen tienen la propiedad de que el conjunto de sus
respectivos predecesores es numerable.6 Cantor hace de esta propiedad la
característica esencial de lo que llama la segunda clase de números o Clase

5 Como luego veremos, la multiplicación de ordinales no es conmutativa si uno de los


factores es transfinito. En particular, 2ω฀ =฀ ω฀ ≠ ω2. Por eso, Cantor llamará más tarde
ω2 al número introducido aquí bajo la designación ʻ2ωʼ (GA, p. 389).
6 Desde luego, tienen esta propiedad los ordinales transfinitos ω2 y ω2 que he aducido
como ejemplos, puesto que ellos enumeran, respectivamente, (i) el conjunto ordenado
38 El Paraíso de Cantor

(II). Dicha propiedad puede verse como un tercer principio “de inhibición o
limitación” (Hemmungs- oder Beschränkungsprinzip), en virtud del cual:

(a1) Todo ordinal transfinito κ formado conforme a los principios gene-


radores tiene un conjunto de predecesores [κ] equinumeroso con
[ω].

La Clase (II) está formada por ω y los ordinales sucesores y ordinales lí-
mites que cumplen con la exigencia (a1). Cumple además las condiciones
siguientes:

(b1) El agregado de todos los números de la Clase (II) es más numeroso


que el conjunto [ω] de los números de la Clase (I); y
(c1) no existe una numerosidad intermedia mayor que la de la Clase (I)
y menor que la de la Clase (II).7

Sea ω1 el enumerador del conjunto de los ordinales de las Clases (I) y (II),
ordenados de menor a mayor. Consíderese ahora la condición

(a2) [κ] es equinumeroso con [ω1].

Los ordinales generados conforme a los principios cantorianos bajo esta


condición forman una Clase (III) tal que

(b2) el agregado de todos los ordinales de la Clase (III) es más nume-


roso que el conjunto [ω1] de los números de la Clase (II); y
(c2) no hay una numerosidad intermedia mayor que la de la Clase (II)
y menor que la de la Clase (III).

En forma análoga, se forman las Clases (IV), (V),…, de ordinales, tales

que forman todos los impares 1, 3, 5,…฀ seguidos por todos los pares 2, 4, 6,…฀ y (ii)
el conjunto ordenado que forman los números primos 2, 3, 5, 7, 11,…฀ seguidos por
sus respectivos cuadrados, cubos,…; y, evidentemente, cada uno de estos conjuntos
puede biyectarse sobre el conjunto de los predecesores de ω (con el cual se confunde,
si olvidamos el orden).
7 En el Apéndice III bosquejo su demostración de estas dos proposiciones.
1.5 Aritmética transfinita 39

que, para cada entero positivo n, (i) el conjunto [ξ] de los predecesores de
cualquier ordinal ξ de la clase (n+1)-ésima clase es equinumeroso con el
conjunto de los ordinales de la clase n-ésima; (ii) la clase n-ésima es me-
nos numerosa que la clase (n+1)-ésima; y (iii) no existe una numerosidad
intermedia entre las de las clases n-ésima y la (n+1)-ésima. Por otra parte,
como Zermelo observa en su edición de los escritos de Cantor (GA, p. 199),
los principios citados no bastan para establecer la existencia de una clase
ω-ésima de ordinales.
En sus obras más maduras, Cantor se refiere a esta serie ascendente de
numerosidades infinitas conjurada por los sucesores de ω como a una serie
numérica transfinita distinta de la de los ordinales, aunque asociada a ella: la
sucesión de los números cardinales transfinitos o alephs (llamados así por la
letra hebrea aleph, ℵ, que Cantor adoptó para nombrarlos). Para Cantor, el
cardinal de un conjunto epitomiza lo que él llamaba su potencia o valencia y
aquí he llamado su numerosidad. Si olvidamos todas las particularidades de
los elementos de un conjunto K, recordando únicamente que son diferentes
entre sí, obtenemos, según Cantor, un concepto que se aplica igualmente
a K y a cualquier otro conjunto equinumeroso con K. Este concepto es lo
que él llama el número cardinal (Kardinalzahl) de K. Si K es menos nu-
meroso que otro conjunto L, decimos que el cardinal de K es menor que el
cardinal de L. El conjunto de los cardinales finitos está bien ordenado por
la relación ʻx es menor que yʼ —que simbolizaremos: x < y—, puesto que,
evidentemente, hay un isomorfismo† de órdenes entre los cardinales finitos,
ordenados por la relación <, y los enumeradores de los conjuntos respec-
tivos, ordenados por la relación <. (Usaré también la abreviatura ʻx ≤ yʼ
para decir ʻx < y o x = yʼ.) En virtud de este isomorfismo los cardinales
finitos se identifican naturalmente con los respectivos ordinales y se conocen
por los mismos nombres que éstos. Pero, como hemos visto, tal correspon-
dencia no existe en el dominio transfinito. Cantor insiste, por ello, en que
los cardinales transfinitos son otra clase de objetos que los ordinales y los
designa con nombres peculiares. Así, el cardinal del conjunto [ω] —o del
conjunto de los predecesores de cualquier ordinal de la segunda clase— se
llama ℵ0 (aleph cero); el cardinal del conjunto de los ordinales de segunda
clase —o del conjunto de los predecesores de cualquier ordinal de la tercera
clase— se llama ℵ1, etc.
Como dije arriba, Cantor demostró que entre ℵ0 y ℵ1 no puede haber
40 El Paraíso de Cantor

un cardinal intermedio (véase el Apéndice II). Esta proposición se deja


generalizar a cualquier ordinal κ ≥ 1: en otras palabras, si ℵκ y ℵκ+1฀ son
los cardinales de los conjuntos K y K′, respectivamente, no puede haber
un conjunto K″ más numeroso que K y menos numeroso que K′. Sea K un
conjunto infinito cualquiera. Si K admite un buen orden hay un ordinal que
lo enumera, y K es equinumeroso con el conjunto de los predecesores de
ese ordinal. Por lo tanto, el cardinal de K es ℵλ (para algún ordinal λ). Pero
si K no admite un buen orden, no hay ningún ordinal que lo enumere y el
cardinal de K no pertenece a la secuencia de los alephs. Peor aún, como
demostrará Hartogs (1915), a menos que todo conjunto sea bien ordenable,
habrá numerosidades incomparables, esto es, pares de conjuntos K y K′ tales
que K no es ni más ni menos numeroso que K′ ni equinumeroso con él.
Está claro, entonces, que la pretensión de Cantor de haber provisto un
sistema numérico suficiente para medir todas las numerosidades de la na-
turaleza depende enteramente del Teorema del Buen Orden. Por otra parte,
si —como él— lo damos por supuesto, obtenemos sólo la seguridad de
que todas esas numerosidades son medibles a ojos de Dios, puesto que
nosotros no somos capaces de bien ordenar ni siquiera el conjunto de los
puntos de un intervalo, ni, en general, ningún conjunto que no sea finito o
numerable. Por esta razón, la clara jerarquía de los alephs correspondientes
a las sucesivas clases de ordinales transfinitos resulta de poco interés fuera
del recinto cerrado de la teoría cantoriana si no se la vincula a la serie
ascendente de numerosidades generada en el primer frente del avance al
transfinito por la operación K Å฀ PK. Como veremos un poco más adelante,
es fácil probar que el conjunto  de los números reales es equinumeroso
con P[ω]. La Hipótesis del Continuo significa, entonces, que no hay con-
juntos de numerosidad intermedia entre la de [ω] y la de P[ω], de modo
que el cardinal de P[ω] —y de — es precisamente ℵ1. La Hipótesis del
Continuo constituye así el primer eslabón de una cadena que vincularía la
jerarquía de los alephs a las numerosidades generadas por la operación K
Å฀ PK. Por eso, Cantor se empeñará mucho en demostrar la Hipótesis del
Continuo y se sentirá atribulado por su fracaso. La cadena se completa con
la llamada Hipótesis Generalizada del Continuo, formulada en el espíritu de
Cantor por sus sucesores:
1.5 Aritmética transfinita 41

HGC Si ℵκ es el cardinal de un conjunto K, el cardinal de PK es ℵκ+1,


cualquiera que sea el ordinal κ.

HGC implica el Teorema del Buen Orden (pero no es implicada por él).
Por lo tanto, sólo cabría admitirla como un principio que no se demuestra.
Volveremos sobre esto en la Tercera Parte. Es claro que bajo HGC los
alephs darían abasto para cubrir todas las numerosidades de la “naturaleza
corpórea y espiritual”.
Con clara conciencia de lo que se espera de un “número” de veras digno de
ese nombre, Cantor pone especial cuidado en definir las operaciones aritmé-
ticas elementales aplicables a sus ordinales y cardinales. No podemos entrar
en detalles, pero un par de indicaciones darán una idea de este asunto.
Aunque la aritmética transfinita ordinal precede históricamente a la car-
dinal, es más fácil explicarla si hablamos primero de ésta. Este es el orden
que Cantor mismo sigue en su presentación final del tema (Cantor 1895/97;
GA, pp. 282ff.), en la que me basaré. Como ya he dicho, para Cantor el
cardinal de un conjunto K es el concepto abstracto que se forma olvidando
todas las propiedades y relaciones de los elementos de K excepto una sola, a
saber, que cada uno de esos elementos es idéntico consigo mismo y diferente
de todos los demás. Como es obvio, el mismo concepto se obtiene a partir
de cualquier conjunto equinumeroso con K.8 Para referirme a los cardinales
—finitos o transfinitos— usaré como Cantor letras góticas, , , ,…฀ Can-
tor designa el cardinal del conjunto K mediante el símbolo , pero aquí lo
llamaremos |K|, como es ahora habitual. Por definición, la suma  +  de
dos cardinales  y  es el cardinal de la unión de dos conjuntos disjuntos
cualesquiera tales que  y ฀sean sus repectivos cardinales. En otras palabras,
si  = |A| y  = |B| y A ∩ B =฀∅,  +  = |A ∪฀B|. El producto  de dos
cardinales  y  se define así: si  = |A| y  = |B|, sea A ×฀ B el conjunto
de todos los pares ordenados 〈a,b〉, tales que a ∈ A y b ∈ B; entonces  =
|A × B|. Cantor muestra que bajo las condiciones antedichas,  es asimismo el
cardinal del conjunto construido formando la unión de  conjuntos disjuntos

8 La caracterización cantoriana de los cardinales recuerda, sin duda, la definición de Frege,


según la cual el cardinal de una clase C es la clase de todas las clases equinumerosas
con C, pero no debe confundirse con ella. La definición de Frege identifica el cardinal
de la clase C con la extensión del concepto con el cual lo identificaría Cantor si C
fuese en efecto un conjunto.
42 El Paraíso de Cantor

equinumerosos con B; en otras palabras, si  = |A|, y para todo h, k ∈฀ A, 


= |Bh| y Bh ∩ Bk =฀ ∅ si h ≠ k, entonces  = |¨k∈ABk|.9 Es fácil verificar
que la adición y la multiplicación así definidas son operaciones conmutativas
y asociativas:  +  =  + ;  + ( + ) = ( + ) + ;  = ; () =
(); y que la multiplicación es distributiva sobre la adición: ( + ) =
 + . Asimismo, si llamamos 0 al cardinal de ∅฀ y 1 al de un conjunto
unitario, es claro que ฀ + 0 = , 0 = 0 y 1 = . Cantor mostró además
que si  ≤ , hay un cardinal  tal que ฀ =  + , y que si ฀ ≤฀  y ฀
≤฀ ,
entonces  + ฀ ≤฀  +  y ฀ ≤฀ . Hasta aquí, pues, la aritmética transfinita
cardinal no difiere de la finita. Por otra parte, se puede demostrar que si a
es un cardinal transfinito y n es un cardinal finito,  + n = . Hessenberg
(1906) estableció que, para cualquier ordinal κ, ℵκ + ℵκ = ℵκ, de lo cual
se deduce fácilmente que si κ < λ, ℵκ + ℵλ = ℵλ.10
Para definir la exponenciación de cardinales Cantor define lo que llama
ʻcubrimientoʼ de un conjunto N con un conjunto M (Belegung von N mit
M), como “una ley en virtud de la cual se le asocia a cada elemento n de N
un determinado elemento de M, pudiendo usarse repetidas veces un mismo
elemento de M.” Un cubrimiento de N con M es pues precisamente lo que
hoy se llama una aplicación† de N en M, y usaré este término en lugar del
utilizado por Cantor. Por definición, si  = |A| y  = |B|,  es el cardinal
del conjunto de todas las aplicaciones de B en A. Cantor muestra que la
operación así definida obedece a las leyes familiares de la exponenciación
finita:  = +, ()c฀ = a.
Es claro que, si  es finito, ฀ 2. Cantor demostró que ฀
<฀ <฀2฀
฀también si 
es infinito. Por su importancia, este aserto se llama comúnmente el Teorema
de Cantor. La siguiente prueba, sencilla y elegante, se publicó en Cantor
1890/91 (GA, pp. 279s.). Sea K un conjunto infinito y F el conjunto de todas
las aplicaciones de K en {0,1}. Sea ƒ:K Æ F una aplicación inyectiva. Para
mayor claridad escribo ƒx en vez de ƒ(x), para designar el valor asignado
por ƒ a x ∈ K. Considérese la aplicación ϕ de K en {0,1} definida así: ϕ(x)
= 0 si ƒx(x) = 1 y ϕ(x) = 1 si ƒx(x) = 0. Obviamente, ϕ difiere de ƒx para
cada x ∈ K. Por lo tanto, ϕ es un elemento de F que cae fuera del alcance

9 En estas explicaciones he empleado la terminología y simbolismo actuales.


10 Estos resultados se demuestran en todos los buenos manuales de teoría de conjuntos,
por ejemplo, en Levy 1979, III.3.
1.5 Aritmética transfinita 43

de la aplicación inyectiva ƒ. Por ende, ƒ no es una biyección de K en F.


Como este argumento es aplicable a cualquier inyección de K en F, |K| <
|F| = 2|K|. El argumento ilustra un modo de razonar —el llamado “método
diagonal”— que Russell utilizará en la construcción de la paradoja que lleva
su nombre (Capítulo 1.6) y Gödel en la demostración de su primer teorema
de incompletud (Capítulo 2.10).11
Ahora mostraré que si K es un conjunto cualquiera, el conjunto PK de
todas las partes de K es más numeroso que K. Este resultado asegura una
provisión inagotable de cardinales transfinitos diferentes (si suponemos,
como Cantor al parecer suponía, que existe un conjunto infinito y que la
existencia de un conjunto implica la existencia del conjunto de sus partes).
Es una consecuencia inmediata del Teorema de Cantor. En efecto, cada
elemento H de PK —es decir, cada conjunto H ⊆฀ K— está asociado a una
determinada aplicación de K en {0,1}, la función característica χH definida
así para cada k ∈฀ K: χH(k) = 1 si k ∈฀ H y χH(k) = 0 si k ∉฀ H.12 Por otra
parte, cada aplicación χ:K Æ฀ {0,1} determina un elemento de PK, a saber,

11 Aunque suele atribuírsele a Cantor, el método diagonal fue empleado antes por Paul du
Bois-Reymond (1875, p. 365n.) para demostrar que, dada una secuencia de funciones
reales λ1, λ2,…฀que crecen monotónicamente sin cota ( lim λ k ( x ) = ∞ ), pero cada cual
λ k +1 ( x ) x→∞

más lentamente que la anterior ( lim = 0 ), existe siempre una función real λ que
x→∞ λ ( x )
k
crece sin cota, pero más lentamente que cualquiera de las λk. En términos generales, el
método puede describirse así: dado un conjunto D y una “función de dos variables” g
definida en D2, pasamos a considerar la diagonalización de g, esto es, la “función de
una variable” h definida en D por la condición h(x) = g(x,x). El nombre ʻdiagonalizaciónʼ
se justifica fácilmente en caso que D sea finito o enumerable, ya que entonces los
valores de g se pueden desplegar naturalmente en una matriz cuya diagonal exhibe los
valores de h. La popular demostración de la indenumerabilidad del continuo publicada
en Cantor 1890/91 (GA, pp. 278f.) ilustra el método diagonal en esta forma: Sea ϕ
una aplicación inyectiva de [ω] en I = (0,1]. Sea 0,ak0ak1ak2…akn… la representación
de ϕ(k) mediante su expansión decimal infinita. Sea, para todo ordinal finito h, ah = 1
si ahh ≠ 1 y ah = 2 si ahh = 1. Entonces, 0,a0a1a2…an… es la expansión decimal
infinita de un elemento de I que cae fuera del alcance de la aplicación ϕ, puesto que
difiere de ϕ(k) en el k-ésimo decimal. Por lo tanto, no existe una aplicación biyectiva
de [ω] en I, de suerte que [ω] es menos numeroso que I.
12 Mas adelante, cuando hablemos de Gödel, será preferible definir con él la función ca-
racterística χH de un conjunto H por la condición χH(k) = 0 si k ∈฀H y χH(k) = 1 si k
∉฀ H. Como es obvio, cualquier decisión en esta materia es puramente convencional.
44 El Paraíso de Cantor

el conjunto {k ∈ K:฀ χ(k) = 1}. Por lo tanto, |PK| = 2|K|฀>฀|K|. En particular,


el cardinal del conjunto de las partes del conjunto [ω] de los ordinales finitos
es 2ℵ0, puesto que ℵ0 es, por definición, el cardinal de [ω]. 2ℵ0 es también
el cardinal del continuo, como paso a demostrar. Sea I = (0,1]฀⊆ Â (I es el
conjunto de los números reales x tales que 0 < x ≤ 1). Vimos en el Capitulo
1.3 que I es equinumeroso con un continuo de cualquier dimensión. Sea a
∈ I. Entonces a puede representarse mediante su expansión decimal infinita
0,a0a1a2…an…, donde para cada ordinal finito k, ak es uno de los diez
dígitos y hay un entero h > k tal que ah ≠ 0. También puede representárselo
mediante su expansión binaria infinita, cuya definición es la misma que la
anterior, excepto que para cada ordinal finito k, ak es uno de los dos dígitos
del sistema binario: 0 ó 1. Ahora bien, una tal expansión binaria infinita
puede leerse como la lista de los valores de la aplicación de [ω] en {0,1} por
k Å ak, que es la función característica del conjunto H de ordinales finitos
definido por la condición: k ∈฀ H si ak = 1 y k ∉฀ H si ak = 0. La corres-
pondencia así establecida entre las referidas expansiones binarias y ciertos
subconjuntos de [ω] determina una aplicación inyectiva ƒ: I Æ P[ω]. ƒ no
es biyectiva, pues su alcance comprende solamente los subconjuntos infinitos
de [ω]. En efecto, si H ⊆฀ [ω] es finito, H contiene un elemento máximo n,
de modo que χH(m) = 0 para todo ordinal finito m > n y la lista de valores
de χH no es la expansión binaria infinita de ningún número. Sin embargo,
como hay solamente un número finito de partes diversas de [ω] que tienen
el mismo elemento máximo n es claro que el conjunto de las partes finitas
de [ω] es numerable. Por lo tanto, si U es la unión del intervalo (0,1] con
un conjunto numerable, por ejemplo, con el conjunto {x: x es racional y 1
< x < 2}, se puede definir una aplicación biyectiva ƒ′: U Æ฀P[ω], tal que
ƒ es la restricción de ƒ′ a (0,1]. Por lo tanto, el cardinal de U es idéntico
al cardinal de P[ω]. Como (0,1] y (0,2] son equinumerosos y (0,1] ⊆฀ U ⊆฀
(0,2], es claro que |(0,1]| = |U| = |P[ω]| = 2ℵ0. En vista de esto, la Hipótesis
del Continuo puede enunciarse —como es habitual— así:


ℵ1 = 2ℵ0 (HC)

El argumento anterior ofrece una prueba más de que el conjunto de los ordi-
nales finitos es menos numeroso que el continuo.
Para entender la aritmética ordinal conviene explicar primero el concepto
1.5 Aritmética transfinita 45

cantoriano de tipo de orden. Sea Ki un conjunto no vacío y Pi una relación


binaria entre miembros de Ki (i = 1, 2). Decimos que la estructura 〈K1,P1〉
es isomórfica a la estructura 〈K2,P2〉 si hay entre ellas un isomorfismo, esto
es, una aplicación biyectiva ƒ:K1 Æ K2 tal que, para todo x, y ∈ K1, x tiene
la relación P1 con y si y sólo si ƒ(x) tiene la relación P2 con ƒ(y) (simbóli-
camente: xP1y ⇔ ƒ(x)P2ƒ(y)). Si P1 es una relación de orden lineal, el tipo
de orden de 〈K1,P1〉 es, según Cantor, el concepto que se forma al hacer
abstracción de todas las particularidades de los elementos de K1 excepto (i)
la identidad de cada uno consigo mismo y su diversidad de los otros y (ii) el
orden entre ellos determinado por la relación P1. Obviamente, este concepto
es común a todas las estructuras isomórficas a 〈K1,P1〉.13 Cantor llama simi-
lares (ähnlich) a los conjuntos que tienen un mismo tipo de orden, término
que usaré en lo sucesivo. En 1897 Cantor define los ordinales como los tipos
de orden de los conjuntos bien ordenados (GA, p. 321). En particular, cada
ordinal κ, formado con arreglo a los tres principios enunciados por Cantor
en 1883, habrá de identificarse simplemente con el tipo de orden de los
conjuntos bien ordenados similares con 〈[κ],<〉. Volveré sobre esto después
de explicar la adición y multiplicación de tipos de orden.
Cantor designa los tipos de orden con minúsculas griegas. La suma α
+ β de dos tipos de orden α y β se define como el tipo de orden de la
estructura 〈K,P〉 construida así: (i) tómese una estructura 〈K1,P1〉 de tipo α
y una estructura 〈K2,P2〉 de tipo β, tales que K1 ∩ K2 = ∅; (ii) sea K = K1
∪฀ K2; (iii) defínase así el orden lineal P en K: xPy si y sólo si x, y ∈ Ki
y xPiy, o si x ∈ K1 e y ∈ K2. El producto αβ de α y β se define como el
tipo de orden de la estructura 〈K,P〉 construida así: (i) tómese una estructura
〈K1,P1〉 de tipo α y una estructura 〈K2,P2〉 de tipo β, tales que K1 ∩ K2 =
∅; (ii) fórmese una colección de copias disjuntas de 〈K1,P1〉, una para cada
elemento de K2; sea en particular 〈K1(x),P1〉 la copia correspondiente a x ∈
K2; (iii) sea K la unión de las copias de K1 (K = |¨x฀ K1K1(x)|); (iv) defínase
∈฀
así el orden lineal P en K: uPw si y sólo si u, w ∈ K1(x) para un cierto
x ∈ K2, o si u ∈ K1(x) y w ∈ K1(y) y xP1y. Las operaciones así definidas

13 Siguiendo a Cantor, he restringido la definición de tipo de orden a los órdenes lineales;


pero puede extendérsela sin más a cualquier estructura que posea algo que pudiéramos
llamar un orden. Por ejemplo, es natural decir que los puntos de una circunferencia
exhiben un tipo de orden (cíclico) que tienen también los puntos de una recta en el
plano proyectivo o los rayos que salen de un punto en el plano euclidiano.
46 El Paraíso de Cantor

son obviamente asociativas, pero no son conmutativas, como muestran los


siguientes ejemplos: (i) 1 + ω ≠ ω + 1, puesto que ω + 1 es el tipo de orden
de la estructura 〈[ω]∪{ω},<〉 y 1 + ω es el tipo de orden de la estructura 〈{1}
∪฀ ([ω]\{1}),<〉 = 〈[ω],<〉 (de modo que 1 + ω = ω). (ii) 2ω ≠ ω2, puesto
que ω2 es el tipo de orden de la estructura 〈{α: α < ω y α es par}∪{β:
β < ω y β฀ es impar},P〉, donde ξ฀ Pη si ξ฀ es par y η es impar, o si ξ฀ ฀ y η
son pares y ξ฀ < η, o si ξ฀ ฀ y η son impares y ξ฀ < η, de suerte que ω2 ≠
ω; pero 2ω es el tipo de orden de la estructura 〈¨k<ω{2k,2k+1},<〉, así que
2ω = ω.14
Al definir ʻordinalʼ como ʻtipo de orden de un conjunto bien ordenadoʼ
Cantor se desentiende de los principios generadores enunciados en 1883. El
nuevo concepto de ordinal es más amplio que el anterior, puesto que cubre
también el tipo de orden de un conjunto bien ordenado K cuyo cardinal sea
ℵκ para algún κ ≥ ω, y los principios de 1883 no bastan para generar un
ordinal con ℵω฀ predecesores. Es importante cerciorarse de que ésta es una
ampliación natural, que preserva los caracteres estructurales del concepto
primitivo. Para facilitar el examen de este asunto, llamaré, por ahora, ʻP-or-
dinalesʼ a los miembros de la sucesión generada en virtud de los principios
de 1883 y ʻT-ordinalesʼ a los tipos de orden de los conjuntos bien ordenados.
Usaré las minúsculas griegas para referirme a ordinales de ambas clases, pero,
para evitar confusiones, la letra irá seguida de un asterisco cuando designe
un P-ordinal. Veremos que cada P-ordinal puede asimilarse plausiblemente
a un determinado T-ordinal y que los T-ordinales que no son P-ordinales
se ordenan naturalmente en una sucesión que prolonga la sucesión de los
P-ordinales.
Si k es un elemento de un conjunto bien ordenado 〈K,P〉, designo con
el símbolo [k] el segmento (Abschnitt) de K determinado por k, esto es, el

14 Cantor (1883) ofrece este curioso comentario acerca de la no-conmutatividad de la


adición y multiplicación cuando uno de los sumandos o factores es transfinito y el
otro no:
Como se ve claramente, todo depende de la posición (Stellung) de lo finito hacia
lo infinito; si aquél se adelanta, se disuelve en lo infinito y desaparece en su seno;
pero si se modera y toma su lugar detrás de lo infinito, entonces se conserva y
se une a éste para formar un infinito nuevo, modificado.
(Cantor, GA, p. 177)
1.5 Aritmética transfinita 47

conjunto {x ∈฀ K: xPk} que forman los predecesores de k.15 Los segmentos


de 〈K,P〉 constituyen una parte de P(K) bien ordenada por la relación ⊆.
Llamémosla S(K). La aplicación [k] Å฀ k es un isomorfismo entre 〈S(K),⊆〉
y 〈K,P〉. Cantor mostró que si K y H son conjuntos bien ordenados por las
relaciones P y Q, respectivamente, y 〈K,P〉 no es similar a 〈H,Q〉, entonces
〈K,P〉 es similar a un segmento de 〈H,Q〉, o 〈H,Q〉 es similar a un segmento
de 〈K,P〉. Este resultado es el Teorema 13N en Cantor 1897.16 Este teorema
permite definir una relación de precedencia < entre los T-ordinales: α <
β si y sólo si α es el tipo de orden de un segmento de un conjunto bien
ordenado cuyo tipo de orden es β. Es claro, además, que si κ es el tipo de
orden de un conjunto bien ordenado 〈K,P〉, cada ordinal ζ tal que ζ < κ es
el tipo de orden de cierto segmento [z] de 〈K,P〉. La aplicación ζ Å [z] es
un isomorfismo entre 〈[κ],<〉 y 〈S(K),⊆〉. Por lo tanto, la aplicación ζ Å z
es un isomorfismo entre 〈[κ],<〉 y 〈K,P〉, de suerte que el T-ordinal κ es en
efecto el tipo de orden del conjunto de sus predecesores. Supongamos ahora
que 〈K,P〉 es enumerado por el P-ordinal κ*. Esto significa, sencillamente que
hay un isomorfismo entre 〈K,P〉 y 〈[κ*],<〉. En tal caso, 〈[κ*],<〉 es isomórfico
a 〈[κ],<〉. En virtud del teorema 13N, es claro que si 〈K1,P1〉 es un conjunto
bien ordenado numerable por un P-ordinal y 〈K2,P2〉 es un conjunto bien
ordenado que ningún P-ordinal alcanza para enumerar, 〈K1,P1〉 es similar a
un segmento de 〈K2,P2〉, a saber, aquél cuyo tipo de orden corresponde, en
virtud del isomorfismo antedicho, al P-ordinal que enumera a 〈K1,P1〉. Estos
resultados justifican, sin duda, la identificación de cada P-ordinal κ* con el
tipo de orden de los conjuntos bien ordenados que κ* enumera. La sucesión
de los T-ordinales que no pueden identificarse así con un P-ordinal obvia-
mente continúa la serie de los que admiten tal identificación. Por lo tanto,
de ahora en adelante, hablaré simplemente de ʻordinalesʼ —sin prefijo— y
los designaré con minúsculas griegas sin asterisco.

15 Para que k ∈ K determine un segmento de K, Cantor requiere que k no sea el primer


elemento de K. Esta restricción es innecesaria si se admite la existencia del conjunto
vacío. Si k es el primer elemento de K, [k] = ∅; en tal caso, [k] ⊆฀K, como cualquier
otro segmento de K.
16 GA, pp. 319s. Bosquejo la demostración en el Apéndice II.
1.6 PARADOJAS Y FILOSOFEMAS

En el Capítulo 1.5 reproduje la prueba original del Teorema de Cantor por


el método diagonal. Como un corolario del mismo, probé que, si K es un
conjunto cualquiera, |K| < |PK|. La prueba del corolario se basó en que cada
aplicación de K en {0,1} es la función característica χH de un determinado
conjunto H ⊆ K. Ahora mostraré cómo fundir ambas pruebas en una, de
suerte que el aserto de que |K| < |PK| para todo conjunto K venga a ser
sólo otro modo de expresar el Teorema de Cantor, ฀ <฀ 2. Sea, como antes,
F el conjunto de las aplicaciones de K en {0,1}. Entonces F = {χH:H ⊆฀K}
y hay una biyección canónica g: χH Æ฀ H de F en PK. Si ƒ:x Å ƒx designa,
como en el Capítulo 1.5, una inyección cualquiera de K en F, la aplicación
compuesta gƒ (= g ∑ ƒ) es una inyección cualquiera de K en PK que asigna
a cada x ∈ K, un conjunto Hx ⊆ K. Consideremos otra vez la aplicación ϕ
∈ F, definida de modo que, para cada x ∈ K, ϕ(x) ≠ ƒx(x). ϕ es la función
característica de un determinado conjunto G ⊆ K. G queda caracterizado por
el hecho de que, para cada x ∈ K, ϕ(x) = 1, y, por ende, ƒx(x) = 0. En otras
palabras, x ∈ G si y sólo si x ∉ Hx. Así, pues, G es el conjunto formado
por los elementos de K que no pertenecen al conjunto que respectivamente
les asigna la inyección gƒ. Si G = Ha para un cierto a ∈ K, tendremos que
a ∈ G si y sólo si a ∉ Ha = G. Esta contradicción implica que G cae fuera
del alcance de la inyección gƒ, y que ésta no es una aplicación biyectiva.
Como gƒ es una inyección cualquiera, no hay una biyección de K a PK.
Por lo tanto, |K| < |PK|.
El Teorema de Cantor y su demostración fueron reformulados en térmi-
nos similares a éstos por Bertrand Russell (1903, §§ 346–347). La principal
diferencia reside en que Russell no habla de conjuntos, sino de clases, esto
es, de extensiones de conceptos.1 En la versión de Russell, el Teorema de

1 “Una clase es…todos los objetos que satisfacen una función proposicional” (Whitehead
y Russell, 1910–13, t. I, p. 23). El término ʻfunción proposicionalʼ se explica así: “Sea
φx un enunciado (statement) que contiene una variable x y que se convierte en una
proposición cuando se le asigna a x cualquier significado determinado fijo. Entonces

49
50 El Paraíso de Cantor

Cantor dice, pues, que cualquier clase es menos numerosa que la clase de sus
subclases.2 En la misma obra, Russell nos cuenta que descubrió la paradoja
que hoy lleva su nombre reflexionando justamente sobre las consecuencias
del Teorema de Cantor. Dicha paradoja surge al considerar la clase de todas
las clases que no son miembros de sí mismas. Si llamamos CR a esta clase
russelliana, designamos con ʻ{x: ϕx}ʼ la clase de todos los objetos x que sa-
tisfacen la condición ϕx, y simbolizamos con ʻy ∈ zʼ e ʻy ∉ zʼ los enunciados
ʻy pertenece a la clase zʼ e ʻy no pertenece a la clase zʼ, tenemos que:

CR = {x: x es una clase y x ∉฀ x}

Si a es una clase cualquiera, es claro que a ∈ CR si y sólo si a ∉฀ a. En


particular, si la clase cualquiera considerada es la misma CR, se obtiene la
contradicción:

CR ∈ CR ↔฀ CR ∉ CR

φx se llama una ʻfunción proposicionalʼ” (p. 14). Cada objeto a tal que la proposición
φa es verdadera “satisface” la función proposicional φx y es, por ende, un miembro de
la clase determinada por esta función proposicional. Aunque hay profundas diferencias
entre Principia Mathematica, de donde tomo estas definiciones, y The Principles of
Mathematics de 1903, en este punto concuerdan. Leemos en The Principles que “φx
es una función proposicional si, para todo valor de x, φx es una proposición, determi-
nada si x es dado” (Russell 1903, §฀ 22) y que “los valores de x que hacen verdadera
la función proposicional φx […] en general forman una clase y de hecho una clase
puede definirse como todos los términos que satisfacen alguna función proposicional”
(§฀23).
2 No es obvio para mí que el argumento que Russell toma de Cantor demuestre el teorema
en su nueva versión. En efecto, si tomamos en serio la explicación lógico-lingüística
de la noción de clase recogida en la nota 1, el número de subclases no vacías de una
clase C no es mayor que el número de funciones proposicionales diferentes que satis-
facen uno o más miembros de C. Si cada función proposicional es un enunciado, el
número de las mismas dependerá de la índole del lenguaje que se usa. En particular,
si el lenguaje es la “escritura conceptual” de Frege (1879), o la pasigrafía de Peano
(1895 y ss.), o el sistema desarrollado más tarde por el mismo Russell (Whitehead y
Russell, 1910–13), cualquiera de los cuales sólo admite oraciones de longitud finita
con a lo sumo ℵ0 predicados diferentes, el número total de enunciados diferentes que
es posible hacer en él no es mayor que ℵ0. A menos, claro está, que haya enunciados
—específicamente, funciones proposicionales— inefables.
1.6 Paradojas y filosofemas 51

Esta contradicción es fatal para el sistema de fundamentación de la


aritmética y el análisis elaborado por Frege en Grundgesetze der Arithmetik
(1893/1903) y así lo reconoce el autor en un epílogo al tomo II (1903, pp.
252ss.), en el cual informa sobre la carta que Russell le envió el 16 de junio
de 1902, cuando ese tomo ya estaba en prensa.3 Me refiero a ese sistema
en el Capitulo 2.2, la Sección 2.3.3 y los Apéndices X y XII. La contradic-
ción subsiste, claro está, si ʻy ∈ zʼ significa, como de costumbre, ʻy es un
elemento del conjunto zʼ y pretendemos designar con CR = {x: x ∉฀ x} el
conjunto de todos los conjuntos que no son elementos de sí mismos. Pero
puesta en esta forma no afecta la coherencia del pensamiento de Cantor, ya
que éste no presupone que cada conjunto corresponda a un concepto, ni que
cada concepto determine un conjunto.
Cantor deja muy en claro su posición a este respecto en una carta a Dede-
kind del 3 de agosto de 1899 (publicada en 1932; Cantor, GA, pp. 443ss.).4
Presenta allí lo que hoy se conoce como la Paradoja de Burali-Forti, mas
no como paradoja, sino simplemente como una indicación de que hay plu-
ralidades, bien definidas mediante una caracterización verbal, que no forman
una unidad, es decir, un conjunto. Al comienzo de la carta Cantor distingue
dos especies de “pluralidad determinada (bestimmte Vielheit)”.

En efecto, una pluralidad puede ser de tal índole que el supuesto de que
todos sus elementos “existen conjuntamente” (die Annahme eines “Zusam-
menseins” aller ihrer Elemente) lleva a una contradicción, de modo que
es imposible captar esa pluralidad como una unidad, como “una cosa aca-
bada”. A tales pluralidades las llamo pluralidades absolutamente infinitas
o inconsistentes. […]

3 En su respuesta a Russell, el 22 de junio de 1902, Frege le dice que “su descubri-


miento de la contradicción me ha sorprendido muchísimo y casi querría decir que me
ha consternado, puesto que sacude el fundamento sobre el cual yo pensaba que podía
construirse la aritmética” (Frege, WB, p. 213). En cambio, el joven Zermelo, que había
descubierto la Paradoja de Russell un año antes, no la publicó y continuó sus inves-
tigaciones sobre la teoría de conjuntos sin hacerle caso, seguramente porque entendía
que no era un obstáculo serio para dicha teoría. Véase Rang y Thomas 1980.
4 Zermelo la publicó en el apéndice de Cantor, GA, confundida con otra del 28 de julio,
de la que provienen los cuatro primeros párrafos de la p. 443. La carta del 3 de agos-
to empieza en el quinto, con la frase “Gehen wir von dem Begriff einer bestimmten
Vielheit…aus”. Cf. Dauben 1979, p. 352; Grattan-Guinness 1974.
52 El Paraíso de Cantor

En cambio, si la totalidad de los elementos de una pluralidad se deja con-


cebir sin contradicción como “estando reunida” (als “zusammenseiend”),
de modo que es posible captarla conjuntamente como “una cosa”, la llamo
pluralidad consistente o “conjunto” (“Menge”).
(GA, p. 443)5

Siguen tres asertos, en el estilo que se usará más tarde para enunciar axiomas
de la Teoría de los Conjuntos:

Dos pluralidades equinumerosas son o bien ambas “conjuntos”, o bien


ambas inconsistentes.

Una pluralidad que es parte de un conjunto es un conjunto.

Todo conjunto de conjuntos, cuando éstos se disuelven en sus elementos,


es también un conjunto.
(GA, p. 444)

El tercer aserto significa lo mismo que el Axioma V de Zermelo: “A cada


conjunto T corresponde un conjunto ST cuyos elementos son precisamente
todos los elementos de los elementos de T” (Zermelo 1908a). La segunda
alternativa mencionada en el primer aserto desconcierta a primera vista, ya
que presupone que tiene sentido hablar de equinumerosidad entre pluralidades
inconsistentes, aunque ninguna de ellas pueda considerarse como “una cosa
acabada”. Pero a la luz del uso que le da luego, me parece que todo lo que
Cantor ha querido decir aquí es que si hay una pluralidad inconsistente y
cada elemento discernible en ella puede ponerse en correspondencia exclu-

5 Las expresiones ʻpluralidad consistenteʼ y ʻpluralidad inconsistenteʼ (konsistente,


bzw. inkonsistente Mannigfaltigkeit) habían sido utilizadas por Schröder en un libro
publicado en 1890 (VAL, vol. I, p. 213) para referirse a pluralidades que podemos o,
respectivamente, no podemos concebir como un todo (als ein Ganzes denken—p. 212).
Como ejemplo de pluralidad inconsistente cita un par de proposiciones contradictorias,
porque según él “el espíritu humano no es capaz de reunirlas”. Sin embargo, cualquier
demostración por reducción al absurdo tiene que reunir las conclusiones contradictorias
que deriva de la hipótesis que intenta refutar, para concluir que dicha hipótesis es falsa.
Es por cierto imposible concebir una situación que realice (“sea un modelo de”) un
par de proposiciones contradictorias, pero eso no impide concebir el todo formado por
las proposiciones mismas.
1.6 Paradojas y filosofemas 53

siva con un elemento de otra pluralidad, y viceversa, entonces esta última


también es inconsistente.
A continuación Cantor define los conceptos de ʻorden simpleʼ (nuestro
ʻorden linealʼ) y ʻtipo de ordenʼ, y dice que una pluralidad simplemente or-
denada se dice bien ordenada cuando cada una de sus partes tiene un primer
elemento. Agrega que, en aras de la brevedad, llamará ʻsecuenciaʼ (ʻFolgeʼ)
a toda pluralidad bien ordenada, y observa que cada parte de una secuencia
es también una secuencia. Define luego ʻnúmero ordinalʼ como el tipo de
orden de un conjunto bien ordenado y pasa a considerar “el sistema de to-
dos los ordinales”, que designa con la letra Ω.6 Recuerda haber demostrado
que si α y β son ordinales diferentes, o bien α฀ < β, o bien β฀ < α; que si
α, β y γ son ordinales tales que α฀ < β y β฀ < γ, entonces α฀ < γ, y que si
Z es una colección de ordinales hay en Z un ordinal que precede a todos
los otros. Concluye que el sistema Ω forma una secuencia ordenada por <.
Por lo tanto, si Ω fuese un conjunto, su tipo de orden sería un determinado
ordinal ζ. Entonces ζ, el tipo de orden de Ω, sería un ordinal posterior a
todos los elementos de Ω. Pero ζ ∈ Ω, puesto que Ω es el sistema de todos
los ordinales. Por lo tanto, ζ < ζ.7 Esta contradicción se llama Paradoja de
Burali-Forti, porque el matemático italiano la adujo —con otro propósito— en
un artículo publicado en 1897.8 Cantor infiere de ella, sencillamente, que el
sistema de los ordinales no es un conjunto sino una pluralidad absolutamente
infinita o inconsistente.
Enseguida nos invita a considerar el sistema de todos los alephs, que
designa con la última letra del alfabeto hebreo, Ê (tav). Como hay un aleph
ℵα para cada α฀∈฀Ω, la inconsistencia de Ω implica que Ê es inconsistente

6 Conviene quizás anotar que la expresión que usa Cantor para abreviar ʻOrdnungszahlʼ
(ʻnúmero ordinalʼ) es ʻZahlʼ (ʻnúmeroʼ).
7 El razonamiento resulta quizás más claro si invocamos la Proposición 4 del Apéndice
II: Un conjunto bien ordenado no puede ser isomorfo a uno de sus segmentos. Pero
si el ordinal ζ ∈ Ω es el tipo de orden de Ω, Ω es isomorfo a [ζ], el segmento de Ω
determinado por ζ. El lector a quien, con toda razón, le moleste la idea de que una
pluralidad inconsistente se diga bien ordenada puede reordenar así el razonamiento de
Cantor: Suponga primero que Ω es un conjunto; muestre que si lo es, está bien orde-
nado por <. Por lo tanto, Ω tiene un tipo de orden ζ ∈ Ω y es isomorfo al segmento
[ζ] ⊆ Ω. Como esto es imposible si Ω está bien ordenado, Ω no es un conjunto.
8 Burali-Forti 1897. Explico el argumento de Burali-Forti en el Apéndice IV.
54 El Paraíso de Cantor

(en virtud del primero de los tres asertos iniciales de Cantor arriba citados).
Cantor basa en esta conclusión un argumento que según él demuestra que
el cardinal de un conjunto infinito siempre es un aleph: Sea V una plura-
lidad infinita cuya numerosidad no es un aleph. Es claro, entonces, que,
cualquiera que sea el ordinal α, si ƒα es una inyección de [α] en V, ƒα no
es una biyección. De esto se sigue, según Cantor, que Ω es equinumeroso a
una pluralidad V′ ⊆ V.9 Por lo tanto, en virtud de los dos primeros asertos
iniciales de Cantor citados arriba, V′ y V son pluralidades inconsistentes y V
no puede ser un conjunto. Si el argumento precedente es válido, constituye
una demostración fácil del Teorema del Buen Orden: toda pluralidad cuyo
cardinal sea un aleph se deja biyectar en un segmento de Ω y bien ordenar
por ésta, y una pluralidad que no se deja bien ordenar, lisa y llanamente no es
un conjunto.10 Esta demostración —“por exclusión de lo disconforme”— en-
cierra un peligro. Como nadie sabría coordinar los puntos de un trazo con
un segmento de Ω, se puede pensar —o decidir— que ellos no constituyen
un conjunto. Este diagnóstico afectaría asímismo al sistema  de los nú-
meros reales y a todas las pluralidades equinumerosas con él. Para eliminar

9 Cantor no explica cómo llega a esta conclusión. Pero he aquí un modo como pudiera
haberla defendido. Digamos que una aplicación g está incluida en una aplicación h
(simbólicamente, g ⊆ h) si el dominio de g está incluido en el dominio de h y g(x) =
h(x) para cada x en el dominio de g. Sea V una pluralidad infinita cuyo cardinal no es
un aleph. Como V es infinito, es claro que hay una inyección ƒω: [ω] Æ V. Como el
cardinal de V no es ℵ0, es claro que ƒω฀ no es biyectiva y que hay por lo menos un
elemento de V que no está en el alcance de ƒω. Partiendo de ƒω puede establecerse una
secuencia transfinita de aplicaciones ƒα: [α] Æ V tales que, para cualesquiera ordinales
transfinitos α y β < α, (i) ƒβ ⊆ ƒα, (ii) ƒα es inyectiva y (iii) ƒα no es biyectiva. Sea
α > ω y supongamos que ƒβ está definida y satisface las condiciones (i)–(iii) para todo
ordinal transfinito β < α. Si α es un ordinal sucesor, hay un β ≥ ω tal que α = β +1,
y hay un elemento vβ ∈ V que no está en el alcance de ƒβ. ƒα: [β฀ + 1] Æ V se define
así: si γ < β, ƒα(γ) = ƒβ(γ); ƒα(β) = vβ. Si α es un ordinal límite, ƒα se define así: para
cada ordinal transfinito β < α, ƒα|[β] = ƒβ฀ (ƒα coincide con ƒβ en el dominio de esta
última). Estas definiciones aseguran que ƒα cumple en ambos casos las condiciones (i)
y (ii). Es obvio que también cumple la condición (iii), ya que de otro modo el cardinal
de V sería un aleph. La correspondencia α Å ƒα(α) entre Ω y la pluralidad {ƒα(α):α฀
∈฀ Ω} = V′฀ ⊂ V es biunívoca.
10 Se sabe que en 1896 ó 1897 Cantor envió a Hilbert una demostración del Teorema del
Buen Orden. No conocemos su tenor, pero G. H. Moore (1982, p. 51) conjetura que
se basaba en el mismo argumento utilizado en la carta a Dedekind del 2 de agosto de
1899. Hilbert no se dejó convencer.
1.6 Paradojas y filosofemas 55

esa opción —ruinosa para el proyecto de fundar el análisis en una teoría


de conjuntos— Cantor tendría que haber suplementado su demostración del
Teorema del Buen Orden con una prueba de la Hipótesis del Continuo.
Zermelo, que publicó dos pruebas bastante más elaboradas del Teorema
del Buen Orden en 1904 y 1908, levantó en 1932 dos objeciones contra el
argumento de Cantor: En primer lugar, la biyección de Ω en una parte de
V que Cantor invoca pero no define, tendría, al parecer, que definirse me-
diante una secuencia transfinita de selecciones sucesivas, lo cual significaría
aplicar nuestra intuición del tiempo a un proceso que rebasa toda intuición.
En segundo lugar, “la demostración opera con pluralidades ʻinconsistentesʼ,
y hasta posiblemente con conceptos contradictorios, y ya por eso sería ló-
gicamente inadmisible” (Cantor, GA, p. 451 n. 1). La primera objeción es
sin duda correcta.11 En sus demostraciones del Teorema del Buen Orden,
Zermelo la elude gracias a su famoso Axioma de Selección, que autoriza la
selección simultánea de un número infinito de objetos (vide Capitulo 1.7).
La segunda objeción, en cambio, me parece confusa. Contradictorio y, por
ende, lógicamente inadmisible, sería suponer que alguna de las pluralidades
inconsistentes mencionadas en la prueba de Cantor es una unidad, esto es,
un conjunto, pero no veo que su razonamiento envuelva tal suposición.
A Zermelo le ha inquietado quizás la liviandad con que Cantor designa
mediante una sola letra (Ω, V) a pluralidades que juzga imposible concebir
como unidades. Por la misma índole de tales pluralidades no está claro de
qué manera o en qué preciso sentido puede uno referirse a ellas con un
nombre o un pronombre. A primera vista parecería que una tal referencia no
es posible: si la existencia conjunta de los elementos de una cierta pluralidad
implica contradicción una denominación que pretendidamente los abarque
a todos simplemente no designa nada. Sin embargo, es claro que una frase
castellana como “los ordinales” se refiere a cada ordinal, aunque sea impo-
sible referirse a todos. Por ejemplo, si asevero que entre los ordinales no
hay un máximo, digo, sin ambigüedad ni oscuridad alguna, que para cada
ordinal hay otro que le sigue. En general, si el predicado ʻes un Pʼ distingue
ciertos objetos, puede usárselo en expresiones nominales tales como ʻlos Pʼ
o ʻ{x:x es un P}ʼ para denotar a esos objetos en su disgregada pluralidad

11 Cf. la construcción explicada en la nota 9. Obsérvese que envuelve la selección sucesiva


de objetos vα฀ ∈ V, uno para cada α฀ ∈฀ Ω.
56 El Paraíso de Cantor

aunque no se dejen congregar en un conjunto. Diré que la referencia a esos


objetos en tal caso es distributiva, pero no colectiva. Llamaré ʻdesignador
distributivoʼ a una expresión utilizada para referirse distributivamente a
ciertos objetos.12 Claro está que la referencia distributiva inevitablemente
confiere una suerte de unidad a la pluralidad referida. Se corre, entonces,
el riesgo de tratar a ésta de palabra como lo que no es de veras: un objeto
susceptible de agruparse con otros en nuevas unidades. En la Sección 1.8.4
consideraremos el procedimiento adoptado por von Neumann en la década de
1920 para obviar este riesgo, y que consiste en tratar a las pluralidades que
Cantor llamó inconsistentes como un tipo de objetos, sí, pero inconfundible
con los objetos ordinarios y en particular con los conjuntos, por cuanto en
una aseveración de la forma ʻx ∈ yʼ (ʻx es un elemento de yʼ) un objeto de
ese tipo sólo puede ser denotado por y, nunca por x.
El reconocimiento de que no toda pluralidad bien definida, esto es, caracte-
rizada mediante un criterio diagnóstico preciso, es un conjunto en el sentido
de Cantor no es fatal para su programa, pero suscita un problema que marcará
todo el ulterior desarrollo del mismo por otros autores. Cantor alude a él ya
en una tercera carta a Dedekind, del 28 de agosto de 1899. Específicamente,
se pregunta cómo puede uno saber que las pluralidades bien ordenadas a las
que él asigna los cardinales ℵ0, ℵ1,…, ℵω,…฀ ℵω1,…฀ son efectivamente
conjuntos. “¿No pudiera pensarse que ya estas pluralidades son ʻinconsisten-
tesʼ, sólo que la contradicción inherente en suponer la ʻexistencia conjunta
de todos sus elementosʼ todavía no se ha hecho notar?” (GA, p. 447). Su
respuesta es tan audaz como profunda:

La pregunta debe extenderse también a las pluralidades finitas y un


examen detenido conduce al resultado siguiente: aun en el caso de las
pluralidades finitas no cabe dar una “prueba” de su “consistencia”. En
otras palabras: el hecho de la “consistencia” de las pluralidades finitas es
una verdad simple, indemostrable, es “el axioma de la aritmética” (en el
antiguo sentido del término). Y del mismo modo, la “consistencia” de las
pluralidades a las que asigno los alephs como cardinales es “el axioma
de la ampliada aritmética transfinita”.
(Cantor, GA, pp. 447–48)

12 Por ejemplo, la frase ʻuniverso del discursoʼ, empleada en semántica para referirse a
todo cuanto pueda ser tema de conversación en el lenguaje bajo estudio, es ciertamente
un designador distributivo si el lenguaje en cuestión es natural.
1.6 Paradojas y filosofemas 57

Esta respuesta tiene dos aspectos que consideraré sucesivamente: (A) La duda
señalada afecta a la aritmética finita no menos que a la transfinita. (B) El
matemático tiene la libertad de superar tales dudas postulando axiomas.

(A) En un escrito anterior Cantor ya había observado que las limitaciones


humanas que alegadamente impiden o entraban la matemática del infinito
dificultan asímismo la consideración de cantidades finitas —al menos cuando
son muy grandes— y que los recursos de que la matemática se ha valido
tradicionalmente para superar tales limitaciones le sirven también para
pensar sobre lo infinito. El 28 de febrero de 1886 Cantor dirigió una carta
al médico berlinés, Dr. A. Eulenburg, sobre el “horror del infinito” común
entre médicos y hombres de ciencia. Luego la publicó, con otras sobre temas
afines, en una revista filosófica, bajo el título de “Comunicaciones sobre la
doctrina del transfinito” (Cantor 1887/88). La versión impresa incluye una
larga nota sobre el infinito matemático en la obra de San Agustín, Orígenes
y Santo Tomás de Aquino. Cantor cita in extenso el Capítulo 19 del Libro
XII de La Ciudad de Dios, donde San Agustín refuta a quienes sostienen
que las cosas “que son infinitas no pueden ser comprendidas ni siquiera
por el conocimiento divino”. No puede ser, dice San Agustín, que Dios no
conozca todos los números. Ahora bien, “cada número está determinado por
sus propiedades, de modo que ninguno de ellos puede ser igual a otro. Por lo
tanto, son desiguales y diversos entre sí, y aunque cada uno es finito, todos
son infinitos (et singuli quique finiti sunt, et omnes infiniti sunt).” Puesto que
lo que el conocimiento comprende tiene que “estar definido (finitur) por la
comprensión de quien conoce”, la infinidad de los números “está definida
(finita est) para Dios de cierta manera inefable (quoddam ineffabile modo)”.
Según Cantor, cuando San Agustín afirma que Dios capta totalmente, en forma
intuitiva, la multitud infinita de los números, “reconoce al mismo tiempo este
conjunto formalmente como un todo infinito actual, como un Transfinitum, y
nos vemos compelidos a seguirle en esto” (GA, p. 402). Se objetará quizás
que, aunque estemos forzados a admitir que el conjunto ˆ de los enteros
positivos es un objeto infinito, no nos es lícito entrar a considerar su ordinal
ω ni su cardinal ℵ0, por cuanto “nosotros, en nuestra esencial limitación,
no somos capaces de captar con un solo golpe de vista (uno intuitu) todos
los infinitos números individuales n que pertenecen al conjunto ˆ.” Contra
esta objeción, Cantor aduce que nadie es capaz de “representarse uno intuitu
58 El Paraíso de Cantor

distinta y precisamente” todas las unidades comprendidas en un número finito


bastante grande, por ejemplo, mil millones.

Y sin embargo tenemos derecho a considerar los números finitos, por


grandes que sean, como objetos del conocimiento discursivo humano, e
investigarlos científicamente según su modo de ser. El mismo derecho nos
compete con respecto a los números transfinitos.
[…]
Rara vez poseemos un concepto del que se pueda decir que es un
“conceptus rei proprius ex propriis”, con el que captamos y conocemos
adecuadamente una cosa tal como es en y por sí misma, sin ayuda de la
negación, de un símbolo o de un ejemplo. Antes bien, en nuestro conocer
dependemos casi siempre de un “conceptus proprius ex communibus” que
nos capacita para determinar una cosa mediante predicados generales y
con ayuda de comparaciones, exclusiones, símbolos o ejemplos, de suerte
que se distinga bien de cualquier otra cosa. Compárese, por ejemplo, el
método [explicado en el Capítulo 1.3] que usé para definir las magnitudes
numéricas irracionales. Iré al extremo de aseverar incondicionalmente
que este segundo modo de determinación y delimitación de las cosas es
incomparablemente más sencillo, más cómodo y más fácil en el caso de
los números transfinitos pequeños (por ejemplo, ω, u ω + 1, u ων, si ν es
un entero finito pequeño) que tratándose de números finitos muy grandes,
en cuyo caso, sin embargo, también hemos de recurrir al mismo medio
auxiliar ajustado a nuestra naturaleza imperfecta.
(Cantor, GA, pp. 402–3)

(B) La libertad del matemático es el tema de lo que, a mi modo de ver, es el


texto filosófico más importante que nos ha dejado Cantor. Constituye el § 8
del escrito Nº 5 de la serie “Sobre variedades lineales infinitas de puntos”,
que ya he citado varias veces. Empieza distinguiendo dos sentidos en que
cabe hablar de la existencia (Existenz) o realidad actual (Wirklichkeit) de
los números enteros, finitos o infinitos. Por una parte, podemos considerar
que ellos existen

en cuanto ocupan, sobre la base de definiciones, un lugar enteramente de-


terminado en nuestro entendimiento, se distinguen perfectamente de todos
los demás componentes de nuestro pensamiento, tienen determinadas rela-
ciones con ellos, y así modifican de una determinada manera la sustancia
de nuestro espíritu. Permitáseme llamar esta forma de realidad (Realität)
1.6 Paradojas y filosofemas 59

de nuestros números su realidad intrasubjetiva o inmanente.


(Cantor, GA, p. 181)

Por otra parte, en cuanto las distintas clases de números, (I), (II), (III), etc.,
son representantes de numerosidades que efectivamente se encuentran en la
naturaleza,

cabe también atribuir a los números realidad actual (Wirklichkeit) porque


hay que verlos como una expresión (Ausdruck) o reflejo (Abbild) de sucesos
y relaciones en el mundo exterior que enfrenta al intelecto. […] Llamo
esta segunda forma de realidad la realidad transubjetiva o trascendente.
(Cantor, GA, p. 181)

Ahora bien, la matemática, “en la elaboración de su caudal de ideas, tiene que


considerar única y exclusivamente la realidad inmanente de sus conceptos, y
no tiene ninguna obligación de examinarlos en lo que respecta a su realidad
trascendente” (GA, p. 182). Cantor no piensa, sin embargo, que cualquier
concepción arbitraria, con tal que no genere contradicciones, tiene derecho
a un lugar en el sistema de las ideas matemáticas. “La matemática es com-
pletamente libre en su desarrollo”, pero éste está sujeto a dos restricciones:
los conceptos matemáticos deben estar libres de contradicción interna, y
además deben “estar en relaciones firmes, ordenadas mediante definiciones,
con los conceptos previamente formados, ya existentes y probados” (GA, p.
182).13 Esta doble exigencia “deja al arbitrio un campo muy reducido”. Más
aún, “cada concepto matemático lleva en sí el correctivo necesario: si no es
idóneo y fecundo, él mismo lo demuestra muy pronto con su inutilidad, y
es entonces descartado por falta de éxito.” En cambio, según Cantor,

cualquier estrechamiento superfluo del afán de investigación matemática


envuelve un peligro mucho mayor, tanto más grande cuanto que no puede

13 Cantor prosigue: “En particular, al introducir nuevos números [la matemática] sólo
está obligada a dar de ellos definiciones que les confieran una tal determinación y,
eventualmente, una tal relación con los números más antiguos, que, dado el caso, se
puedan distinguir entre ellos de un modo determinado. En cuanto un número satisface
todas estas condiciones se puede y se debe considerarlo como existente y real (existent
und real) en la matemática” (GA, p. 182).
60 El Paraíso de Cantor

dársele ninguna justificación basada en la esencia de la ciencia; pues la


esencia de la matemática consiste justamente en su libertad.
(Cantor, GA, p. 182)

Con todo, en el mismo § 8 en que defiende tan rotunda e inequívocamente


los derechos de una matemática autónoma, basada en su propia inventiva
y fiel sólo a su propia historia, Cantor declara su convicción personal de
que la realidad inmanente y la realidad trascendente siempre concuerdan,
en cuanto

un concepto que deba caracterizarse como existente en el primer sentido


siempre posee también una realidad trascendente en ciertos —y en verdad,
en infinitos— respectos, cuya comprobación, claro está, es en general
una de las tareas más laboriosas y difíciles de la metafísica y suele tener
que diferirse hasta que el desarrollo natural de una de las otras ciencias
descubra el significado transcendente del concepto en cuestión.
(Cantor, GA, p. 181)14

Esta creencia de Cantor hace comprensible —aunque en mi parecer no justi-


fica— dos epígrafes latinos que puso a la cabeza de su obra más madura,
“Aportes a la fundamentación de la teoría de los conjuntos transfinitos”
(1895/97), a saber, la frase de Newton, “hypotheses non fingo” (“no forjo
hipótesis”), y otra, tomada de Francis Bacon, según la cual “no le damos
leyes al intelecto y a las cosas según nuestro arbitrio, sino que como es-
cribas fieles anotamos y transcribimos las que anuncia y pronuncia la voz
de la propia naturaleza.”15 Un tercer epígrafe, tomado de la Biblia, evoca
la observación, arriba citada, de que la comprobación de la realidad trascen-
dente de los conceptos matemáticos debe dejarse al trabajo futuro de otras
14 Cantor agrega en una nota que esta convicción suya concuerda con los principios de
la filosofía de Platón y “con un rasgo central del sistema de Spinoza”, el expresado
en la Prop. VII de la Parte II de la Ética: “El orden y la conexión de las ideas es el
mismo que el orden y la conexión de las cosas”
15 Dauben (1979), pp. 236–39, explica que con las expresiones citadas Cantor buscaba
sobre todo manifestar su rechazo de los infinitésimos y la geometría no-arquimédica de
Veronese (¿así entendía la libertad de la matemática?). Dauben señala que en una carta
a Vivanti del 13 de diciembre de 1893, en la que ya aducía —contra Veronese— la cita
de Bacon, Cantor equipara “la naturaleza” con “lo posible”. A la luz de la referencia
a Spinoza en Cantor 1883 (v. nota 14), me parece que esta equiparación no significa,
como sugiere Dauben, que lo que aquí se llama “la naturaleza” no es más que “lo
1.6 Paradojas y filosofemas 61

disciplinas: “Digo cosas que ahora están ocultas, pero llegará el tiempo en
que una persistente diligencia las saque a la luz del día.”
La polémica apasionada de Cantor en la década de 1880 contra quienes,
desde Aristóteles, han negado el infinito actual, puede entenderse como un
primer paso hacia la certificación de la realidad trascendente de los conceptos
inventados por él, pero también como un intento para demostrar informal-
mente su consistencia.16 En una carta a G. Eneström del 4 de noviembre
de 1885 (Cantor 1886), distingue tres modos como puede considerarse —y
cuestionarse— el infinito actual: (i) en cuanto es “lo absoluto” en Dios eterno
omnipotente y extramundano o natura naturans; (ii) en cuanto es “lo transfi-
nito”, presente en concreto en la natura naturata, y (iii) en cuanto puede ser
captado en abstracto por el conocimiento humano “en la forma de números
actualmente infinitos —o transfinitos, como los he llamado— o en la forma
aún más general de los tipos de orden transfinitos” (GA, p. 372). Dejando
de lado el primer modo, Cantor señala que los otros dos dan lugar a cuatro
posiciones filosóficas diferentes: algunos, como Cauchy, Gauß, León XIII (en
la encíclica De philosophia christiana) y “todos los llamados positivistas”,
niegan el infinito actual en concreto y en abstracto; otros, como Descartes,
Spinoza, Leibniz, Locke, Lotze, lo sostienen en concreto y lo niegan en
abstracto; algunos neoescolásticos lo niegan en concreto pero lo afirman en
abstracto; por último,

el infinito actual puede ser afirmado tanto en concreto como en abstracto;


pocos toman esta posición, que considero la única correcta; quizás sea
yo el primero que representa este punto de vista con plena decisión y en
todas sus consecuencias, pero estoy seguro de que no seré el último en
defenderlo.
(Cantor, GA, p. 373)

posible”, sino que “lo posible” es nada menos que “la naturaleza”: para Cantor, como
para nuestro contemporáneo David Lewis, lo posible es lo realmente real.
16 Cantor 1883, 1886, 1887/88 (GA, pp. 165ss., 370ss., 379ss.). Dauben 1979, Capítulo
6, resume y comenta muy bien “la filosofía del infinito” contenida en estos escritos.
62 El Paraíso de Cantor

Según Cantor, el error de los positivistas consiste en que de antemano atri-


buyen “o más bien imponen” a todos los números las propiedades de los
números finitos, “mientras que los números infinitos, si en absoluto han de
ser concebibles de algún modo, tienen que constituir, por su oposición a
los números finitos, una clase de números totalmente nueva, cuya índole
depende enteramente de la naturaleza de las cosas y es objeto de investiga-
ción, no de nuestro arbitrio o de nuestros prejuicios” (GA, p. 372).17 Así,
todos los argumentos de Aristóteles contra el infinito actual (por ejemplo,
en Metaph. Κ, 10) se basan en el supuesto de que no hay más que números
finitos, supuesto que Aristóteles infería, a su vez, de que sólo había cono-
cido enumeraciones de conjuntos finitos (GA, p. 174). De un modo análogo,
Santo Tomás de Aquino niega que pueda haber una multitud actualmente
infinita, por cuanto toda multitud es una multitud de una cierta especie, las
especies de multitud corresponden a las especies de números, y ninguna de
éstas es infinita, ya que todo número es una multitud medida por el uno
(Summa theol. I, q. 7, art. 4); pero este argumento desconoce que “en lo
transfinito está presente y en cierto modo almacenada una riqueza mucho
mayor de formas y de ʻspecies numerorumʼ que en el campo relativamente
pequeño de lo finito ilimitado” (GA, p. 404). Por último, el enfático rechazo
del infinito actual por grandes matemáticos del siglo XIX como Cauchy y
Gauß se explica en parte, según Cantor, como una reacción contra el uso y
abuso de lo infinitamente pequeño en la matemática del siglo XVIII —que
también Cantor repudia— pero también debe atribuirse a “una especie de
miopía, que nos roba la posibilidad de ver el infinito actual, a pesar de que
en [la forma de] su portador supremo y absoluto nos creó y nos conserva
y en sus formas secundarias, transfinitas, nos rodea por todas partes y mora
en nuestro espíritu” (GA, pp. 374–75).

17 Trascribo este pasaje, destacado en el original por el autor, porque Michael Hallett,
en un libro por lo demás bastante instructivo, hace gran caudal de lo que llama “el
principio del finitismo de Cantor”, que formula así: “Lo transfinito está a la par con
lo finito y matemáticamente se lo debe tratar, en lo posible, igual que a lo finito (like
the finite)” (Hallett 1984, p. 7).
1.7 EL TEOREMA DEL BUEN ORDEN
Y EL AXIOMA DE SELECCIÓN

“Aportes a la fundamentación de la teoría de los conjuntos transfinitos”


(1895/97) es la última publicación importante de Cantor. Deja sin resolver los
dos problemas de cuya solución —como vimos en el Capitulo 1.5— depende
la alegada suficiencia de la aritmética transfinita cantoriana para medir todas
las multitudes del universo: el problema del continuo y el problema del buen
orden. Cantor no tuvo éxito en sus intentos por demostrar la Hipótesis del
Continuo y no logró persuadir a Hilbert con su demostración del Teorema
del Buen Orden (Capitulo 1.6, nota 10). En una famosa conferencia ante el
Segundo Congreso Internacional de Matemáticos (París, 1900), Hilbert plan-
teó 23 problemas que la matemática del siglo XX debía encarar. El primero
de todos es “el problema de Cantor de la cardinalidad del continuo”. Las
investigaciones de Cantor sobre “los conjuntos de números reales ordinarios
o puntos” sugieren un teorema que Hilbert considera muy plausible: Todo
conjunto infinito de números reales es equinumeroso ya sea con el conjunto
de los enteros positivos {1, 2,…}, ya sea con el conjunto de todos los rea-
les, es decir, con el continuo mismo. A este propósito, Hilbert menciona otra
tesis de Cantor que quizás encierre la clave de una demostración del teorema
anterior: El conjunto de todos los números reales se deja ordenar bien.

Me parece sumamente deseable obtener una prueba directa de este no-


table aserto de Cantor, tal vez indicando efectivamente un ordenamiento
de los números tal que dentro de cada subconjunto pueda señalarse un
primer número.
(Hilbert, GA, III, p. 299)

El Tercer Congreso Internacional de Matemáticos se reunió en Heidelberg


en el verano de 1904. El 10 de agosto, Julius König presentó un argumento
que demostraba, según él, que el cardinal del continuo no es un aleph y
que, por consiguiente, el conjunto de los números reales no puede ser bien
ordenado. Esta conclusión se deduce de la igualdad

63
64 El Paraíso de Cantor

฀ ℵαℵ0 =ℵα · 2ℵ0 (1)

(donde α es un ordinal cualquiera), que König toma de la disertación doctoral


completada en 1901 bajo la tuición de Hilbert por el discípulo de Cantor,
Felix Bernstein. Es fama que Cantor quedó consternado después de escuchar
la ponencia de König; pero esa misma noche Zermelo detectó una falla en
su razonamiento y la comunicó al Congreso al otro día: la demostración
de la igualdad (1) ofrecida en la disertación de Bernstein no vale con toda
la generalidad requerida por König, sino únicamente si α < ω (y de hecho
Bernstein mismo usa (1) sólo en este caso).1 Seis semanas después, en una
carta fechada el 24 de septiembre, Zermelo hizo llegar a Hilbert la prueba
del Teorema del Buen Orden que bosquejaré a continuación.
Como Zermelo (1904) señala al final de su prueba, ella depende esencial-
mente del siguiente supuesto:

AS Si K es una colección de conjuntos no vacíos y K es el conjunto de


todos los elementos pertenecientes a los conjuntos de la colección
K (K = UK), hay una aplicación ƒ:K → K tal que, para cada k ∈
K, ƒ(k) ∈ k.

Como ƒ, por así decir, “selecciona” un elemento de cada conjunto de la


colección K, diré que ƒ es un selector para K y llamaré a ƒ(k) el elemen-
to selecto del conjunto k. Para probar que un conjunto cualquiera M ≠ ∅
se deja ordenar bien, Zermelo considera un selector para PM\{∅}, al que
designa con la letra γ (γ selecciona un elemento en cada parte no vacía de
M). Diremos, con Zermelo, que una parte G de M es un γ-conjunto si G
está bien ordenada por una relación <G y, para g ∈ G, g = γ(M\{x฀ ∈฀G:฀
x฀<G฀g}) (g es el elemento seleccionado por γ en el complemento en M del

1
König 1905 es una versión corregida de esta ponencia. Allí König admite que sólo
ha demostrado la proposición condicional: “Si el lema (1) de Bernstein vale para
todo ordinal α, entonces la Hipótesis del Continuo es falsa”. Como, por otra parte,
la falsedad de la hipótesis del continuo implica el lema (1), la negación de este lema
puede tomarse como una formulación alternativa de la Hipótesis del Continuo que los
partidarios de ésta podrían ensayarse en demostrar. König 1905a combate la posibilidad
de bien ordenar el continuo con otro argumento.
1.7 El Teorema del Buen Orden 65

conjunto de los predecesores de g en 〈G,<G〉). Diremos asímismo que un


elemento g ∈ M es un γ-elemento si g pertenece a un γ-conjunto. Así, por
ejemplo, es claro que el elemento selecto de M, γ(M), es un γ-elemento,
puesto que {γ(M)} reúne los requisitos para ser un γ-conjunto (está bien
ordenado, en un sentido trivial, y su único elemento es precisamente el
elemento seleccionado por γ en el complemento del conjunto ∅ de sus
predecesores). Como un γ-conjunto es un conjunto bien ordenado, su tipo
de orden es un ordinal. Sean α y β los tipos de orden de los γ-conjuntos
〈Gα,<α〉 y 〈Gβ,<β〉, respectivamente. Si α < β, hay un morfismo inyecti-
vo ϕ: Gα →฀ Gβ (Apéndice II, Proposición 5). Supongamos que ϕ(x) ≠
x para algún x ∈ Gα. Entonces {x ∈Gα:x ≠ ϕ(x)} es una parte no vacía
del conjunto bien ordenado Gα y tiene, por ende, un primer elemento g1.
Entonces U = {x ∈Gα:x <α ϕ(x)} = {ϕ(x):x ∈Gα ∧ ϕ(x) <β ϕ(g1)} = V y,
por definición, g1 = γ(M\U) = γ(M\V) = ϕ(g1). Vemos así que {x ∈Gα:
x ≠ ϕ(x)} = ∅ y que ϕ(x) = x para cada x ∈ Gα. De suerte que Gα ⊆ Gβ
y, como ƒ es un morfismo, la relación <α concuerda en Gα con <β. Lla-
maré Mγ al conjunto de todos los γ-elementos de M (Zermelo lo llama Lγ,
pero no veo la ventaja de introducir una letra nueva para este propósito).
Sabíamos ya que Mγ ≠ ∅. Ahora hemos aprendido que Mγ es la unión de
una secuencia, posiblemente transfinita, de γ-conjuntos G1, G2,… tales
que G1 ⊆ G2 ⊆… Obsérvese, en particular, que G1 = {γ(M)}, de modo
que γ(M) figura —como primer elemento— en cada γ-conjunto. Sean a y
b dos γ-elementos y sea α el primer ordinal tal que {a,b} ⊆ Gα. Digamos
que a < b si a <α b. Es claro que < determina un orden lineal en Mγ. Este
orden es un buen orden. Para comprobarlo, consideremos un conjunto no
vacío A ⊆ Mγ y un a ∈ A. Sea α el primer ordinal tal que a ∈ Gα. En-
tonces {x ∈Mγ:x ≤ a} ⊆ Gα y si B = A ∩ {x ∈Mγ:x ≤ a}, < concuerda con
la relación de buen orden <α en B ⊆ Gα. Por lo tanto, 〈B,<〉 tiene un pri-
mer elemento, que es también el primer elemento de 〈A,<〉. Vemos así que
cualquier parte no vacía de Mγ tiene un primer elemento en el orden <.
Por lo tanto 〈Mγ,<〉 es un conjunto bien ordenado. Finalmente, probaré que
Mγ = M. Sea M* = M\Mγ. Si M* ≠ ∅, podríamos extender el orden < a
Mγ ∪ {γ(M*)} estipulando que para todo x ∈ Mγ, x < γ(M*). Entonces,
evidentemente, Mγ ∪ {γ(M*)} sería un γ-conjunto y γ(M*) ∈ Mγ. Como
esto es imposible, dada la definición de M*, concluimos que M* = ∅ y
que M es idéntico al conjunto bien ordenado Mγ. Como M es un conjunto
66 El Paraíso de Cantor

cualquiera, todo conjunto admite un buen orden.


El supuesto AS que Zermelo destaca expresamente al final de su prueba
se conoce desde entonces como el Axioma de Selección (alemán, Auswahls-
axiom; francés, Axiome du Choix; inglés, Axiom of Choice).2 Dice Zermelo al
respecto: “Este principio lógico no puede derivarse de otro más simple, pero
se aplica universalmente sin titubeos en el razonamiento matemático” (1904,
p. 516). Vemos así que para establecer como un teorema lo que Cantor había
llamado “una ley del pensamiento” Zermelo tiene que invocar un “principio
lógico” que no figura en los escritos de Aristóteles, ni en las obras más
recientes de Boole o de Frege. No sabría decir si el Axioma de Selección
es más simple que el Teorema del Buen Orden. Lo que sí es claro es que
la adopción de cualquiera de los dos como principio que no se demuestra
permite demostrar al otro. El Teorema del Buen Orden se infiere del Axioma
de Selección, como hemos visto, con un argumento sutil pero no difícil. El
Axioma de Selección se deduce del Principio del Buen Orden de un modo
brutalmente fácil: Sea K una colección de conjuntos no vacíos y < un buen
orden en K = UK. Entonces k ∈ K sólo si k ⊆ K y evidentemente hay un
selector ƒ:฀K → K que asigna a cada k ∈ K un valor ƒ(k) ∈ k, a saber, la
aplicación que asigna a k su primer elemento en 〈K,<〉.
La demostración del Teorema del Buen Orden por Zermelo (1904) causó
gran revuelo entre los especialistas y reacciones muy adversas, especialmente
en Francia. Los ilustres matemáticos Borel y Lebesgue, que habían dado
táctiamente por supuesto el Axioma de Selección en trabajos anteriores, lo
declararon inadmisible cuando vieron que podía invocárselo para establecer
la conclusión, a juicio suyo inverosímil, de que el continuo se deja ordenar
bien. No puedo entrar aquí en los detalles de esta polémica, que G. H. Mo-
ore analiza lúcidamente en su magistral historia del Axioma de Selección
(1982).
En respuesta a sus críticos, Zermelo produjo la “Nueva demostración de
la posibilidad de un buen orden” (1908a). El artículo está dividido en dos
partes que contienen la nueva demostración y un examen de las objeciones
contra la demostración anterior, respectivamente. La segunda demostración
depende del Axioma de Selección, como la primera, pero difiere de ella en
cuanto ahora Zermelo evita cuidadosamente invocar resultados de la teoría

2
Algunos autores de habla castellana prefieren decir ʻAxioma de Elecciónʼ.
1.7 El Teorema del Buen Orden 67

cantoriana de los ordinales. Antes bien, al mostrar cómo se puede introducir


un buen orden en cualquier conjunto M —dado un selector para PM\{∅}
—Zermelo ilumina la estructura subyacente a esa teoría y prepara el terreno
para su reformulación puramente conjuntista en términos de las relaciones
∈ y ⊆.
La demostración va precedida del enunciado explícito de dos supuestos
no demostrados: (I) Todos los elementos de un conjunto M que cumplen una
condición bien definida E forman un subconjunto (Untermenge) ME ⊆ M; el
complemento M\ME también es un conjunto. (II) Todos los subconjuntos de
un conjunto M forman un conjunto PM. Por cierto, la matemática conjuntista
había hecho uso de estos supuestos sin formularlos. Como veremos en la
Sección 1.8.1, ambos figuran en la lista de axiomas para la teoría de conjuntos
que Zermelo publicó ese mismo año (1908a). El Teorema del Buen Orden se
enuncia como una proposición hipotética: Un conjunto M es bien ordenable
si hay un selector para PM\{∅}. Después de completar la prueba de la
misma, Zermelo enuncia el Axioma de Selección, en virtud del cual es lícito
desglosar la apódosis: Todo conjunto es bien ordenable. La argumentación
de Zermelo se dirige a probar que si M es un conjunto no vacío y ƒ es un
selector para PM\{∅}, hay un y sólo un M ⊆ PM tal que (i) M está bien
ordenado por la relación de inclusión propia ʻX ⊆฀ Y ∧฀ X ≠ Yʼ (ʻY incluye
a X, pero no es igual a Xʼ), que simbolizaré ʻY ⊃ Xʼ, y (ii) la restricción
ƒM de ƒ a M\{∅} es una biyección de M\{∅} sobre M. Como es obvio,
M está bien ordenado entonces por la relación < definida como sigue, para
cualquier par de elementos x, y ∈ M: x < y ⇔ ƒM-1(x) ⊃ ƒM-1(y). (Decimos
que de esta manera ƒM induce en M el buen orden de M).3
Zermelo responde a objeciones formuladas por Borel y Peano, Poincaré,
Philip Jourdain y Schoenflies. Me limitaré a considerar las primeras. Borel
y Peano habían reclamado una prueba del Axioma de Selección. Zermelo
responde que en matemáticas la indemostrabilidad no equivale a la invali-
dez, pues, como es sabido, no todo se puede demostrar. Concede que “no
puede forzar a nadie apodícticamente a reconocer” el Axioma, pero a la vez
arguye que éste reúne los tres requisitos que, a su modo de ver, justifican la
adopción de un postulado en matemáticas: (a) con frecuencia ha sido utili-

3
En el Apéndice V doy una paráfrasis de la segunda demostración del Teorema del
Buen Orden por Zermelo.
68 El Paraíso de Cantor

zado tácitamente en diversos campos de la matemática y especialmente en


teoría de conjuntos, (b) es evidente de suyo y (c) responde a una necesidad
científica, pues son muchas las proposiciones importantes que sólo pueden
demostrarse invocándolo. De estas tres condiciones sólo la tercera ha demos-
trado tener verdadera fuerza. A la lista ofrecida por Zermelo de siete teoremas
importantes que no se pueden demostrar sin ayuda del Axioma, han venido
a agregarse desde 1908 muchísimos más, al punto de que hoy por hoy el
típico especialista en álgebra, topología o análisis diría que si lo privan del
Axioma le están quitando el suelo bajo sus pies. Zermelo corona su respuesta
con un devastador argumentum ad hominem: Peano no necesita el Axioma
de Selección en su trabajo profesional debido a que el sistema lógico-mate-
mático expuesto en su Formulaire des Mathématiques genera la paradoja de
Russell, de la cual se puede deducir lo que a uno le dé la gana.
Más significativa que la objeción de Peano me parece la de Poincaré. En
una serie de tres artículos sobre “Las matemáticas y la lógica” (1905/1906),
el gran matemático y filósofo francés descargó el peso de su autoridad y el
fuego de su elocuencia a la vez sobre el conjuntismo de Cantor y sobre el
logicismo de Peano, Russell y Couturat. Poincaré estima que estos programas
de fundamentación de las matemáticas andan completamente extraviados. De
ahí las paradojas que, a su modo de ver, aquejan a ambos por igual. Según
Poincaré, las paradojas nacen del empleo de términos cuya definición envuel-
ve una forma de circularidad qué él juzga viciosa. Así, el término ʻconjunto
de todos los conjuntos que no son elementos de sí mismosʼ supuestamente
denota un objeto caracterizado mediante una alusión a la totalidad de los
conjuntos, uno de los cuales es precisamente ese objeto. Asímismo el ordinal
de todos los ordinales, nombrado en la paradoja de Burali-Forti, se define
por la expresión ʻtodos los ordinalesʼ, cuya extensión lo contiene. Caracte-
rizar el término t nombrando un determinado conjunto K tal que t ∈ K es
como repetir el definiendum en el definiens, puesto que cualquier expresión
que nombre a K = {x:฀ x ∈฀ K} denota, entre otros, al objeto que se busca
designar con t. Poincaré objetó a la primera prueba del Teorema del Buen
Orden por Zermelo (1904) que la caracterización de los γ-conjuntos, que
figuran decisivamente en ella, peca de este vicio. Zermelo (1908a) no sólo
reconoce que ello es así, sino que para explicar a sus lectores la objeción de
Poincaré, cita un ejemplo tomado de su segunda prueba, a saber, el término
M que designa la intersección de todas las ƒ-cadenas de M, la cual —como
1.7 El Teorema del Buen Orden 69

luego se prueba— es ella también una de esas ƒ-cadenas (v. Apéndice V).
Debido a un desplazamiento semántico que ya se manifiesta en este texto
de Zermelo, las definiciones que Poincaré juzga circulares y los términos
definidos por ellas suelen distinguirse con el epíteto ʻno predicativoʼ o
ʻimpredicativoʼ.4 Zermelo observa que el uso de términos no predicativos
es endémico en el análisis: ellos figuran en cada demostración “en que el
máximo o el mínimo de un conjunto numérico ʻcerradoʼ definido previamente
se utiliza para llegar a nuevas conclusiones. Así ocurre, por ejemplo, en la
conocida prueba del Teorema Fundamental del Álgebra por Cauchy, sin que
hasta ahora se le haya ocurrido a nadie hallar en ella algo ilógico” (Zermelo
1908, p. 524).5 Y la verdad es que nadie reconocería un procedimiento falaz
en la descripción de diciembre como “el último mes del año” o del perihelio
de Mercurio como “el punto de la órbita de Mercurio que está más cerca
del sol”. En un diccionario filosófico reciente, Christian Thiel, que milita
entre los enemigos de la ʻimpredicatividadʼ, amaña su definición para evi-
tar los contraejemplos de este género. Impredicativo, según Thiel, es “un

4
Russell (1906) llama ʻpredicativaʼ a una condición (“función proposicional”) que de-
termina un conjunto; ʻno predicativaʼ, entonces, es una que no logra hacerlo, como la
condición ʻx es el conjunto de todos los conjuntosʼ. Poincaré (1905/1906) dice que “las
definiciones que deben ser consideradas como no predicativas son aquellas que contie-
nen un círculo vicioso” (CM, p. 147). Zermelo, que probablemente no había leído el
artículo de Russell, da la impresión de entender que Poincaré en este pasaje —destacado
en cursiva— está definiendo el término ʻdefinición no predicativaʼ. Poincaré acepta
aparentemente esta interpretación en su “Logique de lʼinfini” (1909), cuando distingue
“dos especies de clasificaciones aplicables a los elementos de las colecciones infinitas:
las clasificaciones predicativas, que no pueden ser quebrantadas por la introducción de
nuevos elementos, y las clasificaciones no predicativas, que la introducción de nuevos
elementos obliga a modificar incesantemente” (DP, p. 10). Doy más detalles sobre este
asunto en el Capitulo 2.4.
5
El Teorema Fundamental del Álgebra dice que todo polinomio de grado n ≥ 1, con
coeficientes complejos, a0 + a1x1 +…+ anxn, tiene por lo menos una raíz (en el cuerpo
Ç de los complejos). Un caso ejemplar de impredicatividad es la definición habitual del
supremo o cota superior mínima de un conjunto K ⊂ Â: para todo x, z, y w ∈฀ Â, x
es el supremo de K si y sólo si (i) si w ∈ K, entonces w ≤ x, y (ii) si para cualquier
w ∈ K, z ≥ w, entonces z ≥ x. (El ínfimo o cota inferior máxima de K ⊂ Â se define
análogamente, mutatis mutandis). Buena parte del análisis clásico depende de un teo-
rema que dice que todo conjunto de números reales que tiene una cota superior posee
un supremo y todo conjunto de números reales que tiene una cota inferior posee un
ínfimo.
procedimiento para delimitar o caracterizar un objeto, que en la descripción
del mismo hace referencia a una totalidad de objetos que…comprendería
al propio objeto en cuestión, y cuyos elementos no pueden todos generarse
constructivamente” (cursiva mía).6 Conforme a esta nueva definición, claro
está, el vicio de impredicatividad no consiste en que se aduzca “circularmen-
te”, para fijar la referencia a cierto objeto, una totalidad que lo presupone,
sino más bien en que la totalidad en cuestión no satisface un requisito de
construibilidad que habría que especificar y justificar. Como la matemática
conjuntista no se deja imponer tales requisitos, el desacuerdo entre Poincaré
y Zermelo nos sitúa, de hecho, en la línea divisoria entre dos grandes ver-
tientes del pensamiento matemático del siglo XX.

6
Mittlestraß, EPW, s.v. imprädikativ/Imprädikativität.
1.8 AXIOMAS PARA UNA TEORÍA DE CONJUNTOS

1.8.1 Zermelo (1908)

Respondiendo a la objeción de Peano contra su primera demostración del


Teorema del Buen Orden, Zermelo observa que el sistema lógico-matemático
de ese autor cae presa de la paradoja de Russell porque no distingue entre
ʻconjuntoʼ y ʻclaseʼ.

En cambio, como pronto mostraré en otro lugar, los partidarios de la teo-


ría de los conjuntos como disciplina puramente matemática, que no está
constreñida por los conceptos fundamentales de la lógica tradicional, son
perfectamente capaces de evitar, mediante una apropiada especialización
de sus axiomas, todas las “antinomias” conocidas hasta ahora.
(Zermelo 1908, p. 115)

El escrito anunciado apareció ese mismo año (Zermelo 1908a). Con él nace
la teoría axiomática de conjuntos.
La idea de una teoría axiomática procede de Aristóteles, para quien todo
conocimiento científico propiamente tal (§pistÆmh) se establece por inferencia
deductiva a partir de principios (érxa¤) de dos clases, a saber, conceptos
que no se definen y aseveraciones que no se demuestran. En la literatura
filosófica posterior se los llama, respectivamente, ʻprimitivosʼ y ʻaxiomasʼ.
Los primitivos no tienen que definirse porque cualquiera los entiende. No
es posible, pero tampoco es preciso, demostrar los axiomas, porque son de
suyo evidentes.1 Tradicionalmente se ha visto en los Elementos de Euclides
(publicados alrededor de un cuarto de siglo después de muerto Aristóteles)
una realización ejemplar de esta idea de ciencia. No comparto esta opinión.2

1
Aristóteles explica su idea de una ciencia deductiva en los Segundos Analíticos. Scholz
(1930) ofrece una interpretación de esa obra a la luz de la axiomática moderna (en
el estilo de Hilbert). Sobre esta materia, puede también consultarse mi artículo, “El
método axiomático” (1993).
2
Véase Torretti 1978, pp. 5–9.

71
72 El Paraíso de Cantor

A mi modo de ver, la concepción aristotélica de una ciencia edificada por


deducción rigurosa sobre principios de suyo inteligibles o evidentes no
vino a realizarse hasta 1882, en las Lecciones sobre geometría moderna de
Moritz Pasch.
La exposición sistemática de la geometría en el libro de Pasch parte de
ciertos conceptos primitivos concernientes a la figura, tamaño y posición
recíproca de los cuerpos. Dichos conceptos no se definen, pues ninguna
definición podría sustituir a “la indicación de objetos naturales apropiados”,
que es la única vía para entender nociones tan simples e irreductibles como
éstas (Pasch 1882, p. 16). Todos los demás conceptos utilizados se definen
en términos de los primitivos o de otros conceptos ya definidos. Los axiomas
(Grundsätze) conectan los conceptos primitivos entre sí. Aseveran “lo que se
observa en ciertas figuras muy simples” y su contenido geométrico no puede
captarse aparte de esas figuras (1882, p. 43). Todas las demás aseveraciones
de la geometría —sus “teoremas” (Lehrsätze)— se deducen de los axiomas
o de teoremas ya deducidos. Así, “todo lo que se necesita para probar los
teoremas tiene que estar consignado (niedergelegt), sin excepción, en los
axiomas” (1882, p. 5). “Cada conclusión a la que se llega en una prueba tiene
que hallar su confirmación en la figura, pero no se justifica por la figura sino
por una determinada proposición (o definición) precedente” (1882, p. 43).
En agudo contraste con el mismo Aristóteles y la larga tradición de sus
intérpretes, Pasch comprendió a cabalidad las implicaciones de esta idea de
una ciencia rigurosamente deductiva.

De hecho, si la geometría ha de ser realmente deductiva, el proceso de


inferencia debe ser siempre independiente del sentido de los conceptos
geométricos, tal como debe ser independiente de las figuras. Sólo pueden
considerarse las relaciones entre los conceptos geométricos consignadas
en las proposiciones y definiciones utilizadas. Durante la deducción es sin
duda lícito y útil pensar en el significado de los conceptos geométricos que
se presentan, pero ello no es en absoluto necesario; de modo que cuando
resulta indispensable, esto indica, justamente, que la deducción tiene lagu-
nas y —si no es posible llenarlas modificando el razonamiento— que las
proposiciones aducidas como medios de prueba son insuficientes.
(Pasch 1882, p. 98)

Este pasaje anticipa el nuevo giro que Hilbert le dará poco más tarde a la
idea de una ciencia deductiva, y que inspirará, prácticamente sin rivales, todas
1.8 Axiomas para una teoría de conjuntos 73

las axiomatizaciones de teorías matemáticas en el siglo XX. Si el significado


de los conceptos primitivos —fijado intuitivamente por “indicación de objetos
naturales apropiados”— nada contribuye a la justificación de los teoremas,
la teoría deductiva en cuestión valdrá lo mismo para el sistema de objetos
indicado que para cualquier otro sistema de objetos cuyas relaciones mutuas
satisfagan las condiciones estipuladas en los axiomas. Así, por ejemplo, la
teoría del espacio euclidiano axiomatizada por Hilbert retiene todo su valor
si se entiende que un “punto” es un trío ordenado de números reales, que
una “recta” o un “plano” es un cierto conjunto de “puntos” que satisfacen
un cierto tipo de ecuaciones, se interpretan los otros primitivos de Hilbert
de un modo apropiado —por ejemplo, el “punto” x = 〈x1,x2,x3〉 “incide” en
el plano π, si los números x1, x2 y x3 forman una solución del sistema de
ecuaciones lineales constitutivo de π— y se define la “distancia” δ(v,u) entre
dos “puntos” v = 〈v1,v2,v3〉฀ y u = 〈u1,u2,u3〉฀ por la relación pitagórica

12
 3 2
δ(v, u) =  ∑ ( vi − ui ) 
 i=1 

Como Hilbert le explica a Frege el 29 de diciembre de 1899:

Naturalmente, cada teoría es sólo un andamiaje (Fachwerk) o esquema de


conceptos con sus necesarias relaciones mutuas, y los elementos básicos
pueden pensarse como se quiera (in beliebiger Weise). Si pienso que mis
puntos son cualquier sistema de cosas, vgr. el sistema amor, ley, des-
hollinador,…, con que luego sólo postule la totalidad de mis axiomas
como relaciones entre estas cosas, mis teoremas —el de Pitágoras, por
ejemplo— valen también para ellas. En otras palabras: cada teoría puede
siempre aplicarse a infinitos sistemas de elementos básicos. Basta aplicar
una transformación unívoca invertible [una biyección—R.T.] y estipular
que los axiomas homólogos valen para las transformadas.
[Hilbert a Frege, 29.12.1899, en Frege, WB, p. 67]

Las lúcidas observaciones de Pasch y Hilbert que he citado dan al traste


con la idea de Gergonne (1818), repetida por varios autores a comienzos de
este siglo, según la cual los axiomas de una teoría proveen una definición
implícita de sus primitivos. De hecho, es muy poco o nada lo que los axiomas
pueden decir acerca de la índole de los objetos que los primitivos denotan.
Es claro, en cambio, que los axiomas definen explícitamente una clase de
74 El Paraíso de Cantor

objetos complejos, a la que pertenece cada sistema de elementos básicos que


cumple con las condiciones estipuladas por ellos. Si a una lista de axiomas
compatibles entre sí viene a agregarse otro que no es una consecuencia de los
anteriores, la clase definida se restringe. (En particular, si el nuevo axioma
es incompatible con los demás, la clase definida se reduce a ∅). Cuando se
habla de “especializar” los axiomas de una disciplina matemática, uno pen-
saría normalmente que se trata de restringir de este modo el alcance de sus
aplicaciones potenciales. Por ejemplo, si eliminamos el Axioma IV (Axioma
de las Paralelas) de la lista propuesta en Los fundamentos de la geometría
de Hilbert (1899), la clase de objetos complejos caracterizada por la teoría
resultante incluye todos los ejemplos concebibles de espacio euclidiano y
todos los ejemplos concebibles de espacio de Lobachevsky (entiéndase: de
tres dimensiones). Al agregar el Axioma IV la teoría se especializa y deja
de ser aplicable a los espacios de Lobachevsky.3 En cambio, la teoría obte-
nida agregando la negación del Axioma IV caracteriza precisamente a los
espacios de Lobachevsky y no es aplicable a los euclidianos. Por último, si
agregamos a los Axiomas I–III y V de Hilbert tanto el Axioma IV como su
negación, obtenemos una teoría tan especializada que no podría haber nada
a lo que fuese aplicable. Sorprende, pues, que Zermelo pretendiese limpiar
de contradicciones a la teoría de conjuntos por la vía de especializar sus
axiomas.
Aunque influida por la obra de Hilbert, la teoría axiomática de conjuntos
de Zermelo tiene características peculiares, impuestas por la naturaleza de
su tema. Una que salta a la vista concierne a la manera de referirse a éste.
Normalmente, una teoría axiomática se refiere a uno o más conjuntos de
objetos, cuyos atributos y relaciones son caracterizados por los axiomas.4
Pero como la teoría de Zermelo intenta justamente caracterizar el atributo de
ser un conjunto no puede invocarlo de entrada al acotar su tema. Leemos,
por eso, que “la teoría de conjuntos concierne a un ʻdominioʼ  de objetos
3
El Axioma IV de Hilbert dice que si a es una recta cualquiera y A es un punto fuera
de a, en el plano determinado por a y A hay a lo sumo una recta que pasa por a y no
intersecta a A. El Axioma IV es falso en un espacio de Lobachevsky. En tal espacio
no hay rectángulos y el cuarto ángulo de un cuadrilátero con tres ángulos rectos es
siempre agudo.
4
Hilbert invita al lector a concebir “tres sistemas de cosas” (que llama ʻpuntosʼ, ʻrectasʼ
y ʻplanosʼ), donde —como señalé en la nota 3 del Capitulo 1.2— ʻsistemaʼ (System)
es el término que usaba Dedekind en lugar de ʻconjuntoʼ (Menge).
1.8 Axiomas para una teoría de conjuntos 75

que simplemente llamamos ʻcosasʼ, una parte de las cuales está formada
por los ʻconjuntosʼ.”5 Para comprender esta oración no tenemos que saber
lo que significa la palabra ʻconjuntoʼ, ya que esto es lo que los axiomas
buscan determinar, pero ciertamente tenemos que entender la frase ʻdominio
de objetosʼ. Ahora bien, se preguntará el lector ¿no denota esta frase exac-
tamente lo que hasta aquí, siguiendo a Cantor, hemos llamado ʻconjuntoʼ?
¿asistimos, entonces, a un acto de prestidigitación verbal? En la Sección
1.8.5 presentaré la profunda y original respuesta a tales preguntas que años
más tarde ofrecerá Zermelo (1930). Pero por ahora podemos encarar este
asunto así: la expresión ʻel conjunto Kʼ, en su acepción cantoriana, designa
colectivamente a los elementos de K; en cambio, la frase ʻel dominio ʼ
designa distributivamente a las cosas cuyos atributos y relaciones Zermelo
busca caracterizar con sus axiomas. En efecto, si ʻel dominio ʼ designase
un objeto formado por esas cosas, se podría discernir en  otro objeto ,
formado por aquellas cosas de  que son conjuntos; entonces , no importa
como se lo describa, sería en efecto el conjunto de todos los conjuntos, cuya
existencia es contradictoria.
Otra diferencia notoria entre la teoría de Zermelo y las axiomáticas habi-
tuales concierne al número y complejidad de los primitivos. Mientras la
geometría de Hilbert tiene ocho, a saber, tres predicados monádicos (ʻpun-
toʼ, ʻrectaʼ, ʻplanoʼ), cuatro diádicos (dos especies de incidencia y dos de
congruencia) y uno triádico (ʻel punto x está entre los puntos z y wʼ), la
teoría de Zermelo sólo tiene un predicado monádico, ʻx es un conjuntoʼ, y
uno diádico, ʻx es un elemento del conjunto yʼ (simbolizado ʻx ∈ yʼ). Entre
esos ocho primitivos, los axiomas de Hilbert postulan relaciones sumamente
complejas, las cuales caracterizan su dominio con tal precisión que, a fin
de cuentas, cualquier modelo (realización) de la geometría de Hilbert es iso-
mórfico† a cualquier otro. Si una teoría axiomática posee esta propiedad se
dice que es monomórfica o categórica. La teoría de Zermelo no es categórica,

5
“Die Mengenlehre hat zu tun mit einem ʻBereichʼ  von Objekten, die wir einfach
als ʻDingeʼ bezeichnen wollen, unter denen die ʻMengenʼ einen Teil bilden” (Zermelo
1908a, p. 262). En virtud del Axioma II si a es una “cosa” del dominio  hay en 
por lo menos un conjunto k tal que a ∈ k. Así, pues, todas las “cosas” de que habla
la teoría axiomática de Zermelo son elementos de conjuntos. Aquéllas que no son con-
juntos a su vez se conocen en la literatura matemática como Urelemente (ʻelementos
primordialesʼ).
76 El Paraíso de Cantor

y podría pensarse por ello que ofrece una caracterización insuficiente de su


tema. Para muchos éste es un defecto de la teoría axiomática de conjuntos
que Fraenkel intentará subsanar pero que según Skolem y von Neumann no
tiene remedio. Por su parte, Zermelo (1930) sostendrá que la no-categorici-
dad es una virtud imprescindible en una teoría que pretende enmarcar la
matemática entera.6
En el Apéndice VI doy una traducción de los axiomas de Zermelo. Aquí
comentaré su alcance, en parte citándolos, en parte parafraseándolos. Ante
todo, quiero llamar la atención sobre un hecho notable: salvo el Axioma I,
todos los axiomas de Zermelo son asertos de existencia, ya sea absolutos,
ya sea condicionales: los Axiomas II y VII aseveran que en el dominio 
hay un conjunto de cierta índole; los Axiomas II–VI aseveran que, si en 
hay ciertos objetos o conjuntos, también hay en  ciertos otros conjuntos
que cumplen ciertas condiciones con respecto a aquéllos. Los asertos de
existencia son frecuentes en todas las teorías axiomáticas, pero éstas in-
cluyen también lo que —por analogía con la física— cabe llamar “leyes”,
esto es, axiomas que postulan que si unos objetos del dominio cumplen
una condición, también cumplen otra.7 Parecería que sin tales “leyes” no
se puede especificar la naturaleza del dominio de la teoría. La única “ley”
entre los axiomas de Zermelo es el Axioma I (Axioma de Determinación),
en virtud del cual la identidad de un conjunto sólo depende de sus elemen-
tos. También tiene este carácter la indicación preliminar de que, con la sola
excepción expresada en el Axioma II, una cosa a es un conjunto si y sólo

6
“Nuestro sistema de axiomas justamente es no-categórico, lo que en este caso no es
un inconveniente, sino una ventaja. Pues precisamente sobre este hecho descansa la
enorme significación y la aplicabilidad ilimitada de la teoría de conjuntos en general”
(Zermelo 1930, p. 45). Zermelo se refiere aquí a su sistema ZF′ de 1930, pero el pasaje
también es aplicable al sistema de 1908a.
7
El Axioma I 8 de Hilbert es un buen ejemplo de aserto existencial absoluto: “Hay por
lo menos cuatro puntos que no están todos en un mismo plano”. El Axioma II 2 es
un aserto existencial condicional: “Dados dos puntos A y C, hay siempre un punto B
sobre la recta AC tal que C está entre A y B.” Entre los 18 primeros axiomas de Hilbert
sólo siete no son asertos de existencia: los Axiomas I 5 y II 3 niegan la existencia de
ciertos objetos; los Axiomas I 6, II 1, III 2, III 3 y III 5 afirman que ciertas relaciones
subsisten cada vez que se cumplen ciertas relaciones. Los dos axiomas restantes son
peculiares. El Axioma V afirma que, dados dos segmentos rectos α y β, tales que
α < β, siempre hay un número entero n tal que β < nα. Se trata pues de un aserto
existencial, pero, como n no es un punto, una recta, o un plano, lo que V 1 asevera
1.8 Axiomas para una teoría de conjuntos 77

si hay una cosa b tal que b ∈ a (Zermelo 1908, p. 262, §1.2). Eso es todo
lo que la teoría nos brinda para visualizar qué podría ser un ʻconjuntoʼ y en
qué consiste la relación ʻ∈ʼ.
Los asertos existenciales absolutos establecen el contenido mínimo del
dominio .
Conforme al Axioma II (Axioma de los Conjuntos Elementales), hay un
conjunto tal que no contiene elementos, “el conjunto cero”, simbolizado
“0”. Me parece justificado identificarlo sin más con el conjunto vacío ∅.
Obsérvese que lo que aquí se está diciendo es (a) que hay en  (por lo
menos) una cosa, (b) que (por lo menos) una de las cosas que hay en  no
contiene elementos, y (c) que no obstante la característica general atribuida
a los conjuntos por la indicación preliminar (§ 1.2), cierta cosa ∅ que no
contiene elementos será tratada como conjunto en nuestro discurso. Evi-
dentemente, como la identidad de un conjunto depende de sus elementos
(Axioma I), este privilegio no puede conferirse más que a una sola cosa.
Completan el Axioma II dos aseveraciones condicionales: si hay en  una
cosa cualquiera a, entonces también hay en  un conjunto {a}, cuyo único
elemento es a; si hay en  dos cosas a y b, entonces también hay en  un
conjunto {a,b}, cuyo únicos elementos son a y b.
Conforme al Axioma VII (Axioma del Infinito), hay en  por lo menos un
conjunto Z tal que (i) ∅฀∈ Z y (ii) si a ∈ Z, {a} ∈ Z. Invocando el Axioma
III, Zermelo demuestra que existe en  un cierto conjunto Z0 —que es la
parte común a todos los conjuntos Z que cumplen la condición del Axioma
VII— cuyos elementos son ∅, {∅}, {{∅}},… Zermelo propone llamar a
Z0 “la serie numérica”, porque sus elementos puede hacer las veces de nú-
meros. “Constituye el ejemplo más simple de un conjunto ʻenumerablemente
infinitoʼ” (Zermelo 1908, p. 267).
Los asertos existenciales condicionales postulan una expansión colosal
del contenido de .
Como vimos, si hay dos cosas distintas, a y b, las cláusulas condicionales
del Axioma II certifican la existencia de los infinitos conjuntos {a}, {{a}},
{{{a}}},…,{b}, {{b}}, {{{b}}},…, {a,b}, {a,{b}}, {{a},{a,b}}, etc.

es la existencia de un objeto ajeno al dominio de la teoría. También el Axioma V 2


(trascrito más adelante en la nota 27) trasciende el dominio de la teoría, pues dice que
fuera de él no hay otros objetos con los cuales se lo pueda ampliar para constituir un
dominio más rico en que también se cumplan los axiomas.
78 El Paraíso de Cantor

En virtud del Axioma III (Axioma de Separación), los elementos de un


conjunto a existente en  que cumplen una condición bien definida P forman
un conjunto separado existente en , el subconjunto {x: x ∈฀ a ∧ Px}. Para
que este axioma tenga un significado preciso hay que determinar qué es una
condición bien definida (definit). Zermelo lo explica así:

Una cuestión o proposición , cuya validez o invalidez deciden sin arbi-


trariedad las relaciones fundamentales del dominio [esto es, las relaciones
de la forma a ∈฀ b] en virtud de los axiomas y de las leyes lógicas uni-
versalmente válidas se llama “bien definida” [“definit”]. Asímismo, una
proposición universal (x), en la cual el término variable x puede recorrer
todos los individuos de una clase , se dice “bien definida” si está bien
definida para cada individuo de la clase . Así, la cuestión de si a ∈฀ b
o no está siempre bien definida; también la cuestión de si M ⊆ N o no.
(Zermelo 1908a, p. 263)

Aunque a primera vista parece que la frase “deciden sin arbitrariedad” (ohne
Willkür entscheiden) no es suficientemente precisa (Weyl 1910, p. 304),
una breve reflexión permite extraer del pasaje citado la siguiente definición
recursiva: Una condición P está bien definida (a) si P expresa la presencia
o ausencia de la relación ∈ entre dos cosas; (b) si P se refiere a todas las
cosas que cumplen una cierta condición bien definida con respecto a cada una
de ellas; o (c) si P se infiere de otras condiciones bien definidas, en virtud
de los Axiomas I–VII y de las leyes de la lógica.8 Cabe todavía preguntarse
qué hay que entender aquí por ʻleyes de la lógicaʼ. Como veremos en la
Sección 1.8.2, Skolem (1922) dará a esta pregunta una respuesta radical que
ha tenido mucha aceptación.
El Axioma IV (Axioma del Conjunto Potencia) dice que si T es un con-
junto existente en , también existe en  el conjunto potencia PT cuyos
elementos son todos los subconjuntos de T. Combinado con el Axioma VII,
que postula la existencia en  de un conjunto infinito (enumerable), el
Axioma IV asegura la existencia en  de conjuntos indenumerables cuyos

8
Apliquemos esta definición a los ejemplos de ʻcuestión bien definidaʼ propuestos por
Zermelo. ʻa ∈฀ bʼ está siempre bien definida en virtud de (a). ʻM ⊆ Nʼ abrevia la
condición ∀x(x ∈฀ Μ฀ ⊃฀ x ∈฀ Ν), la cual está bien definida en virtud de (b), ya que
ʻx ∈฀ Νʼ —en virtud de (a)— y por ende ʻx ∈฀ Μ฀ ⊃฀ x ∈฀ Νʼ —en virtud de (c)— son
condiciones bien definidas para toda cosa x.
1.8 Axiomas para una teoría de conjuntos 79

ℵ0
cardinales son 2ℵ , 22 ,…
0

El Axioma V (Axioma de Unión) dice que si T es un conjunto existente


en , también existe en  el conjunto unión UT formado por todos los
elementos de los elementos de T.
El Axioma VI es el Axioma de Selección. Formalmente: si T es un conjunto
existente en  cuyos elementos son conjuntos no vacíos y mutuamente dis-
juntos (esto es, si u ∈ T implica que ∃w(w ∈฀ u) y u ∈ T ∧ v ∈ T implica
que u = v ∨฀ u ∩฀ v = ∅), el conjunto unión UT incluye un subconjunto s
que tiene un y sólo un elemento en común con cada elemento de T.9 Infor-
malmente, esto equivale a decir que si T cumple la condición indicada, es
posible seleccionar un y sólo un elemento de cada elemento de T, y formar
con los objetos así seleccionados un conjunto s.
De los siete axiomas citados Zermelo infiere los principales teoremas de la
teoría de los cardinales transfinitos (1908a, § 2 “Teoría de la equivalencia”).
La teoría de los ordinales, cuya publicación anuncia (p. 262), y que se sabe
que completó hacia 1914, no llegó a publicarse.
Se ha solido decir que Zermelo elaboró su teoría axiomática de conjun-
tos con el propósito de eludir las paradojas. G. H. Moore sostiene que esta
opinión tradicional contiene a lo sumo “una migaja de verdad” (1982, p.
157), pero que Zermelo obró motivado sobre todo por el deseo de responder
a los críticos de su primera prueba del Teorema del Buen Orden, para lo
cual necesitaba determinar con toda precisión los supuestos requeridos para
demostrarlo. Como no he tenido acceso a la correspondencia u otros papeles
privados de Zermelo, no puedo cuestionar este aserto de Moore. Lo que
no admite duda es que Zermelo ofreció al público su axiomatización como
el método apropiado para reconstruir la teoría de Cantor sin paradojas. Lo
dice el anuncio de Zermelo 1908a en Zermelo 1908 (citado al comienzo de
esta sección) y lo confirma ampliamente la introducción de Zermelo 1908a.
Leemos allí que la “Antinomia de Russell” relativa al “conjunto de todos
los conjuntos que no se contienen a sí mismos” nos fuerza a restringir la
definición cantoriana de conjunto como una “reunión en un todo de determi-
nados objetos bien distinguidos de nuestra intuición o nuestro pensamiento”,
aunque “todavía no se ha logrado reemplazarla con otra, igualmente simple,

9
La apódosis del Axioma VI se puede expresar con más claridad así:

∃s(s ⊆฀ UT ∧฀ ∀u(u ∈ T ⊃฀ (u ∩฀ s ≠ ∅฀ ∧฀ ∀x∀y({x,y} ⊆฀ u ∩฀ s ⊃ x = y))))


80 El Paraíso de Cantor

que no dé lugar a tales dudas” (1908a, p. 261).

En estas circunstancias no queda en la actualidad otro recurso que em-


prender el camino al revés y, partiendo de la “teoría de conjuntos” his-
tóricamente dada, buscar los principios que se requieren para fundamentar
esta disciplina matemática. Esta tarea debe resolverse de tal modo que los
principios se restrinjan lo suficiente para excluir todas las contradicciones,
pero a la vez sean lo bastante amplios para retener todo lo que hay de
valioso en dicha teoría.
(Zermelo 1908a, p. 261)

Zermelo estima que sus siete axiomas cumplen este propósito. Confiesa que
no ha podido aún demostrar rigurosamente su consistencia (Widerspruchs-
losigkeit), pero subraya que “todas las ʻantinomiasʼ conocidas hasta ahora
desaparecen en cuanto se adoptan como base los principios aquí propuestos”
(1908a, p. 262).

1.8.2 ¿Qué está ʻbien definidoʼ?

Cuando Zermelo publica sus axiomas en 1908, ya está en marcha el es-


fuerzo iniciado por Frege y Peano para introducir precisión y claridad en el
pensamiento matemático reformulándolo en un lenguaje artificial de sintaxis
austera y rigurosa. Esta empresa intelectual, a la que me refiero en la Segun-
da Parte, tuvo una marcada influencia en el desarrollo ulterior de la teoría
axiomática de conjuntos. Ello no obstante, y a riesgo de adelantar ideas que
debo explicar allí, me ha parecido oportuno cerrar esta Primera Parte con
una descripción sumaria de las principales innovaciones que median entre el
primer sistema axiomático de Zermelo (1908a) y los sistemas ZF (Zermelo-
Fraenkel) y NGB (von Neumann-Gödel-Bernays) utilizados corrientemente
en la enseñanza y la investigación.
En la conferencia “Sobre las definiciones de los conceptos matemáticos
fundamentales”, dictada en Zurich al obtener la venia legendi, Weyl (1910)
expresa reservas frente a la noción de lo ʻbien definidoʼ (definit) invocada
en el Axioma III de Zermelo, cuya caracterización parafrasea así:
1.8 Axiomas para una teoría de conjuntos 81

Una proposición bien definida es una proposición tal que su verdad o


falsedad se puede decidir únivocamente y sin arbitrariedad sobre la base
de las relaciones fundamentales ∈ que subsisten entre las cosas de la
teoría de conjuntos.
(Weyl 1910, p. 304)

Weyl observa con razón que hablar de una “decisión unívoca y exenta de
arbitrariedad” es un tanto vago, y propone en cambio una definición re-
cursiva más precisa pero posiblemente más estrecha que la que extraje del
texto original de Zermelo en la Sección 1.8.1. De hecho, Weyl no llega a
formular tal definición, sino que nos invita a construirla por analogía con
ciertos “principios de definición” de los conceptos geométricos enunciados
en la misma conferencia (1910, pp. 299s.). Es lo que intento a continuación.
(El importante concepto de definición recursiva se explica en el Apéndice
VIII. En el siguiente ejemplo, la cláusula señalada con el índice 0 constituye
la base de la recursión):

(0) Toda proposición de la forma ʻx ∈ yʼ está bien definida, cualesquiera


que sean los términos x e y.
(1) Si ϕ está bien definida, también lo está su negación ¬ϕ.
(2) Si ϕ y ψ están bien definidas, también lo está su conjunción
ϕ ∧ ψ.
(3) Si ϕ(α1,…, αν) es una proposición bien definida, referente al
ν-tuplo de cosas 〈α1,…, αν〉, y σ designa una permutación de
{1,…, ν}, entonces la proposición ϕ(ασ1,…, ασν), referente al
ν-tuplo 〈ασ1,…, ασν〉, también está bien definida.
(4) Si ϕ(α1,…, αν) está bien definida, y ∀ξψ(α1,…, αν, ξ) es ver-
dadera si y sólo si ϕ(α1,…, αν) es verdadera, entonces ψ(α1,…,
αν, αν+1) está bien definida cualquiera que sea la cosa designada
por αν+1.
(5) Si ϕ(ξ1,…, ξν) está bien definida, y ψ(α1,…, αν−1) es verdadera
si y sólo si ∃ξϕ(α1,…, αν−1, ξ) es verdadera, ψ(α1,…, αν−1) está
bien definida.
(6) ϕ es una proposición bien definida si y sólo si es posible caracteri-
zarla como tal mediante un número finito de aplicaciones de las
seis reglas precedentes.
82 El Paraíso de Cantor

En 1910 Weyl todavía estaba dispuesto a decir que la matemática, al menos


en lo que respecta a su “contenido lógico”, es “la ciencia de ∈ y de aquellas
relaciones que se dejan definir sobre la base de este concepto conforme a
los principios antedichos” (1910, p. 304). Advierte, con todo, una dificultad
para esta manera de ver en el hecho siguiente: al hablar de “un número fi-
nito de aplicaciones” de ciertos “principios de definición”, tratamos a dichos
principios “como cosas enumerables en el sentido de la teoría de conjun-
tos”; así, estamos presuponiendo esta teoría en la explicación misma de los
axiomas en que pretendemos basarla. En 1917, en su monografía sobre El
continuo, reconoce que no ha podido resolver esta dificultad y cambia de
punto de vista:

El intento de adoptar estos principios [de definición] como axiomas para


la formación de conjuntos y de expresar la exigencia de que no existan
más conjuntos que los que pueden formarse mediante la aplicación, un
número finito de veces, de los principios de construcción contenidos en los
axiomas, todo ello sin presuponer el concepto de los números naturales,
me condujo a una vasta y cada vez más compleja formalización, sin que
lograra un resultado definitivo. Sólo en conexión con ciertos conocimientos
filosóficos generales […] se me hizo claro que perseguía un pseudo-
problema escolástico, y alcancé el firme convencimiento […] de que la
representación de la iteración, de la serie natural de los números, es un
fundamento último del pensamiento matemático. […] Si es verdad que
los conceptos fundamentales de la teoría de conjuntos sólo pueden captarse
llevando a cabo esta intuición “pura”, es superfluo y confundidor basar a
su vez el concepto de número natural en la teoría de conjuntos.
(Weyl 1918, pp. 36–37)

En El continuo, Weyl ensaya una filosofía construccionista a medio cami-


no entre la ortodoxia conjuntista a que adhería en 1910 y el intuicionismo
brouweriano que abrazará públicamente en 1921. Esta obra cae fuera de los
límites del presente estudio. En cambio, debemos atender a varias formas
de definir definit surgidas en los años 20 dentro de la corriente central del
pensamiento matemático. Aunque todas son variantes de la idea propuesta
por Weyl en 1910, los autores que voy a citar deben haberla redescubierto
independientemente, puesto que no reconocen su deuda con él.
Fraenkel (1922a) demuestra que el Axioma de Selección es independiente
de los otros seis axiomas postulados por Zermelo (1908a).10 Para ello nece-
1.8 Axiomas para una teoría de conjuntos 83

sita una formulación precisa del Axioma de Separación, que en el escrito de


Zermelo “contiene la imprecisa noción definit.” Fraenkel se vale en cambio
de un concepto de función que, parafraseando sus palabras, puede caracte-
rizarse así: Sea x un elemento cualquiera de un dado conjunto K; entonces
ϕ(x) es el objeto que se forma aplicando un número finito de veces los
Axiomas II–VI al objeto “variable” x y posiblemente también a otros objetos
dados —“constantes”— a1,…, an. La regla que gobierna dicha aplicación
de los Axiomas II–VI es la función designada con la letra ϕ. Por ejemplo,
ϕ(x) = U{{{x}, {∅}}, Px ∪฀ {{∅}}}. Fraenkel subraya que este concepto
“no incluye ninguna noción general de función o correspondencia ni otra
noción fundamental nueva” (1922a, en Heijenoort 1967, p. 286). Mediante
este concepto el Axioma de Separación puede reformularse así:

AXIOMA III. Si M es un conjunto y ϕ y ψ son dos funciones definidas en


ese orden, M incluye (i) un subconjunto M que contiene pre-
cisamente todos los elementos x ∈ M tales que ϕ(x) ∈ ψ(x) y
ningún otro elemento; así como (ii) un subconjunto M¬ que
contiene precisamente todos los elementos x ∈ M tales que ϕ(x)
∉ ψ(x) y ningún otro elemento.

Por cierto, en la prueba de la independencia del Axioma VI se sobreentien-


de que las funciones ϕ y ψ mencionadas en el Axioma III sólo envuelven
aplicaciones de los Axiomas II–V.11
Zermelo (1929) considera que esta nueva versión de su Axioma III es obje-
table porque emplea la expresión ʻun número finito de vecesʼ en la definición
de ʻfunciónʼ. Ve aquí un vicio de circularidad, puesto que el concepto mismo
de número debiera fundarse en la teoría axiomática de conjuntos. Zerme-
lo concuerda en esto con la autocrítica de Weyl, mas no por ello depone
sus convicciones conjuntistas. Antes bien, mantiene la versión original del
Axioma III, suplementándola con lo que describe como una caracterización

10
Una proposición P es independiente de un conjunto de proposiciones S si P no es
una consecuencia lógica de S. Como toda proposición es una consecuencia lógica de
S฀si S es inconsistente, la tesis de que P es independiente de S se entiende siempre
sujeta a la condición tácita de que S sea consistente.
11
En el Apéndice VII bosquejo la prueba de que el Axioma VI de Zermelo es indepen-
diente de los Axiomas I–V y VII (Fraenkel 1922a).
84 El Paraíso de Cantor

axiomática del concepto definit. De hecho lo que nos da es una definición


recursiva, suplementada por un curioso “axioma de completud” calcado sobre
el Axioma V 2 de los Fundamentos de la geometría de Hilbert.12
Antes de enunciar la definición de ʻdefinitʼ, Zermelo prescribe una exi-
gencia que este concepto debe satisfacer. Una lista de axiomas A —dice—
determina un “sistema lógicamente cerrado”, esto es, un sistema S de
proposiciones que pueden derivarse de A de un modo puramente lógico. Si
A es consistente “tiene también que ser ʻrealizableʼ, es decir, representable
mediante un ʻmodeloʼ, una matriz completa de las ʻrelaciones fundamenta-
lesʼ que figuran en [S]” (Zermelo 1929, p. 341). Ahora bien, si r(x1,…,xn)
es una de las relaciones fundamentales que figuran en el sistema S y B es
el dominio de elementos de un tal modelo de A, entonces tiene que estar
decidido para cualquier lista 〈a1,…,an〉 de objetos de B si vale para ella la
relación r o bien su negación ¬r.

Una tal propiedad o relación decidida (entschiedene) en cada modelo por


las relaciones fundamentales es lo que se quiso designar con la expresión
“definit” en [Zermelo 1908a]. “Definit” es, pues, lo que está decidido en
cada modelo particular, pero puede estarlo de distinta manera en distintos
modelos. La “decisión” se refiere al modelo particular; la “definición”
(“Definitheit”) misma a la relación considerada y al sistema total.
(Zermelo 1929, p. 341)

La definición de ʻdefinitʼ va precedida de una estipulación terminológica que


me parece oscura y parafrasearé según mis luces:

Sea  un dominio (que puede constar de varios subdominios mu-


tuamente exclusivos 1,…, m). Sea  un sistema de relaciones
fundamentales de la forma r(x1,…, xn), donde las variables x1,…,
12
En la nota 27 cito el Axioma V 2 de Hilbert. El “axioma de completud” de Zermelo
dice así:
AXIOMA III. Si P es el sistema de todas las proposiciones “bien definidas” o,
más generalmente, si es cualquier sistema de proposiciones p de la índole Dp,
P no incluye ningún subsistema propio P1 que contenga todas las relaciones
fundamentales de  y además comprenda todas las negaciones, conjunciones,
disyunciones y generalizaciones de las proposiciones o funciones proposicionales
contenidas en él.
(Zermelo 1929, p. 344)
1.8 Axiomas para una teoría de conjuntos 85

xn recorren el dominio  (pudiendo también restringirse el recorrido


de cada variable xk a uno solo de los subdominios de ).13

Zermelo propone escribir Dϕ en lugar de la expresión ʻla proposición ϕ está


bien definida con respecto a ʼ que define recursivamente así:

0. Si r(x1,…, xn) es una expresión en la cual r designa una relación


n-aria del sistema  y x1,…, xn son variables con recorrido en
, entonces Dr(x1,…, xn).
1. Si Dϕ, entonces también D¬φ.
2. Si Dϕ y Dψ, entonces D(ϕ฀ ∧฀ ψ) y D(ϕ฀ ∨฀ ψ).
3. Si Dƒ(x1,…, xn) para todos los valores admisibles de las variables
x1,…, xn, entonces D∀x1…∀xnƒ(x1,…, xn) y también, por lo
tanto, D∃x1…∃xnƒ(x1,…, xn).
4. Si DF(ƒ) para todo functor bien definido ƒ = ƒ(x1,…, xn), entonces
D∀ƒF(ƒ) y D∃ƒF(ƒ).

Hoy llamamos ʻfunctor n–ádicoʼ a un símbolo que, acompañado de n términos


(esto es, expresiones gramaticalmente aptas para designar objetos), forma un
nuevo término. Por ejemplo, ʻlogʼ es un functor monádico que, junto a un
término que designe un número, forma un término que designa el logaritmo
de ese número; ʻ+ʼ es un functor diádico que, acompañado de términos que
designen dos números, forma un término que designa la suma de esos dos
números. No me parece que en la cláusula 4 ʻfunctorʼ pueda entenderse en

13
He aquí una traducción literal del texto de Zermelo: “Suponemos dado un domi-
nio B (o en general una pluralidad de dominios B1, B2,…) así como una sistema
R de relaciones fundamentales de la forma r(x, y, z,…), donde las variables x, y,
z,…pertenecen respectivamente a los dominios B” (1929, p. 342). En el simbolismo
matemático actual, las expresiones ʻB1, B2,…ʼ y ʻx, y, z,…ʼ indicarían que Zermelo
está hablando de unas secuencias infinitas de dominios y de variables. En tal caso,
las generalizaciones universales y existenciales a que se refiere la cláusula II.3 de la
definición de ʻdefinitʼ irían precedidas por infinitos cuantificadores. Pero no creo que
Zermelo haya contemplado aquí tan inusitada formación sintáctica. Tampoco creo que
haya pretendido establecer una correspondencia biunívoca entre su lista de variables
y su lista de dominios, como sugiere la frase “las variables x, y, z,…฀ pertenecen
respectivamente a los dominios B”. Por otra parte, no habría inconveniente en admitir
una partición del dominio  en infinitos subdominios, y sólo en aras de la brevedad
he omitido mencionar esta posibilidad en mi paráfrasis.
86 El Paraíso de Cantor

esta acepción. Significa más bien lo que hoy llamaríamos un predicado, esto
es, un símbolo que, acompañado de un número idóneo de términos, forma
una proposición. Así, lo que esa cláusula nos está diciendo es que se puede
formar una proposición bien definida cuantificando sobre variables predica-
tivas. Ello implica que la teoría de conjuntos no se deja formalizar en un
cálculo predicativo de primer orden.14
La misma revista —Fundamenta Mathematicae— en que apareció el
artículo de Zermelo (1929) publicó poco después una nota polémica de
Thoralf Skolem (1930). Skolem observa que la definición de ʻdefinitʼ pro-
puesta por Zermelo, en la medida en que es aceptable, equivale a la suya,
publicada mucho antes (Skolem 1922), y se sorprende de que Zermelo no la
mencione. Conforme a la definición de Skolem, una aseveración bien defi-
nida (eine definite Aussage) es cualquier expresión finita construida a partir
de aseveraciones elementales de la forma a ∈ b, o a = b, mediante una o
más de las cinco operaciones siguientes: conjunción, disyunción, negación,
cuantificación universal —“validez en cada caso”— y cuantificación exis-
tencial —“validez al menos en un caso” (Skolem, SWL, p. 139).15 En otras
palabras, una aseveración bien definida es una aseveración bien formada de
un cálculo predicativo de primer orden con identidad y un primitivo único,
el predicado diádico ʻ∈ʼ. Al permitir la cuantificación sobre funciones pro-
posicionales, la cláusula 4 de la definición de Zermelo ciertamente asigna a
ʻdefinitʼ una extensión más amplia que la definición de Skolem. La crítica
de Skolem se dirige principalmente contra esta cláusula. Según él, no está
claro el significado de la expresión ʻF(ƒ)ʼ que allí figura. Designa, al pa-
recer, una función de funciones proposicionales; pero Zermelo no explica
como debe entenderse este concepto. Skolem reclama una mayor precisión
sobre esto. En efecto, según él, si el concepto de función proposicional se
piensa con tal amplitud que abarque el concepto de función de funciones
proposicionales, puede generarse la paradoja de Russell. Por otra parte, si
sólo se admiten funciones de funciones proposicionales construidas a partir
de éstas mediante las cinco operaciones lógicas arriba mencionadas, los

14
Para los lectores que no estén familiarizados con la lógica moderna, doy una versión
de cálculo predicativo de primer orden en el Apéndice IX.
15
Nótese que esta definición concuerda con la de Weyl (1910), que Skolem no mencio-
na.
1.8 Axiomas para una teoría de conjuntos 87

axiomas de Zermelo (1908a) combinados con la definición de ʻdefinitʼ de


Zermelo (1929) no autorizan la formación de ningún conjunto que no sea
posible ya en virtud de esos mismos axiomas combinados con la definición
más simple de ʻdefinitʼ de Skolem (1922).16

1.8.3 El Axioma de Reemplazo

El sistema de axiomas para la teoría de conjuntos conocido por la sigla ZF


—con Z de Zermelo y F de Fraenkel— se distingue del sistema original de
Zermelo (1908a) en cuanto excluye el Axioma de Selección (cuya inclusión
genera el sistema llamado ZFC, con C de choice) y contiene un axioma
nuevo, el Axioma de Reemplazo, propuesto —independientemente— por
Fraenkel y por Skolem en 1922.17
Fraenkel (1922) justifica la necesidad del Axioma de Reemplazo así: Si Z0
es el conjunto infinito cuya existencia postula el Axioma VII y (para cada n
> 0) designamos con Zn al conjunto potencia PZn–1, cuya existencia resulta
de la aplicación reiterada del Axioma IV a Z0, es fácil ver que los axiomas
de Zermelo no garantizan la existencia del conjunto infinito {Z0, Z1,…}.
16
Skolem, SWL, pp. 276–77. Skolem 1930 concluye con “una observación de orden
general” que anticipa aspectos esenciales de la famosa argumentación de Gödel 1931.
“Si para caracterizar las funciones proposicionales se establecen axiomas que expresen
ciertos requisitos de reproducción como las cláusulas [1–4] de Zermelo, tales axiomas
se dejan concebir […] como ʻaseveraciones aritméticasʼ” (Skolem, SWL, p. 278).
Sea O el más pequeño modelo concebible del dominio de funciones proposicionales
caracterizado por tales axiomas. En virtud del teorema de Löwenheim-Skolem (vide
infra, p. 98), |O| = ℵ0. Supongamos que la teoría axiomática de conjuntos de Zermelo
(mejorada con su definición de ʻdefinitʼ) tiene un modelo B. Entonces, B contiene un
conjunto infinito numerable Z0 y existe una biyección de Z0 en O. Sea Sn la función
proposicional de una variable que dicha biyección asigna a n ∈ Z0. Sea Σ(x) la función
proposicional de una variable que es verdadera para x = n ∈ Z0 si y sólo si Sn(n) es
falsa. Σ(x) obviamente difiere de Sn(x) para cada n ∈ Z0 y por lo tanto no pertenece al
modelo O. Por otra parte, Σ(x) es una función proposicional bien definida conforme a
la exigencia que Zermelo (1929, p. 341) impone a este concepto. “En otras palabras,
parece imposible caracterizar mediante una dada axiomática finita un concepto de
ʻdefinitʼ que concuerde con [dicha exigencia]” (Skolem, SWL, p. 279).
17
Mirimanoff (1917, p. 49) postuló que si un conjunto A es equinumeroso con una co-
lección de conjuntos B, entonces B también es un conjunto; este postulado equivale al
Axioma de Reemplazo. Pero la obra interesantísima de Mirimanoff no fue reconocida
88 El Paraíso de Cantor

Por lo tanto, si el cardinal del continuo es menor que ℵω, no es posible es-
tablecer en el sistema de Zermelo que hay conjuntos cuyo cardinal sea igual
o mayor que ℵω.18 El Axioma VII, claro está, se puede reformular de modo
que asegure la existencia del conjunto {Z0, Z1,…}, pero el procedimiento
utilizado para definirlo podría entonces aplicársele a él mismo, caracterizando
así nuevos conjuntos cuya existencia, aunque manifiestamente plausible, no
estaría garantizada por el sistema. Fraenkel propone, en cambio, una solución
general de la dificultad que consiste en adoptar el axioma siguiente:

AXIOMA DE REEMPLAZO. Si M es un conjunto y cada elemento de M se re-


emplaza con [lo que Zermelo llama] una cosa del dominio , M
se convierte en otro conjunto.

Este enunciado que habla de reemplazos y conversiones tiene más de receta


que de axioma, pero poco más tarde Fraenkel (1925, p. 254) ofrecerá una
formulación más rigurosa: Si ϕ es una función —en el sentido de Fraenkel
(1922a) explicado en la Sección 1.8.2— y M es un conjunto, entonces también
es un conjunto la imagen de M por ϕ, esto es, {ϕ(x):฀
x ∈ M}. Ocurre, empero,
que —como demostrará von Neumann (1928a, p. 377)— esta aseveración se
deduce de los axiomas I–V de Zermelo (1908a) y por lo tanto no basta para
establecer que existe un conjunto cuyo cardinal es igual o mayor que ℵω.
Pero esta debilidad se remedia recurriendo a un concepto de función menos
estrecho. Una función ϕ en el sentido de Fraenkel tiene que estar definida
en cierto conjunto M. En cambio, según von Neumann (1928a, p. 376), la
función ϕ mencionada en el Axioma de Reemplazo debe estar libre de esta
restricción y admitir como argumento cualquier objeto susceptible de serlo
que pertenezca al dominio de la teoría.
Así fortalecido, el Axioma de Reemplazo concuerda precisamente con el
propuesto por Skolem al Congreso de Matemáticos Escandinavos de 1922,
en la misma ponencia en que introdujo la definición de definit que cité en
la Sección 1.8.2 (Skolem 1922):

por los estudiosos de la teoría de conjuntos antes de 1925, cuando fue citada por von
Neumann (vide infra, nota 20).
18
Fraenkel hizo esta objeción a Zermelo en una carta fechada el 6 de mayo de 1921
(citada en Moore 1982, p. 263 n. 10).
1.8 Axiomas para una teoría de conjuntos 89

Sea U una aseveración bien definida (definite) que vale para ciertos pa-
res ordenados 〈a,b〉฀de objetos pertenecientes al dominio  de modo que
para cada a hay a lo sumo un b tal que U es verdad. Según a recorre
los elementos de un conjunto Ma, b recorre todos los elementos de un
conjunto Mb.
(Skolem, SWL, pp. 145s.)

Skolem exhibe la insuficiencia del sistema original de Zermelo mediante el


mismo ejemplo aducido por Fraenkel, a saber, el conjunto {Z0, Z1,…} arriba
descrito; pero Skolem da una demostración rigurosa de la insuficiencia de ese
sistema para garantizar la existencia de dicho conjunto. Para ello introduce el
importante concepto de rango (Stufe) de un conjunto, que caracteriza como
sigue. Sean PnM y UnM los conjuntos formados reiterando n veces la ope-
ración de formar, respectivamente, el conjunto potencia y el conjunto unión
de un conjunto dado M (Axiomas IV y V de Zermelo). Sea P0M = U0M =
M. Diremos que el conjunto M es de primer rango si hay un entero n ≥ 0
tal que UnM = ∅. (Recordando que Z0 = {∅,{∅},{{∅}},…}, advertimos
que UnZ0 = Z0 para todo n ≥ 0; por lo tanto, Z0 no es un conjunto de primer
rango). Para cada entero k > 1, diremos que el conjunto M es de k-ésimo
rango si M no es de (k–1)-ésimo rango pero hay un entero n ≥ 0 tal que
todos los elementos de UnM son conjuntos de (k–1)-ésimo rango. (Nótese
que, conforme a esta estipulación, Z0 es un conjunto de segundo rango). Sea
B un dominio en que satisface los siete axiomas de Zermelo. En virtud del
Axioma VII, B contiene un conjunto infinito que llamaremos, como siempre,
Z0. Supongamos que B contiene además el conjunto {Z0, Z1,…}. Sea B′ el
subdominio formado por todos los conjuntos de primer o segundo rango que
hay en B. Se puede verificar fácilmente que B′฀también satisface los axiomas
de Zermelo. Obviamente, Z0 pertenece a B′, puesto que es un conjunto de
segundo rango, pero {Z0, Z1,…} es un conjunto de tercer rango y por lo
tanto no puede pertenecer a B′. Como los axiomas de Zermelo se cumplen
en B′, es claro que no bastan para garantizar la existencia del conjunto {Z0,
Z1,…}. En una nota, Skolem esboza una prueba de que el Axioma de Re-
emplazo basta para remover la deficiencia (Skolem, SWL, p. 146n.).
90 El Paraíso de Cantor

1.8.4 Aportes de von Neumann

John von Neumann fue uno de los matemáticos más versátiles y fecundos
del siglo XX. Su teoría matemática de los juegos y sus ideas sobre el diseño
de computadoras han revolucionado el mundo de los negocios. Su aporte a
la sistematización matemática y la clarificación conceptual de la mecánica
cuántica, aunque muy discutida, también ha tenido una influencia enorme.19
Contribuyó decisivamente a la teoría de conjuntos con una serie de trabajos
publicados cuando tenía entre 20 y 25 años. En esta sección presentaré su
innovadora concepción de los ordinales (1922/23) y las ideas centrales de
su sistema axiomático (1925, 1928), aunque sin dar una presentación com-
pleta del mismo. En el Apéndice VIII explico cómo empleó su teoría de los
ordinales para justificar la definición por inducción transfinita.
Como sabemos, Cantor llegó a definir los ordinales como “tipos de orden”.
Dos conjuntos ordenados tienen el mismo “tipo de orden” si son “similares”,
esto es, si hay entre ellos un isomorfismo de órdenes. Un ordinal es el tipo
de orden de un conjunto bien ordenado. Von Neumann considera que este
procedimiento es “algo vago” y propone reemplazarlo por otro, “basado en
operaciones unívocas con conjuntos”. La definición de Cantor se deja traducir,
por cierto, a términos estrictamente conjuntistas: “El ordinal de un conjunto
bien ordenado es la clase de todos los conjuntos similares a él”. Pero si esto
es un ordinal, no hay ninguna garantía de que existan conjuntos de ordinales
y el intento de formarlos puede generar paradojas.

19
Sobre la teoría de los juegos, véase von Neumann 1928b, von Neumann y Morgenstern
1944. Sobre la mecánica cuántica, véase en particular von Neumann 1927a, 1932;
Birkhoff y von Neumann 1936. La principal contribución de von Neumann al diseño
de la computadora moderna consistió nada menos que en la idea misma de software,
esto es, la idea de que las instrucciones para resolver un problema deben registrarse
temporalmente en la memoria electrónica del aparato —al igual que los datos del
problema, aunque premunidas de un codificación que diferencie estas dos clases de
input— en vez de incorporarlas en la configuración fija de sus circuitos eléctricos. La
idea es simple, pero genial, y aparentemente no se le había ocurrido a ninguno de los
matemáticos e ingenieros que trabajaron en el diseño de computadoras electrónicas antes
de que von Neumann entrase en este campo en 1944. En las primeras computadoras,
construidas para las fuerzas armadas de Gran Bretaña y los Estados Unidos durante la
Segunda Guerra Mundial, había que reconfigurar los circuitos cada vez que se quería
abordar otro tipo de problemas. Cf. Pollack 1982, p. 19.
1.8 Axiomas para una teoría de conjuntos 91

La definición de ordinal de von Neumann es una aplicación brillante del


Axioma de Reemplazo que Fraenkel acababa de publicar (von Neumann lo
cita). Sea 〈M,<〉 un conjunto ordenado. Si x ∈ M, el conjunto {y฀ ∈฀M: y <
x} —abreviado A(x,M)— es el segmento de x en 〈M,<〉. Supongamos que
〈M,<〉 es un conjunto bien ordenado. Una enumeración (Zählung) de M es
una aplicación ƒ que asigna a cada x ∈ M el conjunto ƒ(x) = {ƒ(y): y ∈
A(x,M)}. En otras palabras, el valor de ƒ para cada x ∈ M es el conjunto de
todos los valores de ƒ correspondientes a los elementos que preceden a x en
〈M,<〉. Obsérvese que ƒ(x) es un conjunto en virtud del Axioma de Reempla-
zo, puesto que A(x,M) lo es en virtud del Axioma de Separación. También
{ƒ(x): x ∈ M} es un conjunto (por el Axioma de Reemplazo), que llamaré
provisionalmente ʻel ordinal de 〈M,<〉 determinado por la enumeración ƒʼ.
Cualquiera que sea el conjunto bien ordenado 〈M,<〉, si x0 es su primer
elemento, ƒ(x0) = ∅. Por lo tanto, si x1, x2 y x3 son respectivamente, el se-
gundo, tercer y cuarto elemento de 〈M,<〉, tenemos que

ƒ(x1) = {∅}
ƒ(x2) = {∅,{∅}}
ƒ(x3) = {∅,{∅},{∅,{∅}}}.20

Visiblemente, el conjunto bien ordenado 〈M,<〉, admite una y sólo una


enumeración ƒ, la cual determina un ordinal único, que llamaremos en
adelante el ordinal de 〈M,<〉. Si 〈M,<〉 es un conjunto bien ordenado y ƒ es
su enumeración, entonces ƒ(x) ∉ ƒ(x) para todo x ∈ M. Si x, y ∈฀ M y x
< y, entonces ƒ(x) ⊂฀ ƒ(y). Von Neumann (1922/23) ofrece demostraciones
detalladas de estas proposiciones y luego establece la siguiente importante
caracterización de los ordinales:

P es un ordinal si y sólo si (i) P es un conjunto de conjuntos,


ordenable por inclusión; (ii) su orden por inclusión es un buen or-
den; (iii) si ξ ∈ P, ξ = A(ξ, P) (cada elemento de P es su propio
segmento en 〈P,⊂〉).

20
Este ejemplo lo daba ya Mirimanoff (1917, p. 46), quien descubrió antes que von
Neumann esta forma de construir los ordinales. Von Neumann conocía la obra del
matemático ruso y la menciona expresamente (1925, p. 230n.).
92 El Paraíso de Cantor

Usando esta caracterización von Neumann prueba que si P es un ordinal, P


es el conjunto de todos los ordinales diferentes de P e incluidos en P; que,
si P y Q son dos ordinales diferentes uno de los dos está incluido en el otro,
y que si U es un conjunto cualquiera de ordinales, la relación de inclusión
⊂ determina un buen orden en U. Una segunda caracterización, derivable de
la anterior, es ésta: P es un ordinal si y sólo si todo elemento de P es un
ordinal incluido en P. Con estos recursos, von Neumann puede demostrar
fácilmente que los ordinales definidos a su manera satisfacen estos teoremas
clásicos de la teoría cantoriana del buen orden: Dos conjuntos bien ordenados
son similares si y sólo si sus ordinales respectivos son idénticos; un conjunto
bien ordenado es similar a un segmento de otro conjunto bien ordenado si
y sólo si el ordinal del primero está incluido en el ordinal del segundo; si
〈M,<〉 es un conjunto bien ordenado hay un y sólo un ordinal que, ordenado
por inclusión, es similar a 〈M,<〉, a saber, el ordinal de 〈M,<〉.
Gracias a que concibe los ordinales como conjuntos de cierta índole von
Neumann puede identificar los cardinales infinitos con ordinales, como se
hace con los finitos. Digamos que el ordinal α es un cardinal si todo otro
ordinal equinumeroso con α es mayor que α (von Neumann 1928, p. 731).
En otras palabras, un ordinal es un cardinal si es el primer ordinal de su
numerosidad. Como cada ordinal finito es más numeroso que su predecesor,
todos son cardinales. En cambio, entre los ordinales infinitos sólo es un
cardinal el primero de cada clase cantoriana. Los cardinales infinitos como
los define von Neumann corresponden, pues, precisamente a los alephs de
Cantor. Ahora bien, si un conjunto M admite un buen orden <, M es equinu-
meroso con el ordinal de 〈M,<〉; por lo tanto, bajo el Axioma de Selección
cada numerosidad está representada por un aleph, o sea, un cardinal en el
sentido de von Neumann. Pero si no se acepta este axioma, será conveniente
disponer de una segunda definición de ʻcardinalʼ restringida a los conjuntos
que no pueden ser bien ordenados (cf. Levy 1979, p. 83).
“La construcción axiomática de la teoría general de los conjuntos” es el
tema de la tesis doctoral sometida por von Neumann en 1925 a la Universidad
de Budapest (en húngaro). Sabemos que en agosto de 1923 había enviado
una versión alemana a Zermelo.21 Fraenkel recordará treinta años después

21
Véase la carta de von Neumann a Zermelo del 15 de agosto de 1923 en Meschkowski
1967, pp. 271–73.
1.8 Axiomas para una teoría de conjuntos 93

que “alrededor de 1922–23” la redacción de Mathematische Zeitschrift


lo consultó sobre “un largo manuscrito de un autor para él desconocido,
Johann von Neumann, titulado ʻDie Axiomatisierung der Mengenlehreʼ, el
cual era su futura disertación doctoral, que la revista publicaría recién en
1928.” Fraenkel dice que, aun sin entenderlo del todo, pudo reconocer ex
ungue leonem y dio una opinión favorable. A la vez, invitó a von Neumann
a una entrevista en la cual le aconsejó que “preparara el terreno para la
comprensión de un ensayo tan técnico con otro más informal que destacase
el nuevo enfoque del problema y sus principales consecuencias.”22 Siguiendo
este consejo, von Neumann redactó “Eine Axiomatisierung der Mengenlehre”
(1925). Este artículo, que he tomado de base para la exposición siguiente,
no deriva teoremas, pero en cambio explica la motivación de los axiomas
y contiene importantes consideraciones de interés filosófico que faltan en la
presentación formal (1928).
Von Neumann empieza describiendo dos modos de reaccionar ante las
paradojas de la teoría de conjuntos. El primero, representado por Russell,
Brouwer, Weyl y el húngaro König, “se propone la meta de establecer la
ciencia exacta entera sobre una nueva base evidente para todos, desde la
cual pueda nuevamente alcanzarse lo ʻcorrectoʼ en matemáticas y teoría
de conjuntos, pero excluyendo de antemano lo contradictorio gracias a la
fundamentación intuitiva inmediata” (1925, p. 220). La impresión que de-
jan estos autores es “aniquiladora”: mientras Russell hace descansar toda la
matemática en el cuestionable “Axioma de Reducibilidad”, Weyl y Brouwer
rechazan consecuentemente la mayor parte de ella como carente de sentido
y critican a fondo los métodos elementales de inferencia empleados normal-
mente en sus demostraciones. La segunda reacción, iniciada por Zermelo,
retiene los métodos lógicos tradicionales pero descarta el concepto ingenuo
de conjunto. Para reemplazarlo, se postulan axiomas en que figura la palabra
ʻconjuntoʼ pero sin atribuirle un significado: “Por ʻconjuntoʼ se entiende aquí
[…] sólo una cosa de la que no se sabe ni se quiere saber más que lo
que al respecto se sigue de los postulados. Éstos tienen que formularse de

22
Las dos citas de Fraenkel están tomadas de una carta suya a Ulam, transcrita en parte
en Moore 1982, p. 264.
94 El Paraíso de Cantor

tal modo que de ellos se sigan todos los teoremas deseados de la teoría de
conjuntos cantoriana, pero no las antinomias” (p. 220).
Von Neumann dice que su escrito pertenece a la segunda corriente. Con
todo, el término matemático tradicional que caracteriza mediante axiomas
no es ʻconjuntoʼ, sino ʻfunciónʼ, utilizado luego para definir ʻconjuntoʼ.
Obviamente cualquier conjunto M (en el sentido intuitivo del término) puede
representarse de un modo inequívoco mediante su función característica, que
asigna un valor fijo (por ejemplo, 1) a todos los objetos que pertenecen a
M y otro valor fijo (por ejemplo, 0) a todos los objetos que no pertenecen a
M. El sistema de von Neumann se apoya en esta observación. Sus axiomas
se refieren a dos clases de objetos, llamados informalmente ʻfuncionesʼ y
ʻargumentosʼ (el título formal es ʻcosas-Iʼ y ʻcosas-IIʼ —I. Dinge y II. Din-
ge— pero lo evitaré en mis explicaciones). Hay dos argumentos distinguidos,
A y B (que hacen el papel de 0 y 1 en el ejemplo anterior). Si a y b son
argumentos, 〈a,b〉 es un argumento, el par ordenado cuyo primer elemento es
a y cuyo segundo elemento es b. (Repitiendo la operación de formar pares,
se obtiene el n-tuplo 〈a1,…,฀ an〉 = 〈〈a1,…,฀ an-1〉,฀
an〉).฀Si ƒ es una función y
a es un argumento, [ƒ,a] es un argumento, el valor de ƒ en a. Puede haber
argumentos que a la vez son funciones —los llamaré ʻfunciones-argumentosʼ
(el título formal es I.II. Dinge)— y es esencial que haya funciones que no
pueden ser argumentos, esto es, objetos cuyo nombre sólo puede ocupar el
primer lugar —nunca el segundo— en una expresión de la forma [ƒ,a].
Un dominio (Bereich) es una función ƒ tal que, para todo argumento x, o
bien [ƒ,x] = A, o bien [ƒ,x] = B. Si el dominio ƒ es una función-argumen-
to, von Neumann dice que ƒ es un conjunto. Introduce la abreviatura a ∈฀
ƒ para decir que ƒ es una función y a es un argumento tal que [ƒ,a] ≠ A.
Obsérvese que para usar esta abreviatura no se requiere que [ƒ,a] = B; en
otras palabras, es lícito escribir a ∈ ƒ aunque ƒ no sea un dominio. Por otra
parte, si ƒ y g son funciones, la expresión ʻƒ ∈ gʼ tiene sentido si y sólo si
ƒ es una función-argumento. Evidentemente, si ƒ es un dominio pero no es
un conjunto —esto es, si ƒ no es una función-argumento—, no puede existir
un dominio g tal que ƒ ∈ g. En tal caso, diré que ƒ es un dominio propio.23

23
Entiéndase ʻpropioʼ como lo contrario de ʻimpropioʼ. Más castizo sería decir ʻdominio
propiamente talʼ pero la expresión es incómodamente larga. En la terminología de
Gödel (1940), comúnmente aceptada en la literatura matemática actual, un objeto k es
1.8 Axiomas para una teoría de conjuntos 95

Intuitivamente, un dominio propio ƒ se puede ver como una colección de


elementos —los argumentos x tales que [ƒ,x] = B— que no es a su vez
elemento de ninguna colección. Gracias a que admite dominios que no son
conjuntos von Neumann elude las paradojas clásicas sin coartar la libertad del
matemático para concebir objetos y darles nombre. Como veremos, el sistema
contiene un criterio preciso para determinar qué dominios no son conjuntos.
Intuitivamente se lo puede expresar así: el dominio ƒ es un dominio propio
si y sólo si la totalidad de los argumentos x tales que x ∈ ƒ no es menos
numerosa que la totalidad absoluta de los argumentos.
Los axiomas de von Neumann forman cinco grupos. El grupo I de “axio-
mas introductorios” postula la existencia de los argumentos A y B, fija la
sintaxis de las expresiones [x,y] y 〈x,y〉, y estipula que las funciones ƒ y g
son idénticas si [ƒ,x] = [g,x] para todo argumento x. Los grupos II y III
—“axiomas de construcción aritmética y lógica”— sirven principalmente
para asegurar que las todas las expresiones debidamente formadas con desig-
nadores (constantes o variables) de argumentos y funciones y los símbolos
[, 〈, ], 〉, =, ∀, puedan reducirse a ciertas formas normales (como explicaré
en las dos próximas notas).
El grupo II postula que existen (1) la función identidad, esto es, una fun-
ción i tal que, para todo argumento x, [i,x] = x; (2) una función constante
para cada argumento u, esto es, una función cu tal que para cada argumento
x, [cu,x] = u; (3 y 4) las proyecciones sobre el primer y sobre el segundo
elemento de cada par ordenado, esto es, funciones p1 y p2 tales que, para
todo par 〈x,y〉, [p1,〈x,y〉,] = x y [p2,〈x,y〉,] = y; (5) una función h tal que, para
cada par ordenado 〈ƒ,x〉฀ cuyo primer elemento es una función-argumento,
[h,〈ƒ,x〉] = [ƒ,x]. Postula además que, para cualesquiera funciones dadas ƒ
y g, existen (6) la función producto ƒ × g tal que, para todo argumento x,
[ƒ × g,x] = 〈[ƒ,x],[g,x]〉, y (7) la función compuesta ƒ ∑ g tal que, para todo
argumento x, [ƒ ∑ g,x] = 〈[ƒ,[g,x]〉.24

una clase (class) si es el conjunto vacío, k = {x: x ≠ x}, o cumple la condición ∃x(x
∈฀ k). Si ∀x(k ∉ x), decimos que la clase k es una clase propia (proper class).
24
Gracias a los axiomas del grupo II von Neumann (1928, pp. 670ss.) puede demostrar el
siguiente Teorema de Reducibilidad: Sea τ una expresión formada según las reglas del
grupo I con nombres de argumentos y funciones, los símbolos [, ], 〈, 〉, y n variables
ξ1,…,ξn. Sea τ(a1,…, an) la expresión que se obtiene al reemplazar consistentemente
96 El Paraíso de Cantor

El grupo III postula (1) que hay una función ƒ tal que, para todo par orde-
nado 〈x,y〉, 〈x,y〉฀ ∈฀ ƒ si y sólo si x = y; (2) que, si ƒ es una función, hay
una función h tal que para todo argumento x, x ∈ h si y sólo si para todo
argumento y, 〈x,y〉฀ ∉฀ ƒ; y (3) que, si ƒ es una función, hay una función h
tal que para todo argumento x, [h,x] = y cuando quiera que y es el único
argumento tal que 〈x,y〉฀ ∈฀ ƒ.25
El grupo IV demanda más atención. Los dos axiomas de que consta
sirven, respectivamente, para distinguir a las funciones-argumentos de los
argumentos que no son funciones y de las funciones que no son argumentos.
No obstante la simetría de sus propósitos, su alcance es muy diferente. El
Axioma IV.1 es prescindible, pues no habría ningún inconveniente formal
en suponer que todos los argumentos son a la vez funciones, esto es, que
cualquier objeto de la teoría puede nombrarse en primer lugar en una expre-
sión encerrada por corchetes (aunque esta suposición contraría evidentemente
nuestras ideas intuitivas de argumento y función). En cambio, el Axioma
IV.2 es la pieza central del sistema de von Neumann y de él se deducen el
Axioma de Separación, el Axioma de Reemplazo y el Axioma de Selección.
He aquí una traducción literal de estos axiomas (seguida de una paráfrasis
entre paréntesis):

IV.1 Hay una cosa-II a tal que una cosa-I x es una cosa-I/II si y sólo
si [a,x] ≠ A.
(Hay una función a tal que un argumento x es una función-argu-
mento si y sólo si x ∈ a.)

en τ la variable ξk por un nombre del argumento ak (1 ≤ k ≤ n). Entonces existe una


función ƒ tal que, para todo n-tuplo de argumentos x = 〈x1,…,xn〉, si τ(x) designa un
argumento, [ƒ,x] = τ(x).
25
El grupo III garantiza que, si Φ(a) expresa una condición impuesta a un n-tuplo de
argumentos a = 〈a1,…,an〉, habrá siempre una función฀ ƒ tal que Φ(a) si y sólo si
[ƒ,a] ≠ A (esto es, si y sólo si a ∈ ƒ). El Axioma III.1 lo asegura si Φ(a) envuelve
identidades y III.2 si envuelve cuantificación universal o existencial, mientras que III.3
implica que cualquier objeto y determinado implícitamente por una condición [ƒ,〈x,y〉]
≠ A tiene también una representación explícita y = [h,x].
1.8 Axiomas para una teoría de conjuntos 97

IV.2 Una cosa-II a no es una cosa-I/II si y sólo si hay una cosa-II b


tal que para cada cosa-I x existe un y que cumple las condiciones
[a,y] ≠ A y [b,y] = x.
(Una función a no es una función-argumento si y sólo si hay una
función b tal que para todo argumento x, [b,y] = x para algún y ∈
a.)

Como se puede ver, el Axioma IV.2, con toda su tremenda fuerza, es suma-
mente simple. Restringido a cosas-II (funciones) que sean dominios lo que
dice es esto: Un dominio a es un dominio propio— y no un mero conjun-
to— si y sólo si hay una función b que lo aplica sobre el universo de todos
los argumentos. Recordando el distingo tardío de Cantor entre pluralidades
inconsistentes y consistentes (Capítulo 1.6), podemos decir que en el sistema
de von Neumann una pluralidad es “demasiado grande” para ser recogida
como elemento en otra pluralidad si, pero solamente si es “tan grande”
como la pluralidad de todos los objetos ordinarios (conjuntos y elementos
de conjuntos). Pero en este sistema un objeto así “tan grande” admite una
interpretación natural como función que no es a su vez argumento de otra,
y no hace falta entender que los objetos que esa función admite como
argumentos no pueden “existir todos conjuntamente” (Cantor, GA, p. 443;
citado en el Capitulo 1.6).
Los tres axiomas del grupo V —”axiomas del infinito”— equivalen precisa-
mente al Axioma del Infinito, el Axioma de Unión y el Axioma del Conjunto
Potencia. Sólo el primero difiere significativamente en su formulación del
respectivo axioma de Zermelo, pues, aunque postula como éste la existencia
de un conjunto enumerablemente infinito, lo construye de otro modo. Doy
una paráfrasis de este axioma:

V.1 Existe una función-argumento a con las siguientes propiedades:


Hay una función-argumento x tal que x ∈ a. Si y es una función-
argumento tal que y ∈ a, hay una función-argumento z ≠ y tal que
z ∈ a y para todo x, x ∈ y implica x ∈ z.

Las funciones-argumentos de que aquí se habla no tienen que ser conjuntos,


pero si todas lo fuesen el conjunto a cuya existencia se postula admitiría la
caracterización siguiente: (i) a es un conjunto no vacío; (ii) algunos elementos
de a son conjuntos; (iii) todo conjunto que es un elemento de a es parte de
98 El Paraíso de Cantor

otro conjunto diferente que también es un elemento de a.


Von Neumann hace hincapié en que el grupo V sólo es indispensable para
la teoría de los cardinales infinitos, pero que los primeros cuatro grupos de
axiomas bastan para fundar la teoría de los conjuntos finitos y los números
naturales (enteros no negativos), así como una parte significativa de la teoría
del continuo, inclusive la definición de los números reales como secuencias
de Cauchy de racionales, los teoremas de convergencia de secuencias y series,
la teoría de las funciones continuas, el álgebra, el análisis y la integral de
Riemann. Pero sin el grupo V “carecen de sentido el Teorema de Weierstraß
sobre el supremo (de conjuntos numéricos, no secuencias), puesto que no
puede haber conjuntos de cosas-II; asimismo el concepto general de función,
el buen orden del continuo, la integral de Lebesgue” (von Neumann 1925,
p. 237).
Después de presentar los axiomas y bosquejar rápidamente el orden en
que la teoría de conjuntos se deduce de ellos (en su 1928), von Neumann
desarrolla algunas consideraciones escépticas sobre su significado y utilidad
(1925, pp. 229–40). Ellas giran esencialmente en torno al hecho de que la
teoría ofrecida no es categórica. En la Sección 1.8.1 indiqué que una teoría
axiomática se dice categórica si todos sus modelos son isomórficos. Como
un axioma nada dice sobre la naturaleza individual de los objetos a que se
refiere y sólo puede especificar la estructura resultante de sus relaciones
mutuas, una teoría categórica caracteriza su tema con la máxima precisión
alcanzable por un sistema axiomático. Von Neumann muestra que la teoría
determinada por sus axiomas no es categórica y sostiene que ninguna teoría
axiomática de conjuntos puede serlo. Según él, esto resulta de un teorema
demostrado por Löwenheim (1915) y generalizado por Skolem (1920, 1922).
Conforme a ese teorema, si una teoría T formulable en un cálculo predica-
tivo de primer orden tiene un modelo infinito, T tiene un modelo Mκ con
cardinal κ para cada κ ≥ ℵ0. Obviamente, Mκ no puede ser isomórfico a
Mλ si κ ≠ λ. El Teorema de Löwenheim-Skolem se aprecia mejor a la luz
de la semántica de Tarski y me referiré a él en el Capitulo 3.2. Por eso,
de las ideas presentadas por von Neumann en la última parte de su artículo
de 1925 mencionaré aquí una sola, que no envuelve dicho teorema y que
nos ayudará a entender el trabajo de Zermelo (1931) que estudiaremos en
la Sección 1.8.5.
1.8 Axiomas para una teoría de conjuntos 99

Los Fundamentos de la geometría de Hilbert incluyen desde la segunda


edición un “axioma de completud”,26 destinado a asegurar la categoricidad
de la teoría. En virtud del mismo, un modelo de la teoría no puede estar
incluido como parte propia en otro modelo que preserve las relaciones
geométricas entre los elementos del primero.27 Inspirándose en el ejemplo de
Hilbert, Fraenkel propuso completar la teoría axiomática de conjuntos con
el siguiente Axioma de Limitación:

ALF Aparte de los conjuntos que forzosamente tienen que existir en


virtud de los axiomas, no existen otros conjuntos.

Von Neumann (1925, p. 230) observa que esta formulación es vaga y la


reemplaza por otra más precisa (ajustada, además, a su terminología). Sea
Σ un modelo de la teoría de von Neumann, esto es, un sistema de cosas-I
y cosas-II (“argumentos” y “funciones”), en el cual se distinguen dos co-
sas-I, A y B, y las operaciones 〈 , 〉 y [ , ] están definidas de manera que
se cumplan todos los axiomas de los grupos I–V. Σ′ es un subsistema de Σ

26
Pido excusas por este neologismo feísimo, pero firmemente arraigado entre los especia-
listas de habla castellana (algunos prefieren decir ʻcompletitudʼ, que no suena mejor).
Corresponde al sustantivo alemán ʻVollständigkeitʼ y al inglés ʻcompletenessʼ, que
designan justamente la calidad de lo es o está completo (vollständig, complete). Más
eufónico hubiera sido quizás ʻcomplenitudʼ, ligado al verbo latino compleo (de donde
completus, ʻcompletoʼ) del mismo modo que ʻplenitudʼ está ligado con el verbo pleo
(ʻllenarʼ). Pero los profesores de lógica ya no estudian lenguas clásicas.
27
“V.2 (Axioma de completud lineal). El sistema de los puntos de una recta con sus re-
laciones de orden y congruencia no admite una ampliación que preserve las relaciones
entre los elementos anteriores así como las propiedades fundamentales que se derivan
de los Axiomas I–III de orden lineal y de congruencia y V.1” (Hilbert, GG, p. 30; el
Axioma V.1 es el Postulado de Arquímedes). Sin este axioma la teoría de Hilbert no
es categórica, pues el modelo numérico mencionado en la Sección 1.8.1 incluye una
parte propia que satisface los axiomas restantes si se mantiene la interpretación de
los primitivos y la definición pitagórica de distancia, a saber, el conjunto de los tríos
ordenados de números algebraicos. Esta estructura no es isomórfica a la primera, pues
el conjunto de los números algebraicos es numerable, mientras que  no es numerable.
Obsérvese que en virtud del Axioma V.2, el sistema de los puntos construibles con
regla y compás, estudiado por Euclides, no es un modelo de la teoría de Hilbert, 2ª
edición, a pesar de que satisface los Axiomas I–IV y V.1; porque dicho sistema es una
parte propia del espacio homeomorfo a Â3 estudiado por Descartes y los geómetras
modernos, que es un modelo de esta teoría.
100 El Paraíso de Cantor

si Σ′ consta de un sistema I′ de cosas-I y un sistema II′ de cosas-II, todas


las cuales pertenecen también a Σ, y A′ y B′ son cosas distinguidas de I′
(posiblemente diversas de A y B), y las operaciones 〈 , 〉′ y [ , ]′ definidas
en Σ′ son las restricciones de 〈 , 〉 y [ , ] a I′ y II′ (es decir, 〈ƒ,x〉′฀ = 〈ƒ,x〉
y [x,y]′ = [x,y]฀ si ƒ pertenece a II′ y x e y pertenecen a I′). Diré que el
subsistema Σ′ es un submodelo si los axiomas de los grupos I–V también
se cumplen si se entiende que se refieren a las cosas-I de I′, las cosas-II de
II′, las operaciones 〈 , 〉′ y [ , ]′ y los objetos distinguidos A′ y B′.28 Usando
este vocabulario el Axioma de Limitación puede reformularse así:

ALN Si Σ es un modelo de los axiomas de los grupos I–V y Σ′ ≠ Σ es


un subsistema de Σ,฀ Σ′ no฀ es un submodelo.

Von Neumann señala que la relación ʻser un subsistema deʼ que aquí figura
no puede asimilarse a la relación ʻ⊆ʼ definible en su teoría (u ⊆฀ v si y sólo
si u y v son funciones y para todo argumento x, x ∈฀ u implica que x ∈฀ v),
por cuanto el modelo Σ de que se habla necesariamente contiene funciones
(cosas-II) que no son argumentos (cosas-I), y por lo tanto no puede ser él
mismo una función con la que otra función tenga la relación ʻ⊆ʼ. Parecería
pues que hay que entender la relación ʻser un subsistema deʼ en su acep-
ción conjuntista ingenua, que tendríamos que dar por supuesta. El intento
de rescatar la teoría de Cantor mediante la caracterización axiomática de
sus conceptos fundamentales se vería entonces abocado al fracaso. Como
solución de esta dificultad, von Neumann adelanta la idea que me interesa
presentar. Consideremos un modelo P de la teoría de von Neumann que
comprende un sistema IP de argumentos y un sistema IIP de funciones, con
operaciones 〈 , 〉P y [ , ]P y argumentos distinguidos AP y BP. Supongamos
que todas las cosas-I y las cosas-II del anterior modelo Σ están contenidas
en IP y que para toda cosa-II ƒ de Σ hay una función φ en IIP tal que, para
toda cosa-I x de Σ, [φ,〈ƒ,x〉P]P es idéntico al valor [ƒ,x] determinado por la

28
Menciono dos objetos distinguidos A′ y B′฀ (o, respectivamente, A y B) por seguir a
von Neumann, pero en rigor para obtener un modelo de sus axiomas basta distinguir
una sola cosa del tipo I. En efecto, los axiomas de von Neumann mencionan un solo
argumento distinguido (A); el segundo (B) aparece en las definiciones de ʻdominioʼ y
ʻconjuntoʼ, términos que no se utilizan en los axiomas.
1.8 Axiomas para una teoría de conjuntos 101

operación [ , ] en Σ. Entonces Σ es un dominio en P y los subsistemas de


Σ tienen con Σ la relación ʻ⊆ʼ (en P).

Así habríamos sobreimpuesto a Σ una “teoría de conjuntos superior” P, en


la que también son argumentos cosas que en Σ no pueden serlo. Esto no
es absurdo de suyo. Si aceptamos como argumentos en un sistema nuevo
P a los conjuntos que eran “demasiado grandes” para ser argumentos [en
Σ], podemos siempre esquivar las antinomias si admitimos a su vez los
conjuntos “aún más grandes” (esto es, demasiado grandes en P) constitui-
dos por aquéllos, pero los declaramos inadmisibles como argumentos.
(Von Neumann 1925, p. 231)

Aunque la nueva idea enseguida se revela impotente para fundar una teoría
categórica,29 abre a la reflexión matemática perspectivas insondables. Vere-
mos ahora cómo Zermelo las despliega —con decidido espíritu cantoriano
(y leibniziano)— en la presentación de su segundo sistema de axiomas para
la teoría de conjuntos.

29
Sea N la teoría determinada por los cinco grupos de axiomas de von Neumann y NL
la determinada por N y el axioma ALN. NL es categórica por definición, pero habría
que ver si es consistente (relativamente a N). Para ello hay que formular condiciones
necesarias y suficientes para que un subsistema de un modelo de N sea un submodelo
y hallar un modelo de N ninguno de cuyos subsistemas las satisfaga. Von Neumann
considera imposible formular tales condiciones sin incurrir en un círculo vicioso. Por
ejemplo, el Axioma II.1 es verdadero en un subsistema Σ′ de un modelo Σ de N si y
sólo si hay en Σ′ una función ƒ tal que, para todo argumento x en Σ′, [ƒ,x] = x. Según
von Neumann no es lícito cuantificar sobre los argumentos del subsistema Σ′ en el
enunciado de las condiciones que deben servir para caracterizarlo. Podemos, claro está,
cuantificar sobre los argumentos (y funciones) de Σ, pero entonces obtenemos condi-
ciones suficientes, mas no necesarias para que un subsistema de Σ sea un submodelo.
Von Neumann da una lista de estas condiciones y muestra que todo modelo Σ de N
contiene un submodelo mínimo Σµ que las cumple todas. Entonces ningún subsistema
de Σµ cumple todas esas condiciones, pero cualquiera de ellos podría ser un submodelo
aunque no las cumpla.
102 El Paraíso de Cantor

1.8.5 Zermelo (1930)

En el artículo “Sobre números-límite y dominios de conjuntos” (1930),


Zermelo presenta un nuevo modo de concebir el tema mismo de la teoría
de conjuntos. Formula un sistema de axiomas que se inspira en el suyo de
1908 aunque difiere de él significativamente. El sistema no es categórico y
Zermelo, que ve en ello una virtud (véase la nota 6), procede a establecer
verdades generales sobre sus posibles modelos. Cada modelo M está caracte-
rizado por dos parámetros: el cardinal de su “base” de Urelemente (véase la
nota 5) y lo que Zermelo llama su “característica”, esto es, el primer ordinal
mayor que todos los ordinales realizados en M.30 Zermelo demuestra que dos
modelos M y M′ son isomórficos si y sólo si tienen bases equinumerosas y
la misma característica, y que si la característica de M es mayor que la de
M′, M contiene un submodelo isomórfico a M′. Las características inducen,
pues, un buen orden entre las clases de equivalencia (por isomorfismo) de
modelos con bases equinumerosas. Por otra parte, si dos modelos tienen la
misma característica, uno de ellos será en todo caso isomórfico a una parte
del otro, aunque sus bases no sean equinumerosas. La investigación “meta-
teórica” de los modelos de la teoría axiomática se conduce en el estilo y con
los conceptos del conjuntismo “ingenuo” de Cantor. Pero si existe un modelo
Mα con característica α, la metateoría restringida a modelos de característica
menor que α se deja establecer (en Mα) como una consecuencia de la teoría
axiomática. (Por otra parte, como el ordinal α no está realizado en Mα, de
todos modos hay que rebasar los recursos disponibles en este modelo para
que dicha metateoría restringida pueda siquiera ser descrita como tal.)
El sistema axiomático propuesto por Zermelo en 1930 reproduce sus
axiomas de 1908 con dos notables excepciones: 1º Se excluye el Axioma
de Selección (VI), porque “tiene otro carácter que los demás y no sirve para

30
Zermelo (1930) concibe los ordinales como tipos de orden, a la manera de Cantor. Así
entendido, el ordinal α está realizado en el modelo M si existe en M un conjunto bien
ordenado con tipo de orden α. Pero si concebimos a los ordinales a la manera de von
Neumann la expresión ʻα está realizado en Mʼ puede entenderse en sentido literal: ʻel
conjunto α existe en Mʼ. Evidentemente, si α está realizado en M en esta segunda
acepción también lo está en la primera. Por otra parte, si hay en M un conjunto bien
ordenado a con tipo de orden α, los axiomas de Zermelo (1930) aseguran que el ordinal
de von Neumann α฀ también existe en M (α es el alcance de la enumeración de a).
1.8 Axiomas para una teoría de conjuntos 103

delimitar los dominios [de los modelos]” y Zermelo ahora lo considera como
“un principio lógico universal presupuesto por toda nuestra investigación”
(1930, p. 31). 2º Se excluyen los asertos existenciales absolutos, es decir,
la postulación del conjunto vacío ∅฀ (Ι,฀ primera parte) y el Axioma del
Infinito (VII).31 Se incluyen, pues, aseveraciones equivalentes a los Axio-
mas de Determinación, Separación, Formación de Pares (I, última parte),
Conjunto Potencia y Unión. Se incluye además el Axioma de Reemplazo y
un nuevo “Axioma de Fundación” (mejor conocido en la literatura actual
como “Axioma de Regularidad”), en virtud del cual no puede haber ninguna
secuencia infinita a1, a2,…฀ tal que an+1 ∈ an para todo n ≥ 1 (por ende, no
hay cadenas infinitas de la forma …∈฀ a3 ∈฀ ∈฀
a2฀ a1, ni ciclos de la forma
a ∈ b ∈ …฀ ∈฀a).32 Zermelo designa cada uno de estos axiomas por letras
que —con una excepción— corresponden a la inicial del respectivo nombre
alemán. Llama ZF al sistema BAPUVE de los primeros seis, y ZF′ al sistema
completo BAPUVEF (F por Fundierung, ʻfundaciónʼ).33 La presentación de
los axiomas termina con esta importante observación metodológica:

Llamamos “dominio normal” a un dominio de “conjuntos” y “elemen-


tos primordiales” (“Urelemente”) que satisfaga nuestro sistema ZF′ con
respecto a la “relación fundamental” a ∈ b. A los “dominios” de este
género, sus “elementos”, “subdominios”, “uniones” e “intersecciones” los
trataremos conforme a los conceptos y axiomas universales de la teoría

31
El Axioma del Infinito reaparecerá al final, fortalecido a ultranza, como postulado “me-
tateórico”. Con respecto a ∅ tenemos sólo la indicación, en el Axioma del Conjunto
Potencia, de que cualquiera que sea el conjunto m, el respectivo conjunto Pm no está
vacío, sino contiene en cada caso el mismo Urelement arbitrariamente escogido u0
(“que hace las veces del ʻconjunto vacíoʼ”). Esta no es una aseveración absoluta de
existencia, pero implica que, si existe un conjunto, existe al menos un objeto que no
es un conjunto.
32
Gracias a que da por supuesto el Axioma de Selección, Zermelo puede enunciar elegan-
temente su Axioma de Fundación así: Todo conjunto no vacío x contiene un conjunto
y tal que para todo z ∈ x, z ∉ y. Cf. Mendelson 1958.
33
Cito el Axioma de Separación A (Aussonderung): “Toda función proposicional ƒ(x)
separa en cada conjunto m un subconjunto mƒ que contiene todos los elementos x tales
que ƒ(x) es verdad” (Zermelo 1930, p. 30). En una nota al pie de esa página Zermelo
explica que la función proposicional ƒ(x) —así como la función de reemplazo en el
Axioma de Reemplazo— puede ser “enteramente arbitraria”, de modo que “todas las
consecuencias derivadas de limitar estas funciones a una clase especial caducan desde
el punto de vista aquí adoptado ”.
104 El Paraíso de Cantor

de conjuntos, exactamente como [si fuesen] conjuntos, ya que no se dis-


tinguen materialmente (sachlich) de éstos en ningún aspecto esencial; pero
los llamaremos “dominios” y no “conjuntos” para diferenciarlos de los
“conjuntos” que son elementos del dominio bajo consideración.
(Zermelo 1930, p. 31)

En la terminología de Zermelo, un conjunto bien ordenado m es una secuen-


cia fundamental (Grundfolge) si el primer elemento de m es un Urelement
y todo otro elemento m es igual al conjunto de los elementos precedentes.
Así, una secuencia fundamental es —como un ordinal de von Neumann— un
conjunto bien ordenado por la relación ∈. Por lo demás, si convenimos
con Zermelo en que ∅ esté representado en cada dominio normal por un
cierto Urelement fijo u0 (véase nota 31), los ordinales de von Neumann son
secuencias fundamentales. Zermelo demuestra que si un dominio normal D
contiene un Urelement u y un conjunto bien ordenado r con tipo de orden
ρ, D contiene también una secuencia fundamental gρ similar a r cuyo primer
elemento es u.34 La totalidad de las secuencias fundamentales con idéntico
primer elemento u contenidas en un dominio fundamental D constituyen
un subdominio bien determinado Gu de D y sus respectivos tipos de orden
forman un segmento bien determinado Zδ de la serie de los ordinales, con
tipo de orden δ. Pero Gu no es uno de los conjuntos de D, ni hay en D un
conjunto bien ordenado con tipo de orden δ, sino que δ es el primer ordinal
mayor que todos los ordinales realizados en D. “De otro modo, se obtendría
la conocida Antinomia de Burali-Forti” (Zermelo 1930, p. 33). El ordinal δ,
así descrito, es la característica o número-límite del dominio normal D. A
continuación explicaré dos propiedades esenciales de tales números-límite
establecidas por Zermelo. Para aligerar la exposición, adoptaré las defini-
ciones de ordinal y cardinal de von Neumann (Sección 1.8.4); de acuerdo
con ellas, “el segmento Zδ de la serie de los ordinales determinado por el
ordinal δ” es precisamente el ordinal δ y un ordinal es un cardinal si no es
equinumeroso con un ordinal menor.

34
Por el Axioma de Reemplazo: sea u el reemplazante del primer elemento de r; réem-
placese cualquier otro elemento de r por el conjunto de los reemplazantes de sus
predecesores.
1.8 Axiomas para una teoría de conjuntos 105

(I) Si δ es la característica de un dominio normal, δ es un cardinal


regular. Esto quiere decir que si α es un ordinal menor que δ, y σα
es un subconjunto de δ tal que 〈σα,<〉 es similar a 〈α,<〉, entonces
|α| < |δ| y hay un ordinal β < δ tal que σα ⊆฀ β.35
(II) Se puede definir una aplicación ƒ de la serie de los ordinales en sí
misma, tal que (a) para cualesquiera ordinales ξ y ζ, ƒ(ξ) < ƒ(ζ) si
y sólo si ξ < ζ;฀(b) si α es un ordinal límite, limξ<αƒ(ξ) = ƒ(limξ<αξ)
y (c) si δ es la característica de un dominio normal, ƒ(δ) = δ. Esta
aplicación queda definida por las tres condiciones siguientes: (i)
ƒ(0) = 0; (ii) ƒ(ξ + 1) = |Pƒ(ξ)| para cada ordinal sucesor ξ + 1,
y (iii) ƒ(α) = limξ<αƒ(ξ) para cada ordinal límite α.36

35
DEMOSTRACIÓN DE (I). Sea δ la característica de un dominio normal D. Si δ no es un
cardinal hay un ordinal γ < δ, tal que |γ| = |δ|. En tal caso, γ está realizado en D. Por
el Teorema de Cantor, |Pγ| >฀ |γ| = |δ|. Pγ existe en D (por el Axioma del Conjunto
Potencia) y admite un buen orden similar a algún ordinal β. Entonces |β| = |Pγ| >
|δ|, de suerte que δ no es mayor que todos los ordinales realizados en D, contra la
hipótesis. Por lo tanto, δ es un cardinal. Supongamos ahora que σ es un subconjunto
de δ tal que 〈σ,<〉 es similar a 〈α,<〉 para algún ordinal α < δ y que hay un ξ ∈ σ tal
que para todo β < δ, β฀ ≤ ξ. En tal caso, Uσ existe en D (por el Axioma de Unión).
Pero Uσ, por ser la unión de un conjunto de ordinales, también es un ordinal, a saber,
limξ∈σξ = δ. Por lo tanto, Uσ no puede existir en D. En consecuencia, no existe un σ
⊂ δ que cumpla la condición señalada. Por lo tanto, δ es un cardinal regular.
Con un argumento similar al primero de los anteriores, Zermelo prueba también
que si δ es la característica de un dominio normal D, δ = ℵα para algún ordinal límite
α. En efecto, por ser un cardinal, δ = ℵα para algún ordinal α. Pero si α fuera un
ordinal sucesor, α = ξ + 1, el cardinal ℵξ estaría realizado en D y también, por lo
tanto, el cardinal |Pℵξ| ≥ ℵξ+1 = ℵα = δ, y δ no podría ser la característica de D. Por
consiguiente, α es un ordinal límite.
36
DEMOSTRACIÓN DE (II). Sea δ la característica de un dominio normal D. Probaré por
inducción transfinita (Apéndice VIII) que si α es un ordinal menor que δ, ƒ(α) < δ.
Supongamos que ƒ(ξ) < δ para todo ξ < α. Entonces, para todo ξ < α, Pƒ(ξ) existe
en D, de modo que ƒ(ξ + 1) = |Pƒ(ξ)| < δ. Por lo tanto, si α es un ordinal sucesor,
ƒ(α) < δ. Si α es un ordinal límite, sea α′ = {ƒ(ξ): ξ < α}. Como α está realizado
en D, α′ existe en D por el Axioma de Reemplazo y Uα′ existe en D por el Axioma
de Unión. Pero Uα′ = limξ<αƒ(ξ) = ƒ(α), de modo que ƒ(α) < δ, puesto que es un
ordinal que está realizado en D. En la demostración de (I) se vio que δ no puede ser
un ordinal sucesor. Por lo tanto es un ordinal límite y ƒ(δ) = limξ<δƒ(ξ). Si δ < ƒ(δ)
habría un α < δ tal que ƒ(α) > δ, contra lo que se acaba de probar. Por lo tanto, δ =
ƒ(δ).
106 El Paraíso de Cantor

Las propiedades (I) y (II) caracterizan a los cardinales inaccesibles.37 Se


los llama así porque, si κ es un cardinal de esta especie, no es posible “al-
canzarlo” a partir de cardinales menores que κ por las operaciones ordinarias
de formar pares, uniones y conjuntos potencia. No es difícil entender por
qué la característica δ de un dominio normal D tenía que ser un cardinal
inaccesible. D es un modelo de la teoría ZF′, que postula la existencia de
todo par, unión o conjunto potencia de conjuntos dados, y δ es el primer
ordinal mayor que todos los realizados en D. Por lo tanto, si κ y λ son or-
dinales menores que δ, |κ∪λ|, |Uκ| y |Pκ| están realizados en D y por ende
tienen que ser menores que |δ|฀ =฀ δ. Zermelo recurre reiteradamente a este
argumento en la demostración de (I) y (II) (notas 35 y 36).
La parte central del trabajo de Zermelo (1930) investiga patrones estructura-
les discernibles en todo modelo de la teoría ZF′. Empieza con esta importante
caracterización de los submodelos incluidos en un dado modelo:
LEMA: Sea D′ un subdominio del dominio normal D. D′ es un dominio
normal si y sólo si los siguientes objetos pertenecientes a D tam-
bién pertenecen a D′: (i) cada elemento contenido en un conjunto
perteneciente a D′ y (ii) cada conjunto que sólo contenga elementos
pertenecientes a D′. Si D′ comprende toda la base de Urelemente
de D, entonces D′ = D.38
37
Hausdorff (1914, p. 131) llamó “exorbitantes” a los ordinales que tienen la propiedad
(I); hoy suele llamárselos “débilmente inaccesibles”. Zermelo (1930, p. 35) observa
acertadamente que bajo la Hipótesis Generalizada del Continuo, los números que tienen
la propiedad (I) también tienen la propiedad (II): los cardinales débilmente inaccesibles
también son inaccesibles (en el sentido “fuerte”). El primer ordinal infinito ω tiene,
por cierto, las propiedades (I) y (II); algunos autores lo excluyen —por convención
terminológica— de la clase de los cardinales inaccesibles.
38
DEMOSTRACIÓN DEL LEMA. Hay que probar que los axiomas de la teoría ZF′ se cum-
plen en D′. Si a y b pertenecen a D′, {a,b} es un conjunto perteneciente a D′ (por la
condición (ii)). Si m es un conjunto perteneciente a D′ y mφ es el subconjunto de m
determinado por la condición φ, mφ pertenece a D′, pues mφ es un conjunto de D que
sólo contiene elementos de m, los cuales pertenecen todos a D′฀ (por (i)). Si m es un
conjunto de conjuntos perteneciente a D′, todos sus elementos y los elementos de sus
elementos pertenecen a D′ (por (i)); por ende, Um pertenece a D′ (por (ii)). Como todos
los elementos contenidos en un conjunto m perteneciente a D′ también pertenecen a D′
(por (i)), todos los subconjuntos de m existentes en D existen en D′ (por (ii)); por lo
tanto, Pm pertenece a D′ (por (ii)). Análogamente, se puede mostrar que D′ satisface
el Axioma de Reemplazo, si éste se refiere, como es natural, sólo a sustituciones de
elementos de un conjunto existente en D′ por objetos pertenecientes a D′.
1.8 Axiomas para una teoría de conjuntos 107

Premunido de este resultado, Zermelo establece que todo dominio normal


D con base U y característica δ se descompone en una serie bien ordena-
da de estratos no vacíos y mutuamente disjuntos Qα (α < δ), tales que un
objeto x del dominio D pertenece a Qα siempre que (i) para cada ξ < α,
x ∉ Qξ y (ii) para cada y ∈ x, hay un ξ < α tal que y pertenece a Qξ. La
descomposición del dominio normal D en dichos estratos se apreciará mejor
si prestamos atención a los “segmentos” Dα = Uβ < α฀ Qβ (0 < α < δ). Tales
segmentos pueden definirse así:

(S1) D 1 = U = Q 0.
(Sα) Si 0 < α < δ, y α es un ordinal límite, Dα = Uξ<α฀ Dξ; si α no es
un ordinal límite, α = β+1 y Dβ+1 contiene todos los objetos de D
cuyos elementos pertenezcan a Dβ.

Si estipulamos que Q0 = D1 = U y Qα = Dα+1\D α฀ (0 < α < δ), es claro que


los estratos Qα (α < δ) determinan una partición del dominio Dδ฀ = Uξ<δ฀ Dξ.
Se comprueba fácilmente que Dδ cumple las condiciones del lema. Como la
base U está incluida en Dδ, tenemos que Dδ = D.
Especial interés presenta la estratificación del dominio normal D cuando
es un “dominio unitario” (Einheitsbereich), esto es, cuando su base U consta
de un solo Urelement. Sea, pues, |U| = 1 y ƒ la aplicación definida en (II).
Entonces, para cada α < δ, tenemos que (i) |Dα| = |ƒ(α)|; (ii) si x es un
conjunto perteneciente a Dα, |x| < |Dα|; (iii) en el estrato correspondiente
Qα hay algún conjunto x tal que |x| = |Dα|; (iv) cada subdominio de Dα es
un conjunto en Dα+1, y (v) si α es un ordinal límite, todos los segmentos
Dξ฀ (ξ < α)฀ y sus respectivos subdominios son conjuntos en Dα. Además, |D|
= δ y cualquier subdominio de D que sea menos numeroso que D es un
conjunto perteneciente a D. Según esto, si D es un dominio normal unitario,
D satisface el Axioma IV.2 de von Neumann, según el cual una colección de
objetos es “demasiado grande” para ser un conjunto sólo si es tan numerosa
como todo el universo de objetos. Zermelo subraya que un modelo de ZF′
que tenga más de un Urelement no satisface ese axioma de von Neumann
(1930, p. 38). Muestra asímismo que cualquier dominio normal D admite
una “estratificación canónica”, cuyos “segmentos canónicos” se definen por
las estipulaciones siguientes:
108 El Paraíso de Cantor

(C1) D1 = U = Q0 (como S1).


(Cα) Si 0 < α < δ, y α es un ordinal límite, Dα = Uξ<α฀ Dξ; si α no es un
ordinal límite, α = β +1 y Dβ+1 contiene cada objeto x de D cuyos
elementos pertenecen a Dα y cuyo cardinal |x| ≤ |ƒ(α)| —donde ƒ
es la aplicación definida en (II).

Si D es un dominio unitario, (Cα) equivale a (Sα), de modo que D no admite


otra estratificación que ésta. La estratificación canónica le sirve a Zermelo
para establecer que las propiedades (I) y (II) son no sólo necesarias sino
también suficientes para que un dominio sea “normal” (esto es, para que sea
un modelo de ZF′). También se utiliza en la demostración de los teoremas
de isomorfismo a que aludí al comienzo y enunciaré con mayor precisión
ahora. Sea Uk la base y δk la característica de un dominio normal Dk (k =
1, 2). Teorema I. Si |U1| = |U2| y δ1 = δ2, D1 y D2 son isomórficos y una
biyección ϕ: U1 →฀ U2 determina un isomorfismo único D1 →฀ D2. Teorema
II. Si |U1| = |U2| y δ1 < δ2, D1 es isomórfico a un segmento canónico de D2.
Teorema III. Si δ1 = δ2, o bien D1 es isomórfico a un subdominio (propio o
impropio) de D2 o bien D2 es isomórfico a un subdominio (propio o impro-
pio) de D1. De la segunda parte del teorema I, Zermelo deduce fácilmente
que el grupo de automorfismos de un dominio normal es isomórfico (como
grupo) al grupo de permutaciones de su base.
En la última sección de su trabajo, Zermelo aborda “cuestiones de existen-
cia, consistencia y categoricidad”, bajo el supuesto de que el sistema ZF′
no implica contradicciones. Este supuesto no se ha demostrado, pero puede
aceptarse como plausible mientras no se derive una contradicción de los
axiomas BAPUVEF (y ninguna ha sido derivada hasta la fecha). Zermelo da,
entonces, por descontado que existe un dominio normal D con característi-
ca δ฀ y una base no especificada U. El teorema III de isomorfismo implica
que si U′ es una parte propia de U existe un dominio normal D′ con base
U′. En cambio, como no todo ordinal es un “cardinal inaccessible” con las
propiedades (I) y (II), una variación de la característica δ no genera auto-
máticamente un nuevo dominio normal. Ni siquiera es claro que haya tales
“cardinales inaccesibles”, ni, si los hay, cuántos son.
El primer ordinal que reúne las propiedades (I) y (II) es ω. Digamos que
un objeto m existente en D envuelve el infinito si m es un conjunto infinito
1.8 Axiomas para una teoría de conjuntos 109

o si hay en D n conjuntos a1, a2…, an tales que a1 es infinito y a1 ∈฀ a2


∈… ∈ an = m (n ≥ 1). El segmento Dω de la estratificación canónica de D
comprende precisamente todos los objetos de D que no envuelven el infinito.
Dω฀ es un dominio normal con característica ω. Por lo tanto, si ZF′ tiene un
modelo cualquiera D también tiene un modelo D′ con característica ω. La
existencia de este modelo “finitista” —que Zermelo piensa que no será dispu-
tada ni siquiera por los peores adversarios de la teoría de conjuntos— basta
al menos para probar que la teoría ZF′ es consistente. Pero, “justamente
porque no contiene ningún conjunto infinito, no se lo puede ser aducir
como un ʻmodeloʼ genuino de la teoría de conjuntos cantoriana” (1930, p.
44). El Axioma del Infinito de Zermelo (1908a), al postular la existencia de
un conjunto similar a ω, supera los límites del modelo descrito. Si hay un
modelo de ZF′ que satisfaga este axioma, esto es, un dominio normal D en
que el ordinal ω esté realizado, su característica es el primer cardinal regular
κ que sea un punto fijo de la función ƒ definida en (II), en otras palabras,
que satisfaga la ecuación ƒ(κ) = κ. Pero es sensato preguntar: ¿existe acaso
un ordinal κ > ω que tenga estas propiedades?
He aquí las consideraciones en que Zermelo basa su respuesta afirmativa
a esta pregunta. Si D es un dominio normal con característica κ,฀ no exis-
te en D ningún conjunto bien ordenado similar a κ, ni en general ningún
conjunto equinumeroso con κ. Por otra parte, la totalidad de las secuencias
fundamentales con idéntico Urelement inicial existentes en D tiene precisa-
mente el cardinal |κ| y forma una secuencia bien ordenada similar a κ. Pero
¿tenemos derecho a profesar que dicha totalidad existe como tal, si existe
el dominio normal D? Zermelo recuerda que si se fija la característica y el
cardinal de la base de un dominio normal D, la teoría ZF′ determina a D
“categóricamente” (es decir, ZF′ determina sin ambigüedades la clase de
todos los dominios normales isomórficos a D). Por lo tanto, si adoptamos “la
hipótesis general de que todo dominio categóricamente determinado puede
ser también concebido de algún modo como ʻconjuntoʼ, es decir, que puede
presentarse como elemento de un dominio normal (apropiado), resulta que a
cada dominio normal corresponde otro superior con la misma base, a cada
dominio unitario un dominio unitario superior, y así a cada ʻnúmero-límiteʼ
110 El Paraíso de Cantor

π corresponde también un número-límite mayor π′” (1930, p. 46).39 Esta re-


flexión se aplica también a cualquier totalidad categóricamente determinada
de “números-límite”, de modo que la serie de éstos números es tan ilimitada
como la de los ordinales y a cada ordinal transfinito corresponde biunívo-
camente un cardinal inaccesible.

Naturalmente, esto no es una consecuencia “demostrable” de los axiomas


ZF′, ya que la situación aseverada trasciende cada dominio normal parti-
cular. Más bien hay que postular la existencia de una serie ilimitada de
números-límite como un nuevo axioma para la “metateoría de conjuntos”
(für die “Meta-Mengenlehre”).
(Zermelo 1930, p. 46)

La nueva visión de la teoría de conjuntos arroja luz también sobre las


paradojas en que se ceban los “antimatemáticos”:

Estas aparentes “contradicciones” descansan meramente en una confusión


de la teoría de conjuntos misma, no determinada categóricamente por sus
axiomas, con los modelos particulares que la representan: lo que en un
modelo aparece como un “no-conjunto o superconjunto ultrafinito” (“ul-
trafinite Un- oder Übermenge”) es ya en el modelo superior siguiente
un “conjunto” plenamente válido con número cardinal y tipo de orden, y
constituye el cimiento sobre el cual se edifica el nuevo dominio. A la serie

39
El lector habrá advertido que Zermelo formula su “hipótesis general” en dos versiones
tales que la primera es plausible, pero la consecuencia buscada sólo se infiere de la
segunda, a saber:

(1) Todo dominio categóricamente determinado puede ser también concebido de


algún modo como “conjunto” (“irgendwie auch als ʻMengeʼ aufgefaßt werden
kann”—cursiva mía).
(2) Todo dominio categóricamente determinado puede presentarse como elemento de
un dominio normal idóneo (“als Element eines (geeignet gewählten) Normalbe-
reiches auftreten kann”).

Aunque en el texto de Zermelo van unidos por la expresión “es decir” (das heißt),
los asertos (1) y (2) no dicen lo mismo, y no es posible establecer su equivalencia
lógica sin premisas adicionales. ʻConjuntoʼ se usa en (1) en su significado “ingenuo”
ordinario, y no está dicho que sólo un objeto que se llame ʻconjuntoʼ en un modelo
de la teoría ZF′ sea admisible como ejemplo ilustrativo de ese significado.
1.8 Axiomas para una teoría de conjuntos 111

ilimitada de los ordinales cantorianos corresponde pues una doble serie


igualmente ilimitada de modelos esencialmente distintos de la teoría de
conjuntos, en cada uno de los cuales se expresa íntegra la teoría clásica.
Las dos tendencias polarmente opuestas del espíritu que piensa, la idea del
progreso creador y la de la conclusión abarcadora, que también subyacen
a las “antinomias” kantianas, están representadas y reconciliadas simbó-
licamente en el concepto de la serie transfinita de los números, basada en
el buen orden, la cual en su progreso sin límites no tiene una verdadera
conclusión, pero sí estaciones, a saber, justamente esos “números-límite”
que separan los tipos de modelo superiores de los inferiores. Y así las
“antinomias” de la teoría de conjuntos, bien entendidas, conducen a la
ciencia matemática no a un estrechamiento y mutilación, sino más bien
a un despliege y enriquecimiento que aún es imposible abarcar con la
mirada.
(Zermelo 1930, p. 47)
2

CÁLCULOS
2.1 EL PROGRAMA DE HILBERT

Hacia 1920, David Hilbert, entonces en la cima de su fama, se embarcó re-


sueltamente en un nuevo programa de fundamentación de las matemáticas.
Más tarde, ante la Sociedad Filosófica de Hamburgo, explicará su propósito,
lapidariamente, así:

Con esta nueva fundamentación de las matemáticas persigo un fin im-


portante: Al hacer de cada enunciado matemático una fórmula que pueda
exhibirse en concreto y derivarse con rigor y al darle así a las conceptua-
lizaciones e inferencias matemáticas una forma tal que resulten irrefuta-
bles y a la vez proporcionen una representación de la ciencia [matemáti-
ca] entera, yo quisiera eliminar definitivamente del mundo la cuestión de
los fundamentos de las matemáticas.
(Hilbert 1931, p. 489; cursiva mía)

Su interés en el asunto no era nuevo. En 1899 había publicado la prime-


ra axiomatización adecuada de la geometría euclidiana.1 Al año siguiente
apareció su caracterización axiomática del cuerpo de los reales, que reem-
plaza —y vindica— las definiciones clásicas de los números reales como
colecciones infinitas de racionales (Hilbert 1900).2 Dos cuestiones de funda-
mentos encabezan la lista de problemas para el siglo XX que planteó ese
mismo año al Primer Congreso Internacional de Matemáticos, reunido en
París: el problema cantoriano de la cardinalidad del continuo y la consisten-

1 En la Sección 1.8.1 me referí brevemente a esta obra. Mario Pieri (1899) publicó casi
al mismo tiempo otra axiomatización de la geometría clásica, muy diferente de la de
Hilbert, pero no menos idónea.
2 Los axiomas de Hilbert definen el sistema de los reales como un cuerpo arquimédico
completo (véase el Glosario, s.v. ‘cuerpo’). Las definiciones clásicas de Weierstraß,
Méray, Dedekind y Cantor determinan sendos modelos (realizaciones) de esta especie
de estructura. Como todos los modelos de un cuerpo arquimédico completo son
isomórficos, dichas definiciones pueden aceptarse como equivalentes.

115
2.1 El programa de Hilbert 116

cia3 de “los axiomas aritméticos”, expresión con la que designa a los axio-
mas de la teoría de los reales. La importancia de este último problema se
puede explicar así: Varias pruebas propuestas en el siglo XIX referían la
consistencia de una teoría dudosa a la de otra teoría incuestionada.
Lobachevsky, por ejemplo, había mostrado que las fórmulas trigonométricas
de su geometría no-euclidiana podían generar una contradicción sólo si la
trigonometría esférica euclidiana era inconsistente. El mismo Hilbert (1899)
había probado que su axiomatización de la geometría euclidiana no era in-
consistente a menos que la teoría de los números reales también lo fuera.
Con ello, ancló las anteriores pruebas de consistencia relativa en la consis-
tencia de la aritmética. Ésta tendría que demostrarse directamente, estable-
ciendo la imposibilidad, no condicional, sino absoluta de inferir una contra-
dicción de sus axiomas. Ante el Tercer Congreso Internacional, celebrado en
Heidelberg, Hilbert (1904) explicó a grandes rasgos cómo habría que proce-
der a tal demostración directa. Esta ponencia, que manifiestamente subesti-
ma la dificultad de la empresa, adelanta ya algunos planteamientos y méto-
dos característicos de su programa de los años 20.4 Pero su renovado interés
en el tema fue motivado al parecer por las críticas de Brouwer (1907, 1912)
y de Weyl (1921) a la fundamentación conjuntista del análisis y el consi-
guiente rechazo por parte de estos eminentes matemáticos de la metodología
matemática habitual.
La filosofía matemática de Brouwer y Weyl cae fuera de los límites de
este libro. Pero para apreciar los motivos y la orientación del programa de
Hilbert no es preciso conocer el pensamiento de estos autores, sino solamen-
te la idea que se hacía al respecto el propio Hilbert (quien, al parecer, no

3 Hilbert dice ‘Widerspruchslosigkeit’, literalmente, ‘carencia de contradicción’. Un sis-


tema de axiomas tiene esta propiedad si es imposible derivar de él aseveraciones con-
tradictorias “mediante un número finito de inferencias lógicas” (Hilbert 1900a; GA,
III, 300). En adelante, usaré siempre los sustantivos ‘consistencia’, ‘inconsistencia’ (así
como los correspondientes adjetivos ‘consistente’, ‘inconsistente’) en esta acepción. Más
adelante habrá oportunidad de precisar —de distintas maneras en diferentes casos— lo
que se admite como “inferencia lógica”. Otros autores llaman ‘consistente’ a una teo-
ría, axiomatizada o no, si admite una realización o modelo. Para evitar confusiones,
usaré siempre las palabras ‘realizable’, ‘realizabilidad’ para referirme a esta propiedad
de las teorías (o de sus axiomas).
4 Me referiré a Hilbert 1904 en la Sección 2.9.2, donde dispondremos de más elementos
de juicio para apreciar sus propuestas.
2.1 El programa de Hilbert 117

puso demasiado empeño en entenderlos).5 En su primer trabajo sobre el nuevo


programa, se expresa así:

[Weyl y Brouwer] buscan fundamentar la matemática arrojando por la


borda todo lo que les parece incómodo y erigen una Dictadura de la Pro-
hibición à la Kronecker. Con ello, empero, desmiembran y mutilan nues-
tra ciencia, y corremos el peligro de perder gran parte de nuestros más
valiosos tesoros si seguimos a tales reformadores. Weyl y Brouwer pros-
criben los conceptos generales de número irracional y de función, inclusi-
ve de función aritmética, los números cantorianos de las clases superiores
de números, etc.; también el teorema según el cual entre infinitos núme-
ros naturales siempre hay uno menor que los demás, e incluso el princi-
pio lógico “Tertium non datur”, por ejemplo, en la aseveración: o bien
hay sólo un número finito de números primos o hay infinitos. Estos son
ejemplos de proposiciones e inferencias prohibidas. Creo que así como
Kronecker no logró suprimir el número irracional —Weyl y Brouwer per-
miten al menos conservar un muñón— tampoco Weyl y Brouwer tendrán
éxito. No. Brouwer no es la revolución, como cree Weyl, sino sólo la
repetición, con recursos viejos, de un amago de putsch que antes falló
totalmente aunque fue intentado con mucha más decisión, y que, ahora
que el poder del estado ha sido tan bien equipado y fortalecido por Frege,
Dedekind y Cantor, está de antemano condenado al fracaso.
(Hilbert 1922; GA, III, 159s.)

A mi modo de ver, el desacuerdo entre Kronecker y Cantor reside, en lo


esencial, en esto: Kronecker exigía que toda definición matemática incluyera
un método para decidir efectivamente a cuáles objetos se aplicaba y a cuáles
no;6 en cambio, Cantor no tenía inconveniente en reconocer que una colec-

5 El lector curioso encontrará en el Apéndice XIX un esbozo de las ideas de Brouwer


contra las que reacciona Hilbert. Allí podrá comprobar que la parte positiva de la en-
señanza de este autor no ha sido criticada por Hilbert, quien sólo buscó proteger a la
matemática clásica contra su escepticismo, mediante una nueva e irrebatible
fundamentación.
6 Kronecker difundía su concepción de las matemáticas desde su influyente cátedra en la
Universidad de Berlín. De sus escritos, el más filosófico es tal vez el ensayo “Sobre el
concepto de número” (1887), pero en él no figura la exigencia arriba mencionada. Pero
el siguiente pasaje, tomado de un trabajo de Kronecker de 1882, la aplica muy clara-
mente en un caso especial: “La citada definición de irreducibilidad carecerá de un fun-
damento seguro mientras no se indique un método mediante el cual se pueda decidir,
ante una función determinada dada, si ella es o no irreducible conforme a dicha defi-
2.1 El programa de Hilbert 118

ción de objetos existe y está completamente determinada, aunque no haya


un inventario de sus elementos o un método efectivo para generarlo. Al igual
que Kronecker, Brouwer y sus partidarios rechazan este supuesto. Por eso,
no pueden aceptar la idea moderna de aplicación (función) como corres-
pondencia arbitraria entre conjuntos, ni la identificación de los números
irracionales con secuencias de racionales (no convergentes en Œ), ni los
ordinales transfinitos de Cantor. En ese rechazo se basa también la prohibi-
ción de invocar el Principio del Tercero Excluido o Tertium non datur en las
demostraciones referentes a colecciones infinitas.7 En efecto: supongamos que
el mero enunciado de una condición no contradictoria C no basta para deter-
minar la colección de los objetos que son C; entonces, aunque se pruebe que
es falso que todos los C cumplen además una cierta condición D, no se habrá
establecido que existe un objeto x que es C pero no es D; para certificar la
existencia de tal objeto hay que presentarlo o, al menos, presentar un méto-
do para construirlo.
Hilbert, en cambio, entiende de muy distinta manera lo que un matemáti-
co puede y debe admitir como existente. Como le hace presente a Frege en
la misma carta del 29 de diciembre de 1899 que cité en la Sección 1.8.1:

Si los axiomas arbitrariamente estipulados, junto con todas sus conse-


cuencias, no se contradicen entre sí, entonces son verdaderos y existen las
cosas definidas por ellos. Ese es para mí el criterio de la existencia y de
la verdad.
(Frege, KS, p. 411)

En otras palabras, si el matemático caracteriza un sistema de objetos me-


diante una serie de condiciones mutuamente compatibles (esto es, mediante
condiciones que no se contradigan explícitamente y no impliquen consecuen-

nición” (citado por O. Becker 1954, p. 328, de Kronecker, “Grundzüge einer


arithmetischen Theorie der algebraischen Grössen”, § 4).

falsa: no hay una tercera alternativa (non datur tertium); simbólicamente: p ∨ ¬p. Apli-
7 El Principio del Tercero Excluido afirma que cualquier aseveración p es verdadera o es

cado a un predicado Γ atribuible a los elementos de un conjunto caracterizado por un


predicado ∆, el Principio afirma que, o bien todos los elementos del conjunto {x: ∆x}
son Γ, o bien alguno de ellos no es Γ; simbólicamente:
∀x(∆x → Γx) ∨ ∃x(∆x ∧ ¬Γx)
2.1 El programa de Hilbert 119

cias contradictorias), tiene que reputar existente a cualquier objeto cuya per-
tenencia al sistema se infiera de dichas condiciones. Hilbert le da un giro un
tanto distinto a esta idea en la citada ponencia ante el Congreso de París:

Si a un concepto se le asignan características contradictorias, digo que ese


concepto matemáticamente no existe. […] Pero si se logra demostrar que
las características asignadas al concepto no pueden conducir jamás a una
contradicción mediante la aplicación de un número finito de inferencias
lógicas, digo que con ello se ha demostrado la existencia matemática del
concepto (por ejemplo, de un número o una función que cumple ciertos
requisitos).
(Hilbert 1900a; GA, III, 301–302)

Esta noción de existencia conceptual ad usum mathematicorum concuerda


hasta cierto punto con lo que Cantor llamaba la “realidad inmanente” de los
objetos matemáticos (Capítulo 1.6).8 Como en este punto Hilbert discrepa
absolutamente de Brouwer y los suyos, su polémica con ellos estaba de an-
temano destinada a ser un diálogo entre sordos.9 Pero el propósito de Hilbert

8 Cantor exigía además que todo nuevo sistema introducido mediante una caracteriza-
ción consistente estuviese firmemente arraigado en la tradición matemática. En sus pa-
labras: los nuevos conceptos deben “estar en relaciones firmes, ordenadas mediante de-
finiciones, con los conceptos previamente formados, ya existentes y probados” (Can-
tor, GA, p. 182; citado en la Sección 1.6). Podría decirse que Hilbert introduce una
exigencia similar cuando compara un problema matemático nuevo —especialmente cuan-
do lo suscita la investigación de la naturaleza— con “una ramita joven que sólo pros-
pera y da fruto si se la injerta cuidadosamente según las reglas rigurosas del arte del
jardinero en el tronco viejo, el seguro patrimonio de nuestro saber matemático” (1900a;
GA, III, 293s.).
9 Van Dalen (1990) narra cómo Hilbert, que era el director de Mathematische Annalen,
hizo sacar a Brouwer de la lista de colaboradores distinguidos impresa en la portadilla
de la revista —donde figuró desde 1915 hasta 1928— porque, según le notificó, “no
me es posible colaborar con usted, dada la incompatibilidad de nuestros puntos de vis-
ta sobre cuestiones fundamentales”. Una conferencia dictada por Hilbert en 1928 ante
el Seminario Matemático de Hamburgo, contiene la siguiente indisimulada alusión a
Brouwer: “Quitarle al matemático el tertium non datur sería como querer prohibirle el
telescopio al astrónomo o el uso de los puños al boxeador. La prohibición de las ase-
veraciones existenciales y el tertium non datur viene a ser más o menos lo mismo que
la renuncia a la ciencia matemática en general. […] Me asombra que un matemático
ponga en duda la validez rigurosa del modo de inferencia basado en el tertium non
datur. Más me asombra que, al parecer, se haya formado ahora toda una comunidad de
2.1 El programa de Hilbert 120

no era quizás traerlos de vuelta al redil, sino sólo neutralizar de una vez por
todas el efecto descorazonador que sus objeciones pudieran tener sobre los
buenos matemáticos. En interés de la matemática misma, pero también de
toda nuestra cultura, quiere establecer que “las proposiciones matemáticas
de hecho son verdades inexpugnables y definitivas” (1922; GA, III, 162).10
La incertidumbre que todavía prevalece al respecto se debe, según él, a que
los estudios sobre los fundamentos de las matemáticas realizados hasta en-
tonces

no permiten reconocer un camino que haga posible formular cada cues-


tión relativa a los fundamentos de tal modo que tenga que ir seguida de
una respuesta unívoca. Pero esto es justamente lo que reclamo: En princi-
pio, en asuntos matemáticos, no deben tener cabida las dudas, ni las me-
dias verdades, ni las verdades esencialmente heterogéneas (es soll in
mathematischen Angelegenheiten prinzipiell keine Zweifel, es soll keine
Halbwahrheiten und auch nicht Wahrheiten von prinzipiell verschiedener
Art geben können).
(Hilbert 1922; GA, III, 157)

Como Hilbert (1899) había demostrado que su axiomatización de la geo-


metría no es contradictoria a menos que el concepto clásico de número real
lo sea, la certeza indisputable que Hilbert demanda se habrá logrado, a sus

matemáticos que lo hace. Pero sobre todo me asombra el hecho de que incluso entre
matemáticos el poder de sugestión de un solo hombre ingenioso y temperamental (die
Suggestivkraft eines einzelnen temperamentvollen und geistreichen Mannes) sea capaz
de ejercer los efectos más excéntricos y más inverosímiles” (Hilbert 1928; GG7, p. 307).
10 Más de una vez Hilbert ha descrito su programa como una cruzada cultural. Por ejem-
plo, en su alocución al Congreso de Matemáticos de Bologna:
¿En qué pararía la verdad de nuestro saber en general y la existencia y el progre-
so de la ciencia si ni siquiera en las matemáticas hubiese una verdad segura? Y en
efecto, hoy por hoy, el escepticismo y el desánimo con respecto a la ciencia sue-
len expresarse incluso en la literatura especializada y en conferencias públicas.
Esto es como una especie de ocultismo, que juzgo dañina. La Teoría de la Prueba
hace imposible tal actitud y nos procura la convicción entusiasta de que al menos
el entendimiento matemático no tiene límites y puede incluso rastrear las leyes
del pensamiento mismo.
(Hilbert 1928a, en GG7, p. 323)
2.1 El programa de Hilbert 121

ojos, en cuanto dispongamos de una teoría consistente de los reales. Equipa-


rando los reales con ciertos conjuntos infinitos de racionales, los conjuntistas
intentaron fundar una teoría de los reales por lo menos tan consistente como
la aritmética. Según Brouwer y Weyl, las paradojas de la teoría de conjuntos
han puesto en evidencia la futilidad de ese intento. Hilbert no comparte esta
manera de ver:

El hecho de que el concepto de conjunto en el sentido más general no sea


admisible sin más no excluye de ningún modo que el concepto de un
conjunto de números enteros sea correcto. Y las paradojas de la teoría de
conjuntos no pueden considerarse como una prueba de que el concepto de
conjunto de números enteros lleva a contradicciones. Al contrario: todas
nuestras experiencias matemáticas respaldan la corrección y la consisten-
cia de este concepto.
(Hilbert 1922; GA, III, 158)

Hilbert alude además a su propia axiomatización de la teoría de los reales


(1900), que los caracteriza sin recurrir al concepto de conjunto de enteros.11
Sus axiomas son suficientes para fundamentar el análisis. En este campo,
“no obstante las más osadas y diversas combinaciones y el uso de los méto-

11 Según Hilbert, gracias a su caracterización axiomática “las dudas que en general se


han hecho valer contra la existencia del agregado (Inbegriff) de todos los números rea-
les y de conjuntos (Mengen) infinitos en general pierden toda su justificación […]: el
conjunto de los números reales no tiene que concebirse ahora, digamos, como la tota-
lidad (Gesamtheit) de las leyes que pueden gobernar la sucesión de los términos de
una secuencia de Cauchy (Fundamentalreihe), sino más bien […] como un sistema
(System) de cosas cuyas relaciones mutuas están dadas por el sistema finito y cerrado
de los Axiomas I–IV [que caracterizan un cuerpo arquimédico completo] y sobre los
cuales valen otras aseveraciones sólo si uno puede derivarlas de esos axiomas me-
diante un número finito de inferencias lógicas” (1900; GG7, p. 246). He puesto en
cursiva la cláusula final (el original destaca sólo las tres palabras correspondientes a
‘finito y cerrado’) porque tendré que referirme a ella más adelante. En el pasaje para-
lelo de Hilbert 1900a está expresada en forma aún más drástica así: “El continuo [en
la concepción axiomática es] un sistema de cosas cuyas relaciones mutuas están regu-
ladas por los axiomas establecidos y con respecto a las cuales son verdaderos todos los
hechos y solamente los hechos que se pueden deducir de los axiomas mediante un nú-
mero finito de inferencias lógicas (für welche alle und nur diejenige Tatsachen wahr
sind, die durch eine endliche Anzahl logischer Schlüsse aus den Axiomen gefolgert
werden können)” (GA, III, 301).
2.1 El programa de Hilbert 122

dos más refinados, reina una total seguridad en las inferencias y una concor-
dancia patente de todos los resultados” (Hilbert 1922; GA, III, 159), y por
lo tanto se justifica aceptar los axiomas que cimientan esa seguridad y con-
cordancia. “Disputar esa justificación sería privar de antemano a toda cien-
cia de la posibilidad de operar” (ibid.). Subsiste, con todo, el problema de
probar la consistencia de los axiomas. Este es justamente el problema que
Hilbert quiere resolver con su nuevo programa.
Contestando a la citada carta de Hilbert (del 29.XII.1899), Frege se pre-
gunta qué medios hay para demostrar que ciertas propiedades o requisitos
no se contradicen mutuamente. Responde así:

El único que conozco es este: Exhibir un objeto que posea todas esas
propiedades, indicar un caso en que se cumplan todos esos requisitos. No
sería posible demostrar la consistencia (Widerspruchslosigkeit) por otra vía.
(Frege, KS, p. 414)

Obviamente es inútil aducir la consistencia de un conjunto de axiomas como


criterio de la existencia de un sistema de objetos caracterizado por él, si para
cerciorarse de aquélla hay que tener a éstos por delante. Pero el programa
de Hilbert se encamina a demostrar directamente la imposibilidad de inferir
una contradicción de las teorías axiomáticas que le interesan. Ello presupo-
ne, por cierto, que se conozcan con precisión todas las formas de inferencia
legítimas, así como la estructura de las conclusiones que ellas permiten de-
ducir de cada clase tipificable de premisas. En este aspecto esencial el pro-
grama de Hilbert se apoya en la formalización de la lógica y las matemáti-
cas emprendida por el propio Frege y perfeccionada por Russell y Whitehead.
En los Capítulos 2.2–2.4 hablaré de las motivaciones y principales logros de
esa empresa. Pero antes debo redondear este capítulo introductorio con algu-
nas indicaciones generales sobre la función que desempeñan en el programa
de Hilbert.
En Principia Mathematica (1910–13), Whitehead y Russell mostraron que
todas las proposiciones clásicas de la aritmética y el análisis pueden enun-
ciarse en la escritura ideográfica, de sintaxis simple y precisa, desarrollada
por ellos. En su sistema lógico-matemático las inferencias desde premisas
formuladas en esa escritura se ajustan a unos pocos patrones fácilmente
reconocibles. Utilizando esos patrones, de un par de premisas contradicto-
2.1 El programa de Hilbert 123

rias puede deducirse cualquier conclusión.12 El programa de Hilbert se basa


en esto. Hilbert piensa que una vez que los axiomas cuya consistencia inte-
resa demostrar se han enunciado en la escritura canónica podemos desaten-
der por completo lo que se quería decir con ellos (olvidar, por ejemplo, que
intentábamos referirnos al infinito actual). La única tarea pendiente consiste
en probar que hay por lo menos una oración que no se puede deducir de los
axiomas. Específicamente, es preciso demostrar que es imposible que cierta
fórmula de la escritura canónica—por ejemplo, un enunciado de la igualdad
‘0 = 1’— ocupe el último lugar en una lista de tales fórmulas cada una de
las cuales es un axioma o se deduce de una o más de sus predecesoras en la
lista conforme a uno de los patrones de inferencia del sistema. Tal demostra-
ción, claro está, debe efectuarse de manera que no deje lugar a dudas y que
no invite, a su vez, a probar la consistencia de los recursos utilizados en
ella. Para ello es necesario y suficiente, según Hilbert, que la demostración
requerida se conduzca enteramente en el ámbito de lo que él llama la “pos-
tura finita” (finite Einstellung) o el “punto de vista finito” (finiter Standpunkt).
De este modo, Hilbert, sin renunciar al transfinito cantoriano, trata de ha-
cerlo inofensivo reduciéndolo a ser nada más que el referente ideal —y olvida-
ble— de ciertos símbolos que el matemático puede y debe utilizar como si
no significaran nada. Ello implica reemplazar lo que Hilbert llama el “razo-
namiento sustantivo” (inhaltliches Schließen), expresado en alemán o caste-
llano, que se hace pensando en aquello sobre lo cual se discurre, por un tipo
de razonamiento puramente formal, que, sin pensar, manipula filas de signos
de la escritura ideográfica conforme a reglas que conciernen únicamente a
su aspecto y no a su significado.13 Esto no quiere decir, sin embargo, que
Hilbert auspicie una matemática no-pensante. A la matemática “clásica”, que

Sea ¬α la negación de una oración α. Sea β otra oración cualquiera. De la premisa α


es lícito inferir (β → α). De las premisas (β → α) y ¬α es lícito inferir β. Por lo
12

tanto, de las premisas α y ¬α, puede inferirse la conclusión β.


13 “Obtenemos así, en lugar de la ciencia matemática sustantiva (inhaltlich), trasmitida en
el lenguaje corriente, un caudal de fórmulas con signos matemáticos y lógicos, que se
ponen en fila según ciertas reglas. A los axiomas matemáticos corresponden algunas de
las fórmulas y a la inferencia sustantiva (inhaltliches Schließen) corresponden las re-
glas conforme a las cuales las fórmulas se suceden unas a otras. La inferencia sustantiva
es reemplazada, pues, por un operar extrínseco según reglas…” (Hilbert, 1925; GA,
III, 177). El vocablo alemán inhaltlich que traduzco por ‘sustantivo, a’, se deriva de
Inhalt, ‘contenido’ y significa literalmente ‘propio del contenido’, ‘relativo al conteni-
2.1 El programa de Hilbert 124

se trata de hacer inmune a la crítica aunque sea al precio de exonerarla del


pensamiento, viene ahora a agregarse una “meta-matemática”: la Teoría de
la Prueba (Beweistheorie), que estudia sistemáticamente el razonamiento
formal y servirá para establecer que éste no podrá nunca generar una contra-
dicción dentro de la matemática formalizada. La Teoría de la Prueba razona
“sustantivamente”, pensando en lo que dice; pero, como trata sólo de signos
que son marcas fácilmente reconocibles de tinta o de tiza y de reglas sim-
ples para combinar esas marcas en filas y en columnas, se mantiene, según
Hilbert, dentro de la “postura finita” y no corre el riesgo de contradecirse.14
Hilbert nunca hizo un inventario de los recursos accesibles a la “postura
finita” ni los caracterizó mediante una definición precisa. Pero los ejemplos
que ofrece en los artículos en que anuncia y defiende el programa, la exi-
gencia de que la prueba de consistencia sea inequívoca e incuestionable, y
el mismo adjetivo ‘finito’ empleado para describirlos dan, creo, una idea bas-
tante clara de la índole y alcance de esos recursos. Parece obvio, por ejem-
plo, que el matemático en “postura finita” no podrá contemplar la existencia
de un conjunto cerrado de objetos actualmente infinito, sino a lo sumo se-
cuencias abiertas, potencialmente infinitas. Al razonar sobre éstas, se absten-
drá de invocar el Principio del Tercero Excluido. Como anota von Neumann:
“El demostrar sustantivo debe desarrollarse en completo acuerdo con la ló-
gica intuicionista de Brouwer y Weyl. La Teoría de la Prueba debe edificar,
por decirlo así, la matemática clásica sobre una base intuicionista y de este

do’. Por eso el término hilbertiano inhaltlich se ha solido traducir al inglés por
‘contentual’, un neologismo que es feo en ese idioma y sería prácticamente ininteligi-
ble en el nuestro. Me parece en cambio que el contraste que hacemos en castellano
corriente (no filosófico) entre la “mera forma” y la “sustancia” de un asunto justifica
mi traducción de inhaltlich.
14 Von Neumann (1927, pp. 1–2) describe estos dos tipos de razonamiento con insupera-
ble claridad:
Hay que distinguir tajantemente entre dos modos diferentes de “demostrar”: El
demostrar formalista (“matemático”) dentro del sistema formal y el demostrar
sustantivo (“metamatemático”) concerniente al sistema. Mientras aquél es un jue-
go lógico definido arbitrariamente (aunque tiene que ser, por cierto, en buena
medida análogo a la matemática clásica), éste consiste en un encadenamiento de
intuiciones sustantivas (inhaltlicher Einsichten) inmediatamente evidentes.
2.1 El programa de Hilbert 125

modo reducir al absurdo el intuicionismo estricto” (1927, p. 2).15


La insistencia en que las teorías matemáticas bajo estudio se formulen en
una escritura canónica similar la adoptada en Principia Mathematica obede-
ce, sobre todo, a que entonces —como ha señalado Kreisel— la cuestión de
su consistencia se torna “finita” en el sentido preciso siguiente: “Dadas las
reglas formales y, por lo tanto, en particular, la lista (finita) de símbolos a
utilizar, uno puede decidir con respecto a cualquier secuencia de ‘palabras’

palabras de la forma a y ¬a, donde el símbolo ¬ se usa para expresar la


(= fórmulas) si está construida de acuerdo con las reglas y si contiene o no

negación” (Kreisel 1976, p. 94). Este es el objetivo de las tres primeras ta-
reas que von Neumann asigna a la Teoría de la Prueba en la ponencia que
leyó como portavoz del grupo de Hilbert en el simposio sobre fundamentos
de la matemática celebrado en Königsberg en septiembre de 1930 (en que
también hablaron Heyting, por la escuela de Brouwer, y Carnap, por el
logicismo à la Frege-Russell favorecido en el Círculo de Viena):

1. Enumerar todos los símbolos empleados en la matemática y la lógica.

2. Caracterizar inequívocamente todas las combinaciones de dichos símbo-


los que representan oraciones dotadas de sentido según la matemática clási-
ca. Estas combinaciones se llaman “fórmulas”. (Adviértase que una oración
dotada de sentido no tiene que ser verdadera. ‘1 + 1 = 1’ es una oración
dotada de sentido, pero falsa).

15 La última cita sigue inmediatamente al texto traducido en la nota 14. Justifica el uso
común en la escuela de Hilbert del epíteto ‘intuicionista’ para calificar los métodos de
razonamiento “sustantivo” admitidos por ella. Herbrand (1931; EL, p. 225, n. 3) define
dicho epíteto con admirable claridad:
Entendemos por razonamiento intuicionista un razonamiento que satisfaga las si-
guientes condiciones: en él se considera sólo un número finito determinado de
objetos y de funciones; éstas están bien definidas, de modo que su definición
permita calcular unívocamente su valor; nunca se afirma la existencia de un obje-
to sin dar el medio de construirlo; nunca se considera el conjunto de todos los
objetos x de una colección infinita; y cuando se dice que un razonamiento (o un
teorema) es verdadero para todo x, esto significa que para cada x tomado particu-
larmente se puede repetir el razonamiento general en cuestión, el cual no debe
considerarse sino como el prototipo de estos razonamientos particulares.
(Herbrand, EL, p. 225 n.3)
2.1 El programa de Hilbert 126

3. Determinar un procedimiento que permita construir sucesivamente todas


las fórmulas que corresponden a oraciones “demostrables” de la matemática
clásica. Tales construcciones se llaman “pruebas”.

Como estas tres tareas ya fueron ejecutadas casi a cabalidad por Whitehead
y Russell antes de que Hilbert siquiera concibiese su programa, sólo queda
por resolver una cuarta y última tarea, que von Neumann describe aproxi-
madamente en estos términos:

4. Mostrar “de un modo combinatorio finitista” que las fórmulas corres-


pondientes a oraciones de la matemática clásica que pueden verificarse por
métodos aritméticos finitistas pueden “probarse” —esto es, construirse me-
diante el procedimiento mencionado en el punto 3— sí y sólo si la verifica-
ción de la oración correspondiente muestra que ésta es verdadera.

Con el cumplimiento de esta tarea quedará establecida la consistencia de la


matemática formalizada (puesto que si fuese inconsistente se podría “pro-
bar” en ella la fórmula representativa de una igualdad numérica falsa). Pero
se establecerá además que la fórmula representativa de cualquier verdad arit-
mética elemental puede “probarse” en la matemática formalizada. En otras
palabras, el programa de Hilbert, según lo explica von Neumann en 1930,
proponía demostrar, no sólo que la matemática formalizada es consistente,
sino además que constituye una representación formal completa de la arit-
mética elemental.16 Esta doble demostración tiene que llevarse a cabo ente-

16 Hilbert (1930, p. 6) menciona “la completud (Vollständigkeit) del sistema de axiomas


de la aritmética (Zahlentheorie) así como del análisis” entre los “problemas de funda-
mentación de las matemáticas” aún pendientes. Aunque dicha completud “comúnmente
se admite, la consideración usual mediante la cual se muestra que cualquier par de rea-
lizaciones del sistema de axiomas de la aritmética (respectivamente, del análisis) tie-
nen que ser isomórficas, no satisface las exigencias del rigor finito”. Hilbert propone
dar en cambio —“por de pronto para la aritmética, cuyo campo se deja delimitar con
precisión”— un sustituto finitista de la prueba habitual de isomorfismo, demostrando

mética, no es posible probar la consistencia de ¬S (la contradictoria de S) con esos


que “si es posible probar la consistencia de una oración S con los axiomas de la arit-

axiomas”. Adviértase que el trabajo en que Hilbert propone este problema no fue in-
cluido en sus Gesammelte Abhandlungen (editados después de la publicación de los
teoremas de incompletud de Gödel).
2.1 El programa de Hilbert 127

ramente con los recursos del análisis combinatorio finito. Por una curiosa
coincidencia, Gödel anunció en la misma reunión de Königsberg sus céle-
bres teoremas de incompletud (Gödel 1930a, 1931). Los estudiaremos en el
Capítulo 2.10. Por ahora, baste indicar, grosso modo, que en virtud de ellos,
si T es una formalización de la aritmética elemental ajustada a las condicio-
nes 1, 2 y 3 no es posible que T sea a la vez consistente y completa. Ade-
más, aunque en dicha formalización T habrá más de una fórmula apta para
representar la oración ‘T es consistente’, ninguna de ellas se puede “probar”
en T a menos que T sea inconsistente. Como los razonamientos del análisis
combinatorio finito ciertamente se dejarían representar mediante “pruebas”
en una tal formalización de la aritmética, sería imposible ejecutar la tarea
cuarta y final del programa de Hilbert “de modo combinatorio finitista”. Pero
Hilbert nunca había explicado con tanta precisión como von Neumann el
significado de su “postura finita” y gracias a eso pudo eventualmente “am-
pliar el marco metódico” de su programa a la luz de los hallazgos de Gödel,
sin admitir su fracaso.17

17 Véase la Sección 2.9.4. También el Capitulo 2.12, primer párrafo y nota 1, donde me
refiero a Hilbert y Bernays 1939, § 5, “Der Anlaß zur Erweiterung des methodischen
Rahmens der Beweistheorie” (“El motivo para ampliar el marco metódico de la Teoría
de la Prueba”). El tomo I de la misma obra contiene la siguiente explicación, elocuente
pero no muy precisa, sobre el significado del adjetivo ‘finit’ (que generalmente traduz-
co ‘finitista’):
Con la palabra “finit” queremos siempre expresar que la reflexión, aseveración o
definición así calificada se ciñe a los límites de la representabilidad de objetos y
de la ejecutabilidad de procesos y por lo tanto se realiza en el marco de una con-
sideración concreta.
(Hilbert y Bernays 1934, p. 32)

Donde escribo ‘representabilidad’ y ‘ejecutabilidad’, los autores dicen “grundsätzliche


Vorstellbarkeit” (“representabilidad en principio”) y “grundsätzliche Ausführbarkeit”
(“ejecutabilidad en principio”), pero me ha parecido inútil agregar una indicación que
lastra la frase y que cualquier lector de inteligencia mediterránea sobreentiende.
2.2 ESCRITURA CONCEPTUAL

Leibniz soñó con “una lengua o escritura universal” en que “los caracteres y
las palabras dirigirían la razón y los errores que no fuesen errores de hecho
no serían sino errores de cálculo” (GP, III, 605). En dicho lenguaje artificial,
toda falacia del razonamiento estaría vedada por la sintaxis, de modo que

un sofisma, expresado en tal nueva forma de escritura, no sería en verdad


más que un solecismo o barbarismo, fácil de refutar aduciendo las leyes
de esa gramática filosófica. Así, cuando surgieran desacuerdos entre dos
filósofos, no haría falta más discusión que entre un par de calculistas.
Bastaría que, pluma en mano, —en presencia, si se quiere, de un ami-
go— se sentasen a sus ábacos, diciéndose mutuamente: calculemos.
(Leibniz, GP, VII, 200)1

Para lograr este resultado, Leibniz propuso extender a la lógica los méto-
dos algebraicos utilizados con tanto éxito en aritmética y geometría. Entre
sus papeles quedaron —inéditos hasta el siglo XIX— algunos ensayos rudi-
mentarios de lógica algebraica. Pero la idea de un álgebra de la lógica sólo
toma vuelo con los libros de Boole (1847, 1854).2 La tradición booleana,
cultivada en Inglaterra por Jevons y en América por Peirce, fue recogida y
promovida en Alemania por Ernst Schröder (1877, VAL: 1890–1905). Para
el filósofo norteamericano C. I. Lewis —que publica un Panorama de la
lógica simbólica en 1918— “el álgebra clásica de la lógica” lleva los apelli-
dos de Boole y Schröder. En cambio, Hilbert, que sin duda los conocía, no
suele nombrarlos entre los precursores de su programa, cuya iniciación atri-

1 Véase asímismo Leibniz, GP, VII, 204–207 (traducción castellana en Leibniz, EF, pp.
188–193).
2 Los aportes más interesantes de Leibniz son quizás los dos “especímenes” en GP, VII,
228–247 (traducción inglesa en Leibniz, LP, pp. 122–144). En el siglo XVIII hubo
algunos intentos aislados por desarrollar un cálculo lógico; al respecto, véase C. I. Lewis
1918, pp. 18–51, quien destaca sobre todo la obra de J. H. Lambert.

129
2.2 Escritura conceptual 130

buye, como hemos visto, a Gottlob Frege —a quien Lewis dedica menos de
una página de su Panorama (1918, pp. 114s.)— y a sus continuadores Russell
y Whitehead.
Varias razones justifican, a mi modo de ver, esta preferencia de Hilbert
por Frege. En primer lugar, Frege creó su propia lengua artificial (Escritura
conceptual, 1879) con el propósito específico de expresar en ella razonamien-
tos matemáticos y utilizarla en la fundamentación estrictamente lógica de la
aritmética. En cierto modo, pues, el proyecto de Frege anticipa directamente
el programa de Hilbert. Además —como reconoce el propio Lewis— Frege
entendió antes que nadie los requisitos que ha de cumplir la representación
escrita de un razonamiento deductivo para que la corrección o incorrección
del mismo pueda controlarse mediante un cálculo. Pero, sobre todo, debe-
mos a Frege el análisis moderno de los predicados relacionales y la genera-
lización universal, que hizo posible entender muchas demonstraciones mate-
máticas como casos de simple inferencia lógica.3
Frege abraza sin reservas la clasificación kantiana de las verdades en
analíticas y sintéticas. Mejorando a Kant, caracteriza ambas clases de modo
que constituyan una genuina partición: verdades analíticas son las que se de-
ducen de leyes lógicas y meras definiciones; cualquier verdad que no es ana-
lítica es sintética.4 La meta de sus investigaciones lógico-matemáticas es de-
mostrar que las verdades de la aritmética y del análisis son, en este sentido,

3 Conviene, sí, recordar que también Peirce (1870, 1880, 1882, 1883) desarrolló por esos
mismos años —independientemente de Frege— la lógica moderna de la generalización
y de los predicados poliádicos. Por otra parte, como ha mostrado Goldfarb (1979), la
generalización vino a entenderse cabalmente como la entendemos ahora sólo después
de 1920, precisamente en la escuela de Hilbert.
4 Para Kant una aseveración es analítica si el predicado está contenido en el concepto
del sujeto y es sintética si el predicado no está contenido en el concepto del sujeto. Las
aseveraciones disyuntivas y condicionales, que no se dejan analizar en sujeto y predi-
cado, no caen, pues, en ninguna de estas dos clases, según Kant. Frege tuvo que pro-
poner una caracterización diferente porque en un comienzo rechazó el análisis tradicio-
nal de las aseveraciones en sujeto y predicado (Frege 1879, p. 3). Su caracterización
aventaja también a la kantiana en cuanto permite clasificar sin dificultada como analí-

Capitulo 2.1, decimos que una aseveración α se deduce de un conjunto de asevera-


ticas a las aseveraciones que expresan leyes lógicas. En efecto, como indiqué en el

ciones S si α ocupa el último lugar en una lista de aseveraciones cada una de las cuales

Por lo tanto, si S es un conjunto de aseveraciones que expresan leyes lógicas y α es


pertenece a S o se infiere directamente de una o más de sus predecesoras en la lista.
2.2 Escritura conceptual 131

analíticas. Para presentar la demostración de tal modo que no dejase lugar a


dudas, Frege inventó su “Begriffschrift” (“escritura conceptual”), un lengua-
je artificial especialmente diseñado para la formulación perspicua de infe-
rencias deductivas, que designaré aquí con la sigla BS. BS es una versión de
lo que hoy llamamos un cálculo predicativo. Frege admite la posibilidad de
hacer generalizaciones referentes a propiedades y relaciones, pero no la re-
glamenta expresamente. Si BS* es lo que resta de BS cuando se elimina esta
posibilidad y sólo se permiten generalizaciones referentes a objetos indivi-
duales, tenemos que BS* equivale a nuestro cálculo predicativo de primer
orden.5
Aunque Frege maneja el lenguaje BS con impecable coherencia, sus expli-
caciones gramaticales no siempre alcanzan la claridad y precisión a que nos
han habituado sus seguidores, los modernos tratadistas de lógica. No llega a
dar un inventario formal de las letras que pueden usarse como variables y
constantes de BS, ni una codificación exhaustiva del modo de utilizarlas.6
Además, en su presentación original, la elucidación de las nociones decisi-
vas de ‘contenido’ y de ‘función’ deja mucho que desear. Frege corrige este
defecto en la presentación final de BS en el tomo I de Leyes fundamentales
de la aritmética (1893), aprovechando las grandes innovaciones ontológicas
y semánticas introducidas en “Función y concepto” (1891), “Sobre sentido
y denotación” (1892) y “Sobre concepto y objeto” (1892a). No puedo entrar

una de ellas, diremos que α se deduce de S, por cuanto α ocupa ciertamente el último
lugar de la lista cuyo único miembro es α y, por hipótesis, α ∈ S.
5 Antes de leer el resto de este capítulo —y los siguientes— el lector que no haya estu-
diado algo de lógica moderna debiera darle una ojeada al Apéndice IX sobre el cálculo
predicativo. Como la exposición es bastante concisa, no creo que le aproveche a quien
no tenga ya cierta práctica en la lectura de obras matemáticas. El lector que no la ten-
ga debe leer uno o dos manuales de lógica. Recomiendo a Jeffrey 1981 y Mates 1970,
cuyas virtudes se complementan.
6 Ello genera sorpresas. Así, a la luz de los ejemplos de Frege 1879, p. 51, y de una
lectura desaprensiva de los §§ 9–12, el lector pensará ingenuamente que, en la expre-
siones f(b), g(b), h(b) de la Proposición 60 (p. 52), la letra b es una constante o varia-
ble individual, y las letras f, g y h son predicados. Pero en la p. 69 se nos manda

de la forma f(Γ) por expresiones de la forma Γ(y), de modo que f(b) ha de reemplazar-
sustituir, en la Proposición 60, la letra b por la variable predicativa ᑠ y las expresiones

se con ᑠ(y).
2.2 Escritura conceptual 132

aquí a comentar esas innovaciones,7 aunque daré al respecto una indicación


somera que ayude a entender la gramática de BS.
Los signos de BS son de dos clases: letras, “con las que uno puede
representarse una variedad de cosas”, y figuras lineales “que tienen un sen-
tido completamente determinado”. Las letras, de varios tipos, “deben servir
principalemente para expresar la generalidad” (1879, p. 1).8 Como dije, Frege
no explica metódicamente cómo se usan los distintos tipos de letras. Sólo el
empleo de las letras góticas ᑾ, ᑠ,… está cuidadosamente reglamentado:
una letra gótica sólo puede figurar en una expresión si va precedida de un
cuantificador que la contiene; en otras palabras, en BS una letra gótica es
siempre una variable ligada (individual, si es minúscula; predicativa, si es

Α, Β, Γ,… funcionan como constantes, que algunas veces significan una


mayúscula). Entiendo, en cambio, que las mayúsculas del alfabeto griego,

oración completa (así, la Α y la Β en Frege 1879, p. 22), otras veces un


predicado determinado (vgr. la Φ en esa página).9 Las minúsculas del alfa-
beto griego, α, β, γ,… se usan en Escritura conceptual como índices —
esto es, variables ligadas— en ciertas expresiones simbólicas definidas (1879,
§§ 24, 26) que se dejan eliminar; también figuran en las indicaciones margi-
nales sobre sustitución de expresiones, pero en este uso no pertenecen a BS,
sino a la lengua viva —el alemán— en que se dan esas indicaciones: son
pues lo que hoy llamamos ‘variables metalingüísticas’. En Leyes fundamen-
tales de la aritmética las minúsculas griegas tienen también otros usos que
no es preciso detallar aquí. Por último, las cursivas latinas minúsculas se
emplean como variables libres: a, b, c, m y x funcionan a veces como varia-
bles proposicionales (Proposiciones 1–51), a veces como variables in-
dividuales (Proposiciones 52–62, 64–65), a veces como ambas cosas (Pro-
posiciones 63, 67 y 68); en cambio, f, g, h y la mayúscula F son variables

7 Los tres artículos mencionados están bien traducidos al castellano en Frege, LS.
8 Frege dice que esta clasificación de los signos y sus funciones se inspira en el ejemplo

como +, × , √ con un significado fijo. Pero los matemáticos, según él, no son entera-
de la matemática que usa letras a, b, x, y,… con significado variable e ideogramas

mente consecuentes, puesto que usan combinaciones de letras, como log, sen, Lim, como
ideogramas (1879, p. 1 n.).
9 Frege 1879, p. 2n., dice que las mayúsculas griegas son “abreviaturas” a las que el
lector ha de asignar cualquier sentido apropiado, cuando no estén expresamente defini-
das por el autor.
2.2 Escritura conceptual 133

predicativas (monádicas o diádicas).


Las figuras lineales en BS se componen de los signos siguientes: ¡ , @ ,
# ,$ , 0 y =. Como luego veremos, = (en 1879, ∫) es el signo de
^
identidad; 0 es el signo de cuantificación universal (la variable ligada anida
en la cucharita), y #y$ corresponden respectivamente a nuestros signos
^
de negación (¬) e implicación (→). Pero los signos ¡ y @ no tienen su
homólogo en el cálculo predicativo actual. Frege los explica así:

Una aseveración (Urtheil) se expresará siempre mediante el signo



situado a la izquierda del signo o combinación de signos que indica el
contenido de la aseveración. Al omitir el breve trazo vertical en el ex-
tremo izquierdo del horizontal, la aseveración se convierte en una mera
combinación de representaciones (blosse Vorstellungsverbindung), de la
cual el escribiente no expresa si le atribuye verdad o no. Por ejemplo, si
⁄Α
significa la aseveración “los polos magnéticos de distinto nombre se
atraen”, entonces

no expresa la aseveración, sino debe evocar en el lector únicamente la
representación de la atracción mutua de los polos magnéticos de distinto
nombre, tal vez para derivar de ella consecuencias y examinar a la luz de
éstas si el pensamiento (Gedanke) es correcto. En este caso, parafraseamos
la expresión con las palabras “la circunstancia de que” o “la proposición:”
(„der Satz, daß“). […] El trazo horizontal con que se forma el signo
⁄ reúne los signos siguientes en un todo, y a este todo se refiere la
afirmación expresada por el trazo vertical en el extremo izquierdo del
horizontal.
(Frege 1879, pp. 1–2)10

10 Nótese que Frege identifica aquí la representación evocada por los signos —que puede
variar mucho de lector en lector— con el pensamiento expresado mediante ellos —que
ha ser el mismo para todos si la escritura sirve como medio de comunicación—; más
tarde distinguirá enfáticamente estas dos cosas. Más grave me parece la confusión si-
2.2 Escritura conceptual 134

Frege recuerda enseguida que no todo contenido expresable verbalmente


puede ser materia de una aseveración. Puedo aseverar: ‘la casa de Juan es
de madera’; pero no puedo aseverar: ‘casa’. Cabe, pues, distinguir entre con-
tenidos aseverables y no aseverables (“beurtheilbare und unbeurtheilbare
Inhalte”). Llamemos simple a una aseveración cuyo contenido aseverable no
incluye partes (distintas de él) que a su vez son contenidos aseverables. La
lógica tradicional analizaba el contenido aseverable de cualquier aseveración
simple en dos componentes no aseverables: sujeto y predicado. Frege recha-
za este análisis (1879, p. 2). Hace ver, en cambio, que un mismo contenido,
aseverable o no, puede analizarse de diversas maneras, fijando una parte de
la expresión que lo enuncia y tratando el resto como variable. Así, en la
expresión ‘Juan admira a Juanita’, si fijo ‘admira a Juanita’ y reemplazo ‘Juan’
por ‘Pedro’, ‘Diego’, etc. efectúo un análisis similar al tradicional; si fijo
‘Juan admira a’ y reemplazo ‘Juanita’ por ‘Isabel’, ‘Beatriz’, etc., llego a un
análisis correspondiente al tradicional de ‘Juanita es admirada por Juan’, que

‘admira a’ y reemplazo el par 〈‘Juan’, ‘Juanita’〉 por 〈‘Pedro’, ‘Isabel’〉,


es el mismo contenido aseverable, expresado en voz pasiva; pero si sólo fijo

〈‘Diego’, ‘Beatriz’〉, 〈‘Diego’, ‘Juanita’〉, etc., o si fijo 〈‘Juan’, ‘Juanita’〉 y


reemplazo ‘admira a’ por ‘saluda a’, ‘sonríe a’, ‘detesta a’, etc. obtengo
descomposiciones del contenido aseverable que no tienen precedente en la
lógica tradicional. Los contenidos no aseverables admiten el mismo trata-
miento: por ejemplo, en la frase ‘la casa de Juan’, puedo fijar ‘la casa’ y
reemplazar ‘de Juan’ por ‘de Diego’, ‘de Pedro’, etc. o fijar ‘de Juan’ y re-

tratar el par 〈‘la casa’, ‘Juan’〉 como variable.11 En Escritura conceptual, Frege
emplazar ‘la casa’ por ‘la mujer’, ‘la profesión’, ‘el país’, etc., o fijar ‘de’ y

guiente: Frege sugiere que uno puede derivar consecuencias de un pensamiento no


aseverado (y examinar la corrección de éste a la luz de aquéllas), pero según las reglas
de inferencia de BS, las premisas de una deducción tienen que ser aseveraciones (esto
es, expresiones de la forma !A, nunca de la forma @A).
11 La simetría que Frege evidentemente postula entre estos diversos modos de análisis
hace comprensibles las sustituciones descritas en la nota 6. La libertad con que Frege
está dispuesto a ver en una expresión como ‘León ríe’, tanto una expresión del valor
de la función ríe para el argumento León (reemplazable por Pedro, Juan, Diego, etc.)
como una expresión del valor de la función León para el argumento ríe (reemplazable
por ‘llora’, ‘ruge’, ‘muerde’, etc.) es familiar en matemáticas. He aquí un caso análo-
2.2 Escritura conceptual 135

—inspirándose en la terminología matemática— llama función al componente


fijo, argumento al componente reputado variable de una expresión represen-
tativa de un dado contenido, aseverable o no.12 Pero en Leyes fundamentales
de la aritmética rechaza sin más el error de quienes consideran a la función
“como una expresión, una combinación de signos, y no como lo designado
por ellos” (1893, p. 5).
Hacia 1891 Frege llegó a la conclusión de que en el significado de las
expresiones lingüísticas hay que distinguir dos aspectos complementarios pero
bien diferentes: su sentido (Sinn) y lo que llamaré su denotación (Frege lo
llama Bedeutung; literalmente, ‘significado’).13 Las expresiones ‘72’, ‘100 –
51’ y ‘(11 × 2) + (9 × 3)’ denotan lo mismo, a saber, el número 49, pero no
lo presentan del mismo modo, así que no tienen el mismo sentido. Una igual-
dad, como 135 = 371.293, sería falsa si el miembro de la izquierda no deno-
tase el mismo objeto que el miembro de la derecha, pero sería banal si ambos
miembros tuviesen el mismo sentido, como en 135 = 135. Por ese mismo
tiempo, Frege (1891, 1892a) revisa a fondo su distingo entre función y argu-
mento. Observa que hay dos clases de expresiones: expresiones “saturadas”
(gesättigt), cuyo sentido está completo o “cerrado” (abgeschlossen), y ex-

go, tomado del álgebra lineal: Si V es un espacio vectorial sobre el cuerpo Â, las apli-
caciones lineales de V en  forman otro espacio vectorial V* sobre Â. Las aplicacio-

siguiente: para cada r ∈ V, r: V* Æ Â es la aplicación (demostrablemente lineal) que


nes lineales de V* en  se identifican con los vectores de V mediante la estipulación

en cada ξ ∈ V* toma precisamente el valor que ξ: V Æ Â toma en r. Se acostumbra


designar dicho valor con 〈ξ|r〉, una expresión que puede leerse de dos maneras, a saber
(i) ‘el valor ξ(r) de la función lineal ξ: V Æ Â en el argumento r ∈ V’ y (ii) ‘el valor
r(ξ) de la función lineal r: V* Æ Â en el argumento ξ ∈ V*’.
12 Cito la definición pertinente:
Si en una expresión (Ausdruck) —cuyo contenido no tiene que ser aseverable—
figura en una o más posiciones un signo (Zeichen) simple o compuesto y pensa-
mos que este signo es reemplazable en algunas de esas posiciones o en todas ellas
por otra cosa (durch Anderes), pero que sea la misma en cada caso, llamamos
función a la parte de la expresión que se presenta en este respecto como invaria-
ble y a la parte reemplazable la llamamos su argumento.
(Frege 1879, p. 18; énfasis mío; el pasaje entero va en cursiva en el original)
13 El distingo entre Sinn y Bedeutung es el tema de Frege 1892, pero ya aparece mencio-
nado en Frege 1891, p. 14.
2.2 Escritura conceptual 136

presiones “insaturadas” (ungesättigt), que entendemos como provistas de uno


o más blancos a llenar con expresiones saturadas. En los ejemplos del párra-
fo anterior, ‘Juan’, ‘la casa de Juan’, ‘Juan admira a Juanita’ son expresio-
nes saturadas; en cambio, ‘la casa de …’, ‘… de …’, ‘… admira a Juanita’,
‘Juan admira a …’, ‘… admira a …’ son expresiones insaturadas (en las que
ahora he marcado blancos donde antes los subentendíamos). Según Frege, la
diferencia entre expresiones saturadas e insaturadas refleja la división de lo
real en dos categorías irreductibles: objetos (Gegenstände) y funciones
(Funktionen). Aquéllos son, en cierto modo, completos y se los denota con
expresiones saturadas; éstas son incompletas y se las designa mediante ex-
presiones insaturadas. Por ejemplo, ‘3’ y ‘7’ denotan objetos; ‘… + …’ de-

valor de la función …+… en el par de argumentos 〈3,7〉; el mismo objeto es


signa una función. La expresión saturada ‘3 + 7’ denota el objeto que es el

denotado también por la expresión saturada ‘10’.


A la luz de estas ideas nuevas, es claro que lo que Frege llamaba en 1879
“contenido aseverable” reúne —y confunde— el sentido y la denotación de
la expresión utilizada para hacer una aseveración (1893, p. 9 n. 2). Toda
expresión utilizable para ello, es decir, toda oración declarativa, es por cier-
to una expresión saturada. Su sentido es lo que Frege llama un pensamiento
(Gedanke); su denotación, uno de los dos objetos que llama valores veritativos
(Wahrheitswerte): lo verdadero (das Wahre) o lo falso. Una oración declarativa
simple —no formada por combinación o transformación de otras oraciones
declarativas— constará en todo caso de una o más expresiones saturadas que
denotan objetos, insertadas en los huecos de una expresión insaturada que
denota un concepto. Un concepto es pues una función que admite como ar-
gumento cualquier n-tuplo de objetos (para un entero positivo fijo n, carac-
terístico de ese concepto), pero cuyo valor para un dado argumento sólo puede
ser uno de los dos valores veritativos, a saber, lo verdadero, si el n-tuplo en
cuestión cae bajo el concepto, y lo falso, si dicho n-tuplo no cae bajo el
concepto.
El distingo entre objetos “llenos” y funciones “huecas” evoca la clásica
división de lo real en particulares y universales, combinada con la tesis
occamista de que sólo los particulares existen plenamente, mientras que los
universales sólo pueden actualizarse en aquellos. El distingo entre dos clases
de expresiones correspondientes a las dos categorías de entes da nueva vida
al análisis de las oraciones en sujeto y predicado, rechazado por Frege en
2.2 Escritura conceptual 137

1879. Pero este análisis rebasa ahora los estrechos límites a que lo confina-
ba la tradición. Según ella, cada aseveración simple se refería a un solo objeto,
el sujeto, denotado por una expresión saturada, y le atribuía una propiedad,
designada con una expresión insaturada, el predicado. En cambio, como Frege
entiende que las expresiones insaturadas denotan funciones —en una acep-
ción del vocablo inspirada en la terminología matemática—, puede con toda
naturalidad admitir que una aseveración simple se refiera a un n-tuplo de
objetos (n = 1, 2,…) y les atribuya una relación (si n > 1). Por otra parte,
a la luz del análisis fregeano, es claro que un predicado (expresión insaturada)
no puede hacer las veces de sujeto (expresión saturada). Así, si ‘Hp’ signifi-
ca ‘Píndaro es hombre’ y ‘Gp’ significa ‘Píndaro es griego’, no es lícito poner
en la primera oración ‘G’ en el lugar de ‘p’ para significar (i) ‘Todo griego
es hombre’ o (ii) ‘Algún griego es hombre’. En estas oraciones del lenguaje
corriente, el sujeto gramatical —‘todo griego’, ‘algún griego’— no denota
un objeto al cual se atribuye el predicado sino que circunscribe la clase a
que ese objeto pertenece (mediante un predicado común a todos los miem-
bros de esa clase). Así, según Frege, lo que dicen las oraciones citadas que-
da mejor expresado por (i) ‘Si algo es griego, también es hombre’ y (ii) ‘Hay

lo predicativo: (i) ∀x(Gx → Hx); (ii) ∃x(Gx ∧ Hx)). Gracias a estas innova-
algo que es griego y también hombre’ (en el simbolismo estándar del cálcu-

ciones, Frege pudo poner de manifiesto, como dije, la índole puramente ló-
gica de muchas demostraciones matemáticas.14
Ahora puedo dar con Frege una definición más clara y satisfactoria de la
línea @ y de los cuatro signos de BS que arriba dejamos sin definir (cf.
Frege 1893, pp. 9–12). Usaré la letra negrita v para nombrar lo verdadero y
la f para nombrar lo falso. La línea @ designa la función cuyo valor es v en
el argumento v y cuyo valor es f en cualquier otro argumento.15 El signo #

con ‘R2rd ∧ r > 0’), “Cuatro es el cuadrado de dos” (‘Qcd’) y “Toda raíz cuadrada de
14 Por ejemplo, de las premisas “√2 es la raíz cuadrada positiva de dos” (que representaré

un número es una raíz cuarta del cuadrado de ese número” (‘∀x∀y(Qyx → ∀z(R2zx →
R4zy))’) se deduce fácilmente que “√2 es una raíz cuarta de cuatro” (‘R4rc’), una con-
clusión obvia que sin embargo es inaccesible a la lógica aristotélica.
Así pues, la función @, restringida a valores veritativos, es precisamente la aplicación
x Å x (@‚Γ = v si Γ = v y @‚Γ = f si Γ = f), lo cual explica que no haya una signo
15

para ella en el simbolismo lógico actual: normalmente sería superfluo. Pero Frege no
deslinda explícitamente el dominio de sus funciones, a las que trata como si cada una
2.2 Escritura conceptual 138

designa la función cuyo valor es f en cada argumento x tal que @‚x es v y


cuyo valor es v en cada argumento x tal que @‚x es f (nuestro signo de
negación ¬ se inspira probablemente en este signo fregeano).16 La expresión
‘™u™ºf(ᒒ)’ denota v si y sólo si la función f( ) toma el valor v en todo argu-

v en el argumento fijo Α. Vemos así que, como arriba adelanté, el signo 0


mento. La expresión ‘™F™ºᑠ(Α)’ denota v si y sólo toda función toma el valor

∀, y liga la variable individual o predicativa inscrita en él. La expresión ‘a


funciona como signo de cuantificación universal, correspondiente a nuestro

= b’ denota v si ‘a’ y ‘b’ denotan el mismo objeto y denota f si ‘a’ y ‘b’ no


denotan el mismo objeto. Así, si ‘a’ y ‘b’ son términos, ‘a = b’ dice que a
es idéntico a b y si ‘a’ y ‘b’ son aseveraciones, ‘a = b’ dice que a si y sólo
$A
si b. Por último, el signo $ designa la función binaria definida así: (i) ^ B
^
es f si y sólo si B es v y A es un objeto distinto de v; (ii) si A es v o si B

no es v, $ A es v (Frege 1891, p. 28; 1893, p. 20).17


^B

de ellas estuviera definida en todo el universo de objetos. Esto es una ilusión, pues si
W designa el universo de objetos, una función irrestricta binaria (una “función de dos
variables”) no está definida en W sino en W2, una función ternaria en W3, etc.
16 Esta función, como todas las de Frege, está definida para cada objeto (nota 15). Según
esto, #x es v aunque ‘x’ no denote un valor veritativo.
17 Frege 1879, p. 5, dice que “si Α y Β significan contenidos aseverables, hay las cuatro
posibilidades siguientes: (1) se afirma Α y se afirma Β; (2) se afirma Α y se niega Β;
(3) se niega Α y se afirma Β; (4) se niega Α y se niega Β. ¡$ Α significa entonces la

aseveración de que la tercera de estas posibilidades no se cumple, sino una de las
otras tres.” A la luz de esta caracterización, Baker y Hacker (1984), concluyen que en
1879 Frege no había dado aún con la definición verifuncional de la implicación, des-
cubierta por Filón de Megara en el siglo III a.C. El texto citado respalda este diag-
nóstico sólo si se toma al pie de la letra, esto es, si se entiende que ¡$ Α es una

aseveración biográfica relativa a lo que alguna persona indeterminada de hecho aseve-

10–11 del mismo libro trata como equivalentes las expresiones ‘se afirma Β’ (‘Β wird
ra o no asevera. Pero no creo que fuera la intención de Frege entenderlo así. En las pp.

bejaht’) y ‘Β ha de afirmarse’ (‘Β zu bejahen…ist’), y creo que ya en 1879 Frege


pensaba que un contenido aseverable ha de afirmarse si y sólo si es verdadero.
2.2 Escritura conceptual 139

La última definición indica sin lugar a dudas que $ A representa la


^B
implicación material que hoy representamos con (Α → Β). Frege advierte
oportunamente al lector que $ A corresponde a ‘si Β, entonces Α’ (“wenn
^B
Α, so Β”) sólo parcialmente, en algunos casos.18 Hay, en cambio, funciones
compuestas de # y $ que corresponden a ciertas conjunciones familiares.
^
Así, 3$3 corresponde exactamente a la conjunción ‘y’, pues, como el lec-
^
tor puede fácilmente calcular, 3$3 A denota v si @Α y @Β denotan v, y
^2 B
de otro modo denota f. Y 2$2 corresponde a la conjunción ‘o’ entendida
^3
en un sentido no excluyente, puesto que 2$2 A denota f si @Α y @Β
^3 B
denotan f, y de otro modo denota v. En otras palabras, 3$3 es la función
^
que simbolizamos ‘∧’ y 2$2 es la función que simbolizamos ‘∨’. Aprove-
^3
chando la correspondencia entre la función ∧ y la conjunción ‘y’, los profe-

luego definen → como una función compuesta de ∧ y ¬. Frege no obró así


sores de lógica suelen introducir primero esa función en sus explicaciones y

diano, le interesaba escribir deducciones de manera perspicua y → se presta


porque, mucho más que traducir la escritura conceptual BS al lenguaje coti-

muchísimo mejor que ∧ para este propósito.


En efecto, con los signos de BS y las convenciones semánticas de Frege,
la regla modus ponens (MP) puede enunciarse así: De las premisas / A y
^B
⁄ Β, deducir la conclusión ! Α. O, más gráficamente:

18

(Α → Β) se lee ‘si Α, entonces Β’ y tienen luego que enfrentar la mirada escéptica de sus
Su buen sentido contrasta con la irreflexión de esos profesores de lógica que enseñan que

alumnos cuando, a resultas de ello, se ven forzados a sostener que un enunciado como ‘si
la luna está hecha de queso, entonces 2 + 2 = 4’ expresa una verdad necesaria.
2.2 Escritura conceptual 140

/A
^B
!B
!A

quiera que sean las oraciones declarativas Α y Β, puesto que, si la segunda


Presentada así, no cabe la menor duda de que la deducción es correcta, cuales-

premisa es verdadera, la primera premisa sólo puede ser verdadera si la con-


clusión también lo es. Para controlar la corrección de una inferencia en que
se usa esta regla basta comprobar por simple inspección visual que la expre-
sión a la derecha del signo ! en la conclusión es igual a la expresión a la
derecha de la línea horizontal superior del signo / en la primera premisa
^
y que la expresión a la derecha de la línea horizontal inferior de este último
signo es igual a la expresión a la derecha del signo ! en la segunda premi-
sa.
En el § 11 de Escritura conceptual Frege enuncia la regla de inferencia
que hoy suele llamarse generalización universal (GU): Deducir de la premi-
/ Φ(a) la conclusión /a™ Φ(ᑾ) siempre que Α sea una expresión en la
sa
^A ^@™ A
cual no figura a y que a sólo figure en Φ(a) en las posiciones que ocupa ᑾ
en Φ(ᑾ). Frege justifica esta regla así: “Si ™™a2 Φ(ᑾ) es negado se tiene que
poder asignar a a un significado tal que Φ(a) sea negado. Por lo tanto, si
2a2 Φ(ᑾ) fuera negado y Α fuera afirmado, se tendría que poder asignar a
a un significado tal que Α fuese afirmado y Φ(a) fuese negado. Pero ello es
imposible en virtud de / Φ(a), ya que esto significa que está excluido el
^A
caso en que Φ(a) es negado y Α es afirmado. Por lo tanto, no es posible
negar ™™a2 Φ(ᑾ) y afirmar Α; esto es: /a™ Φ(ᑾ) ” (Frege 1879, pp. 21s.)
^@™ A
Sin embargo, en las deducciones de ese libro, Frege no utiliza —por lo
que veo— esta regla GU, sino únicamente la regla MP y una regla de sus-
titución, cuyos requisitos no llega a formular expresamente. Conforme a esta
2.2 Escritura conceptual 141

última, de una dada aseveración A se infiere la aseveración A′ obtenida al


sustituir uniformemente una determinada expresión B que figura una o más
veces en A por otra expresión C. (Digo que C sustituye uniformemente a B
en A si se escribe C en lugar de B en todas las posiciones que B ocupa en
A). Evidentemente, la aplicación de este procedimiento se puede controlar
por simple inspección visual. Su justificación es también muy obvia cuando
se manda reemplazar —como en las primeras deducciones del libro (Frege
1879, §§ 15–19)— una cursiva minúscula utilizada como variable proposi-
cional en cierta aseveración A por una oración (esto es, una expresión apta
para denotar cualquiera de los valores veritativos v y f): bajo las reglas
semánticas de BS, tal sustitución no puede afectar el valor veritativo deno-
tado por A. Pero no todas las sustituciones prescritas en esa obra siguen este
sencillo patrón.19 En 1893, Frege describe y justifica en detalle los pro-
cedimientos de sustitución admisibles y enuncia además otras reglas que
validan pasos que en 1879 presentaba como sustituciones. El “Resumen de
reglas” en Frege 1893, § 48, enumera doce (más seis “estipulaciones sobre
el uso de paréntesis”). La regla MP es sólo una de ellas. No puedo examinar
aquí las otras. Baste señalar que —como vimos en el caso de MP— aunque
la justificación de cada regla es semántica, su aplicación y el control de su
aplicación depende exclusivamente de la apariencia visual de las expresio-
nes envueltas, y no de su significado. Esto es esencial para el propósito de
BS, que es poner de manifiesto, sin lugar a dudas, los nexos deductivos entre
las verdades aritméticas y las leyes lógicas suplementadas con definiciones.
Una expresión A del BS representa una ley lógica si denota la verdad en
todo caso, sea cual sea la denotación de sus partes. En la segunda parte de
Escritura conceptual, Frege enuncia nueve expresiones que cumplen este
requisito, según hace evidente mediante consideraciones semánticas.20 Estas
expresiones son las premisas indemostradas de que parten sus deducciones.
Constituyen, pues, una lista de axiomas para la lógica. Las reproduzco en el

19 En la nota 6 mencioné las sustituciones que Frege aventura para probar la Proposición
90. Hay otros ejemplos.
20 Por ejemplo, el axioma 1 excluye el caso en que p es f, q es v y p es v, el cual es
evidentemente imposible, puesto que p no puede ser v y f a la vez (Frege 1879, § 14).
Por cierto, esto no es una demostración del axioma; pero al aclarar lo que éste signi-
fica se pone de manifiesto que no es posible negarlo.
2.2 Escritura conceptual 142

Apéndice X. Con el simbolismo del cálculo predicativo se las puede formu-


lar como sigue:21

1. (p → (q → p))
2. ((p → (q → r)) → ((p → q) → (p → r)))
8. ((p → (q → r)) → (q → (p → r)))
28. ((p → q) → (¬q → ¬p))
31. (¬¬p → p)
41. (p → ¬¬p)
52. ((c = d) → (Φ(c) → Φ(d)))
54. (c = c)
58. (∀xΦ(x) → Φ(a))

La fuerza de estos axiomas depende, por cierto, de las reglas de inferencia


que se adopten. Si las letras p, q y r se tratan como variables proposicionales,
libremente sustituibles por oraciones, los Axiomas 1, 2, 8, 28, 31 y 41,
combinados con la regla MP, bastan para deducir todas las oraciones com-
puestas que denotan la verdad cualquiera que sea el valor veritativo de las
oraciones componentes (esto es, todas las tautologías, en el sentido del Apén-

tución de a por cualquier expresión τ que designe un objeto y de Φ( ) por


dice IX.C). Supongamos, además, que en el Axioma 58 se permite la susti-

cos” se llenen todos con τ. Entonces, como demostrará Gödel (1930), los
una expresión insaturada que se convierte en una oración en cuanto sus “blan-

Axiomas 1, 2, 8, 28, 31, 41 y 58, combinados con las reglas MP y GU bas-


tan para deducir todas las verdades lógicas expresables en un cálculo predi-

21 Doy a cada axioma el número que tiene en el libro de Frege (los números intermedios
corresponden a teoremas deducidos de los axiomas precedentes). La “traducción” ofre-
cida demanda algunos comentarios. Debemos recordar que en BS, el signo ‘=’ (‘≡’ en
1879) funciona como nuestro símbolo de identidad ‘=’ si las expresiones a la izquierda
y la derecha son variables individuales o nombres de objetos, y como nuestro símbolo
de equivalencia ‘↔’ si dichas expresiones son oraciones. Frege permite sustituir las
letras c y d que figuran en los Axiomas 52 y 54 tanto por nombres como por oracio-
nes. Por último, como señalé en la nota 6, en 1879 Frege se permite reemplazar la
variable ligada en el Axioma 58 no sólo por nombres, sino también por predicados.
2.2 Escritura conceptual 143

cativo de primer orden sin identidad (como el presentado en el Apéndice


IX.A, B). Para deducir todas las verdades lógicas expresables en el cálculo

y 54 —en el entendido de que Φ(d) en el 52 se obtiene por sustitución uni-


predicativo de primer orden con identidad hay que agregar los Axiomas 52

forme o parcial de c por d en Φ(c)— y autorizar la libre sustitución de las


letras c y d que figuran en ellos por expresiones que designen objetos. Pero,
como pondrá en claro el mismo Gödel (1930a, 1931), este sistema de axio-
mas y reglas de inferencia, suplementado con todas las definiciones que se
deseen, no es suficiente para deducir todas las verdades aritméticas. Distinto
es el caso si adoptamos MP y la loca regla de sustitución empleada por Frege
en 1879, o los axiomas y reglas de inferencia postulados por Frege en 1893.
Tales recursos sí que bastan para deducir las verdades aritméticas y —en
general— todo lo que uno quiera, pues, como Russell le informó a Frege el
16 de junio de 1902, el sistema es inconsistente.22

22 En una carta dirigida a Frege en esa fecha, Russell vincula directamente la paradoja
que hoy se conoce por su nombre a la liberalidad con que Frege admite y maneja las
variables predicativas en Escritura conceptual. Esa liberalidad se manifiesta
específicamente en la práctica fregeana —a que aludí en la nota 6— de sustituir por un
predicado la variable c que figura en la línea superior del Axioma 58, . Sea w el pre-
dicado “…es un predicado no predicable de sí mismo”. Russell se pregunta si w es
predicable de sí mismo. Como quiera que se conteste esta pregunta, se obtiene una
contradicción. Por lo tanto, concluye Russell, w no es un predicado. Pero la contradic-
ción es inevitable bajo las reglas (o prácticas) de Escritura conceptual. En efecto, en el

birse así: 1F™ ((@ºw(ᑠ)) ≡ (# ᑠ(ᑠ))). Si en el Axioma 58 sustituimos, a la ma-


BS de 1879, la condición con que Russell caracteriza el predicado w tendría que escri-

nera de Frege, f(Γ) por ((@‚w(Γ)) ≡ (#‚Γ(Γ))), ᑾ por ᑠ y c por w, y aplicamos MP


al par de premisas que forman el resultado de esta sustitución y la condición antedicha
obtenemos inmediatamente la contradicción

1‚((@ºw(w)) ≡ (#ºw(w)))

Russell agrega: “Asímismo, no hay ninguna clase (como un todo) de aquellas clases
que —como todos— no se pertenecen a sí mismas. De ello concluyo que bajo ciertas
circunstancias un conjunto definible no forma un todo (eine definierbare Menge kein
Ganzes bildet).” (Frege, WB, p. 211). La paradoja de Russell surge, por cierto, tam-
bién en el sistema más riguroso de Frege 1893/1903 (véase el Apéndice XII).
2.3 FUNDAMENTOS DE LA ARITMÉTICA

El aporte más importante de Frege a la filosofía matemática consiste en lo


que ya hemos visto: su concepción de la escritura conceptual y su análisis
de las relaciones y de las aseveraciones condicionales y universales (Capitu-
lo 2.2). Su fundamentación de la aritmética con estos medios impresiona
todavía a ciertos filósofos, pero los matemáticos le han prestado muy poca
atención. En todo caso, aunque no nos detengamos a examinar el formalis-
mo de sus deducciones, vale la pena darle una mirada a las definiciones que
introdujo para “reducir” los conceptos específicos de la aritmética a ideas
básicas comunes a todas las áreas del pensamiento. La motivación y alcance
de la empresa de Frege —y también la peculiar ceguera que la vicia— se
apreciarán mejor si examinamos primero la obra contemporánea —mucho
más influyente y, en mi opinión, más acertada— de Richard Dedekind y
Giuseppe Peano.1

2.3.1 Peano (1889)

En 1889 Peano publicó la monografía Arithmetices principia, novo methodo


exposita. En el largo prefacio presenta y explica la escritura conceptual in-
ventada por él, que es el antecedente histórico directo de la que usamos hoy.
El § 1 contiene la primera versión publicada de los célebres Axiomas de
Peano, que constituyen justamente el sistema de axiomas para la aritmética
elemental cuya consistencia Hilbert y sus colaboradores intentarán demos-
trar. Peano agradece a Boole, Schröder, Jevons, Peirce y MacColl sus apor-
tes a la lógica y cita también el libro sobre aritmética de Dedekind (1888)
que comentaré enseguida, pero no nombra a Frege, lo que me hace suponer

1 Al redactar este capitulo tuve a la vista con mucho provecho la obra de Gillies (1982)
y la Sección XIX del libro de Crispin Wright (1983).

145
2.3 Fundamentos de la aritmética 146

que en 1889 todavía no lo conocía.2 Reproduzco a continuación los Axio-


mas de Peano, en la notación original (doy entre paréntesis una versión cas-
tellana):3

P1 1 ε N.

a ε N. ç . a + 1 ε N.
(1 es un número.)
P2

a, b ε N. ç . a = b. = . a + 1 = b + 1.
(Si a es un número, el siguiente de a es un número.)
P3
(Si a y b son números, a es igual a b si y sólo si el siguiente de a

a ε N. ç . a + 1 ⴚ= 1.
es igual al siguiente de b.)
P4

k ε K. ç ∴ 1 ε k ∴ x ε N. x ε k : çx . x + 1 ε k : : ç . N ç k.
(Si a es un número, el siguiente de a no es igual a 1.)
P5
(Si k es una clase tal que (i) 1 pertenece a k y (ii) para todo objeto
x, si x es un número y x pertenece a k, también el siguiente de x
pertenece a k, entonces k incluye a toda la clase de los números.)

2 En un artículo sobre “Los principios de la lógica matemática” aparecido dos años más
tarde, Peano cita a Frege 1879, pero sólo para informar al lector que, “en vez de a ç
b, [Frege] escribe / a ” (Peano 1891, n. 5). El 30 de enero de 1894, contestando a una
^b
carta de Frege, Peano le comunica que “j’ai acheté il y a quelques temps vos Die
Grundlagen der Arithmetik [Frege 1884]” y el 3 de octubre de 1896 le cuenta que acaba
de releer Begriffschrift (1879) y Grundgesetze (tomo I, 1893), “avec nouveau plaisir”
(Frege, WB, p. 177, 189), pero no sabemos cuando leyó estas obras por primera vez.
Peano publicó en 1895 una reseña del tomo I de Grundgesetze que dio lugar a una
interesante respuesta de Frege.
3 En el libro de Peano los axiomas P2–P5 llevan los números 6, 7, 8 y 9, respectivamen-
te. Los números 2–5 corresponden a axiomas que gobiernan el uso entre números del
signo ‘=’, el cual se emplea a la vez como símbolo de la equivalencia entre asevera-
ciones y de la igualdad aritmética. Peano (1898) enuncia sólo cinco axiomas de la arit-
mética, correspondientes a P1–P5 (supongo que esta simplificación se debe a que lle-
gó a pensar como Frege que los axiomas que gobiernan el símbolo ‘=’ en ambos usos
pertenecen a la lógica general; cf. nota 5). Allí emplea el símbolo ‘0’ en vez de ‘1’
para designar al miembro distinguido de la clase N, esto es, el objeto que según P1 es
un número y según P4 no es igual al siguiente de ningún número; con ello se evita la
perniciosa confusión entre ‘1’ y ‘+1’ que comento en la nota 4.
2.3 Fundamentos de la aritmética 147

explicado en la presentación de su escritura conceptual, a saber, ⴚ, =, ε, ç,


En los enunciados de Peano figuran algunos signos de uso general que ha

çx, la constante K y los puntos. Hay además tres símbolos nuevos, no defi-
nidos, que son los primitivos de su aritmética, a saber, N, 1 y la expresión
+1.4 Antes de examinar la índole sintáctica de estos primitivos y las condi-
ciones semánticas que les imponen los axiomas, conviene hacer algunas ob-
servaciones sobre los signos de uso general. Peano dice que “K significa clase
o agregado de entes”. Los puntos funcionan como los paréntesis en el álge-
bra, entendiéndose que, en una fórmula dividida por puntos, se asocian, ante
todo, los signos que no están separados por ningún punto; enseguida, los

puntos, etc. Así, a b . c d : e f . g h ∴ k significa lo mismo que


que están separados por un punto; luego, los que están separados por dos

(((ab)(cd))((ef)(gh)))k. Aunque Peano no lo dice, debemos entender que la


simple yuxtaposición de dos oraciones expresa la conjunción de éstas.
Los demás signos de uso general corresponden, aunque no sin equívocos,
a otros que utilizamos hoy. El signo =, escrito entre nombres de objetos,
expresa la identidad de los objetos nombrados, como nuestro signo de la

la equivalencia de éstas, como nuestro signo ↔ (cf. la segunda posición que


misma forma; pero Peano también lo escribe entre oraciones para expresar

4 También el signo ‘=’ es un primitivo de la aritmética en Peano 1889 (además de servir


como símbolo lógico de equivalencia), pero para nuestros propósitos es preferible no
hacer caso de esta peculiaridad (por eso he omitido los axiomas “aritméticos” 2–4 que
atribuyen a la igualdad entre números la consabida reflexividad, simetría y transitividad,
y el axioma 5, que estipula que si a = b y a es un número, entonces b es un número).
Es importante advertir que, aunque consta de dos caracteres, ‘+1’ es un solo símbolo
simple que representa la función unaria ‘el siguiente de…’. El signo ‘1’ que vemos en
él es sólo tipográficamente igual a la constante individual ‘1’ que se usa en el axioma

binaria que asigna a cada par de números 〈x,y〉 el número que es la suma de x e y.
P1, y el signo ‘+’ que lo precede no representa aquí la adición, es decir, la función

Desafortunadamente, Peano utiliza en su libro el mismo signo ‘+’ como símbolo de la


adición, que define así en la Proposición 18:

a, b e N. ç . a + (b + 1) = (a + b) + 1

Esto es: Si a y b son números, la suma de a y el siguiente de b es igual al siguiente


de la suma de a y b. Nótese que en esta definición el primer y el tercer signo ‘+’
significan la suma (de los números que figuran a cada lado), pero el segundo y el cuarto
se funden con el signo ‘1’ para significar el siguiente (del último número a su izquier-
da).
2.3 Fundamentos de la aritmética 148

el signo = ocupa en P3).5 El signo ⴚ significa negación, como nuestro sig-


no ¬; pero también expresa la operación booleana de formar el complemen-
to (si a es una clase, ⴚa es la clase formada por todos los objetos que no
pertenecen a a). La sintaxis del signo de negación difiere de la actual: si a

cribiríamos ‘¬(a = b)’ o, más informalmente, ‘a ≠ b’.


y b son objetos, ‘a ⴚ= b’ significa ‘a no es idéntico a b’, lo que ahora es-

El signo ε es, por cierto, el antecedente histórico directo de nuestro signo


∈: en P5 la cláusula ‘1 ε k’ dice que el objeto llamado 1 pertenece a —es

Peano explica que ε debe leerse ‘es’ (§st¤ en griego; è en italiano). Cabría,
uno de los elementos de— la clase o colección de objetos llamada k. Pero

pues, entender este signo meramente como una cópula que une el sujeto

interpretación la cláusula ‘k ε K’ en P5 puede leerse ‘k es clase’, sin que


mencionado a la izquierda con el predicado escrito a la derecha. Bajo esta

haga falta suponer que hay una clase de todas las clases denotada por la
constante K.

clase (o conjunto), simbolizada por ε, y la relación de inclusión entre clases


Peano fue el primero en distinguir entre la relación de pertenencia a una

sólo si, cualquiera que sea el objeto x, x ε a implica que x ε b. En esta fun-
(o conjuntos), simbolizada por ç. Si a y b son clases, entonces a ç b si y

ción, ç corresponde pues a nuestro signo ⊆. Pero ç desempeña además otra


función: si a y b son oraciones, entonces ‘a ç b’ significa, según Peano, que
b se deduce de a. Esta explicación no es muy iluminadora ya que, debido a
la ausencia total de reglas de inferencia explícitas, no es fácil determinar
cuándo una oración se deduce de otra en su sistema. Con todo, Peano indica

significa en verdad lo mismo que ahora expresamos con ‘a → b’ (el lector


—en un pasaje citado en la nota 2— que si a y b son oraciones, ‘a ç b’

percibirá la semejanza entre el signo ç y la “herradura” ⊃ utilizada por


Russell y otros en vez de la flecha →). El doble sentido del signo ç es notorio
en P5, pero también en la definición misma de ç como signo de inclusión
(Peano 1889, Prefacio, Proposición 50):

5 Como vimos en la p. 142, n. 21, también Frege utiliza su signo de identidad = para
expresar la equivalencia entre oraciones. Pero en su sistema esto no constituye un uso
equívoco de dicho signo, ya que, según él, una oración denota su valor veritativo. Ob-
viamente, si dos oraciones son equivalentes, el valor veritativo que ambas denotan es
uno y el mismo.
2.3 Fundamentos de la aritmética 149

a, b ε Κ. ç ∴ a ç b : = : x ε a. çx. x ε b (50)

Aquí ç significa inclusión cuando está escrito entre los nombres de clase a
y b, pero significa implicación en los otros casos. Con el subíndice x que
acompaña a la última implicación Peano quiere decir que ésta vale cualquie-

cuantificador universal ∀x (en lugar de ‘x ε a. çx. x ε b’ hoy escribiríamos


ra que sea el objeto x. El subíndice x hace, pues, las veces de nuestro

‘∀x(x ∈ a → x ∈ b)). Peano escribe asimismo =x para generalizar una equi-


valencia.
Las explicaciones precedentes, aunque tediosas, apuntan a una importante
limitación común a toda escritura conceptual. Aunque se pretenda absoluta,
la precisión que tal escritura confiere al pensamiento no será mayor que la
que se logre discurriendo —para definirla y reglamentarla— en una lengua
viva. Por otra parte, la escritura conceptual permite fijar ideas de un cierto
grado de precisión y protegerlas —merced a la artificialidad y carencia de
poder sugestivo de sus símbolos— contra la erosión por el torrente de pará-
frasis y metáforas de que se nutre el discurso “natural”.

figura siempre a la derecha del signo ε. Por lo tanto, según la interpretación


Atendamos ahora a los primitivos N, 1 y +1. En los axiomas P1–P4, N

arriba mencionada, podríamos entender que N es un predicado, no el nom-


bre de una clase o colección existente de objetos. Pero en P5 figura la cláu-

decir algo si N ε K. El axioma P1 dice que 1 es un elemento distinguido de


sula N ç k. De acuerdo con la Proposición 50 del Prefacio, esto sólo quiere

esta clase N. Los axiomas P2–P4 caracterizan la aplicación de N en N por


x Å x + 1. P2 indica que se trata efectivamente de una aplicación con do-
minio y codominio N, puesto que dice que para cada objeto a que pertenez-
ca a N hay también en N un determinado elemento designado por a + 1. P3
indica que esta aplicación es inyectiva (a + 1 = b + 1 sólo si a = b).6 P4

Å x + 1 (no existe un x ε N tal que 1 = x + 1). Finalmente, P5 dice que la


dice que el objeto distinguido 1 no cae dentro del alcance de la aplicación x

6 Según lo que llevamos dicho, la apódosis a = b. = . a + 1 = b + 1 de P3 equivale a la


conjunción de las dos condiciones a + 1 = b + 1. ç . a = b y a = b. ç . a + 1 = b +
1. La primera de estas condiciones establece que la aplicación x Å x + 1 es inyectiva.
La segunda condición es superflua si entendemos, como parece natural, que la expre-
sión a + 1 es un término y, como tal, designa un y sólo objeto.
2.3 Fundamentos de la aritmética 150

clase N está incluida en cualquier clase k que reúna los dos requisitos si-
guientes: (i) k contiene el elemento distinguido 1 y (ii) si x es cualquier objeto

ciertamentemente existe, en virtud de P2, puesto que x ε N). Por lo tanto, si


contenido a la vez en N y en k, k contiene también el objeto x + 1 (que

entendemos —como parece haber entendio Peano— que cada propiedad atri-
buible a objetos determina una clase formada por los objetos que tienen esa
propiedad, el axioma P5 justifica un método para demostrar que una propie-
dad es común a los objetos de la clase N. Sea k la clase formada por los
objetos que tienen la propiedad k*. En virtud de P5, para probar que todos

probar que 1 la tiene y que, si la tiene cualquier x ε N también la tiene el


los objetos de la clase N tienen la propiedad k* (de modo que N ç k) basta

respectivo objeto x + 1. Este método de prueba se llama inducción matemá-


tica (finita).

un conjunto no vacío cualquiera N y una aplicación inyectiva σ: N Æ N, tal


Para apreciar mejor el potencial de los axiomas de Peano, consideremos

que un determinado objeto 1 ∈ N queda fuera del alcance de σ (∀x(x ∈ N


→ σ(x) ≠ 1)). La estructura 〈N,σ,1〉 evidentemente satisface los axiomas P1–

que σ es la aplicación x Å x + 1. ¿Qué condiciones adicionales tiene que


P4, si entendemos que N es la clase N, que 1 es el objeto distinguido 1 y

cumplir 〈N,σ,1〉 para que satisfaga además el axioma P5? En Was sind und
sollen die Zahlen? (1888), Dedekind había dado a esta pregunta una respuesta
que Peano no incorpora a su tratamiento del asunto, posiblemente porque
cuando redactó Arithmetices Principia (1889) todavía no había estudiado bien
aquel libro (que cita, sin embargo, en su Prefacio). Pero antes de hablar de
ella, conviene tener presentes algunos ejemplos de estructuras que efectiva-
mente satisfacen los cinco axiomas P1–P5. Sea N el conjunto de los símbo-

mos 1 al símbolo 1 y σ a la aplicación que asigna a cada símbolo el símbo-


los con que representamos los enteros positivos: N = {1, 2, 3,…}; llame-

lo siguiente.7 Entonces 〈N,σ,1〉 satisface los cinco axiomas de Peano. Pero

7 Nótese que digo los símbolos, no los objetos (números) que ellos supuestamente repre-
sentan. Qué sean estos objetos es lo que Peano y Dedekind buscaban establecer. Para
que el conjunto de símbolos {1, 2, 3,…} esté bien definido es preciso, claro está,
disponer de una regla que determine la figura del sucesor inmediato de cualquier sím-
bolo dado. Pero evidentemente disponemos de ella. ¿No sabe acaso el lector escribir
en el acto el número que sigue a 37.045.622.876.359? Con un pequeño esfuerzo puede
también sin duda nombrarlo, en castellano, en inglés y en cuántas lenguas conozca.
2.3 Fundamentos de la aritmética 151

〈N,σ,1〉 también satisface los cinco axiomas de Peano si N = {0, 1, 2,…}


y σ es como antes, pero 1 es el símbolo 0. Fijémosnos por el momento en
esta última interpretación. Sea Nn ⊆ N el conjunto {0, n, 2n, 3n,…}, 1 el
0 y σn la aplicación Nn Æ Nn definida por σn(x) = x + n. Basta una breve

estructura 〈Nn,σn,1〉, si entendemos que la clase N de Peano es Nn, que el


reflexión para convencerse de que los axiomas P1–P5 están realizados en la

su aplicación inyectiva x Å x + 1 es σn.


objeto distinguido que él llama 1 es nuestro 1 (esto es, el símbolo 0), y que

2.3.2 Dedekind (1888)

En la obra citada, Dedekind quiso mostrar que “el concepto de número es


enteramente independiente de las representaciones o intuiciones del espacio
y del tiempo” y que puede considerárselo “un producto (Ausfluß) inmediato
de las puras leyes del pensamiento” (1893, p. vii).8 Estas palabras recuerdan
el programa de Frege: probar que las verdades aritméticas se deducen de
definiciones y leyes de la lógica. En el prólogo a la segunda edición Dedekind
dice que leyó el libro de Frege, Grundlagen der Arithmetik (1884), un año

Podríamos, pues, identificar N con cualquiera de los siguientes conjuntos de palabras:


{uno, dos, tres,…}, o {one, two, three,…}, o {eins, zwei, drei,…}, etc., y obte-
ner otras tantas realizaciones de los axiomas de Peano. A primera vista, no parece que
pueda sacarse mucho provecho del axioma P5 para demostrar propiedades del conjun-
to N así interpretado, pues obviamente no hay ninguna conexión necesaria entre la fi-
gura gráfica o fónica de uno de los símbolos o palabras en cuestión y la de su sucesor
inmediato. Pero las propiedades interesantes que se prueban mediante P5 involucran
funciones como la suma y la multiplicación, cuyas definiciones fundan tales conexio-
nes. Se advertirá de paso que en cualquiera de estas interpretaciones N no es un con-
junto de objetos físicos —paquetes de ondas acústicas, inscripciones hechas con tiza o
con lápiz— sino ideales: los prototipos pensables de tales símbolos o palabras. De hecho,
la inmensa mayoría de esos prototipos no ha tenido nunca ni podría tener una realiza-
ción física.
8 No he tenido en mis manos un ejemplar de la primera edición de Dedekind 1888, sino
sólo de la segunda (inalterada) de 1893. Por eso —y para facilitar la consulta de otras
ediciones— mis citas remiten a los números (del 1 al 172) en que está dividido el
texto en todas ellas. Esta convención, empero, no es aplicable al prólogo.
2.3 Fundamentos de la aritmética 152

después de publicada la primera del suyo (1888), y que, considerando “la


precisión con que el autor se expresa sobre la inferencia de n a n + 1”, es
claro que “aquí pisamos sobre el mismo terreno” (Dedekind 1893, p. xvii).
Sin embargo, como veremos, hay una profunda diferencia entre ambos. Mucho
más cerca está Dedekind de Cantor, con quien, como sabemos, tenía corres-
pondencia (Capítulo 1.4). Dedekind parte introduciendo la noción de siste-
ma (System), que yo no sabría distinguir de lo que Cantor llamaba ‘conjun-
to’ (Menge).9 En aras de “la uniformidad de la dicción”, admite la existencia
de sistemas “que constan de un objeto único” (esto es, de conjuntos unita-
rios); pero descarta explícitamente “el sistema vacío, que no contiene nin-
gún elemento […], aunque para otras investigaciones puede ser cómodo
inventarlo” (Dedekind 1888, #2).
Básico es asímismo el concepto de aplicación (Abbildung), que Dedekind
introduce así:

Por aplicación ϕ de un sistema S se entiende una ley en virtud de la cual

nada que se llama la imagen (Bild) de S y se designa con ϕ(s). Decimos


a cada elemento determinado s de S pertenece (gehört) una cosa determi-

también que ϕ(s) corresponde (entspricht) al elemento s, que ϕ(s) surge


de s o es generado desde s por la aplicación ϕ, y que por ella s se trans-
forma en ϕ(s) (übergeht in ϕ(s)). Si T es una parte cualquiera de S, la
aplicación ϕ de S contiene a la vez una determinada aplicación de T que,
en aras de la simplicidad, podemos designar con el mismo signo ϕ y que

imagen ϕ(t) que t posee como elemento de S. También el sistema que


consiste en que a cada elemento t del sistema T le corresponde la misma

consta de todas las imágenes ϕ(t) se llamará la imagen de T y se designa-


rá con ϕ(T). Esto explica de paso el significado de la expresión ϕ(S).
(Dedekind 1888, #21)

9 He aquí una traducción del pasaje pertinente:


En lo sucesivo entiendo por cosa (Ding) a cada objeto de nuestro pensamiento. […]
Ocurre muy a menudo que diversas cosas a, b, c,…, consideradas por cualquier
motivo bajo un punto de vista común, son reunidas en la mente (im Geiste zusammen-
gestellt werden) y se dice entonces que forman un sistema S; las cosas a, b, c,…
son los elementos del sistema S, están contenidas en S. Por su parte, S consta de
(besteht aus) estos elementos. Como objeto de nuestro pensamiento, un tal sistema S
[…] es también una cosa; está completamente determinado cuando respecto de cada
cosa está determinado si ella es o no es un elemento de S.
(Dedekind 1888, ##1,2)
2.3 Fundamentos de la aritmética 153

Este concepto de Dedekind concuerda no sólo en el nombre con lo que en


alemán ahora se llama Abbildung (‘aplicación’† en castellano). Sorprende un
tanto el aserto de que una aplicación es una ley, pues las aplicaciones a que
Dedekind de hecho se refiere en su libro pueden ser —como las nuestras—
correspondencias enteramente arbitrarias. Igual que en la matemática actual,
una aplicación está individualizada aquí por su dominio, esto es, por el par-
ticular sistema a cuyos elementos ella asigna “imágenes” (en contraste con
las funciones de Frege que son, por así decir, aplicaciones del universo en-

una aplicación ϕ definida en un conjunto S y la restricción de ϕ al subconjunto


tero). Por eso Dedekind distingue con primor inusitado en su tiempo entre

T ⊂ S (aunque, “en aras de la simplicidad”, usa la misma letra ϕ para desig-

al sistema de donde la aplicación ϕ toma sus imágenes, o sea lo que hoy


nar a ambas). El lector echará de menos en el pasaje trascrito una referencia

llamamos el codominio de ϕ. Dedekind introduce este concepto más adelan-


te y enseña a describir una aplicación —como se hace hoy—nombrando su
dominio y su codominio:

Si ϕ es una […] aplicación de un sistema S y ϕ(S) es una parte de un


sistema Z llamamos a ϕ una aplicación de S en Z, y decimos que S es
aplicada por ϕ en Z.
(Dedekind 1888, #36)

Pero no insiste —como haríamos hoy— en que el codominio de una aplica-


ción también contribuye a individualizarla.10
Dedekind llama ‘aplicación similar’ (ähnliche Abbildung) a lo que hoy
llamamos una aplicación inyectiva. Dos sistemas son similares si uno de ellos

10 Esto se debe, seguramente, a la índole misma de las aplicaciones que Dedekind consi-
dera en su libro. El codominio B de una aplicación ƒ: A Æ B cobra importancia como
factor individualizador cuando atendemos a las propiedades inherentes a ƒ en virtud de
las estructuras características de A y B. Por ejemplo, si S es una superficie curva en el
espacio euclidiano E, la métrica estándar de E induce una métrica en S (que determi-
na, por ejemplo, cuales son las rutas más cortas que puede seguir una hormiga que
camina sobre S). La inclusión ␫: S Æ E, x Å x, que asigna a cada punto x de la
superficie S el mismo punto considerado como elemento del espacio E, difiere enton-
ces de la identidad IS: S Æ S, x Å x, puesto que IS es una isometría, pero ␫ normal-
mente no lo es (dos pares de puntos equidistantes en S generalmente no equidistan en
E).
2.3 Fundamentos de la aritmética 154

S1 es similar al sistema S2 si hay una aplicación inyectiva ϕ: S1 Æ S2 tal que


es la imagen de una aplicación similar del otro. En otras palabras, el sistema

ϕ(S1) = S2. En tal caso, decimos hoy que ϕ es biyectiva. Evidentemente, si


S1 es similar a S2, ambos sistemas son equinumerosos. Valiéndose de este
concepto, Dedekind construye su célebre definición de infinito: Un sistema

si y sólo si hay una aplicación inyectiva ϕ: S Æ S tal que ϕ(S) ≠ S.11


S es infinito si y sólo si es similar a una parte propia de sí mismo, esto es,

Dedekind “demuestra” el siguiente “teorema”: Hay sistemas infinitos (1888,


#66).12

término ‘cadena’. Sea S un sistema cualquiera y ϕ una aplicación de S en S.


Para explicar cómo Dedekind concibe la aritmética tenemos que definir el

Una parte K de S es una cadena (Kette) con respecto a ϕ si K incluye su

11 Intuitivamente diríamos que un conjunto S es infinito si y sólo si ningún número natu-


ral es suficientemente grande para enumerar a S, esto es, si y sólo si |S| ≥ |ω|. Pero
Dedekind quiso tener un concepto de infinito utilizable en la caracterización de los
números naturales. Es fácil comprobar que todo conjunto infinito en el sentido de

se verá más adelante, un conjunto equinumeroso con ω). Mas para establecer la equi-
Dedekind también es infinito en el sentido intuitivo (pues necesariamente incluye, como

valencia de ambos conceptos se requiere el Axioma de Selección. Dedekind lo utiliza

equinumeroso con ω puede biyectarse sobre una parte propia suya (1888, #159).
de hecho implícitamente en su demostración de que cualquier conjunto que sea

12 Dedekind razona así: Sea G el sistema de todas las cosas que pueden ser objeto de mi
pensamiento. Si g es un elemento cualquiera de G, llamaré g′ al pensamiento de que g

aplicación ϕ: g Å g′ es una inyección de G en G (ya que, si g ≠ t, el pensamiento de


puede ser objeto de mi pensamiento. Obviamente, g′ también es un elemento de G. La

ser objeto de mi pensamiento). No todo elemento de G pertenece a ϕ(G) (ya que hay
que g puede ser objeto de mi pensamiento es distinto del pensamiento de que t puede

objetos posibles de nuestro pensamiento que no son pensamientos acerca de otros ob-
jetos). Por lo tanto, G es infinito. (Boolos 1990 hace interesantes observaciones sobre
este argumento de Dedekind).
Años más tarde, Dedekind retirará esta “prueba” porque la suposición de que existe
el sistema G lleva directamente a las paradojas de la teoría de conjuntos, aunque ex-
presaba todavía la confianza en que “una investigación rigurosa de la capacidad crea-
dora del espíritu para formar con elementos determinados un nuevo [objeto] determi-
nado, su sistema, que necesariamente se distingue de cada uno de esos elementos,
conducirá sin duda a una reformulación de los fundamentos de mi escrito que supere
todas las objeciones” (citado por Webb 1980, p. 63). Como vimos en el Capítulo 1.8,
los conjuntistas del siglo XX simplemente postulan que existe al menos un conjunto
infinito. Es más claro y honesto.
2.3 Fundamentos de la aritmética 155

propia imagen ϕ(K). En otras palabras, un sistema K es una cadena con res-
pecto a una aplicación ϕ: S Æ S si y sólo si ϕ(K) ⊆ K ⊆ S. En aras de la
brevedad diré ‘ϕ-cadena’ en vez de ‘cadena con respecto a ϕ’. Obviamente,
el propio sistema S es una ϕ-cadena. Consideremos ahora una parte cual-
quiera A ⊆ S. La ϕ-cadena de A —designada en el libro de Dedekind por
A0— es la intersección de todas las ϕ-cadenas que incluyen a A. Obsérvese

llamaré ‘la ϕ-cadena de x’ y designaré —como Dedekind— con x0 a la ϕ-


que, si A mismo es una cadena, A0 = A. Si x es un elemento cualquiera de S,

cadena del sistema {x} cuyo único elemento es x. (Lamentablemente, la nota-


ción A0, x0, no indica la aplicación con respecto a la cual estos sistemas son
cadenas; pero la usaré sólo en contextos en que no hay peligro de confu-
sión).13

der vollständigen Induction; en adelante, TIC): Sean ϕ: S Æ S, A ⊆ S y A0


Dedekind demuestra el siguiente Teorema de la Inducción Completa (Satz

la ϕ-cadena de A; sea Σ un sistema cualquiera (incluido o no en S). Para que


A0 esté incluida en Σ (A0 ⊆ Σ) son suficientes estas dos condiciones: (i) A ⊆
Σ y (ii) x ∈ A0 ∩ Σ sólo si ϕ(x) ∈ Σ. En efecto, si se cumple la condición
(i), A ⊆ A0 ∩ Σ, de modo que el sistema G = A0 ∩ Σ existe.14 Tenemos que
A ⊆ G ⊆ A0. Como A0 es una ϕ-cadena, x ∈ A0 → ϕ(x) ∈ A0. Por lo tanto,
ϕ(G) ⊆ A0. Por otra parte, (ii) implica que ϕ(G) ⊆ Σ. Por lo tanto, si (ii) es
verdad, tenemos que ϕ(G) ⊆ G. G es, pues, una ϕ-cadena, una de las ϕ-
cadenas que incluyen a A. Por lo tanto, A0 ⊆ G ⊆ Σ. Q.E.D.

13

ción ϕ: S Æ S y el subsistema A ⊆ S, ϕ(A0) = (ϕ(A))0: la ϕ-imagen de la ϕ-cadena es


Anoto un resultado al que me referiré más adelante: Cualesquiera que sean la aplica-

la ϕ-cadena de la ϕ-imagen (Dedekind 1888, #57). Para probarlo, demostramos prime-


ro el siguiente lema: Si hay una ϕ-cadena L tal que ϕ(A) ⊆ L, también hay una ϕ-
cadena K tal que A ⊆ K y ϕ(K) ⊆ L. En efecto, sea K = A ∪ L. Entonces A ⊆ K y ϕ(K)
= ϕ(A) ∪ ϕ(L). Como ϕ(A) ⊆ L (por hipótesis) y ϕ(L) ⊆ L (porque L es una ϕ-cade-
na), ϕ(K) ⊆ L ⊆ K. Por lo tanto, K es una ϕ-cadena. Sea, pues, (ϕ(A))0 = L. Entonces
L es una ϕ-cadena tal que ϕ(A) ⊆ L y —en virtud del lema— existe una ϕ-cadena K
tal que A ⊆ K y ϕ(K) ⊆ L. Por lo tanto, A0 ⊆ K (ya que A0 es la intersección de todas
las cadenas de que A es parte), de suerte que ϕ(A0) ⊆ ϕ(K) ⊆ L = (ϕ(A))0. Por otra
parte, ϕ(A) ⊆ ϕ(A0) (dado que A ⊆ A0) y ϕ(ϕ(A0)) ⊆ ϕ(A0) (dado que ϕ(A0) ⊆ A0). En
otras palabras, ϕ(A0) es una ϕ-cadena que incluye a ϕ(A). Por lo tanto, (ϕ(A))0 ⊆ ϕ(A0)
(pues (ϕ(A))0 es la intersección de todas las ϕ-cadenas que incluyen a ϕ(A)). Resulta,
pues, que ϕ(A0) = (ϕ(A))0. Q.E.D.
14 Hoy diríamos “de modo que A0 ∩ Σ ≠ ∅”. Como Dedekind no reconoce la existencia
del sistema vacío, para él un sistema existe si y sólo si contiene elementos.
2.3 Fundamentos de la aritmética 156

El TIC es inmediatamente aplicable a la estructura 〈N,σ,1〉 descrita en las


pp. 150-51, en que σ: N Æ N es inyectiva y 1 ∈ N pero 1 ∉ σ(N). Estas
características implican que 〈N,σ,1〉 satisface los primeros cuatro axiomas
de Peano. Ahora podemos ver, a la luz del TIC, que 〈N,σ,1〉 satisface ade-
más el axioma P5 si y sólo si N es la σ-cadena de 1 (si N = 10, en la no-

cualquier sistema k si (i) {1} ⊆ k y (ii) x ∈ 10 ∩ k implica que σ(x) ∈ k.


tación de Dedekind). En efecto, en virtud de ese teorema, 10 es parte de

Ahora bien, (i) equivale a la cláusula 1 ∈ k (‘1 ε k’) del axioma P5; por
otra parte, si N = 10, (ii) dice precisamente que ∀x((x ∈ N ∧ x ∈ k) → σ(x)
∈ k) (‘x ε N. x ε k : çx . x + 1 ε k’). Por lo tanto, bajo las condiciones
antedichas, N ⊆ k. Por otra parte, si N ≠ 10, tenemos que N å 10 aunque 1
∈ 10 y si x ∈ N y x ∈ 10, σ(x) ∈ 10. Por lo tanto, si N ≠ 10, el propio
sistema 10 proporciona un ejemplo de una colección de objetos que reúne
las condiciones prescritas a k en el axioma P5 y sin embargo no incluye a
N.

te: Supongamos que σ: S Æ S es una aplicación inyectiva cualquiera y que


De este resultado se deduce sin dificultad la importante conclusión siguien-

existe un objeto 1 ∈ S tal que 1 ∉ σ(S) (el lector recordará que esto sólo es

10 denota la σ-cadena de 1 y entendemos que 10 es N, 1 es 1 y σ es la


posible si S es un sistema infinito en el sentido de Dedekind). Entonces, si

aplicación x Å x + 1, la estructura 〈10,σ,1〉 satisface los axiomas P1–P5 y

los números naturales. En efecto, 〈10,σ,1〉 satisface P1–P4 por la forma cómo
puede por lo tanto prestar todos los servicios que la matemática espera de

la hemos definido y satisface P5 en virtud del TIC, puesto que 10 es la σ-


cadena de 10. Este argumento demuestra que todo sistema infinito en el sen-
tido de Dedekind incluye un subsistema capaz de brindar un modelo de los
axiomas de Peano.
En 1888 Dedekind no menciona, por cierto, los axiomas publicados por
Peano en 1889, pero caracteriza el tema de la aritmética elemental como acabo

aplicación similar (esto es, inyectiva) ϕ de N en N tal N es la ϕ-cadena de


de hacerlo. Dice que un sistema N se llama simplemente infinito si hay una

un elemento suyo que no pertenece a ϕ(N). Dedekind denota este elemento


con el signo ‘1’ y lo llama el elemento básico (Grundelement) de N. Dice

ción ϕ. “La esencia de un sistema simplemente infinito N consiste pues en


también que el sistema simplemente infinito N está ordenado por la aplica-

la existencia de una aplicación ϕ de N y un elemento 1 que satisfagan las


condiciones siguientes:”
2.3 Fundamentos de la aritmética 157

α. ϕ(N) ⊆ N.
β. N = 10 (la ϕ-cadena de 1).
γ. 1 ∉ ϕ(N).
δ. ϕ es similar (inyectiva).15

El estudio de esta esencia es la tarea propia de la aritmética, como indica la


siguiente:

ordenado por una aplicación ϕ, uno prescinde completamente de la parti-


D EFINICIÓN . Si en la consideración de un sistema simplemente infinito N

cular índole de sus elementos, se fija meramente en que es posible distin-

ción ordenadora ϕ, dichos elementos se llaman números naturales o nú-


guirlos y atiende sólo a las relaciones mutuas en que los pone la aplica-

meros ordinales o simplemente números y el elemento básico 1 se llama

nes o leyes que se derivan pura y exclusivamente de las condiciones α, β,


el número básico (Grundzahl) de la serie numérica N. […] Las relacio-

γ, δ en el #71 y por ende son siempre las mismas en todos los sistemas
ordenados simplemente infinitos, —cualesquiera que sean los nombres que
casualmente se asignen a los elementos particulares— constituyen el ob-
jeto inmediato de la ciencia de los números o aritmética.
(Dedekind 1888, #73)

A mi modo de ver, esta visión de la aritmética elemental como la teoría de


los sistemas simplemente infinitos queda plenamente vindicada cuando
Dedekind define en sus términos la relación ‘mayor que’ y las funciones
aritméticas básicas: suma, multiplicación y exponenciación (de enteros posi-

al sistema simplemente infinito N ordenado por la aplicación ϕ y u = ϕ(v).


tivos). Digamos con él que u es el número siguiente a v si u y v pertenecen

Dedekind demuestra que, aparte del elemento básico 1, todo elemento de N


es el número siguiente a otro elemento de N.16 Por otra parte, es fácil ver

15 Dedekind 1888, #71. He colocado el texto de los postulados α–δ fuera de la cita entre
comillas porque no uso la misma notación que Dedekind.
16 En efecto, si ƒ: S Æ S es cualquier aplicación y A ⊆ S, la ƒ-cadena de A, A0 = A ∪
ƒ(A0) (Dedekind 1888, #58). Por lo tanto, N = 10 = {1} ∪ ϕ(10) = 1 ∪ ϕ(N). La citada

= (ƒ(A))0. Para abreviar, estipulamos que L = ƒ(A0) y K = A ∪ L. Entonces ƒ(A) ⊆ L


proposición #58 se prueba así: Por la proposición #57 (demostrada en la nota 13), ƒ(A0)

(ya que A ⊆ A0) y, como L es una ƒ-cadena, la demostración del lema utilizado en la
nota 13 para probar la proposición #57 indica que también K es una ƒ-cadena tal que
2.3 Fundamentos de la aritmética 158

que ningún x ∈ N está contenido en la ϕ-cadena (ϕ(x))0 del número siguiente


a x.17 Sea K una ϕ-cadena cualquiera y n ∈ N. Basándose en las dos propo-
siciones recién citadas, Dedekind establece que (i) si n ∉ K, K ⊆ ϕ(n0); (ii)
si n ∉ K pero ϕ(n) ∈ K, K = ϕ(n0); (iii) hay un y sólo un k ∈ K tal que K
= k0 y (iv) si n ≠ m ∈ N, n0 ⊆ ϕ(m0) si y sólo si m0 å ϕ(n0).18 Dedekind
ofrece la siguiente definición: Si n, m ∈ N, n es mayor que m (simbólica-
mente: n > m), si y sólo si n0 ⊆ ϕ(m0). En virtud de los resultados antedichos,
cada par de números n, m ∈ N satisface una y sólo una de las tres relaciones
siguientes: n > m, o n = m, o m > n.19 Dedekind define luego recursiva-
mente la suma, la multiplicación y la exponenciación. Pero antes demuestra
el importante Teorema de la Definición por Inducción, que asegura la
univocidad de las definiciones recursivas (Dedekind 1888, #126). Mediante
este teorema Dedekind demuestra asimismo que entre dos sistemas simple-
mente infinitos cualesquiera hay una única aplicación biyectiva que asigna
al elemento básico del uno el elemento básico del otro y al siguiente de cada
elemento del primer sistema el siguiente del elemento correspondiente del
segundo. En virtud de ello, obviamente, todos los sistemas simplemente in-
finitos son intercambiables en su papel de “serie numérica” y el tema de la
aritmética resulta ser precisamente la estructura realizada en cualquiera de

A ⊆ K y ƒ(K)⊆ L. Como A0 es la intersección de todas las ƒ-cadenas que incluyen a A,


A0 ⊆ K. Por otro lado, A ⊆ A0 y L = ƒ(A0) ⊆ A0. Por lo tanto, K = A ∪ L ⊆ A0, de
suerte que K = A0.
17 En efecto, el elemento básico 1 ∉ (ϕ(1))0, puesto que 1 ∉ ϕ(N) y —en virtud de
Dedekind 1888, #57 (demostrado en la nota 13)— ϕ(N) = ϕ(10) = (ϕ(1))0. Suponga-
mos ahora que la tesis vale para un cierto n ∈ N. Sea p el número siguiente a n. Te-
nemos, pues, que n ∉ p0 y por ende difiere de cada q ∈ p0. En consecuencia, para
cada q ∈ p0, p = ϕ(n) ≠ ϕ(q) ∈ ϕ(p0) = (ϕ(p))0 (la desigualdad se debe a que ϕ es
inyectiva; la última igualdad se basa en el citado #57). Por lo tanto, si la tesis vale
para n vale también para el número siguiente a n. En consecuencia, por el TIC, vale
para todos los elementos de N. Q.E.D.
18 Las proposiciones (i), (ii), (iii) y iv) se enuncian y demuestran en Dedekind 1888, ##85,
86, 87 y 88, respectivamente.
19 Si n = m, n0 = m0. Como m ∈ m0 pero m ∉ ϕ(m0) —por la proposición demostrada en
el nota 17—, tenemos que n0 å ϕ(m0), es decir, que n ⬎ m. Intercambiando n y m en
este argumento concluimos que si m = n, m ⬎ n. Por otra parte, si n ≠ m, la proposi-
ción (iv) implica que se cumple una y sólo una de las alternativas: n > m, m > n.
2.3 Fundamentos de la aritmética 159

ellos. Me refiero a estos asuntos en el Apéndice XI (véase también el Apén-


dice VIII).

2.3.3 Frege (1884)

En su definición de la aritmética Dedekind adopta resueltamente lo que hoy


llamamos una concepción estructuralista de las matemáticas. Desde este punto
de vista cualquier sistema de cosas —no importa su origen y condición—
constituye el objeto de una determinada disciplina matemática en cuanto se
logra concebirlo como una realización de la especie de estructura que es el
tema propio de esa disciplina. Ello permite entender que las matemáticas sean
no —como se ha dicho a veces irreflexivamente— el lenguaje de la cien-
cia,20 pero sí un componente principal del pensamiento científico. El estruc-
turalismo matemático asoma ya en los escritos de Leibniz, y Newton descri-
bió en una oportunidad el espacio y el tiempo absolutos como sistemas de
objetos individualizados exclusivamente por sus relaciones mutuas.21 Pero fue
durante el gran florecimiento de las matemáticas en el siglo XIX que el punto
de vista estructuralista se fue imponiendo, sin hacer ruido, a sus practican-
tes. Se ha destacado con justicia la contribución de la geometría proyectiva
a este proceso (Nagel 1939, Freudenthal 1974). Permítaseme mencionar sin
comentarios el hecho siguiente: si H es un haz de rectas en el espacio ordi-
nario —es decir, si H es el sistema de todas las rectas que concurren en un
punto dado— y llamamos ‘punto’ a cada recta de H y ‘recta’ a cada plano
20 El discurso científico se conduce en castellano, inglés, chino, etc. Algunos fragmentos
sencillos se han traducido a una que otra escritura conceptual: BS, CP1=, etc. Pero
sería grotesco pretender que las matemáticas son uno de estos “lenguajes”.
21 “Del mismo modo que las partes del tiempo se individualizan por el orden, de suerte
que, por ejemplo, si el día de ayer pudiera permutar su orden con el día de hoy y
tornarse posterior perdería su individualidad y ya no sería más el día de ayer sino el de
hoy; así también las partes del espacio se individualizan por sus posiciones, de modo
que si dos cualesquiera de ellas pudiesen permutar sus posiciones, permutarían a la vez
su identidad y cada una se convertiría como individuo en la otra. Sólo en virtud del
orden y las posiciones relativas se conciben las partes del tiempo y del espacio como
siendo esas mismas que de veras son; y no tienen otro principio de individuación que
ese orden y esas posiciones, las cuales, por lo tanto, no pueden cambiar” (Newton,
“De Gravitatione et equipondio fluidorum”, en Hall y Hall 1978, p. 103).
2.3 Fundamentos de la aritmética 160

determinado por dos de ellas, entonces H, así descrito, realiza todos los teo-
remas de la geometría proyectiva plana. Sorprende por eso que Frege, cuya
tesis doctoral (1873) versó sobre un tema de geometría proyectiva, haya re-
sistido el enfoque estructuralista aun allí donde, como en la teoría axiomática
de la geometría de Hilbert, su necesidad saltaba a la vista.22 La diferencia
esencial entre su fundamentación de la aritmética y la propuesta por Dedekind
se debe justamente a esta extraña resistencia —o, mejor dicho, ceguera— de
Frege. Así como los teólogos demandan un concepto de Dios que no tenga
más que un solo ejemplar, Frege exige una definición de número que certi-
fique la unicidad del uno, el dos, el tres, etc. Como veremos, esta exigencia
lo indujo a la contradicción que arruina su teoría.23
La primera contribución importante de Frege a la fundamentación de la
aritmética aparece en la tercera parte de Escritura conceptual (1879, pp. 55–
87). Consiste en la demostración de varios teoremas de lo que Frege llama
“Teoría general de las series (allgemeine Reihenlehre)”. Uno de ellos pro-
vee, como el TIC de Dedekind, una justificación directa para la inducción
matemática finita. Camuflados en la escritura BS, estos resultados de Frege
no llamaron la atención de Dedekind y Peano cuando elaboraban sus teorías
de la aritmética. Como suele ocurrir en matemáticas, el genio del autor se

22 Sobre los Fundamentos de la geometría (Hilbert 1899) Frege y Hilbert intercambian


cartas —reproducidas en Frege WB, 60–76— en diciembre de 1899 y enero de 1900.
La obra es objeto también de dos artículos muy críticos de Frege (1903a, b). Es perti-
nente asímismo la correspondencia de Frege con el joven matemático Heinrich
Liebmann, hijo de su colega Otto Liebmann, y ayudante a la sazón en Göttingen, quien
le había procurado un ejemplar de los apuntes —autorizados por el profesor— del curso
“Elementos de geometría euclidiana” (invierno de 1898/99) en que Hilbert presentó su
axiomatización. El 29 de julio de 1900 Frege devolvió este trabajo a Liebmann con
una carta en la que le dice que, “aunque contiene varias invenciones ingeniosas, en
conjunto lo estimo malogrado (verfehlt) y utilizable sólo tras mucha crítica” (WB, pp.
147s.). Resnik 1980, cap. 3, contiene una buena exposición de “La controversia entre
Frege y Hilbert”. Aunque, a mi modo de ver, Resnik exagera los aciertos del primero,
admite que “Frege no apreció el potencial de la obra de Hilbert para la matemática en
general”, mostrándose “ciego” en un grado que nos resulta “chocante (shocking)” para
la evidente analogía entre la axiomática hilbertiana y lo que él mismo había hecho con
la aritmética (p. 114).
23 En definitiva, no hay multiples sistemas numéricos que realicen la teoría de la aritmé-
tica de Frege porque, como ella es contradictoria, simplemente no hay ninguno. No
faltará quien vea aquí otro paralelo con la teología.
2.3 Fundamentos de la aritmética 161

manifiesta principalmente, no en la derivación misma de los teoremas —ta-


rea relativamente fácil una vez bien planteada— sino en la selección de los
conceptos apropiados para formularlos. Así como Dedekind da con el con-
cepto muy simple y general de cadena —del que la serie numérica resulta
ser un ejemplo— y demuestra el TIC para toda cadena, así Frege introduce
los conceptos no específicamente aritméticos de serie determinada por un
procedimiento y propiedad hereditaria en una tal serie y prueba teoremas
sobre tales propiedades. Según Frege, “la inferencia de n a n + 1” —esto es,
la inducción matemática finita— se puede reducir a las leyes lógicas única-
mente a través de estos conceptos ideados por él (Frege 1884, p. 93).24
Para no cansar al lector, explicaré los conceptos de Frege en castellano
salpicado con fórmulas de la lógica actual.25 Me tomo además la libertad de
reemplazar los ideogramas churriguerescos que Frege usa para representar-
los por otros mucho más sencillos. Numero las explicaciones para facilitar
su consulta.

24 Las palabras ‘se puede …únicamente’ corresponden a la frase alemana ‘wird es allein
möglich’ empleada por Frege. Con ella expresa una apreciación singularmente exage-
rada de su propia obra. Como vimos, Dedekind no necesita los conceptos fregeanos
para llegar al TIC con una soltura y elegancia que una persona condenada a leer úni-
camente a Frege no se soñaría siquiera. Claro que el TIC es un teorema de una teoría
general de conjuntos, y como tal —diríamos hoy— no logra reducir la inducción ma-
temática a “leyes lógicas universales”. Pero inmediatamente después de probar el TIC
en la versión conjuntista que hemos visto (Sección 2.3.2), Dedekind da un paso que —
tomado al pie de la letra— reduciría en efecto la teoría de conjuntos a la lógica, si no

que una cadena A0 está incluida en un dado sistema Σ. Por lo tanto, según Dedekind,
la hiciera inconsistente. Me explico: El TIC enuncia ciertas condiciones que aseguran

el TIC puede invocarse para establecer que todos los elementos de A0 tienen cierta

poner que Σ designa “el sistema de todas las cosas que poseen la propiedad ᑟ (o para
propiedad ᑟ (o cumplen con la condición especificada en cierta oración ᑭ): basta su-

las cuales vale la oración ᑭ)” (1888, #60). Pero el supuesto de que existe, para cada
propiedad ᑟ (o condición ᑭ), el sistema de las cosas que poseen ᑟ (o satisfacen ᑭ)
implica, como sabemos, la paradoja de Russell. Gracias a Dios, para edificar la aritmé-

que Σ designa el sistema de todos los elementos de A0 que tienen la propiedad ᑟ (o


tica à la Dedekind no hace falta entender literalmente el pasaje citado: basta suponer

cumplen con la condición ᑭ). Así restringido, el supuesto no implica, que yo sepa,
contradicción alguna.
25 Véase el Apéndice IX. Adviértase que para explicar a Frege no puedo limitarme a uti-
lizar el conocido cálculo de primer orden que allí se explica en detalle, sino que debo
2.3 Fundamentos de la aritmética 162

[S0] Un ‘procedimiento’ (Verfahren), en el sentido de Frege, es sim-


plemente una relación binaria. Si R es un procedimiento y Ruv,
diremos con Frege que v resulta de aplicar R a u.

En la explicaciones siguientes me refiero a un procedimiento arbitrario pero


fijo que —imitando a Frege— designo con la letra minúscula ƒ.

(simbólicamente: ᑢƒF) si y sólo si ∀u(Fu → ∀v(ƒuv → Fv)),


[S1] Una propiedad F es hereditaria en la serie determinada por ƒ

esto es, si y sólo si, cuando un objeto v resulta de aplicar ƒ a un


objeto u que tiene la propiedad F, v también tiene la propiedad
F. En vez de ‘la serie determinada por ƒ’ diré ‘la ƒ-serie’ y en
vez de ‘hereditaria en la ƒ-serie’ diré ‘ƒ-hereditaria’.

sólo si ∀F(ᑢƒF → (∀w(ƒuw → Fw) → Fv)), esto es, si y sólo


[S2] u ƒ-precede a v y v ƒ-sucede a u (simbólicamente: u <ƒ v) si y

si, cualquiera que sea la propiedad F, v tiene F si F es ƒ-heredi-


taria y si el resultado de aplicar ƒ a u siempre tiene F.

serie que llega a v (simbólicamente: u ≤ƒ v ) si y sólo si u = v o


[S3] v pertenece a la ƒ-serie iniciada con u y u pertenece a la ƒ-

u <ƒ v.
[S4] Supongamos ahora que ƒ es un procedimiento tal que ƒuv y ƒuw
sólo si v = w. En tal caso, decimos con Frege que ƒ es un pro-
cedimiento unívoco (eindeutig).26 Como puede verse, un proce-
dimiento unívoco es simplemente una aplicación de todo el uni-
verso de objetos en sí mismo: ƒxy si y es el valor de tal aplica-
ción en el argumento x.

ocasionalmente recurrir al cálculo de segundo orden esbozado en la sección G de di-

la fórmula ∃R∀x∀y(Rxy → ¬(x = y)) dice que hay una relación binaria R que subsiste
cho apéndice. Éste envuelve cuantificación sobre variables predicativas. Por ejemplo,

sólo entre objetos no-idénticos.


ε
26 Frege escribe Iδ ƒ(δ,ε) para decir que el procedimiento ƒ es unívoco. Este es el más
sencillo de los ideogramas que emplea para representar los cuatro conceptos definidos
arriba.
2.3 Fundamentos de la aritmética 163

Los teoremas de la teoría de las series presentada en Frege 1879 se dedu-


cen de estas las definiciones [S1]–[S4] y los axiomas lógicos enunciados en
la Capítulo 2.2 (y en el Apéndice X), mediante las reglas de inferencia men-
cionadas en dicho capítulo (esto es, modus ponens y una regla tácita de sus-
titución de variables). La proposición siguiente constituye el fundamento de
la inducción matemática finita:

81. (Fx → (ᑢƒF → (x <ƒ z→ Fz)))


(Si F es una propiedad ƒ-hereditaria y x tiene
F y z ƒ-sucede a x, z también tiene F).

la inducción” fregeano. Aquél es relativo a una aplicación arbitraria ϕ, pero


Obsérvese cuánto más general que el TIC de Dedekind es este “teorema de

la operación ƒ a que éste se refiere no tiene que ser una aplicación: es lisa
y llanamente una relación binaria cualquiera. La demostración es facilísima,
si tenemos presentes las definiciones de ‘propiedad ƒ-hereditaria’ y ‘ƒ-suce-

por la conjunción de las tres premisas siguientes: (i) Fx, (ii) ᑢƒF, o sea, ∀u(Fu
de’. La proposición 81 queda establecida si probamos que Fy está implicada

→ ∀v(ƒuv → Fv)) y (iii) x <ƒ y, esto es, ∀G(ᑢƒG → (∀v(ƒxv → Gv) →

(iv) ∀v(ƒxv → Fv)). La conjunción de (ii) y (iii), combinada con el Axioma


Gy)). La conjunción de (i) y (ii), combinada con el Axioma 58, implica que

58, implica que (v) (∀v(ƒxv → Fv) → Fy).27 La conjunción de (iv) y (v)
implica Fy. Evidentemente, si entendemos que x denota el primer número
natural y ƒuv significa ‘v es el siguiente del número u’, la proposición 81
combinada con la regla modus ponens autoriza la inducción matemática fini-
ta.
Convencido de que la aritmética sólo puede ser una ciencia si sus asertos
se refieren a objetos bien determinados, Frege dedica la parte positiva de
Fundamentos de la aritmética (1884) a establecer qué objetos son los núme-
ros. No puedo examinar aquí las otras soluciones de esta cuestión que Frege

27 En esta segunda aplicación del Axioma 58, (∀xΦ(x) → Φ(a)), hay que entender como

con la variable Γ que aparece ligada en la premisa (iii). Frege nos pediría sustituir en
Frege que la variable ligada x puede ser predicativa y por ende puede ser sustituida

(∀xΦ(x) → Φ(a)), x por Γ, a por Φ, y Φ(Γ) por (ᑢƒΓ → (∀v(ƒxv → Γv) → Γy)); cf.
p. 131, nota 6.
2.3 Fundamentos de la aritmética 164

fustiga en la parte inicial —negativa— de su libro, aunque la crítica devas-


tadora a que las somete contribuye decididamente a motivar la suya. Los
objetos que propone —si existiesen de veras— constituirían, como veremos,
la serie determinada por cierto procedimiento, de modo que la teoría de 1879
les sería aplicable.
Frege procede a averiguar qué son los números examinando el modo como
corrientemente se habla de ellos. Para eso disponemos de palabras (y sig-
nos) —uno, dos, tres, cuatro… (1, 2, 3, 4,…)— que llamaré numerales.
También tenemos reglas precisas para construir nuevos numerales cada vez
que sea menester. Ahora bien, en la conversación cotidiana los numerales
funcionan como atributos o predicados —‘estas tres gallinas pusieron ayer
cinco huevos’, ‘la semana tiene siete días’, ‘hay ochenta mil soldados pafla-
gonios en Moronesia’. Por esto, los manuales de gramática clasifican a los
numerales como adjetivos. Sin embargo, en la fraseología matemática se
comportan como sustantivos, según puede verse en los siguientes ejemplos:
‘cuatro es el cuadrado de dos’, ‘once es el único número primo mayor que
siete y menor que trece’, ‘el dos, el tres y el siete son los únicos divisores
primos del 42’. Frege dice que le interesa concebir la noción de número en
la forma en que es utilizable por la ciencia, así que no se dejará turbar por
el hecho de que en la vida diaria los numerales también se usan atributiva-
mente (1884, p. 69). Además, cualquier expresión en que un numeral se usa
de este modo es fácilmente sustituible por otra equivalente en que se lo
emplea como sustantivo; así, en vez de ‘la semana tiene siete días’ siempre
puedo decir —si no me importa parecer afectado— ‘el número de los días
de la semana es igual a siete’. No obstante esta advertencia, Frege aborda su
tema con una pregunta que concierne directamente al uso atributivo (y pre-
dicativo) de los numerales, como quiera que se lo disimule con transforma-
ciones sintácticas. Cuando empleamos un numeral como adjetivo ¿a qué —
o a quién— le atribuimos una propiedad? La respuesta parece obvia: la pro-
piedad significada mediante un adjetivo se atribuye (en castellano) al objeto
nombrado por el sustantivo que dicho adjetivo califica. Así, el aserto sobre
las fuerzas armadas de Paflagonia atribuye a los soldados de esa nación
estacionados en Moronesia la propiedad de ser ochenta mil. Frege descarta
esta respuesta debido a que la presencia militar paflagonia en Moronesia
también se puede describir correctamente como un ejército, cinco divisio-
nes, cuarenta regimientos, ciento sesenta batallones. La propiedad expresada
2.3 Fundamentos de la aritmética 165

por el numeral ‘ochenta mil’ no se atribuye, pues, a la realidad concreta


nombrada en nuestro aserto, sino al concepto de soldado paflagonio en
Moronesia mediante el cual se refiere a ella. Este argumento fregeano no
tiene en cuenta, al parecer, que aunque una misma realidad exhiba distintas
propiedades según el concepto adoptado para objetivarla, ellas son propieda-
des del objeto captado, no del concepto bajo el cual se lo capta. Cuando leo
Las Bacantes leo a la vez una tragedia antigua y una edición moderna; un
escrito extraordinario y un impreso muy ordinario; una historia simple, pero
un texto difícil. Sería ridículo decir que esta última aseveración atribuye di-
ficultad no a la obra misma que estoy leyendo ahora —Las Bacantes de
Eurípides, en la edición de E. R. Dodds— sino a un concepto general bajo
el cual se la puede clasificar. Pero Frege tiene otra razón para sostener que
los adjetivos numerales expresan propiedades de conceptos. Imaginemos un
cuadro estadístico, por países, de los enfermos de cólera diagnosticados en
1991. Frente al nombre ‘Perú’ el cuadro registra un número de cinco cifras,
pero frente a ‘Finlandia’ hay un cero. Evidentemente, el cuadro no atribuye
la propiedad de ser cero al objeto descrito por la frase ‘enfermo de cólera
diagnosticado en Finlandia en 1991’. De acuerdo con lo que el propio cua-
dro nos informa, tal objeto no existe y no puede, por lo tanto, tener propie-
dad alguna. Pero el cuadro sí podría atribuir dicha propiedad al concepto de
enfermo de cólera diagnosticado en Finlandia en 1991 y —según la tesis de
Frege— de hecho se la atribuye.28

28 He aquí una traducción del pasaje de Frege que he estado parafraseando:


Si con respecto a un mismo fenómeno externo puedo decir con la misma verdad:
“esto es un grupo de árboles’ y “esto son cinco árboles”, o “aquí hay cinco com-
pañías” y “aquí hay 500 hombres”, no varía en tales casos ni lo individual, ni el
todo, el agregado, sino la denominación que le doy. Pero esto indica sólo la sus-
titución de un concepto por otro. Esto sugiere como respuesta a la primera pre-
gunta del párrafo anterior [“¿de quién se asevera algo mediante una indicación
numérica (Zahlangabe)?”] que la indicación numérica contiene un aseveración so-
bre un concepto. Esto se percibe tal vez con máxima claridad en el caso del nú-
mero 0. Si digo “Venus tiene 0 lunas”, no hay ninguna luna o colección de lunas
de la que pudiera estar diciendo algo; pero le atribuyo una propiedad al concepto
“luna de Venus”, a saber, la de no comprender nada (nichts unter sich zu befassen).
Si digo “el coche del emperador va tirado por cuatro caballos” le atribuyo el nú-
mero cuatro al concepto “caballo que tira el coche del emperador”.
(Frege 1884, p. 58)
2.3 Fundamentos de la aritmética 166

Supondré pues, con Frege, que atribuyo cierta propiedad al concepto C


cuando asevero que los C son un cierto número n. ¿Qué propiedad es ésa?
Tentativamente, Frege propone la siguiente definición recursiva (1884, p. 67):

(∆α) Al concepto C le corresponde (zukommt) el número 0 si y sólo si,


cualquiera que sea el objeto x, x no es C.
(∆β) Al concepto C le corresponde el número 1 si y sólo si hay un ob-
jeto a tal que a es C y cualquier objeto b que sea C es idéntico a
a.
(∆γ) Al concepto C le corresponde el número n + 1 si y sólo si hay un

sión (insaturada) ‘x es C y x ≠ a’ le corresponde el número n.


objeto a tal que a es C y al concepto C* expresado por la expre-

Frege rechaza esta propuesta en el acto, aunque admite que es tan natural
que el rechazo demanda una explicación. Su principal defecto consiste, se-
gún él, en que se ha definido la expresión ‘a C le corresponde el número n
+ 1’ mediante la expresión ‘a C* le corresponde el número n’, cuyo signifi-
cado se desconoce. Utilizando las definiciones ofrecidas,

podemos decir lo que significa (bedeutet) “al concepto F le corresponde


el número 1 + 1” y luego, mediante este resultado, indicar el sentido (Sinn)
de la expresión “al concepto F le corresponde el número 1 + 1 + 1”, etc.
Mas —para dar un ejemplo craso— con nuestras definiciones no podre-
mos decidir nunca si a un concepto le corresponde el número Julio Cé-
sar—si el conocido conquistador de Galia es o no es un número. Ade-
más, no es posible demostrar, con ayuda de las definiciones ensayadas,
que a tiene que ser igual a b si al concepto F le corresponde el número a
y a ese mismo concepto le corresponde el número b. Por lo tanto, la ex-
presión ‘el número que corresponde al concepto F’ no podría justificarse
y sería, por ende, generalmente imposible demostrar una identidad numé-
rica, ya que no podríamos captar un determinado número.
(Frege 1884, p. 68)29

Como sabemos, el Teorema de la Definición por Inducción de Dedekind


(Sección 2.3.2 y Apéndice XI) asegura la univocidad de las definiciones

29 La primera oración de este pasaje muestra que en 1884 Frege todavía utilizaba —como
en alemán corriente— Bedeutung (‘significado’) y Sinn (‘sentido’) como sinónimos.
2.3 Fundamentos de la aritmética 167

recursivas y por lo tanto desarma la objeción general contra tales definicio-


nes implícita en este texto de Frege. Pero dicho teorema presupone la exis-
tencia de una serie numérica y no se lo puede invocar para caracterizarla.
Por otra parte, el texto citado nos sugiere por qué Frege no supo hallar, como
Dedekind y Peano, una caracterización flexible y viable de los números, y
dio en cambio con un dogma rígido y contradictorio. Frege no entendió nunca
que una teoría matemática se interesa por sus objetos sólo en cuanto mantie-
nen ciertas relaciones mutuas, y no en cuanto a lo que cada uno pudiera ser
de suyo. Julio César será ciertamente un número, si integra con otros obje-
tos lo que Dedekind llama un sistema simplemente infinito (para lo cual el
difunto dictador romano es perfectamente idóneo). Pero a la aritmética no
va a interesarle su programa político, ni su estilo literario, ni sus hazañas
militares, sino sólo qué objeto le sigue y qué objetos le preceden en ese sis-
tema (si él mismo no es el primero). Por eso, en su papel de número nadie
lo nombraría con su nombre de familia, sino con el numeral correspondiente
(como hacemos con los dedos, cuando los usamos para sacar cuentas). Inca-
paz de ver estas cosas que a muchos nos resultan tan obvias, Frege censura
a Hilbert por modelar el plano euclidiano en un sistema de pares de números
reales.30 La misma ceguera motiva, me parece, su afán de encontrar, para
cada número natural, un objeto único que se identifique irremplazablemente
con él.

30 Hilbert llama Ω al sistema de los números algebraicos, esto es, los números reales que
son soluciones de ecuaciones polinomiales con coeficientes enteros. Frege, 1903b, p.
374, escribe:

〈x,y〉 del dominio Ω”, etc. Si mediante la definición y los axiomas pertinentes se
En la p. 20 [de Hilbert 1899] se dice: “Tomamos como punto un par de números

le hubiese ya conferido una denotación (Bedeutung) a la palabra ‘punto’, no se

un par de números del dominio Ω, que es de primer orden, igual que el concepto
podría hacerlo aquí otra vez. La cosa hay que pensarla así quizás: el concepto es

euclidiano de punto, debe caer bajo el concepto hilbertiano de segundo orden (si
es que hay tal concepto). Molesta, claro está, el uso de la palabra ‘punto’ en ambos
casos, pues evidentemente tiene en cada uno una denotación diferente.
El 27 de diciembre de 1899 Frege ya le había objetado por carta a Hilbert que sus
conceptos de ‘punto’ y ‘entre’ no son unívocos (WB, p. 63). Hilbert le envió a vuelta
de correo la declaración sobre “el sistema amor, ley, deshollinador,…” que cité al
comienzo de la Sección 1.8.1.
2.3 Fundamentos de la aritmética 168

Inmediatamente después de criticar como hemos visto la definición


recursiva propuesta, Frege le objeta que ya la base de la recursión (∆α) nos
dice solamente lo que significa ‘corresponder (a un concepto) el número 0’,
mas no lo que el número 0 es. Esto quiere decir que, en el mejor de los
casos, la definición determinaría a lo sumo el uso correcto de los adjetivos
numerales, mas no el significado de los sustantivos numerales que nombran
a los objetos de la aritmética. Para obviar esta dificultad Frege intenta una
maniobra familiar en matemáticas. En el lenguaje de hoy, la describiríamos
sumariamente así: Frege define cierta relación de equivalencia entre pares
de conceptos e identífica cada número con una de las clases de equivalencia
determinadas por dicha relación. La equivalencia definida por Frege es la
relación que hay entre dos conceptos a los que corresponde el mismo núme-
ro. Espontáneamente, diríamos que un mismo número corresponde a dos
conceptos F y G si el número n correspondiente a F es idéntico al número
m correspondiente a G. Pero este camino le estaba vedado a Frege mientras
no supiera lo que significa la expresión ‘el número n corresponde al concep-
to F’. Su magistral ocurrencia consistió en definir la relación diádica ‘X tie-
ne el mismo número que Y’ sin haber definido aún la propiedad ‘X tiene un
cierto número’, y usar la definición de aquella para fijar la de ésta. He aquí
su definición (Frege 1884, p. 85):

[N≈] La expresión ‘el concepto F es equinumeroso [gleichzahlig] con el

φ que coordina biunívocamente [beiderseits eindeutig zuordnet] los


concepto G’ significa lo mismo que la expresión ‘hay una relación

objetos que caen bajo el concepto F con los objetos que caen bajo
el concepto G’.

Para entender esta definición, presuponemos con Frege que, si F es cual-


quier concepto, los objetos que caen bajo F forman un colectivo. Siguiendo

una relación (diádica) φ coordina un objeto a con otro objeto b si el par


la tradición, Frege lo llama ‘la extensión (Umfang) de F’. Frege explica que

〈a,b〉 cae bajo el concepto φ.31 φ determina una coordinación biunívoca si

31 Usando las ideas de Frege 1891, diríamos que φ coordina a con b si y sólo si la fun-
ción φ toma el valor v en el argumento 〈a,b〉. Como Frege (1884, p. 84) explica
prolijamente, es enteramente legítimo decir que φ coordina los objetos que caen bajo F
2.3 Fundamentos de la aritmética 169

cumple los dos requisitos siguientes: (i) si el par 〈a,b1〉 cae bajo el concepto
φ, entonces 〈a,b2〉 cae bajo φ sólo si b1 = b2; (ii) si el par 〈a1,b〉 cae bajo el
concepto φ, entonces 〈a2,b〉 cae bajo φ sólo si a1 = a2. Utilizaré la abreviatu-
ra ‘F ≈ G’ para significar que el concepto F es equinumeroso con el concep-
to G. En nuestra jerga actual diríamos pues que, con arreglo a [N≈], F ≈ G
si y sólo si existe una aplicación biyectiva de la extensión de F en la exten-

cia puesto que (i) cada concepto es equinumeroso consigo mismo, (ii) si F ≈
sión de G. La relación de equinumerosidad es evidentemente una equivalen-

G, G ≈ F, y (iii) si F ≈ G y G ≈ H, F ≈ H. Como Frege supone tácitamente


que hay una suerte de reino formado por la totalidad de los conceptos, para
él es claro que la relación de equinumerosidad determina una partición† de
ese reino en colecciones de conceptos equinumerosos. Ellas son las clases
de equivalencia determinadas por la relación. Bajo este supuesto tenemos,
pues, que en virtud de [N≈] cada concepto F pertenece a una y sólo una de
esas clases. Ella es la extensión del concepto que expresamos con el predi-
cado ‘es equinumeroso con F’. Definimos con Frege (1884, p. 85):

cepto expresado mediante la fórmula ‘X ≈ F’.


[NF] El número correspondiente al concepto F es la extensión del con-

[Nn] La expresión ‘n es un número’ significa lo mismo que la expresión


‘existe un concepto F tal que n es el número correspondiente a F’.

Con estas definiciones se habría vindicado finalmente —bajo los supuestos


indicados— el uso de los numerales como sustantivos. Un numeral nombra
un número, que según [NF] es un objeto: la extensión de un concepto. Pero
también se ha justificado su uso como adjetivos: el concepto cuya extensión
nombra un cierto numeral se determina fijando uno de los correlatos de una
relación binaria entre conceptos: la relación de equinumerosidad. Dicho nu-
meral puede emplearse por eso sin mayor riesgo de confusión para expresar
la propiedad que pertenece a un concepto cualquiera si y sólo si es equinu-
meroso con el correlato fijado.

con los objetos que caen bajo G —simbólicamente: ∀x(Fx → ∃y(Gy ∧ φxy))— aunque
la extensión de F esté vacía. En efecto, si ∀x(Fx ↔ x ≠ x), es claro que ∀x¬Fx, de
modo que ∀x(¬Fx ∨ ∃y(Gy ∧ φxy)). La última oración equivale a ∀x(Fx → ∃y(Gy ∧
φxy)).
2.3 Fundamentos de la aritmética 170

Frege asigna ahora denotaciones precisas a los numerales 0 y 1:

fórmula ‘x ≠ x’.
[N0] 0 es el número correspondiente al concepto expresado mediante la

[N1] 1 es el número correspondiente al concepto expresado mediante la


fórmula ‘x = 0’.

La identificación fregeana de los objetos denotados por los demás numerales


depende esencialmente de la relación binaria que Frege llama seguir inme-
diatamente en la serie natural de los números. Esta relación se define así
(Frege 1884, p. 89):

[Nσ] La oración »n sigue inmediatamente a m en la serie natural de los


números« (»n folgt in der natürlichen Zahlenreihe unmittelbar auf
m«) significa lo mismo que la oración »hay un concepto F y un
objeto a que cae bajo F, y n es el número correspondiente a F y m

mula ‘Fx pero x ≠ a’«.


es el número correspondiente al concepto expresado mediante la fór-

En vez de ‘n sigue inmediatamente a m en la serie natural de números’ es-


cribiré ‘σmn’ (léase: ‘n sigue inmediatamente a m’ o ‘n es el siguiente de m’
o ‘m precede inmediatamente a n’ o ‘m es el predecesor inmediato de n’).32

efecto el siguiente de 0. Según [Nσ], σ01 equivale a esta doble generaliza-


Comprobamos en el acto que, conforme a las definiciones de Frege, 1 es en

ción existencial: hay un concepto F y un objeto a que cae bajo F, 1 es el


número correspondiente a F y 0 es el número correspondiente al concepto

32 No escapará al lector que, conforme a [Nσ], un número puede ser su propio predecesor
inmediato. Por ejemplo, si n es el número correspondiente al concepto ‘punto del cír-

céntrico del círculo con centro P y radio r’, [Nσ] implica que σmn aunque m = n (pues
culo con centro P y radio r’ y m es el número correspondiente al concepto ‘punto ex-

ambos conceptos son equinumerosos). Por lo tanto, contra lo que parecen creer algu-
nos traductores, la serie natural de los números, en el sentido de Frege, no es lo mismo
que la serie de los números naturales, en el sentido corriente. Nuestros números natu-

necientes a la σ-serie iniciada con 0 (cf. [S3]). Por cierto, un número tal que 0 ≤σ x,
rales son lo que Frege (1884, p. 96) llama números finitos, esto es, los números perte-

satisface la condición ¬σxx.


2.3 Fundamentos de la aritmética 171

expresado mediante la fórmula ‘Fx ∧ x ≠ a’. Dicha generalización existencial


es verdadera si tiene por lo menos un ejemplo particular. Helo aquí: sea a el
número 0 y F el concepto que expresamos mediante la fórmula ‘x = 0’. 1 es
el número correspondiente a este concepto y 0 cae bajo el mismo; además 0

la fórmula ‘x = 0 ∧ x ≠ 0’.
es precisamente el número correspondiente al concepto expresado mediante

Es fácil comprobar que, si σmn, no hay otro número p ≠ n tal que σmp:
si el siguiente de un número existe, es único. La relación binaria σ constitu-

explicación [S4] en la p. 162). También se comprueba fácilmente que, si σmn,


ye pues lo que Frege (1879) llamaba un procedimiento unívoco (véase la

no hay otro número q ≠ m tal que σqn: si el predecesor inmediato de un


número existe, es único. Me parece, pues, razonable decir que σ es un pro-
cedimiento biunívoco. Resumo este resultado en una proposición que llama-
ré F3 para subrayar su homología con el axioma P3 de Peano:

[F3] Si σmn y σpq, entonces m = p ↔ n = q.

Nuestras definiciones implican que 0 no es es el siguiente de ningún núme-


ro,33 lo cual se puede enunciar así:

[F4] No hay un número m tal que σm0.

a la σ-serie iniciada por 0 (simbólicamente: ∀x(Nxy ↔ 0 ≤σ x)). Obsérvese


Un objeto x es un número finito si y sólo si x es un número perteneciente

que esta propiedad es σ-hereditaria: ∀x∀y(Nx ∧ σxy → Ny).34

33 En efecto, según [Nσ], σm0 implicaría que 0 es el número correspondiente a un con-

el concepto H definido por la condición Hx ↔ x ≠ x. Mas 0 es, por definición, el


cepto F bajo el cual cae un objeto a. Tal concepto F no podría ser equinumeroso con

número correspondiente a un cierto concepto F si y sólo si F ≈ H.


34 Como σ es un procedimiento unívoco, esta aseveración es una consecuencia inmediata
de Frege 1879, Teorema 131. Pero también podemos justificarla directamente así: Re-
cordemos las definiciones [S2] y [S3]. Sea m un número finito y n el siguiente de m.
Por [Nσ], n es un número. Si 0 = m, 1 = n y es claro que 0 <σ n, es decir, que n posee
todas las propiedades σ-hereditarias del siguiente de 0, puesto que éste es el mismo n.
Si 0 <σ m, m posee todas las propiedades σ-hereditarias del siguiente de 0 y, por cierto,
se las trasmite a su propio siguiente n, de modo que 0 <σ n. En cualquier caso, 0 ≤σ n:
n es un número finito.
2.3 Fundamentos de la aritmética 172

Como 0 = 0 → N0, es claro que

[F1] 0 es un número finito.

Como 0 <σ x → Nx, tenemos además que (por [S3] y Frege 1879, Teorema
81, demostrado arriba en la p. 163):

[F5] Cada número finito posee todas la propiedades σ-hereditarias del 0.

Así pues, la justificación del razonamiento inductivo en aritmética fluye


directamente de la definición fregeana de número finito. En cambio, la pro-
posición siguiente es más difícil de probar:

que σmn.
[F2] Si m es un número finito cualquiera, existe un número finito n tal

La prueba, meramente esbozada por Frege en 1884, se basa en la simple

ros finitos que σ-preceden a m. Por lo tanto, si m existe, también existe el


observación siguiente: Si m es un número finito, hay exactamente m núme-

to perteneciente a la σ-serie que llega a m’ (o sea, ‘número x tal que, o bien


siguiente de m: éste es el número correspondiente al concepto ‘número fini-

0 ≤σ x <σ m, o bien x = m’). Como Frege (1884, p. 95) nos advierte, esta
observación presupone que ningún número finito se σ-sucede a sí mismo,
esto es, que ∀x(Nx → ¬(x <σ x)).35 No puedo detenerme a demostrarlo.36

35 Supongamos, por el contrario, que m <σ m. En tal caso, el concepto ‘número finito
perteneciente a la σ-serie que llega al predecesor inmediato de m’ sería equinumeroso
con el concepto ‘número finito perteneciente a la σ-serie que llega a m’, y el número
correspondiente a este último concepto no podría ser el siguiente de m..
36 La proposición ∀x(Nx → ¬(x <σ x)) es el Lema 52 en Wright 1983, Sección XIX.
Wright bosqueja una demostración en las pp. 165–67. Ella depende de una definición

(F < G) si y sólo si hay un concepto H tal que F ≈ G ∧ H y ∃x(Gx ∧ ¬Hx). (Aquí ‘G


y dos sublemas. Defino con Wright: el concepto F es menos amplio que el concepto G

∧ H’ designa el concepto bajo el cual caen precisamente todos los objetos que caen
bajo G y bajo H). Los sublemas demostrados por Wright se pueden enunciar así: [521]
Si u <σ v y u es el número correspondiente a un concepto U y v es el número corres-

concepto F es un número finito, entonces ¬(F < F) (F no es menos amplio que sí


pondiente a un concepto V, entonces U < V. [522] Si el número correspondiente al
2.3 Fundamentos de la aritmética 173

condición: Sm x ↔ Nx ∧ x ≤σ m. Denotaré con νm el número correspondiente


Consideremos, pues, un número finito m. Sea Sm el concepto definido por la

a Sm. Como N es σ-hereditaria, es claro que σmνm implica que Nνm (νm es
un número finito). Así, para demostrar [F2] bastaría establecer que σmνm.

sólo si x es un número finito tal que σxνx. (En otras palabras: el número
Para ello, conviene prestar atención a la propiedad S definida por: Sx si y

rrespondiente al concepto Sx). Si se demuestra (i) que S0 y (ii) que S es σ-


finito x tiene la propiedad S si y sólo si el siguiente de x es el número co-

hereditaria, F5 implica que ∀x(Nx → Sx). Es fácil probar (i). En efecto, S0


↔ ν0 = 1, esto es, si y sólo si hay un objeto único x tal que S0x. Como es
imposible que exista un objeto x tal que x <σ 0,37 tenemos que ∀x(x ≤σ 0 ↔

modo que efectivamente ν0 = 1. Probar (ii) no es tan fácil. Sea m un número


x = 0), lo cual implica que 0 es el único objeto que tiene la propiedad S0, de

finito cualquiera. Entonces, Sm ↔ σmνm. Hay que probar que Sm → Sνm.


Para simplificar la tipografía, pongo νm = n. Sea p el número correspondien-
te al concepto Tn, definido por la condición Tnx ↔ Snx ∧ x ≠ n. En virtud de
[Nσ], es claro que σpνn. Como Snx ↔ Nx ∧ (x = n ∨ x <σ n), tenemos que
Tnx ↔ Nx ∧ x <σ n. Por hipótesis, σmn. Es claro, entonces, que Tnm.38 Ha-
bría que probar, además, que Tnx ∧ x ≠ m → x <σ m.39 Si lo damos por

mismo). Con los supuestos de Wright es fácil demostrar además que si x es un número

522 implican que ningún número finito se σ-precede a sí mismo.


finito, x es el número correspondiente a algún concepto. Combinados con ella, 521 y

37 Sea F la propiedad definida por: Fx si y sólo si hay un concepto G y un objeto u tales

ro, [Nσ] implica que Fw. Así pues, trivialmente, F es una propiedad σ-hereditaria. Por
que Gu y x es el número correspondiente a G. Si w es el siguiente de cualquier núme-

lo tanto, si u es un número cualquiera, F es una de las propiedades σ-hereditarias del


siguiente de u. Como obviamente, ¬F0, resulta que ¬(u <σ 0): 0 no posee todas las
propiedades σ-hereditarias del siguiente de u.
38 Según lo que recién hemos visto, Tnm ↔ Nm ∧ m <σ n. Nm por hipótesis y m <σ n si
y sólo si n tiene todas las propiedades σ-hereditarias que posee el siguiente de m. Esta
es una verdad trivial si, como hemos supuesto, n es justamente el siguiente de m.
39 Tn x ∧ x ≠ m → x <σ m es una consecuencia directa de la conjunción de las dos aseve-
raciones precedentes con el Lema 5121 de Wright 1983, Sección XIX, cuya demostra-

finitos: ∀x∀y(Nx ∧ Ny → x <σ y ∨ x = y ∨ y <σ x) (Lema 51212 de Wright) y de la


ción Wright esboza en las pp. 163–65. Ella depende de la tricotomía de los números

Proposición 124 de Frege 1879: Si ƒ es un procedimiento unívoco y ƒxy, entonces ∀z(y


<ƒ z → y ≤ƒ z) (Lema 51211 de Wright).
2.3 Fundamentos de la aritmética 174

hecho, concluimos que Tn x ↔ x ≤σ m ↔ Sm x, de suerte que Tn ≈ Sm. Por


consiguiente, p = νm = n y σnνn. Así queda establecido que Sm → Sn: S es,
pues, σ-hereditaria. En virtud de (i) y (ii), cada número finito m cumple la
condición Sm y, por ende, hay un número que le sigue inmediatamente en la
serie natural de los números.
Así pues, con sólo llenar las lagunas del razonamiento anterior sería po-
sible deducir los cinco Axiomas de Peano de leyes lógicas suplementadas
con las definiciones fregeanas [N≈], [NF], etc. Desgraciadamente, en el siste-
ma de Frege, estas definiciones sólo pueden enunciarse como tales bajo un
supuesto que, como sabemos, implica la paradoja de Russell (Capítulo 1.6):40
si F es un concepto bien definido, existe la extensión de F. Arriba vimos
que este supuesto entra en la definición [N≈], y sobre todo en la definición
[NF], de la que penden la objetividad y unicidad de los números fregeanos.
En el Apéndice XII explico mejor de qué modo ese supuesto está presente
en el sistema maduro de Frege, y lo hace contradictorio. Aquí sólo me inte-
resa destacar que si no hubiera contradicción o si un neo-fregeano pudiera
eliminarla, los argumentos de Frege establecerían a lo sumo que esas exten-
siones de conceptos que él llama números finitos forman un modelo de la
especie de estructura caracterizada por los Axiomas de Peano. Por lo tanto,

40 Wright (1983) buscó esquivar la catástrofe reemplazando la definición [N≈] por un


axioma del mismo tenor. Elaborando esta idea, Boolos (1987) muestra que la aritmé-
tica puede fundarse entera sobre los principios de la lógica de segundo orden de la
Begriffschrift (Frege 1879) y un solo axioma adicional, que puede parafrasearse así:

extensión de F si y sólo si hay una relación φ que coordina biunívocamente los objetos
‘Para todo concepto F existe un único objeto x tal que, para todo concepto G, x es la

que caen bajo el concepto F con los objetos que caen bajo el concepto G’. Boolos
ofrece además una prueba de consistencia del sistema deductivo así formado, relativa
a la consistencia de la teoría de conjuntos de Zermelo-Fraenkel (ZF), y también a la
consistencia del sistema, estrictamente más débil que ZF, que Shoenfield (1967, § 8.5)
llama “aritmética de segundo orden”. Ni el axioma de Wright, ni el de Boolos pueden
pasar por verdades lógicas (Boolos subraya que el suyo, combinado con los susodichos
principios lógicos, implica la existencia de infinitos objetos; vide Demopoulos 1995, p.
231). Por este camino no se llega, pues, a vindicar la pretensión de Frege de que la
matemática es parte de la lógica. Pero sí se pone de manifiesto —como destaca Boolos—
el enorme logro simplificador y elucidatorio del análisis fregeano del concepto de nú-
mero, “mediante el cual podemos ver cómo un vasto cuerpo de matemáticas puede
deducirse de un único principio simple y obviamente consistente” (Boolos 1987, en
Demopoulos 1995, p. 232).
2.3 Fundamentos de la aritmética 175

si tales extensiones existieran, podrían legítimamente reclamar el nombre de


‘números’, mas no con mejor derecho que los elementos de cualquier otro
modelo de esos axiomas.
2.4 LA TEORÍA DE LOS TIPOS LÓGICOS

Russell comunicó a Frege en junio de 1902 la paradoja de la clase de todas


las clases que no son miembros de sí mismas.1 Trabajaba entonces en el li-
bro The Principles of Mathematics, que apareció en 1903. Aunque lo conci-
bió —y en buena parte escribió— antes de leer a Frege, la doctrina susten-
tada en él concuerda en buena medida con la del pensador alemán,2 y resul-
ta igualmente afectada por la paradoja. Las Partes II–VII del libro se dedi-
can a demostrar “que toda la matemática pura se ocupa exclusivamente con
conceptos definibles en términos de un número muy pequeño de conceptos
lógicos fundamentales, y que todas sus proposiciones se pueden deducir de
un número muy pequeño de principios lógicos fundamentales”, mientras que
la Parte I acomete la “tarea puramente filosófica” de elucidar “los conceptos

1 Véase la nota 22 en la p. 143. Es razonable pensar que Russell comunicó la paradoja


a Frege poco después de descubrirla. Tal era, por ejemplo, la opinión de Coffa (1991,
p. 114). Pero desde que se sabe que Zermelo descubrió la paradoja independientemen-
te en 1901 (cf. la nota 3 en la p. 51), los expertos en Russell se han empeñado en
adelantar la fecha en que éste dio con ella. Rodríguez Consuegra me asegura —en co-
municación privada— que “fue en 1901, probablemente en mayo, aunque hay quien
sostiene que en diciembre de 1900”. Por otra parte, según el propio Rodríguez Consuegra
(1989, p. 134), los pasajes de The Principles que suponen un conocimiento de la para-
doja —esto es, el Capítulo 10, la versión final del Capítulo 43 y los apéndices sobre
Frege y sobre la teoría de los tipos— fueron despachados a la imprenta entre junio y
noviembre de 1902.
2 En el Apéndice A del libro citado Russell expone “Las doctrinas lógicas y aritméticas
de Frege”, según él las veía en 1903, y señala algunas de las diferencias que lo sepa-
ran de ellas. Tiles 1991, Cap. 3, muestra que, aunque coinciden en la superficie, las
ideas de Frege y de Russell sobre esta materia responden a motivaciones muy diferen-
tes. Coffa (1980, pp. 247s.) y otros han destacado que según Russell las verdades arit-
méticas son sintéticas, mientras que según Frege son analíticas. Pero el pasaje en que
Russell introduce esta tesis (1903, § 434) remite a Russell 1900, § 11, donde se define
un juicio analítico como “aquel cuyo predicado está contenido en el sujeto”, noción
ésta francamente más estrecha que la de Frege, para quien, como sabemos, una aseve-
ración es analítica cuando se deduce de definiciones y las leyes de la lógica (cf. p.
130, nota 4).

177
2.4 La teoría de los tipos lógicos 178

fundamentales que la matemática acepta como indefinibles” (Russell 1903,


Prefacio; 2ª ed., 1937, p. xv). La paradoja es el tema del capítulo 10, “The
Contradiction”. En ese mismo capítulo y en el Apéndice B, Russell esboza
un método para resolverla. Se trata de la primera versión, todavía rudimen-
taria, de la teoría de los tipos lógicos adoptada en Principia Mathematica
(1910–13), la obra monumental que Russell escribe en colaboración con
Whitehead. En el citado Prefacio, Russell en cierto modo anuncia esta obra
al declarar que lo que en 1903 ofrece al público es sólo un primer tomo,
escrito informalmente en inglés y dirigido principalmente a los filósofos, y
que irá seguido de un segundo tomo, formal, en escritura conceptual, para
cuya redacción ha reclutado la ayuda del matemático Whitehead. Pero los
tres tomos que finalmente escribieron juntos se alejan bastante del libro de
1903 y no se presentan como una continuación suya.
No pretendo examinar aquí la filosofía matemática de Russell.3 Menos aún
puedo evaluar en este espacio el aporte de Whitehead y Russell a un mejor
entendimiento de la arquitectura de la matemática clásica y su influencia
efectiva en el desarrollo ulterior de la misma.4 Me limitaré a hablar de la
teoría de los tipos, que es seguramente —después de la paradoja— la contri-
bución más original y característica de Russell a nuestro tema. Quizás sería
mejor considerarla no como una teoría —descripción o explicación de algún
género de realidades— sino como una preceptiva gramatical, dirigida a im-
pedir que se escriban expresiones capaces de generar contradicciones como
la paradoja de Russell. Pero sólo mucho más tarde —respondiendo a la crítica

3 Russell mismo la explica admirablemente en su forma madura en Introduction to Mathe-


matical Philosophy (1919), de la que hay varias traducciones al castellano. El lector
interesado en sus comienzos, antecedentes y motivaciones puede ahora recurrir al ex-
celente libro de Rodríguez Consuegra (1991).
4 Sospecho que, salvo por la saludable costumbre de formular las proposiciones y razona-
mientos matemáticos en un fragmento del lenguaje “natural” (castellano, inglés, etc.)
que se deje traducir sin pérdida a un cálculo predicativo de primer o segundo orden,
dicha influencia ha sido insignificante. Para confirmar o refutar esta sospecha sería
menester, eso sí, poner en claro como se entienden a la luz de Principia Mathematica
las grandes teorías de la matemática clásica (para determinar, luego, el papel que ese
particular modo de entenderlas ha desempeñado en el desarrollo ulterior de las mis-
mas). Los tres estudios más notables sobre la obra de Whitehead y Russell —Ramsey
1925, Quine 1941 y Gödel 1944— dejaron inexplorado este tema y no conozco ningún
trabajo que lo aborde.
2.4 La teoría de los tipos lógicos 179

de Black (en Schilpp 1944)— aceptará Russell verla así (Schilpp 1944, p. 691).
La versión publicada en el tomo I de Principia Mathematica en 1910 es el fruto
de una meditación compleja y vacilante, atenta a preocupaciones metafísicas, y
ello se le nota. En lo que sigue trazaré a grandes rasgos su desarrollo.5
A la teoría cantoriana del transfinito se le imputaban dos paradojas que
algunos juzgaban fatales: (i) La paradoja de Cantor: el cardinal del con-
junto de todos los conjuntos tiene que ser mayor que cualquier otro cardinal
pero, según el Teorema de Cantor, es menor que el cardinal del conjunto de
las partes del conjunto de todos los conjuntos. (ii) La paradoja llamada de
Burali-Forti: el conjunto de los ordinales está bien ordenado y por lo tanto
tiene un ordinal, mayor que cualquier ordinal perteneciente a dicho conjun-
to, el cual, por ser un ordinal, pertenece sin embargo a ese conjunto. La
paradoja de Russell, inspirada por la demostración del Teorema de Cantor
(Capítulo 1.6), se deja insertar en este mismo orden de ideas, si entendemos,
con Russell (1903, § 68), que las clases a que se refiere la paradoja son
precisamente los objetos que en la jerga matemática se llaman conjuntos. Se
distingue, empero, de las dos paradojas citadas en cuanto no envuelve los
conceptos de cardinal u ordinal ni ningún otro concepto específicamente
matemático, de modo que es propiamente una paradoja de la lógica univer-
sal, no de una disciplina matemática particular. En su primer intento de re-
solverla, Russell apela al distingo —introducido en Russell 1903, Cap. VI—
entre una clase considerada como pluralidad de objetos (the class as many)
y una clase considerada como siendo ella misma un objeto (the class as one).
Damos por descontado —dice Russell— que dondequiera hay una clase-plu-
ralidad también hay una clase-objeto, pero este axioma no tiene que valer
universalmente y parecería ser la fuente de la contradicción. “Así pues, con
sólo negarlo se superará toda la dificultad” (1903, § 104).6

5 Cocchiarella (1980) contiene un análisis más detallado de la compleja evolución de la


teoría de los tipos desde 1903 hasta 1910 y explica su curiosa motivación filosófica.
Rodríguez Consuegra (1989) ilumina el proceso con la luz que emana de los inéditos
de Russell y de paso corrige algunas opiniones de Cocchiarella.
6 El distingo russelliano entre the class as one (literalmente, ‘clase como uno’) and the
class as many (‘clase como muchos’) es afín al distingo entre referencia distributiva y
colectiva que utilicé en el Capítulo 1.1. Sea k un sustantivo común o frase sustantiva
que especifica una clase. Entonces, podemos referirnos distributivamente a cualquier k
(any k) o a cada k (every k) y también podemos referirnos colectivamente a todos los
k (all k). Este último modo de referencia englobaría a los k en una unidad objetiva, the
2.4 La teoría de los tipos lógicos 180

Como veremos, Russell luego descartará esta solución, debido a la impo-


sibilidad de fijar un criterio racionalmente justificable que determine los casos
en que a una clase-pluralidad le corresponde una clase-objeto y los casos en
que no le corresponde. Al parecer fue buscando ese criterio que Russell dio
con la idea de tipo lógico, conservada luego en la solución que adopta final-
mente. Para Russell el concepto de clase está estrechamente ligado al con-

proposicional si, para cada valor de x, φx es una proposición, bien determi-


cepto de función proposicional, que explica así: “φx es una función

nada si x está dado” (1903, § 22). “Una clase puede definirse como todos
los términos que satisfacen una cierta función proposicional” (§ 23). En el
vocabulario de Russell 1903, un ‘término’ (term) no es una palabra o frase
de cierto género, sino “cualquier cosa que pueda ser objeto del pensamiento

a la función proposicional φx comprende un objeto u si y sólo si φu es una


…o pueda ser contada como una” (§ 47). Así pues, la clase correspondiente

proposición verdadera. Ahora bien, según Russell

cada función proposicional φx…posee además de su ámbito de verdad

es, un ámbito dentro del cual x debe hallarse si φx ha de ser una proposi-
(range of truth), un ámbito de significación (range of significance), esto

esto es, si x pertenece al ámbito de significación de φx, existe una clase


ción, ya sea verdadera o falsa. Los ámbitos de significación forman tipos,

ámbito de significación de φx, como quiera que varíe φ; y el ámbito de


de objetos, el tipo de x, todos los cuales también tienen que pertenecer al

significación es siempre, o bien un tipo único, o una suma de varios tipos


completos.
(Russell 1903, § 497)

Las seis apretadas páginas que Russell dedica a “La doctrina de los tipos”
(1903, Apéndice B) no son un dechado de claridad,7 pero es bastante claro

class as one, la clase-objeto. Pero no toda expresión especificadora k tiene esta virtud.
Así, si k es la frase sustantiva “clase que no es miembro de sí misma”, la paradoja de
Russell implica que no puede existir la clase-objeto de todas las k. Pero —contra lo
que Russell va a sostener más tarde— ello no nos impediría hablar con sentido de una
k, cualquier k, cada k.
7 Especialmente desconcertante es la relación que establece Russell aquí entre su inci-
piente doctrina de los tipos y el par de conceptos clase-como-muchos/clase-como-uno.
Según él, una clase-como-uno es un objeto del mismo tipo que los comprendidos en
2.4 La teoría de los tipos lógicos 181

ción de una función proposicional φx comprende objetos de un tipo dado,


cómo piensa utilizarla para resolver su paradoja: si el ámbito de significa-

φu es una proposición verdadera— es un objeto de otro tipo diferente. Por


entonces su ámbito de verdad —es decir, la clase de los objetos u tales que

lo tanto, si esta clase es designada por la expresión ‘{u: φu}’, la expresión


‘φ{u: φu}’ carece de sentido, puesto que {u: φu} no pertenece al ámbito de
significación de φx. Así pues, en el contexto de la doctrina de los tipos, no
tiene cabida la noción de que una clase esté o no esté comprendida dentro
de sí misma y la paradoja de Russell no se puede siquiera expresar. Las
paradojas de Cantor y Burali-Forti también se eliminan por esta vía.
Russell (1906) retorna al tema de las paradojas, comentando un artículo
del matemático Hobson. Éste daba por supuesto que un “agregado” (ag-
gregate) —hoy diríamos un conjunto— de objetos sólo puede constituirse si
hay una norma que lo defina, esto es, una condición determinada que cum-
plan todos sus elementos y sólo sus elementos (Russell aclara que lo que
Hobson llama una norma es lo mismo que él llama una función propo-
sicional).8 Por eso, Hobson cuestiona el Axioma de Selección adoptado por
Zermelo (1904) para demostrar el Teorema del Buen Orden. Según este axio-
ma, si F es una familia de conjuntos no vacíos, existe un conjunto que con-

ella: “Lo que llamamos en el Capítulo VI la clase-como-uno es un individuo, con tal


que sus miembros sean individuos: los objetos de la vida diaria, personas, mesas, si-
llas, manzanas, etc., son clases-como-uno” (1903, § 497). Al tipo superior siguiente
pertenece en cambio la respectiva clase-como-muchos. Aparentemente, Russell identi-
fica aquí la clase-como-uno que forman ciertos objetos con lo que llamaríamos hoy la
fusión o suma mereológica de esos objetos (su relación con ellos es como la que tiene
una barra de acero con los átomos de hierro y carbono de que consta). En cambio, la
clase-como-muchos, en abierto contraste con la caracterización original de este con-
cepto en el Capítulo VI, es tratada aquí como un objeto, de otro tipo que sus miem-
bros, sí, pero dotado de unidad y susceptible de agruparse con otros de su mismo tipo
para formar nuevas clases (como-uno y como-muchos).
8 Esta identificación me parece demasiado optimista: las normas de Hobson son oracio-
nes del inglés o de otro idioma, de las que hay ejemplos por docenas en cualquier libro
de matemáticas; en cambio, las funciones proposicionales de Russell, que son aplica-
ciones del reino de los objetos en el reino de las proposiciones, son —como este últi-
mo— criaturas de su rica inventiva metafísica, cuya misma naturaleza cambia de uno
a otro de sus escritos. Más exacto sería decir, pues, que lo que Hobson llama ‘norma’
es lo que Russell intentaba “reconstruir racionalmente” mediante su concepto de fun-
ción proposicional.
2.4 La teoría de los tipos lógicos 182

tiene precisamente un elemento de cada elemento de F, aunque no hay nin-


guna norma que lo defina. Hobson parece haber pensado asímismo que las
paradojas de la teoría de conjuntos nacen de la ausencia o imperfecta espe-
cificación de una norma, pero, como Russell hace ver, la situación en este
caso es muy diferente:

La dificultad de los agregados inconsistentes surge de la presencia de una


norma perfectamente bien definida combinada con la ausencia demostrable
del agregado correspondiente. Esto sugiere que una norma es una condi-
ción necesaria pero no suficiente para la existencia de un agregado; de
ser así, la solución completa de [la dificultad de los agregados inconsis-
tentes] estribaría en descubrir las condiciones precisas que una norma debe
cumplir para definir un agregado.
(Russell EA, p. 136)

Russell señala que la palabra ‘agregado’ se usa a veces de un modo que


implica la existencia de un orden, y que él utilizará ‘clase’ (class) para refe-
rirse a un agregado sin tal implicación. Si toda norma lógicamente bien de-
terminada definiera una clase, entonces existiría la clase W formada por todos
los entes x que cumplen la norma ‘x = x’. Como todo ente cumple esa nor-
ma, no puede haber un cardinal mayor que |W|, el cardinal de la clase W.
Pero Cantor ha demostrado que, si W existe, |W| < |PW|. Por lo tanto, la
norma ‘x = x’ no determina una clase. Análogamente, si la norma ‘x no es
una clase que sea un miembro de sí misma’ definiera una clase w, tendría-
mos que w es un miembro de sí misma si y sólo si no lo es. Por lo tanto,
tampoco esta norma define una clase. De este modo, “aparte de toda opinión
sobre la naturaleza de los cardinales y sin hacer consideraciones perte-
necientes a la aritmética, podemos probar que hay al menos una norma
perfectamente determinada que no define una clase” (EA, p. 139). Russell
llama no-predicativas (non-predicative) a las normas (funciones propo-
sicionales) de una variable que no definen clases, y predicativas (predicative)
a aquéllas que sí las definen; análogamente, una función proposicional de
dos variables se llama predicativa si define una relación binaria, no-predicativa
si no la define, etc. “Necesitamos, pues, reglas para decidir cuáles normas
son predicativas y cuáles no lo son, a menos que adoptemos la opinión (que,
como veremos, es muy recomendable) de que ninguna norma es predicativa”
(p. 141).
2.4 La teoría de los tipos lógicos 183

Russell bosqueja tres soluciones posibles de este problema, que bautiza

ría sin clases (the no classes theory). La teoría del zigzag supone que si φx
(a) la teoría del zigzag, (b) la teoría de la limitación de tamaño y (c) la teo-

es una función predicativa, también su negación ~φx es predicativa.9 Sea


ψx una función no-predicativa. Entonces, no existe una clase {x: ψx}. Por lo
tanto, cualquiera que sea la función predicativa φx, el ámbito de verdad de
ψx zigzagueará entre la clase {x: φx} definida por ella y la clase {x: ~φx}
definida por su negación. Según Russell, esta es la teoría sugerida en
Principles of Mathematics, §§ 103 y 104 (EA, p. 146n.). Su desarrollo cabal
requiere axiomas que establezcan qué funciones son predicativas. Se parte
de la base que todas las funciones proposicionales simples son predicativas
y sólo algunas complicadas y extrañas no lo son. Pero, según Russell, cuan-
do intentó precisar esta idea básica tuvo que formular axiomas excesivamen-
te complicados y carentes de toda plausibilidad intrínseca. Además, para
seleccionarlos no tuvo otra guía que la necesidad de evitar contradicciones, la
cual “por sí sola, es un principio muy insuficiente, pues nos deja expuestos siem-
pre al riesgo de que nuevas inferencias generen contradicciones” (EA, p. 147).
Russell atribuye la teoría de la limitación de tamaño a su amigo el ma-
temático Philip Jourdain. Según ella una función proposicional define una
clase no cuando su fórmula es suficientemente sencilla, sino cuando efecti-
vamente deslinda una colección de objetos, y no implica —como las funcio-

será rebasado. Desde este punto de vista, obviamente, si φx es predicativa,


nes ‘x es un cardinal’ y ‘x es un ordinal’— que todo límite que se designe

~φx no puede serlo. Russell opina que “una gran dificultad de esta teoría

los ordinales. Pudiera ser que ya ω sea ilegítimo, en cuyo caso todas las
consiste en que no nos dice hasta dónde es legítimo avanzar en la serie de

clases propiamente tales (all proper classes) serían finitas” (EA, p. 153).10

9 Uso aquí la notación de Russell 1903. Russell 1906 designa una función proposicional

guida de un signo de admiración y una minúscula latina cursiva, vgr. φ!x. Pero en
cualquiera, predicativa o no, con una expresión formada por una minúscula griega se-

Principia Mathematica el signo de admiración a la derecha de una minúscula griega


distingue a cierto género de funciones (llamadas “predicativas”, pero en una nueva
acepción que explico en la nota 20). Para no turbar al lector con tantas notaciones
incompatibles, me abstengo de emplear la de Russell 1906.
10 Obsérvese que, como Russell equipara sus clases a lo que los matemáticos llaman con-
juntos, tiene que llamar clases propias a lo que los matemáticos —desde von
2.4 La teoría de los tipos lógicos 184

En 1906, todas las simpatías de Russell van a la teoría sin clases. El es-
crito que comentamos concluye con una nota suplementaria, fechada el 6 de
febrero de 1906, en la que dice que sus últimas investigaciones lo han per-
suadido de que la teoría sin clases proporciona “la completa solución” de las
dificultades suscitadas por las paradojas (EA, p. 164). Se refiere, sin duda, a
los resultados que presenta en su artículo “Sobre la teoría sustitucional de
las clases y las relaciones” (1906a), sometido a la London Mathematical
Society el 24 de abril de 1906, pero retirado antes de que saliera impreso,
porque dejó de satisfacerlo (se publicó póstumamente en 1973). El nombre
‘teoría sustitucional’ alude al método de sustitución de expresiones con que
propone eliminar —o hacer ontológicamente inocuos— los ingredientes del
lenguaje que aparentemente hacen referencia a las clases.11 Dicho método le
fue sugerido seguramente por su brillante análisis de las descripciones defi-
nidas (Russell 1905), que paso a explicar.
Afligido por la dificultad de asignar una denotación a expresiones tales
como ‘la esposa favorita del obispo de Roma’ o ‘el río de oro derretido que
desemboca en el Orinoco’, que describen algo que no existe, Russell optó
por concebirlas como abreviaturas que sirven para representar en contextos
de un cierto género a otras expresiones más largas, las cuales, a su vez, no
denotan nada. Concretamente, cuando se dice que

(1) El río de oro derretido que desemboca en el Orinoco es más cauda-


loso que el Guadalquivir

lo que se expresa, según Russell, es simplemente que

Neumann— llaman clases impropias (propias son precisamente las clases que no son
conjuntos). Recordemos de paso que —como se vio en la Sección 1.8.4— la teoría de
conjuntos de von Neumann da una respuesta precisa a la dificultad mencionada por
Russell: una clase es “demasiado grande” —y por lo tanto es propia en el sentido de
von Neumann, impropia en el sentido de Russell— si y sólo si es equinumerosa con la
clase de todos los conjuntos.
11 Como Russell abandona muy pronto la teoría de 1906a pero sigue simpatizando con la
idea de la eliminación de las clases, los expertos distinguen entre la ‘teoría sin clases’
y la ‘teoría sustitucional de las clases’. Pero, comparando textos, no hay duda de que
la ‘teoría sin clases’ bosquejada en Russell 1906 (EA, pp. 154-56) y aludida en la nota
suplementaria al final (EA, p. 164), no es otra que la teoría sustitucional explicada en
1906a.
2.4 La teoría de los tipos lógicos 185

(1*) Existe un objeto x tal que (i) x es un río de oro derretido que desem-
boca en el Orinoco, (ii) x es más caudaloso que el Guadalquivir y
(iii) si cualquier objeto y es un río de oro derretido que desemboca
en el Orinoco, entonces y es idéntico a x.

En (1*), la descripción del río de oro figura sólo como predicado, no como
frase nominal. La oración es falsa porque no hay nada que satisfaga ese
predicado, y no, como sugiere (1), porque el objeto denotado por la frase
nominal sea un río no más caudaloso que el Guadalquivir.
No es raro que Russell, después de eliminar con tanta soltura la denotación
de las descripciones definidas, se sintiera animado a hacer lo propio con los
nombres de clases. Se trata “de proveer un modo de interpretar las asevera-
ciones corrientes sobre clases sin suponer que las clases son entes” (1906c,
p. 200). Por esta vía, resultará que todas las proposiciones significativas en
que se mencionan clases pueden entenderse como proposiciones acerca de

ta función proposicional φx. Sólo las proposiciones que no se dejan entender


sus miembros, esto es, sobre algunos o todos los objetos que satisfacen cier-

así dan lugar a contradicciones. “Por lo tanto, es natural suponer que las clases
son meramente abreviaturas lingüísticas o simbólicas” (Ibid.). Russell reco-
noce que el procedimiento de eliminación propuesto por él es complicado,
un truco técnico que debe reemplazarse por otro más conveniente. Las si-
guientes indicaciones, basadas en su primera presentación sumaria de la teo-
ría (Russell 1906, en EA, pp. 154-56), darán una idea de lo que se trata.
Sea p una proposición y p(x/a) lo que se obtiene cuando x reemplaza a a
en todos los lugares en que a figura en p; p(x/a) nos da, para distintos valo-
res de x lo que solíamos llamar los distintos valores de una función propo-
sicional.12 Si b es un ente cualquiera que no es un ingrediente de p y q =
p(b/a), tenemos que la aseveración ‘q(x/b) es verdadera para todo valor de x’

12 Lo anterior traduce literalmente palabras de Russell. No pretendo que sean claras. Como
una proposición es un estado de cosas —real o posible— la letra a designa aquí un
ingrediente objetivo del mismo. La variable x, en cambio, no puede sino ser un objeto
lingüístico: un pronombre si está ligada, la indicación de un “hueco” (en el sentido de
Frege) si está libre ¿Cómo se puede reemplazar un ingrediente objetivo de un estado
de cosas con un “hueco”? ¿Cuál es el modo de ser del producto de tal procedimiento?
Incapaz de responder a estas preguntas, las tomo como un indicio más de la confusión
que, en diversas modalidades, acompañó a Russell durante casi toda su carrera filosó-
fica.
2.4 La teoría de los tipos lógicos 186

equivale a ‘p(x/a) es verdadera para todo valor de x’. Cabe, pues, decir que
la aseveración ‘p(x/a) es verdadera para todo valor de x’ no depende del sujeto
a, sino “sólo de la forma de p” (EA, p. 155). Russell propone que usemos
aseveraciones de este tipo en vez de mencionar funciones proposicionales o
clases determinadas por ellas.

sólo un x tal que φx es verdad’), tendremos ‘Hay un ente b tal que p(x/a)
Por ejemplo, en vez de ‘φ es una función unitaria’ (esto es, ‘Hay un y

es verdadera si y sólo si x es idéntico a b’. No existirá ya, pues, un ente


como el número 1, aislado; pero podremos definir lo que significamos al
decir ‘Una y sólo una proposición del tipo p(x/a) es verdadera (dados p y
a)’. En vez de decir ‘La clase u es una clase que tiene sólo un miembro’,
diremos […] ‘Hay un ente b tal que p(x/a) es verdadera si y sólo si x es
idéntico a b’. Aquí los valores de x para los cuales p(x/a) es verdadera
reemplazan a la clase u; pero no presuponemos que estos valores forman
colectivamente un ente único que es la clase compuesta de ellos.
(Russell EA, p. 155)13

Russell observa que no es difícil reemplazar la antigua escritura por la nue-


va, pero que la demostración de teoremas de existencia se ve entonces muy
entorpecida. En 1906 esperaba “elaborar esta teoría hasta el punto en que se
vea claramente cuánto preserva de las matemáticas y cuánto nos fuerza a
abandonar” (EA, p. 156). Como ‘clases’ y ‘conjuntos’ (‘agregados’) son para
Russell lo mismo, la negación de la existencia de tales entes imprime a su
filosofía de las matemáticas un rumbo muy distinto del que tomó por esos
mismos años la filosofía de los matemáticos. Como vimos en el Capítulo
1.7, Zermelo (1908a) postula la existencia de un mínimo de conjuntos que
le parecían imprescindibles para hacer matemáticas, y presume que su teoría
es inocente de contradicciones mientras no se la pruebe culpable.14 La co-

Como advertí en la nota 9, altero un poco la notación de Russell: él escribe φ!x donde
yo φx. También Lackey, el editor de EA, se ha tomado libertades con la notación ori-
13

ginal: Russell ponía el “numerador” sobre el “denominador” en la “fracción” x/a, con


lo cual podía prescindir de los paréntesis que Lackey y yo utilizamos para separarla de
la p. Curiosamente, después de reformar esta notación de Russell en el texto de 1906,
Lackey se ciñe fielmente a ella en el texto de 1906c (el original inglés de 1906b).
14 Subrayo que los axiomas de Zermelo no se eligen, como en la teoría russelliana del
zigzag, sólo con vistas a prevenir las contradicciones conocidas. Zermelo tiene un co-
metido —hacer matemáticas— y postula lo que necesita para eso. Su selección se ha
2.4 La teoría de los tipos lógicos 187

rriente central de la matemática conjuntista ha seguido su ejemplo con una


temeridad que aterra a los temperamentos metafísicos, ansiosos de cobijarse
en una verdad totalitaria e inquebrantable.
Whitehead y Russell declaran reiteradamente que el sistema de Principia
Mathematica es neutral con respecto a las clases: no presupone su existencia
ni su inexistencia (PM, I, 24, 187). Pero la escritura conceptual utilizada en
el libro no cuenta con los medios para nombrar tales objetos; una expresión
como ≈(φx)—que se lee “la clase de los objetos x que satisfacen la condi-
ción φ”— simula hacerlo, pero es un símbolo incompleto, definido siguien-
do un patrón análogo al arriba descrito (véase la definición contextual de
‘≈(φx)’ en la nota 35). Es verdad que en Principia Mathematica la elimina-
ción de las clases no lleva la voz cantante en la solución de las paradojas;15
pero opera tras bastidores. La solución se funda expresamente en el “princi-
pio del círculo vicioso”, que Russell (1906b, 1908) toma de Poincaré. Pero
dicho principio es insostenible si de veras hay clases (véase la nota 41 y el
texto que remite a ella).
Henri Poincaré, matemático profundo y agudo filósofo, no simpatizaba con
el “cantorismo” (como llamaba a la teoría de conjuntos) y menos aún con la
“logística” (esto es, la nueva lógica premunida de escritura conceptual y ávida
de anexarse las matemáticas). El fenómeno de las paradojas le parece una
señal clarísima de que cantoristas y logísticos andan perdidos. En el segun-
do de tres artículos sobre “Las matemáticas y la lógica” (1905/1906),16
Poincaré introduce el tema con marcado sarcasmo:

probado duradera. En cambio, Russell, que buscaba certificar —como si hiciera fal-
ta— las matemáticas hechas por otros, daba solamente con axiomas implausibles, ins-
pirados por un principio que él mismo juzgaba insuficiente (1906, en EA, p. 147, cita-
do arriba en la p. 183).
15 Esto puede deberse a que Whitehead no favorecía la eliminación de las clases. El 22
de febrero de 1906 —o sea, dos semanas después de la fecha de la nota suplementaria
en que Russell abraza sin reservas esa alternativa— Whitehead le escribió protestando
contra su teoría sustitucional, que “funda toda la matemática en un artificio tipográfico
(a typographical device) y de este modo contradice las doctrinas principales del tomo
I [= Russell 1903]” (citado por Lackey en Russell, EA, p. 131; cf. las otras citas y
comentarios de Lackey en las pp. 131-32).
16 Una versión revisada de estos ensayos forma los Capítulos III, IV y V del libro II de
Science et méthode (Poincaré 1908). A ella remiten mis referencias.
2.4 La teoría de los tipos lógicos 188

¿Pueden las matemáticas ser reducidas a la lógica sin recurrir a principios


que le sean propios? Existe una escuela llena de ardor y de fe que se
esfuerza por establecerlo. Tiene un lenguaje especial en el que las pala-
bras se sustituyen por signos. Este lenguaje no lo comprenden más que
algunos iniciados, de manera que los profanos están dispuestos a inclinar-
se ante las decisivas afirmaciones de los adeptos. No me parece inútil
examinar estas afirmaciones más de cerca a fin de ver si justifican el tono
perentorio con que se las presenta.
(Poincaré, CM, p. 111)17

Poincaré reúne bajo el nombre de antinomias18 cantorianas las paradojas


que hemos mencionado ya, en las que figura decisivamente la noción de
conjunto o la de clase, con otras que aún no hemos mencionado, en que estas
nociones no desempeñan ningún papel. Tiende un puente entre ambos gru-
pos la paradoja de Richard (1905), en la cual figura la noción de conjunto,
pero de modo inesencial. Hela aquí: sea E el conjunto de los números reales
del intervalo (0,1) que se pueden caracterizar en nuestro idioma mediante un

ƒ: ˆ Æ E una enumeración de E. Designemos con αhk al k-ésimo dígito de


número finito de palabras. E es evidentemente un conjunto numerable. Sea

la expansión decimal infinita de ƒ(h) ∈ E. Caracterizaré ahora un número


real β del intervalo (0,1) mediante la condición siguiente: Sea βn el n-ésimo
dígito de la expansión decimal infinita de β; entonces βn = 5 si αnn ≠ 5 y βn
= 6 si αnn = 5. Evidentemente, β ∉ E, puesto que, para cada n ∈ ˆ, β difie-

Más, por otra parte, es claro que β ∈ E, puesto que acabamos de caracterizarlo
re de ƒ(n) en el n-ésimo dígito de la respectiva expansión decimal infinita.

en castellano mediante un número finito de palabras. El argumento de Richard

17 Cf. también este otro pasaje, referente a la paradoja de Burali-Forti: “Mientras se trate
de demostrar que uno es un número, la pasigrafía basta; pero si se presenta una difi-
cultad, si hay una antinomia que resolver, la pasigrafía se torna impotente” (Poincaré,
CM, p. 123). ‘Pasigrafía’ —esto es, ‘escritura para todos’ (o ‘para todo’)— es el nom-
bre que daba Peano a su escritura conceptual.
18 ‘Antinomia’ —es decir, antilegalidad— llamó Kant al “conflicto de la razón pura con-
sigo misma” que estudia en su Crítica de la razón pura. Dicho conflicto se manifiesta,
según Kant, en la demostración de varios pares de aseveraciones contradictorias. Con-
forme a un precedente establecido por el propio Kant, la palabra ‘antinomia’ se usa
comúnmente para designar a cada uno de estos pares. Por ejemplo, la segunda antino-
mia kantiana consta de la tesis, “Todo cuerpo consta de partes indivisibles” y la antí-
tesis, “Todo cuerpo es indefinidamente divisible”.
2.4 La teoría de los tipos lógicos 189

apela, es cierto, a la noción de conjunto y se vale una vez más del método
diagonal de Cantor para generar una contradicción, pero se puede formular
una paradoja esencialmente análoga a ésta sin esos recursos. Poincaré (CM,
p. 144) cita la siguiente paradoja que atribuye Russell, pero que según éste
le fue sugerida por G. G. Berry (Russell LK, p. 60n.). Considérese el entero
positivo más pequeño que no se puede describir en castellano con menos de
diechiocho palabras. Como, obviamente, hay enteros positivos que sólo pue-

llamémosle α— que sea menor que todos los demás. Según esto, α no pue-
den describirse con 18 palabras o más, tiene que haber uno entre ellos —

de describirse con menos de 18 palabras. Sin embargo, la frase en cursiva lo


describe inequívocamente, y tiene sólo 17 palabras. Como se puede ver, la
contradicción no incide en una relación como la simbolizada con ‘∈’, que
podemos pensar que subsiste en virtud de la propia naturaleza de las cosas
relacionadas, sino en la relación obviamente convencional entre un término
y la expresión que lo define. Este giro lingüístico se advertía ya en la prime-
ra formulación de la paradoja de Russell en la carta que éste escribió a Frege
el 16 de junio de 1902: “Sea w el predicado ‘es un predicado que no puede
predicarse de sí mismo’ ¿Se puede acaso predicar w de sí mismo? De cada
respuesta se infiere lo contrario” (Frege, WB, p. 211; vide supra, p. 143,
nota 22).19
Según Poincaré, Richard (1905) ofrece la verdadera solución de las
“antinomias cantorianas”. Consideremos una vez más el conjunto E, men-

19 Al mismo género pertenece la siguiente paradoja publicada en Russell 1903, Apéndice


B, § 500: Sea m una clase de proposiciones; la proposición ‘todas las proposiciones de
la clase m son verdaderas’ puede o no pertenecer a la clase m; sea w la clase de todas
las proposiciones de la forma indicada que no pertenecen a la clase que mencionan y
sea p la proposición ‘todas las proposiciones de la clase w son verdaderas’; entonces p
pertenece a w si y sólo si no pertenece a w. Russell señala allí que esta paradoja no
puede resolverse con la teoría de los tipos (simple, no ramificada) propuesta en dicho
Apéndice B.
El giro lingüístico se consuma en la siguiente paradoja, descubierta por Kurt Grelling:
digamos que una palabra es autológica si tiene la propiedad que ella expresa o perte-
nece a la clase que ella nombra, heterológica en caso contrario. Por ejemplo, ‘breve’,
‘pentasílaba’, ‘esdrújula’ y ‘sustantivo’ son palabras autológicas, ‘larga’, ‘tetrasílaba’,
‘aguda’ y ‘adverbio’ son heterológicas. Ahora bien, la palabra ‘heterológica’ ¿es
heterológica o autológica? Evidentemente, si es heterológica es autológica y si es
autológica es heterológica (Grelling y Nelson 1908).
2.4 La teoría de los tipos lógicos 190

cionado en la presentación de la paradoja debida a este autor. E es el con-


junto de los números reales del intervalo (0,1) que se pueden caracterizar en
nuestro idioma mediante un número finito de palabras sin hacer referencia
al conjunto E. La cláusula en cursiva tiene que subentenderse en la defini-
ción de E pues de otro modo dicha definición contendría un círculo vicioso.

Pero entonces no hay duda que β ∉ E y que es falsa la conclusión antinómica


“No se puede definir E por el conjunto E mismo” (Poincaré, CM, p. 146).

β ∈ E. En efecto, aunque el número β se ha definido con un número finito


de palabras, esas palabras contienen una referencia a E. Según Poincaré, “la
misma explicación vale para las otras antinomias, como es fácil verificar”
(pp. 146ss.). De este modo, habríamos por fin hallado el criterio —que Russell
(1906) decía haber buscado en vano— para distinguir las definiciones (nor-
mas, funciones proposicionales) predicativas de las que no lo son: “Las de-
finiciones que deben ser consideradas como no predicativas son las que
contienen un círculo vicioso” (Poincaré, CM, p. 147). Aquí ‘predicativa’
designa —siguiendo a Russell (1906)— las definiciones que determinan una
clase. Sin embargo, el texto recién citado de Poincaré —en cursiva también
en el original— se entenderá más tarde como una definición de los términos
técnicos ‘predicativo’ y ‘no predicativo’ o ‘impredicativo’, como se suele
decir. Lo que en lógica y matemáticas se llama hoy impredicatividad —y
que algunos autores consideran como un abuso del lenguaje o al menos del
pensamiento— consiste en esa forma de circularidad que Poincaré reputó
viciosa y que Russell intentará caracterizar con más precisión.20

20 Véase el Capítulo 1.7, nota 4. Para mayor confusión, Russell (1908) emplea la palabra
‘predicativo’ en una tercera acepción. Como, en virtud de la teoría sin clases, no hay
funciones proposicionales predicativas en el sentido de Russell (1906), y en virtud de
la sintaxis adoptada, no es posible representar en la escritura conceptual una función
proposicional impredicativa en el sentido de Poincaré (1906), la palabra ha quedado
vacante y se la redefine entonces como sigue: Una función de orden n y una sola va-
riable es predicativa, si esa variable es de orden n – 1; una función de varias variables
es predicativa, si al reemplazar por constantes todas sus variables excepto una se ob-
tiene una función predicativa de la variable restante (Russell LK, p. 78). Más adelante
veremos qué es lo que aquí se llama el orden de una función o de una variable.
Whitehead y Russell 1910/13 reiteran esta definición (PM, I, 53), pero dan también
otra más sencilla que, en virtud de la sintaxis adoptada en ese libro, resulta ser equiva-
lente a la anterior: “Se dice que una función es predicativa cuando es una matriz”, esto
es, cuando “no envuelve variables ligadas (apparent variables)” (PM, I, 164, 163).
2.4 La teoría de los tipos lógicos 191

En “La lógica matemática basada en la teoría de los tipos” (1908), Russell


ofrece una solución detallada de las paradojas. Muchos pasajes de este artí-
culo se reproducen sin variación en Principia Mathematica y aunque es
posible señalar diferencias de doctrina entre ambas obras, aquí no les pres-
taremos atención.21 El artículo empieza con una lista de siete paradojas,
encabezada por la clásica paradoja del mentiroso, que no habíamos encon-
trado en la literatura comentada hasta aquí, pero que ilustra con especial
elocuencia la circularidad denunciada por Poincaré: si digo “estoy mintien-
do” lo que digo es falso si es verdad y es verdad si es falso.22 Según Russell,
cada una de las paradojas de su lista da por supuesta “una totalidad que, si
fuera legítima, instantáneamente se incrementaría con nuevos miembros de-
finidos en términos de ella misma” (LK, p. 63). Esta observación debe lle-
varnos, según él, a adoptar la regla siguente:

‘Lo que envuelve el todo de una colección (all of a collection) no puede


ser un miembro de esa colección’; o, recíprocamente: ‘Si, en caso que
cierta colección tuviera un total, tendría miembros definibles sólo en tér-
minos de ese total, dicha colección no tiene un total’.
(Russell LK, p. 63)

21 Rodríguez Consuegra 1989, pp. 153ss. estudia el significado de esas diferencias a la


luz de manuscritos inéditos que Russell redactó por esos años. Russell 1910 es una
exposición de la teoría de los tipos contemporánea de PM, destinada a rebatir las crí-
ticas de Poincaré a Russell 1908. Este artículo se publicó en francés; el original inglés
se hallará en Russell, EA, pp. 215-52.
22 Cf. Cicerón, Academica, II.95: “Si te mentiri dicis idque verum dicis, mentiris?” Atri-
buida por Diógenes Laercio (II.108) a Eubúlides de Mileto, un contemporáneo de
Aristóteles, la paradoja del mentiroso debe su difusión sobre todo a la epístola de San
Pablo a Tito (i.12; cf. Calímaco, H. 1.7), donde se alude a cierto “profeta”, quien ha-
bría dicho que “los cretenses son siempre mentirosos” (Kr∞tew ée‹ ceËstai), siendo
así que él mismo era cretense. En el artículo “Insolubilia” del Dictionary of Philosophy
and Psychology de Baldwin (1901-1905), C. S. Peirce presenta una versión de la para-
doja como paradigma de “una clase de sofismas en los cuales se plantea una cuestión
de tal índole que, ya sea que se responda afirmativa o negativamente a ella, un argu-
mento formalmente impecable demostrará que la respuesta es falsa” (CP, 2.618). Peirce
menciona dos métodos de solución propuestos en la Edad Media. Uno, adoptado por
Ockam, arguye que “ninguna proposición puede aseverar nada acerca de sí misma”.
En “Les paradoxes de la logique” (1906b), Russell cita el artículo de Peirce a propó-
sito justamente de este método de Ockam (EA, p. 196, nn. 2 y 3). Obsérvese que el
original inglés de “Les paradoxes de la logique” sigue a Peirce también en su título:
“On ‘Insolubilia’ and their Solution by Symbolic Logic” (1906c).
2.4 La teoría de los tipos lógicos 192

Principia Mathematica repite textualmente los dos enunciados de esta regla


y le da un nombre: “el principio del círculo vicioso” (PM, I, 37). Este prin-
cipio impone un orden jerárquico a las funciones proposicionales. Según
Whitehead y Russell, la característica esencial de una función es su ambi-

indeterminado de la función. Si los valores de la función son φa, φb, φc,…,


güedad. Cuando hablamos de ‘φx’ sin especificar x, nos referimos a un valor

podemos decir que ‘φx’ denota ambiguamente a φa, φb, φc,…

Por lo tanto, “φx” sólo tiene un significado bien definido (es decir, bien

φa, φb, φc, etc., están bien definidos. En otras palabras, una función no es
definido excepto en cuanto es de su esencia ser ambigua) si los objetos

una función bien definida a menos que todos sus valores ya estén bien
definidos. De esto se desprende que ninguna función puede tener entre
sus valores algo que presuponga la función, pues, si lo tuviera, no podría-
mos considerar que los objetos ambiguamente denotados por la función
están definidos mientras la función no estuviera definida, mientras que, a
la inversa, como acabamos de ver, la función no puede estar definida
mientras no lo estén sus valores. Este es un caso particular, pero tal vez
el más fundamental, del principio del círculo vicioso.
(Whitehead y Russell, PM, I, 39)

φa, φb, φc, etc. con el símbolo ‘φΩ’. A la luz del texto citado, es claro que
Imitando a Whitehead y Russell, designaré a la función cuyos valores son

φφΩ no puede ser un valor de esa función. Más aún, una expresión como
‘φφΩ’ simplemente no tiene sentido.23 Así, la paradoja russelliana del predi-
cado ‘…es un predicado que no es predicable de sí mismo’ no puede si-

predicado, su definición sería: ∀φ≈(ψφ≈ ↔ ~φφ≈). Pero la fórmula a la


quiera enunciarse. En efecto, si usamos la letra ‘ψ’ para simbolizar dicho

derecha del signo de equivalencia es inadmisible.


Russell (1908) resucita la terminología que ya le vimos utilizar en 1903:

φΩ —esto es, los objetos a, b, c,… tales que φa, φb, φc,… son valores de
los objetos que forman el ámbito de significación de una función proposicional

φΩ— constituyen un tipo de objeto al cual φΩ misma no pertenece. La fun-


ción φΩ, por su parte, forma con otras funciones un tipo diferente que es el
ámbito de significación de funciones proposicionales de un tercer tipo, y así

23

φΩ en φx no se escribe φφΩ, sino φ(φΩ), una inconsecuencia que prefiero no imitar.


Dicho sea de paso, en el libro de Whitehead y Russell el resultado de reemplazar x por
2.4 La teoría de los tipos lógicos 193

sucesivamente. Whitehead y Russell (PM, I, 47s.) aducen dos razones —nada

un elemento en común.24 Por lo tanto, si φa es un valor de la función φΩ y


concluyentes a mi modo de ver— para probar que tales tipos no pueden tener

ΨφΩ es un valor de una función Ψ¥, Ψa no puede ser un valor de Ψ¥ y la


expresión ‘Ψa’ no tiene sentido. Llamaré ‘individuos’ —como Whitehead y
Russell— a los objetos que no son funciones proposicionales ni proposicio-
nes.25 Según nuestros autores, todos los individuos forman un solo tipo, que

24 La primera razón propuesta es esta: Una función no puede servir de argumento a otra
cuyo ámbito de significación incluya objetos individuales, porque una función no es
un objeto definido sino “una mera ambigüedad a la espera de una determinación […],
y obviamente no la obtiene con sólo reemplazar a algo determinado en una proposi-
ción”. Por eso los nombres ‘Whitehead’ y ‘Poincaré’ pueden sustituir a la variable x en
la función proposicional ‘x es un matemático inglés’, generando, respectivamente, una
proposición verdadera y una falsa, pero si reemplazamos la x por el nombre de una
función proposicional como, por ejemplo, ‘z es una estrella de quinta magnitud’ el re-
sultado carece de sentido. Whitehead y Russell reconocen que el citado argumento no
se aplica a una función proposicional de una o más variables si todas estas están liga-

proposicional sino una proposición generalizada). Sirva ‘(x).Px ⊃ Kx’ para abreviar la
das (de modo que lo que tenemos entre manos no es propiamente una función

el sol’. Entonces, obviamente, la expresión ‘(x).Px ⊃ Kx es un matemático inglés’ ca-


proposición generalizada ‘Todo planeta describe una elipse en uno de cuyos focos está

rece de sentido, aunque las partes de que consta no adolecen de indefinición. “Necesi-
tamos, entonces, una nueva objeción, a saber, la siguiente: Una proposición no es un
ente singular, sino una relación entre varios; por lo tanto, una aseveración en que figu-
re una proposición como sujeto sólo será significativa si puede reducirse a una aseve-
ración sobre los términos que figuran en la proposición. […] Pero esto no es posible
en el caso de una aseveración tal como ‘p es un hombre’, donde p es una proposición.
Por eso ‘{(x).φx} es un hombre’ carece de sentido” (PM, I, 48; cursiva mía). El argu-
mento depende de la oración que he destacado en cursiva. No logro imaginarme qué
pudo inducir a los autores a pensar que esa oración es verdadera. El ejemplo siguiente
demuestra que no lo es: ‘El Teorema de Pitágoras se deduce de los axiomas de Hilbert
para la geometría euclidiana’. La relación de deducibilidad que aquí se afirma que
subsiste entre una cierta proposición y un determinado grupo de proposiciones no pue-
de aseverarse de los términos —puntos, rectas, etc.— que figuran en dichas proposi-
ciones, ni siquiera es equivalente a una relación que subsista entre esos términos.
25 PM, I, 51, 132. En la p. 162 los autores dicen: “Podemos explicar un individuo como
algo que existe por su propia cuenta; entonces, obviamente no es una proposición, puesto
que las proposiciones, según se explicó en el Capítulo II de la Introducción (p. 43),
son símbolos incompletos, que no tienen significado sino cuando de las usa [en un
contexto].” Pero en la p. 161 advierten que “en la práctica no es necesario saber qué
objetos pertenecen al tipo más bajo, ni si el tipo más bajo de variable que figura en un
2.4 La teoría de los tipos lógicos 194

llamaré ‘0’. Si φΩ es una función proposicional de una variable cuyo ámbito


de significación es el tipo t, digo que φΩ es del tipo (t). A la luz de lo dicho,
parecería que los tipos de las funciones de una variable —los atributos—
forman una jerarquía isomórfica a la serie de los números naturales: (0), ((0)),
(((0))),… En esta jerarquía, cada tipo sería el ámbito de significación de
las funciones del tipo siguiente. En cambio, las funciones proposicionales de

con tanta nitidez. Sea φΩ1…Ωn una función de n variables y φa1…an una
dos o más variables —las relaciones— no podrían en ningún caso ordenarse

proposición obtenida desambiguando esa función. Sean t1,…, tn los tipos

tados por los términos a1,…, an. El ámbito de significación de φΩ1…Ωn


—posiblemente diversos— a que pertenecen respectivamente los objetos deno-

sería entonces el producto cartesiano t1 × … × tn. Digamos entonces que


φΩ1…Ωn es una función del tipo (t1,…, tn). Por ejemplo, si ψab se lee
‘Pedro ama a Teresa’, ψΩ≈ es una relación binaria del tipo (0,0). Si φacd
dice que ‘Pedro antepone el patriotismo al amor’, tenemos que a es un ob-

y d es justamente la relación del tipo (0,0) que antes llamé ψΩ≈. Por lo tan-
jeto del tipo 0, c es un atributo de individuos, esto es, un objeto del tipo (0),

to, φ≈¥Ω es una función del tipo (0,(0),(0,0)). Como es concebible que haya,
por ejemplo, funciones del tipo

(((0),(0)),(0,0,(0,(0))),((((0))),0))

y de otros aún más endiablados, no podemos ordenarlas numéricamente de


un modo natural.
El sistema descrito en el párrafo anterior se llama —¡increíble pero cier-
to!— la teoría simple de los tipos. Como ya indiqué, ella disuelve sin dificul-
tad la paradoja de Russell (también las de Cantor y Burali-Forti). Pero, como
veremos enseguida, no es compatible con el principio del círculo vicioso,
por lo cual Whitehead y Russell, en la primera edición de Principia Mathe-

dado contexto es el de los individuos o es otro. Pues en la práctica sólo importan los
tipos relativos de las variables; así el tipo más bajo que figura en un dado contexto
puede llamarse ‘de los individuos’ por lo que hace a ese contexto. […] Lo esencial
es el modo cómo los otros tipos se generan a partir de individuos, como quiera que
esté constituido el tipo de los individuos.”
2.4 La teoría de los tipos lógicos 195

matica, adoptan la llamada teoría ramificada de los tipos. La cita siguiente


explica por qué no pueden aceptar la idea de que las funciones que compar-
ten un dado ámbito de significación formen entre todas un tipo:

Sea ƒ(φΩ,x) una función de las dos variables φΩ y x. Entonces si, mante-

posibles de φ, obtenemos una proposición:


niendo a x fija por el momento, aseveramos esto con todos los valores

(φ).ƒ(φΩ,x).

función envuelve una totalidad de valores de φΩ, no puede ser ella misma
Aquí, si x es una variable, tenemos una función de x; pero como esta

círculo vicioso. Se sigue que la totalidad de valores de φΩ a que concierne


uno de los valores incluidos en esa totalidad, en virtud del principio del

(φ).ƒ(φΩ,x) no es la totalidad de todas las funciones en que x puede figu-


rar como argumento, y que no existe una totalidad de todas las funciones
en que x puede figurar como argumento.
(Whitehead y Russell, PM, I, 48–49)26

Sea t un tipo cualquiera y F una colección de funciones cuyo ámbito de

‘a satisface todas las funciones φΩ de la colección F’ expresa una proposi-


significación es t. Si a es un objeto cualquiera del tipo t, entonces la oración

una fórmula representativa de una función proposicional que llamaré ψΩ. Pero
ción. Si en ella reemplazamos la constante a por la variable x obtenemos

entonces, aunque el ámbito de significación de ψΩ también es el mismo tipo


t, el principio del círculo vicioso no permite que ψΩ pertenezca a F, puesto
que ψΩ se refiere a la totalidad de F.27 No hay derecho a hablar de un tipo

26

parecido lícito alterarlo en esta cita textual. Nótese que la variable φΩ de la primera
Pido al lector disculpas por el simbolismo confuso e inconsecuente, pero no me ha

oración pasa a ser φ en la oración siguiente; luego, en la fórmula destacada, reviste


ambas formas, tocándole al lector adivinar que φΩ es la variable ligada por el
cuantificador universal (φ). (Cien páginas más adelante, en PM, I, 165, Whitehead y
Russell nos explican que adoptaron esta práctica “en aras de la brevedad”; aunque ella
responde también a un motivo menos inocente, como se verá en la nota 35). Tampoco
es justo, después que se ha dicho que x es una variable, hablar de “las funciones en
que x puede figurar como argumento”: un argumento de una función es en cada caso
un objeto determinado o, metonímicamente, un término constante que lo designe.
27 Si una función φ¥ pertenece a F si y sólo si ƒφ¥, la fórmula representativa de la fun-
ción que he llamado ψΩ debe escribirse (φ¥)(ƒφ¥ ⊃ φx) en la notación de PM.
2.4 La teoría de los tipos lógicos 196

(0) al que pertenecerían todas las funciones cuyo ámbito de significación es


el tipo 0 de los individuos. Cualquier totalidad de funciones de una variable
que admitan individuos como argumento tiene necesariamente que excluir
algunas funciones con ese ámbito de significación. En general, para satisfa-
cer el principio del círculo vicioso, las funciones que tienen un mismo ám-
bito de significación tienen que repartirse en diversos “órdenes”, ninguno de
los cuales incluye una función que se refiera a todo ese orden.28
Whitehead y Russell no dan una caracterización global precisa de su sis-
tema “ramificado”. En vez de intentarla por mi cuenta, me limitaré a resu-
mir las indicaciones que ellos juzgaron suficientes para darse a entender.29

28 La palabra ‘orden’ (order) se emplea de este modo en PM, *12. En el pasaje de la


Introducción arriba parafraseado, Whitehead y Russell escriben ‘tipo’ (type). Hablan de
lo que llaman ‘a-functions’, esto es, las funciones proposicionales cuyo ámbito de signi-
ficación comprende un dado objeto a. El texto original dice así: “What is necessary
therefore in order to avoid vicious-circle fallacies, is to divide our a-functions into ‘types,’
each one of which contains no functions which refer to the whole of that type” (PM, I,
50).
29 Como ellos mismos admiten en el prólogo de la 1ª edición, “la explicación de de la
jerarquía de los tipos en la Introducción difiere un poco de la dada en el *12 en el
cuerpo de la obra” (PM, p. vii). Sigo de preferencia esta última. Church (1976, 1984)
ofrece una reconstrucción rigurosa de la teoría ramificada de los tipos. Para que el lector
se haga una idea de lo que ello entraña, resumo en esta nota sus principales reglas de
sintaxis. La clasificación en órdenes y tipos —que Church llama r-tipos, para distin-
guirlos de los simples tipos de la teoría simple— se aplica en primer lugar a las varia-
bles, en segundo lugar a las constantes con que es lícito sustituirlas. Los r-tipos están
agrupados en lo que Church llama niveles (levels), cada uno de los cuales se conoce
por un número natural. Dichos niveles son acumulativos: el recorrido de una variable
de cierto r-tipo incluye los recorridos de todas las variables de nivel inferior al suyo.
El nivel 1 corresponde a las variables cuyo recorrido sólo contiene lo que Whitehead
y Russell llamaban funciones predicativas. La escritura conceptual adoptada compren-
de los símbolos lógicos de negación, disyunción y cuantificación universal, paréntesis,
una lista infinita de variables de cada r-tipo y listas finitas —posiblemente vacías— de

β1,…,βm son r-tipos (m ≥ 0), hay un r-tipo (β1,…,βm)/n integrado por variables pre-
constantes de distinto r-tipo. Hay un tipo i integrado por las variables individuales. Si

dicativas m-arias de nivel n (n ≥ 1). El r-tipo (α1,…,αm)/k es inferior al r-tipo


(β1,…,βm)/n si y sólo si k < n y αh = βh (1 ≤ h ≤ m). Si β1 =… = βm = i, en vez
de (i,…, i) escribimos m. El orden de una variable ξ se define recursivamente así: (i)
si ξ es del r-tipo i, el orden de ξ es 0; (ii) si ξ es del r-tipo (β1,…βm)/n y N es el
orden más alto que puede tener una variable de uno de los r-tipos β1,…βm, el orden
de ξ es N + n. Una fórmula está bien formada (i) si consta sólo de una variable
proposicional, esto es, una variable de alguno de los r-tipos 0/n; (ii) si consta de una
variable del r-tipo (β1,…,βm)/n (m > 0) seguida de m variables y la h-ésima variable
2.4 La teoría de los tipos lógicos 197

En aras de la fidelidad histórica, no me esforzaré en aclarar si las proposi-


ciones, funciones proposicionales, variables libres y ligadas, y otros entes
por el estilo, de que tendré que hablar, son expresiones lingüísticas u objetos
suprasensibles. La necesidad de ser completamente inequívoco en este res-
pecto, inculcada más tarde por Hilbert y sus discípulos, aparentemente no

función proposicional de n variables (n ≥ 1) que no contiene ninguna varia-


fue reconocida por Whitehead y Russell. Llamaré, con ellos, matriz a una

ble ligada. De una matriz φ≈1…≈n se derivan funciones que no son matri-

simbólicamente: ∀xkφ≈1…≈k-1xk≈k+1…≈n y ∃xkφ≈1…≈k-1 xk≈k+1…≈n (1


ces, por generalización universal o existencial sobre una de sus variables;

≤ k ≤ n).30 Según Whitehead y Russell, “toda función posible que no sea


una matriz se deriva de una matriz” por una o más generalizaciones (PM, I,
162).31 Definiremos recursivamente el orden de una variable, matriz, fun-

(1 ≤ h ≤ m) es del r-tipo βh; (iii) si se obtiene reemplazando variables por constantes


del mismo r-tipo en una fórmula bien formada como la descrita en (ii); (iv) si se cons-
truye a partir de fórmulas bien formadas por negación, disyunción o cuantificación.
Además de las reglas de inferencia habituales de un cálculo predicativo de orden ma-
yor que 1, Church adopta dos axiomas (esquemáticos) de comprensión:
(I) ∃p(p ↔ P), donde p es una variable del r-tipo 0/n que no figura como varia-
ble libre en P, todas las variables ligadas de P son de orden menor que n y nin-

(II) ∃f∀x1…∀xm(fx1…xm ↔ P), donde f es una variable predicativa del r-


guna constante ni variable libre de P es de orden mayor que n.

tipo (β1,…βm)/n, x1,…, xm son variables diferentes de los r-tipos β1,…βm,


respectivamente, que pueden figurar como variables libres en P, todas las varia-
bles ligadas de P son de orden menor que el orden de f y ninguna constante ni
variable libre de P es de orden mayor que el orden de f.
30

(xk).φ(≈1,…,≈k-1,xk,≈k+1…,≈n) en vez de ∀xkφ≈1 …≈k-1xk≈k+1…≈n y


Whitehead y Russell hubiesen escrito

(∃xk).φ(≈1,…,≈k-1,xk,≈k+1…,≈n) en vez de ∃xkφ≈1…≈k-1xk≈k+1…≈n.


31 Olvidan, aparentemente, que una función puede derivarse también de varias matrices,
combinando las dos formas de generalización con la negación y la disyunción. Tal olvido

riables que designan ambiguamente individuos), pues, si φ≈1…≈n es una función


resulta inofensivo en el caso de las matrices de primer orden (que sólo contienen va-

proposicional de n variables individuales formada a partir de varias matrices por cual-

proposicional “prenexa” Qz1…Qzpψz1…zp ≈1…≈n, lógicamente equivalente a


quier combinación de generalizaciones, negaciones y disyunciones, hay una función

φ≈1…≈n, y formada por generalizaciones sucesivas a partir de la matriz de primer


orden ψΩ1…Ωp≈1…≈n (véase el Apéndice XIII; la Q representa indistintamente un
signo de cuantificación existencial o universal).
2.4 La teoría de los tipos lógicos 198

guamente designados por ella son individuos, y que es de orden n (n ≥ 1) si


ción o proposición. Diré que una variable es de orden 0 si los objetos ambi-

tales objetos son funciones de n-ésimo orden.32 Una matriz se dice de pri-
mer orden si sólo contiene variables de orden 0. Una función se dice de
primer orden si es una matriz de primer orden o se deriva de una matriz de
primer orden por generalización. Si se ligan por generalización todas las
variables libres de una matriz de primer orden, se obtiene una proposición
de primer orden. Una matriz cuyas variables son todas de orden menor que
n > 1 y que contiene por lo menos una variable de orden n – 1 se dice de
n-ésimo orden. Una función se dice de n-ésimo orden si es una matriz de n-
ésimo orden o se deriva de una matriz de n-ésimo orden por generalización.
Si se ligan por generalización todas las variables libres de una matriz de n-
ésimo orden, se obtiene una proposición de n-ésimo orden. Evidentemente,
una función o proposición de n-ésimo orden sólo contendrá variables de orden
menor que n y por lo menos una variable de orden n – 1. Con exasperante
exuberancia terminológica, Whitehead y Russell, en vez de matriz, suelen
decir función predicativa (vide supra, p. 190, n. 20).† Para distinguir la re-
presentación simbólica de una función predicativa o matriz de la de otras

inicial, por ejemplo, así: φ!x, ψ!(x,y). Este método de representación se ex-
funciones insertan un signo de admiración después de la minúscula griega

tiende también a las proposiciones que se derivan de una matriz mediante la


sustitución de todas sus variables por constantes (llamadas proposiciones ele-
mentales si la matriz en cuestión es de primer orden).
La teoría ramificada de los tipos resuelve todas las paradojas que hemos
mencionado. A modo de ejemplo, cito dos de sus soluciones. Cuando el menti-
roso dice “estoy mintiendo”, o bien habla sin sentido —en cuyo caso no hay
paradoja—, o bien dice que una proposición p aseverada por él es falsa. Sea
p de orden n. Entonces, la proposición “estoy mintiendo”, que se refiere a p,
es de orden superior a n y por lo tanto no puede ser idéntica a p (Russell
LK, p. 79).33 Consideremos ahora la paradoja de Berry. Ella concierne a la
32 Whitehead y Russell no asignan órdenes a la variables en la explicación que estoy
parafraseando, pero en PM, I, 167 hablan, sin previo aviso, de una “variable ligada de
orden n”, en una acepción que no puede ser otra que la que defino en el texto.
33 Whitehead y Russell (PM, I, 38) se valen de un razonamiento análogo para disolver un
ridículo argumento contra el escepticismo que todavía suele escucharse. Conforme a
ese argumento, quien asevera que no sabe nada se contradice, pues reclama saber al
† LA CONFUSIÓN ES MÍA. RECTIFICO: Una función predicativa es una función
proposicional que no contiene variables ligadas de orden superior a sus variables
libres. Una matriz, en cambio, no contiene variables ligadas. [R.T.-2005]
2.4 La teoría de los tipos lógicos 199

función proposicional ‘x es el entero positivo más pequeño que no se puede

simbólica ‘Ψξ’ para decir que ξ es una función proposicional de una varia-
describir en castellano con menos de dieciocho palabras’. Usaré la expresión

ble expresable en castellano con menos de 18 palabras (además de la varia-

x ≤ y para decir que el entero x es menor o igual que el entero y. Conforme


ble x y la cópula ‘es’). Escribiré Nx para decir que x es un entero positivo y

al análisis de Russell (1905), la función involucrada en la paradoja de Berry


puede entonces simbolizarse así:

∃y(x = y ∧ Ny ∧ ∀φΩ((φy → ¬ ΨφΩ) ∧


∀w((Nw ∧ (φw → ¬ ΨφΩ)) → y ≤ w)))

La variable ligada φΩ tiene necesariamente un orden determinado n, inferior,


por cierto, al de la función en que figura. Por lo tanto, no es contradictorio
afirmar en castellano que un cierto número q satisface esta función, aunque
ello entrañe describir a q con menos palabras que las que se está diciendo
que hacen falta para eso. Aunque q no satisfaga ninguna función de orden n
expresable en castellano con menos de 18 palabras, bien puede satisfacer una
función de orden mayor que n expresable en castellano con sólo 17 pala-
bras.34
La victoria de Russell y Whitehead sobre las paradojas tiene un precio
que a muchos ha parecido excesivo. El inconveniente de la teoría de los ti-
pos que más salta a la vista es que ella multiplica los entes más allá de todo
lo que uno se hubiera nunca imaginado que podía ser necesario. Piénsese en
la relación de identidad. Normalmente pensaríamos que la función propo-
sicional ≈º=º¥ genera una proposición verdadera si sus dos variables se re-
emplazan por nombres o descripciones de una misma cosa, cualquiera que
sea, y genera una proposición falsa si se las reemplaza por nombres o des-

menos eso que asevera. Según la teoría de los tipos, la oración ‘no sé nada’ sólo puede
expresar que no hay ninguna proposición de orden menor que cierto entero positivo n
que diga algo que yo sé. Pero el orden de la proposición así expresada es, entonces,
por lo menos igual a n.
34 Las dos soluciones citadas y otras cinco más —correspondientes a las paradojas de
Burali-Forti y Richard y dos formas de la paradoja de Russell— aparecen en Whitehead
y Russell, PM, I, 62–64. Church 1976 da una formulación y solución rigurosas de la
paradoja de Grelling citada en la nota 19.
2.4 La teoría de los tipos lógicos 200

cripciones de dos cosas distintas, cualesquiera que sean. Pero según la teoría
de los tipos no puede haber una función proposicional cuyo ámbito de sig-
nificación sea la totalidad de las cosas (ni, mucho menos, el producto carte-
siano de dicha totalidad consigo misma). Tiene que haber por eso muchas
relaciones de identidad diferentes, una para cada tipo. El símbolo ‘=’, en que
veíamos un paradigma de la univocidad, se nos revela así como infinitamen-

Russell designan lo que llaman la clase nula, esto es, la clase ≈(x ≠ x) que
te ambiguo. No menos ambiguo es el símbolo ‘Λ’ con que Whitehead y

contiene a todo objeto x que no es idéntico a sí mismo (PM, I, 216).35 Aná-


loga ambigüedad afecta a los números cardinales. El cardinal de la clase K
—llámemosle |K|— es la clase de todas las clases similares a K, es decir, de
todas las clases X tales que hay una correspondencia biunívoca cuyo domi-
nio es X y cuyo codominio es K (Russell LK, p. 96). Pero, como explico en
la nota 35, una clase es sólo una manera de hablar de funciones propo-
sicionales de cierto tipo y en el caso de |K| dicho tipo depende del tipo de
los objetos de las clases X y K. Así, variando X, se obtienen infinitos signi-
ficados de ‘|K|’ y sólo excepcionalmente será correcto decir que |K| = |X|.36
La matemática puede sin duda arreglárselas con este resultado, sobre todo

35 Cuando se habla de clases a propósito de Principia Mathematica hay que entender esto
a la luz del *20 de ese libro, donde se expone una “Teoría General de las Clases” que

‘≈(φx)’ —léase: ‘la clase de los x tales que φx’— no tiene ningún significado por sí
“evita suponer que haya algo así como clases” (PM, I, 187). La expresión simbólica

misma, sino sólo en contexto: en el *20.01, se introduce la expresión ‘ƒ(≈(φx))’ como


abreviatura de
∃ψ(ƒ(ψ!Ω) ∧ ∀x(ψ!x ↔ φx))
En otras palabras, la frase ‘la clase de los x tales que φx tiene la propiedad ƒ’ consti-
tuye una manera cómoda de decir que existe una función predicativa ψ que tiene la
propiedad ƒ y es tal que, cualquiera que sea el objeto x (del tipo pertinente), x tiene ψ
si y sólo si x tiene φ. (El lector observará, de paso, que no fue sólo “en aras de la
brevedad” que Whitehead y Russell adoptaron la notación inconsecuente que comenté

simbolizada con ψ!Ω al lado izquierdo de la conjunción y con ψ! al lado derecho).


en la nota 26; en la fórmula recién citada, el cuantificador existencial liga la variable

36 Si se estipula que la función ≈º=º¥, aunque “ambigua en cuanto al tipo”, es en todos


los casos una función de dos variables del mismo tipo, resulta que ‘|K| = |X|’ por regla
general ni siquiera tiene sentido, ya que, aunque los objetos en K (por ejemplo, los
dedos de mi mano derecha) estén en correspondencia biunívoca con los objetos en X,
no tienen que ser del mismo tipo que éstos (que podrían ser, por ejemplo, las funcio-
nes proposicionales que se generan reemplazando la variable y por el número de gra-
2.4 La teoría de los tipos lógicos 201

si, siguiendo el ejemplo de Whitehead y Russell, utiliza sin remilgos un solo


símbolo para representar propiedades o relaciones análogas de distinto tipo.
Hay, con todo, cierta ironía en que la prosecución de su programa logicista
llevara a Russell a admitir que un símbolo como ‘7’ designa simultáneamen-
te infinitas clases diferentes. En efecto, Russell rechazó el estructuralismo
de Dedekind —para quien, como vimos en la Sección 2.3.2, cualquier siste-
ma simplemente infinito tiene derecho a llamarse ‘la serie numérica’— y
patrocinó en cambio, como Frege, la definición de los números en términos
puramente lógicos, porque “queremos números que sirvan para contar los
objetos comunes, y esto requiere que nuestros números tengan un significado
determinado (definite), y no meramente que posean ciertas propiedades for-
males” (Russell 1919, p. 10).
Mas la teoría de los tipos no sólo hace irrisoria una de las motivaciones
que animaron el logicismo, sino que contradice directamente la pretensión
de deducir todas las proposiciones de la matemática pura de un pequeño
número de principios lógicos fundamentales. Se recordará que para demos-
trar la existencia del siguiente de cada número finito Frege agregaba cada
número finito n a la clase de n miembros integrada por los predecesores de
n, con lo cual formaba una clase cuyo número era justamente el siguiente de
n (véase la demostración de [F2], pp. 172-74). Pero en virtud de la teoría de
los tipos, si n = |K|, donde K es la clase integrada por ciertos objetos a1,…,
an, n es un objeto de otro tipo que a1,…, an y no puede pertenecer junto
con ellos al ámbito de significación de una misma función proposicional.
Por lo tanto, los objetos a1,…, an y n no forman una clase K′ tal que |K′|
= (n + 1). Para salvar la aritmética bajo estas condiciones, hay que postular
que, si K es una clase finita de objetos de un tipo dado, existe siempre un

número de la clase K ∪ {a} será precisamente el siguiente de |K|. Tal pos-


objeto a de ese mismo tipo que no está contenido en la clase K; entonces el

tulado equivale al axioma que Whitehead y Russell llaman Infin ax —por

α es un “cardinal inductivo” (esto es, un número finito en el sentido de Frege),


‘Infinity axiom’— y adoptan formalmente (PM, *120.03). Éste dice que si

existe por lo menos una clase —del tipo en cuestión— que contiene precisa-

mos que pesa cada uno de los dedos de mi mano derecha en la expresión ‘x es un
número real mayor que y’).
2.4 La teoría de los tipos lógicos 202

mente α elementos.37 Whitehead y Russell no pretenden hacer pasar este


axioma por un principio lógico. Según ellos, Infin ax —al igual que su ver-
sión del Axioma de Selección, Mult ax (*88.03)— es “una hipótesis aritmé-
tica que algunos juzgarán evidente por sí misma, pero que preferimos man-
tener como hipótesis, aduciéndola como tal [esto es, como antecedente de
una implicación material—R.T.] cada vez que sea pertinente” (PM, II, 203).
Aparte de que destruye el sueño logicista que la inspiró en sus inicios, la
teoría de los tipos amenaza la posibilidad misma de la matemática en su forma
clásica. Como atinadamente señala Zermelo (1908, p. 524; citado en la p.
69), ésta abunda en conceptos definidos sin prestar ni la más mínima aten-
ción al alegado “principio del círculo vicioso”. Un caso ejemplar, aludido
por Zermelo y analizado por Weyl (1918, p. 23) y Ramsey (1931, p. 64), es
el concepto del supremo o cota superior mínima de un conjunto de números
reales, tan importante en la fundamentación clásica del análisis. La circu-
laridad inherente a su definición puede exhibirse fácilmente partiendo de la
caracterización abstracta del sistema de los reales como un cuerpo† arquimé-
dico completo presentada en el Glosario. Decimos que un número real σΚ es

37

que dice que si α es un cardinal inductivo, existe un objeto x tal que x ∈ α. Para
*120.03 designa con el nombre “Infin ax” a la aseveración ambigua en cuanto al tipo

mayor claridad, supongamos que α es un cardinal del tipo más bajo posible (lo que

Esto significa que x ∈ α si y sólo si x es una clase de individuos y α es la clase de


digo a continuación puede luego transferirse mutatis mutandis a los tipos superiores).

todas las clases similares a x (dos clases a y b son similares si son del mismo tipo y

*73.03). En particular, si llamamos, con Whitehead y Russell, ι‘a a la clase ¥(y = a)


hay una correspondencia biunívoca entre a y b; cf. PM, *73, especialmente *73.02 y

cuyo único miembro es el objeto a y Λ a la clase nula o vacía, tenemos que el cardinal
0 es la clase de todas las clases similares a Λ y el cardinal 1 es la clase de todas las
clases similares a ι‘x (donde x es un cierto individuo, que evidentemente puede ser
cualquiera sin afectar la identidad del objeto designado por ‘1’). Si α es un cardinal, α
+ 1 es la clase de todas las clases similares a z ∪ ι‘x, donde z ∈ α y x ∉ z, y por
ende también es un cardinal. Si β = α + 1, digo que β tiene con α la relación (+1)
(simbólicamente: β(+1)α). Digo que β tiene con α la relación (+1)* (simbólicamente:
β(+1)*α) si (i) β(+1)α ó (ii) hay un cardinal γ tal que β(+1)γ y γ(+1)*α. El cardinal α
es inductivo si y sólo si α(+1)* 0. Así pues la aseveración ambigua en cuanto al tipo
que bautizamos Inf ax, referida a objetos del tipo más bajo posible, dice que si α es

hay una clase no vacía de individuos cuyo cardinal es α. Obviamente, esto equivale a
cualquier cardinal obtenido por adiciones sucesivas de un individuo a la clase vacía

decir que existe una provisión inagotable de individuos para ir generando clases de
diferente numerosidad mediante adiciones sucesivas de un individuo a la clase vacía.
2.4 La teoría de los tipos lógicos 203

una cota superior del conjunto de reales K si σΚ es mayor o igual que todo
k ∈ K. El supremo de K, denotado por sup K, es la menor de las cotas su-
periores de K. En otras palabras, si ∅ ≠ K ⊂ Â, sup K es un número real tal
que (i) ∀x(x ∈ K ⊂ Â → x ≤ sup K) y (ii) ∀y(∀x(x ∈ K ⊂ Â → x ≤ y) →
sup K ≤ y). La cláusula (ii) de la definición de sup K envuelve, pues, una
referencia a la totalidad de los objetos y tales que ∀x(x ∈ K ⊂ Â → x ≤ y),
uno de los cuales se pretende que sea el propio sup K, conforme a la cláu-
sula (i). Con todo, la doctrina de Whitehead y Russell se apreciará mejor si
consideramos este ejemplo en el contexto de una de las interpretaciones clá-
sicas de los números reales como conjuntos de racionales. Siguiendo a

similar a la adoptada en Principia Mathematica. Sea 〈Œ,+,×,0,1〉 el cuerpo


Ramsey, utilizaré una reformulación de la interpretación de Dedekind (1872)

vacío r ⊂ Œ tal que, si ξ ∈ r y ζ ∈ Œ\r, entonces ξ < ζ. Si u y v son


de los racionales (de un tipo dado). Una sección de Œ es un conjunto no

secciones de Œ, diremos que u es mayor o igual que v si hay un ξ ∈ u


mayor o igual que todo η ∈ v. Sea  el conjunto de todas las secciones de
Œ. Se puede demostrar que la estructura 〈Â,ⴙ,ⴛ,0,1〉 es un cuerpo ar-

les— si se estipula que 0 = {ξ ∈ Œ: ξ ≤ 0}, que 1 = {ξ ∈ Œ: ξ ≤ 1}, y que,


quimédico completo —y, por ende, una interpretación legítima de los rea-

para todo u, v ∈ Â, u ⴙ v = {ξ + ζ: ξ ∈ u ∧ ζ ∈ v} y u ⴛ v = {ξ × ζ: ξ
∈ u ∧ ζ ∈ v}. Sea K ⊂ Â un conjunto no vacío tal que existe una cota

mento de K. En tal caso, la unión de K, UK = {ξ ∈ Œ: ∃x(ξ ∈ x ∧ x ∈ Â)},


superior de K, esto es, una sección de Œ mayor o igual que cualquier ele-

cada racional ζ contenido en un z ∈ K hay un racional ξ ∈ UK tal que ξ es


es una sección de Œ que satisface la doble condición siguiente: (C1) para

mayor o igual que ζ, y (C2) si x ∈ Â es una cota superior de K hay un


racional ξ ∈ x mayor o igual que cualquier elemento de UK. Esto implica

demostrado, al parecer, que si un conjunto no vacío K ⊂ Â tiene una cota


que UK es una cota superior de K menor que cualquier otra. Así pues hemos

superior, K tiene una cota superior mínima o supremo UK ∈ Â. Pero la ca-

por cuanto emplea la función proposicional ∃x(ξ ∈ x ∧ x ∈ Â) que hace


racterización de UK viola manifiestamente el principio del círculo vicioso,

referencia a la totalidad de Â. La teoría de los tipos (ramificada) salva esta


dificultad negando que las secciones de Œ formen una totalidad acabada. El
conjunto  que hemos tomado como base de nuestro cuerpo de los reales
puede comprender, sí, todas las secciones de Œ caracterizables mediante fun-
2.4 La teoría de los tipos lógicos 204

ne que ser en todo caso de otro orden, de modo que UK ∉ Â. Resulta, en-
ciones de cierto orden, pero la función empleada para caracterizar a UK tie-

tonces, que UK no forma sumas ni productos con los elementos de Â, ni


entra en el ámbito de verdad de ninguna función proposicional satisfecha
por esos elementos. Podremos siempre llamar a UK ‘el supremo de K’ y

tados de Â, en un cuerpo arquimédico completo diferente de 〈Â,ⴙ,ⴛ,0,1〉.


reunirlo con los supremos —así entendidos— de los otros subconjuntos aco-

Pero la existencia del supremo de cada conjunto acotado de reales no servirá


al propósito con el cual se la demuestra en la fundamentación clásica del
análisis.
Una corriente minoritaria pero tenaz de la matemática del siglo XX sos-
tiene que en vista de esto hay que descartar la fundamentación clásica del
análisis y procurarle otra diferente, constructivista (Weyl 1918, Lorenzen 1965,
Bishop 1967) o intuicionista (Brouwer 1907, 1930; Weyl 1921), aunque ello
entrañe renunciar a ciertos teoremas que nos habíamos habituado a reputar
verdaderos. Pero Whitehead y Russell no militan en esa corriente. Aunque
éste se preguntaba cuánto habría que sacrificar de la matemática clásica para
resolver las paradojas (Russell 1906, en EA, p. 156, citado arriba), cuando

pósito, adoptan el Axioma de Reducibilidad, en virtud del cual, si ψΩ es una


publican Principia Mathematica creen poder rescatarla entera. Con ese pro-

φ!Ω con el mismo ámbito de significación que ψΩ, tal que, para todo argu-
función proposicional de cualquier orden hay siempre una función predicativa

mento idóneo x, φ!x si y sólo si ψx.38 Aplicado al ejemplo que examinamos


en el párrafo anterior, esto significa que si una función proposicional de
cualquier orden circunscribe una clase de racionales, existe una función del
orden mínimo que tiene exactamente el mismo ámbito de verdad y por lo

38 Whitehead y Russell enuncian un Axioma de Reducibilidad para funciones de una


variable y otro para funciones de dos variables (*12.1, *12.11), y señalan que no enun-
ciarán otros porque esos dos son los únicos que utilizarán en su obra (PM, I, 167).
Ambos son, por cierto, esquemas ambiguos en cuanto al tipo. En la escritura concep-
tual de PM, el esquema correspondiente a una función proposicional de n variables se
enunciaría así:

∂:(∃ƒ):φ(x1,…, xn).∫x ,…, x .ƒ!(x1,…, xn)


1 n

(Las variables escritas como subíndices a la derecha del símbolo de equivalencia ‘∫’
deben leerse como cuantificadores universales, a la manera de Peano explicada en la p.
149 después de la fórmula 50.)
2.4 La teoría de los tipos lógicos 205

tanto circunscribe la misma clase. Así, aunque el supremo de un conjunto


acotado de elementos del cuerpo arquimédico completo  tenga que carac-
terizarse mediante una función proposicional que hace referencia a la totali-
dad de  y, por lo mismo, no puede aplicarse a elementos de  sin violar el
principio del círculo vicioso, esto no importa: el Axioma de Reducibilidad
nos asegura que si dicha función existe también hay otra que no hace refe-
rencia a la totalidad de  y expresa una condición satisfecha por los mismos
racionales que satisfacen la condición expresada por la primera, de modo
que ella también define la misma sección de Œ. El Axioma de Reducibilidad,
claro está, no nos dice cuál es la función predicativa equivalente a una fun-
ción no predicativa dada ni nos suministra un método para construirla. Más
que un principio lógico o matemático, el Axioma de Reducibilidad parece la
cruda expresión de un deseo. No es raro, entonces, que la seguridad que ofrece
haya inspirado en general poquísima confianza, a pesar del ingenio invertido
como ahora veremos en su defensa.
El siguiente argumento en pro del Axioma de Reducibilidad se publicó
primero con la sola firma de Russell (1908, § V), pero reaparece en el *12

objetos reales y que cada función proposicional φ≈ determina la clase {x:φx}


de Principia Mathematica. Supongamos por un momento que las clases son

a la que pertenece cada objeto que está en el ámbito de verdad de φ≈. El

supuesto indicado, si existe la función φ≈ existe también la función ψ!≈


Axioma de Reducibilidad se deduce entonces fácilmente, ya que, bajo el

definida por la condición (ψ!x ↔ x ∈ {x:φx}), la cual evidentemente es


predicativa. Pero, como sabemos, nuestro supuesto implica también la para-
doja de Russell y tiene que ser rechazado. En cambio, el Axioma de Redu-
cibilidad —hasta donde sabemos— no implica paradoja alguna.39 Sería, se-
gún eso, estrictamente más débil que dicho supuesto y, por ende, es un can-
didato excelente para sustituirlo una vez que éste se probó demasiado fuerte.
Como dicen nuestros autores:

Para que sea posible la matemática, es absolutamente necesario […] que


dispongamos de un método para hacer aseveraciones que habitualmente
serán equivalentes a lo que queremos decir cuando hablamos (inexacta-

39 Chwistek (1922) creyó haber derivado de él la paradoja de Richard, y Copi (1950) la


de Grelling, pero estaban equivocados. Véase Copi 1971, pp. 96s.
2.4 La teoría de los tipos lógicos 206

mente) de “todas las propiedades de x”. (Una “propiedad de x” puede


definirse como una función proposicional satisfecha por x.) Por lo tanto,
hay que hallar, en lo posible, un método para reducir el orden de una
función proposicional sin afectar la verdad o falsedad de sus valores. Pa-

ses. Dada una función proposicional ψx de cualquier orden, se supone que


rece que esto es lo que el sentido común efectúa aceptando que hay cla-

“x pertenece a la clase α”. Ahora bien, suponiendo que exista un ente tal
esto equivale, para todos los valores de x, a una aseveración de la forma

como la clase α, esta aseveración es de primer orden, puesto que no alu-

la aseveración original ψx reside en que es de primer orden. No hay nin-


de a ninguna función variable. De hecho, su única ventaja práctica sobre

guna ventaja en suponer que realmente hay clases, y la contradicción so-


bre las clases que no son miembros de sí mismas muestra que, si hay
clases, tienen que ser algo radicalmente diferente de los individuos. Pare-
cería que el solo propósito al que sirven las clases y una razón capital que
las hace lingüísticamente convenientes es que proveen un método para
reducir el orden de una función proposicional. Por lo tanto, no supondre-
mos nada de lo que parece entrañar la aceptación de las clases por el
sentido común, excepto esto: que toda función proposicional es equiva-
lente, para todos sus valores, a alguna función predicativa del mismo ar-
gumento o argumentos.
(Whitehead y Russell, PM, I, 166)40

40 Llama la atención la frase ‘toda función proposicional’ empleada en la última cláusula,


ya que la generalización se refiere obviamente a una totalidad ilegítima. En el enuncia-
do formal del Axioma de Reducibilidad en *12.1 no figura un cuantificador universal
cuya variable ligada recorra todas las funciones proposicionales que comparten un dado
ámbito de significación, pero cabe sostener que éste es un arreglo puramente cosméti-
co. Como señala Wittgenstein, en una carta a Russell escrita probablemente en el ve-
rano de 1913:
Tu axioma de reducibilidad es ∂:(∃ƒ):φx.∫x.ƒ!x. ¿No es esto un disparate (is this

mos convertir la φ en una variable ligada (apparent). Si no podemos hacerlo, nunca


not all nonsense)? Puesto que esta prop[osición] sólo tiene un significado si pode-

podrá deducirse ninguna ley general de tu axioma. El axioma mismo me parece


en este momento sólo un truco de prestidigitador (a mere juggling trick). Díme
por favor si encierra algo más. El axioma como lo habéis enunciado es sólo un
esquema y la verdadera Pp debiera ser ∂:.(φ):(∃ƒ):φx.∫x.ƒ!x y ¿para qué serviría
eso (what would be the use of that)?
(Wittgenstein 1974, p. 26)
2.4 La teoría de los tipos lógicos 207

Dicen en otro lugar que la razón para aceptar un axioma, “lo mismo que
otra proposición cualquiera” sólo puede ser “inductiva”, a saber, “que mu-
chas proposiciones que son casi indudables se deducen de él, que no se conoce
otra vía igualmente plausible por la cual esas proposiciones podrían ser ver-
daderas aunque el axioma fuera falso, y que de él no se puede deducir nada
que sea probablemente falso” (PM, I, p. 59). En el caso del Axioma de
Reducibilidad, las consecuencias que alegadamente lo hacen verosímil son,
ante todo, los teoremas del análisis. Cuando Whitehead y Russell publican
estas palabras en 1910, el cuestionamiento intuicionista del análisis clásico
—“la amenaza bolchevique de Brouwer y Weyl” contra las matemáticas
(Ramsey 1931, p. 56)— había recién comenzado y estaba confinada aún a la
tesis doctoral, en holandés, y otros trabajos juveniles de Brouwer (vide Apén-
dice XIX). Pero el mismo año 1908 en que Russell publicó el Axioma de
Reducibilidad, Zermelo había trazado otra vía “por la cual esas proposiciones
podrían ser verdaderas aunque el axioma fuera falso”, una que la gran ma-
yoría de los matemáticos considera mucho más transitable que la teoría
(ramificada) de los tipos combinada con el Axioma de Reducibilidad. Es
interesante comparar las dos alternativas. Zermelo viene de la escuela de
Cantor quien, como sabemos, nunca enseñó que cada predicado determinara
un conjunto (ni que cada conjunto fuera caracterizable por un predicado).
Desde este punto de vista, las paradojas no ocasionan una revolución del
pensamiento, pero hacen muy aconsejable proceder con cuidado en la carac-
terización de conjuntos mediante condiciones necesarias y suficientes. Los
axiomas de Zermelo (1908a), concebidos ante todo para hacer perspicua su
demostración del Teorema del Buen Orden, regulan tales caracterizaciones
en una forma que —una vez revisada por Skolem y Fraenkel (Secciones 1.8.2
y 1.8.3)— ha resultado generalmente adecuada a las necesidades de los
matemáticos. La estrategia de Zermelo consiste en admitir como existentes
sólo aquellos conjuntos que la experiencia matemática revela imprescindi-
bles. Sigue, pues, lo que puede llamarse una vía minimalista y, por ende,
genuinamente “inductiva”, en el sentido de Whitehead y Russell. Maximalista,
en cambio, es la seguida por éstos al adoptar el Axioma de Reducibilidad,
que postula la existencia de una función predicativa generalmente descono-
cida y probablemente inefable para cada función proposicional que con-
cibamos (y también para las que no concebimos). Tales entes son presumible-
mente más tenues que los conjuntos que postula Zermelo, pero existencia es
2.4 La teoría de los tipos lógicos 208

existencia y Whitehead y Russell tienen que acomodarlos de alguna manera


en su ontología. No se sabe cómo. En cambio, me parece claro que, a pesar
de la anunciada neutralidad con respecto a la existencia de clases, Principia
Mathematica las admite sólo como una manera de hablar (del modo descrito
en la nota 35). En efecto, si una clase —o un conjunto— existe de veras no
puede hacerle mella que la caractericemos impredicativamente. En tal caso,
pues, no puede justificarse la prohibición contenida en el principio del círcu-
lo vicioso.41
La Introducción a la segunda edición de Principia Mathematica (1927),
escrita por Russell, propone varios cambios que el lector debe subentender
en el cuerpo de la obra, reproducido de la primera edición con sólo peque-
ñas correcciones. Uno de los más importantes es la supresión del Axioma de
Reducibilidad. Para hacerla viable, se adopta la tesis de Wittgenstein de que
todas las funciones de proposiciones son funciones veritativas —analizables,
por ende, exhaustivamente en términos de disyunciones y negaciones (o de
la sola “función palote” introducida por Sheffer)42— y que una función sólo

41 Criticando el primer enunciado del principio del círculo vicioso —‘Lo que envuelve el
todo de una colección no puede ser un miembro de esa colección’— dice Gödel que
esto vale “sólo si las entidades en cuestión han sido construidas por nosotros”:
En este caso es claro que tiene que haber una definición (a saber, la descripción
de la construcción) que no se refiere a una totalidad a la que pertenece el objeto
definido, pues la construcción de una cosa ciertamente no puede basarse en una
totalidad de cosas a la que pertenezca la cosa misma que ha de ser construida. Sin
embargo, si se trata de objetos que existen independientemente de nuestras cons-
trucciones, entonces no hay nada absurdo en la existencia de totalidades que con-
tengan miembros que sólo puedan ser descritos (esto es, caracterizados
unívocamente) por referencia a esa totalidad.
(Gödel 1944, p. 136s.)
Conviene leer toda la crítica al principio del círculo vicioso en Gödel 1944, pp. 133–
37 (trad. castellana en Gödel, OC, pp. 322–26).
42 La función palote (stroke function) de Sheffer, llamada así porque se la representa me-
diante el signo |, es la función veritativa binaria definida por las condiciones (i) p|q es

mente ¬p si y sólo si p|p y p ∨ q si y sólo si (p|q)|(p|q), es claro que cualquier función


verdadera si p y q son ambas falsas, y (ii) de otro modo, p|q es falsa. Como evidente-

veritativa puede caracterizarse mediante combinaciones de palotes. Las proposiciones

generalización universal ∀xφx equivale a la conjunción φx1 ∧ φx2 ∧… (y la genera-


generales se reducen a funciones veritativas si entendemos, con Wittgenstein, que la

lización existencial ∃xφx a la disyunción φx1 ∨ φx2 ∨…), donde las xi recorren todo
2.4 La teoría de los tipos lógicos 209

puede figurar en una proposición a través de sus valores. Como consecuen-


cia de esto, si dos funciones proposicionales son satisfechas por exactamen-
te los mismos argumentos, ellas mismas satisfacen exactamente las mismas
funciones.43 La renuncia al Axioma de Reducibilidad invalida, por cierto,
algunas de las demostraciones del libro. La nueva sección *89 sobre la in-
ducción matemática (Apéndice B), está destinada a reconstruir las bases de
la teoría de los números naturales sin Axioma de Reducibilidad. Gödel anota
un error en la demostración del lema principal *89.16, y concluye por eso
que “la cuestión de si la teoría de los enteros puede obtenerse sobre la base
de la jerarquía ramificada debe considerarse como no resuelta hasta la fe-
cha” (1944, p. 146). En todo caso, aunque se reparara ese error, seguiría
pendiente la reconstrucción de la teoría de los números reales, que ni siquiera
se aborda en la segunda edición de Principia. Gödel considera además que
la práctica de admitir como argumentos de un predicado de funciones, a
funciones de orden más alto que el predicado mismo —que Russell defiende
en la nueva Introducción (PM, I, xl y xli) y ejerce profusamente en el Apén-
dice B— significa que “el principio del círculo vicioso para las funciones
proposicionales ha sido virtualmente descartado” (Gödel 1944, p. 134).
En la Introducción citada Russell agradece vivamente la colaboración de
Frank Ramsey (PM, I, xiii, nota), por lo cual pienso que es posible que la
vigorosa oposición del joven filósofo al Axioma de Reducibilidad haya con-
tribuido a la decisión de abandonarlo. Sorprende, empero, que Russell no
aluda a la clasificación de las paradojas que Ramsey publicó en 1925 y que
según él hace posible eliminar la ramificación de los tipos (y con ella el
motivo por el cual dicho Axioma se introdujo). Según Ramsey hay una clara
diferencia entre paradojas tales como las de Russell, Cantor y Burali-Forti
(que Russell ya tiene presentes en 1903), y las paradojas de Richard, Berry
y el mentiroso (que Russell unió a las otras desde su 1906a, probablemente
influido por Poincaré). Las paradojas del primer grupo “envuelven únicamente
términos lógicos o matemáticos como clase y número, e indican que tiene

el universo del discurso. Como señala Gödel (1944, p. 144), esta concepción sólo está
exenta de dificultades si el número de los individuos y de los predicados primitivos es
finito.
43

de funciones son extensionales, es decir, φx ∫x ψx.⊃.ƒ(φ≈) ∫ ƒ(ψ≈)” (PM, I, xxxix).


Russell resume esta conclusión así: “Según nuestra presente teoría todas las funciones
2.4 La teoría de los tipos lógicos 210

que haber una falla en nuestra lógica o en nuestra matemática”; pero las del
segundo grupo —al cual también pertenece la paradoja de Grelling citada en
la nota 19— “no pueden formularse empleando sólo términos lógicos, pues-
to que todas contienen alguna referencia al pensamiento, el lenguaje o el
simbolismo, que no son términos formales, sino empíricos” (Ramsey 1931,
p. 20). Para resolver las paradojas del primer grupo basta la jerarquía simple
de los tipos. La jerarquía ramificada se necesita en Principia Mathematica
sólo para evitar las del segundo grupo, pero Ramsey muestra que este méto-
do de solución no es imprescindible. La clasificación de Ramsey ha sido
generalmente aceptada, y es corriente llamar paradojas sintácticas a las del
primer grupo y paradojas semánticas a las del segundo. Explicaré esta no-
menclatura en el Capítulo 3.1, cuando hable de la solución de las paradojas
semánticas propuesta por Tarski.44

44 El distingo entre los dos grupos de paradojas está implícito ya en la observación que
hizo Peano (1906) a propósito de la paradoja de Richard: ella no pertenece a la mate-
mática sino a la lingüística.
2.5 ARITMÉTICA FINITISTA

En los próximos capítulos examinaré varias contribuciones a la ejecución del


programa de Hilbert, publicadas antes de que Kurt Gödel pusiera en eviden-
cia la imposibilidad de llevarlo a cabo conforme a su concepción inicial
(Gödel 1930a, 1931; cf. Capítulo 2.1, ad finem). Pero antes de abordarlas,
me referiré al trabajo de Thoralf Skolem, “La fundamentación de la aritmé-
tica mediante el modo recursivo de pensar” (1923). Aunque fue concebido
al margen de la escuela de Hilbert, será reconocido por ésta como un para-
digma de la matemática finita, de los conceptos y procedimientos sustantivos
a utilizarse en la vindicación del sistema formal de la matemática clásica del
infinito.1 En su Observación Final, Skolem explica que redactó el trabajo en
1919, después de estudiar Principia Mathematica (Skolem, SWL, p. 187).
Durante ese estudio se le ocurrió que una buena parte de las matemáticas se
podía fundamentar sin valerse de generalizaciones universales o existenciales
con un campo de aplicación ilimitado. Como las paradojas de la lógica y la
teoría de conjuntos obviamente suponen dicha forma de generalización, al
evitársela se elude también el complicado aparato adoptado por Whitehead y
Russell para prevenirlas. Skolem llama la atención sobre la idea de “aseve-
ración funcional” (Funktionalbehauptung), que atribuye a Whitehead y Russell
y caracteriza así: “Una aseveración funcional consistirá en afirmar una pro-
posición (Aussage) como válida en un caso que se deja indeterminado”
(Skolem, SWL, p. 153).2 Con su trabajo se propone mostrar lo siguiente: “Si

1 Sobre el distingo entre matemática sustantiva y formal, véanse las citas de Hilbert y
von Neumann en las pp. 123 y 124, notas 13 y 14.
2 A continuación traduzco el pasaje de Principia Mathematica de donde Skolem toma
esta idea:
Cuando aseveramos algo que contiene una variable libre (a real variable), en ri-
gor no cabe decir que estemos aseverando una proposición, pues sólo obtenemos
una proposición determinada al asignar un valor a la variable, y entonces nuestra
aseveración sólo se aplica a un caso determinado y no tiene de ningún modo la
misma fuerza que antes. Cuando lo que aseveramos contiene una variable libre

211
2.5 Aritmética finitista 212

concebimos las aseveraciones universales de la aritmética como aseveracio-


nes funcionales y nos basamos en el modo recursivo de pensar, dicha cien-
cia se puede fundamentar consecuentemente sin aplicar los conceptos ‘always’
y ‘sometimes’ empleados por Russell y Whitehead” (p. 153, cursiva de
Skolem). El “modo recursivo de pensar” (rekurrierende Denkweise) consiste
en valerse libremente de la inducción matemática para la definición de con-

aseveración funcional, este modo de pensar no deja lugar a dudas. Sea ϕ(x)
ceptos y la demostración de teoremas. Combinado con la susodicha idea de

propiedad ϕ. Sea σn el siguiente del número n. Si podemos establecer la


la aseveración funcional que dice que un número indeterminado x tiene la

proposición ϕ(1) y la aseveración funcional ϕ(x) → ϕ(σx), podemos eviden-


temente concluir que ϕ(x). En efecto, como quiera que se fije el número x,
la conclusión se obtiene mediante una serie finita de aplicaciones de la regla
modus ponens. Análogamente, para definir una función ƒ con argumentos y
valores numéricos basta estipular cuál es el número ƒ(1) y cómo se calcula
ƒ(σx) dado ƒ(x). Entonces podremos determinar el valor de ƒ correspondien-
te a un número determinado cualquiera mediante una serie finita de aplica-
ciones de dicho procedimiento de cálculo. Así pues, como Skolem proclama
con orgullo, su reconstrucción de la aritmética es “consecuentemente finitista”
y se basa en “el principio de Kronecker según el cual una determinación
matemática sólo es una determinación efectiva si lleva a la meta al cabo de
un número finito de intentos (Versuche)” (SWL, p. 188).
La teoría creada por Skolem (1923) se conoce como aritmética primitivo-
recursiva y tiene ciertas limitaciones. Como señala van Heijenoort (1967, p.
302), en ella se puede decir y probar que existen infinitos números primos,

estamos aseverando una proposición completamente indeterminada, de entre todas


las que resultan al darle diversos valores a la variable. Es conveniente decir que
tales aseveraciones aseveran una función proposicional. Las fórmulas matemáti-
cas corrientes contienen tales aseveraciones; por ejemplo, ‘sen2x + cos2x = 1’ no
asevera este o aquel caso particular de la fórmula, ni asevera que la fórmula vale
para todos los valores posibles de x, aunque equivale a esta última aseveración;
simplemente asevera que la fórmula vale, dejando x completamente indetermina-
do; y puede hacerlo legítimamente porque, como quiera que se determine x, resul-
tará una proposición verdadera.
(Whitehead y Russell, PM, I, p. 18)
2.5 Aritmética finitista 213

que x < z ≤ x! + 1; pero no sabríamos expresar que existen infinitos pares de


esto es, que existe, para cada número primo dado x, un número primo z tal

primos gemelos —esto es, de la forma 〈x, x+2〉— mediante una fórmula que
no contenga variables ligadas de recorrido ilimitado.
El trabajo de Skolem es a la vez largo y conciso y no puedo resumirlo
aquí. Pero dado el carácter paradigmático que tiene para Hilbert y los suyos,
es importante que el lector se forme una idea clara de sus métodos, que ilus-
traré con varios ejemplos. Antes de entrar en materia, Skolem hace algunas
advertencias que conviene repetir. Ante todo, nos dice que concibe todas las
funciones como “propiamente descriptivas”. Las funciones proposicionales
se distinguen sólo porque no admiten más valores que verdadero y falso.
Específicamente concibe tales funciones descriptivas “como nombres propios

ción de una o más variables”. Según esto, σn se concibe como el nombre


funcionales, es decir, nombres propios cuya denotación depende de la elec-

propio de un número, pero de tal suerte que el número así designado varía
según como se elija el número n.3 Advierte además que el signo de igualdad
(=) entre dos expresiones indica siempre que ambas designan lo mismo; por
lo tanto, cuando figura entre dos funciones proposicionales expresa —como
en Frege— la equivalencia de éstas. Por último, anuncia que dará por su-
puestos los conceptos de número natural y de el siguiente de un número, así
como el modo recursivo de pensar.

binaria definida recursivamente así: [i+] x + 1 = σx; [ii+] x + σy = σ(x + y).


El § 1 de Skolem 1923 trata de la adición. La presenta como una función

Como Skolem —a diferencia de Peano— no menciona el número 1 entre


los conceptos que da por supuestos, debemos entender que la estipulación
[i+] sirve en parte para caracterizarlo como el único número cuya suma con
un número cualquiera x es el siguiente de x. (La existencia de tal número
único estaría entonces implícita en la definición de la adición y sería un

‘x + 1’ por ‘el siguiente de x’ (en vez de σx, una notación que Skolem no
requisito de su viabilidad). La estipulación [i+] autoriza a Skolem a escribir

3 Skolem comenta brevemente la teoría de las descripciones de Russell, según la cual


una expresión como ‘el autor de Waverley’ es un símbolo incompleto que nada signi-
fica por sí solo. Dice que no le parece incuestionable y que, en todo caso, aunque fuese
correcta aplicada a las descripciones del lenguaje cotidiano, no hay por qué concebir
de este modo a las funciones descriptivas de la aritmética (SWL, p. 154).
2.5 Aritmética finitista 214

utiliza). Así, la estipulación [ii+] aparece escrita de este modo: x + (y + 1) =


(x + y) + 1. Como los conceptos de número natural y siguiente de un núme-
ro se han dado por supuestos, la estipulación [i+] determina el valor de la
suma de cualquier número x y el número fijo 1. Por su parte, la estipulación
[ii+] nos enseña a calcular en un número finito de pasos la suma de x y otro
número cualquiera y, a partir del valor de x + 1 establecido por [i+]. Skolem
demuestra luego que la adición es asociativa, esto es, que, cualesquiera que
sean los números a, b y c, a + (b + c) = (a + b) + c. La argumentación se
presenta con todo detalle como ejemplo típico de una prueba por inducción.
La estipulación [ii+] relativa a la adición significa que esta ecuación es váli-
da si c = 1, cualesquiera que sean los números a y b. Supongamos, enton-
ces, que, cualesquiera que sean a y b, ella vale para un número fijo c. De
este supuesto se deduce fácilmente que la ecuación vale también si reempla-
zamos c por el siguiente de c. En efecto, a + (b + (c + 1)) = a + ((b + c) +
1), según la estipulación [ii+]. Pero a + ((b + c) + 1) = (a + (b + c)) + 1, por
la misma estipulación [ii+]. Con arreglo a nuestro supuesto, (a + (b + c)) +
1 = ((a + b) + c) + 1. Pero ((a + b) + c) + 1 = (a + b) + (c + 1), según la
estipulación [ii+]. Hilvanando estas ecuaciones, tenemos pues que a + (b +
(c + 1)) = (a + b) + (c + 1), Q.E.D. El lector que haya visto el Apéndice XI
reconocerá aquí la demostración de Dedekind. Lo mismo cabe decir del teo-
rema de conmutatividad de la adición que Skolem demuestra enseguida.

mediante dos estipulaciones: [i<] ¬(a < 1);4 y [ii<] (a < b + 1) ↔ ((a < b)
Luego Skolem define la relación ‘a < b’ (‘a es menor que b’), también

∨ (a = b)). Combinadas con la definición de suma, estas estipulaciones im-


plican que 1 no es el siguiente de ningún número. En efecto, supongamos
que n es un número tal que 1 es el siguiente de n. Entonces, en virtud de

trar la tricotomía: cualesquiera que sean los números a y b, (a < b) ∨ (a =


[ii<], n < n + 1 = 1; pero esto contradice la estipulación [i<]. Es fácil demos-

b) ∨ (b < a). En vez de (a < b) ∨ (a = b), escribiremos (a ≤ b). Omito la


definición de la multiplicación y la prueba de que es asociativa, conmutativa
y distributiva porque —como en el caso de la adición— son prácticamente
iguales a las de Dedekind (Apéndice XI).
Para definir la relación ‘a es divisible por b’ —simbolizada D(a,b)—

4 Uso el simbolismo de nuestro cálculo predicativo (Apéndice IX), en vez de los símbo-
los lógicos tomados de Schröder que Skolem emplea.
2.5 Aritmética finitista 215

nio acotado. Si ϕ(x) es una aseveración funcional cualquiera y n es un nú-


Skolem introduce el importante concepto de cuantificación sobre un domi-

mero determinado, en vez de la conjunción ϕ(1) ∧ ϕ(2) ∧ … ∧ ϕ(n) escri-


bimos (∀x≤n)ϕ(x) —léase: ‘para todo x menor o igual que n, ϕ(x)’— y en
vez de la disyunción ϕ(1) ∨ ϕ(2) ∨ … ∨ ϕ(n) escribimos (∃x≤n)ϕ(x) —
léase: ‘hay un x menor o igual que n, tal que ϕ(x)’. Los cuantificadores
‘(∀x≤n)’ y ‘(∃x≤n)’ ligan variables de recorrido finito y las fórmulas que
los contienen pueden siempre reemplazarse por la correspondiente conjun-
ción o disyunción. Su uso no infringe, pues, la decisión inicial de no em-
plear ‘siempre’ (always) o ‘a veces’ (sometimes) a la manera de Whitehead
y Russell. La divisibilidad puede ahora definirse sencillamente así:

D(a,b) ↔ (∃x≤a)(a = bx)

A continuación se abordan la subtracción y la división. A propósito de


ellas, Skolem introduce la idea de función parcial: si ƒ es una función de
este tipo, ƒx designa un cierto número sólo si x es uno de los números perte-
necientes a un dominio acotado expresamente. Atendamos a sus explicaciones.

↔ (z = x + y). Según esto, obviamente, la diferencia z - y no existe si z ≤


La subtracción se define habitualmente mediante la estipulación (z - y = x)

y, puesto que en tal caso es imposible que z = x + y. Pero puede demostrarse


que hay un número igual a z - y cuando quiera que y < z. Tradicionalmente,
este aserto se habria enunciado así:

¬(y < z) ∨ ∃x(x + y = z)

Pero esta fórmula con variables ligadas de recorrido ilimitado se puede aho-
ra reemplazar con esta otra

¬(y < z) ∨ (∃x≤z)(x + y = z)

que Skolem demuestra. La división es objeto de un tratamiento análogo.


El trabajo culmina en los §§ 6 y 7, donde Skolem, sin recurrir a otros
medios que los que ha declarado admisibles, define los conceptos de máxi-
mo común divisor, mínimo común múltiplo y número primo, y demuestra
que si 1 < x, el número x se puede siempre representar de una y sólo una
2.5 Aritmética finitista 216

manera como producto de números primos.5 En estos dos parágrafos, Skolem


a veces define un predicado U(x), para cualquier número x, estipulando las
condiciones necesarias y suficientes para que [i] U(1) y [ii] U(x) dado que
(∀z<x)U(z). Este procedimiento es característico de la llamada definición por
inducción transfinita (Apéndice VIII), pero Skolem explica que si x es un
número natural, tenemos que habérnoslas sólo con una variante de la defini-

proposicional U(z) ∧ (z ≤ x) para cualquier par de números 〈x,z〉 se conoce


ción recursiva ordinaria. Tenemos, en efecto, que el valor de la función

verdadero o falso para un cierto z ≤ x si se conoce el valor de U(z) ∧ (z ≤


si se conoce el valor de U(z) para z, y que, por otra parte, se sabe si U(z) es

x) para ese z y ese x. Por lo tanto, para definir U(x) bastará definir U(z) ∧ (z
≤ x). El valor de U(z) ∧ (z ≤ x) puede definirse por inducción ordinaria.
Estipulamos primero el valor de U(1). Esto nos da el valor de U(z) ∧ (z ≤ 1)
para cualquier z, ya que, si z ≠ 1, U(z) ∧ (z ≤ 1) es falso. Luego suponemos
establecido el valor de U(z) ∧ (z ≤ n) para cualquier número z, y estipula-
mos sobre esa base el valor de U(z) ∧ (z ≤ n + 1) para cualquier z. Ahora
bien, si n + 1 < z, entonces ¬(z ≤ n + 1), de modo que U(z) ∧ (z ≤ n + 1)
es falso; si z < n + 1, entonces z ≤ n y el valor de U(z) ∧ (z ≤ n) está ya
determinado por hipótesis; por lo tanto, sólo hace falta estipular el valor de
U(z) para el caso en que z = n + 1. En otras palabras, “determinar del valor

vale a determinar el valor de la función proposicional U(x) ∧ (z ≤ x) para x


de U(x+1) si esta función se supone conocida para cualquier z < x + 1 equi-

= n + 1 y un número cualquiera z si ya se lo conoce para x = n y un número


cualquiera z” (SWL, p. 172; he modificado algo la notación de Skolem).

ción transfinita: De las premisas [α] U(1) y [β] (∀z<x)U(z) → U(x), inferir
Skolem también recurre a veces al modo de razonar propio de la induc-

[γ] U(x). Su utilización en el presente contexto está perfectamente justifica-

5 Skolem define la función binaria aŸb mediante la triple condición (a = b → aŸb = a)


∧ (b < a → aŸb = (a – b)Ÿb) ∧ (a < b → aŸb = aŸ(b – a)) y muestra luego que
aŸb es precisamente el máximo común divisor de a y b. Asímismo, define la función
a⁄b mediante la condición a⁄b = ab/(aŸb) y muestra que a⁄b es el mínimo común

primo’— Skolem define una función proposicional binaria que designaré Π(x,y) (Skolem
múltiplo de a y b. Para definir la función proposicional P(x) —léase ‘x es un número

pulación siguiente: [i] Π(x,1); [ii] Π(x,y + 1) ↔ (Π(x,y) ∧ (x = y + 1 ∨ ¬D(x,y + 1))).


utiliza también para ésta la misma letra P). Ésta queda caracterizada por la doble esti-

Entonces, P(x) ↔ (Π(x,y) ∧ (x ≠ 1))


2.5 Aritmética finitista 217

da, por cuanto la premisa [β] implica siempre una aseveración que, combi-
nada con [α], lleva a la conclusión [γ] por inducción matemática ordinaria.

vale a la aseveración de que para ese x y cualquier z, (z < x) → U(z). Por lo


En efecto, si x es un cierto número, la aseveración de que (∀z<x)U(z) equi-

tanto, la premisa [β] (∀z<x)U(z) → U(x) equivale a ((z < x) → U(z)) →


U(x). Como U(x) → ((z = x) → U(z)), es claro que [β] implica que ((z < x)
→ U(z)) → ((z = x) → U(z)), lo cual equivale a ((z < x) → U(z)) → (((z <
x) → U(z)) ∧ ((z = x) → U(z))). Pero ((z < x) → U(z)) ∧ ((z = x) → U(z))
equivale a ((z < x) ∨ (z = x)) → U(z), y por consiguiente a ((z < x + 1) →
U(z)). Por lo tanto, [β] implica que ((z < x) → U(z)) → ((z < x + 1) →
U(z)). Ahora bien, de U(1) y ((z < x) → U(z)) → ((z < x + 1) → U(z)) se
infiere por inducción ordinaria que (z < x) → U(z) para cualquier número x.
Reemplazando en este último aserto x por x + 1 y z por x, obtenemos la
conclusión U(x) por modus ponens.
Me referiré por último a un teorema intuitivamente obvio que podemos
enunciar así: Si un cierto número tiene la propiedad U, hay un número que
tiene la propiedad U y que es menor que cualquier otro que la tenga. Las
generalizaciones —una existencial y universal la otra— incluidas en la
apódosis de este enunciado se pueden expresar sin pérdida de información
mediante cuantificadores de dominio acotado. Para abreviar designo con
µxU(x) al número más pequeño que tiene la propiedad U (Skolem emplea
para ello la expresión ‘Min(U,x)’). Es claro que si hay un cierto número n
tal que U(n), entonces µxU(x) —si existe— será igual o menor que n. Ade-

que U(z) bastará decir que µxU(x) es igual a cualquier z ≤ µxU(x) tal que
más, para informar que µxU(x) es menor que cualquier otro número z tal

U(z). El contenido del teorema se deja, pues, formular mediante las dos ase-
veraciones siguientes:

[i] U(n) → (∃x≤n)(∀z≤x)(U(x) ∧ (U(z) → x = z))

((U(a) ∧ (∀x≤a)(U(x) → x = a)) ∧


(U(b) ∧ (∀y≤b)(U(y) → y = b))) → a = b
[ii]

[i] dice que U(n) implica la existencia de un número que obedece a la descrip-
ción de µxU(x) y [ii] dice que tal número es único. La aseveración [i] es
obvia si n = 1. Supongamos, pues, que el teorema es verdad para cualquier
2.5 Aritmética finitista 218

n ≤ m y que U(m+1). Caben dos posibilidades: o bien hay un número w <


m + 1 tal que U(w), y entonces, por hipótesis, (∃x≤w<m+1)(∀z≤x)(U(x) ∧
(U(z) → x = z)), de modo que U(m+1) → (∃x≤m+1)(∀z≤x)(U(x) ∧ (U(z)
→ x = z)); o bien no hay ningún número w < m + 1 tal que U(w), en cuyo
caso m+1 = µxU(x) y es claro que U(m+1) → (∃x≤m+1)(∀z≤x)(U(x) ∧
(U(z) → x = z)). La aseveración [ii] se deduce fácilmente de la tricotomía de
los números. Si a ≠ b, entonces a < b o b < a; pero si b < a es claro que
(∀x≤a)(U(x) → x = a) implica ¬U(b) y si a < b, (∀y≤b)(U(y) → y = b)
implica ¬U(a). Así pues, a ≠ b implica que la prótasis de la aseveración [ii]
es falsa, de modo que dicha aseveración es verdadera.
2.6 PRUEBAS DE CONSISTENCIA

2.6.1 Ackermann (1925)

La tesis doctoral de Wilhelm Ackermann, “Fundamentación del ‘tertium non


datur’ mediante la teoría de la no-contradicción de Hilbert”, da testimonio
de la confianza ciega que Hilbert y sus discípulos tenían en la viabilidad de
su programa. Se trata de “borrar la fea mancha de las paradojas” del “edifi-
cio por otra parte tan perfecto de la matemática” y de “salvar partes valiosas
de la matemática —por ejemplo, la teoría de conjuntos— del escepticismo
que todo lo aniquila” (Ackermann 1925, p. 1). Con ese fin se propondrá un
sistema axiomático suficiente para deducir la matemática entera y se buscará
demostrar su consistencia (Widerspruchsfreiheit). Ahora bien, “las paradojas
surgen en la matemática sólo allí donde se trata de totalidades infinitas, don-
de se emplean las palabras ‘todos’ y ‘existe’ y las formas de inferencia
transfinita —como la ‘inducción completa’ y el ‘tertium non datur’— que
sólo pueden formularse mediante esas palabras” (p. 1). Obviamente, tales
formas de inferencia deberán evitarse, so pena de circularidad, en las prue-
bas de consistencia.

Hilbert evita estas dificultades con su conocido distingo entre matemática


y metamatemática. La matemática se convierte en un acopio de fórmulas,
de signos. También lo transfinito tiene aquí su figura visible, finita. La
metamatemática suministra la prueba de consistencia para la matemática.
Como la metamatemática sólo hace aseveraciones sobre cosas concretas,
presentes a la vista, se las arregla enteramente sin inferencias transfinitas.
Emplea sólo aquellas formas de inferencia primitivas y finitas que admi-
ten aun los escépticos más tenaces.
(Ackermann 1925, p. 1)

Ackermann formula la matemática axiomatizada en un cálculo predicati-


vo cuyos símbolos lógicos, con una sola excepción que explicaré luego, co-
rresponden exactamente a los de nuestro Apéndice IX. Para facilitar la lec-

219
2.6 Pruebas de consistencia 220

tura los reemplazaré, pues, por éstos. Hay variables individuales a, b, c,…;
variables funcionales n-arias (para cada entero positivo n) f, m,…; varia-
bles proposicionales A, B, C; variables predicativas A(a), B(a,b),…, Aa f(a)
(donde el subíndice a indica que A depende de la variable funcional f y no

nales. Estas últimas incluyen los símbolos + y × de la adición y la multipli-


de su argumento a),…; constantes individuales 0 y 1, y constantes funcio-

las griegas ϕ, ψ,… que simbolizan funciones n-arias (para diversos valores
cación, que se escriben entre los signos de los argumentos, y letras minúscu-

del entero positivo n) y se escriben delante del n-tuplo de los argumentos.


Como variables metalingüísticas —esto es, como parte del alemán en que él
escribe (o del castellano en que lo explico)— Ackermann usa letras góticas:
las mayúsculas ᑛ, ᑜ, ᑝ,… representan fórmulas; las minúsculas ᑾ, ᑿ, ᒀ,…
expresiones de cierto género que, siguiendo a Hilbert, llama funcionales

ticamente admisible de signos 0, 1, +, × y variables individuales es un fun-


(Funktionale). Éstas se pueden caracterizar así: toda combinación sintác-

cional; si ϕ es una constante funcional n-aria y ᑾ1,…, ᑾn son funcionales,


entonces ϕ(ᑾ1,…, ᑾn) es un funcional. Conforme a la tradición iniciada por

de las premisas ᑭ y ᑭ → ᑮ inferir la conclusión ᑮ. La segunda es esta


Frege, se adoptan sólo dos reglas de inferencia. La primera es modus ponens:

regla de sustitución: si ᑛ es un axioma y x es una variable cualquiera, infe-


rir de ᑛ la fórmula que se obtiene reemplazando uniformemente x en ᑛ por
un funcional determinado si x es una variable individual, por una cierta fun-
ción n-aria si x es una variable funcional n-aria, por una fórmula cualquiera
si x es una variable proposicional del tipo A, B,…, por una fórmula que
contenga una función 1-aria si x es una variable proposicional del tipo Aa
f(a), etc.
Los funcionales de la forma 0, 0 + 1,…, 0 + 1 + 1 + 1 + 1,… se

y uno o más de los símbolos lógicos =, →, ∧, ∨, ¬, es una fórmula numé-


llaman numerales (Zahlzeichen). Una expresión que sólo incluya numerales

rica. Una fórmula numérica de la forma ᑾ = ᑿ se dice correcta (richtig) si


ᑾ y ᑿ son numerales iguales; de otro modo se dice incorrecta (falsch). Esti-

ta, las fórmulas ᑬ → ᑬ, ᑠ → ᑬ, ᑠ → ᑠ, ᑬ ∧ ᑬ, ᑬ ∨ ᑬ, ᑬ ∨ ᑠ, ᑠ ∨ ᑬ


pulamos que, si ᑬ designa una fórmula numérica correcta y ᑠ una incorrec-

y ¬ᑠ son correctas y las fórmulas ᑬ → ᑠ, ᑬ ∧ ᑠ, ᑠ ∧ ᑬ, ᑠ ∧ ᑠ, ᑠ ∨ ᑠ


y ¬ᑬ son incorrectas. Es claro pues que toda fórmula numérica es correcta
o incorrecta. No hay otra alternativa. Como subraya Ackermann (1925, p. 4),
2.6 Pruebas de consistencia 221

el tertium non datur tiene aplicación aquí en un sentido finito, intuitivo.


Ackermann enuncia el siguiente criterio de consistencia: un sistema

es imposible deducir de sus axiomas la fórmula numérica ¬(0 = 0). El mé-


axiomático que emplee el formalismo descrito se reputa consistente si y sólo

todo propuesto para demostrar la consistencia de un sistema dado Σ puede


describirse sumariamente como sigue: Sea 〈ᑛ1,…, ᑛn〉 una lista de fórmu-
las tales que ᑛn es una fórmula numérica y para cada entero positivo k ≤ n,
ᑛk es un axioma de Σ, o se infiere por sustitución de una fórmula que la
precede en la lista, o se infiere por modus ponens de dos fórmulas que la
preceden en la lista. Se da una regla para reemplazar por una fórmula numé-
rica a cada fórmula de la lista que no sea una fórmula numérica. Se muestra
que aplicando esa regla cualquier lista que cumpla con los requisitos estipu-

fórmula ¬(0 = 0) es incorrecta y toda deducción de una fórmula numérica


lados se convierte en una lista de fórmulas numéricas correctas. Como la

ᑛn a partir de los axiomas de Σ consiste en una lista 〈ᑛ1,…, ᑛn〉 de fórmulas

que la fórmula ¬(0 = 0) no puede deducirse de los axiomas de Σ. Por lo


que reúne los requisitos indicados, el procedimiento descrito hace evidente

tanto, Σ es consistente.
Los axiomas para la matemática clásica propuestos por Ackermann for-
man dos grupos: axiomas para la matemática finita y “axiomas transfinitos”.
Ackermann da una demostración breve pero completa de la consistencia del
primer grupo y luego bosqueja larga y tortuosamente una demostración aná-
loga aplicable a todo el sistema. No puedo dar aquí más que algunas indica-
ciones incompletas sobre esta última. En cambio, presentaré la primera en
detalle, para que el lector se forme una idea precisa de las intenciones y
recursos de la metamatemática hilbertiana. (También Ackermann ofrece esa
demostración sobre todo a título ilustrativo).
Los axiomas de la matemática finita son 16. Los Axiomas 1–12 bastan
para deducir por sustitución y modus ponens todas las tautologías; los Axio-
mas 13 y 14 gobiernan el signo de identidad, y los Axiomas 15 y 16 son
propiamente aritméticos. Los doy aquí en nuestra notación:
2.6 Pruebas de consistencia 222

1. A → (B → A)
2. (A → (A → B)) → (A → B)
3. (A → (B → C)) → (B → (A → C))
4. (B → C) → ((A → B) → (A → C))
5. (A ∧ B) → A
6. (A ∧ B) → B
7. A → (B → (A ∧ B))
8. A → (A ∨ B)
9. B → (A ∨ B)
10. (A → C) → ((B → C) → ((A ∨ B) → C))
11. A → (¬A → B)
12.1 (A → B) → ((¬A → B) → B)
13. a=a
14. a = b → (A(a) → A(b))
15. ¬(a + 1 = 0)
16. ¬(a = 0) → (a = δ(a) + 1)

La constante funcional δ utilizada en el Axioma 16 se define recursivamente


por la doble condición: δ(0) = 0 y δ(a + 1) = a. Las constantes + y × se

a × 0 = 0 y a × (b + 1) = (a × b) + a. Ackermann admite que la matemática


definen también recursivamente así: a + 0 = a y a + (b + 1) = (a + b) + 1;

finita se enriquezca indefinidamente con nuevas funciones, siempre que és-


tas se definan según un esquema de recursión del cual las tres definiciones
recién citadas son ejemplos sencillos. Dicho esquema se deja formular con

El tertium non datur, (A ∨ ¬A), se deduce de los Axiomas 8, 9 y 12 por sustitución y


modus ponens. En efecto, sustituyendo B por ¬A en el Axioma 8, obtenemos [α] A →
1

(A ∨ ¬A). Sustituyendo B por ¬A en el Axioma 9, obtenemos [β] ¬A → (A ∨ ¬A).


Sustituyendo B por (A ∨ ¬A) en el Axioma 12, obtenemos [γ] (A → (A ∨ ¬A)) →
((¬A → (A ∨ ¬A)) → (A ∨ ¬A))). Mediante dos aplicaciones de modus ponens a las
premisas α, β y γ, inferimos (A ∨ ¬A).
2.6 Pruebas de consistencia 223

toda generalidad así: Considérese una constante funcional n-aria ϕ y funcio-

bles distintas, respectivamente (n ≥ 1); entonces ϕ se puede caracterizar


nales ᑾ(x1,…,xn–1) y ᑿ(x1,…,xn+1) que contienen sólo n – 1 y n + 1 varia-

mediante la doble condición siguiente:2

ϕ(0,b1,…,bn–1) = ᑾ(b1,…,bn–1)

ϕ(a + 1,b1,…,bn–1) = ᑿ(a,b1,…,bn–1,ϕ(a,b1,…,bn–1))


(R)

Demostraré, siguiendo a Ackermann, que la fórmula ¬(0 = 0) no puede


deducirse por sustitución y modus ponens de los 16 axiomas de la matemá-
tica finita, suplementados con definiciones recursivas de constantes funcio-
nales conforme al esquema descrito. Sea L = ᑛ1,…, ᑛn una lista de fór-

dicho sistema de axiomas. Esto supone que, para cada entero positivo k ≤ n,
mulas que constituye una deducción de la fórmula numérica ᑛn a partir de

ᑛk es uno de los axiomas 1–16, o se infiere de una o dos fórmulas prece-


dentes de L por una de las reglas de inferencia. Supondremos, además, que
toda fórmula que precede a ᑛn en L se invoca una y sólo una vez para in-
ferir otra fórmula de L; por lo tanto, si uno de los axiomas se utiliza para
deducir r fórmulas de L, L contiene r copias de ese axioma, y si una fór-
mula que no es un axioma se aduce en la deducción de otras r fórmulas de
L, L contiene r copias de dicha fórmula y de toda la secuencia de fórmulas
mediante la cual se la deduce de los axiomas. Este supuesto no resta gene-
ralidad a nuestro argumento, ya que obviamente no cuesta nada darle la for-

de los axiomas 1–16. En virtud del mismo, cada fórmula ᑛk ∈ L que no sea
ma por él requerida a cualquier deducción de la fórmula numérica ᑛn a partir

la última sirve directamente para justificar una única fórmula ᑛh ∈ L (k < h


≤ n) que llamaré la sucesora de ᑛk en L. Evidentemente, para que ᑛh sea la
sucesora de ᑛk tiene que cumplirse una de las dos condiciones siguientes: o

que k ≠ j, k < h, j < h y ᑛh se deduce de ᑛk y ᑛj por modus ponens (obvia-


bien (i) ᑛh se deduce de ᑛk por sustitución; o bien (ii) hay un índice j tal

mente esto sólo puede ocurrir si ᑛj = ᑛk → ᑛh o ᑛk = ᑛj → ᑛh).

2 Ackermann expresa el esquema de recursión sólo para los casos n = 1 y n = 2, pero a


la luz de ellos no cabe duda de que la regla general en que está pensando es la formu-
lada arriba.
2.6 Pruebas de consistencia 224

Queremos demostrar que ᑛn no puede ser la fórmula ¬(0 = 0). Para ello,
como se explicó arriba, vamos a convertir a L en una lista de fórmulas
numéricas. Empecemos eliminando las variables. Sea ᑛp la última fórmula
de L que contiene variables. Como ᑛn es una fórmula numérica, es claro
que p < n y que ᑛp tiene una sucesora sin variables. Si la sucesora de ᑛp se
deduce de ésta por sustitución, efectúo la misma sustitución en ᑛp (en otras
palabras, pongo en lugar de ᑛp una copia de su sucesora). Si la sucesora de

deduce por modus ponens de premisas ᑜ y ᑜ → ᑝ, y ᑛp = ᑜ o ᑛp = ᑜ →


ᑛp no se deduce de ésta por sustitución, se trata de una fórmula ᑝ que se

ᑝ. Como ᑝ no contiene variables, todas las variables de ᑛp están contenidas


en la subfórmula ᑜ. Las sustituimos simultáneamente en ambas premisas.
Como figuran en L por última vez en ᑛp, se las puede reemplazar por ex-
presiones más o menos arbitrarias: cada variable individual se reemplaza por
0, cada variable proposicional A se reemplaza por 0 = 0, cada variable fun-
cional ƒ(a) se reemplaza por a, cada variable funcional binaria g(a,b) por a
+ b, etc. y todas las variables individuales así introducidas se reemplazan
luego por 0 del modo antedicho.3 Al término de estas operaciones, ᑛp habrá
sido sustituida por una fórmula sin variables ᑛ′p y L por una lista L′ cuya
última fórmula sin variables es ᑛq, con q < p. Repitiendo el mismo proce-
dimiento un número finito de veces se formará una lista de fórmulas que no
contienen variables. Para convertirla en una lista de fórmulas numéricas hay

constante funcional ϕ tiene que haberse definido recursivamente según el


que eliminar todas las constantes funcionales diferentes de +. Como cada

esquema antedicho, toda subfórmula sin variables ϕ(…) que comience con
ϕ se puede traducir mediante un número finito de transformaciones en una
fórmula numérica ᒐ, tal que ϕ(…) = ᒐ es una fórmula correcta. Sustitui-
mos ϕ(…) por ᒐ. Como L es una lista finita de fórmulas finitas, este pro-
cedimiento se completa en un número finito de pasos, al cabo de los cuales
habremos obtenido una lista L* de fórmulas numéricas la última de las cua-
les es ᑛn. Cada fórmula de L* o bien (i) es una copia de una fórmula pre-
cedente, o bien (ii) se deduce de dos fórmulas precedentes por modus ponens,
o bien (iii) se obtiene directamente por sustitución de variables en alguno de

3 Aunque Ackermann no lo dice expresamente, tiene que subentender que 0 + 0 se debe


reemplazar por 0. De otro modo, no se obtendría a fin de cuentas una lista de fórmulas
numéricas en el sentido preciso del término.
2.6 Pruebas de consistencia 225

los axiomas 1–16. En el caso (i), la fórmula en cuestión será correcta, a menos
que la precedente que copia sea incorrecta. Es claro asímismo que la con-
clusión deducida por modus ponens de dos premisas correctas es siempre
correcta.4 Por lo tanto, sólo puede haber fórmulas incorrectas en L* si algu-
na de las correspondientes al caso (iii) es incorrecta. Pero eso no es posible:
las fórmulas del tipo (iii) obtenidas a partir de uno de los axiomas 1–12 son
siempre correctas, no importa que las fórmulas numéricas que reemplacen a
cada una de las variables A, B y C sean correctas o no;5 y la sustitución de
variables según las reglas arriba descritas en los axiomas 13–16 sólo puede

L, no puede ser la fórmula incorrecta ¬(0 = 0).


generar fórmulas correctas. Por lo tanto, ᑛn, la última fórmula de L* y de

Antes de seguir adelante, conviene observar que el sistema de la matemá-


tica finita propuesto por Ackermann, con sus 16 axiomas, sus dos reglas de
inferencia y su esquema de recursión formaliza justamente la matemática finita
que Hilbert y sus discípulos sostienen que debe darse por descontada. Es
claro que la prueba de consistencia ofrecida apela a evidencias y emplea
modos de razonar propios de esa matemática finita, de modo que en efecto
supone aquello mismo que pretende establecer. Sirve, pues, a lo sumo, para
verificar que la formalización es adecuada, que no hemos tenido un traspiés
al escribir los axiomas con que intentamos representar aquello que está fue-
ra de duda. Además, por cierto, prepara al lector para la prueba siguiente,
que emplea los mismos recursos para demostrar la consistencia de un siste-
ma esencialmente más fuerte.
Éste comprende, además de todo lo incluido en el sistema anterior, los
“axiomas transfinitos” que enuncio a continuación:6

4 Por definición, las fórmulas ᑛ y ᑛ → ᑜ no pueden ser ambas correctas, a menos que
la fórmula ᑜ lo sea.
5 El lector para quien esto no sea inmediatamente obvio debe comprobarlo construyendo
tablas de verdad para esos doce axiomas.
6 Ackermann asigna a los axiomas transfinitos los números 1 al 4; sin embargo, me ha
parecido más razonable numerarlos del 17 al 20, ya que los axiomas 1–16 del sistema
antes descrito pertenecen también al sistema ahora considerado. Para facilitar la refe-
rencia he distinguido con subíndices las diversas formas de los axiomas 17–19. Otros

negación mediante el signo ¬, en vez de la tilde y el signo ≠ utilizados por Ackermann,


dos puntos en que mi presentación difiere de la original son los siguientes: expreso la

y sólo empleo paréntesis redondos, aunque Ackermann también utiliza llaves y corche-
tes, esto es, los pares { } y [ ]. Por otra parte, respeto todos los pares de paréntesis
2.6 Pruebas de consistencia 226

170. A(a) → A(εaA(a))


171. Aa f(a) → Aa((εf Ab f(b))(a))

180. A(εa A(a)) → πaA(a) = 0


181. Aa((εf Ab f(b))(a)) → πf (Aa f(a)) = 0

190. ¬A(εa A(a)) → πa A(a) = 1


191. ¬Aa((εf Ab f(b))(a)) → πf (Aa f(a)) = 1

20. ¬(εa A(a) = 0)

Como se explicó al comienzo, el subíndice en una expresión como Aaf(a)


indica que la variable proposicional A depende de la variable funcional f, no
de la variable individual a; la presencia de esta última sirve sólo para indi-
car que la variable f es 1-aria. Los Axiomas 171, 181 y 191, que envuelven
variables funcionales 1-arias, son propiamente los miembros iniciales de tres
secuencias infinitas de axiomas análogos que envuelven variables funciona-
les n-arias, para cada entero positivo n. Por ejemplo, el Axioma 173 se enun-
ciaría así:

173. Aabc f(a,b,c) → Apqr((εf Apqr f(p,q,r))(a,b,c))

Los operadores ε y π que figuran en los axiomas transfinitos son una inge-

cuantificación ∀ y ∃.7 Ackermann subraya que “ε y π son aquí meros signos


niosa creación de Hilbert mediante la cual se pueden definir los signos de

correlativos colocados por él, aunque me parece superfluo el tercer par en el Axioma
171, así como el segundo en los Axiomas 181 y 191.
7 Las siguientes definiciones resumen las ofrecidas por Ackermann (1925, p. 32):
∃uA(u) ↔ A(εuA(u))
∀uA(u) ↔ A(εu¬A(u))
(aquí, u es una variable individual o funcional). Basándose en ellas, no es difícil dedu-
cir de los axiomas 1–20 los siguientes teoremas (1925, pp. 32–36):

∀uA(u) → A(u)
A(u) → ∃uA(u)
¬∀uA(u) ↔ ∃u¬A(u)
∀u¬A(u) ↔ ¬∃uA(u)
2.6 Pruebas de consistencia 227

con los cuales se opera conforme a ciertas reglas” (1925, p. 8). Hay que
considerarlos, pues, como caracterizados a cabalidad por los axiomas mis-
mos. Por otra parte, la pretensión de que los Axiomas 1–20 —cuando se los
suplementa con el procedimiento para la definición de funciones que descri-
biré luego— bastan para deducir por sustitución y modus ponens toda la
matemática clásica resulta injustificable e incluso ridícula mientras no se

que se quiere representar —o reemplazar— con ε y π. Basándome en lo que


explique cuáles son los ingredientes del pensamiento matemático ordinario

dice Ackermann, me parece justo explicarlos así: ε y π simbolizan funciones


que asignan un número fijo al predicado escrito a su derecha. El Axioma

mero designado por εaA(a) sea uno de ellos. Como dice Ackermann, “εaA(a)
170 requiere que, si hay números a los que se aplica el predicado A, el nú-

es que hay algo que la satisfaga” (p. 8). De otro modo, εaA(a) puede ser
designa un número del cual es seguro que satisface la aseveración A(a), si

narle un valor determinado de una vez por todas, por ejemplo, εa A(a) = 0).
cualquier número (aunque es recomendable, a diferencia de Ackermann, asig-

El Axioma 171 impone una exigencia similar a la función designada por εf


Ab f(b) en caso que A sea un predicado de funciones. Conforme al Axioma

número designado por εaA(a). Conforme a los Axiomas 18 y 19, π simboli-


20, el predicado A no se aplica en ningún caso al predecesor inmediato del

za una función que asigna a cada predicado el valor 0 si hay algún número
(o una función) a que dicho predicado se aplique, y el valor 1 si no lo hay.8
La presencia de ε y π amplia decisivamente el repertorio de funcionales
con los que se puede reemplazar una variable de acuerdo con la regla de
sustitución. Inicialmente Ackermann parece haber contemplado su utilización
irrestricta, pues en el texto de su trabajo dice simplemente que “en lugar de

cional εbᑛ(a,b) o también εbᑛ(a,b,c), de modo, pues, que por sustitución en


una variable funcional f(a) con un solo hueco, es lícito ahora poner el fun-

una fórmula ᑝa f(a) se pueden formar las fórmulas nuevas ᑝa[εbᑛ(a,b)] o


ᑝa[εbᑛ(a,b,c)]” (p. 9). Pero en una nota agregada “durante la corrección de
pruebas”, Ackermann prescribe la restricción siguiente:

8 Si hay un número a tal que A(a), entonces A se aplica al número εaA(a) (Ax. 170) y
por lo tanto, πaA(a) = 0 (Ax. 180). Si no hay ningún número a tal que A(a), tenemos
que ¬A(εaA(a)), cualquiera que sea el número εaA(a), de suerte que πaA(a) = 1 (Ax.

mas 18n y 19n (n ≥ 1)— en que A es un predicado de funciones n-arias.


190). El lector podrá extender estas consideraciones al caso —gobernado por los Axio-
2.6 Pruebas de consistencia 228

ᑾ(a) en que a figura dentro del alcance (Bereich) de un εf . Por ejemplo,


No está permitido reemplazar una variable funcional f(a) con un funcional

(εf ᑜ(f))(a) + εbᑞ(a,b).


no se puede poner (εf ᑛ(a, f))(0) en vez de f(a), pero sí se puede poner

(Ackermann 1925, p. 9n.)

Como advierte von Neumann (1927, p. 44), esta restricción es indispensable


para que la prueba de consistencia ofrecida por Ackermann sea válida, pero
limita severamente el alcance de la misma: la matemática vindicada por ella
viene a ser sólo un fragmento de la matemática clásica, equivalente al de-
fendido por Weyl en El continuo (1918), o a la teoría ramificada de los tipos
sin Axioma de Reducibilidad.
También se amplía el esquema para la definición recursiva de nuevas
funciones. Ahora se admiten como parámetros no sólo las variables indivi-
duales (como b1,…, bn–1 en el esquema R), sino también variables funcio-

sive ε y π. En vez que expresar esta idea mediante un complejo esquema


nales, que representen a cualquier función previamente caracterizada, inclu-

general, prefiero ilustrarla con tres ejemplos tomados de Ackermann.

ϕb(0, f(b)) = ᑾb( f(b))

ϕb(a + 1, f(b)) = ᑿb(a, f(b),ϕc(a, f(c)))


(R1)

ϕbf (0,gc(b, f(c))) = ᑾbf (gc(b, f(c)))

ϕbf (a + 1,gc(b, f(c))) = ᑿbf (a,gc(b, f(c)),ϕdh(a,gd(d,h(c))))


(R2)

ϕ(0) = (εf ᑛb( f(b)))(0)

ϕb(a + 1) = ϕ(a) + (εfᑛb( f(b)))(a + 1)


(R3)

La prueba de consistencia del sistema completo sigue esencialmente el mé-


todo ya descrito, pero, a causa de las novedades introducidas, es muchísimo
más complicada. Sea L = ᑛ1,…, ᑛn una lista de fórmulas que constituye
una demostración (por sustitución y modus ponens) de la fórmula numérica
ᑛn a partir de los axiomas 1–20. Supongamos que ya se han eliminado de L
2.6 Pruebas de consistencia 229

todas las variables libres. Una fórmula de L derivada del Axioma 17 por
sustitución podría entonces ajustarse al patrón siguiente:

ᑛ(ᑿ) → ᑛ(εaᑛ(a))

donde ᑿ es un funcional determinado y ᑛ(a) es una fórmula cuya única

símbolos ε y π. Por ejemplo, ᑿ podría ser un funcional de la forma


variable libre es a. Naturalmente, tanto ᑿ como ᑛ(a) pueden contener los

εfᑜei(f(e),εcᑝ(c),εdᑞ(f(i),d)))(0)

y ᑛ(a) la fórmula εb(a = b) = 0. Entonces, la formula en cuestión se repre-


sentaría más adecuadamente así:

εb(εfᑜei(f(e),εcᑝ(c),εdᑞ(f(i),d)))(0) = b) = 0 → εb(εa(εc(a = c) = 0) = b) = 0

donde ᑜ, ᑝ y ᑞ representan fórmulas cuya complejidad está apenas insi-


nuada. Para reducir L a una lista L* de puras fórmulas numéricas hay que

ε y π. En los casos más sencillos, se puede proceder por “ensayo y error”.


eliminar todas las constantes funcionales definidas recursivamente y también

Consideremos una vez más el patrón ᑛ(ᑿ) → ᑛ(εaᑛ(a)), mas suponiendo


ahora que ε no figura en ᑛ(a) y que el funcional ᑿ es una fórmula numéri-

de ᑿ por cierto numeral ᒗ. Tentativamente, reemplazamos εaᑛ(a) por 0. La


ca. En tal caso, nuestro procedimiento habitual redundará en la sustitución

fórmula resultante ᑛ(ᒗ) → ᑛ(0) es correcta a menos que ᑛ(ᒗ) sea correcto
y ᑛ(0) incorrecto, y entonces el propio ᒗ es un sustituto adecuado para εaᑛ(a).
Pero el caso general es muchísimo más complicado. Como subraya Acker-

sustituciones de ε y π habrá que efectuar para que estos símbolos desaparez-


mann, con sólo mirar una fórmula no se puede saber de antemano cuántas

can del todo. Consíderese, por ejemplo, una expresión como ésta:

εaᑛ(ϕb(εdᑜ(d),εcᑥ(c,b)),a))

donde la función ϕ se definerecursivamente así:

ϕb(0, f(b)) = f(0)


2.6 Pruebas de consistencia 230

ϕb(a + 1, f(b)) = ϕb(a, f(b)) + f(a + 1)

Si εdᑜ(d) se deja reemplazar lícitamente por cierto numeral ᒗ, la expresión


considerada se transforma en εaᑛ(ϕb(ᒗ,εcᑥ(c,b)),a)), la cual, mediante la
definición de φ, se reduce a:

εaᑛ(εcᑥ(c,0) + εcᑥ(c,1) +…+ εcᑥ(c,ᒗ),a)

El número de símbolos ε que hay que sustituir en esta nueva expresión de-
pende obviamente del número de unos en el numeral ᒗ. Esta dificultad es,
por cierto, una consecuencia de la inclusión de variables funcionales como

cualquier constante funcional definida según ese esquema. Si la constante ϕ


parámetros en el esquema de recursión y afecta también, por lo tanto, a

entra en su propia definición recursiva, cuando la reemplacemos con ayuda


de su definición en una fórmula dada, puede que acabe figurando en la fór-
mula resultante un mayor número de veces que en la propia fórmula inicial.
Para establecer que la reiterada sustitución de las funciones que figuran
en un funcional cualquiera lo transforma en una fórmula numérica al cabo
de un número finito de operaciones, Ackermann concibe un modo de asig-
narle a cada funcional un índice característico (formado por varios números),
define un orden lineal entre esos índices y demuestra que el índice de un
funcional dado disminuye con cada sustitución prescrita hasta reducirse, tras
un número finito de ellas, al índice mínimo, característico de las fórmulas
numéricas. La demostración es tortuosa y no voy a reproducirla aquí (en la

más simple en que éste no contiene los signos ε y π).9 Como ya señalé, su
nota siguiente explico como se construye el índice de un funcional en el caso

los signos ε y π, Ackermann tiene en cuenta el orden en que se han definido


Para determinar el índice característico de un dado funcional ᒐ, en el cual no figuran

recursivamente las funciones que figuran en ᒐ. Obsérvese que este orden no depende

caso, la primera de esas funciones es la adición. Diré que la función ψ es mayor o


del funcional en cuestión sino del modo cómo se ha construido el sistema. En todo

igual que la función ϕ si ψ = ϕ o si ϕ precede a ψ en dicho orden. Si ϕ y ψ figuran


en el funcional ᒐ, diré que ψ está subordinada a ϕ (en ᒐ) si ψ figura dentro del parén-
tesis gobernado por ϕ y dentro del alcance de ψ hay una variable ligada por un subíndice
de ϕ. Si χ está subordinada a ψ y ψ está subordinada a ϕ, decimos que χ también está
subordinada a ϕ. Ackermann asigna a cada funcional un rango con respecto a cada
una de las funciones que figuran en él. El rango del funcional ᒐ con respecto a una
2.6 Pruebas de consistencia 231

alcance está severamente limitado por la restricción que Ackermann tuvo que
imponer a su regla de sustitución.

cierta función ϕ depende de lo que llamaré el nivel relativo a ϕ de las funciones ma-
yores o iguales que ϕ que figuran en ᒐ. Sea Φ el conjunto de estas funciones. Si ψ ∈
Φ y ninguna función de Φ está subordinada a ψ en ᒐ, el nivel de ψ relativo a ϕ es 1.
Si ψ ∈ Φ y n ≥ 1 es el más alto nivel relativo a ϕ que alcanza una función de Φ
subordinada a ψ (en ᒐ), el nivel de ψ relativo a ϕ es n + 1. El rango de ᒐ con respecto
a ϕ es el más alto nivel relativo a ϕ que tiene en ᒐ una función mayor o igual que ϕ.
Si ϕ no figura en ᒐ diré que el rango de ᒐ respecto de ϕ es 0 (Ackermann no mencio-
na esta posibilidad, pero hay que tenerla en cuenta para que sea verdad, como él dice,
que cada funcional tiene un rango con respecto a cada función recursiva). Cada funcio-

ejemplo, los componentes de ψd(ψe(0 + 1 + 1,ϕb(e,b)),ϕb(d,b)) son: 0 + 1 + 1, e, b, d,


nal ᒐ contiene una colección finita de funcionales que llamaré sus componentes. Por

ϕb(e,b), ψe(0 + 1 + 1,ϕb(e,b)), ϕb(d,b) y ψd(ψe(0 + 1 + 1,ϕb(e,b)),ϕb(d,b)). Cada com-


ponente ᒐk de un dado funcional ᒐ tiene un rango determinado con respecto a cada una
de las funciones que se han definido recursivamente en el sistema; la lista de estos
números, dispuesta de modo que las funciones respectivas queden ordenadas de mayor
a menor, constituye la combinación de rangos de ᒐk. Las combinaciones de rangos de

siguiente: 〈a1,…,ar〉 > 〈b1,…,bs〉 si r > s, o si r = s y hay un k (1 ≤ k ≤ r) tal que


los funcionales contenidos en ᒐ se ordenan de mayor a menor según la convención

ak < bk pero aj = bj si j < k (nótese que en virtud de las convenciones adoptadas cada
combinación de rangos contiene el mismo número de enteros no negativos, a saber, el
número de las funciones que se han definido recursivamente en el sistema). A cada
combinación presente en la lista le asignamos el número total de veces que figuran en
ᒐ funcionales que posean esa combinación. Además, asignamos el 0 a cada posible
combinación de rangos ausente de la lista que sea menor que la mayor de las presen-
tes. La lista de números así generada, dispuesta en el orden de las correspondientes
combinaciones de rangos, es el indice del funcional ᒐ. Los índices de distintos funcio-
nales se ordenan de mayor a menor según la misma convención que aplicamos a las
combinaciones de rango. Si el funcional ᒐ forma parte de una fórmula numérica tiene
que ser un numeral, esto es, un 0, o un 0 seguido de una o más copias de la configu-
ración ‘+ 1’. Según nuestras estipulaciones, si ᒐ es un numeral, él mismo es su solo

ciones del sistema. Por lo tanto, su combinación de rangos es la mínima, 〈0,…,0,1〉,


componente y su rango es 1 respecto de la adición y 0 respecto de todas las otras fun-

y su índice es el menor de todos, 〈1〉. En cambio, si ᒐ no es un numeral, su combina-


ción de rangos tendrá al menos un entero positivo en una posición distinta de la última
y su índice, por ende, constará de dos o más números. En las pp. 16–18, Ackermann

ral y no contenga variables libres ni los signos ε y π, las cuales demostrablemente


(1925) prescribe sustituciones aplicables a cualquier funcional ᒐ que no sea un nume-

al cabo de un número finito de pasos en un funcional de índice 〈1〉. En el resto de su


generan un funcional de índice más bajo que aquél al que se aplican y lo transforman

más copias de ε y π.
trabajo, Ackermann extiende estos procedimientos a funcionales que contengan una o
2.6 Pruebas de consistencia 232

2.6.2 Von Neumann (1927)

El escrito de von Neumann “Sobre la teoría hilbertiana de la prueba” (1927)


trata el mismo tema que Ackermann (1925), pero es mucho más luminoso y
fácil de leer. El autor formula y clasifica los axiomas de que supuestamente
puede deducirse toda la matemática clásica de un modo que deja bien claros
los límites de la prueba de consistencia ofrecida. Ésta no cubre cabalmente
el sistema propuesto, sino sólo el fragmento que depende de cinco de sus
seis grupos de axiomas, aunque von Neumann conjetura —con demasiado
optimismo— que la consistencia de todos los axiomas podrá establecerse con
el mismo método que aplica con éxito a ese fragmento. Dicho método tiene
especial interés para nosotros, porque anticipa los utilizados después de 1930
en el contexto de la llamada teoría de modelos (que estudiaremos en la Par-
te 3). Antes de explicarlo, me referiré a ciertas observaciones de carácter
general que von Neumann enuncia en las primeras secciones de su escrito.
Primero, sobre la “matemática clásica”. Von Neumann entiende por esto
“la matemática […] como era universalmente reconocida (allgemein aner-
kannt) hasta que surgieron los críticos de la teoría de conjuntos: le pertene-
cen esencialmente todos los métodos de la teoría de conjuntos, pero no la
teoría de conjuntos abstracta; y, por de pronto, no conoce cardinalidades
mayores que la del continuo” (p. 256). No sabría identificar con precisión
ese cuerpo universalmente reconocido de métodos y teoremas matemáticos.
Me siento inclinado a creer que para von Neumann la “matemática clásica”
comprendía, por ejemplo, los recursos que empleó Lebesgue en su teoría de
la integración; pero inmediatamente después de la caracterización citada nos
advierte que no resolverá, por el momento, si ella incluye o no el Axioma
de Selección.
Para probar la consistencia de la matemática clásica hay que formalizar
con absoluto rigor “todo su aparato de aseveraciones y demostraciones”. Esto
incluye, por cierto, una formalización de la aritmética elemental o teoría de
los números naturales. Con todo, “no es posible edificar la teoria de la prue-
ba a menos que ya esté disponible a priori el número entero positivo con
todas esas propiedades suyas que se pueden derivar a la manera intuicionista,
es decir, sustantivamente (inhaltlich)” (p. 258). En otras palabras, la aritmética
finita à la Skolem (Capítulo 2.5), aunque derivable en la matemática forma-
lizada, tiene que darse por descontada al emprender la formalización. Ocu-
2.6 Pruebas de consistencia 233

rre, pues, que los mismos conceptos tienen dos modos de manifestarse, (i)
dentro del formalismo que se investiga y (ii) en la reflexión “metateórica”
acerca de él. Además de los enteros positivos, “todas las relaciones lógicas”
aparecen bajo esta doble faz (p. 258). Von Neumann reconoce que esto pue-
de causar confusión (p. 258).
Von Neumann distingue cinco clases de símbolos simples: variables (consti-
tuidas por la letra x seguida de un subíndice numérico), constantes (C con
subíndice), operaciones (O con subíndice y exponente), abstracciones (A con
subíndice), y signos de puntuación (coma, paréntesis). Operaciones son los
conectivos lógicos, la identidad, la función ‘el siguiente de…’, la suma, la
multiplicación, etc.; el exponente indica “el número de conceptos a los que
se aplica una dada operación” (p. 259), mientras el subíndice sirve para dis-

von Neumann las representa con los signos habituales, por ejemplo, → en
tinguir diversas operaciones con el mismo exponente (aunque en la práctica

vez de O12, = en vez de O22, etc.). Abstracciones son los operadores que

(que representaré, como de costumbre, con ∀ y ∃) y el operador τ (afín al


ligan variables, esto es, los signos de cuantificación universal y existencial

operador ε que estudiamos en la Sección 2.6.1). Von Neumann da una defi-


nición recursiva precisa de lo que se llama una fórmula. Ella permite decidir
en todos los casos si una combinación cualquiera de símbolos simples es o
no una fórmula. Dada una fórmula, hay siempre un y sólo un modo de cons-
truirla a partir de una determinada colección finita de símbolos simples,
mediante un número finito de aplicaciones sucesivas de las reglas que for-
man la definición de fórmula. Este principio es familiar a cualquiera que haya
estudiado lógica moderna y está claramente ilustrado en nuestro Apéndice
IX. Von Neumann subraya su “fundamental importancia”: “un formalismo
en que no se cumpla sería rechazado por todos como ininteligible e inservi-
ble” (p. 261). Una fórmula sin variables libres es una fórmula normal. En la

obvio, dentro de una fórmula normal ϕ puede figurar una subfórmula ψ


teoría de la prueba se trata siempre de fórmulas normales (aunque, como es

que contenga variables libres ligadas por abstracciones que preceden a ψ en ϕ).
En la presentación de von Neumann, la pieza clave de una teoría forma-
lizada es una regla ᑬ para construir cierto género de fórmulas normales que
llamaremos axiomas. ᑬ tiene que concebirse de modo que permita decidir,
en presencia de cualquier fórmula normal, si ésta es o no un axioma. ᑬ se
expresa mediante una serie de esquemas. Un axioma es cualquier fórmula
2.6 Pruebas de consistencia 234

obtenida reemplazando por fórmulas normales (o, en algunos casos, por va-

fórmula obtenida reemplazando α y β por fórmulas normales en el esquema


riables) ciertos elementos de uno de esos esquemas. Por ejemplo, cualquier

(α → (β → α)) es un axioma según la regla ᑧᑬ característica de la mate-


mática clásica. En contraste con los sistemas de Frege, Whitehead-Russell y
Ackermann, tal reemplazo no es aquí una operación del sistema formal —
una deducción conforme a una “regla de sustitución”— sino un procedimiento
metateórico, un paso más en la formulación —intrínsecamente interminable—
del propio sistema. Von Neumann advierte que ese procedimiento “no debe
confundirse en ningún caso con las operaciones formalistas, pues es un pro-
ceso sustantivo (inhaltlicher)”: el signo de sustitución —βζ/ξ en nuestro Apén-
ξ
dice IX (p. 485), Subst β en el escrito de von Neumann— “significa”
ζ
algo (1927, p. 264).
Relativamente a una determinada regla de construcción de axiomas ᑬ, una
fórmula demostrable se define así:

Si ψ es una fórmula normal y ϕ y (ϕ → ψ) son fórmulas ya reco-


[D1] Todo axioma es una fórmula demostrable.

nocidas como demostrables, entonces ψ es una fórmula demostra-


[D2]

ble.

Como von Neumann expresamente destaca, esta definición nos enseña a


construir (aufstellen) fórmulas demostrables, mas no a decidir (entscheiden)
frente a una fórmula normal dada, si ella es demostrable o no. En esto con-
trasta con la definición recursiva de ‘fórmula’ que aparece en nuestro Apén-
dice IX (similar a la de von Neumann). Esto se debe a que, para decidir que
una cierta fila de signos es una fórmula basta examinar los signos de que
consta y el modo cómo se combinan, sin que haya que tener en cuenta a

una cierta fórmula normal ψ que no sea un axioma es demostrable, hay que
ningún objeto que no esté dado con ella. En cambio, para determinar que

conocer una fórmula demostrable ϕ tal que (ϕ → ψ) también sea demostra-


ble, y obviamente el mero examen de ψ no revela esa fórmula φ.

Parece, pues, que no hay ninguna vía para descubrir el criterio universal
de decisión (allgemeine Entscheidungskriterium) sobre si una dada fórmula
normal a es demostrable. Por cierto, actualmente no podemos probar nada
2.6 Pruebas de consistencia 235

a este respecto. No hay tampoco ninguna indicación de cómo podría pro-


barse dicha indecidibilidad. Pero esta incertidumbre no nos impide cons-
tatar que hoy en día no es posible decidir universalmente si una fórmula
normal cualquiera a es demostrable o no (relativamente a la regla de cons-
trucción de axiomas que se describirá luego). Y que ello sea indecidible
es incluso la conditio sine qua non para que tenga sentido hacer matemá-
ticas con los métodos heurísticos de hoy. El día mismo que la indeci-
dibilidad cese, también dejará de existir la matemática en el sentido ac-
tual; en su lugar habría una receta completamente mecánica con ayuda de
la cual cualquiera podría decidir acerca de cualquier aseveración si se la
puede o no demostrar.
(von Neumann 1927, p. 266)

el operador O11 a una fórmula cualquiera α se llama la negación de α. Es-


En el formalismo de von Neumann, la fórmula construida anteponiendo

cribiré ¬α en vez de O11α (von Neumann escribe ~α). Una regla de cons-

mal α tal que α y ¬α sean ambas demostrables relativamente a ᑬ. La con-


trucción de axiomas ᑬ se dice consistente si no hay ninguna fórmula nor-

sistencia de una dada regla ᑬ quedará establecida sin lugar a dudas si pode-
mos definir una partición de todas las fórmulas normales en dos clases con
las propiedades siguientes:

[W1] Dada una fórmula normal a siempre es posible decidir, en un nú-


mero finito de pasos, a cuál de las dos clases pertenece.
[W2] Ninguna fórmula normal pertenece a la misma clase que su nega-
ción.

La fórmula normal (α → β) pertenece a la misma clase que los


[W3] Todos los axiomas pertenecen a la misma clase.

axiomas si y sólo si la fórmula β pertenece a esa clase o la fórmu-


[W4]

la α pertenece a la otra clase.

Una partición que cumpla estos cuatro requisitos es una valuación (Wertung)
de ᑬ. Como es evidente, en una valuación todas las fórmulas demostrables
pertenecen a la misma clase que los axiomas. Von Neumann llama a esa clase,
la clase R (por richtig, ‘correcto’), pero yo la llamaré V. A la otra clase la
llamo, con von Neumann, F (falsch, en alemán, significa a la vez ‘incorrec-
to’ y ‘falso’).
Von Neumann enuncia una regla ᑧᑬ que según él es capaz de generar
todos los axiomas que hacen falta para deducir toda la matemática clásica
2.6 Pruebas de consistencia 236

(por modus ponens; cf. la cláusula [D2] de la definición de ‘fórmula demos-

grupos. El Grupo I caracteriza los conectivos lógicos ¬ y → (formalmente,


trable’). Los axiomas generables con arreglo a ᑧᑬ se clasifican en seis

O11 y O12) y basta para generar o deducir por modus ponens a todas las tau-
tologías. El Grupo II caracteriza la identidad = (formalmente, O22). El Gru-
po III es una versión sin cuantificadores de los cuatro primeros axiomas de
Peano: caracteriza la constante 0 (formalmente, C1; léase cero) y los opera-
dores Z y +1 (formalmente, O21 y O31; Z precede y +1 sigue a su argumen-
to; léase …es un número y el siguiente de…). Los tres primeros grupos
equivalen, pues, a los Axiomas 1–16 de Ackermann. El Grupo VI y último
es el grupo de las definiciones (para cuya representación formal von Neumann
ofrece esquemas). Concentraremos nuestra atención en los Grupos IV y V.

siguientes esquemas IV1-IV4 cuando β es reemplazada por una fórmula nor-


Al Grupo IV pertenece toda fórmula que se obtenga a partir de uno de los

mal, ξ por una variable y α por una fórmula sin otra variable libre que la
elegida para reemplazar a ξ, o —trivialmente— por una fórmula normal.
(Conforme a la convención de nuestro Apéndice IX, αβ/ξ sería entonces la
expresión obtenida al sustituir uniformemente la variable que reemplace a ξ
por la formula normal que reemplace a β en la fórmula que reemplace a α):

∀ξα → αβ/ξ
αβ/ξ → ∃ξα
IV1.

α τξα/ξ → ∀ξα
IV2.

∃ξα → α τξ¬α/ξ
IV3.
IV4.

Siguiendo a von Neumann, el sentido del operador τ se puede explicar así:


una fórmula α cuya única variable libre es ξ representa un predicado que la
fórmula normal αβ/ξ atribuye al objeto designado por la expresión β; si hay
objetos a los que dicho predicado no se aplica, τξα designa uno de esos

ferido, τξα designa cualquier cosa. (Como se puede ver, τ es simplemente el


objetos; pero si no hay ningún objeto al que no se aplique el predicado re-

operador complementario o “dual” del operador ε utilizado por Ackermann;


cf. la nota 8). Si τ se entiende de esta manera, los esquemas IV3 y IV4 res-
ponden a la interpretación familiar de los símbolos →, ∀ y ∃. Tenemos en
efecto (i) que el predicado representado por la fórmula α con variable libre
ξ se aplica al objeto particular designado por τξα sólo si no hay ningún objeto
2.6 Pruebas de consistencia 237

tos al que se aplique el predicado representado por α, a esos objetos no se


al que dicho predicado no se aplique (esquema IV3), y (ii) que si hay obje-

aplica el predicado representado por ¬α y τξ¬α designa uno de ellos, esto


es, un objeto al que se aplica el predicado representado por α (esquema IV4).
Von Neumann observa acertadamente que “los típicos modos de inferen-
cia ‘transfinitos’ o ‘impredicativos’” representados por los esquemas del Grupo
IV no bastan para edificar la matemática clásica. Ello requiere además una
cierta parte de la teoría de conjuntos.

Es necesario destacarlo expresamente: Hay dos puntos en que el edificio


de la matemática clásica está inseguro y expuesto a los ataques de los
escépticos, a saber, el concepto “todos” y el concepto de “conjunto”. Es-
tas dos cosas fundamentalmente diferentes no deben identificarse (como
suele ocurrir), pero tampoco puede permitirse que una de ellas nos haga
olvidar la otra. La crítica de la matemática comenzó por el concepto de
“conjunto” y lentamente ha avanzado hasta el de “todos”, que hoy, empe-
ro, es el principal punto de ataque de los intuicionistas. Pero no hay que
olvidar que, aun cuando sus objeciones contra “todos” hayan sido refuta-
das en cierto sentido, con eso no se ha rescatado aún el concepto de con-
junto.
(von Neumann 1927, p. 271)

Conforme al patrón establecido en sus escritos sobre teoría de conjuntos

cepto de función. Introduce un operador binario Φ (formalmente, O23) tal


(Sección 1.8.4), von Neumann sustituye el concepto de conjunto por el con-

que Φ(ξ,η) designa el valor de la función designada por ξ en el argumento


designado por η. El Grupo V de axiomas incluye todas las fórmulas que se
obtengan reemplazando, en el siguiente esquema, ξ y η por dos variables
distintas y α por una fórmula sin variables libres o cuya única variable libre
sea la elegida para reemplazar a η:

∃ξ∀η(Zη → (Φ(ξ,η) = α))

Von Neumann explica esto así: ∀η(Zη → (Φ(ƒ,η) = α)) implica que, cual-
quiera que sea el objeto c, Zc → (Φ(ƒ,c) = αc/ξ); en otras palabras, la fun-
ción ƒ representa la expresión αc/ξ en el dominio de los números. Por lo tanto,
lo que el esquema dice es sencillamente que toda expresión está representa-
da por una cierta función en el dominio de los números.
2.6 Pruebas de consistencia 238

Y ésta es justamente la pretensión de la teoría de conjuntos: Todas las


aseveraciones sobre x, por compleja que sea su estructura y por intrin-
cado que sea el modo como x figura en ellas, pueden reducirse a la forma
normal “x elemento de M”, donde M es independiente de x. Como en vez
de conjuntos consideramos funciones, en lugar de aseveraciones hallamos
expresiones, en lugar de la equivalencia lógica la simple identidad y en
lugar de la forma normal “x elemento de M” la forma normal “valor de la
función F para el argumento x”.
(von Neumann 1927, p. 273)

Como indiqué al comienzo, von Neumann no logra probar la consistencia


de ᑧᑬ. Sólo prueba la consistencia de ᑧᑬ(I–IV,VI), la regla para la cons-
trucción de los axiomas de todos los grupos excepto el V. Su prueba, como
él mismo señala, no va más lejos que la de Ackermann; pero es muchísimo
más clara y elegante. Von Neumann prepara el terreno con una prueba sim-
ple y contundente de la consistencia de ᑧᑬ(I–III) (comparable a la prueba
de Ackermann concerniente a sus Axiomas 1–16). Ella consiste en definir
una valuación de la regla ᑧᑬ(I–III) por las siguientes estipulaciones. [i]
Todas las variables y todas las constantes menos una pertenecen a la clase

tenece a la clase F. [ii] Si φ es una fórmula que consta de una operación n-


V; la constante exceptuada, que von Neumann escribe informalmente WF, per-

aria y n fórmulas α1,…,αn cuya clasificación ya se ha determinado, enton-


ces [ii1] si φ es ¬α1, φ es V si α es F y φ es F si α es V; [ii2] si φ es (α1 →
α2), φ es V si y sólo si α1 es F o α2 es V; [ii3] si φ es (α1 = α2), φ es V si
y sólo si α1 y α2 son idénticas; [ii4] si φ es Zα1, φ es V si y sólo si α1 consta
de un 0 seguido de ninguna, una o varias copias de la expresión ‘+1’;10 [ii5]
si φ no obedece a ninguna de las cuatro cláusulas precedentes, φ es V. [iii]
Si φ es una fórmula que consta de una abstracción seguida de una variable
y una fórmula cualquiera, φ es V.11 Esencialmente la prueba de consistencia

10 Formalmente, esta cláusula se puede expresar con más claridad: [ii4] si φ es O21α1, φ
es V si y sólo si α1 es la constante C1, o consta de C1 precedida de una o varias copias
de O31.
11 Las estipulaciones [ii5] y [iii] tienen el efecto de asegurar —trivialmente— la clasifica-
ción de fórmulas que carecen de toda importancia en la teoría determinada por la regla
ᑧᑬ(I–III) cuya consistencia se trata de probar. La necesidad de clasificar tales fórmu-
las desaparece si restringimos el lenguaje de la teoría en cuestión, estipulando que no
2.6 Pruebas de consistencia 239

consiste en establecer que cualquier axioma de los grupos I–III, esto es, cual-
quier fórmula obtenida por reemplazo a partir de los esquemas característi-
cos de esos grupos, pertenece a la clase V. Una vez que esto ha sido asegu-
rado, la cláusula [ii2] garantiza que cada fórmula demostrable es V y la cláu-
sula [ii1] garantiza que la negación de una fórmula demostrable es F y por
ende no puede ser demostrable.
Von Neumann señala enfáticamente que no sabríamos dar una valuación
de ᑧᑬ, ni siquiera de ᑧᑬ(I–IV). Toda valuación contiene un procedimien-

en un número finito de pasos si una dada fórmula α es irrefutable (si es


to efectivo para clasificar a cualquier fórmula y por lo tanto permite decidir

clasificada como V, en cuyo caso ¬α tiene que ser F) o indemostrable (si es


clasificada como F). Aun cuando ello no bastaría para resolver la cuestión
arriba planteada de si una dada fórmula es o no demostrable, von Neumann
considera “sumamente inverosímil” que exista un procedimiento universal
para alcanzar siquiera esta decisión más débil “con respecto a todos los pro-
blemas matemáticos posibles” (1927, p. 276). Pero aunque la prueba de con-
sistencia por valuación tenga que confinarse a ᑧᑬ(I–III), la consistencia de
ᑧᑬ(I–IV,VI) puede probarse mediante lo que von Neumann llama una
valuación parcial. Y en 1927 von Neumann no ha perdido la esperanza de
extender este método a ᑧᑬ.12 No puedo entrar aquí en las complejidades
de su aplicación a fórmulas que contengan cuantificadores o el operador τ.
Pero daré, para terminar, una caracterización general del mismo.
Sea ᑬ una regla para la construcción de axiomas. Una valuación parcial
de ᑬ es un procedimiento que define, para cada lista finita ᑭ de axiomas
construidos conforme a ᑬ una partición de las fórmulas normales en dos
clases Vᑭ y Fᑭ con las propiedades siguientes:

[W1′] Dada una fórmula normal α siempre es posible decidir, en un nú-


mero finito de pasos, si pertenece a la clase Vᑭ o a la clase Fᑭ.

contiene abstracciones, ni más operaciones que las mencionadas en las cláusulas [ii1]–
[ii4].
12 Von Neumann 1927, p. 276, n. 8 atribuye a Julius König la idea de probar la consis-
tencia de la matemática mediante una valuación y a Hilbert las ideas en que se basa el
concepto de valuación parcial.
2.6 Pruebas de consistencia 240

[W2′] La fórmula normal α pertenece a la clase Vᑭ si y sólo si ¬α per-

[W3′]
tenece a la clase Fᑭ.

[W4′] La fórmula normal (α → β) pertenece a la clase Vᑭ, si y sólo la


Todos los axiomas de la lista ᑭ pertenecen a la clase Vᑭ.

fórmula β pertenece a la clase Vᑭ o la fórmula α pertenece a la


clase Fᑭ.

Como puede verse, toda valuación es a la vez una valuación parcial13 con la
notable propiedad de que la partición {Vᑭ, Fᑭ} que ella asocia a cada lista
finita de axiomas ᑭ no depende de la índole de ᑭ. Una valuación parcial
corriente no sería tan neutra. Sin embargo, basta dar una valuación parcial
de ᑬ para estar seguro de que ᑬ es consistente. Para demostrarlo, suponga-

es inconsistente. Esto último implica que hay dos fórmulas normales α y


mos que hay una valuación parcial de ᑬ —que llamaré ᑱᑬ— pero que ᑬ

¬α que son ambas demostrables relativamente a ᑬ. Ahora bien, a la luz de


las cláusulas [D1] y [D2] de la definición de fórmula demostrable, si α es
demostrable relativamente a ᑬ tiene que haber una lista finita ᑦα de axio-
mas construidos con arreglo a ᑬ, tal que, o bien ᑦα tiene un solo miembro
y ese miembro es α, o bien α se deduce de los miembros de ᑦα mediante
un número finito de aplicaciones de modus ponens. Otro tanto vale para ¬α
y una lista finita ᑦ¬α. Sea ᑦ la unión de las listas ᑦα y ᑦ¬α y {Vᑦ, Fᑦ} la

Entonces, por [W3′] y [W4′], α y ¬α pertenecen a la clase Vᑦ. Pero esto es


partición de las fórmulas normales asociada a ᑦ por la valuación parcial ᑱᑬ.

imposible, por [W2′]. Por lo tanto, si hay una valuación parcial de ᑬ, ᑬ no


puede ser inconsistente.

13 Puesto que, para cada entero positivo k ≤ 4, [Wk] implica [Wk′].


2.6 Pruebas de consistencia 241

2.6.3 Herbrand (1931)

En una nota sobre la “Consistencia (non-contradiction) de los axiomas aritmé-


ticos” (1929), comunicada a la Academia de París, Jacques Herbrand deslin-
da con luminosa precisión la teoría axiomática cuya consistencia habría lo-
grado establecer von Neumann (1927) y esboza un método suyo, más senci-
llo, para llegar al mismo resultado. Herbrand distingue dos teorías, que lla-
maré T1 y T2 (él las llama Th. 1 y Th. 2). Ambas se refieren a objetos
(individus) llamados números (nombres), entre los cuales hay uno designado
por la constante ‘0’. Hay un único predicado ‘=’ (que se escribe entre los
dos términos a que se aplica) y una “función descriptiva” que asigna a cada
número a el número designado por ‘a + 1’. T1 tiene tres grupos de axiomas:

[I] a = a, a = b → b = a, a = b ∧ b = c → a = c,
a+1=b+1↔a=b ¬(a + 1 = 0)

[II] Todas las fórmulas de la secuencia


¬(a = a + 1), ¬(a = a + 1 + 1), ¬(a = a + 1 + 1 + 1),…

[III] Todas las fórmulas que se obtengan reemplazando una letra dada
por una expresión cualquiera (formada con los medios descritos)
en los axiomas anteriores o también —como debemos suponer,
aunque Herbrand no lo diga expresamente— en una tautología14
formada con letras y los cinco conectivos ¬, ∨, ∧, → y ↔.

La única regla de inferencia de T1 es modus ponens. La teoría T2 tiene los


mismos axiomas, pero admite el uso de variables ligadas por cuantificadores
(“variables aparentes”, como dice Herbrand). Hemos de suponer que admite,
además de modus ponens, las reglas para la introducción y manipulación de
tales variables descritas en lo que Herbrand (1929) llama “nuestra Nota pre-
cedente” (esto es, Herbrand 1928): reglas de generalización universal y

14 Esto es, en palabras de Herbrand, una “proposición cuyo valor veritativo (valeur logique)
es la verdad, cualquiera que sea el valor veritativo de las letras que figuran en ella”
(Herbrand, EL, p. 21).
2.6 Pruebas de consistencia 242

existencial y las reglas familiares para pasar15 de ¬∀xφx a ∃x¬φx, de ¬∃xφx


a ∀x¬φx, de p ∨ ∀xφx a ∀x(p ∨ φx), y de p ∨ ∃xφx a ∃x(p ∨ φx), o vicever-
sa. Herbrand observa que la consistencia de T1 es fácil de probar. Luego señala
que la teoría cuya consistencia von Neumann (1927) demuestra “por un
método bastante complicado” es precisamente T2. Bosqueja “los fundamen-
tos de una demostración más simple” y concluye:

Para completar la aritmética sería menester introducir las definiciones


recursivas y el axioma de inducción total, cuya consistencia nuestro mé-
todo —igual que el de von Neumann— no permite demostrar. Hay que
advertir, sin embargo, que si se introduce solamente el axioma de inducción
total, sin definiciones recursivas, éste resulta ser una consecuencia de los
axiomas precedentes y, por lo tanto, no es contradictorio.
(Herbrand, EL, p. 26)

La demostración bosquejada en la nota de 1929 se presenta en detalle en


la tesis doctoral de Herbrand (1930). Su simplicidad se debe justamente a
que utiliza el principal resultado de esa tesis, el poderoso Teorema de

mo, una fórmula Φ de T2 es demostrable (con los recursos señalados) sólo si


Herbrand, cuya demostración, eso sí, es muy complicada. En virtud del mis-

ciertas fórmulas sin cuantificadores, construibles a partir de Φ según un pro-


cedimiento que Herbrand especifica, cumplen ciertas condiciones efectiva-

tales que si una fórmula Φ de T2 se halla en el caso descrito es evidente-


mente verificables. Como veremos en el Capítulo 2.7, esas condiciones son

mente imposible que su negación ¬Φ se halle también en el mismo caso.


Herbrand trata nuevamente el tema de manera más concisa, pero en cierto
modo más completa y eficaz, en el artículo póstumo “Sobre la consistencia
de la aritmética” (1931) que terminó en Göttingen el 14 de julio de 1931,
trece días antes de caer a un precipicio en el macizo de Pelvoux (tenía vein-
titrés años). Allí vindica la observación final arriba transcrita, mediante el
invento genial que examinaremos ahora. Herbrand considera ahora una teo-

15

reglas y sus inversas. Enuncia también otras, que envuelven los conectivos ∧ y →. El
“Règles de passage” es como Herbrand llama (en otros escritos) a las próximas cuatro

a pesar de que en ese escrito se acepta como primitivo el conectivo → (escrito ⊃, à


deseo de ser breve explica —pienso— la omisión de estas últimas en Herbrand 1928,

la Russell), además de ¬ y ∨.
2.6 Pruebas de consistencia 243

ría que llamaré T3, formalizada como T1 y T2 en un cálculo predicativo de


primer orden con sólo una constante (0), un predicado diádico (=) y un functor
primitivo (+1). T3 retiene los axiomas del grupo I, llamado aquí Grupo A,
pero en lugar del grupo II se introduce el siguiente Grupo B (esquema de
“inducción total”):

[B] Si Φ(x) representa una fórmula que contiene la variable libre x,


entonces la fórmula construida según el esquema siguiente es un
axioma:
(Φ(0) ∧ ∀x(Φ(x) → Φ(x + 1))) → ∀xΦ(x)

Un tercer grupo de axiomas [C] consiste en las ecuaciones requeridas para


definir un número arbitario pero finito de functores k-arios (para uno o más
enteros positivos k). Con respecto a esas ecuaciones, Herbrand sólo estipula
que (i) no pueden contener variables ligadas, (ii) permiten “calcular efectiva-
mente” el valor de la función respectiva para cualquier lista idónea de nú-
meros (k números cualesquiera, si el functor es k-ario), y (iii) se puede “de-
mostrar de modo intuicionista”16 que el valor así calculable está bien deter-
minado en cada caso.17
El último grupo de axiomas de T3 autoriza la deducción de generalizacio-
nes mediante la siguiente estipulación:

16 Cf. la definición de esta expresión por Herbrand citada en la p. 125, nota 15. Designa
precisamente los métodos sustantivos (inhaltlich), finitistas, de la metamatemática
hilbertiana.
17

α y β son, respectivamente, un término y un functor 1-ario previamente definidos, puede


Herbrand no define aquí el concepto de cálculo efectivo, pero da dos ejemplos: (1) Si

introducirse un nuevo functor ƒ caracterizado por las ecuaciones ƒ(0) = α y ƒ(x + 1) =


β(ƒx). (2) Si los términos a y b y las funciones 〈x,y〉 Å x + y y x Å x – 1 han sido
previamente definidos, se puede introducir un nuevo functor 3-ario ϕ caracterizado por
las ecuaciones ϕ(0,a,b) = a + b, ϕ(x,a,1) = a y ϕ(x + 1,a,b) = ϕ(x,a,ϕ(x + 1,a,b – 1)).
En el Capítulo 2.11 nos ocuparemos con este tema del cálculo efectivo de funciones
numéricas. Como allí veremos, la primera definición precisa del concepto (Gödel 1934),
equivalente a todas las que se han propuesto más tarde, se inspiró en una comunica-
ción privada de Herbrand a Gödel.
2.6 Pruebas de consistencia 244

[D] Si Φ(x) representa una fórmula sin variables ligadas, tal que, cuan-
do se la considera sustantivamente (esto es, como enunciando una

probar mediante “procedimientos intuicionistas” que Φ(x) es ver-


propiedad de los enteros y no como un mero símbolo), se puede

dadera para todo x, entonces ∀xΦ(x) es un axioma.

La teoría T3 así caracterizada es por lo menos tan fuerte como la aritmé-


tica clásica. Herbrand no pretende haber demostrado su consistencia y reco-
noce que, a la luz del teorema recién publicado por Gödel (1931), bien pue-
de ser imposible demostrarla.18 Su prueba de consistencia vindica sólo cier-
tos fragmentos de la aritmética, más amplios en todo caso que el vindicado
por Ackermann (1925) y von Neumann (1927). Sus resultados pueden for-
mularse así:

〈1〉
las fórmulas Φ(x) a que se refiere el Grupo B no contienen varia-
La teoría determinada por los Grupos A, B, C y D es consistente si

〈2〉
bles ligadas.

aunque las fórmulas Φ(x) a que se refiere el Grupo B contengan


La teoría determinada por los Grupos A, B, C y D es consistente

variables ligadas, si dichas fórmulas no contienen ningún functor


de los definidos en el Grupo C (en otras palabras, si el único functor
que figura en ellas es el functor 1-ario ‘+1’ caracterizado por los
dos últimos axiomas del Grupo A).

Para lograr estos resultados, Herbrand se vale de la ocurrencia que arriba


llamé genial y que ahora paso a explicar. Consiste en definir, para cada fór-

18 Entiéndase, con los métodos que él llama intuicionistas (veáse arriba, nota 16, y Capi-
tulo 2.1, nota 14). La siguiente observación con que termina Herbrand (1931) se enten-
derá mejor una vez que hayamos estudiado el descubrimiento de Gödel en el Capítulo
2.10:
No es imposible que todo razonamiento intuicionista pueda representarse (se faire)
en una aritmética con los axiomas A y B, sin admitir en C más que la adición y
la multiplicación ordinarias. De ser así, aun la consistencia de la aritmética ordi-
naria sería indemostrable.
(Herbrand, EL, p. 232)
2.6 Pruebas de consistencia 245

mula Φ(x) a que se refiere el Grupo B (sin restricciones) una función ␧ con
la siguiente propiedad: si a es el número más pequeño tal que Φ(a) es falsa,
␧(x) = 0 cuando x < a y ␧(x) = a cuando x ≥ a. La definición rigurosa de ␧
está dada por el siguiente Grupo E de esquemas (el lector debe verificar que
la función ␧ aquí definida tiene en efecto la propiedad indicada):

[E1] ␧(0) = 0

[E2] (Φ(0) ∧ ¬Φ(x + 1) ∧ ␧(x) = 0) → ␧(x + 1) = x + 1

[E3] ¬(Φ(0) ∧ ¬Φ(x + 1) ∧ ␧(x) = 0) → ␧(x + 1) = ␧(x)

[E4] ␧(x) = y + 1 → ␧(y + 1) = y + 1 ∧ ␧(y) = 0

Mediante un razonamiento tan simple como brillante, Herbrand demuestra

gamos, en efecto, que cierta fórmula Φ(x) satisface las condiciones E1–E4,
que el esquema de inducción total B es una consecuencia de E1–E4. Supon-

Φ(0) y ∀x(Φ(x) → Φ(x + 1)) son verdaderas, pero que hay un número x tal
pero que el respectivo esquema B es falso. Esto último significa suponer que

que ¬Φ(x + 1). En tal caso, E2 y E3 implican que ␧(x + 1) = x + 1 si ␧(x)


= 0 y ␧(x + 1) = ␧(x) si ␧(x) ≠ 0. Así pues, en cualquier caso, ␧(x + 1) ≠ 0,

virtud de E4, ␧(y + 1) = y + 1 y ␧(y) = 0. Esto implica que ␧(y + 1) ≠ ␧(y).


de modo que hay un número y tal que ␧(x + 1) = y + 1. Por lo tanto, en

De esta desigualdad y E3 se infiere (por modus tollens) que (Φ(0) ∧ ¬Φ(y


+ 1) ∧ ␧(y) = 0) y por ende que ¬Φ(y + 1). Supusimos inicialmente que
∀x(Φ(x) → Φ(x + 1)) es verdadera, lo cual implica que ∀x(¬Φ(x + 1) →
¬Φ(x)). Concluimos, por lo tanto, que ¬Φ(y), de modo que y ≠ 0. Hay, pues,
un número z tal que y = z + 1. Tenemos que ␧(z + 1) = ␧(y) = 0 ≠ z + 1. De
esta desigualdad y E2 se infiere (por modus tollens) que ¬(Φ(0) ∧ ¬Φ(z +
1) ∧ ␧(z) = 0), lo cual, combinado con E3, permite concluir (por modus
ponens) que ␧(z) = ␧(z + 1) = ␧(y) = 0. Por otra parte, como Φ(0) y ¬Φ(z
+ 1) —o sea, ¬Φ(y)— son verdaderas, ¬(Φ(0) ∧ ¬Φ(z + 1) ∧ ␧(z) = 0)
implica que ␧(z) ≠ 0. ¡Contradicción! Es claro, entonces, que el Grupo E

Si las fórmulas Φ(x) a que se refieren los Grupos B y E no contienen


puede sustituir al Grupo B.

po C, “pues en ese caso se puede constatar efectivamente si Φ(x) es o no


variables ligadas, los esquemas E1–E4 caen según Herbrand dentro del Gru-
2.6 Pruebas de consistencia 246

verdadera y las hipótesis E permiten calcular efectivamente los valores ␧(x)

tado 〈1〉 basta entonces probar la consistencia de los grupos A, C y D. Como


de modo unívoco y no contradictorio” (EL, p. 228). Para establecer el resul-

Teorema de Herbrand. También el resultado 〈2〉 es una consecuencia fácil de


se verá en el próximo capítulo, ello no es difícil, una vez se dispone del

ese teorema.
2.7 EL ENTSCHEIDUNGSPROBLEM
Y EL TEOREMA DE HERBRAND

El programa de Hilbert busca vindicar la matemática clásica con métodos


finitistas o “intuicionistas”1 a través del estudio de su formulación en una
escritura conceptual o cálculo lógico, como el CP1= de nuestro Apéndice
IX, o el que utilizan Whitehead y Russell. Tales cálculos tienen una propie-
dad que resulta ser importantísima para ese propósito: para decidir si un objeto
cualquiera es un signo del cálculo, si una fila de tales signos es una fórmula,
o si una lista de fórmulas es una prueba (de la última fórmula de la lista a
partir de una o más de las anteriores) basta efectuar un número finito de
operaciones simples, cada una de las cuales arroja un resultado inequívoco e
indubitable. Por ejemplo, para decidir que & no es un signo de nuestro CP1=

que una lista 〈α1,…,αn〉 de fórmulas de la teoría T1 de Herbrand 1929 (Sec-


basta compararlo con cada uno de los 10 signos del mismo; para establecer

ción 2.6.3) es una prueba de αn a partir de los axiomas [I], [II] y [III] de T1
basta determinar, con respecto a cada fórmula αk (1 ≤ k ≤ n) de la lista, que
αk es un axioma o es idéntica a la subfórmula γ de una fórmula αh = (β →
γ), donde h < k y β = αj para algún índice j < k. La índole intuitiva y ruti-
naria de tales métodos de decisión recuerda los familiares algoritmos para
calcular la suma, el producto, el mínimo común múltiplo, etc., de una lista
de enteros. Como veremos en el Capítulo 2.11, aquí no hay sólo un pareci-
do, sino una afinidad esencial. Usaré por eso el término genérico ‘algoritmo’
para referirme a cualquier procedimiento como esos. La noción es algo ne-
bulosa, pero en el Capítulo 2.11 veremos que hay varios modos (equivalen-
tes) de hacerla precisa. Diré que un cálculo lógico K es efectivo si hay un
algoritmo para decidir si una lista de objetos es una prueba en K (lo cual
supone, claro está, que haya algoritmos para decidir si un objeto cualquiera
es un signo, una fórmula o un axioma de K).

1 Sobre el uso hilbertiano del adjetivo ‘intuicionista’, vide supra, p. 125, nota 15.

247
2.7 El Entscheidungsproblem 248

Porque el cálculo de Whitehead y Russell es efectivo, sus propiedades se


pueden estudiar “metamatemáticamente” con métodos “intuicionistas”. Como
las teorías fundamentales de la matemática clásica se dejan representar en
él, Hilbert concibió la esperanza de demostrar la consistencia de esas teorías
a través de la investigación metamatemática de su representación en el cál-

senta la desigualdad 0 ≠ 0— no puede ser la última fórmula de una prueba


culo. Bastaba establecer que una fórmula dada —por ejemplo, la que repre-

a partir de los axiomas de la teoría investigada. Obviamente, el problema


quedaría resuelto si hubiera un algoritmo para decidir, ante una fórmula cual-
quiera, si ella es o no deducible de los axiomas. La efectividad del cálculo
no garantiza que tal algoritmo exista. Si el cálculo es efectivo es posible,
claro está, determinar en un número finito de pasos si cierto despliegue de
signos que termina con la fórmula en cuestión obedece o no a las reglas que
que gobiernan las pruebas. Pero otra cosa muy distinta es decidir con me-
dios finitos si en el conjunto infinito de las pruebas posibles hay o no una
que termine con esa fórmula.
En los años veinte empezó a usarse el vocablo alemán Entscheidungs-
problem (‘problema de la decisión’) para designar, por antonomasia, este
último problema. Formulémoslo con un poco más de precisión. Sea T una

fórmulas de K que son axiomas de T. Sea α una fórmula de K. Decimos que


teoría matemática representada en un cálculo efectivo K. Sea A la clase de

α es deducible de A en K —simbólicamente, A ∂K α— si hay una lista L


de fórmulas de K tal que [i] α es la última fórmula de L y [ii] si β es cual-
quier fórmula de L, o bien β ∈ A, o bien β se infiere conforme a una de las
reglas de inferencia de K de fórmulas que preceden a β en L. Un procedi-

permita decidir, en el caso de cualquier fórmula α de K, si A ∂K α o no. El


miento de decisión (Entscheidungsverfahren) para T es un algoritmo que

Entscheidungsproblem de la teoría T consiste en hallar un procedimiento de


decisión para T. Como luego explicaré, Post (1921) resolvió positivamente
el Entscheidungsproblem para el llamado cálculo proposicional, que es un
pequeño fragmento del sistema de Principia Mathematica. Animados en parte
por este éxito y también, sin duda, por la índole puramente combinatoria de
la construcción de pruebas en un cálculo efectivo, varios seguidores de Hilbert
creyeron que podrían hallar un procedimiento de decisión para el fragmento
mayor (correspondiente a nuestro CP1=) que juzgaban suficiente para re-
presentar la matemática clásica. Vimos en la Sección 2.6.2 que von Neumann
2.7 El Entscheidungsproblem 249

(1927, p. 266), con característica sagacidad, expresaba dudas con respecto a


la viabilidad de este proyecto, y no hay indicios de que Hilbert mismo se
haya interesado por él.2 En cambio, para el joven Herbrand ese era “el proble-
ma fundamental de la lógica matemática” (EL, pp. 64, 170), “en cierto modo,
el problema más general de las matemáticas” (EL, p. 210).3 Si no hubiera
creído que podía resolverlo, difícilmente habría llevado adelante la endiabla-
da demostración del teorema que lleva su nombre y que todavía sirve de
base a la solución positiva del Entscheidungsproblem en los casos especiales
en que ésta es posible (cf. Dreben y Goldfarb 1979).
Antes de seguir adelante, debo señalar que la definición de ‘procedimien-
to de decisión’ que he dado aquí, ajustándome a las formulaciones de

2 Antes bien, en su importante artículo “Sobre lo infinito”, Hilbert da por descontado


que no puede haber un método general —no digamos un algoritmo— para resolver
todos los problemas matemáticos. Tras reiterar su convicción de que en la matemática
no hay problemas insolubles, agrega: “Por cierto, mi teoría de la prueba no puede in-
dicar en general una vía por la cual todo problema matemático pueda resolverse: tal
vía tampoco existe” (1925, p. 180).
3 La última frase está tomada del resumen de la tesis doctoral de Herbrand, redactado
por él mismo y publicado sin firma en los Anales de la Universidad de París en 1931.
Vale la pena leer el párrafo completo que la precede:
Russell mostró en Principia Mathematica que para hacer matemáticas se puede
usar, en vez del lenguaje ordinario, una suerte de estenografía, de lenguaje simbó-
lico que utiliza sólo un número muy limitado de signos […], cuyas combinacio-
nes forman las frases. Pero fue más lejos y eso es lo que nos importa: mostró que
todas las demostraciones matemáticas posibles dependen de unas cuantas reglas
simples de razonamiento que él enuncia; que en toda teoría matemática determi-
nada se comienza por admitir como verdaderas ciertas proposiciones —los axio-
mas de esa teoría— que se traducen en combinaciones de signos; que todas las
demostraciones que se pueden hacer en la teoría se reducen al empleo sucesivo de
ciertas reglas bien determinadas que permiten fabricar nuevas proposiciones ver-
daderas a partir de proposiciones ya reconocidas como verdaderas, y que, si se
traduce toda la demostración al lenguaje simbólico, estas reglas pueden enunciarse
como reglas para determinadas combinaciones de los signos de este lenguaje. Así
vemos, pues, que el problema “¿Puede tal proposición demostrarse en una teoría
que tiene tales axiomas?” es un problema concerniente a los signos de este len-
guaje y sus combinaciones, y que es susceptible de un tratamiento matemático.
Esa es la forma más general del problema que los alemanes llaman el “Ent-
scheidungsproblem”. Es, en cierto modo, el problema más general de las matemá-
ticas.
(Herbrand, EL, pp. 209–10)
2.7 El Entscheidungsproblem 250

Herbrand (y a las demandas del programa de Hilbert), difiere de la que doy


en el Apéndice IX. Según ésta, un procedimiento de decisión para un cálcu-
lo lógico es un algoritmo para determinar la validez —no la deducibilidad—
de sus fórmulas. Como ambos conceptos se entrelazan en la historia que voy
a relatar, conviene distinguirlos mediante prefijos: ‘v-’ para validez, ‘d-’ para
deducibilidad.4 A un hilbertiano de estricta observancia tiene que importarle
la d-decisión, que se refiere a una propiedad sintáctica de las fórmulas, inde-
pendiente de su posible significado, y no la v-decisión, que se refiere a una
cuestión semántica, concerniente al significado y la verdad.5 Sin embargo,
los dos trabajos más importantes dedicados al Entscheidungsproblem en la
revista de Hilbert (Behmann 1922, Bernays y Schönfinkel 1928) lo caracte-
rizan exclusivamente en términos de v-decisión. Aún más llamativo es el

4 Más adelante, encontraremos un tercer concepto de decisión, en el título y en el texto


del célebre artículo de Gödel, “Sobre proposiciones formalmente indecidibles de Prin-

signo de negación que representaré con ¬. Sea R una relación n-ádica entre números
cipia Mathematica y sistemas afines” (1931). Sea K un cálculo lógico efectivo con un

naturales (n ≥ 1). R es decidible en K en el sentido de Gödel 1931 si K tiene una


fórmula con n variables libres φ(ξ1,…,ξn), tal que ∅ ∂K φ(α1/ξ1,…,αn/ξn) si
α1,…,αn son los nombres en K de una lista de números que tiene la relación R y ∅
∂K ¬φ(α1/ξ1,…,αn/ξn) si α1,…,αn son los nombres en K de una lista de números
que no tiene la relación R. (La notación φ(α1/ξ1,…,αn/ξn) se explica en el Apéndice
IX, p. 485). Conviene advertir que Gödel no es enteramente responsable de esta con-
fusión terminológica. En la definición que acabo de parafrasear, donde —como todos
los traductores— digo ‘decidible’, el original no dice ‘entscheidbar’, sino ‘entscheidungs-
definit’, que propiamente significa ‘determinado con respecto a la decisión’. Como Gödel
estaba indudablemente familiarizado con los conceptos de v-decisión y d-decisión arri-
ba explicados y con el llamado Entscheidungsproblem, cabe pensar que con la palabra
‘entscheidungsdefinit’ no quiso decir ‘decidible’ —en una nueva y caprichosa acep-
ción— sino ‘determinado con vistas a (o para los efectos de) la d-decisión’. Pero Gödel
usa invariablemente ‘unentscheidbar’ (‘indecidible’) para calificar las relaciones que no
son entscheidungsdefinit —así como las proposiciones que las aseveran— hasta en el
mismo título de su trabajo.
5 Como incisivamente advierte Kleene (1952, p. 175), “la noción misma de validez no
es finitista (finitary) en el caso de un dominio infinito y una fórmula que contenga [un
predicado n-ádico]. Pues supone que el valor de una función sea [0] para todas las
funciones lógicas de n variables consideradas como valores de ese predicado, y la cla-
se de tales funciones lógicas es indenumerable y por ende sólo es concebible (como
solemos pensar) en términos del infinito actual”. (Los corchetes marcan dos pequeños
cambios que he introducido en el texto de Kleene para ajustarlo a nuestro Apéndice
IX).
2.7 El Entscheidungsproblem 251

hecho de que tanto Post como Herbrand, que ponen sus miras resueltamente
en la d-decisión, la abordan, como veremos, con lo que en el fondo son
métodos de v-decisión, que sirven al interés declaradamente sintáctico de estos
autores porque ocurre que se ocupan con cálculos en los que toda fórmula
válida es a la vez deducible.
El concepto semántico de fórmula válida definido en el Apendice IX (para
el CP1= y el CP2=) es, por cierto, posterior a estos trabajos: lo introdujo
Tarski en un escrito que apareció en polaco en 1933, en alemán sólo en 1935
(Capítulo 3.1). Pero un concepto análogo está implícito ya en los argumen-
tos con que Frege justifica los axiomas y reglas de inferencia de su cálculo
BS (1879) y figura destacadamente en la obra de Schröder (VAL, 1890ss.),
quien, inspirándose en Boole y sobre todo en Peirce, fundó en Alemania otra
tradición de lógica matemática.6 Esa tradición culmina en el articulo de
Leopold Löwenheim, “Sobre posibilidades en el cálculo de relativos” (1915).
Dicho artículo, que por su simbolismo obsoleto nos resulta hoy casi ilegible,
fue estudiado acuciosamente por Skolem, Herbrand y Gödel. Contiene la
primera versión del célebre Teorema de Löwenheim y Skolem. Rompiendo
el orden cronológico, dejo su estudio para el Capítulo 3.2, porque la obra de
Tarski a que se refiere el Capítulo 3.1 nos ayudará a entender mejor el punto
de vista semántico presupuesto en la concepción misma del teorema. Pero
debo dar aquí algunas indicaciones sobre dicho punto de vista, pues Gödel
lo adopta en las investigaciones que estudiaremos en los Capítulos 2.8 y 2.10,
y el propio Herbrand, cuya ortodoxia hilbertiana le impedía adoptarlo, lo
explota como un recurso metódico.

evitaré citar sus fórmulas.7 Éstas son ecuaciones, casi siempre de la forma Φ
Para no fatigar al lector con el aprendizaje del simbolismo de Löwenheim,

= 0 ó Φ = 1, donde Φ es una expresión que contiene variables, que pueden


ser de distintos tipos. En las ecuaciones de primer orden8 —las únicas a que

6 En cambio, en Principia Mathematica el concepto de validez brilla por su ausencia.


7 La nota introductoria a la traducción inglesa de Löwenheim 1915 en van Heijenoort
1967 contiene indicaciones sobre el “cálculo de relativos” de Peirce-Schröder que bas-
tan para descifrar ese escrito y los escritos tempranos de Skolem.
8 Löwenheim las llama “ecuaciones numéricas” (Zahlgleichungen). El nombre que les
doy corresponde al utilizado en la traducción inglesa de Löwenheim 1915 citada en la
nota precedente. Se justifica porque toda ecuación numérica en el sentido de Löwenheim
puede expresarse mediante una fórmula de nuestro cálculo predicativo de primer orden
2.7 El Entscheidungsproblem 252

voy a referirme aquí— las variables son de un solo tipo y recorren un mis-
mo dominio de objetos (Denkbereich, “universo del discurso”), no vacío pero

11. Dependiendo de su estructura, Φ denota una clase de n-tuplos de objetos


por lo demás indeterminado, que Löwenheim, siguiendo a Schröder, llama

de 11 o expresa una aseveración sobre tales objetos o clases. El significado

sión Φ a la izquierda: si ésta nombra una clase de n-tuplos, 1 es la clase de


del signo ‘1’ a la derecha de la ecuación depende de la índole de la expre-

todos los n-tuplos posibles; pero si Φ es una aseveración, ‘Φ = 1’ expresa


que Φ es verdadera. 0 es en todo caso el complemento booleano del 1 per-
tinente: la clase vacía, si 1 es una clase; “lo falso”, si 1 es una aseveración.
Como es obvio, una ecuación que en cierto dominio de objetos se cumple
(vale, está satisfecha) como quiera que se fijen los valores de sus variables,
puede no cumplirse en otro dominio. Una ecuación satisfecha en todo caso,
cualquiera que sea el dominio 11, es una ecuación idéntica. Löwenheim lla-
ma Fluchtgleichung —digamos ecuación huidiza— a una ecuación que no
es idéntica, pero que se cumple en cada dominio finito, como quiera que se
fijen los valores de sus variables; y llama Haltgleichung —diré ecuación
detenible— a una ecuación que falla para alguna asignación de valores a sus
variables en un dominio finito.9 Evidentemente, la clasificación de las
ecuaciones en idénticas, huidizas y detenibles es una partición.
El Teorema 2 de Löwenheim (1915) dice que toda ecuación huidiza de
primer orden falla para alguna asignación de valores a sus variables en un
dominio enumerable. Este es el enunciado original del célebre teorema ge-
neralizado más tarde por Skolem.10 Pero en el presente contexto nos interesa

CP1= y toda fórmula del CP1= puede representarse mediante una ecuación numérica
en el sentido de Löwenheim.
9 La idea que inspira esta curiosa terminología me parece ser la siguiente. Podemos tra-
tar de refutar la validez universal de una ecuación examinando si se cumple en domi-
nios de 1, 2, 3,… objetos. Si ella es una Haltgleichung este proceso se detiene con
algún entero positivo n; pero en el caso de una Fluchtgleichung el proceso continúa
indefinidamente a pesar de que la ecuación no es universalmente válida. Así, la ecua-
ción huidiza es una que logra escapar a la refutación que sin embargo merece.
10 La formulación habitual del Teorema “ascendente” de Löwenheim-Skolem generaliza
el siguiente corolario, derivado por contraposición del enunciado anterior: si una ecua-
ción de primer orden está satisfecha —como quiera que se fijen los valores de sus
variables— en un dominio enumerable y en cada dominio finito, esa ecuación es una
ecuación idéntica.
2.7 El Entscheidungsproblem 253

más el Teorema 4. Digamos que una ecuación de primer orden es unaria si


contiene expresiones que denotan clases de objetos de 11, pero no contiene
ninguna expresión que denote, para algún n > 1, una clase de n-tuplos de
tales objetos. Tales ecuaciones pueden evidentemente representarse en aquel
fragmento del CP1= que no contiene predicados poliádicos. Este fragmento
del CP1= (o de otro cálculo lógico equivalente o análogo) suele llamarse
cálculo de predicados monádicos. El Teorema 4 dice que ninguna ecuación
unaria es huidiza. Esto significa que toda ecuación unaria es detenible o
idéntica. La demostración —que Löwenheim solamente bosqueja— provee
un método constructivo que permite establecer, con respecto a cada ecua-
ción unaria en que figuran k predicados monádicos diferentes, o bien que
ella es idéntica, o bien que no está satisfecha para alguna asignación de
valores en un dominio de 2k objetos. Tal método constituye en efecto un
procedimiento de v-decisión para el cálculo de predicados monádicos. El
Teorema 4 de Löwenheim (1915) constituye pues la primera solución posi-
tiva parcial —avant la lettre— del Entscheidungsproblem (en sentido
semántico, es decir, como problema de la v-decisión).11
La tesis doctoral de Emil Post, “Introducción a una teoría general de las
proposiciones elementales” (1921) plantea explícitamente y resuelve el pro-
blema de la d-decisión con respecto a una parte del sistema deductivo de
Principia Mathematica. Dicha parte comprende precisamente lo que en la
jerga de nuestro Apéndice IX llamaríamos fórmulas verifuncionales y los
axiomas que consisten en fórmulas de esa clase. Su nombre tradicional es
cálculo proposicional, porque se entiende que los predicados 0-ádicos (“va-
riables proposicionales”) que figuran en tales fórmulas representan proposi-
ciones indeterminadas.12 Siguiendo a Whitehead y Russell (PM, *1), Post

11 Así lo entiende Behmann en su escrito “Contribuciones al álgebra de la lógica, espe-


cialmente al Entscheidungsproblem” (1922). La principal contribución que ahí se ofre-
ce es precisamente el Teorema 4 de Löwenheim 1915, reformulado como solución al
problema de la v-decisión del cálculo de predicados monádicos. Behmann da una de-
mostración detallada y relativamente clara, basada en la de Löwenheim; pero aún más
clara es la elegante demostración de Bernays y Schönfinkel (1927) que presento en el
Apéndice XIV.
12 El rechazo filosófico de la idea misma de proposición inspiró luego el nombre sentential
calculus que suele, curiosamente, vertirse al castellano como ‘cálculo sentencial’, qui-
zás porque la palabra ‘oración’ —equivalente exacto de la inglesa ‘sentence’— tiene,
además de su significado gramatical, uno religioso (la alergia a la connotación paralela
2.7 El Entscheidungsproblem 254

llama ‘proposiciones elementales’ a las fórmulas de este cálculo, pero como


aquí hemos reservado el adjetivo ‘elemental’ para sus ingredientes inana-
lizables (que otros llaman ‘fórmulas atómicas’), las llamaré, como de cos-
tumbre, ‘fórmulas verifuncionales’ o simplemente ‘fórmulas’ (si no hay pe-
ligro de confusión). Post adopta un punto de vista decididamente sintáctico:
estudia el cálculo proposicional de Principia y ciertas generalizaciones del
mismo exclusivamente como objetos formales (“as purely formal develop-
ments”—p. 266).13 Sus resultados “conciernen a la lógica de las proposicio-
nes pero no están incluidos en ella” (p. 265). Esta observación anticipa el
distingo hilbertiano entre los razonamientos formales, que la metamatemática
estudia, y los razonamientos sustantivos (inhaltlich), que ella practica; pero,
en contraste con Hilbert, que quería rebatir el intuicionismo con los limita-
dos recursos que éste admite, Post está dispuesto a aprovechar “cualquier
instrumento de la lógica y la matemática que [encuentre] útil” (p. 266).14
La descripción del cálculo proposicional, organizado como sistema de-
ductivo, está contenida en cuatro postulados. El Postulado I da la regla para
construir nuevas fórmulas a partir de una o dos fórmulas dadas. Los Postu-
lados II y III dan reglas para obtener nuevos asertos a partir de uno o dos
asertos dados. El Postulado IV despliega los asertos primitivos. Conviene
advertir que las mismas letras minúsculas p, q, r, con o sin subíndices nu-
méricos, que Whitehead y Russell usaban como variables del cálculo
proposicional (el equivalente de nuestros predicados 0-ádicos), Post las uti-
liza como parte del idioma de trabajo (o sea, como “letras esquemáticas” o
“variables metalingüísticas”) para representar variables proposicionales cua-
lesquiera, y también, aparentemente (en el Postulado I), para representar
fórmulas cualesquiera. Por otra parte, usa bien decididamente las mayúscu-

habría operado, quizás, en la otra dirección si entre los profesores de filosofía de habla
castellana fuese mayor el número de ex-penados y no tan grande el de ex-seminaristas).
13 Para “una formulación general de este punto de vista”, Post remite al capítulo VI de la
obra de C. I. Lewis, Survey of Symbolic Logic (1918), desgraciadamente omitido en la
reimpresión de 1960. Leemos allí que “un sistema matemático es cualquier conjunto
de filas de signos reconocibles (strings of recognizable marks) en el cual algunas filas
se adoptan inicialmente y las demás se derivan de ellas mediante operaciones ejecuta-
das conforme a reglas que son independientes de cualquier significado asignado a las
signos” (p. 355; en el original, este pasaje está destacado en cursiva).
14 Como veremos en el Capítulo 2.8, Gödel 1930 adoptará una postura metódica similar.
2.7 El Entscheidungsproblem 255

las P y Q para representar fórmulas indeterminadas (en el Postulado III).


Como es habitual, Post usa los conectivos del cálculo para nombrarlos al
discurrir sobre éste.15 El cálculo proposicional de Principia Mathematica tiene
dos conectivos primitivos, ~ y ∨, en términos de los cuales se definen estos
tres: ⊃, ⋅ y ≡. Post usa estos cinco signos como en ese libro, pero aquí los
reemplazaré por ¬, ∨, →, ∧ y ↔, respectivamente. Por lo demás, usaré li-
bremente la jerga de nuestro Apéndice IX. Para la puntuación usaré parénte-
sis en vez de los sistemas de puntos que Post imita de Principia. Post se
vale del signo fregeano ∂ prefijado a un esquema de fórmulas para indicar
que cualquier fórmula construida según ese esquema es una aseveración
(assertion). Entiendo que este signo no pertenece al cálculo, sino al discurso
sobre el cálculo.
A continuación enuncio los postulados con que Post caracteriza el cálculo
proposicional de Principia Mathematica.

Si p y q son fórmulas verifuncionales (elementary propositions), ¬p


y (p ∨ q) son fórmulas verifuncionales.16
I

II Si una aseveración t contiene una variable del cálculo p, y q y r

verifuncional obtenida al reemplazar p por q, o por ¬q, o por (q ∨


son variables del cálculo, también es una aseveración la fórmula

Si P y Q son fórmulas verifuncionales tales que ∂P y ∂(¬P ∨ Q),


r) en todas las posiciones que p ocupa en t.
III

∂(¬(p ∨ p) ∨ p), ∂((¬(p ∨ (q ∨ r)) ∨ (q ∨ (p ∨ r))),


entonces ∂Q.

∂(¬q ∨ (p ∨ q)), ∂(¬(¬q ∨ r) ∨ (¬(p ∨ q) ∨ (p ∨ r))),


IV

∂(¬(p ∨ q) ∨ (q ∨ p)).17

15

expresión ‘(p ∨ q)’ representa la fila de signos formada por el paréntesis izquierdo,
Por ejemplo, cualesquiera que sean las fórmulas representadas por las letras p y q, la

seguido de la fórmula representada por p, seguido del signo de disyunción, seguido de


la fórmula representada por q, seguido del paréntesis derecho.
16 Post escribe “p ∨ q”, sin los paréntesis, que introduce luego sin estipulación previa en
los esquemas de fórmulas más complejas. Pero el uso de los paréntesis tiene que regir-
se por un postulado, igual que el uso de los conectivos, aunque más tarde se autorice
su eliminación —informal— si no hay riesgo de confusión.
17 Salvo por la sustitución de símbolos arriba descrita, reproduzco fielmente el Postulado

mejor si reemplaza cada fila de la forma (¬α ∨ β) por una de la forma (α → β).
IV de Post (p. 267). El lector poco familiarizado con la lógica moderna lo entenderá
2.7 El Entscheidungsproblem 256

El teorema fundamental demostrado por Post acerca del cálculo propo-


sicional establece la condición necesaria y suficiente para que una fórmula
del conjunto definido mediante el postulado I “sea aseverada (asserted) en
virtud de los postulados II, III y IV” (1921, p. 269), esto es —en la termino-
logía del Apéndice IX— para que sea deducible de los axiomas (IV) confor-
me a las reglas de inferencia por sustitución (II) y modus ponens (III). La
demostración de este teorema descansa en una interpretación algebraica de
las fórmulas del cálculo (o de los esquemas con que Post los representa—no
sabría decir cuál de estas dos alternativas es la que tiene presente; para no
distraer al lector me referiré expresamente sólo a la primera). Dicha inter-
pretación consiste sencillamente en esto: cada fórmula representa una opera-
ción algebraica sobre un dominio que contiene dos objetos. Post los designa
con los signos ‘+’ y ‘–’, pero yo usaré los signos ‘0’ y ‘1’. Como es habitual
en este género de representaciones, las letras representan los argumentos de
la operación. Así, una fórmula con n variables proposicionales diferentes re-
presentará una aplicación de {0,1}n en {0,1}. Como cabe esperar, la aplica-
ción ¬:{0,1} Æ {0,1} se define por la doble condición ¬0 = 1, ¬1 = 0, y
la aplicación ∨:{0,1}2 Æ {0,1} por la cuádruple condición (0 ∨ 0) = (0 ∨ 1)
= (1 ∨ 0) = 0 y (1 ∨ 1) = 1. Cada fórmula del cálculo proposicional (o cada
esquema) representa entonces alguna aplicación ϕ: {0,1}n Æ {0,1} definida

teorema siguiente: Toda aplicación ϕ: {0,1}n Æ {0,1} está representada por


por composición (generalmente repetida) de éstas dos. Post demuestra el

una fórmula.18 Diremos con Post que una tal aplicación es positiva si su valor
es idénticamente 0 en todos sus argumentos (recuérdese que Post escribe ‘+’
en vez de ‘0’), negativa si su valor es idénticamente 1 (‘-’), y mixta si ad-
mite ambos valores. Esta partición de las operaciones algebraicas sobre {0,1}
se extiende naturalmente a las fórmulas que las representan. Digamos con

La demostración es muy fácil de seguir si escribimos (p ∧ q) —o, como Post, p⋅⋅q—


para abreviar ¬(¬p ∨ ¬q). En tal caso, la aplicación ∧: {0,1}2 Æ {0,1} queda defini-
18

da por las ecuaciones (0 ∧ 0) = 0, (0 ∧ 1) = (1 ∧ 0) = (1 ∧ 1) = 1. La demostración

que n = 1, representadas, respectivamente, por (p ∨ p), (p ∨ ¬p), ¬(p ∨ ¬p) y ¬p.


procede por inducción sobre el número de argumentos n. Hay cuatro aplicaciones tales

que ƒ(p1,…, pk+1) = ((pk+1 ∧ ƒ1(p1,…, pk)) ∨ (¬pk+1 ∧ ƒ2(p1,…, pk)), donde ƒ1
Supongamos que el teorema vale si n = k y que ƒ aplica {0,1}k+1 en {0,1}. Es fácil ver

y ƒ2 son aplicaciones de {0,1}k en {0,1} y por ende están representadas por fórmulas,
conforme a la hipótesis inductiva.
2.7 El Entscheidungsproblem 257

Post que una fórmula α está contenida en un fórmula β si α se deriva de β


por una o más aplicaciones de la regla de sustitución II. Post demuestra que
toda fórmula contenida en una fórmula positiva (negativa) es positiva (nega-
tiva) y que toda fórmula mixta con n variables diferentes contiene al menos
una fórmula representativa de cada operación n-aria. La condición necesaria
y suficiente para que una fórmula verifuncional sea aseverada en virtud de
los postulados II, III y IV es que ella sea positiva. Es muy fácil demostrar
que esta condición es necesaria: un cálculo rápido muestra que cualquier
fórmula construida según los esquemas del postulado IV es positiva; ya se-
ñalamos que toda fórmula derivada por sustitución de una fórmula positiva
es positiva, y es evidente que toda fórmula derivada por modus ponens de
dos fórmulas positivas es positiva. Para demostrar que la condición es sufi-

cualquier fórmula positiva α. En otras palabras, Post nos da lo que se llama


ciente, Post establece un método general para derivar la aseveración ∂α de

una demostración constructiva: no se limita a probar en abstracto que cada


fórmula positiva es deducible por II y III de los axiomas IV, sino que enseña
“un método para escribir inmediatamente una derivación formal de su ase-
veración basada en los postulados” (1921, p. 271; en cursiva en el original).
La demostración de Post, relativamente simple, será el paradigma de otras
más complejas. La reproduzco en el Apéndice XV.
Como la positividad o no positividad de una fórmula puede establecerse
computando el valor de la operación respectiva para cada asignación de va-
lores a sus argumentos, el teorema fundamental de Post resuelve el proble-
ma de la d-decisión para el cálculo proposicional. Pero su significación no
se limita a eso. Como el lector se habrá dado cuenta, las fórmulas positivas
según la interpretación algebraica son precisamente las fórmulas válidas se-
gún la interpretación lógica familiar presentada en el Apéndice IX.19 Por lo
tanto, al establecer que una fórmula verifuncional es deducible de los postu-
lados II, III y IV si y sólo si es positiva, Post ha demostrado que el sistema
deductivo descrito es a la vez correcto y completo, esto es, que toda fórmula

19 Post mismo nos lo hace presente cuando introduce su interpretación algebraica del
cálculo proposicional con estas palabras: “Denotaremos el valor veritativo de cualquier
proposición p con + si es verdadera y con – si es falsa. Conviene tener en vista este
significado de + y – como una guía del pensamiento, pero en la exposición siguiente
deben considerarse meramente como símbolos que manipulamos de cierta manera”
(1921, p. 267).
2.7 El Entscheidungsproblem 258

deducible es válida y toda fórmula válida es deducible (Apéndice IX.F).20


Por esta razón, cualquier procedimiento de v-decisión —como el conocido
método de las tablas de verdad utilizado en efecto por Post— constituye a la
vez un procedimiento de d-decisión. Post establece además que el cálculo

formula α, o bien α es deducible, o bien ¬α es deducible. Un sistema de-


proposicional tiene la siguiente interesante propiedad: cualquiera que sea la

completo en el sentido de Post.21 Si ∆ es el conjunto de todas las fórmulas


ductivo que posea esta propiedad —puramente sintáctica— suele llamarse

deducibles en un sistema completo en este sentido y α es cualquier fórmula


que no pertenece a ∆, entonces ∆ ∪ {α} es inconsistente (puesto que ¬α ∈
∆). Por lo tanto, un sistema deductivo completo en el sentido de Post no
puede fortalecerse sin engendrar contradicciones.22

20 Es oportuno señalar que Bernays, en su Habilitationsschrift inédito de 1918, había


establecido que un sistema deductivo equivalente al considerado por Post es completo
en el sentido indicado (toda tautología verifuncional es deducible de sus axiomas).
Bernays 1926 es una versión abreviada de ese trabajo.
21 Conviene observar que el adjetivo ‘completo’ (complete) no se usa así en Post 1921.
Allí, un “sistema completo” es un cálculo proposicional en que “every truth system

todas las aplicaciones de {V,F}n en {V,F} para cualquier n ≥ 1 (p. 273; véase arriba, la
has a representation”, esto es, uno cuyos conectivos primitivos bastan para representar

nota 18). En cambio, un sistema consistente, completo en el sentido de Post, en Post


1921 se llama “closed”, cerrado (p. 277).
22 La mayor parte de la tesis doctoral de Post (1921) se consagra a generalizaciones del
cálculo proposicional. Aunque caen fuera del tema de esta sección, diré aquí breve-
mente de qué se trata. Post considera generalizaciones de tres tipos: por variación de
los conectivos primitivos, por variación de los postulados y por variación del número
de objetos (“valores veritativos”) contenidos en el dominio de la interpretación
algebraica. Con respecto al primer tipo, conviene identificar los sistemas cuyos
conectivos primitivos permiten representar el mismo conjunto de operaciones algebraicas
sobre {0,1}; Post remite a un trabajo futuro en el cual promete demostrar que hay 66

si admitimos conectivos primitivos n-arios con n ≥ 4, se generan ocho familias infini-


sistemas diferentes cuyos conectivos primitivos son unarios, binarios y ternarios, y que,

tas de sistemas (cf. Post 1941); luego establece las condiciones que debe reunir los
postulados de un sistema capaz de representar todas las operaciones sobre {0,1} para
que dicho sistema sea completo en el sentido de Post. A propósito del segundo tipo de
generalización, Post estipula que llamará “inconsistente” a cualquier sistema en que
sea deducible la variable proposicional p. El tercer tipo de generalización concierne a
las llamadas “lógicas polivalentes”; Post ve una analogía entre el dominio de la inter-
pretación algebraica de un cálculo proposicional y el espacio de una geometría,
específicamente, entre la numerosidad de aquél y el número de dimensiones de éste;
ella motiva la aguda observación siguiente:
2.7 El Entscheidungsproblem 259

En los próximos años Post trabajó intensamente en una teoría general de


los sistemas formales (cálculos lógicos) con miras a resolver el problema de
la d-decisión para el sistema entero de Principia Mathematica. Hacia 1924
se convenció —mediante un argumento “diagonal” como el utilizado por
Turing (1937)— de que la solución tenía que ser negativa. Pero no publicó
nada.23 Por ese mismo tiempo, jóvenes matemáticos europeos, privados de
la luz que podría haberles proporcionado un contacto siquiera verbal con su
colega americano, acometían el Entscheidungsproblem con un entusiasmo dig-
no de mejor causa. Concentraré mi atención en la obra de Herbrand, que
constituye en cierto modo el ne plus ultra en esta materia. Su máximo logro
es el Teorema de Herbrand a que he aludido un par de veces. Bernays (1954)
lo llama “el teorema central de la lógica de los predicados”. La tesis docto-
ral de Herbrand, Investigaciones sobre la teoría de la demostración (1930),
está entera dirigida a probarlo. No es posible reproducir la prueba aquí:
larguísima ya en la versión defectuosa del autor, ha crecido todavía más con
las correcciones de Dreben y sus colaboradores.24 Pero vale la pena explicar

Mientras el espacio intuitivo de puntos con mayor número de dimensiones tiene


tres, el espacio intuitivo de proposiciones con mayor número de dimensiones tie-
ne dos. Pero tal como podemos interpretar intuitivamente los espacios geométricos
de mayor número de dimensiones usando un elemento distinto del punto, inter-
pretaremos los espacios de mayor número de dimensiones de nuestra lógica to-
mando como elemento algo que no sea la proposición.
(Post 1921, p. 281)
23 Mucho más tarde, Post redactó un largo informe sobre sus investigaciones de ese pe-
ríodo, al que incorpora extractos de sus notas, para documentar cómo había anticipado
los grandes hallazgos de Gödel, Church y Turing a que me refiero en los Capítulos
2.10 y 2.11. Dicho informe fue publicado póstumamente en la antología The Undecidable
editada por Martin Davis (1965).
24 Dos de las proposiciones auxiliares que Herbrand utiliza en su prueba y alegadamente
demuestra son, en efecto, falsas: el decisivo lema del § 3.3 y el Lema 3 del § 5.3
(Herbrand 1930, cap. 5). Dreben, Andrews y Aanderaa 1963 dan contraejemplos que
ponen su falsedad en evidencia. Dreben 1963 enuncia un nuevo lema con que reempla-
zar al del § 3.3. Una versión corregida del argumento de Herbrand se bosqueja en
Dreben, Andrews y Aanderaa 1963a y Dreben y Anderaa 1964. Dreben y Denton 1966
dan una demostración detallada del lema sustituto. La admirable versión inglesa de los
escritos de Herbrand editada por Goldfarb (Herbrand LW) contiene varias notas —en
parte redactadas por Dreben— que explican claramente este asunto. Las notas de Dreben
se publicaron ya con la traducción inglesa del capítulo 5 de Herbrand 1930 en van
Heijenoort 1967.
2.7 El Entscheidungsproblem 260

el significado del Teorema.


Como vimos en la Sección 2.6.3, Herbrand considera teorías axiomáticas
expresables en un cálculo predicativo de primer orden esencialmente igual a
nuestro CP1= (las diferencias son muy superficiales y aquí las pasaré por
alto). El enfoque es estrictamente sintáctico: aunque Herbrand habla de
propositions, las caracteriza como filas de signos, por lo cual me parece jus-
to llamarlas ‘fórmulas’.25 El cálculo está organizado como un sistema deduc-
tivo equivalente al sistema de primer orden de Principia Mathematica. Una
fórmula verdadera (vraie) o identidad es una fórmula deducible de los axio-
mas conforme a las reglas de inferencia.
En una fase preliminar, Herbrand considera solamente fórmulas compues-
tas de letras minúsculas (propositions-éléments, correspondientes a nuestros

Russell), los conectivos ¬ y ∨, y signos de puntuación, esto es, lo que en el


predicados 0-ádicos y a las “variables proposicionales” de Whitehead y

Apéndice IX.C llamo fórmulas verifuncionales. Con ellas organiza un siste-


ma deductivo equivalente al definido por los Postulados I–IV de Post. Las
fórmulas deducibles en este sistema son “identidades de la primera especie”.
Herbrand asocia a cada letra minúscula lo que llama un “valor lógico”, con-
sistente en una de las dos letras mayúsculas V y F. El valor lógico de una
fórmula compuesta exclusivamente de variables proposicionales, conectivos
y signos de puntuación depende de los valores lógicos asignados a sus va-
riables proposicionales, según reglas que ya nos son familiares. Herbrand tam-
bién designa los valores lógicos con las palabras francesas vrai y faux (‘ver-
dadero’ y ‘falso’), lo que puede ocasionar confusión con el uso de vraie en
la acepción de ‘deducible en el sistema’. Herbrand demuestra, como Post,
que una fórmula verifuncional es deducible en el cálculo proposicional de
Principia Mathematica si y sólo si su valor lógico es V cualquiera que sea
el valor lógico asignado a las minúsculas componentes.
Herbrand pasa luego a ocuparse con su tema principal, el cálculo predica-

con la versión máxima de nuestro CP1= (con ¬ y ∨ como únicos conectivos


tivo de primer orden con identidad, que, para mayor claridad, identificaré

“oficiales”). Forma este cálculo como una extensión del anterior, agregándo-
le los signos de cuantificación y de igualdad y secuencias infinitas de (i)

25

~ y ∨ conforme a las reglas precedentes y a las que se verán en 1.4 se llama una
“Una colección (assemblage) de letras, signos y puntos formada a partir de los signos

proposición” (Herbrand 1930, cap. 1, § 1.3; EL, p. 44; cf. p. 72).


2.7 El Entscheidungsproblem 261

para cada n ≥ 1 y (iv) functores n-arios, para cada n ≥ 1. Herbrand trata a


variables individuales, (ii) constantes individuales, (iii) predicados n-ádicos,

las fórmulas sin variables individuales que este cálculo hereda del anterior
como “predicados con 0 términos” (fonctions propositionelles à 0 argument—
EL, pp. 59f.; el lector reconocerá aquí la fuente de nuestra expresión ‘predi-
cado 0-ádico’). Una proposition élément consta de un predicado seguido del
número apropiado de variables. Me permitiré llamarla fórmula elemental,
como en el Apéndice IX. Por su parte, Herbrand llama propositions
élémentaires a las fórmulas compuestas de propositions éléments y que no
contienen cuantificadores; pero a estas fórmulas —que Herbrand también
describe como fonctions propositionelles de première espèce— yo las llama-
ré matrices. Los componentes elementales de una matriz son las distintas
fórmulas elementales que figuran en ella. Llamaré valuación de una matriz a
la asignación arbitraria de un “valor lógico” V o F a cada uno de sus com-
ponentes elementales; cada valuación confiere obviamente un “valor lógico”
determinado a la matriz misma, computable por el procedimiento de las ta-
blas de verdad.
Si admitimos como axiomas a todas las fórmulas construidas sustituyen-
do letras por fórmulas elementales en los esquemas del Postulado IV de Post,
el teorema relativo a las identidades de la primera especie se extiende natu-
ralmente a las matrices: una matriz se deduce de dichos axiomas por susti-
tución y modus ponens si y sólo si su valor es V en todas sus valuaciones.
En tal caso, decimos con Herbrand que la matriz es una identidad de la pri-

matriz µ tiene esta propiedad si y sólo si µ es una tautología en el sentido


mera especie con respecto a sus componentes elementales (obviamente, una

del Apéndice IX.C). Como esta propiedad es decidible mediante un algorit-


mo, Herbrand se desentiende de los axiomas tradicionales del cálculo
proposicional y adopta como axiomas del cálculo de primer orden todas las
matrices cuyo valor sea V en cualquier valuación.26 No admite otros axio-

26 “Les propositions élémentaires qui, considérées comme des fonctions propositionelles


de première espèce de leurs propositions-éléments, sont des identités de première espèce
seront vraies” (Herbrand 1930, cap. 2, § 2.2,; EL, p. 63; cursiva en el original). Se
advertirá que esta clase de fórmulas es más estrecha que la de las tautologías, definida

cuantificadores. Por ejemplo, la tautología (∀xPx ∨ ¬∀xPx) no es un axioma según la


en el Apéndice IX.C, pues comprende sólo aquéllas de entre éstas que no contengan

estipulación citada.
2.7 El Entscheidungsproblem 262

de simplificación: de (φ ∨ φ), deducir φ; 3º las reglas de generalización—si


mas. Adopta las siguientes reglas de inferencia: 1º modus ponens; 2º la regla

φ(x) contiene la variable libre x, de φ(x) deducir ∀xφ(x) o ∃yφ(x,y), donde


φ(x,y) es cualquier fórmula obtenida reemplazando x por y en una o más
posiciones libres de x en φ(x); 4º las reglas de transición (règles de passage)
que autorizan a sacar un cuantificador del alcance de un conectivo o a po-
nerlo dentro de él (conforme a los esquemas (4), (5), (8) y (9) del Apéndice

bles;27 específicamente, una variable ξ se puede reemplazar por otra variable


XIII). Herbrand da por supuesto que las variables ligadas son intercambia-

cualquiera ζ en todas las posiciones en que ξ esté ligada por un cierto


cuantificador en una fórmula φ, siempre que ζ no figure libre dentro del
alcance de ese cuantificador ni esté ligada en φ por otro cuantificador cuyo
alcance incluya posiciones de la variable que se quiere reemplazar. Pero
Herbrand no postula expresamente una regla de inferencia a este efecto.
Herbrand dice que “el problema fundamental de la lógica matemática con-
siste en hallar un procedimiento que permita siempre reconocer si una fór-
mula (proposition) es deducible (vraie) o no en esta teoría” (1930, cap. 2,
2.1; EL, p. 64). Su estrategia para resolverlo consistió en tratar de reducir el
caso general al caso especial de las matrices, ya resuelto. Para ello asocia

ré cómo construir tales matrices en el caso de una fórmula cualquiera φ de


una clase bien determinada de matrices a cada fórmula del cálculo. Explica-

nuestro CP1=. Divido la explicación en varios pasos, numerados para ma-


yor claridad.

27 “Se sobreentiende que la letra que designa una variable puede ser reemplazada sin incon-
veniente por otra (y, en particular, se puede utilizar cualquier letra como variable liga-
da), a condición eso sí de que dos variables [dentro de una misma fórmula] no pueden
designarse con la misma letra más que en el caso en que ambas estén ligadas y que sus
alcances [en nuestra jerga: el alcance de los cuantificadores que las ligan—R.T.] no
tengan ningún signo en común” (Herbrand, EL, p. 62). A la luz de la equivalencia (7)

nuestro CP1=. Sin ella no es posible deducir la tautología (∀xPx ∨ ¬∀xPx) en el sis-
del Apéndice XIII es claro que esta convención está semánticamente justificada en

tema de Herbrand. En efecto, partiendo del axioma (Px ∨ ¬Px) tenemos la deducción
siguiente (donde simbolizo con ⇒ cada aplicación de una de las reglas de generaliza-
ción o transición): (Px ∨ ¬Px) ⇒ ∃y(Px ∨ ¬Py) ⇒ (Px ∨ ∃y¬Py) ⇒ (Px ∨ ¬∀yPy)
⇒ ∀x(Px ∨ ¬∀yPy) ⇒ (∀xPx ∨ ¬∀yPy). Conforme a la convención citada, la conclu-
sión puede reescribirse (∀xPx ∨ ¬∀xPx).
2.7 El Entscheidungsproblem 263

especificada, podemos, sin pérdida de generalidad, requerir que φ cumpla las


(1) Como las variables ligadas son intercambiables en la forma arriba

tres condiciones siguientes: ninguna variable libre en φ ocupa en φ posicio-


nes donde está ligada; toda variable ligada en φ figura en el alcance del cuanti-
ficador que la liga; no hay en φ dos cuantificadores que liguen la misma

estas condiciones. Supondremos, pues, que φ es una fórmula regular.


variable. En el Apéndice XIII llamamos regular a una fórmula que cumple

(2) Llamamos prenexa a una fórmula en la cual ningún cuantificador fi-


gura dentro del alcance de un conectivo (Apéndice XIII). Llamaré antiprenexa
a una fórmula en la cual ningún conectivo figura dentro del alcance de un

deduce de φ una fórmula prenexa φ* y una fórmula antiprenexa φ†. Como es


cuantificador. Aplicando las reglas de transición en uno o el otro sentido, se

obvio, φ puede deducirse a su vez de cualquiera de estas dos fórmulas. Diré,

otras dos. Herbrand llama a φ† la forma canónica de φ.


por ello, que cualquiera de estas tres fórmulas equivale deductivamente a las

(3) Asignamos a cada fórmula ψ una altura, determinada por los functores
que contiene, de acuerdo con las reglas siguientes: (i) Si ψ no contiene
functores su altura es 0; de otro modo, la altura de ψ es igual a la máxima
altura que tenga un functor en ψ. (ii) La altura de un functor ᒃ en una deter-
minada posición dentro de la fórmula ψ depende de su alcance en esa posi-
ción: si éste no contiene functores, ᒃ tiene altura 1; pero si el alcance de ᒃ

que k, la altura de ᒃ en la posición considerada es k+1. Sea, pues, h ≥ 0 la


contiene un functor de altura k y no contiene ningún functor de altura mayor

altura de nuestra fórmula φ.


(4) Sea ξ una variable ligada en φ por cierto cuantificador Q. Diremos
con Herbrand que ξ es una variable general si Q es universal y está dentro

está dentro del alcance de un número impar de signos de negación, y que ξ


del alcance de un número par de signos de negación o si Q es existencial y

una variable restringida si Q es existencial y está dentro del alcance de un


número par de signos de negación o si Q es universal y está dentro del al-

bar que ξ es en φ, respectivamente, una variable general o restringida, según


cance de un número impar de signos de negación. El lector podrá compro-

que el cuantificador que liga a ξ en la fórmula prenexa φ* sea universal o

(5) Supongamos que ξ y ζ son dos variables distintas ligadas respectivamen-


existencial.

te en φ por los cuantificadores Q y Q′. Si el alcance de Q′ está contenido en el


2.7 El Entscheidungsproblem 264

alcance de Q diremos que ξ supera a ζ en φ. Si ξ supera a ζ en la fórmula


antiprenexa φ† (la forma canónica de φ) diremos que ξ domina a ζ en φ.
(6) Sea ζ una variable general dominada en φ por r variables restringidas
ξ1,…, ξr (r > 0). Asociamos a ζ de modo exclusivo un functor r-ario ᒃζ,
elegido entre los functores del CP1= que no figuran en φ. La exclusividad
requerida está garantizada si numeramos las variables ligadas de φ según el

functores r-arios que no figuran en φ según el número de palotes que contie-


orden en que aparecen —de izquierda a derecha— en esa fórmula y los

general dominada en φ por r variables restringidas. Si la variable general ζ


nen, y asociamos el k-ésimo de estos functores r-arios a la k-ésima variable

forma exclusiva, una constante que no figure en φ.


no está dominada por ninguna variable restringida le asociamos, también en

para cada entero positivo p, un conjunto finito de objetos ∆(φ,p) dependiente


(7) Ahora explicaré, siguiendo de cerca a Herbrand, cómo se construye,

de nuestra fórmula φ. Los elementos de ∆(φ,p) serán constantes del CP1=


que figuran en φ o han sido asociadas a una variable general de φ no domi-
nada por variables restringidas, o provendrán de la secuencia ᑥ = κ1, κ2,…
de las constantes del CP1= (ordenadas por el número de palotes) que no
están comprendidas entre las anteriores. Tendremos que referirnos a más de
una secuencia formada eliminando de ᑥ todas las constantes que pertenecen
a algún conjunto C y renumerando las restantes en el orden en que figuran
en ᑥ; llamaré ᑥ\C a la secuencia así definida. Primero construiremos una

C1 es el conjunto de las constantes que figuran en φ o han sido asociadas a


lista C1,…, Cp+1 de conjuntos de constantes que figuran en ᑥ, como sigue:

una variable general de φ. Si φ no contiene constantes ni variables generales


no dominadas por variables restringidas, estipulamos que C1 = {κ1}.28 Para
construir C2 procedemos así: Con los functores de altura 1 que figuran en φ
y los functores asociados a las variables generales de φ formamos una lista

número de palotes de cada uno; si ᒃt es m-ario (1 ≤ t ≤ s; m > 0), le asigna-


de functores ᑠ = ᒃ1,…, ᒃs ordenada lexicográficamente por la r-aridad y el

por ᒃt y cada m-tuplo k ∈ C1m. Concebimos esta constante como el “valor”


mos, en forma exclusiva, una constante de la secuencia ᑥ al par formado

de ᒃt en dicho m-tuplo. Tales valores se eligen de modo que constituyan

28 De hecho, en ese caso ᑥ comprende todas las constantes del CP1=, a, a|, a||,…; así
que la estipulación antedicha significa que C1 = {a}.
2.7 El Entscheidungsproblem 265

precisamente un segmento inicial κ1,…, κn de la secuencia ᑥ\C1. Enton-


ces, C2 = {κ1,…,κn}, a menos que κ1 ∈ C1, en cuyo caso C2 = {κ2,…,κn}.

p). Sea Uk = C1 ∪…∪ Ck . Entonces Ck+1 estará formado por constantes


Supongamos ahora que se han construido las colecciones C1,…, Ck (k <

(i) si κ ∈ Ck+1, κ es el valor de un determinado functor m-ario ᒃt de la lista


de la secuencia ᑥ elegidas entre las que no pertenecen a Uk de tal modo que

ᑠ en un determinado m-tuplo λ ∈ Ukm, tal que λ ∉ Uk-1m;29 (ii) los elemen-

Estipulamos que Up = C1 ∪…∪ Cp = ∆(φ,p). Sea N la cardinalidad del


tos de Uk+1 que no pertenecen a C1 constituyen un segmento inicial de ᑥ.

conjunto ∆(φ,p). Los elementos de ∆(φ,p) forman una subsecuencia finita


α1,…, αN, de la secuencia a, a|, a||…, de las constantes del CP1=.
(8) Asociaré a φ una matriz φR que llamo, con Herbrand, la reducida
(réduite) de φ.30 La defino por inducción sobre las subfórmulas de φ. Si ψ
es una fórmula elemental, su reducida ψR = ψ. Si ψ y χ son fórmulas cua-
lesquiera, (¬ψ)R = ¬(ψR) y (ψ ∨ χ)R = (ψR ∨ χR). Si ξ es una variable ge-
neral dominada en φ por las variables restringidas ζ1,…, ζk y la subfórmula
ψ es el alcance del cuantificador Qξ que liga a ξ en φ, (Qξψ)R es la fórmula
que se obtiene reemplazando ξ por el término ᒃξζ1…ζk en todas las posi-
ciones libres de ξ en ψR (recuérdese que ᒃξ es el functor k-ario asociado a la
variable general ξ; como las variables ζ1,…, ζk dominan a ξ, están libres
en todas las posiciones que ocupan en Qξψ). Si ξ es una variable restringida
y ψ es el alcance del cuantificador que liga a ξ en φ, designo con ψR(α/ξ) a
la fórmula resultante de reemplazar la variable ξ por la constante α en todas
las posiciones de ξ en ψR (en virtud de nuestras convenciones iniciales, to-
das esas posiciones son libres). Como sabemos, el cuantificador que liga a ξ
será existencial (si está en el alcance de un número par de negaciones) o
universal (si está en el alcance de un número impar de negaciones). Según
cual sea el caso, aplicamos una de las dos convenciones siguientes:31

Esto quiere decir que si λ = 〈λ1,…,λm〉, hay al menos un entero positivo j ≤ m tal
que λj ∈ Ck. La estipulación sirve para asegurar que ᒃt no tenga en Ck+1 nuevos valores
29

correspondientes a m-tuplos formados con elementos de Uk–1, a los que ya se asignó


un valor de ᒃt en Uk.
30 En la citada versión inglesa —Herbrand LW— réduite se traduce expansion.
31 En la segunda igualdad uso como Herbrand, en aras de la claridad, el conectivo ∧;
pero se sobreentiende que ψ ∧ χ no es más que una abreviatura de ¬(¬ψ ∨ ¬χ).
2.7 El Entscheidungsproblem 266

(∃ξψ)R = ψR(α1/ξ) ∨ … ∨ ψR(αN/ξ)

(∀ξψ)R = ψR(α1/ξ) ∧ … ∧ ψR(αN/ξ)

(donde {α1,…,αN} = ∆(φ,p)). La construcción descrita determina la redu-


cida φR de nuestra fórmula φ si ésta no contiene variables libres. Si φ con-
tiene las variables libres η1,…, ηr, φR será, por definición, la reducida de
su clausura universal: φR = (∀η1Ú∀ηrφ)R. Recordando que la altura de φ
es h, vemos que la matriz φR contiene functores de altura q ≤ h.
(9) Ahora asociaremos a φ una nueva matriz que no contenga functores.
Observamos que el alcance de cada functor m-ario ᒃ que ocupa en φR una

pertenecientes a ∆(φ,p) = Up; en virtud de la construcción del párrafo ante-


posición de altura 1 consiste precisamente en un m-tuplo de constantes

rior, Up+1 contiene una constante α que es el valor de ᒃ en dicho m-tuplo.


Reemplazamos por α el término que ᒃ encabeza en la posición considerada.
Para reemplazar en forma análoga los functores de altura superior a 1, cons-

ᒃ es un functor m-ario que tiene altura q en cierta posición que ocupa en φ


truimos los conjuntos de constantes Cp+2,…, Cp+h definidos como sigue: si

(1 < q ≤ h), Cp+q contiene un valor para cada argumento admisible de φ en


(Up+q–1)m; dicho valor pertenece a ᑥ\Up+q-1 y precede a todos los elementos

〈λ1,…,λm〉 ∈ (Up+q-1)m determinados así: si el j-ésimo término en el alcan-


de ᑥ\Up+q. Los “argumentos admisibles” en cuestión son todos los m-tuplos

ce de ᒃ en la posición considerada es una constante, λj es esa constante; si


es una variable, λj puede ser cualquiera de las constantes de ᑥ incluidas en
Up+1; si comienza con un functor de altura w < q, λj puede ser cualquiera de
los valores asignados a ese functor en Up+w. Los functores de altura mayor

q-ésima etapa (1 < q ≤ h), cada functor m-ario ᒃ que ocupa en φR una posi-
que 1 pueden ahora eliminarse en h – 1 etapas sucesivas. Al comienzo de la

ción de altura q va seguido en esa posición por un m-tuplo de constantes


pertenecientes a Up+q-1; el término encabezado por ᒃ se reemplaza entonces
por el valor de ᒃ en dicho m-tuplo, el cual es una constante perteneciente a

orden p para controlar la deducibilidad de φ, o, abreviadamente, la (d,p)-


Up+q. El resultado final es una matriz sin functores que llamaré la matriz de

matriz de φ. La designo Πd(φ,p).

p para controlar la consistencia de φ, o (c,p)-matriz de φ. La designo Πc(φ,p).


(10) Herbrand enseña también a construir lo que llamaré la matriz de orden
2.7 El Entscheidungsproblem 267

Los pasos (6)–(9) de la construcción de Πd(φ,p) describen exactamente la


construcción de Πc(φ,p) si intercambiamos los términos ‘variable general’ y
‘variable restringida’ (de tal modo que ahora se asocie un functor r-ario ᒃζ a
cada variable restringida dominada por r variables generales, etc.).32 La co-

fiere de ∆(φ,p); si hay que referirse a ella podemos llamarla Γ(φ,p).


lección de constantes construida por esta vía en el paso (7) normalmente di-

fórmula φ es deducible (vraie) si y sólo si hay un entero positivo p tal que


Por fin estamos en condiciones de enunciar el Teorema de Herbrand: la

Πd(φ,p) es una identidad de la primera especie con respecto a sus compo-

de los axiomas, sin invocar la regla modus ponens, cualquier fórmula φ tal
nentes elementales. La demostración del Teorema enseña, de paso, a deducir

que, para algún p > 0, Πd(φ,p) cumpla la condición antedicha.33 El Teorema

ces para controlar la consistencia: la fórmula φ es consistente (con los axio-


se puede enunciar también, como es obvio, haciendo referencia a las matri-

mas del sistema) si y sólo si para cada entero positivo p hay una valuación

Πd(φ,p) y Πc(φ,p) tiene una explicación muy sencilla. φ es consistente con los axiomas
32 Esta correspondencia en apariencia mágica entre los procedimientos para construir

del sistema si y sólo si su negación ¬φ no se deduce de ellos. Así, la matriz para con-
trolar la deducibilidad de ¬φ servirá también para controlar la consistencia de φ:
Πd(¬φ,p) = ¬Πc(φ,p). Ahora bien, la forma antiprenexa (¬φ)† = ¬(φ†), de suerte que
las relaciones de dominio entre variables son las mismas en φ y ¬φ; pero la forma
prenexa (¬φ)* difiere ¬(φ*) precisamente en cuanto las variables ligadas en ¬(φ*) por
un cuantificador universal están ligadas en (¬φ)* por un cuantificador existencial y

gidas de φ son, respectivamente, las variables restringidas y generales de ¬φ.


viceversa (cf. Apéndice XIII, (4) y (5)), de suerte que las variables generales y restrin-

33 Por lo tanto, el famoso Teorema del Corte de Gentzen (1936), que enseña a deducir
cualquier fórmula prenexa sin aducir el equivalente gentzeniano de modus ponens, es
un caso especial del Teorema de Herbrand. La expresión ‘(Πd(φ,p)’ es mía; Herbrand

mula φ tiene la propiedad B de orden p si (lo que yo he llamado) la (d,p)-matriz de φ


enuncia su teorema en términos de “la propiedad B de orden p” definida así: La fór-

es una identidad de la primera especie con respecto a sus componentes elementales. El


Teorema dice entonces que “la condición necesaria y suficiente para que una proposi-
ción sea deducible (vraie) es que tenga la propiedad B [de orden p, para algún entero
positivo p]” (Herbrand, EL, p. 139; el texto entre corchetes no corresponde a nada que
figure en el original francés, pero es indispensable; la versión inglesa contiene una
inserción equivalente). La elección de la letra B para nombrar la propiedad en cuestión
se justifica porque en la demostración del Teorema Herbrand apela a otras dos propie-
dades de fórmulas, definidas por él, que llama A y C.
2.7 El Entscheidungsproblem 268

de la matriz Πc(φ,p) tal que el valor lógico de ésta es V.34


El siguiente ejemplo ilustra la fuerza del Teorema. Sea φ una fórmula que
no contiene functores y equivale deductivamente a una fórmula prenexa en

Entonces hay un algoritmo para determinar si φ es o no deducible. En efec-


la que ningún cuantificador existencial precede a un cuantificador universal.

to, en tal caso las variables generales de φ no están dominadas por ninguna
variable restringida, de modo que, para todo entero positivo p, Cp+1 = ∅ y
∆(φ,p) = ∆(φ,1) = C1. Por lo tanto, φ es deducible si y sólo si Πd(φ,1) es una

Basta, pues, aplicar a Πd(φ,1) el algoritmo que determina si esta matriz es o


identidad de la primera especie con respecto a sus componentes elementales.

no una tautología, para decidir si φ es o no deducible. El Entscheidungs-


problem para esta clase de fórmulas había sido resuelto por Bernays y
Schönfinkel (1928), pero la solución basada en el Teorema de Herbrand es
enormemente más simple. Por otra parte, el argumento que acabo de dar

general. En efecto, si φ es una fórmula cualquiera podría ocurrir que —en


sugiere que el Entscheidungsproblem bien podría ser insoluble en el caso

contraste con la clase de fórmulas recién considerada— ∆(φ,p+1) contenga


más elementos que ∆(φ,p), para cada p > 0. Entonces, aunque se determine
mediante un algoritmo que Πd(φ,p) no es una tautología para cierto p, no
cabe excluir que Πd(φ,q) lo sea para algún q > p y el procedimiento de de-
cisión puede prolongarse indefinidamente.
Herbrand no se hace cargo expresamente de esta última posibilidad, pero

ella. Dice, en efecto, que una fórmula φ es “verdadera en un campo infinito


usa una terminología que inescapablemente —me parece— lleva a pensar en

(champ infini)” si cada matriz de control de consistencia Πc(φ,p) admite una

nito” si cada matriz de control de validez Πd(φ,p) admite una valuación que
valuación que le asigna el valor lógico V, y que es “falsa en un campo infi-

le asigna el valor lógico F (p > 0). Según esto, φ es verdadera en un campo


infinito si y sólo si ¬φ es falsa en un campo infinito y φ es falsa en un

Como recordé en la nota 32, la fórmula φ es consistente si y sólo si ¬φ no es deduci-


ble. Según el primer enunciado del Teorema, ¬φ es deducible si y sólo si hay un p >
34

0 tal que Πd (¬φ,p) es una tautología. Πd (¬φ,p) = ¬Πc(φ,p). Ahora bien, si no hay un
p > 0 tal que ¬Πc(φ,p) sea una tautología, tenemos que, para cada p > 0 hay una
valuación de ¬Πc(φ,p) y Πc(φ,p) que asigna a ¬Πc(φ,p) el valor F y, por ende, el valor
V a Πc(φ,p).
2.7 El Entscheidungsproblem 269

campo infinito si y sólo si ¬φ es verdadera en un campo infinito.35 Con este

expresarse con gran concisión: φ es consistente (con los axiomas del siste-
vocabulario, nuestro segundo enunciado del Teorema de Herbrand puede

ma) si y sólo si es verdadera en un campo infinito. Equivalentemente, φ es


deducible si y sólo si no es falsa en un campo infinito. En palabras de
Herbrand:

TEOREMA 1. Si P es una identidad, ~P no puede ser verdadera en un campo


infinito.
TEOREMA 2. Si P no es una identidad, se puede fabricar un campo infinito
en el que ~P es verdadera.
(Herbrand, EL, p. 143)

Herbrand observa que “Löwenheim (1915) ya enunció resultados análogos”,


pero le hace dos reproches. En primer lugar, Löwenheim confiere a la no-
ción de ‘verdad en un campo infinito’ un significado “intuitivo”, por lo cual
“su demostración del Teorema 2 no alcanza el rigor que nos parece desea-
ble”. Pero además, “y éste es el reproche más grave, Löwenheim considera,
al parecer, justamente a causa del sentido intuitivo que le da a dicha noción,
que el Teorema 1 es evidente”. Según Herbrand, ello es “completamente
inadmisible” y llevaría, por ejemplo, “a considerar evidente la no-contradic-
ción de la aritmética” (EL, p. 143). Este reproche nace de un malentendido:
Löwenheim usa la palabra ‘identidad’, como es habitual en matemáticas, para
referirse a una ecuación que está satisfecha como quiera que se le asignen
valores a sus variables. Las identidades de primer orden de su cálculo de
relativos, traducidas a nuestro CP1=, son precisamente las fórmulas váli-
das, es decir, verdaderas en cualquier interpretación. Si ‘identidad’ se en-
tiende de este modo, el citado Teorema 1 es trivial. Pero lo que Herbrand
llama ‘identidad’ es una fórmula deducible en su cálculo; se trata, pues, de
un término de significado puramente sintáctico, no semántico como el de
Löwenheim. El equívoco oculta una relación importante; tomados simultá-

caracterizan a la vez las fórmulas deducibles y las fórmulas válidas: φ es


neamente en su doble acepción, sintáctica y semántica, los Teoremas 1 y 2

35 Puesto que Πc(φ,p) = ¬Πd(¬φ,p) y Πc(¬φ,p) = ¬Πd(¬¬φ,p), y, como es obvio,


Πd(¬¬φ,p) equivale —semántica y deductivamente— a Πd(φ,p).
2.7 El Entscheidungsproblem 270

Πc(¬φ,p) tenga el valor F en cada valuación, y esto ocurre si y sólo si φ es


deducible en el sistema de Herbrand si y sólo si hay un entero p > 0 tal que

válida. Por lo tanto, si, desestimando los reproches de Herbrand, considerá-


semos que en su versión semántica el Teorema 1 es obvio y el Teorema 2
fue demostrado por Löwenheim,36 concluiríamos que al establecerlos en su
versión sintáctica Herbrand ha probado que su sistema deductivo para el
cálculo predicativo de primer orden es correcto y completo (Apéndice IX.F).
Como veremos enseguida (en el Capítulo 2.8), Kurt Gödel se doctoró en
matemáticas casi al mismo tiempo que Herbrand, con una tesis en la que
demuestra —sin equívocos— que dicho sistema es completo, esto es, sufi-
ciente para deducir todas las fórmulas válidas de primer orden. Pero Gödel
adopta de entrada el punto de vista semántico —con lucidez sin paralelo hasta
entonces— y en el punto decisivo de la prueba avanza al infinito sin miedo,
“con arreglo a formas de inferencia conocidas” (nach bekannten Schluß-
weisen—Gödel, CW, I, 116), propias de la matemática clásica. Gracias a ello,
produce un escrito de gran claridad y limpieza, digno antecesor de la obra
revolucionaria (Gödel 1931) que estudiaremos en el Capítulo 2.10.37

36 Para que el Teorema 2 arriba enunciado sea un corolario del Teorema 2 de Löwenheim
1915 no sólo hay que entender ‘identidad’ en su acepción semántica, sino además ‘campo
infinito’ en su sentido literal y no, como Herbrand, sólo como una façon de parler.
Como se vio en la p. 252, el Teorema 2 de Löwenheim 1915 dice que toda ecuación
huidiza de primer orden falla para alguna asignación de valores a sus variables en un

en nuestro CP1= a una fórmula φ tal que (i) φ no es válida, pero (ii) ¬φ es falsa en
dominio enumerable. Una ecuación huidiza en el sentido de Löwenheim corresponde

cualquier interpretación 〈Dp,ƒp〉 tal que |Dp| es un entero positivo p. El Teorema 2 de


Löwenheim 1915 implica que hay una interpretación 〈Dω,ƒω〉 tal que |Dω| = ω y ƒω(φ)
= 1, de modo que φ es falsa y, por ende, ¬φ es verdadera en dicha interpretación. (Si
φ no es válida pero corresponde a una ecuación huidiza, ¬φ no satisface la condición
(ii) y por lo tanto es realizable en un dominio finito y, a fortiori, en cualquier dominio
infinito que lo contenga). En su luminosa introducción a la traducción inglesa de las
obras de Herbrand, Goldfarb explica cómo la construcción de lo que llamé matrices de
control viene a ser “un sustituto finitista (a finitistic surrogate)” de la noción semánti-
ca de realizabilidad en un dominio enumerable (Herbrand, LW, p. 11; cf. pp. 11–14).
37 No debo cerrar este capítulo sin mencionar otro giro adoptado por Herbrand para co-
municar su hallazgo: el Entscheidungsproblem se reduce en cada caso “a un problema
que es una generalización simple del problema de la resolución efectiva de un sistema
de ecuaciones diofánticas” (EL, p. 199; cf. pp. 31s., 193ss.) Una ecuación diofántica
2.7 El Entscheidungsproblem 271

es una ecuación algebraica cuyos coeficientes son números enteros y cuyas soluciones
se buscan entre los enteros. La observación de Herbrand implica que una solución del
Entscheidungsproblem resolvería de paso el 10º problema de Hilbert: Dada una ecua-
ción con cualesquiera incógnitas y coeficientes enteros, indicar un procedimiento que
permita decidir mediante un número finito de operaciones si esa ecuación admite nú-
meros enteros como soluciones (Hilbert 1900a en GA, III, p. 310). Matijasevic (1970)
se apoyará en la solución negativa del Entscheidungsproblem por Church y Turing (vide
infra, Capítulo 2.11) para demostrar que el 10º problema de Hilbert es asimismo inso-
luble. Y. I. Manin, en su Curso de lógica matemática (1977), ofrece una excelente ex-
plicación del descubrimiento de Matijasevic (cap. VI), que precede a su exposición de
los teoremas de incompletud de Gödel (cap. VII) y de la solución negativa del Ent-
scheidungsproblem (cap. VIII).
2.8 EL CÁLCULO PREDICATIVO
DE PRIMER ORDEN ES COMPLETO

En este capítulo estudiaremos el primero de los grandes descubrimientos de


Gödel: el cálculo predicativo de primer orden, organizado como sistema
deductivo a la manera de Frege, o de Whitehead y Russell, es un cálculo
completo, en el sentido preciso que explicaré enseguida y que, siguiendo justa-
mente a Gödel, le damos comúnmente a esta expresión (v. Apéndice IX.F).
Gödel enuncia y demuestra este resultado en su tesis doctoral (1929) y tam-
bién en un artículo publicado en la revista de Hilbert, Mathematische Annalen
(1930). Casi más importante que la demostración —que ha sido reemplaza-
da generalmente en la literatura didáctica por otra más versátil y expedita
debida a Henkin (1949)— es la clara concepción de las ideas envueltas,
especialmente el distingo entre validez (o verdad lógica) y deducibilidad. Con
ello se consolida el enfoque semántico que estaba implícito ya en la obra de
Löwenheim (1915), pero que la escuela de Hilbert tendía a desvirtuar.1 El
artículo es más conciso y elegante que la tesis y contiene un importante teo-
rema que falta en ésta, pero omite casi todas las consideraciones metodo-
lógicas, no sé si en aras de la brevedad o para evitar polémicas. En la si-
guiente presentación utilizo ambas fuentes.2
El párrafo inicial del artículo plantea el problema con insuperable luci-
dez: En Principia Mathematica, Whitehead y Russell adoptan como axio-
mas ciertas proposiciones evidentes y proceden a deducir de ellas —confor-
me a ciertas reglas de inferencia precisas y sin prestar atención al significa-
do de los símbolos— los teoremas de la lógica y las matemáticas. Ante este
procedimiento, cabe preguntarse si el sistema de axiomas y reglas de infe-
rencia propuesto es completo (vollständig), esto es, “si efectivamente basta

1 Piénsese que Herbrand llama propositions vraies justamente a las fórmulas deducibles.
2 La excelente versión castellana de las Obras completas de Gödel, editada por Jesús
Mosterín, contiene el artículo (pp. 23–37), mas no la tesis. Ésta aparece, acompañada
de traducción inglesa, en Gödel CW, vol. I, pp. 60–101.

273
2.8 El cálculo predicativo de primer orden es completo 274

para deducir cada teorema lógico-matemático, o si cabe tal vez concebir


proposiciones verdaderas (y eventualmente también demostrables conforme
a otros principios) que no se pueden derivar en el sistema en cuestión” (1930,
p. 349).3 Gödel recuerda que en el caso de las fórmulas verifuncionales esta
cuestión había sido contestada afirmativamente por Bernays (1926) y anun-
cia que la resolverá, también afirmativamente, para una clase más amplia de
fórmulas, a saber, las del cálculo predicativo de primer orden.4
La cuestión planteada supone que en el estudio de un cálculo lógico distin-
gamos dos tipos de conceptos: (i) aquellos que “conciernen únicamente a
los signos considerados como figuras espaciales” y (ii) aquellos cuya defini-
ción “tiene en cuenta el significado de las fórmulas” (Gödel 1929, § 2, en

3 Gödel 1929 declara, de entrada, que su propósito es probar que el “sistema axiomático
del llamado cálculo funcional restringido” es completo, y explica que esta propiedad
significa “que cada fórmula válida (allgemein giltige) expresable en [este cálculo] se
puede deducir de los axiomas mediante una serie finita de inferencias formales” (CW,
I, 60). En suma, un cálculo lógico premunido de axiomas y reglas de inferencia es
completo en el sentido de Gödel 1929, 1930, si es suficiente para deducir todas las

cálculo proposicional es suficiente o completo en un sentido puramente sintáctico: si φ


verdades en su campo de aplicación. Post 1921 estableció que el sistema deductivo del

deducirse de ellos su negación ¬φ. Tras observar que un sistema deductivo consistente
es una fórmula del cálculo que no se puede deducir de los axiomas, entonces puede

para el cálculo predicativo de primer orden no podría ser completo en el sentido


sintáctico, Hilbert y Ackermann (1928, p. 68) plantearon —quizás por vez primera—
la cuestión de suficiencia abordada por Gödel. Dicen allí que “aún no se ha resuelto la
cuestión de si el sistema axiomático [propuesto por ellos para ese cálculo] es completo
en el sentido de que realmente se puedan derivar de él todas las fórmulas lógicas que
son correctas (richtig) para todo dominio de individuos”. Pero la expresión ‘fórmulas
lógicas’ se introduce en ese libro de una manera que hace completamente incompren-
sible el planteamiento citado. Cito: “Entre las fórmulas que pueden demostrarse me-
diante el cálculo predicativo se destacan aquellas que no contienen constantes indivi-
duales y cuya derivación no presupone otras fórmulas que las fórmulas lógicas básicas
[los axiomas]. Llamaremos a estas fórmulas fórmulas lógicas’’ (Hilbert y Ackermann
1928, p. 54). Según esta estipulación, pues, una fórmula lógica es siempre derivable y
el cálculo es completo por definición.
4 Siguiendo a Hilbert y Ackermann (1928), Gödel lo llama engeres Funktionenkalkül (li-
teralmente: ‘más estrecho cálculo de funciones’). En una nota explica que pertenecen a

les —o sea, en nuestra jerga, con predicados n-ádicos, para cualquier n ≥ 0— mediante
él todas las “expresiones lógicas” formadas con variables proposicionales y funciona-

existencial, “en las cuales los prefijos ∀x y ∃x se refieren sólo a individuos, no a pre-
las “operaciones” de disyunción, negación, cuantificación universal y cuantificación

dicados (Funktionen)” (Gödel 1930, p. 349, n. 3).


2.8 El cálculo predicativo de primer orden es completo 275

CW, I, 66). Hoy los llamamos conceptos sintácticos y semánticos, respecti-


vamente. Gödel va a probar que, en el cálculo predicativo de primer orden
de Principia Mathematica, la clase de las fórmulas deducibles (propiedad
sintáctica) coincide con la clase de las fórmulas que expresan verdades lógi-
cas (propiedad semántica). Para ello, caracteriza primero el cálculo que va a
considerar y da una definición de estos dos conceptos, aplicable a las fór-
mulas de ese cálculo.
El cálculo considerado por Gödel casi no se distingue del CP1=. Usaré,
pues, nuestro simbolismo en lugar del suyo.5 Con todo, seguiré su sintaxis
en un respecto que no tiene su contraparte en la nuestra: Una letra mayúscu-
la seguida de variables individuales entre paréntesis y separadas por comas
representa una fórmula —normalmente, sin cuantificadores— en que las
variables en cuestión ocupan posiciones libres. Según esto, la fórmula F(x,y)
puede corresponder a nuestra fórmula elemental P2xy, pero también a una
matriz compuesta como ¬(P2xy → (P11y ∨ P12x)).6 Al igual que Gödel, uso
cualquier letra minúscula como variable individual y cualquier mayúscula
como variable proposicional o en la función recién descrita. Gödel elige como
axiomas lógicos las ocho fórmulas siguientes:

1 X∨X→X 2 X→X ∨Y
3 X ∨Y → Y∨ X 4 (X → Y) → (Z ∨ X → Z ∨ Y)
5 ∀xF(x) → F(y) 6 ∀x(X ∨ F(x)) → X ∨ ∀xF(x)
7 x=x 8 x = y → (F(x) → F(y))

Las reglas de inferencia son: (I) Modus ponens. (II) “La regla de sustitución

5 Gödel escribe & en vez de ∧, (x) en vez de ∀x y (Ex) en vez de ∃x. Para facilitar la
lectura, utiliza paréntesis de diversas formas. Simboliza la negación, a la manera de
Hilbert y Ackermann, mediante una línea recta trazada encima de todo su alcance. Así,
por ejemplo, su fórmula (x)(Ey)P(x,y) corresponde a nuestra ¬∀x∃yPxy.
6 Este simbolismo puede también interpretarse como una expresión del hecho siguiente:
dada una formula con n variables libres, cabe siempre introducir un predicado n-ario

F definido por la equivalencia: Fxy ↔ ¬(P2xy → (P11y ∨ P12x)).


que la represente. Así, en el caso del ejemplo, se puede introducir un predicado binario
2.8 El cálculo predicativo de primer orden es completo 276

para variables proposicionales y funcionales”.7 (III) De A(x) se puede inferir


∀xA(x) (generalización universal). (IV) Todas las variables —libres y liga-
das— de una fórmula se pueden reemplazar por otras, siempre que se obser-
ven ciertas cautelas (dirigidas a impedir que la reemplazante de una variable
libre sea “cazada” indebidamente por un cuantificador).8 Hay que entender
que ‘(X → Y)’ abrevia a ‘(¬X ∨ Y)’ y que el cuantificador existencial y los
conectivos ∧ y ↔ se definen en la forma habitual (Apéndice IX.D). Una
fórmula φ es deducible (abreviado ∂φ) si hay una prueba de φ, refutable si
hay una prueba de ¬φ. Gödel no explica el término ‘prueba’, pero eviden-

la p. 247: una lista de fórmulas 〈α1,…,αn〉 es una prueba de αn si y sólo si


temente podemos adoptar una definición por el estilo de la que presenté en

cada fórmula αk es idéntica a uno de los ocho axiomas o se infiere de una


fórmula αj por las reglas II–IV, o de un par de fórmulas αj y αh por la regla
I (1 ≤ k ≤ n; j < h < k).

realizabilidad (en la tesis; la explicación falta en el artículo). Sea α una fór-


Gödel explica así los conceptos semánticos esenciales de validez y

mula que contiene las variables proposicionales X1,…, Xm, los predicados
monádicos o poliádicos F1,…, Fk, las variables individuales libres x1,…,
xl, “y fuera de eso sólo variables ligadas” (CW, I, 66). Consideremos ahora
ciertos “individuos” a1,…, al pertenecientes a un cierto dominio (Denk-
bereich) no vacío D, ciertas “funciones (definidas en el mismo dominio)”
ƒ1,…, ƒk y aseveraciones (Aussagen) A1,…, Am. “Diremos que este siste-
ma S = (ƒ1,…, ƒk, a1,…, al, A1,…, Am) realiza (erfülle) la fórmula si,
insertado (eingesetzt) en ella, genera una oración verdadera (en el dominio
en cuestión).” Mediante esta definición, Gödel define los términos realizable
(erfüllbar) en un dominio determinado, realizable absolutamente (“hay un
dominio en el que la fórmula es realizable”), válido (allgemein giltig) en un
dominio determinado (“su negación no es realizable”) y válido absolutamente.

7 Gödel no explica esta regla, pero entiendo que ella autoriza a reemplazar uniforme-
mente (i) una variable proposicional por una fórmula cualquiera (siempre que ésta no
contenga en posiciones libres una variable ligada por un cuantificador en cuyo alcance
se hallaba alguna de las posiciones de la variable proposicional reemplazada) y (ii)
cualquier subfórmula formada por un predicado n-ádico seguido de n variables libres
por una fórmula cualquiera cuyas variables libres sean precisamente las mismas.
8 Gödel no detalla estas cautelas, sino que remite a Hilbert y Ackermann 1928, III, § 5.
2.8 El cálculo predicativo de primer orden es completo 277

Las fórmulas absolutamente válidas son las verdades lógicas. Las definicio-
nes semánticas de Gödel no son impecables, pero apuntan sin duda a las
que, siguiendo a Tarski, doy en el Apéndice IX.9
Es fácil comprobar que los axiomas 1–8 son válidos en el sentido indicado
y que las reglas de inferencia I–IV preservan la validez. Gödel lo acepta sin
discusión. Por lo tanto, toda fórmula deducible es válida. Lo que va a pro-
bar es la proposición recíproca: Toda fórmula válida del CP1= es deducible
en el sistema deductivo descrito (Teorema I del artículo). Ella equivale a esta

to, si vale el Teorema I y la fórmula φ no es realizable, su negación ¬φ es


otra: Toda fórmula del CP1= es realizable o refutable (Teorema II). En efec-

válida y por ende deducible, de suerte que φ es refutable, como dice el Teo-
rema II; mientras que si vale el Teorema II y φ es válida, ¬φ no es rea-
lizable y por ende es refutable, de suerte que ¬¬φ es deducible y, con ella,
también φ, como dice el Teorema I. En vista de ello, Gödel acomete
directamente la prueba del Teorema II.10 Lo prueba primero para las fórmu-

9 Traduje lo más literalmente que pude el pasaje clave para criticar aquí sus defectos.
Ante todo, ¿en qué consiste la operación de insertar (einsetzen) el sistema S en la fór-
mula A? S consta de elementos lingüísticos —las aseveraciones A1,…, Am— que
podrían, tal vez, insertarse literalmente en A, pero también incluye elementos no
lingüísticos, que no sería posible acomodar dentro de una fórmula. Es razonable supo-
ner que cuando habla de ‘insertar’ ciertos individuos en la fórmula Gödel quiere refe-
rirse al reemplazo uniforme de cada variable individual por una expresión que designe
exclusivamente a uno de esos individuos. Otro tanto habría que decir de la inserción
de las funciones ƒ1,…, ƒk. Hay que advertir, además, que cada una de éstas tendrá
que ser lo que solía llamarse una “función proposicional”, esto es, un aplicación de Dn

de la lista 〈F1,…, Fk〉 en cuyo lugar la función se “inserta”. En Gödel 1929 y 1930
en {0,1} o en {“lo verdadero”, “lo falso”}, con n igual a la n-adicidad del predicado

falta toda indicación sobre el empleo de functores (signos que se combinan con térmi-
nos para formar nuevos términos; vide Apéndice IX.E). Por otra parte, en vista del papel
que desempeñan las variables proposicionales en el cálculo lógico, no hace falta, para
juzgar la realizabilidad de una fórmula que contenga tales variables, que éstas se sus-
tituyan con aseveraciones bien determinadas, como propone Gödel; basta asignarle a
cada variable proposicional un valor veritativo fijo cualquiera. Finalmente, Gödel nos
deja en la total oscuridad en lo que respecta a verdad o falsedad de la oración obtenida
“insertando” el sistema S en la fórmula A cuando ésta contiene cuantificadores. Será

sión las condiciones en que una fórmula precedida por ∀ ο ∃ es o no verdadera en una
Tarski quien, junto con elucidar la “inserción” como interpretación, enuncie con preci-

interpretación dada (cf. las reglas [I∀] e [I∃] en el Apéndice IX.D).


10 El Teorema II de Gödel 1930 incluye también la siguiente cláusula: Si una fórmula no
es refutable, es realizable en un dominio infinito enumerable. Con este agregado, el
2.8 El cálculo predicativo de primer orden es completo 278

las que no contienen el signo de identidad y cuya deducibilidad o refutabilidad


depende sólo de los axiomas 1–6, es decir, para el cálculo correspondiente a
nuestro CP1. Luego, mediante un argumento sencillo, extiende el resultado
al CP1=.
Sea ᑠ la clase de las fórmulas del CP1, ᑱ la subclase de las fórmulas

las fórmulas realizables. Se trata de probar que ᑠ = ᑬ ∪ ᑱ. Para abreviar,


refutables (mediante los axiomas 1–6 y las reglas I–IV) y ᑬ la subclase de

llamaré ᑮ a la clase ᑬ ∪ ᑱ. En virtud del resultado de Bernays aludido


arriba, es claro que toda fórmula verifuncional, esto es, toda fórmula que
consta sólo de variables proposicionales, conectivos y paréntesis, pertenece

contienen también otros signos. Sea pues φ una fórmula cualquiera de este
a ᑮ. La discusión puede, entonces confinarse a las fórmulas del CP1 que

tipo. Gödel prueba primero que φ ∈ ᑮ si y sólo cierta fórmula de una clase
especial ᑥ ⊆ ᑠ pertenece a ᑮ. La etapa decisiva de la prueba consiste en-
tonces en establecer que ᑥ ⊆ ᑮ. La reducción del problema general a este
otro más particular comprende varios pasos que describo enseguida (en las

una fórmula ψ equivale lógicamente a otra fórmula χ si la fórmula (ψ ↔ χ)


notas doy una idea de la argumentación). Digamos, como de costumbre, que

es válida. Diré, por otra parte, que ψ equivale deductivamente a χ si la fór-


mula (ψ ↔ χ) es deducible. Sin duda, hay una fórmula prenexa φ1 que equi-
vale lógica y deductivamente a nuestra formula φ.11 Obviamente, φ ∈ ᑮ si y
sólo si φ1 ∈ ᑮ. Gödel muestra sin dificultad que la fórmula prenexa φ1 ∈ ᑮ

Teorema II es estrictamente más fuerte que el Teorema I y contiene (una forma de) el
Teorema de Löwenheim-Skolem. La prueba gödeliana nos rinde pues este importante
teorema como suplemento. (La cláusula mencionada se aplica a las fórmulas del CP1;
como se verá en la nota 27, en el caso del CP1= vale la condición más débil: Si una

Piénsese que la fórmula ∀x∀y(x = y), aunque irrefutable en el sistema descrito, única-
fórmula no es refutable, es realizable en un dominio enumerable, que puede ser finito.

mente es realizable en dominios que contengan un solo objeto).


11 En efecto, las fórmulas representadas por los esquemas (2)–(5) y (8)–(14) del Apéndi-
ce XIII son todas válidas y se deducen de los axiomas, usando las definiciones de los
símbolos lógicos. En particular, el esquema (2) es la definición del cuantificador
existencial; (3)–(5) se deducen fácilmente de (2). La demostración de los esquemas
(8)–(14) depende decisivamente del axioma 6.
12

la fórmula prenexa φ1 contiene las variables libres ξ1, ξ2,…, ξk es claro que φ1 es
Recuérdese que llamamos cerrada a una fórmula que no contiene variables libres. Si

realizable si y sólo si es realizable φ2 = ∃ξ1∃ξ2…∃ξkφ1. Tenemos además que, si ¬φ1


2.8 El cálculo predicativo de primer orden es completo 279

si y sólo si hay una fórmula prenexa cerrada φ2 ∈ ᑮ.12 Por otra parte, la
fórmula prenexa cerrada φ2 ∈ ᑮ si y sólo si hay una fórmula prenexa cerra-
da φ3, cuyo prefijo comienza con un cuantificador universal y termina con
un cuantificador existencial, tal que φ3 ∈ ᑮ.13 Las fórmulas prenexas cerra-
das cuyo prefijo comienza con un cuantificador universal y termina con un
cuantificador existencial constituyen la clase especial ᑥ. Llamémoslas ᑥ-
fórmulas. El grado de una ᑥ-fórmula es el número de cuantificadores uni-
versales en su prefijo cuyos respectivos sucesores inmediatos son cuantifica-
dores existenciales. Sea ᑥn la clase de las ᑥ-fórmulas de grado n. Gödel

es deducible, la regla III permite deducir ∀ξ1∀ξ2…∀ξk¬φ1 y, por consiguiente,


¬∃ξ1∃ξ2…∃ξkφ1; y que, si ¬∃ξ1∃ξ2…∃ξkφ1 es deducible, también es deducible
∀ξ1∀ξ2…∀ξk¬φ1, de la cual se deduce ¬φ1 por aplicaciones repetidas del axioma 5
y modus ponens. Por lo tanto, φ1 es refutable si y sólo si lo es φ2.
13 Sea φ2 la fórmula prenexa cerrada Q␰ψ, donde ψ es una matriz y el prefijo Q␰ es una

φ3 = ∀ζQ␰∃η(ψ ∧ (Φζ ∨ ¬Φη)), donde Φ es un predicado monádico y ζ y η son


fila formada por uno o más cuantificadores de cualquier clase. Considérese la fórmula

variables individuales que no figuran en ψ (como hemos visto en otras ocasiones, esta

úsense los primeros que no figuran en ψ). φ3 es lógica y deductivamente equivalente a


indicación puede precisarse apelando al orden lexicográfico de predicados y variables:

Q␰ψ ∧ ∀ζ∃η(Φζ ∨ ¬Φη). Como ∀ζ∃η(Φζ ∨ ¬Φη) es a la vez deducible y válida, φ3


es lógica y deductivamente equivalente a Q␰ψ = φ2, de modo que φ2 sólo será realiza-
ble o refutable si φ3 lo es.
14 Sea ψ ∈ ᑥn+1. Si n > 1, ψ tiene la forma "␰&␨"␹&␩Q␷Ψ, donde Ψ es una matriz,
Q␷ es una fila de cuantificadores de cualquier clase que comienza con uno universal y

clase indicada. Obviamente, "␹&␩Q␷Ψ ∈ ᑥn y Q␷Ψ ∈ ᑥn-1. Sean β y γ las fórmulas


termina con uno existencial, y "␰, &␨, "␹ y &␩ son filas de cuantificadores de la

definidas como sigue:


β = "␰′&␨′Φ(␰′,␨′) ∧ "␰"␨(Φ(␰,␨) → "␹&␩Q␷Ψ)
γ = "␰′"␰"␨"␹&␨′&␩Q␷(Φ(␰′,␨′) ∧ (Φ(␰,␨) → Ψ))
No es difícil ver que ∂β → ψ. Invocando dos veces el teorema B enunciado más ade-

el teorema C, el lector podrá establecer que ∂β ↔ γ. Ahora bien, γ ∈ ᑥn, de modo


lante en el texto (en la forma más general explicada entre corchetes), combinado con

que, por hipótesis γ ∈ ᑮ. Si γ es realizable, β es realizable y por ende también lo es ψ.


Si γ es refutable, β es refutable, de modo que ∂¬β. Reemplazando en β, Φ por
"␹&␩Q␷Ψ tenemos que
∂¬("␰′&␨′"␹&␩Q␷Ψ ∧ "␰"␨("␹&␩Q␷Ψ → "␹&␩Q␷Ψ))
La subfórmula a la derecha del signo ∧ es, por cierto, deducible. Por lo tanto,
∂¬"␰′&␨′"␹&␩Q␷Ψ. Mediante una sustitución juiciosa de variables ligadas en la fór-
2.8 El cálculo predicativo de primer orden es completo 280

prueba que si ᑥn ⊆ ᑮ, entonces ᑥn+1 ⊆ ᑮ.14 Por lo tanto, si podemos probar


que ᑥ1 ⊆ ᑮ, concluiremos, por inducción sobre el grado de las ᑥ-fórmulas,
que ᑥ ⊆ ᑮ, y por ende —en virtud de los pasos anteriores— que ᑠ = ᑮ.
Como la clase ᑮ reúne las fórmulas refutables y realizables, ella es un híbri-
do sintáctico-semántico y la prueba de que ᑥ1 está incluida en ᑮ tiene que
participar de ambos aspectos. En su aspecto sintáctico, es larga y tediosa,
pero elemental; en su aspecto semántico, es breve y brillante, pero nada ele-

Consideramos una ᑥ-fórmula cualquiera ψ de grado 1 en la que figuran


mental.

cuantificadores existenciales. ψ tiene la forma "␰&␨Θ(ξ1,…,ξr,ζ1,…,ζs), donde


r variables ligadas por cuantificadores universales y s variables ligadas por

riables ξ1,…, ξr y ζ1,…, ζs, respectivamente, y Θ(ξ1,…,ξr,ζ1,…,ζs) es una


"␰ y &␨ son filas de cuantificadores de la clase indicada, que ligan las va-

matriz en que figuran las variables listadas (y sólo ellas). Con una maniobra

asocia a la fórmula ψ ∈ ᑥ1 una secuencia de matrices Θ1, Θ2,… construi-


similar a la ejecutada contemporáneamente por Herbrand (Capítulo 2.6), Gödel

letra x seguida de n palotes (n ≥ 0). Forman, pues, un conjunto infinito nu-


das como ahora explicaré. Cada variable individual del cálculo consta de una

merable V = {x0, x1,…}, ordenado por el número de palotes de cada varia-


ble. Consideremos la familia de todos los r-tuplos que pueden formarse con
elementos tomados de V. Esta familia se puede ordenar atendiendo al núme-
ro total de palotes contenido en cada r-tuplo; si dos r-tuplos contienen el

la secuencia de r-tuplos x1 = 〈x0,x0,…,x0,x0〉, x2 = 〈x0,x0,…,x0,x1〉, x3 =


mismo número de palotes, los ordenamos en orden lexicográfico. Así se forma

〈x0,x0,…,x1,x0〉,… Las matrices Θ1, Θ2,… se forman sustituyendo unifor-


me y ordenadamente en Θ(ξ1,…,ξr,ζ1,…,ζs) las variables listadas por diver-
sos (r+s)-tuplos tomados de V. En cada caso, sustituimos el r-tuplo 〈ξ1,…,ξr〉
por uno de los r-tuplos de nuestra secuencia x1, x2,… y el s-tuplo 〈ζ1,…,ζs〉
por las primeras s variables de V que no se hayan utilizado todavía como
sustitutos. Específicamente,

mula precedente, obtenemos ∂¬"␰&␨"␹&␩Q␷Ψ, o sea, ∂¬ψ. Así pues, ψ es refuta-


ble si γ lo es. Por consiguiente, ψ ∈ ᑮ. Para obtener la misma conclusión en el caso
n = 1 basta eliminar del razonamiento anterior la expresión ‘Q␷’ y su descripción.
2.8 El cálculo predicativo de primer orden es completo 281

Θ1 = Θ(x1,x1,x2,…,xs)
Θ2 = Θ1 ∧ Θ(x2,xs+1,xs+2,…,x2s)

Θn = Θn–1 ∧ Θ(xn,x(n–1)s+1,x(n–1)s+2,…,xns)
…………………………………………………

…………………………………………………

∃x0∃x1…∃xns. Recordando como está construida la secuencia x1, x2,…,


Siguiendo a Gödel, voy a usar varias abreviaturas. Llamo (Pn) al prefijo

tuplo xn+1. Llamo (Pn′) al prefijo que se obtiene al eliminar de (Pn) a todos
vemos que el prefijo (Pn) inevitablemente incluirá todas las variables del r-

yn al s-tuplo de variables nuevas 〈x(n–1)s+1,x(n–1)s+2,…,xns〉, que figuran en Θn


los cuantificadores que ligan variables contenidas en xn+1. Por último, llamo

pero no en Θn–1. Conforme a esta convención escribimos, pues,

Θn = Θn–1 ∧ Θ(xn,yn) (1)

que, para cada entero positivo n, la fórmula (ψ → (Pn)Θn) es deducible. Sea


El aspecto sintáctico de la prueba consiste principalmente en establecer

n = 1. Por simple sustitución de variables ligadas, probamos que

∂"␰&␨Θ(ξ1,…,ξr,ζ1,…,ζs) → "x1&y1Θ(x1,y1) (2)

(donde "x1 y &y1 son filas de cuantificadores que ligan, respectivamente, a


las variables de x1 e y1).15 También se muestra fácilmente que

∂"x1&y1Θ(x1,y1) → &x1&y1Θ(x1,y1) (3)

Por la transitividad de la flecha, de (1) y (2) se infiere ∂ψ → (P1)Θ1. La tesis

n ≥ 1, ∂(ψ ∧ (Pn)Θn → (Pn+1)Θn+1). Como en el caso de (1), es claro que


general quedará establecida inductivamente si podemos mostrar que, para cada

15 Como los r elementos de x1 son la misma variable x0, sólo el último cuantificador de

Θ(x1,x1,x2,…,xs); los r-1 restantes podrían borrarse. Pero evidentemente es más cómo-
la fila "x1 liga en efecto a esa variable en todas sus posiciones libres en la matriz

do escribirlos (abreviadamente), lo que ciertamente está permitido por la sintaxis del


CP1 (Apéndice IX.A).
2.8 El cálculo predicativo de primer orden es completo 282

∂"␰&␨Θ(ξ1,…,ξr,ζ1,…,ζs) → "xn+1&yn+1Θ(xn+1,yn+1) (4)

Permutando los cuantificadores existenciales que forman el prefijo (Pn),


obtenemos

∂((Pn)Θn → &xn+1(Pn′)Θn) (5)

Para completar la prueba, Gödel invoca tres teoremas familiares de la lógica


de primer orden (el lector que no los conozca puede ejercitarse en probar al
menos los dos primeros):16

A Si ␰ es un r-tuplo de variables y α(␰) y β(␰) son dos fórmulas en


que esas variables ocupan todas las posiciones libres, entonces:

∂"␰α(␰) ∧ &␰β(␰) → &␰(β(␰) ∧ α(␰)).

B Sea Q␰ una fila homogénea de cuantificadores (todos existenciales


o todos universales) y Q␨ otra fila, homogénea también. Sea (Π) el

de ambas filas. Entonces, si α(␰) y β(␨) son dos fórmulas en que


prefijo que resulta al combinar en cualquier orden los cuantificadores

las variables listadas ocupan posiciones libres,

∂Q␰α(␰) ∧ Q␨β(␨) ↔ (Π)(α(␰) ∧ β(␨))

[Si Q␰, o Q␨, o ambos, son filas de cuantificadores no homogé-


neas, lo dicho vale siempre que los cuantificadores provenientes de
cada prefijo conserven en (Π) el mismo orden que tenían en el pre-
fijo de origen.]
C Si la fórmula α figura una o más veces como subfórmula en la

16 Los teoremas A, B y C corresponden, respectivamente, a los “teoremas auxiliares” 1b,


4 y 6, enunciados al comienzo de Gödel 1930. El teorema auxiliar 4 expresa el caso
general de B, que formulo entre corchetes al final,. He preferido destacar el caso espe-
cial en que todos los cuantificadores son de la misma clase, porque ese es el que apli-
caremos luego. El caso general se emplea en el argumento esbozado en la nota 14.
2.8 El cálculo predicativo de primer orden es completo 283

fórmula θ(α) y θ(β) es la fórmula obtenida al reemplazar α por la


fórmula β, deductivamente equivalente a α, en una o más de las
posiciones de α en θ(α), entonces θ(α) y θ(β) son deductivamente
equivalentes. En otras palabras, ∂(α ↔ β) implica que ∂(θ(α) ↔
θ(β)).17

En la fórmula destacada en el teorema A sustituimos la subfórmula α(␰) por


&yn+1Θ(xn+1,yn+1) y la subfórmula β(␰) por (Pn′)Θn (donde, como se hizo notar,
las r variables contenidas en xn+1 ocupan posiciones libres); sustituimos, asimismo,
en los prefijos "␰ y &␰ el r-tuplo ␰ por xn+1. Resulta, entonces, que

∂"xn+1&yn+1Θ(xn+1,yn+1) ∧ &xn+1(Pn′)Θn
→ &xn+1((Pn′)Θn ∧ &yn+1Θ(xn+1,yn+1)) (6)

Ahora bien, las apódosis de (4) y (5) —esto es, las subfórmulas que siguen
a la flecha en dichas fórmulas— son los dos miembros de la conjunción que
forma la prótasis —la subfórmula que precede a la flecha— en (6). Pode-
mos, pues, reemplazar ésta por la conjunción de las prótasis de (4) y (5),18
para obtener:

∂ψ ∧ (Pn)Θn → &xn+1((Pn′)Θn ∧ &yn+1Θ(xn+1,yn+1)) (7)

r) y sustituimos Q␰nα(␰n) por &yn+1Θ(xn+1,yn+1) y Q␨mβ(␨m) por (Pn′)Θn.


En la fórmula destacada en el teorema B ponemos n = (n + 1)s y m = (ns –

Como el prefijo (Pn+1′) se obtiene uniendo y reordenando los cuantificadores


—existenciales todos— en &yn+1 y (Pn′), podemos identificarlo con el prefi-
jo (Π). Tenemos, entonces, que

∂(Pn′)Θn ∧ &yn+1Θ(xn+1,yn+1) ↔ (Pn+1′)(Θn ∧ Θ(xn+1,yn+1)) (8)

Pero Θn ∧ Θ(xn+1,yn+1) = Θn+1. Por lo tanto, (8) y B juntos implican que

17 El “metateorema” C refleja el carácter “extensional” propio del cálculo predicativo.


Todo buen manual de lógica matemática lo demuestra para el sistema deductivo adop-
tado en él. Gödel 1930, p. 351, remite a Hilbert y Ackermann 1928, III, § 7.
18 Puesto que ∂(A → B) ∧ (C → D) → ((B ∧ D → F) → (A ∧ C → F)).
2.8 El cálculo predicativo de primer orden es completo 284

∂&xn+1((Pn′)Θn ∧ &yn+1Θ(xn+1,yn+1)) ↔ (Pn+1)Θn+1 (9)

El lado izquierdo de la equivalencia (9) es la apódosis de (7). Reemplazán-


dolo por el lado derecho, obtenemos el resultado que buscábamos:

∂ψ ∧ (Pn)Θn → (Pn+1)Θn+1 (10)

Habiendo establecido que ∂ψ → (P1)Θ1 y que, para cualquier n > 0, ∂ψ


∧ (Pn)Θn → (Pn+1)Θn+1, podemos concluir que ∂ψ → (Pn)Θn para cada n >
0. Por contraposición, ∂¬(Pn)Θn → ¬ψ. Por lo tanto, si (Pn)Θn es refutable
en el caso de algún entero positivo n, nuestra fórmula ψ, sujeta a la sola
condición de ser una ᑥ-fórmula de grado 1, también es refutable. Ahora bien,

puesto que (Pn) es una fila de cuantificadores existenciales y ∂∀ξ¬α ↔


(Pn)Θn es refutable si ∂¬(Pn)Θn, o sea, si ∂¬Θn (en virtud de la regla III,

¬∃ξα). Como Θn es una matriz, hay una fórmula verifuncional ϑn que se


forma reemplazando uniformemente cada subfórmula elemental de Θn (cada
predicado n-ádico seguido de n términos) por una variable proposicional

pongamos que cada variable proposicional de Θn es reemplazada en ϑn por


(predicado 0-ádico) diferente. (Para mayor comodidad en la exposición, su-

prueba de ¬ϑn se transforma en una prueba de ¬Θn. Por lo tanto, (Pn)Θn es


ella misma.) Aplicando juiciosamente la regla de sustitución II, cualquier

refutable si la fórmula verifuncional ϑn es refutable. Ahora bien, como sabe-


mos, si ϑn no es refutable, ϑn es realizable, es decir, hay una asignación de
valores veritativos a las variables proposicionales que figuran en ϑn que hace
“verdadera” a ϑn. En la decisiva fase semántica de la prueba, Gödel explota
este hecho para establecer que ψ es realizable cuando no es refutable, esto
es, que ψ ∈ ᑮ.
Para ello, hay que atender a la estructura interna de ψ. Sabemos que con-
tiene las variables ξ1,…, ξr, ζ1,…, ζs. A la luz de lo que ahora veremos,

19 En otras palabras, la prueba de Gödel está confinada a lo que suele llamarse cálculo
predicativo puro (sin constantes individuales). Pero el argumento sintáctico arriba de-

adaptarse sin dificultad al caso en que la fórmula ψ bajo consideración contiene cons-
sarrollado no supone esta restricción y el argumento semántico que ahora veremos puede

tantes individuales (es cosa de darles también a éstas una interpretación numérica como
la que se les da a las variables).
2.8 El cálculo predicativo de primer orden es completo 285

es claro que Gödel da por descontado que no contiene otros términos.19

predicados ν-ádicos F1,…, Fk (para diversos valores de ν > 0). Como es


Supongamos que contiene las variables proposicionales X1,…, Xh, y los

obvio, X1,…, Xh y F1,…, Fk también están contenidos en cada matriz Θn


y son todas las variables proposicionales y predicados ν-ádicos que allí figu-
ran. Gödel nos invita a considerar, para un dado n > 0, un conjunto de h

definidas en el conjunto de enteros Zn = {z:0 ≤ z ≤ ns} y elegidas de modo


valores veritativos w1n,…, whn y k funciones proposicionales ƒ1n,…, ƒkn,

que ƒjn tenga precisamente la misma ν-adicidad que Fj (1 ≤ j ≤ k).20 Dire-

ésimo” (Erfüllungssystem n-ter Stufe) de la fórmula ψ si es verdadera la


mos, con Gödel, que este conjunto es un “sistema de realización de nivel n-

aseveración que se obtiene a partir de la matriz Θn al asignar el valor veritativo


win a cada variable proposicional Xi (1 ≤ i ≤ h), interpretar cada predicado Fj
como representativo de la función proposicional ƒjn (1 ≤ j ≤ k) y reemplazar
cada una de las variables x0,…, xn que figuran en Θn por su respectivo índice
numérico (contenido en Zn). Si Sm y Sn son dos sistemas de realización de ψ

ye a Sm (Sm ⊂ Sn) si cada función ƒjm ∈ Sm es la restricción a Zm de la fun-


de nivel m-ésimo y n-ésimo, respectivamente (m < n), diremos que Sn inclu-

ción ƒjn ∈ Sn y los valores veritativos wim y win son, respectivamente, iguales
para cada índice i (1 ≤ j ≤ k, 1 ≤ i ≤ h).
Es claro que, si la fórmula verifuncional ϑn asociada a la matriz Θn es

verdadera, esto es, un sistema de realización de ψ de nivel n-ésimo.21 Como


realizable, tiene que haber una interpretación del tipo descrito en que sea

Siguiendo a Gödel, digo simplemente que la función ν-ádica ƒ está definida en Ζn si


está definida en (Ζn)ν.
20

mente comprobar. Recordemos que ϑn se forma reemplazando cada subfórmula ele-


21 El sencillo truco siguiente genera la interpretación deseada, como el lector podrá fácil-

mental de Θn por una variable proposicional. Supongamos, para mayor comodidad, que
cada variable proposicional Xi está representada en ϑn por ella misma. Las demás
subfórmulas elementales de Θn pueden numerarse en el orden en que aparecen por pri-

ϑn es realizable, hay una asignación V de valores veritativos a las Xi y las Yq tal que
mera vez. Sea Yq la variable proposicional que reemplaza a la q-ésima subfórmula. Si

V(ϑn) = 0 (“lo verdadero”). Ponemos win = V(Xi). Si Fj es ν-ádico, definimos la fun-


ción proposicional ƒjn: (Zn)ν Æ {0,1} como sigue: si hay un entero q tal que la q-
ésima subfórmula elemental de Θn está formada por el predicado Fj seguido por ν
variables con los índices numéricos z1,…,zν, respectivamente, entonces ƒjn(z1,…,zν)
= V(Yq); en cualquier otro caso ƒjn(z1,…,zν) = 0.
2.8 El cálculo predicativo de primer orden es completo 286

hemos visto, si ψ no es refutable, ϑn es realizable y hay un sistema de rea-


lización de ψ de nivel n-ésimo para cada n > 0. Teniendo en cuenta que
Θn+1 = Θn ∧ Θ(xn+1,xns+1,xns+2,…,x(n+1)s), es claro que cualquier sistema de
realización de ψ de nivel (n+1)-ésimo provee una realización de Θn y por lo
tanto incluye un sistema de realización de ψ de nivel n-ésimo.22 Según Gödel,
de esta sencilla observación “se sigue, con arreglo a formas de inferencia
conocidas (nach bekannten Schlußweisen), que en tal caso hay una secuen-
cia de sistemas de realización S1, S2,…, Sk,… (con Sk de nivel k-ésimo),
en que cada uno de los que siguen al primero contiene al que le precede”
(1930, p. 356). Este es el paso decisivo en el argumento semántico de Gödel,
así que vale la pena que lo examinemos con atención. En la tesis, lo explica

de realización de ψ de nivel n-ésimo tiene que ser finito (pues es finito el


un poco más. Anota con razón que, para cada n > 0, el número de sistemas

número total de (h+k)-tuplos diferentes formados por h valores veritativos y


k funciones proposicionales definidas en Zn). “Por lo tanto, al menos uno de
los sistemas de realización de primer nivel tiene que estar contenido en in-
finitos otros de nivel superior. Hay, pues, un sistema de realización de se-
gundo nivel en que ese sistema está contenido, el cual a su vez está conte-
nido en infinitos otros de nivel superior. Continuando este razonamiento se

realización S1, S2,…, Si,…, ad infinitum, donde Si ⊂ Si+1 y Si es de nivel


muestra en forma conocida la existencia de una secuencia de sistemas de

i-ésimo” (CW, I, 86).23


¿Cuál es esa forma conocida de razonar a que se refiere Gödel? Contra lo
que el pasaje anterior parecería destinado a sugerir, no puede tratarse de la
inducción matemática. Ésta supone que, dado un objeto caracterizable con
un índice numérico n, sepamos construir o señalar un objeto análogo con el
índice n + 1. Pero en la situación que confrontamos aquí las cosas se pre-
sentan al revés: con cada sistema de realización de nivel n > 1 está dado
otro de nivel n–1, contenido en el primero. Repitiendo el razonamiento,
obtenemos una serie finita de sistemas de realización en forma de muñeca

22 Específicamente, si {w1,…,wh,ƒ1,…,ƒk} es un sistema de realización de ψ de nivel (n+1)-

tema de realización de ψ de nivel n-ésimo incluido en {w1,…,wh,ƒ1,…,ƒk}.


ésimo, y designamos con ƒ′j a la restricción de ƒj a Zn, {w1,…,wh,ƒ′1,…,ƒ′k} es un sis-

23 En el original, la última oración dice así : “So weiter schließend zeigt man in bekannter

wobei Si ⊂ Si+1 und Si von i-ter Stufe ist.”


Weise die Existenz einer Folge von Erfüllungssystemen S1, S2,…, Si,…, ad infinitum,
2.8 El cálculo predicativo de primer orden es completo 287

rusa: Sn ⊃ Sn-1 ⊃ Sn-2 ⊃…⊃ S2 ⊃ S1; pero eso no prueba que dicha serie
coincida con la parte final de la serie obtenida a partir de otro sistema Sm,
con m > n. Por hipótesis, tenemos una galería infinita de “muñecas rusas”
como la descrita, una para cada entero positivo n, pero no cabe combinarlas,
por inducción, en una sola supermuñeca infinita. Por otra parte, hay una pro-
posición —que Dénes König (1926) dedujo del Axioma de Selección, pero
que es estrictamente más débil que éste— que viene como anillo al dedo a
la situación descrita por Gödel. Dice así:

Si Σ1, Σ2,… es una secuencia de conjuntos finitos no vacíos y


hay una relación binaria R tal que para cada a ∈ Σn+1 hay un b ∈
K

Σn tal que bRa, entonces hay una secuencia a1, a2,… tal que, para
cada n > 0, an ∈ Σn y anRan+1.24

Para aplicarla a nuestro caso, basta identificar cada Σn con el conjunto de


todos los sistemas de realización de ψ de nivel n-ésimo y escribir ⊂ en vez
de R. Como Gödel no menciona a König, sus editores sugieren que el pasaje
citado no alude a la misma proposición K, sino más bien a los argumentos
—pertenecientes al “folklore” matemático— que movieron a König a adop-

24 La siguiente proposición, equivalente a K, se suele llamar Lema del Infinito de König


en la teoría de grafos: Si un grafo infinito G contiene subgrafos G1, G2,…, tales que

a un punto de Gn, entonces existe un camino infinito p1, p2,…, tal que pi ∈ Gi.
ninguno de ellos tiene un punto en común con otro, pero cada punto de Gn+1 está unido

25 También Hilbert y Bernays, cuando reformulan la prueba de Gödel en Grundlagen der


Mathematik, se abstienen de aducir expresamente el Lema de König u otra consecuen-
cia del Axioma de Selección, y presentan el paso al infinito en el argumento semántico

vez de nuestros sistemas de realización de ψ (que son conjuntos finitos de valores


como un simple ejercicio del sano sentido común. Vale la pena ver cómo lo hacen. En

veritativos y funciones proposicionales), Hilbert y Bernays consideran los distintos

mulas elementales que figuran en cada matriz Θn. Sea qn el número de fórmulas ele-
modos como se pueden distribuir los valores veritativos (1 y 0) entre las diversas fór-

mentales diferentes que figuran en Θn. Entonces hay 2qn distribuciones posibles de va-

de sus primeras posiciones (de izquierda a derecha) en Θn, cada distribución Wn queda
lores veritativos entre las mismas. Si tomamos dichas fórmulas elementales en el orden

asociada inequívocamente a un numeral del sistema binario (el sistema de numeración


con base 2), a saber, la fila de ceros y unos correspondientes a cada fórmula elemental,
en el orden señalado. Llamaré #Wn al número representado por ese numeral. Conside-
remos ahora dos enteros positivos m y n, tales que m < n. El lector recordará que todas
2.8 El cálculo predicativo de primer orden es completo 288

tarla (Dreben y van Heijenoort, en Gödel, CW, I, 53).25 En todo caso, Gödel
nunca ha cuestionado el Axioma de Selección y en la introducción a la tesis
previene expresamente que no se inhibirá de utilizar ningún medio matemá-
tico de prueba, una advertencia que sólo resulta pertinente en el punto que

las fórmulas elementales de Θm aparecen en Θn antes que todas las fórmulas elemen-
tales que no figuran en Θm. Diremos que la distribución Wn asociada a Θn contiene a
la distribución Wm asociada a Θm (Wm ⊂ Wn) si las fórmulas elementales comunes a
ambas matrices reciben, respectivamente, los mismos valores en Wm y Wn. Nótese que

asociadas a las matrices indicadas por los subíndices y Wm ⊂ Wn y W′m ⊂ W′n, en-
si #Wm, #W′m, #Wn y #W′n son los números representativos de cuatro distribuciones

tonces #Wm ≤ #W′m implica que #Wn ≤ #W′n. Diremos con Hilbert y Bernays que una
distribución de valores veritativos entre las fórmulas elementales de una matriz es una

(“lo verdadero”). Por hipótesis, hay por lo menos una distribución realizadora de Θn,
distribución realizadora (erfüllende Verteilung) de la misma, si le confiere el valor 1

para cada n > 0. Si m < n, Θn es una conjunción de Θm con otras fórmulas. Por lo
tanto, cada distribución Wn realizadora de Θn, contiene una distribución Wm realizado-
ra de Θm. Diremos que Wm es el m-componente de Wn. Nótese que, si m < k < n y Wk
es el k-componente de Wn, entonces el m-componente de Wn es también el m-compo-

realizadoras de Θm tiene que haber por lo menos una que, para todo n > m, sea el m-
nente de Wk. “Según esto, resulta (demnach ergibt sich) que entre las distribuciones

componente de una distribución realizadora de Θn” (Hilbert y Bernays, GG, II, 194;
cursiva mía). Entre las distribuciones que tienen esta propiedad, para un dado m > 0,
hay una cuyo número representativo es menor que el de las demás; llamémosla W*m.
Hilbert y Bernays prueban que, si m y n son dos enteros positivos cualesquiera tales
que m < n, entonces W*m es el m-componente de W*n. Para ello, aprovechan lindamente

Wn la distribución realizadora de Θn tal que W*m es el m-componente de Wn; enton-


la representación numérica de las distribuciones: Sea Wm el m-componente de W*n y

ces, por la misma definición de W*m y W*n tenemos que #W*m ≤ #Wm y #W*n ≤

W*m ⊂ Wn, Wn ⊂ W*n y #W*m ≤ #Wm implica que #Wn ≤ #W*n, de modo que #Wn
#Wn; por otra parte, como hice notar arriba, la aseveración conjunta de las condiciones

determina inequívocamente una secuencia W*1 ⊂ W*2 ⊂…, que sirve de base a
= #W*n; por lo tanto, Wn = W*n y W*m es el m-componente de W*n. Este resultado

una realización de ψ. Pero su impecable demostración constructiva no puede disimular


el carácter no constructivo del paso previo que cité en cursiva.
26 “Por último, debe considerarse que el problema aquí tratado no ha surgido (como, di-
gamos, el problema de la consistencia de las matemáticas) con la disputa sobre los
fundamentos [entre brouwerianos y hilbertianos], sino que, aunque nunca se hubiera
cuestionado la validez sustantiva de la matemática ‘ingenua’ (die inhaltliche Geltung
der “naiven” Mathematik), tendría sentido plantearlo dentro de ésta (en contraste, por
ejemplo, con el problema de la consistencia). Por esto, una restricción de los medios
de prueba no parece más urgente aquí que a propósito de cualquier otro problema
matemático” (Gödel, CW, I, 64).
2.8 El cálculo predicativo de primer orden es completo 289

estamos considerando.26

S1 ⊂ S2 ⊂ …, Gödel tiene lo que necesita para probar que ψ es realizable,


Con la secuencia infinita de sistemas de realización de todos los niveles,

si lo son todas las matrices Θn y las respectivas fórmulas verifuncionales ϑn.


Consideremos el conjunto S = {w1,…,wh,ƒ1,…, ƒk}, caracterizado como

definida en el conjunto ˆ de todos los números naturales (1 ≤ i ≤ h; 1 ≤ j


sigue: (i) cada wi es un valor veritativo y cada ƒj es una función proposicional

≤ k); (ii) wi = wim para algún m > 0 (y, por ende, para todos); (iii) hay un m
> 0 tal que la restricción de ƒj a Zm es igual a ƒjm (y, por lo tanto, la restric-

tas, es claro que, si asignamos la lista de valores 〈w1,…, wh〉 a la lista


ción de ƒj a Zn es igual a ƒjn para todo n > m). Bajo las condiciones prescri-

〈X1,…, Xh〉 de la variables proposicionales de ψ y entendemos que la lista


〈F1,…, Fk〉 de los predicados monádicos o poliádicos de ψ representa la
lista de funciones 〈ƒ1,…, ƒk〉, la fórmula ψ expresa una aseveración verda-

modelo de ψ. Con esto hemos terminado de probar que cualquier ᑥ-fórmula


dera. El sistema S ofrece así una realización o —como también se dice— un

de grado 1 es refutable o realizable. Como se vio antes, esta conclusión


implica que cualquier fórmula del CP1 tiene la misma propiedad. Por su
misma naturaleza, la prueba ha establecido, de paso, que si una fórmula del
CP1 es realizable, tiene una realización en el dominio de los números natu-
rales. Esto es una forma del Teorema de Löwenheim-Skolem (vide nota 10
y Capítulo 3.2).
No voy a explicar el razonamiento, relativamente fácil, mediante el cual
Gödel extiende estos resultados al CP1=.27 En el artículo —mas no en la
tesis— prueba además el siguiente teorema:

27 La argumentación es algo más ágil en el artículo que en la tesis, pero la idea central es
en ambos textos la misma: tratar el signo = como un predicado diádico que cumple las

a continuación el razonamiento del artículo. Sea φ una fórmula del CP1= que conten-
condiciones estipuladas en los axiomas 7 y 8 e invocar la suficiencia del CP1. Esbozo

ga precisamente las variables individuales ξ1,…, ξh y los predicados Π1,…, Πk. Cons-
truimos la fórmula φ′ = φ ∧ ∀x(x = x) ∧ ψ, donde ψ es una conjunción formada como
sigue: si Π es un predicado n-ádico (n ≥ 1) contenido en la lista 〈Π1,…,Πk〉 y
〈ζ1,…,ζn〉 es cualquier n-tuplo formado con variables de la lista 〈ξ1,…,ξh〉, la fór-
mula ∀ξr∀ζ1…∀ζs…∀ζn(ζs = ξr → (Πζ1…ζs…ζn → Πζ1…ξr…ζn)) es una de las
subfórmulas unidas en ψ por el signo ∧ (1 ≤ r ≤ h; 1 ≤ s ≤ n). Si tratamos el signo =
como un predicado binario cualquiera, φ′ es una fórmula del CP1 y, por lo tanto, es
realizable o refutable. Supongamos que φ′ es refutable, o sea, que ¬φ′ es deducible de
los axiomas 1–6. Entonces, como ∀x(x = x) ∧ ψ es obviamente deducible de los axio-
2.8 El cálculo predicativo de primer orden es completo 290

TEOREMA X. Para que un conjunto infinito numerable de fórmulas del CP1=


sea realizable, es necesario y suficiente que cada subconjunto
finito del mismo sea realizable.

En otras palabras, como se dice hoy, el CP1= es compacto. Los argumentos


utilizados en los primeros pasos de la prueba del Teorema II sirven para
mostrar que el Teorema X vale en general, si vale para cualquier conjunto
numerable de ᑥ-fórmulas de grado 1. Sea, pues,

Σ = {"␰1&␨1Φ1(␰1;␨1),"␰2&␨2Φ2(␰2;␨2),…,"␰n&␨nΦn(␰n;␨n),…}

un conjunto numerable de ᑥ-fórmulas de grado 1, con ␰k un rk-tuplo y ␨h un


sh-tuplo de variables individuales (k, h > 0). Consideremos ahora, para cada
k > 0, los rk-tuplos que pueden formarse con las variables individuales x0,
x1,… Ordenados por la suma de sus índices, tales rk-tuplos forman una
secuencia xk1, xk2,… Designaremos con yhj el sh-tuplo de variables indivi-
duales caracterizado por la condición siguiente: al ordenar los yhj en orden
creciente de las sumas h+j (y lexicográficamente, para sumas iguales), la

la secuencia x0, x1,… Como se hizo arriba con las matrices Θn, definimos
secuencia infinita resultante, y11, y12, y21, y13, y22, y31, y14,… coincide con

una secuencia de matrices Ξ1, Ξ2,…, mediante las dos estipulaciones si-
guientes:

Ξ1 = Φ1(x11;y11)
Ξn = Ξn–1 ∧ Ξ1(x1n;y1n) ∧ Ξ2(x2(n–1);y2(n–1)) ∧…∧ Ξn(xn1;yn1)

mas 7 y 8, ¬φ es deducible de 1–8. Por otra parte, si φ′ no es refutable, tiene una

tiene que ser reflexiva, simétrica y transitiva (para que satisfaga a ∀x(x = x) ∧ ψ); por
realización M en ˆ. La relación aritmética diádica que modela al predicado = en M

mente finito, de esas clases de equivalencia provee una realización M* de φ′ en la cual


lo tanto, determina una partición de ˆ en clases de equivalencia. El conjunto, posible-

cada predicado Πj (1 ≤ j ≤ k) es modelado por la relación que subsiste entre las clases
de equivalencia cuyos miembros satisfacen la relación que modela a Πj en M, y el
predicado = es modelado por la genuina identidad. Obviamente, la fórmula φ tiene que
estar realizada en toda realización de φ′. En particular, M* constituye una realización
de φ entendida como fórmula del CP1=.
2.8 El cálculo predicativo de primer orden es completo 291

bles libres en Ξn. Es claro que (Pn)Ξn se deduce del conjunto finito de
Sea (Pn) una fila de cuantificadores existenciales que ligan a todas las varia-

premisas Σn = {"␰1&␨1Φ1(␰1;␨1), "␰2&␨2Φ2(␰2;␨2),…, "␰n&␨nΦn(␰n;␨n)} y


por consiguiente es realizable si Σn es realizable. Por lo tanto, si cada sub-
conjunto finito de Σ es realizable, también cada matriz Ξn es realizable. Por

rema II se concluye finalmente que si cada matriz Ξn es realizable, el con-


un argumento análogo al aducido en la fase semántica de la prueba del Teo-

junto Σ es realizable.
Del Teorema X se sigue inmediatamente el siguiente corolario: Si Σ es un
conjunto numerable de fórmulas del CP1=, o bien Σ es realizable, o bien Σ
incluye un subconjunto finito de fórmulas {α1,…,αn} tal que α1 ∧…∧
αn es refutable (Teorema IX; Gödel 1930, p. 357; también en la tesis, § 8,
CW, I, 96ss.). Como Gödel expresamente señala, esto significa que, si Σ es
el conjunto finito o numerablemente infinito de los axiomas de una teoría
matemática expresable en el CP1=, se cumple una de estas alternativas: o

número finito de pasos de un número finito de premisas contenidas en Σ; o


bien (i) la teoría es inconsistente y se puede deducir una contradicción en un

bien (ii) hay un modelo —una realización— de la teoría. En una nota, Gödel
cita como ejemplo la teoría de los Grundlagen der Geometrie de Hilbert,
“sin los axiomas de continuidad” (que no se pueden expresar en un cálculo
de primer orden).28 De este modo, el corolario citado resuelve, al menos para
este fragmento de la teoría geométrica, la disputa entre Hilbert y Frege a
que me referí en el Capítulo 2.1. Hilbert había escrito a Frege, algo liviana-
mente, que “si los axiomas arbitrariamente estipulados, junto con todas sus
consecuencias, no se contradicen entre sí, entonces son verdaderos y existen
las cosas definidas por ellos: ése es para mí el criterio de la existencia y de
la verdad” (Frege, KS, p. 411; vide p. 118). En este pasaje, Hilbert posible-
mente decía ‘existencia’ sólo como una manera de hablar, pero la prueba de
Gödel le devuelve a la palabra su sentido literal: si la teoría es sintácticamente

28 Los axiomas de continuidad forman el grupo V en Hilbert, GG. Son el Postulado de


Arquímedes (si a y b son las distancias entre dos pares de puntos, hay un entero n tal
que na > b) y el llamativo Axioma de completud (V,2) agregado por Hilbert en 1902,
en virtud del cual ninguna parte propia de un modelo de los axiomas puede a su vez
ser un modelo. Vide supra, p. 99, nota 27.
2.8 El cálculo predicativo de primer orden es completo 292

consistente, también tiene un modelo que la realiza. Irónicamente, el modo


no constructivo de razonar empleado por Gödel, aunque cuestionable para un
hilbertiano estricto (vgr. Herbrand), no le hubiera merecido reparos a Frege.29
El artículo de Gödel contiene otra observación metodológica —ausente
en la tesis— que debe haber caído muy bien en la escuela de Hilbert:

Adviértase que, con vistas al Entscheidungsproblem, la equivalencia “vá-


lido = deducible” que ha quedado demostrada entraña una reducción de
lo no numerable a lo numerable, puesto que “válido” se refiere al conjun-
to no numerable de las funciones [proposicionales], mientras que “dedu-
cible” sólo presupone el conjunto numerable de las pruebas.
(Gödel 1930, p. 356)

Aparentemente, cuando se tomó la molestia de anotar este “avance” hacia la


solución positiva del Entscheidungsproblem, Gödel no sospechaba que su
próximo descubrimiento (1930a, 1931) daría al traste con toda esperanza de

29 En la tesis, Gödel anuncia desde un comienzo este resultado, y se apresura a destacar


su interés filosófico. Después de anunciar su propósito en el texto de CW, I, 60 que
cité en la nota 3, prosigue: “Se reconocerá fácilmente que esta aseveración equivale a
la siguiente: Todo sistema axiomático consistente que conste exclusivamente de [fór-
mulas del cálculo predicativo de primer orden] tiene una realización (Realisierung).
(Consistente (widerspruchslos) quiere decir aquí que ninguna contradicción puede de-
rivarse mediante un número finito de inferencias formales). La última formulación parece
tener cierto interés de por sí, pues la solución de esta cuestión constituye en cierto
sentido un complemento teórico del método usual de las pruebas de consistencia (por
cierto que sólo para el género especial de sistemas axiomáticos aquí considerado), pues
ofrecería una garantía de que este método en todo caso conduce a la meta, es decir,
que o bien tiene que ser posible producir una contradicción, o bien la consistencia
tiene que poderse demostrar mediante un modelo” (Gödel, CW, I, 60).
30 En todo caso, Gödel siguió interesado en el Entscheidungsproblem después de 1931.
Gödel 1932 prueba que hay un algoritmo para decidir la realizabilidad de cualquier
fórmula prenexa de primer orden cuyo prefijo contenga a lo sumo dos cuantificadores

de la llamada clase ∃…∃∀∀∃…∃. Este resultado de Gödel mejora el de Ackermann


universales entre dos filas de cuantificadores existenciales, esto es, cualquier fórmula

1928, quien probó que las fórmulas de la clase ∃…∃∀∃…∃ son decidibles. Gödel 1932

hubiera un algoritmo para decidir la realizabilidad de la clase ∀∀∀∃…∃ (prefijo con


demuestra asimismo que el Entscheidungsproblem quedaría resuelto positivamente si

tres cuantificadores universales seguidos de una fila de existenciales). Esto podía verse

mos ahora— como una prueba de que la clase ∀∀∀∃…∃ es indecidible.


como un avance enorme hacia la solución del problema general o —según lo entende-
2.8 El cálculo predicativo de primer orden es completo 293

alcanzarla.30 Mas, para nosotros que ya lo conocemos, algunas de sus re-


flexiones parecerían anticiparlo. Algunos pensarán —dice Gödel en la intro-
ducción a la tesis— que “la existencia de los conceptos introducidos me-
diante un sistema de axiomas ha de definirse justamente por su consistencia
(Widerspruchslosigkeit).”31

Pero esta definición —con sólo que uno exija, como es obvio, que el
concepto de existencia así introducido obedezca a las mismas reglas de
operación que el elemental— presupone evidentemente el axioma de la
solubilidad de todo problema matemático. Pues si se demostrara la insolubi-
lidad de algún problema (relativo, digamos, al dominio de los números
naturales), de esto se desprendería conforme a dicha definición que exis-
ten dos realizaciones no isomórficas del sistema axiomático de los núme-
ros reales, mientras que, por otra parte, se puede demostrar el isomorfis-
mo que cualquier par de realizaciones. Pero la demostración de la
insolubilidad de un problema no se puede excluir de antemano, si se piensa
que hablamos sólo de insolubilidad con ciertos modos de inferencia for-
mal precisamente señalados. Pues todos los conceptos que vienen a cuen-
to aquí (demostrable, consistente, etc.) sólo tienen un sentido exacto si se
deslindan con precisión los modos de inferencia permitidos.
(Gödel, CW, I, 60–62; cursiva mía)32

El artículo aborda brevemente la cuestión de la independencia de los axio-


mas 1–8. Recuerda que Bernays (1926) ya había probado que ninguno de
los axiomas 1–4 puede deducirse de los otros tres. Obviamente, su indepen-
dencia no se altera al agregar los axiomas 5–8. Para mostrar que también
éstos son independientes —en el sistema total— Gödel opera sustituciones o
adopta postulados que, en cada caso, invalidan a uno de ellos sin afectar la

31 De paso señalo que el pronombre posesivo ‘ihre’ (‘de ellos’ o ‘de ella’) que precede a
‘Widerspruchslosigkeit’ (‘ausencia de contradicción’, arriba traducido ‘consistencia’) sólo
puede referirse al sustantivo plural ‘Begriffe’ (‘conceptos’) o al femenino singular
‘Existenz’ (‘existencia’), y no al neutro singular ‘Axiomensystem’ (‘sistema de axio-
mas’) como cree el traductor inglés (Gödel, CW, I, 61). Por lo demás, en el texto ale-
mán ‘Begriffe’ está más cerca de ‘ihre’ que los otros dos sustantivos. Habría que expli-
car, claro está, qué significa la ‘ausencia de contradicción’ de un grupo de conceptos.
Por esto, he preferido dar una traducción ambigua.
32 En el original sólo van en cursiva las palabras correspondientes a ‘formal precisamente
señalados’.
2.8 El cálculo predicativo de primer orden es completo 294

validez de los restantes (y tampoco, por ende, la de las fórmulas deducibles

∀x∀y(x = y), lo que hace falso a 8 en cualquier dominio con dos o más
de éstos). Por ejemplo, para mostrar que 8 no se deduce de 1–7 postula que

objetos, pero es perfectamente compatible con 1–7. En el pasaje paralelo de


la tesis Gödel examina asimismo la indispensabilidad de las cuatro reglas de
inferencia, aunque algo apresuradamente, me parece (de modus ponens y la
regla de sustitución de variables no dice más que esto: “que las reglas 1 y 2
no son superfluas es algo perfectamente trivial (ist ja vollkommen trivial)”—
CW, I, 96). En ninguno de estos textos se sugiere ni por un instante que la
independencia de los axiomas de la lógica abra la posibilidad de contemplar
lógicas alternativas. Sólo se trata de mostrar que los principios cuya sufi-
ciencia para deducir todas las verdades lógicas enunciables en el CP1= ha
quedado establecida son también imprescindibles para ello. Al fin y al cabo,
si la mera deducibilidad en un sistema formal arbitrario fuese un criterio de
verdad lógica (“en el sistema”) el problema resuelto por Gödel en la parte
principal de estos trabajos no tendría sentido.
2.9 EL PROGRAMA DE HILBERT
VISTO MÁS DE CERCA

Se dice comúnmente que el segundo gran descubrimiento de Gödel —sus


famosos teoremas de “incompletud” (1930a, 1931)— significa el fracaso del
programa de Hilbert. Estudiaremos el hallazgo de Gödel y sus consecuen-
cias más directas en los Capitulos 2.10 y 2.11. Pero para juzgar su efecto
sobre el programa de Hilbert conviene primero examinar los términos en que
él mismo lo explicaba y promovía hasta fines de 1930, antes del shock cau-
sado por Gödel.

2.9.1 Axiomatización y formalización

En los planes de Hilbert para fundamentar sólidamente las matemáticas hay


dos aspectos que suelen confundirse: la axiomatización y la formalización.
Mediante la axiomatización de una teoría matemática —como la practican
ejemplarmente Pasch (1882) y Hilbert (1899, 1900)— se trata de caracteri-
zar exhaustiva y definitivamente el objeto de la misma mediante una lista de
enunciados —los axiomas y definiciones— de suerte que todo lo que la teo-
ría tenga que decir acerca de dicho objeto se pueda demostrar razonando a
partir de esa lista. Mediante la formalización —según la concibe y ejecuta
Frege (1879, 1893, 1903)— se trata de representar las aseveraciones de la
teoría en una “escritura conceptual” de sintaxis sencilla y rigurosa, diseñada
para facilitar la presentación de los razonamientos demostrativos en una for-
ma canónica, fácilmente controlable.
Esta descripción sumaria nos da criterios para medir los aciertos y los
límites de una axiomatización o una formalización. Consideremos una teoría
matemática tradicional cualquiera, por ejemplo, la geometría euclidiana or-
dinaria que Hilbert axiomatizó en 1899. La llamaré E. Todo lo que E tiene
que decir sobre su objeto, es decir, todos los teoremas de E se pueden, por

295
2.9 El programa de Hilbert visto más de cerca 296

cierto, demostrar razonando a partir del solo axioma siguiente: ‘cero no es


idéntico a cero’ (sea lo que fuere el objeto aquí denominado ‘cero’). Pero
este axioma implica también la negación de cada uno de esos teoremas. Para
que caracterice a E, es necesario que la lista de axiomas propuesta sea consis-
tente: si implica una cierta aseveración p, no debe implicar la negación de p.
Por otra parte, la consistencia de la lista de axiomas no es suficiente para
caracterizar a E. Es preciso además que ella sea completa, esto es, que im-
plique todos los teoremas de E. Hilbert menciona estos dos requisitos de una
buena axiomatización a propósito, justamente, de su propia axiomatización
de E (1900, en GG7, p. 242). El requisito de consistencia es crítico e insos-
layable. Pero el requisito de completud se puede trivializar —en el caso de
una teoría nueva o de una tradicional cuyo alcance se disputa— decretando
que el objeto de la teoría que se pretende axiomatizar es precisamente aque-
llo que los axiomas caracterizan. Es lo que hace Hilbert a propósito de los
números reales. En la segunda mitad del siglo XIX éstos habían sido defini-
dos por Cantor y otros autores de varias maneras que apelaban a la existen-
cia de colecciones infinitas bien determinadas de números racionales (cf.
Capítulo 1.3). Kronecker negaba que hubiera tales colecciones. Hilbert (1900)
coge el toro por las astas: formula una lista de cuatro grupos de axiomas
que caracterizan lo que hoy se llama un cuerpo ordenado, completo y
arquimédico (el lector que no conozca este concepto debe ahora mismo con-
sultar el Glosario, s.v. ‘cuerpo’) y propone la estipulación siguiente:

En adelante no debemos entender por ‘el conjunto de los números reales’


algo así como la totalidad de todas las leyes posibles conforme a las cua-
les se suceden los elementos de una secuencia fundamental [definida en
la p. 16—R.T.], sino más bien —como acaba de explicarse— un sistema
de cosas cuyas relaciones mutuas están dadas por el sistema finito y ce-
rrado de los Axiomas I–IV, y sobre las cuales valen nuevas aseveraciones
solamente si se las puede derivar de esos axiomas mediante un número
finito de inferencias lógicas.
(Hilbert 1900, en GG7, p. 246)

La frase de Hilbert “derivar de esos axiomas mediante un número finito de


inferencias lógicas” (“mittels einer endlichen Anzahl von logischen Schlüssen
aus jenen Axiomen ableiten”) corresponde a la que usé arriba: “demostrar
razonando a partir de [ellos]”. Años más tarde, Hilbert ridiculizará a quienes
2.9 El programa de Hilbert visto más de cerca 297

“subrayan la exigencia de que en la matemática rigurosa se permite en una


demostración sólo un número finito de inferencias—como si ya alguien hu-
biese logrado ejecutar una vez infinitas inferencias” (1925, p. 162). Esta ati-
nada observación no se hace cargo, empero, de la vaguedad inherente a la
idea misma de un número de inferencias. Pues ¿qué es una inferencia? To-
dos hemos pasado por la experiencia de oir o leer a un profesor de matemá-
ticas que declara “inmediato” el paso de unas premisas a una conclusión que
no nos parece nada de evidente. Si luego, con trabajo, conseguimos enten-
derlo, será porque logramos analizarlo en varias inferencias que sí son sim-
ples para nosotros.
La formalización de las matemáticas elimina la incertidumbre de tales análi-
sis. En la matemática formalizada, cada razonamiento correcto se representa
—como hemos visto— mediante una listas de fórmula que se suceden unas
a otras conforme a ciertas reglas de cómputo, y cada aplicación simple de
una de estas reglas cuenta como una inferencia. Pero Hilbert ve en la
formalización, sobre todo, un camino para asegurar el cumplimiento del re-
quisito de consistencia. Él había probado (en GG, § 9) que su teoría axiomá-
tica de la geometría era por lo menos tan consistente como la aritmética (in-
cluida la teoría de los números reales). Pero en el caso de la aritmética mis-
ma evidentemente no cabe apelar a la consistencia de otra teoría más funda-
mental.

2.9.2 Balbuceos formales (Hilbert 1904)

Hilbert esboza —muy imperfectamente— una formalización de la aritmética


en su conferencia “Sobre los fundamentos de la lógica y la aritmética” (1904).
Empieza explicando las dificultades de una fundamentación de la aritmética
a través de un breve comentario crítico de las opiniones de seis autores:
Kronecker, Helmholtz, Christoffel, Frege, Dedekind y Cantor. Hilbert conce-
de al primero el mérito de haber visto “en el concepto del número entero el
fundamento genuino de la aritmética”. Pero Kronecker pensaba que el nú-
mero entero nos estaba dado directa e inmediatamente como concepto gene-
ral, lo cual le impidió reconocer que ese concepto necesita y admite una
2.9 El programa de Hilbert visto más de cerca 298

fundamentación.1 Helmholtz sustentaba una filosofía empirista de la aritmé-


tica, que según Hilbert queda refutada por cuanto “nunca se podrá colegir
de la experiencia —vale decir, mediante un experimento— la posibilidad o
la existencia de un número arbitrariamente grande”, dado que “el número de
las cosas que son objeto de nuestra experiencia, por grande que sea, es menor
que cierta cota finita” (GG7, p. 248). Hilbert nombra a Christoffel como el
principal de los “oportunistas” que entendieron correctamente que los irracio-
nales eran indispensables para el análisis y defendieron su existencia contra
Kronecker, sin lograr refutarlo.
Para Hilbert, los tres autores restantes son quienes “han calado más hon-
do en la esencia del número entero”. Frege, que se propuso “fundar las le-
yes de la aritmética por medio de la lógica, concebida en el sentido tradicio-
nal”, tiene el mérito de “haber reconocido correctamente las propiedades esen-
ciales del concepto de número entero así como el significado de la inferen-
cia por inducción completa”. Pero su intento naufraga en paradojas debido a
que Frege (i) da por supuesto que “un concepto (un conjunto) se ha definido
y se puede utilizar inmediatamente en cuanto se haya determinado para cada
objeto si cae o no bajo el concepto” y (ii) “no somete el concepto ‘todo’
(‘jeder’) a restricción alguna”. El fracaso de Frege muestra que “las concep-
ciones y medios de investigación de la lógica, concebida en sentido tradicio-
nal, no están a la altura de las rigurosas exigencias de la teoría de conjun-
tos”. Hilbert proclama enfáticamente que “las investigaciones sobre el con-
cepto de número tienen que proponerse de antemano como una meta princi-
pal evitar tales contradicciones y aclarar esas paradojas”.2 En la obra de

1 Más tarde, Hilbert describirá a Kronecker como su precursor más directo: éste “formu-
ló claramente y dilucidó con numerosos ejemplos una concepción que hoy coincide en
lo esencial con nuestra postura finita” (Hilbert 1931, p. 487). Como bien señala Bernays,
el acuerdo que Hilbert percibe entre su propio modo de pensar y el de Kronecker es-
triba “especialmente en el concepto intuitivo de numeral y en el reconocimiento de
que la forma intuitiva de la inducción completa, esto es, el modo de inferencia que se
basa en la representación intuitiva de la ‘construcción’ de los numerales, es evidente y
no requiere ulterior fundamentación” (1935, p. 203). Sobre la diferencia entre dicha
“forma intuitiva de la inducción completa” y la inducción matemática irrestricta, véase
más adelante la nota 15.
2 El párrafo dedicado a Frege figura en Hilbert, GG7, pp. 248s. Sorprende que Hilbert
creyera que Frege concebía la lógica “en sentido tradicional” (in hergebrachtem Sinne).
Merece atención la sugerencia de que las paradojas vienen de la aceptación indebida
2.9 El programa de Hilbert visto más de cerca 299

Dedekind, Hilbert destaca el método “trascendental” aplicado a la demostra-


ción de la existencia del infinito (bosquejada arriba, en la p. 154, nota 12).
Porque esa demostración recurre al concepto —contradictorio— de la totali-
dad de las cosas, Hilbert se niega a aceptarla como “viable y segura”. Por
último, Cantor sintió la contradicción y expresó, según Hilbert, ese senti-
miento al distinguir entre “conjuntos (Mengen) ‘consistentes’ y ‘no consis-
tentes’”; pero no basó este distingo en ningún criterio preciso, con lo cual
“deja libertad al arbitrio subjetivo y por ende no provee una seguridad obje-
tiva”.3
Completado este panorama, Hilbert declara estar convencido de que “las
dificultades mencionadas se dejan superar y que es posible lograr una funda-
mentación rigurosa y plenamente satisfactoria del concepto de número”
mediante un método que él llama axiomático. A la luz del bosquejo presen-
tado en el resto de la conferencia, es claro que se trata de un intento, todavía
balbuceante, de formalización de la aritmética de los enteros positivos. No
es posible reproducirla aquí en todos sus detalles,4 pero vale la pena llamar
la atención sobre algunos de ellos. La exposición de Hilbert comienza con
la siguiente estipulación:

Llámese cosa pensada (Gedankending) o, brevemente, cosa (Ding) a un


objeto de nuestro pensamiento y nómbresela mediante un signo.
(Hilbert 1904, en GG7, p. 250)

signos 1, =, ᒒ, ᒃ, y ᒃ′. Estas cosas —que luego (p. 255) llama “simples”—
Hilbert propone la consideración de cinco cosas, nombradas mediante los

se combinan en lo que, si damos por supuesto el concepto de número natu-


ral finito, describiríamos sin vacilar como n-tuplos o listas. Pero Hilbert quiere

de ciertos conceptos, no de la suposición injustificada de que cualquier concepto cons-


tituye un conjunto, esto es, un objeto que a su vez es concebible y por ende —bajo
dicha suposición— es elemento de algún conjunto.
3 Hilbert 1904, en GG7, pp. 249. Como vimos en el Capítulo 1.6, Cantor hablaba de
pluralidades (Mannigfaltigkeiten) consistentes e inconsistentes. Sólo las consistentes son
conjuntos (Mengen). Es curioso que Hilbert desdeñara cuando hacía historia la exacti-
tud que juzgaba indispensable en matemáticas.
4 Hay una traducción inglesa de Hilbert 1904 en van Heijenoort 1967, pp. 129–138.
2.9 El programa de Hilbert visto más de cerca 300

tal vez evitar ese supuesto5 y se limita por eso a ilustrar tales combinaciones
de cosas mediante concatenaciones de los signos que las nombran, sin la más
mínima indicación de cómo hay que entenderlas. He aquí sus ejemplos:

1 =, 11 =,…, (1)(= 1)(= = =), ((11) (1) (=)) (= =),

1 = 1, (11) = (1)(1)

el espacio en blanco que a veces precede o sigue al signo = sirve, me ima-


La coma y los puntos suspensivos se usan para separar distintos ejemplos, y

gino, sólo para facilitar la lectura. Pero los paréntesis ) y ( obviamente for-
man parte de la combinación de signos que nombra una dada combinación
de cosas, aunque Hilbert no dice como se usan, ni siquiera los introduce
formalmente. Hilbert nos invita enseguida a “pensar que las combinaciones
de esas dos cosas simples se reparten en dos clases, la clase de los existen-
tes (der Seienden) y la de los no-existentes (der Nichtseienden)” (GG7, p.
251). Si a es una concatenación de signos que nombra una combinación, a
significa también el enunciado de que la combinación nombrada por a per-
tenece a la clase de los existentes y a ‹ significa el enunciado de que dicha
combinación pertenece a la clase de los no-existentes. El enunciado a es
correcto (richtig) si la combinación a efectivamente pertenece a la clase de
los existentes, pero si ella pertenece a la clase de los no-existentes es co-
rrecto el enunciado a .‹ Los enunciados a y a ‹ constituyen —dice Hilbert—
una contradicción.
Hilbert enseña luego a formar un enunciado nuevo a partir de dos enun-

nan, respectivamente, como el signo de disyunción ∨ y el signo de conjun-


ciados dados intercalando entre éstos el signo o. y el signo u. (que funcio-

ción ∧). Si A y B son enunciados, A|B se lee ‘de A se sigue B’ o ‘si A es


correcto, también es correcto B’. Esta explicación y el empleo ulterior del
signo | en la formulación de reglas de inferencia (GG7, p. 260) sugiere que
dicho signo corresponde a nuestro símbolo (metalingüístico) de deducibilidad

ponde a nuestra flecha →. Curiosa es también la forma como Hilbert intro-


∂. Pero Hilbert trata a A|B como enunciado formal, en que el signo | corres-

5 Más adelante Hilbert reconoce, sin embargo, que para demostrar la consistencia del
sistema formal esbozado necesitará el concepto de número ordinal finito (GG7, p. 255).
2.9 El programa de Hilbert visto más de cerca 301

duce lo que hoy llamaríamos cuantificadores. Si A(x) es un enunciado en


que uno o más símbolos que designan cosas se han reemplazado por la va-
riable x y A1, A2, A3,… es una lista de todos los enunciados diferentes que
pueden formarse reemplazando uniformemente x en A(x) por una con-
catenación de signos 1 y =, entonces A(x(o)) representa la disyunción infinita
A1 ∨ A2 ∨ A3 ∨ … y se lee ‘por lo menos para un x, A’ y A(x(u)) representa
la conjunción infinita A1 ∧ A2 ∧ A3 ∧ … y se lee ‘para cada x, A’.6

los cinco signos 1, =, ᒒ, ᒃ, y ᒃ′ y una o más de las letras x, y, w (w figura


A continuación, Hilbert postula cinco “axiomas”. Son concatenaciones de

sólo en las combinaciones w(x) y w(y)). El uso de estas letras se explica así:
x e y representan a uno de los signos 1 y =, o una combinación cualquiera
de estos signos; w(x) representa una combinación arbitraria de los cinco sig-
nos que contiene la combinación de los signos 1 y = representada por la
letra x. He aquí los axiomas, tal como Hilbert los escribe:

1 x = x
2 {x = y u. w(x)} | w(y)
3 ᒃ(ᒒx) = ᒒ(ᒃ′x)
4 ᒃ(ᒒx) = ᒃ(ᒒy) | ᒒx = ᒒy
5 ᒃ(ᒒx) = ᒒ1

6 El original es menos claro que mi paráfrasis. Lo cito a continuación, en aras de la


exactitud histórica. Adviértase que en las páginas que preceden a este pasaje Hilbert no
ha mencionado en ningún momento la posibilidad de que un enunciado (Aussage) con-
tenga una variable (Willkürliche):
Wir wollen unter A1, A2, A3,… diejenigen Aussagen verstehen, die —kurz
ausgedrückt— aus einer Aussage A(x) hervorgehen, indem wir an Stelle der
„Willkürlichen“ x die Gedankendinge 1, =, und die Kombinationen derselben
nehmen; dann schreiben wir die Aussagen
A1 o. A2 o. A3,… bzw. A1 u. A2 u. A3,…
auch wie folgt:
A(x(o)), in Worten: „wenigstens für x“
bzw. A(x(u)), in Worten: „für jedes einzelene x“;
hierin erblicken wir lediglich eine abkürzende Schreibweise.
(Hilbert 1904, en GG7, p. 252)
2.9 El programa de Hilbert visto más de cerca 302

Se trata, evidentemente, de lo que hoy llamamos esquemas. Los axiomas pro-


piamente tales serán las infinitas concatenaciones de signos que pueden for-
marse reemplazando x, y, w(x) y w(y) según las indicaciones ofrecidas. Por
eso desconcierta leer que 1 y 2 son “enunciados (Aussagen)” que conjunta-
mente “constituyen la definición del concepto = (igual)” (GG7, p. 252). Las
explicaciones dadas por Hilbert acerca de los tres restantes sugieren que ellos
deben hacer las veces de los axiomas P1–P4 de Peano (Sección 2.3.1). Los
objetos ᒒ, ᒃ, y ᒃ′ se llaman, respectivamente “conjunto infinito (unendliche
Menge)”, “siguiente (Folgendes)” y “operación concomitante (begleitende
Operation)”. La combinación ᒒx “se llama” un elemento del conjunto infini-
to ᒒ.

Entonces, el axioma 3 expresa que a cada elemento ᒒx le sigue una de-


terminada cosa pensada ᒃ(ᒒx), que es igual a un elemento del conjunto ᒒ,
a saber, al elemento ᒒ(ᒃ′x), que también pertenece al conjunto ᒒ. El axio-
ma 4 expresa el hecho de que, si los elementos que siguen a dos elemen-
tos del conjunto ᒒ son iguales, esos dos elementos también son iguales.
Conforme al axioma 5 no hay en ᒒ ningún elemento al que siga el ele-
mento ᒒ1; por eso este elemento ᒒ1 se llama el primer elemento de ᒒ.
(Hilbert 1904, en GG7, p. 254)

Es difícil imaginarse cómo Hilbert esperaba fundamentar la aritmética con


estos cinco (tipos de) axiomas y las dos reglas de inferencia que formula
explícitamente.7 Pero la idea central de su programa para una prueba directa
de consistencia ya se insinúa claramente. Subraya que el axioma 5 es el único
con la forma a ,‹ propia de un enunciado que adjudica una combinación de
objetos simples a la clase de los no existentes. El sistema sería inconsistente
si permitiera inferir un enunciado que adjudicara a la clase de los existentes
una de las combinaciones así clasificadas por 5; esto es, si permitiera inferir
el enunciado ᒃ(ᒒx(o)) = ᒒ1.8 Ahora bien, este enunciado ciertamente no es lo

Para mayor claridad, doy las dos reglas en nuestro simbolismo: (i) de ((a → b) ∧ (¬a
→ b)) inferir b; (ii) de ((a ∨ b) ∧ (a ∨ c)) inferir (a ∨ (b ∧ c). Adviértase que ninguna
7

de las dos envuelve expresiones con cuantificadores. Tampoco hay una regla de susti-
tución, pero esto es natural si todos los axiomas se dan en la forma de esquemas.
8 Hilbert dice que “los enunciados que forman con 5 una contradicción tienen que ser
[…] de la forma: 6 ᒃ(ᒒx(o)) = ᒒ1” (GG7, p. 254). Si el cuantificador existencial con-
2.9 El programa de Hilbert visto más de cerca 303

que Hilbert llama una ecuación homogénea, esto es, una combinación de la
forma a = b, en que a y b son n-tuplos de objetos simples (para un mismo
n). En virtud de esto, para completar la prueba de consistencia basta demos-
trar que de los axiomas 1–4 no puede inferirse ninguna ecuación que no sea
homogénea. Para efectuar dicha demostración hacen falta, según Hilbert, el
concepto de número ordinal finito y ciertos teoremas sobre el concepto de
equinumerosidad que —nos dice— pueden formularse y derivarse sin esfuerzo
(ohne Mühe). Seguramente tiene razón. En los años 20 —como ya hemos
visto— varios discípulos de Hilbert probarán rigurosamente y sin dificultad
la consistencia del muñón de aritmética basado en los axiomas P1–P4 de
Peano.9

tenido en 6 se concibe a nuestro modo, es claro que (a diferencia de 5) 6 no es una


mera “forma” de enunciado (un esquema), sino un enunciado genuino. Pero no pode-
mos saber con precisión cómo lo concebía Hilbert en 1904.
9 Hilbert 1904 concluye con ciertos “principios normativos de la construcción y ulterior
desarrollo de las leyes del pensamiento matemático en la forma proyectada”, numera-
dos del I al V. Se trata más bien de consideraciones metodológicas. Doy enseguida una
paráfrasis abreviada. I. Cualquier enunciado debe reconocerse como correcto en cuanto
se establezca que no resultará una contradicción al añadirlo como axioma a los enun-
ciados probadamente correctos. (Según Hilbert esto expresa el principio creador que
nos autoriza a formar libremente conceptos nuevos sin otra restricción que la de evitar
las contradicciones). II. En los axiomas, el recorrido de las variables de cuantificación
se limita a las cosas que se dieron inicialmente por sentadas y sus combinaciones, así
como a las cosas que luego se definan en términos de aquéllas. (Se recordará que en el
malogrado sistema de Frege, cada variable de cuantificación recorría supuestamente la
totalidad absoluta de las cosas). III. Al revés de la concepción corriente (a principios
de siglo), el concepto de elemento de un conjunto depende del concepto de conjunto:
“El conjunto se define en general como una cosa pensada m y las combinaciones mx
se llaman elementos del conjunto m” (GG7, p. 258). IV. Al investigar un dado sistema
de axiomas con arreglo a estos principios hay que repartir en dos clases las combina-
ciones de las cosas que se dieron por sentadas, la clase de los existentes y la de los no-
existentes, tratando a los axiomas como prescripciones que esta clasificación tiene que
satisfacer. V. Cuando se habla en plural de cosas pensadas y sus combinaciones, de
variables, de clases de combinaciones, uno se refiere siempre a un número limitado de
tales objetos.
2.9 El programa de Hilbert visto más de cerca 304

2.9.3 Teoría de la prueba

»Wir kennen die Unendlichkeit aus der


Beschreibung.« Nun, dann gibt es eben
diese Beschreibung und nichts sonst.
»Conocemos lo infinito por la descrip-
ción.« Bien, entonces lo que hay es jus-
tamente esa descripción y nada más.
WITTGENSTEIN, PB § 136

Hilbert nunca elaboró en detalle la formalización de la aritmética esbozada


en su conferencia de 1904.10 Su próxima publicación sobre el tema —“Pensa-
miento axiomático” (1918)— remite a la obra de Russell, que propone com-
pletar con una prueba de consistencia. En este escrito —una conferencia pro-
nunciada en Zurich en septiembre de 1917— ‘método axiomático’ no es un
sinónimo de ‘formalización’ (como en Hilbert 1904), sino, como es justo, de
lo que he llamado ‘axiomatización’. Hilbert señala que los hechos com-
prendidos en el campo de estudio de cualquier especialidad científica se or-
denan con ayuda de “un cierto andamio de conceptos (Fachwerk von Be-
griffen) de tal modo que al objeto particular del campo de estudios le co-
rresponde un concepto de ese andamiaje y a cada hecho dentro del campo
de estudios le corresponde una relación lógica entre los conceptos” (Hilbert
1918, en GA III, 146). Dicho andamio conceptual es la teoría de ese campo.
Su construcción descansa en “unas pocas aseveraciones destacadas, [que] bas-
tan por sí solas para construir a partir de ellas todo el andamio, conforme a
principios lógicos” (GA III, 147). Tales aseveraciones son los axiomas de la
teoría. Para que la teoría sirva de veras para ordenar los hechos y orientar el
pensamiento es menester, según Hilbert, hacerse una idea acerca de la mu-
tua dependencia e independencia de sus aseveraciones y tener una garantía

10 Bernays 1935, p. 200, n. 1, observa que el matemático húngaro Julius König, en su


inconclusa Lógica sintética —publicada póstumamente como Nuevos fundamentos de
la lógica, aritmética y teoría de conjuntos (König 1914)— continúa la línea de inves-
tigación iniciada en Hilbert 1904. Bernays agrega que con esa obra König fue un pre-
cursor de la teoría de la prueba, pero que ella no ejerció ninguna influencia sobre Hilbert.
En cambio, el estudio del húngaro von Neumann “Sobre la teoría hilbertiana de la
prueba” (1927) sí se vincula a la obra de König.
2.9 El programa de Hilbert visto más de cerca 305

de su consistencia (Widerspruchslosigkeit). Hilbert cita varios ejemplos de


dependencia e independencia de asertos en teorías conocidas11 y aborda lue-
go la cuestión de la consistencia, cuya “suprema importancia” es patente,
pues “la presencia de una contradicción en una teoría obviamente pone en
peligro la subsistencia de toda la teoría” (GA III, 150). Hilbert alude una
vez más a las pruebas de consistencia relativa —como la que demuestra que
su teoría axiomática de la geometría no puede contener contradicciones si la
teoría de los números reales es consistente— y recuerda que Weierstraß y
Dedekind, empleando conceptos conjuntistas, lograron reducir la consisten-
cia de la teoría de los reales a la consistencia de la teoría de los enteros.
Pero en el caso de la teoría de los enteros y de la teoría de conjuntos ese
procedimiento de reducción a una teoría diferente es inviable “porque fuera
de la lógica no hay ninguna otra disciplina a la que uno pueda entonces
apelar” (GA III, 153). Como “el examen de la consistencia es una tarea in-
soslayable” habrá que “axiomatizar la lógica misma y demostrar que la teo-
ría de los números y la teoría de conjuntos sólo son partes de la lógica”.
Esta tarea, preparada por “las profundas investigaciones de Frege”, ha sido
acometida con muchísimo éxito por “el agudo matemático y lógico Russell”.

En la consumación de esta grandiosa empresa russelliana de la axioma-


tización de la lógica podría verse la coronación de la obra de la axiomati-
zación en general. Pero esa consumación demandará aún nuevas y variadas
labores. Una consideración más atenta nos revela enseguida que en el caso
de los números enteros y los conjuntos la cuestión de la consistencia no

11 Hilbert destaca especialmente la independencia del Postulado de Arquímedes en la fí-


sica: “El hecho de que añadiendo distancias terrestres alcancemos las dimensiones y
distancias entre los cuerpos en los espacios siderales […], así como el hecho de que
las distancias en el interior del átomo se puedan expresar en metros, no son de ningún
modo una mera consecuencia lógica de los teoremas sobre congruencia de triángulos y
la configuración geométrica, sino un resultado de la investigación empírica” (GA III,
149). La siguiente versión del Postulado expresa bien, según él, la forma como los
físicos lo han utilizado siempre, aunque sin mencionarlo:
Si se le asigna un cierto grado arbitrario de precisión a la validez de un enunciado
físico, es posible indicar pequeños dominios (Bereiche) dentro de los cuales las
condiciones del enunciado pueden variar libremente sin que la discrepancia resul-
tante exceda la imprecisión admisible.
(Hilbert 1918, en GA III, 150]
2.9 El programa de Hilbert visto más de cerca 306

está aislada sino que pertenece a un vasto repertorio de dificilísimas cues-


tiones epistemológicas de específica coloración matemática. Menciono, para
caracterizar brevemente este campo de problemas, la cuestión de la
solubilidad en principio de todo problema matemático, el problema de la
posibilidad ulterior de controlar el resultado de una investigación mate-
mática, también la pregunta por un criterio de simplicidad de las demostra-
ciones matemáticas, la cuestión de la relación entre sustantividad (Inhalt-
lichkeit) y formalismo, y por último el problema de la decidibilidad de
una cuestión matemática mediante un número finito de operaciones.
(Hilbert 1918, en GA III, 153)

Los problemas que Hilbert enumera se han comentado en los capítulos


anteriores. Forman parte, según él, del tema de una disciplina matemática
especial. Para dominarlo “debemos investigar el concepto mismo de la prue-
ba específicamente matemática (den Begriff des spezifischen mathematischen
Beweises): así como el astrónomo tiene en cuenta el movimiento de su ob-
servatorio, el físico debe prestar atención a la teoría de su aparato y el filó-
sofo critica a la razón misma” (GA III, 155). Esta es la disciplina que más
tarde llamará teoría de la prueba (Beweistheorie: Hilbert 1928 en GG7, p.
289) y también metamatemática (Metamathematik: Hilbert 1923 en GA, III,
179). A ella pertenecen las investigaciones de Ackermann (1924), von
Neumann (1927) y Herbrand (1929, 1930, 1931) estudiadas en los Capítulos
2.7 y 2.8. Por esos mismos años, Hilbert difunde las ideas básicas de la teo-
ría de la prueba y defiende su valor para la fundamentación de las matemáti-
cas, a través de la docencia y en una serie de alocuciones en seminarios y
congresos (1922, 1923, 1926, 1928, 1928a, 1931). En el resto de esta sec-
ción presentaré esas ideas a la luz de estos textos, prescindiendo de los de-
talles formales, que creo haber ilustrado suficientemente en dichos capítulos.
Hilbert describe varias veces el “supuesto mínimo”12 indispensable para
poner en marcha el discurso lógico-matemático (así como el pensamiento cien-
tífico en general):

Algo nos está ya dado de antemano en la representación; ciertos objetos


concretos extralógicos que preceden como vivencia inmediata a todo pen-
samiento. Para que la inferencia lógica sea segura, estos objetos tienen

12 “Das geringste Maß von Voraussetzung (la mínima medida de presuposición)”—Hilbert


1928, en GG7, p. 290.
2.9 El programa de Hilbert visto más de cerca 307

que dejarse abarcar con la mirada (überblicken) en todas sus partes, y su


presentación (Aufweisung), su distinción, su sucesión o concatenación (ihr
Aufeinanderfolgen oder Nebeneinandergereihtsein) está dado directa e
intuitivamente junto con los objetos como algo que no se deja reducir a
otra cosa ni requiere una reducción.
(Hilbert 1931, p. 486)13

A primera vista, parecería que se trata de un supuesto empírico. Es un hecho


común que percibimos objetos que podemos distinguir, reconocer y combi-
nar; sin ir más lejos: las letras impresas en esta página. A tono con ello,
Hilbert propone —“en directa oposición a Frege y Dedekind”— una aritmé-
tica cuyos objetos sean “los mismos signos, cuya figura podemos reconocer
generalmente y con seguridad independientemente del lugar y el tiempo y
de las condiciones particulares de la producción del signo, así como de dife-
rencias insignificantes en su ejecución” (1922, en GA III, 163). Pero al con-
siderar cómo Hilbert usa su “supuesto mínimo” vemos que éste rebasa los
límites de cualquier experiencia. A continuación del último pasaje citado, da
la siguiente definición de ‘número’ (Zahl):

El signo 1 es un número.
Un signo que empieza con 1 y termina con 1 y en el cual cada 1 va se-
guido por [el signo] + y cada + va seguido por 1 también es un número;
vgr. los signos
1+1
1+1+1
(Hilbert 1922, en GA III, 163)

Fuera de estos “signos” sin significado, que constituyen el objeto propio de


la aritmética, Hilbert introduce signos con significado, como = y >, que sir-
ven para trasmitir aseveraciones (además introduce abreviaturas —2, 3,…—
que significan números). Una fórmula que consta de dos números separados
por el signo = expresa una aseveración verdadera si y sólo si el número a la
derecha de = reproduce el número a la izquierda. Una fórmula que consta de
dos números separados por el signo > expresa una aseveración verdadera si
y sólo si el número a la izquierda de > reproduce el número a la derecha

13 Cf. 1922, en GA III, 162s.; 1926, p. 170; 1928 en GG7, pp. 289s.
2.9 El programa de Hilbert visto más de cerca 308

seguido de una o más copias del signo ‘+1’. Tras esta concisa explicación,
Hilbert propone usar letras góticas como numerales (Zahlzeichen), esto es
como variables que representan números indeterminados. Demuestra luego
el teorema siguiente: cualesquiera que sean los números ᑾ y ᑿ, ᑾ + ᑿ = ᑿ +
ᑾ. En efecto, si ᑾ = ᑿ, es claro que ᑾ + ᑿ = ᑾ + ᑾ = ᑿ + ᑾ. De otro modo,
podemos suponer que ᑿ > ᑾ. En tal caso, hay un número ᒀ tal que ᑿ = ᑾ +
ᒀ. Hay que demostrar, entonces, que ᑾ + ᑾ + ᒀ = ᑾ + ᒀ + ᑾ. Pero esto es

queda demostrado para cualquier par de números 〈ᑾ, b〉 con sólo que sea
obvio si ᑾ + ᒀ = ᒀ + ᑾ. Por lo tanto, como ᑾ + ᑿ > ᑿ = ᑾ + ᒀ, el teorema

válido para cada par 〈ᑾ, ᒀ〉 tal que ᑾ + ᑿ > ᑾ + ᒀ.


Mediante el uso de variables que representan números cualesquiera y de
razonamientos inductivos como el que acabo de parafrasear, Hilbert salta,
más allá de toda “vivencia inmediata”, a la consideración de lo que pode-
mos llamar vivencias posibles—tomando, claro está, el epíteto ‘posible’ en
un sentido bien amplio, no limitado por la cantidad de papel y tinta disponi-
bles para anotar números ni por nuestra capacidad para reconocerlos y dis-
tinguirlos cuando constan de muchas copias de los objetos primarios 1 y +.14
Consciente de ello, Hilbert declara que el “supuesto mínimo” arriba descrito
no proviene de la experiencia ni del pensamiento (Erfahrung und Denken),
sino de “una tercera fuente de conocimiento”: una “disposición intuitiva a
priori (anschauliche Einstellung a priori)” que constituye “la condición de
la posibilidad de todo conocimiento” (1931, p. 486).
Esta intuición a priori hilbertiana —en contraste con la de Kant— es
intrínsecamente finita. Su ámbito constituye el dominio propio del “punto de
vista finito” o la “postura finita”, el suelo firme en que Hilbert cimentará la
matemática.15 Por otra parte, la matemática como la conocemos no tiene

14 Si Hilbert se atuviera a estas limitaciones y ᑿ = ᑾ + ᒀ fuese el número más grande que


el cerebro humano y nuestros demás recursos nos permiten escribir y leer, no podría
pretender que ᑾ + ᑿ = ᑿ + ᑾ, aunque hubiera demostrado paso a paso que ᑾ + ᒀ = ᒀ +
ᑾ.
15 Cf. Hilbert 1931, p. 486: “Das Apriori ist dabei nichts mehr und nichts weniger als
eine Grundeinstellung, die ich auch als die finite Einstellung bezeichnen möchte. (El a
priori aquí no es ni más ni menos que una postura fundamental que quisiera también
llamar la postura finita)” Al incluir en este ámbito de saber incuestionable el tipo de
inferencia inductiva que se usa en la demostración citada, Hilbert parece darle la razón
a Poincaré en su polémica contra el logicismo del Frege y Russell. Poincaré rechazó el
intento de basar la matemática en la lógica porque la edificación rigurosa de la lógica
2.9 El programa de Hilbert visto más de cerca 309

escrúpulos en hablar de lo infinito. Según Hilbert, al emplear los conceptos


‘todo x’ y ‘hay un x’ ya hemos rebasado “lo concretamente intuitivo y fini-
to” (1923, en GA III, 181). Pero estos conceptos pueden eliminarse cuando
se refieren a un agregado finito. “La aseveración de que todos los objetos de
una colección finita abarcable dada tienen una cierta propiedad equivale ló-
gicamente a la reunión de muchas aseveraciones particulares mediante la
conjunción ‘y’ […]. Del mismo modo, la aseveración de que en una colec-
ción finita hay un objeto con una propiedad equivale al enlace de asevera-
ciones particulares mediante la conjunción ‘o’” (GA III, 181). De esto se
desprende inmediatamente que en cualquier colección finita, o bien todos los
objetos tienen una cierta propiedad, o bien hay uno que no la tiene. Los
matemáticos habitualmente dan por descontado sin más que este principio
del “Tercero excluido” (Tertium non datur) vale también para las colecciones

requiere la inducción matemática (Poincaré 1894, en SH, pp. 38–42; 1905/1906, en


CM, pp. 116, 128, 131). Hilbert ya lo había comprendido en 1904 cuando propugna
una fundamentación simultánea de la lógica y de la aritmética (GG7, p. 250; cf. 1922,
en GA III, 174). Pero Hilbert advierte en más de una ocasión (1922, en GA III, 164;
1928, en GG7, p. 301; 1928a, en GG7, pp. 320s.) que el género de razonamiento
inductivo que él acepta y practica sin discusión es muy distinto de la inducción mate-
mática basada en el axioma P5 de Peano (vide p. 146). Cuando demostramos inducti-
vamente que ᑾ + ᑿ = ᑿ + ᑾ cualesquiera que sean los números (filas de signos) ᑾ y ᑿ,

+…+ 1. El “paso inductivo” se reduce a ver que, dada una fila φ de este tipo, la fila
discurrimos sobre la construcción de dos filas de signos de la forma general 1 + 1

φ + 1 que se obtiene añadiendo la fila +1 a la derecha de φ, es idéntica a la fila 1 + φ


que se obtiene al poner la fila 1+ a la izquierda de φ. Del mismo género son los razo-
namientos por inducción sobre el número de paréntesis, o de conectivos, o de
cuantificadores, etc. que se emplean —por ejemplo, en nuestro Apéndice IX— para
establecer propiedades generales de las fórmulas de un cálculo lógico. Pero el axioma
P5 de Peano autoriza inferencias mucho más ambiciosas. Sea n un cierto número y sea
P(n) una aseveración de cualquier grado de complejidad referente a n. Sea P(ᒕ) la ex-
presión que se obtiene al reemplazar en P(n) todas las referencias a n por referencias
al número indeterminado ᒕ. Entonces, P5 nos permite inferir la validez de P(ᒕ), cual-

que sea ᒕ, ¬P(ᒕ) ∨ P(ᒕ + 1). La diferencia entre este caso y el anterior estriba en la
quiera que sea el número ᒕ, de las dos premisas siguientes: (i) P(1) y (ii) cualquiera

complejidad de la aseveración demostrada: P(n) puede referirse mediante cuantificadores


existenciales y universales a toda suerte de números indeterminados. Por eso, Hilbert
considera que la legitimidad de la inferencia inductiva basada en P5 debe justificarse
demostrando la consistencia de los axiomas de la aritmética, y que en esta demostra-
ción cabe emplear, sin circularidad, el otro género de razonamiento inductivo .
2.9 El programa de Hilbert visto más de cerca 310

infinitas. Pero, “así como en el análisis está permitido transferir a sumas y


productos infinitos los teoremas válidos para sumas y productos finitos sólo
cuando esta inferencia está garantizada por una investigación especial de las

ductos lógicos A1 ∧ A2 ∧ A3 ∧ … y A1 ∨ A2 ∨ A3 ∨… como si fueran


condiciones de convergencia, así también, no podemos tratar las sumas y pro-

finitos, a menos que la teoría de la prueba […] autorice este tratamiento”


(GA III, 182; uso nuestro signo ‘∧’ en vez del original ‘&’).
Hilbert quiere preservar intacto el discurso matemático sobre el infinito,
el cual está ya vindicado a sus ojos por la ausencia de contradicciones en el
análisis clásico y por el éxito de sus aplicaciones en la ciencia natural.16 Pero
quiere también establecer sin lugar a dudas y de una vez por todas que esa
forma de discurso es legítima. Para eso, según él, hay que anclarlo firme-
mente en el dominio intuitivo de la “postura finita”: “El operar con lo infi-
nito sólo puede asegurarse a través de lo finito” (1926, p. 190; cf. 1931, p.
488); “la libre manipulación y pleno control de lo transfinito tiene que
alcanzarse en el terreno de lo finito” (1923, en GA III, 182). Para explicar lo
que este proyecto significa, Hilbert evoca la sustitución de los infinitésimos
de Newton y Leibniz por la “epsilóntica” de Cauchy y Weierstraß:17

Así como en los procesos de paso al límite en el cálculo infinitesimal se


ha podido mostrar que lo infinito en el sentido de lo infinitamente pe-

16 “Todos los héroes del espíritu antes de Gauß, y también los que siguen a Gauß, Hermite
y Jacobi hasta Poincaré, han empleado la inferencia transfinita en las formas más va-
riadas y audaces, sin que nunca se haya manifestado ni la más leve discordancia. Por
último, cuando pensamos en las aplicaciones y nos hacemos cargo de la riqueza en
inferencias transfinitas del tipo más difícil y laborioso que albergan, por ejemplo, la
teoría de la relatividad y la teoría cuántica y cómo, sin embargo, la naturaleza se ajusta
precisamente a sus resultados —el rayo de luz de la estrella [curvado cuando pasa cerca
del sol], Mercurio y los espectros más complicados aquí en la tierra y a una distancia
de cientos de miles de años luz— ¿será posible en tales circunstancias que, a causa de
los lindos ojos de Kronecker y unos cuantos filósofos disfrazados de matemáticos, por
razones que además son completamente arbitrarias y ni siquiera se dejan formular con
precisión, dudemos siquiera un instante de que la aplicación del Tertium non datur se
justifica?” (Hilbert 1931, pp. 487s.).
17 El término ‘epsilóntica’ alude a la práctica habitual en los cursos de análisis de utilizar
la minúscula griega epsilon (ε) para referirse a una cantidad arbitrariamente pequeña.

cualquier ε > 0, hay un δ > 0 tal que |ƒ(x) – ƒ(a)| < ε si |x – a| < δ.
Por ejemplo, decimos que la función ƒ: Â Æ Â es continua en el argumento a si, para
2.9 El programa de Hilbert visto más de cerca 311

queño e infinitamente grande no era más que una manera de hablar, así
también lo infinito en el sentido de la colección infinita, como aún ahora
se nos presenta en los modos de inferencia, tiene que reconocerse como
algo meramente aparente. Y así como el operar con lo infinitamente pe-
queño fue reemplazado con procesos en el dominio finito que efectúan lo
mismo y llevan a las mismas elegantes relaciones formales, así también
en general hay que reemplazar los modos de inferencia que envuelven lo
infinito con procesos finitos que efectúan lo mismo, es decir, que hacen
posibles las mismas demostraciones y los mismos métodos para obtener
fórmulas y teoremas.
(Hilbert 1926, p. 162; cursiva mía)18

Otra analogía favorita de Hilbert son los “elementos ideales” introducidos


en diversas teorías matemáticas para redondearlas o simplificarlas.

Así como i = √–1 se introdujo para mantener en pie en su forma más


simple las leyes del álgebra —por ejemplo, las que se refieren a la exis-
tencia y número de las raíces de una ecuación—; así como los factores
ideales se introdujeron para preservar también entre los números enteros

ducimos un divisor común de los números 2 y (1 + √–5), aunque no tie-


algebraicos las leyes simples de divisibilidad —y así, por ejemplo, intro-

nen uno real—; así también tenemos que adjuntar (adjungieren) los enun-
ciados ideales a los enunciados finitos, para preservar las reglas formales
simples de la logica aristotélica usual.
(Hilbert 1926, p. 174; cf. 1928 en GG7, pp. 298s.)

El origen y la índole de tales enunciados ideales puede ilustrarse con el ejem-


plo del álgebra y su método de cálculo literal. Consideremos una vez más el
teorema arriba demostrado: ᑾ + ᑿ = ᑿ + ᑾ, cualesquiera que sean los núme-
ros ᑾ y ᑿ. Aquí las letras góticas ᑾ y ᑿ son, como dijimos, signos con sig-
nificado: cada una representa un número indeterminado cualquiera. Pero en
la práctica ordinaria del álgebra este significado se olvida: el cálculo literal
maneja las letras como objetos primarios que no remiten a nada más allá,
“signos sin significado” como los signos 1 y + de la aritmética finita de

18 A este mismo contexto pertenece la frase de Hilbert en que se inspira el título de este
libro: “Del paraíso que Cantor creó para nosotros, nadie podrá expulsarnos” (1926, p.
170). Las expresiones que destaqué en el pasaje arriba citado indican que Hilbert con-
cibe este paraíso como un set cinematográfico: el Jardín de las Delicias pintado sobre
papel.
2.9 El programa de Hilbert visto más de cerca 312

Hilbert. Por eso Hilbert puede decir (1926, p. 175) que la fórmula algebraica

a+b=b+a

no constituye “una comunicación directa de algo sustantivo”19 sino que es


sólo una “figura formal”, cuya relación con los enunciados finitos

3+2=2+3

5+7=7+5

consiste en que éstos pueden inferirse de aquélla en virtud de los axiomas y


reglas de inferencia comúnmente aceptados. Generalizando este enfoque, la
matemática puede verse como una provisión de fórmulas, que en parte ex-
presan enunciados finitos de contenido sustantivo y en parte no significan
nada. Estas últimas son los enunciados ideales.

Como los enunciados ideales —esto es, las fórmulas que no expresan
aseveraciones finitas— no significan nada, las operaciones lógicas no
pueden aplicárseles de un modo sustantivo como a los enunciados finitos.
Es necesario entonces formalizar también las operaciones lógicas y las
demostraciones matemáticas mismas.
(Hilbert 1926, p. 176)20

19 Como expliqué en la p. 123, nota 13, uso ‘sustantivo’ para traducir el término hilbertiano
‘inhaltlich’.
20 Hilbert prosigue diciendo que, gracias a esa “armonía preestablecida que tan a menudo
se observa en la historia evolutiva de la ciencia”, dicha formalización está ya muy ade-
lantada por obra de los creadores del cálculo lógico.
Los símbolos del cálculo lógico se introdujeron originalmente sólo para la comu-
nicación; pero es consecuente que ahora neguemos todo significado a los signos
lógicos, igual que a los matemáticos, y declaremos que también las fórmulas del
cálculo lógico no significan nada de por sí, sino que son enunciados ideales. En el
cálculo lógico poseemos un lenguaje de signos que es capaz de abarcar en fórmu-
las los teoremas matemáticos y de expresar la inferencia lógica mediante procesos
formales. Igual que en el tránsito de la aritmética sustantiva (inhaltliche
Zahlenlehre) al álgebra formal, contemplamos los signos y símbolos de operacio-
nes del cálculo lógico prescindiendo de su significado sustantivo. Así obtenemos
finalmente, en lugar de la ciencia matemática sustantiva que se trasmite mediante
el lenguaje ordinario, una provisión de fórmulas con signos matemáticos y lógi-
2.9 El programa de Hilbert visto más de cerca 313

Mediante la formalización de las demostraciones, los enunciados ideales


y los enunciados finitos se entrelazan en un sistema formal de matemáticas.
¿En qué relación quedan éstos con aquéllos dentro de dicho sistema? Para
arrojar luz sobre esta cuestión me referiré a un famoso ejemplo de “elemen-
tos ideales” que Hilbert menciona a veces: los “puntos infinitamente leja-
nos” de la geometría proyectiva (cf. Hilbert 1923, p. 187; 1926, p. 166).
Aunque la invención de este recurso puede atribuirse a Kepler y fue utiliza-
do por Desargues y Pascal en el siglo XVII, el auge de la geometría
proyectiva comienza en 1822 con la publicación del Traité des propriétés
projectives des figures de Poncelet. Sesenta años más tarde, Pasch (1882) la
llama simplemente ‘geometría moderna’. El giro característico que conduce
de la geometría tradicional a la proyectiva puede describirse sumariamente
así: Consíderese un plano euclidiano; a cada recta le agregaremos un objeto
que llamamos ‘el punto en el infinito’ de esa recta. Con este agregado, ha-

punto en el infinito de una recta cualquiera λ y a, b y c son tres puntos de


bremos formado el plano proyectivo si sobreentendemos que (i) si p es el

λ tales que b está entre a y c, entonces a está entre p y b, y c está entre b


y p (en virtud de esto es claro que el conjunto de todos los puntos de λ tiene

infinito de λ es idéntico al punto en el infinito de cualquier recta paralela a


el mismo tipo de orden que los puntos de un círculo); (ii) el punto en el

λ, de modo que todas las rectas de una familia de paralelas se intersectan en


su respectivo punto en el infinito; (iii) los puntos en el infinito pertenecien-
tes a cada familia de paralelas forman la ‘recta en el infinito’ del plano
proyectivo; el orden (cíclico) de los puntos de la recta en el infinito se de-
riva fácilmente del orden en que las rectas ordinarias que pasan por un mis-

cos, enfiladas unas tras otras según ciertas reglas. A los axiomas matemáticos
corresponden algunas de las fórmulas, y a la inferencia sustantiva corresponden
las reglas de acuerdo con las cuales se suceden las fórmulas. De este modo, la
inferencia sustantiva es reemplazada por un operar extrínseco (ein äußeres Handeln)
conforme a reglas y se consuma rigurosamente el tránsito del tratamiento ingenuo
al tratamiento formal con respecto a los axiomas mismos —que en un principio
se propusieron ingenuamente como verdades fundamentales, pero que la axiomática
moderna considera hace tiempo como meras combinaciones de conceptos— y tam-
bién con respecto al cálculo lógico, que originalmente no pretendía ser sino un
lenguaje más.
(1926, pp. 176s.; cf. GA III, 165, 179; GG7, pp. 298s.).
2.9 El programa de Hilbert visto más de cerca 314

mo punto ordinario q intersectan un círculo cualquiera con centro en q, ya


que cada punto de la recta en el infinito pertenece a una y sólo una de esas
rectas ordinarias. Los puntos en el infinito han solido considerarse como meras
ficciones, pero también se los ha identificado, por ejemplo, con la dirección
de la recta respectiva: no cabe duda que cada recta del plano euclidiano tie-
ne una dirección y que tal dirección es común a todas las rectas de una fa-
milia de paralelas. La innovación de la geometría proyectiva consiste enton-
ces en definir convencionalmente una relación de orden —descrita en (i) y
(ii)— entre los puntos de una recta y su dirección (como se define en dere-
cho una relación legal de parentesco entre los consanguíneos de una persona
y los consanguíneos de su cónyuge). Más satisfactorio aún es concebir a los
elementos del plano proyectivo como objetos cualesquiera, cuyas propieda-
des y relaciones se especifican mediante postulados, siguiendo el ejemplo de
Hilbert (1899, 1900). Visto de este modo, el plano proyectivo resulta ser no
una ficción matemática arbitraria, ni tampoco un monstruo quimérico gene-
rado asimilando las direcciones de rectas a los puntos del plano, sino una
estructura abstracta realizable en objetos familiares. Concretamente, el haz
de todas las rectas que pasan por un punto p del espacio ordinario constitu-
ye una realización del plano proyectivo si convenimos en llamarlas ‘puntos’,
llamamos ‘recta’ a cada plano determinado por dos de ellas, y designamos
un plano cualquiera como ‘la recta en el infinito’ (lo arbitrario de esta selec-
ción refleja la circunstancia de que en la teoría del plano proyectivo no hay,
en efecto, ninguna diferencia entre la recta en el infinito y las otras rectas).
Si eliminamos del haz el plano elegido para desempeñar este papel, resta un
sistema de ‘puntos’ y ‘rectas’ que llamaré los ‘elementos finitos’ del plano
proyectivo. Dicho sistema reproduce las relaciones de incidencia y orden entre
sus homónimos en el plano euclidiano. Por lo tanto, cualquier teorema de la
geometría proyectiva plana concerniente a relaciones de incidencia u orden
entre elementos finitos expresa una verdad de la geometría euclidiana plana.
Aplicando la analogía de la geometría proyectiva al sistema de la mate-
mática formal concluimos que dentro de éste los enunciados finitos no se
distinguen de los enunciados ideales: unos y otros están a la par. Por lo tan-
to, desde un punto de vista inmanente al sistema, aquéllos no tienen ni una
brizna más de significado que éstos. La diferencia, extrínseca al sistema for-
mal, viene de que los enunciados finitos tienen —y los ideales no— una
traducción dotada de sentido al lenguaje informal e intuitivo de la práctica
2.9 El programa de Hilbert visto más de cerca 315

matemática ordinaria y de la experiencia. La utilidad de los enunciados ideales


reside esencialmente en esto: en el sistema enriquecido con ellos es más fácil
validar muchos enunciados finitos cuya traducción dotada de sentido es ver-
dadera. Como es obvio, tal utilidad se perdería si el sistema formal permitie-
ra validar algún enunciado finito cuya traducción fuese falsa. En otras pala-
bras: para ser útil, el sistema de la matemática formal debe constituir una
extensión conservadora del sistema de los enunciados finitos. Evidentemen-
te, esto es así sólo si la matemática formal es consistente, esto es, si no todo
enunciado formulable en el sistema es a la vez validable en el sistema. In-
troduciendo más precisión en el planteamiento del problema se puede probar
que esta condición necesaria también es suficiente, esto es, que si el sistema
formal es consistente todo enunciado finito validable en él es verdadero
(Smorynski 1977, pp. 846-47; cf. pp. 823-24). La matemática clásica queda-
rá, pues, vindicada si se establece la consistencia de su versión formalizada.
Con este fin, Hilbert hace del sistema mismo de la matemática formal un
objeto de investigación matemática en el sentido tradicional. La investiga-
ción puede conducirse sin infringir las limitaciones impuestas a la matemá-
tica sustantiva, ya que los enunciados del sistema formal son secuencias fi-
nitas de signos tomados de un alfabeto finito y las derivaciones que validan
un enunciado dado a partir de otros ya validados son secuencias finitas de
enunciados, y ambos géneros de secuencias obedecen a reglas perspicuas.
Hilbert llama ‘metamatemática’ (Metamathematik) o también ‘teoría de la
prueba’ (Beweistheorie) a la disciplina matemática —una especie de análisis
combinatorio— encargada de tal investigación. Ella constituye un discurso
con sentido, un razonar sustantivo acerca de los objetos finitos —signos,

suma, de mostrar que un enunciado cualquiera, por ejemplo ‘1 ≠ 1’, no se


fórmulas, pruebas— que componen la matemática formalizada. Se trata, en

puede validar derivándolo en el sistema formal. ¿Quién podría dudar de que

con la demostración, conocida desde la antigüedad, de que √2 es irracional.


esta tarea es abordable de un modo puramente intuitivo? Hilbert la compara

Para establecerlo demostramos intuitivamente que no puede haber dos nú-


meros ᑾ y ᑿ tales que ᑾ2 = 2ᑿ2, o sea, que no pueden existir dos numerales
constituidos del modo descrito.21 “Análogamente, nos corresponde mostrar

21

Euclides, puede formularse así: Si √2 no es irracional, hay dos números ᑾ y ᑿ, primos


La demostración, trasmitida en uno de los apéndices apócrifos de los Elementos de
2.9 El programa de Hilbert visto más de cerca 316

que no puede haber una prueba constituida de cierto modo. Pero una prueba
formalizada, lo mismo que un numeral, es un objeto concreto y abarcable

titución de la fórmula final, a saber, que lea ‘1 ≠ 1’, es una propiedad con-
con la mirada. Es comunicable de principio a fin. También la requerida cons-

cretamente constatable de la prueba. Por lo tanto, esta demostración de he-


cho puede suministrarse, y con ella ganamos el derecho a introducir nues-
tros enunciados ideales” (1926, p. 179; cf. 1928, en GG7, p. 300).22

2.9.4 La investigación de la consistencia de la matemática formalizada,


a la luz del descubrimiento de Gödel

El programa de Hilbert propone, pues, probar la consistencia del sistema


formal de la matemática clásica con medios finitos razonando sustantivamente
sobre sus enunciados y derivaciones, considerados como combinaciones de
signos sin sentido. Esta empresa, al parecer tan factible, ha sido puesta en
cuestión en vista de los resultados que Gödel anunció a fines de 1930 y
demostró rigurosamente en su artículo de 1931, que examinaremos en deta-
lle en el Capítulo 2.10. Me parece oportuno explicar aquí sumariamente en
qué sentido preciso el programa de Hilbert queda afectado por dichos resul-
tados. Así podré afinar un poco más mi descripción de este programa y tam-

entre sí, tales que ᑾ/ᑿ = √2. En tal caso, ᑾ2 = 2ᑿ2. Por lo tanto, ᑾ2 es un número par.
Pero un número par no puede ser el cuadrado de un número impar (si ᒕ = 2ᒋ + 1,
entonces ᒕ2 = 4ᒋ2 + 2ᒋ + 1, que es impar). Por lo tanto, ᑾ es par: ᑾ = 2ᒀ. Por lo tanto,

primos entre sí. ¡Contradicción! Por lo tanto, √2 es irracional.


2ᑿ2 = ᑾ2 = 4ᒀ2 y ᑿ2 = 2ᒀ2. Por lo tanto, también ᑿ es par. Por lo tanto, ᑾ y ᑿ no son

22 El optimismo de Hilbert sería más justificado si la matemática formalizada fuese in-


consistente y se tratase de mostrarlo mediante razonamientos sustantivos sobre objetos

mula “1 ≠ 1”. Bastaría construir una prueba formal que desemboque en esta fórmula.
finitos. Para eso sí que nos ayudaría la índole “concretamente constatable” de la fór-

namientos que la fórmula “1 ≠ 1” no puede aparecer nunca en la última línea de una


Pero la tarea de la metamatemática hilbertiana consiste en mostrar mediante tales razo-

prueba de la matemática formalizada; y no veo bien por qué Hilbert daba tan fácilmen-
te por descontado que esta aseveración referente a todas las infinitas pruebas en prin-
cipio enunciables podría demostrarse con medios finitos.
2.9 El programa de Hilbert visto más de cerca 317

bién, espero, motivar al lector para el esfuerzo de atención que requiere el


estudio de la obra de Gödel.
Gödel considera una formalización de la aritmética elemental ajustada al
prototipo de Principia Mathematica “y sistemas afines”. Las investigaciones
de Church, Turing y otros (Capítulo 2.11) han permitido determinar con pre-
cisión los requisitos que tiene que cumplir un sistema formal para que se le
apliquen los resultados de Gödel y sea, en este sentido, afín a Principia
Mathematica. Se trata sencillamente de esto: que existan procedimientos de
cómputo para decidir, en un número finito de operaciones, si un objeto dado
es o no un signo del sistema, si una secuencia de tales signos es o no un
enunciado del sistema y si una secuencia de tales enunciados es o no una
derivación —una “prueba”— del sistema. No me cabe ninguna duda de que
los sistemas formales estudiados en detalle en la década de los 20 por los
seguidores de Hilbert —Ackermann, Herbrand, von Neumann— llenaban los
requisitos indicados. Por otra parte, en un escrito aparecido el mismo año
que el artículo de Gödel, Hilbert propone adoptar en la matemática formali-
zada una regla de inferencia que infringe esos requisitos, por cuanto autoriza
derivaciones con una lista infinita de premisas. La referida regla dice así:

Si se ha comprobado que la fórmula ᑛ(ᒗ) —donde ᒗ es un numeral


dado— es siempre [esto es, para cualquier numeral—R.T.] una fór-

∀xᑛ(x).23
mula numérica correcta, puede usarse como premisa la fórmula

Hilbert agrega que la nueva regla de inferencia es “finita”, lo que indica —


me parece— que entendía esta palabra clave en una acepción muy personal.
Los sistemas formales que Hilbert y Bernays estudian en el magnum opus
publicado en 1934 y 1939 no incluyen esta regla, y son todos afines a Prin-
cipia Mathematica en el sentido explicado. Ello no obstante, no debemos
perder de vista que Hilbert, aún antes de estudiar los resultados de Gödel,
estaba dispuesto a favorecer un método de formalización que los evade.

23 Hilbert 1931, p. 491. La regla citada suele llamarse “la regla ω” (cf. Isaacson 1992).
Hilbert comenta que la “oración (Aussage)” ∀xᑛ(x) va mucho más lejos que la “fór-
mula (Formel)” ᑛ(ᒗ), con ᒗ un numeral cualquiera, puesto que aquélla autoriza a infe-
rir toda oración que se obtenga reemplazando en ᑛ(x) la variable libre x por cualquier
término que denote un número (no sólo por cualquier numeral).
2.9 El programa de Hilbert visto más de cerca 318

Sea S un sistema formal de aritmética del género descrito. Como luego


veremos, Gödel ideó un método para representar mediante números los sig-
nos, enunciados y derivaciones de S. Las propiedades y relaciones sintácticas
de dichos objetos de S vienen a quedar representadas por propiedades y re-
laciones aritméticas de los números correspondientes. La investigación
metamatemática de S con medios finitos se refleja entonces exactamente en
una investigación combinatoria sobre dichos números, sus propiedades y
relaciones, cuyos razonamientos y resultados se dejan por cierto formalizar
en S. En particular, puede definirse un predicado aritmético P atribuible a
un número si y sólo si ese número representa una fórmula derivable en S.

enunciado ‘1 ≠ 1’, el enunciado que atribuye el predicado P al número a es


Entonces, si a es el número representativo de la fórmula de S que expresa el

verdadero si y sólo si S es inconsistente y la negación de este enunciado es


verdadera si y sólo si S es consistente. Y habrá muchos otros enunciados
que, como éste, representan la consistencia de S. Como son enunciados arit-
méticos, cada uno de ellos se expresa formalmente mediante una fórmula de
S. Sea ‘Consis S’ la fórmula correspondiente a cualquiera de ellos. Gödel
demostró que Consis S no puede derivarse en S a menos que S sea incon-
sistente. Este es el resultado que, en opinión de la mayoría de los matemá-
ticos, dio un golpe de muerte al programa de Hilbert.24 A la luz de las expli-
caciones precedentes, no cabe duda de que este diagnóstico es acertado si la
investigación metamatemática se deja representar, como se ha dicho, por una

24 El pasaje siguiente expresa la opinión del grupo Bourbaki:


Es en efecto en lo relativo a la cuestión de la no-contradicción de las teorías mate-
máticas —el origen y el corazón mismo de la metamatemática— que los resulta-
dos se han revelado más defraudantes. Durante los años 1920-1930 Hilbert y su
escuela desarrollaron métodos nuevos para abordar estos problemas; tras haber
demostrado la no-contradicción de formalismos parciales, que cubrían una parte
de la aritmética, creían estar a un paso de la meta y demostrar no sólo la no-
contradicción de la aritmética sino también la de la teoría de conjuntos, cuando
Gödel, apoyándose en la no-categoricidad de la aritmética, dedujo la imposibili-
dad de demostrar mediante los “procedimientos finitos” de Hilbert, la no-contra-
dicción de cualquier teoria T que contenga a la aritmética.
Sin embargo, el teorema de Gödel no cierra totalmente la puerta a las tenta-
tivas de demostrar la no-contradicción, con tal que se abandonen (al menos par-
cialmente) las restricciones de Hilbert concernientes a los “procedimientos fini-
tos”. Es así como Gentzen en 1936 logró demostrar la no-contradicción de la arit-
2.9 El programa de Hilbert visto más de cerca 319

investigación aritmética formalizable en S; pero el diagnóstico no tiene base


si la investigación metamatemática dispone de recursos que no pueden re-
presentarse así. Ahora bien, parecería que los recursos y procedimientos
representables en la aritmética elemental y, por ende, en S abarcan todo lo
que una persona sensata pudiera describir como ‘métodos finitos’. Por otra
parte, como veremos en el Capítulo 2.12, Gerhard Gentzen (1935, 1938)
demostró la consistencia de un sistema formal de aritmética del tipo estudia-

Cantor llamó ε0 (el primer ordinal ξ, tal que ωξ = ξ.). Hilbert y Bernays
do por Gödel empleando inducción transfinita hasta el ordinal numerable que

reconocieron que los métodos de Gentzen tenían cabida dentro del programa
de Hilbert y eran compatibles con su punto de vista finitista. Para ello tuvie-
ron que “ampliar el marco de los modos de inferencia sustantivos admitidos
en la teoría de la prueba” (1939, p. vii; cito el original en la p. 421, nota 1),
pero esto no les causó, al parecer, ningún escrúpulo. Resta, sin embargo, una
duda: si el programa de Hilbert acaba recurriendo al transfinito, ¿por qué
tantos melindres y reservas ante el paraíso heredado de Cantor? ¿por qué no
instalarse en él, alegremente, de una vez por todas?

ordinal numerable ε0. El valor de “certeza” atribuible a tal razonamiento es sin


mética formalizada utilizando “intuitivamente” la inducción transfinita hasta el

duda menos probatorio que en el caso de los que satisfacen a las exigencias ini-
ciales de Hilbert y es esencialmente cosa de la psicología personal de cada mate-
mático.
(Bourbaki 1970, E.IV.75-76)
Últimamente algunos filósofos han alegado que el citado descubrimiento de Gödel no
constituye un obstáculo para el programa de Hilbert (Webb 1980, Detlefsen 1986, 1990).
Pero hasta la fecha no han establecido que la consistencia de la aritmética se pueda
demostrar con recursos más débiles que los utilizados por Gentzen. Me referiré nueva-
mente a Detlefsen una vez que hayamos estudiado los resultados de Gödel (p. 358,
nota 48).
2.10 LOS TEOREMAS DE INCOMPLETUD DE GÖDEL

2.10.1 Preliminares

En este capítulo estudiaremos el escrito de Gödel “Sobre proposiciones


formalmente indecidibles de Principia Mathematica y sistemas afines” (1931).
Su enorme resonancia histórica responde, en parte, a sus sorprendentes re-
sultados, pero también a los métodos de que el autor se vale para establecer-
los. Los métodos de Gödel sientan las bases para una nueva disciplina ma-
temática, la teoría de las funciones recursivas o “computables”. El gran im-
pacto de esta disciplina sobre la vida diaria viene de que ella es el núcleo
teórico en torno al cual se desarrolla, en la segunda mitad del siglo XX, la
llamada “informática” y la industria de las computadoras. Mas desde un punto
de vista estrictamente científico y filosófico su significación radica en que
hay buenas razones para pensar que el concepto preciso de función compu-
table, definido de varias maneras equivalentes por sus cultivadores, abarca
todas las funciones numéricas (con argumentos y valores en ˆ) cuyo valor,
para cada argumento dado, puede calcularse mediante un algoritmo, en el
sentido intuitivo corriente.1 En el Capítulo 2.7 (p. 247), apelé a la idea
intuitiva de algoritmo para caracterizar los sistemas formales o “cálculos” a
que Hilbert y su escuela querían reducir la matemática clásica. Si esa idea
intuitiva —y vaga— se reemplaza con el concepto preciso que es el tema de
la referida disciplina, los resultados obtenidos por Gödel limitan de un modo
claro y terminante el alcance de cualquier representación de teorías matemá-
ticas mediante tales cálculos y la utilidad de los mismos para la fundamen-
tación de las matemáticas.

1 Como bien señala Post, “si la función recursiva general [una de esas nociones precisas
de función computable—R.T.] es el equivalente formal de la calculabilidad efectiva, su
formulación podría tener en la historia de la matemática combinatoria una importancia
superada sólo por la formulación del concepto de número natural” (1944, p. 315).

321
2.10 Los Teoremas de Incompletud de Gödel 322

Gödel concentra su atención en cierto cálculo P, que se parece mucho al


utilizado en Principia Mathematica.2 Pero sus razonamientos se basan sólo
en ciertas características muy generales de P, y sus conclusiones valen, por
ende, para todo cálculo que las comparta. Desde luego, es claro que tanto el
cálculo de Principia Mathematica como los utilizados por Ackermann, von
Neumann y Herbrand en sus investigaciones metamatemáticas se hallan en
ese caso, y que costaría muy poco adaptar la argumentación de Gödel a
cualquiera de ellos.3 Mas para enunciar los teoremas de Gödel con toda
generalidad, habría que decir exactamente en qué consisten las característi-
cas en cuestión. Así se deslindaría la clase de los “sistemas afines” a Prin-
cipia Mathematica mencionados el título de Gödel 1931. Ahora bien, dichas
características se reducen esencialmente a dos: (i) cada cálculo o sistema de
esa clase provee una representación formal de la aritmética elemental; y (ii)
la sintaxis del cálculo puede a su vez representarse mediante números natu-
rales y sus propiedades y relaciones. Luego explicaré en detalle el significa-
do de (i) y (ii) a propósito del cálculo P de Gödel.4 En todo caso, la idea de
una representación formal de la aritmética no tomará por sorpresa al lector
de los capítulos anteriores (especialmente, el 2.6). En cambio, la idea de una
representación numérica de la sintaxis del cálculo es una de las contribucio-
nes originales de Gödel, de una sencillez genial. Como veremos luego, la
representación numérica requerida debe cumplir con los siguientes requisi-
tos: (a) que cada objeto del cálculo, esto es, cada signo, cada fila de signos
y cada lista de tales filas de signos, tenga un número de identidad exclusivo;
(b) que, dado un número natural n, sea posible establecer, mediante un nú-
mero finito de operaciones aritméticas elementales, si n es o no el número

2 En la comunicación preliminar de sus resultados a la Academia de Viena, Gödel (1930b)


dice haberlos establecido para el caso del cálculo de Principia Mathematica “con Axioma
de Reducibilidad o sin Teoría Ramificada de los Tipos” (CW, I, 140 n.1). De hecho, su
cálculo P se ajusta a la segunda alternativa: es un cálculo predicativo de orden ω, con-
forme a la teoría simple de los tipos.
3 En cambio, como indiqué en la p. 317, la argumentación de Gödel no es aplicable a un
cálculo cuyas reglas de inferencia incluyan la regla ω, allí citada, que Hilbert (1931, p.
491) propuso después que le comunicaron los resultados de Gödel.
4 El Apéndice XVI contiene una formulación precisa de las condiciones (i) y (ii), aplica-
ble a cualquier cálculo. Ella proviene de una obra reciente (Smullyan 1992), donde se
la utiliza en la presentación de la “forma abstracta” del primer teorema de incompletud
de Gödel resumida en dicho Apéndice.
2.10 Los Teoremas de Incompletud de Gödel 323

de identidad de una prueba (esto es, de una lista de fórmulas del cálculo,
cada una de las cuales es un axioma del cálculo o se deduce, conforme a las
reglas de inferencia del cálculo, de una o más fórmulas que la preceden en
la lista) y, en caso afirmativo, (c) que sea posible reconstruir las fórmulas de
que consta la prueba correspondiente. Gracias a esta doble representación —
de la aritmética en el cálculo y del cálculo en la aritmética— Gödel puede
cerrar el círculo de espejos en que descansa su Teorema VI, el “primer teo-
rema de incompletud”. En la Sección 2.10.2 describiré, paso a paso, la com-
pleja argumentación que culmina en ese teorema. Pero antes conviene deli-
nearla a grandes rasgos, para saber adónde lleva, y sobre todo para captar
con un sólo golpe de vista la función que desempeñan en ella las caracterís-
ticas (i) y (ii). El bosquejo siguiente es una paráfrasis del ofrecido por el
mismo Gödel (1931, § 1).
Gödel supone que toda oración deducible de los axiomas del cálculo con-
siderado —esto es, toda oración que ocupa el último lugar de una lista que
constituye una prueba— expresa una aseveración verdadera. Este supuesto
es muy razonable, pues mal podría pretenderse formalizar la aritmética en
un cálculo que genera teoremas falsos. Con todo, Gödel lo adopta sólo para
facilitar la presentación del bosquejo preliminar: la demostración rigurosa del
Teorema VI en el § 2 depende de supuestos puramente sintácticos, y no in-
voca el concepto de verdad. Para decir en castellano que φ es una oración
deducible de los axiomas del cálculo, escribiremos ∂φ;5 asimismo, la abre-
viatura Îφ expresará que φ no es una oración deducible de los axiomas del
cálculo. Supondremos que el cálculo contiene categorías sintácticas homólogas
a las constantes y variables de nuestros cálculos predicativos (Apéndice IX).6
Para que pueda representar formalmente la aritmética, el cálculo debe conte-
ner un conectivo —primitivo o introducido por definición— que prefijado a
una oración verdadera genere una oración falsa y prefijado a una falsa gene-
re una verdadera. Simbolizaré este conectivo del cálculo con el signo

5 Gödel usa la abreviatura Bew, del alemán ‘beweisbar’ (‘demostrable’). Sus traductores
al inglés y al castellano han preservado esta abreviatura, aunque en estos idiomas, a
diferencia del original, ella obstaculiza la lectura: no sólo no evoca ninguna palabra
pertinente, sino que ni siquiera se la puede pronunciar con facilidad.
6 Este requisito afecta, sin duda, la generalidad del argumento. Como puede verse en el
Apéndice XVI, de hecho no se lo necesita para demostrar la “forma abstracta” del pri-
mer teorema de Gödel presentada allí.
2.10 Los Teoremas de Incompletud de Gödel 324

russelliano de negación ~.7 Diré que la oración ϕ es demostrable si es de-


ducible de los axiomas, esto es, si ∂φ; y que es refutable si su negación es
demostrable, esto es, si ∂~φ. Se trata de probar que hay en el cálculo por lo
menos una oración que no es demostrable ni refutable.
Sea F1 la clase de las fórmulas que contienen una y sólo una variable
libre. Si α es una fórmula de esa clase, designamos con [α;n] a la fórmula
—en efecto, una oración— obtenida al sustituir la única variable libre de α
(en todas sus posiciones) por el nombre del número n. Suponemos F1 orde-
nada según el orden de magnitud creciente de los números de identidad de
sus fórmulas. Sea Rn la n-ésima fórmula de F1 y K el conjunto de todos los
números n tales que Î[Rn;n].8 Pertenecer a K es una propiedad de números
que se puede representar en el cálculo, si éste posee la característica (i). Tiene
que haber, pues, una fórmula κ de la clase F1 que se transforma en una
oración verdadera cuando su única variable libre es reemplazada por el nom-
bre de un número que pertenece a K y en una oración falsa cuando esa va-
riable es reemplazada por el nombre de un número que no pertenece a K.
Esa fórmula tiene un número de identidad, digamos, el q-ésimo en el orden
inducido en F1. La fórmula κ es, entonces, precisamente la fórmula que
hemos convenido en llamar Rq. Consideremos la oración [Rq;q]. Esta ora-
ción no es demostrable ni refutable en el cálculo. En efecto, supongamos
que ∂[Rq;q]. Entonces [Rq;q] es verdadera. Pero [Rq;q] es la oración obteni-
da al reemplazar la variable libre en Rq por el nombre del número q. Dicha
oración es verdadera sí y sólo si q ∈ K, esto es, si y sólo si Î[Rq;q]. Por lo
tanto, [Rq;q] no es demostrable. Supongamos, entonces, que su negación lo
es, esto es, que ∂~[Rq;q]. Entonces [Rq;q] es falsa. Pero [Rq;q] es la oración
obtenida al reemplazar la variable libre en Rq por el nombre del número q;
dicha oración es falsa sí y sólo si q ∉ K, esto es, si y sólo si ∂[Rq;q]. Así
pues, ~[Rq;q] sólo es demostrable si también lo es [Rq;q], o sea, si el cálcu-
lo es inconsistente. Pero esto sería incompatible con el supuesto inicial de

7 Adopto esta convención porque en toda este capítulo utilizaré nuestros símbolos logicos
como abreviaturas del discurso metalógico que conducimos en castellano. Imito así la
práctica de Gödel, que destinó a tal propósito los símbolos de Hilbert y Ackermann
1928.
8 En otras palabras, el número n pertenece al conjunto K si y sólo si la oración obtenida
al sustituir la variable libre en la fórmula Rn por el nombre de n no es deducible de los
axiomas de P.
2.10 Los Teoremas de Incompletud de Gödel 325

que ninguna oración falsa es deducible de los axiomas.


El argumento precedente muestra que un cálculo que posee las caracterís-
ticas (i) y (ii) y en que toda expresión demostrable es verdadera contiene
necesariamente una oración que no es demostrable ni refutable. En otras
palabras, cualquier cálculo de la clase indicada es incompleto en el sentido
de Post. La oración [Rq;q], que lo atestigua, es verdadera si y sólo si el
número q pertenece al conjunto numérico
K = {n:[Rn;n] no es deducible de los axiomas}.
Tenemos, entonces, que [Rq;q] es verdadera, puesto que [Rq;q], en efecto, no
es demostrable. Por otra parte, como [Rq;q] no es demostrable, si agregamos
a la lista de axiomas la oración falsa ~[Rq;q], el sistema así formado es
consistente. Por lo tanto, la verdad matemática no puede simplemente equi-
pararse a la deducibilidad en un sistema consistente, como pretendía Hilbert.9
El razonamiento de Gödel ilustra el “método diagonal” descrito en la p.
43, nota 11. Como se recordará, dicho método se utiliza asimismo en la
demostración del Teorema de Cantor y en la construcción de la paradoja de
Russell. Gödel subraya la analogía entre su razonamiento y las paradojas de
Richard y del mentiroso. Pero también la diferencia es obvia: “la fórmula ϕ
es verdadera si y sólo si la negación de ϕ es verdadera” es una contradic-
ción; pero “la fórmula φ es demostrable si y sólo si la negación de ϕ es
demostrable” significa únicamente que la fórmula φ no puede deducirse de
los axiomas convenidos aplicando las reglas de inferencia adoptadas (a me-
nos que esos axiomas y reglas determinen un sistema deductivo inconsisten-
te). Aunque defraudante para quien haya puesto su fe en los poderes del cál-
culo, esta conclusión no tiene nada de paradójica. De hecho, no debiera sor-
prendernos, puesto que, como se ha visto en los capítulos anteriores, el uso
de cálculos lógicos implica un sacrificio feroz de la inteligencia en aras de
la seguridad.

9 Recuérdese el pasaje de la carta de Hilbert a Frege del 29 de diciembre de 1899 (Frege,


KS, p. 411), citado en p. 118.
2.10 Los Teoremas de Incompletud de Gödel 326

2.10.2 La incompletud de la aritmética

Concluido el bosquejo preliminar, Gödel emprende una demostración ri-


gurosa de sus resultados, aplicable a cierto cálculo P bajo hipótesis sintácticas
precisas relativas a su consistencia. El § 2 (1931, pp. 176-191), que conclu-
ye con el primer “teorema de incompletud” (Teorema VI), es una de las
cumbres de la historia de la lógica, y creo que el lector debe darse el trabajo
de leerlo. (Hay una buena traducción castellana en Gödel, OC). La explica-
ción siguiente debiera facilitar, mas no sustituir esa lectura. Omitiré, pues,
algunos detalles. Distinguiré cuidadosamente los pasos sucesivos del razona-
miento, señalando la función de cada uno; pero descifraré, a modo de ejem-
plo, sólo una parte de las definiciones abreviadas de Gödel, dejando al lec-
tor la tarea, tediosa pero necesaria, de explicitar todas las otras.

1º El primer paso es la descripción de la sintaxis del cálculo P. En aras de


la precisión, la repetiré íntegra; pero conviene tener presente que Gödel no
emplea el cálculo para derivar teoremas. Por lo tanto, el lector no necesita
dominarlo. P es un cálculo predicativo análogo a los CP= del Apéndice IX,
pero ajustado a la teoría simple de los tipos (cf. Capítulo 2.4). Los signos
primitivos son los conectivos ~ y ⁄ (negación y disyunción),10 el signo de
cuantificación universal Π, la constante individual 0 (‘cero’), el functor unario
ƒ (‘el siguiente de’), los paréntesis ) y (, e infinitas variables de distintos
tipos, uno para cada entero positivo. Las variables de tipo 1, x1, y1, z1,…,
representan números naturales indeterminados; las de tipo 2, x2, y2, z2,…,
representan clases de números naturales; las de tipo 3, x3, y3, z3,…, clases
de clases de números naturales, etc. Gödel observa que no hace falta admitir
variables que representen relaciones, ya que éstas pueden concebirse como
clases de clases (por ejemplo, cada relación diádica corresponde a una clase
de pares ordenados y cada par ordenado 〈x,y〉 a la clase de clases {{x},{x,y}}).
Son signos de tipo 1 (i) el 0, (ii) cualquier variable de tipo 1, (iii) cualquier
signo de tipo 1 precedido por el functor ƒ. Un signo de tipo 1 que contiene
el 0 —por ejemplo, ƒƒƒƒ0— se llama numeral.11 Usaré a veces la abrevia-

10 Le doy al signo de disyunción ⁄ del cálculo P más peso que Gödel para distinguirlo
de nuestro signo ∨, que, como dije en la nota 7, reservo para el discurso metalógico.
11 Gödel dice ‘Zahlzeichen’, literalmente ‘signo de número’.
2.10 Los Teoremas de Incompletud de Gödel 327

tura ƒk0 para referirme al numeral formado por k copias de ƒ seguidas de 0.


Dicho numeral puede verse como el nombre, en P, del número natural k. Si
n ≥ 2, un signo de tipo n es simplemente una variable de tipo n. Si a es un
signo de tipo n (n ≥ 2) y b es un signo de tipo n–1, la expresión a(b) es una
fórmula elemental. Una fórmula de P es una fila de símbolos que cae bajo
una de las descripciones siguientes:

(1) Una fórmula elemental es una fórmula.


(2) Si a es una fórmula, ~(a) es una fórmula (la negación de a).
(3) Si a y b son fórmulas, (a) ⁄ (b) es una fórmula (la disyunción de
a y b).
(4) Si a es una fórmula y x es una variable de cualquier tipo, xΠ(a) es
una fórmula (una generalización de la fórmula a); (a) es el alcance
del cuantificador xΠ; decimos que la variable x está ligada por el
cuantificador xΠ en todas las posiciones que ocupa en la expresión
(a).

Se advertirá que hay pequeñas diferencias entre P y nuestros CP, en cuanto


al uso de los paréntesis y la posición relativa del signo de cuantificación y
la variable correspondiente. Como aquí estudiaremos, pero no utilizaremos
el cálculo P, me ha parecido innecesario ajustarlo a la forma acostumbrada.
Una variable que no está ligada se dice libre. Una fórmula sin variables li-
bres es una oración.12
El cálculo P se organiza como sistema deductivo con infinitos axiomas y
dos reglas de inferencia. Las reglas son (i) modus ponens y (ii) generaliza-
ción universal. Gödel las enuncia así: decimos que (i) la fórmula c es una
consecuencia inmediata de las fórmulas a y b si a es la fórmula ~(b) ⁄ (c)
y (ii) c es una consecuencia inmediata de a si c es la fórmula vΠ(a), donde
v es una variable cualquiera. Para facilitar el enunciado de los axiomas, Gödel
adopta “las convenciones habituales sobre la omisión de paréntesis” e intro-
duce símbolos auxiliares, utilizados como abreviaturas (en P): los conectivos
⋅ (conjunción), ⊃ (implicación) y ≡ (equivalencia) y el cuantificador
existencial (Ex) —que supone definidos en la forma habitual (cf. Apéndice
IX.D)— y el signo de identidad = , que define (en la nota 21) así: ‘xn = yn’

12 Gödel dice ‘Satzformel’, literalmente ‘fórmula de oración’.


2.10 Los Teoremas de Incompletud de Gödel 328

abrevia a ‘xn+1Π(~xn+1(xn) ⁄ xn+1(yn)). Los axiomas se clasifican en cinco


grupos. Los tres axiomas del grupo I se enuncian así:

I.1 ~(ƒx1 = 0)
I.2 ƒx1 = ƒx2 ⊃ x1 = x2
I.3 x2(0)⋅x1Π(x2(x1) ⊃ x2(ƒx1)) ⊃ x1Π(x2(x1))

Estos axiomas expresan que cero no es el siguiente de ningún número, que


el siguiente de un número no es igual al siguiente de ningún otro número y
que si cero pertenece a una clase que contiene el siguiente de cualquier
número contenido en ella, esa clase contiene todos los números. Correspon-
den, pues, respectivamente, a los axiomas P4, P3 y P5 de Peano (p. 146).13
Los restantes axiomas se enuncian mediante esquemas, esto es, reglas para
construir determinadas fórmulas de P, que serán propiamente los axiomas.
Los axiomas formados según los cuatro esquemas del grupo II garantizan la
deducibilidad de cualquier tautología (por modus ponens). El grupo III com-
prende todos los axiomas formados reemplazando, en los dos esquemas si-
guientes, (1) a por una fórmula cualquiera α, (2) v por una variable cual-
quiera ξ, (3) b por una fórmula en la que la que ξ no esté libre en ninguna
posición y (4) c por un signo del mismo tipo que ξ, y que no contenga nin-
guna variable ligada en α por un cuantificador dentro de cuyo alcance figure
ξ. Los esquemas son:

III.1 vΠ(a) ⊃ a[c/v]


III.2 vΠ(b ⁄ a) ⊃ b ⁄ vΠ(a)

Los axiomas del grupo IV desempeñan la función del Axioma de Redu-


cibilidad de Russell y Whitehead, o de los axiomas de comprensión en la
teoría de conjuntos. Se obtienen reemplazando en el siguiente esquema (1) v
por una variable de tipo n ≥ 1; (2) u por una variable de tipo n+1 y (3) a
por una fórmula en que la variable que reemplaza a u no ocupa una posición
libre:

IV.1 (Eu)(vΠ(u(v) ≡ a)

13 Por su parte, la definición recursiva de numeral —0 es un numeral; si η es un nume-


ral, ƒη es un numeral— reemplaza los axiomas P1 y P2.
2.10 Los Teoremas de Incompletud de Gödel 329

Por último, el grupo V consta del axioma enunciado a continuación y todas


las fórmulas que pueden obtenerse a partir de él mediante el procedimiento
que Gödel llama “elevación de tipo”.

V.1 x1Π(x2(x1) ≡ y2(x1)) ⊃ x2 = y2

Elevar el tipo de una fórmula dada α consiste, simplemente, en reemplazar


las variables ξ1,…, ξk, de tipos t1,…, tk, contenidas en α, por variables
de ζ1,…, ζk, de tipos t1+n,…, tk+n (n ≥ 1).

2º El paso siguiente consiste en asignarle un número de identidad exclusivo


a cada signo, fila de signos y lista de filas de signos de P. Si ϕ es uno de
estos objetos, llamaré el gödel de ϕ (abreviado, #[ϕ]) al número asignado a
ϕ en virtud del procedimiento que describiré enseguida.14 Doy por sabida la
siguiente propiedad de los números naturales: todo número mayor que 1 se
puede analizar de una y sólo una manera como producto de factores primos;
por ejemplo, 766.360 = 23 × 51 × 72 × 171 × 231. La expresión a la derecha
del signo = es la factorización prima de 766.360 y los números 2, 5, 7, 17
y 23 son sus factores primos. En lo sucesivo, llamaré pn al n-ésimo número
primo (p1 = 2, p2 = 3, p3 = 5,…).
Siguiendo a Gödel, estipulamos que #[0] = 1, #[ƒ] = 3, #[~] = 5, #[⁄] =
7, #[Π] = 9, #[(] = 11 y #[)] = 13. Asimismo, asignamos el n-ésimo primo
mayor que 13 —esto es, pn+6— a la n-ésima variable de tipo 1. Si vtn desig-
na la n-ésima variable de tipo t, #[vtn] = (pn+6)t (el n-ésimo primo mayor que
13 elevado a la t-ésima potencia). Hemos fijado así el gödel de cada signo
de P de tal modo que dado un número cualquiera q se puede determinar
mediante un número finito de operaciones aritméticas simples si q es el gödel
de un signo de P: tiene que ser un impar menor que 14 o una potencia de un

14 La denominación estándar de #[ϕ] es ‘el número de Gödel de ϕ’. Esta expresión tradu-
ce literalmente las que se usan en alemán y en inglés, idiomas en que el genitivo ‘de
Gödel’ se expresa anteponiendo ‘Gödel’ a ‘Zahl’ o ‘number’ (‘número’); pero suena
torpe en castellano. En cambio, no me caería mal escribir, casi fonéticamente, ‘guédel’
(plural, ‘guédeles’); pero no me he atrevido a tanto. Por cierto, la denominación ‘el
gödel de ϕ’ y el símbolo #[ϕ] se aplican también a los números de identidad asignados
a los objetos de cualquier cálculo lógico mediante un procedimiento análogo al que se
explicará arriba. En el Apéndice XVII, explico el método mucho más simple propuesto
por Smullyan (1992) para un cálculo similar a P.
2.10 Los Teoremas de Incompletud de Gödel 330

primo mayor que 13; además, al averiguarlo, se establece a qué signo co-
rresponde. Supongamos ahora que Φ = α1α2…αk es una fila de k signos
de P. Estipulamos que #[Φ] = 2#[α1] × 3#[α2] ×… × pk#[αk]. Por último, si L
= 〈Φ1,Φ2,…, Φr〉 es una lista de filas de signos de P, estipulamos que #[L]
= 2#[Φ1] × 3#[Φ2] × … × pr#[Φr]. Nuestras estipulaciones garantizan la unici-
dad del gödel correspondiente a cada fila de signos y a cada lista de filas,
así como la posibilidad de recuperar el objeto correspondiente a un número
dado con sólo analizarlo en sus factores primos.15 Por lo tanto, si n es el
gödel de un objeto del cálculo, el objeto con gödel n es un ente perfecta-
mente determinado, que llamaré †[n]. Por otra parte, es claro que, bajo las
condiciones prescritas, hay números que no son el gödel de ningún objeto
del cálculo P.
Sea K una propiedad atribuible a ciertos objetos del cálculo; por ejemplo,
la propiedad de ser una variable de tipo 5, o de ser una prueba, o de ser una
fórmula no demostrable. Entonces, la clase de números K# = {x:x es el gödel
de un objeto que tiene la propiedad K} provee una representación numérica
de la propiedad K. Es natural referirse a los elementos de K# con un predi-
cado que recuerde al utilizado para designar la propiedad K. Gödel (1931)
usa con este fin el mismo predicado, impreso en cursivas. Pero aquí, siguiendo
la práctica de sus editores (CW, OC), usaré las versalitas. Así, si α es un
axioma de P, digo que el número #[α] es un AXIOMA. En otras palabras, el
número x es un AXIOMA si y sólo si el objeto †[x] existe y es un axioma de
P. Lo mismo vale, mutatis mutandis, para las relaciones. Por ejemplo si la
fórmula α es una consecuencia inmediata por modus ponens de las fórmulas
β y γ, digo que #[α] es una CONSECUENCIA INMEDIATA POR MODUS PONENS de
#[β] y #[γ].

3º Enseguida, Gödel define lo que llama funciones y relaciones recursivas.


Aunque lo presenta como “una digresión (eine Zwischenbetrachtung) que,
por de pronto, no tiene nada que ver con el sistema formal P” (1931. p. 179),
este pasaje —como arriba adelanté— ha tenido repercusiones enormes. Lo

15 Obsérvese, por ejemplo, que un número dado es el gödel de una fila de k signos sólo
si es divisible por potencias impares de cada uno de los primeros k primos, y es el
gödel de una lista de h filas de signos sólo si es divisible por potencias pares de cada
uno de los primeros h primos.
2.10 Los Teoremas de Incompletud de Gödel 331

que Gödel llama aquí “funciones recursivas” es sólo una parte de la familia
que hoy conocemos por ese nombre.16 Pero —como veremos en el Capítulo
2.11— la familia completa se forma con sólo añadir dos sencillas operacio-
nes generadoras a las admitidas por Gödel.17 Como dije al comienzo, es jus-
tificado pensar que esta familia comprende todas las funciones numéricas que
es posible computar mediante un algoritmo. Gödel mismo no creyó en un
principio que la clase de las funciones computables mediante un algoritmo
se pudiera caracterizar así —sólo se convenció después de leer a Turing
(1937)— y, por cierto, nunca pretendió que toda función computable fuera
recursiva en el sentido restringido definido por él en 1931. Pero cada fun-
ción recursiva en este sentido restringido es computable mediante un algorit-
mo que se especifica en su misma definición.
Una función recursiva es una función numérica, esto es, una función cuyo
dominio y alcance están contenidos en el conjunto ˆ de los números natu-
rales. En particular, las funciones recursivas en el sentido restringido de Gödel
están definidas en todo ˆ. Esta clase de funciones se distingue sólo por un
pequeño detalle de lo que hoy se llama la clase de las funciones recursivas
primitivas, que definimos así:

16 Jesús Mosterín, en su excelente traducción castellana de Gödel, se toma la libertad de


escribir “recursiva primitiva” donde el original dice “rekursiv” a secas (OC, p. 62).
Esta iniciativa viola la integridad del documento en un punto esencial para el historia-
dor de las ideas. Es verdad que la ilustre matemática húngara Rósza Péter (1934) lla-
mó ‘primitiv rekursiv’ a las funciones “recursivas” de Gödel 1931, pero ese nombre se
usa ahora en un sentido un tanto más amplio: lo que hoy llamamos funciones recursivas
primitivas coincide con lo que Gödel llama “funciones recursivas” en 1934 (CW I, p.
347; OC, p. 169), mas no con lo que Gödel llamó de ese modo en 1931 (la definición
de 1931 omite la cláusula PR3 de la definición de funciones recursivas primitivas que
doy enseguida en el texto (vide p. 332).
17 Una es la indicada en la referida cláusula PR3: La proyección que asigna a cada r-
tuplo de números naturales su k-ésimo término (1 ≤ k ≤ r) es una función recursiva
primitiva. Me referiré a la otra en el Capítulo 2.11; pero aquí va un anticipo. Sea µyΦ(y)
el más pequeño número natural y que cumple la condición Φ(y), o el número 0 si nin-
gún número la cumple. Si ϕ es una función recursiva (n+1)-ádica, entonces también es
recursiva la función n-ádica ψ definida por:

ψ(x1,…,xn) = µy(φ(x1,…,xn,y) = 0 ∧ ∀z(z < y → φ(x1,…,xn,z) > 0))

Kleene (1936) demostró que cualquier función recursiva (en el sentido actual) puede
expresarse como una función compuesta de no más de dos funciones recursivas primi-
tivas y una aplicación de la función µ.
2.10 Los Teoremas de Incompletud de Gödel 332

PR1 La función sucesor x Å x + 1 es recursiva primitiva.


PR2 Si r es un entero positivo, la función cero 〈x1,…, xr〉 Å 0 es
recursiva primitiva.
PR3 Si r es un entero positivo, la función 〈x1,…, xr〉 Å xk (1 ≤ k ≤ r)
es recursiva primitiva. Esta función se llama la k-ésima proyección
de ˆr, simbolizada πrk o simplemente πk.18
PR4 Si h es una función recursiva primitiva m-aria, y g1,…,gm son
funciones recursivas primitivas n-arias, también es recursiva primi-
tiva la función compuesta:
〈x1,…, xn〉 Å h(g1(x1,…, xn),…,gm(x1,…, xn))
PR5a Si k ∈ ˆ y h es una función recursiva primitiva 2-aria, también es
recursiva primitiva la función 1-aria f definida por la doble condi-
ción siguiente:
f(0) = k
f(x+1) = h(x,f(x))

PR5b Si n > 1, g es una función recursiva primitiva (n-1)-aria y h es una


función recursiva primitiva (n+1)-aria, también es recursiva primi-
tiva la función n-aria f definida por la doble condición siguiente:

f(0, x2,…, xn) = g(x2,…, xn)


f(x1+1, x2,…, xn) = h(x1,f(x1, x2,…, xn),…, xn)

El lector reconocerá sin dificultad que el esquema de recursión señalado


en el texto de Gödel (1931, p. 179) con el número (2) corresponde exacta-
mente a PR5b; el esquema de “sustitución” que él ilustra en la nota 27 (p.
180) corresponde a PR4. Gödel menciona expresamente a PR1 y PR2,19 y

18 En rigor, debería indicarse en el nombre de la proyección el valor de r, puesto que la


i-ésima proyección de m-tuplos no es la misma función que la i-ésima proyección de
n-tuplos a menos que n = m. Pero, en la práctica, este dato está implícito en el contex-
to y se prefiere no recargar la notación con un signo alusivo a él.
19 De hecho, Gödel menciona una condición más amplia que PR2, a saber: dado un nú-
mero cualquiera c, la función constante 〈x1,…,xr〉 Å c es “recursiva”. Pero esta con-
dición se deriva fácilmente de PR1, PR2 y PR4 así: en PR4 tómese g igual a la fun-
ción cero y h igual a la función sucesor reiterada c veces; entonces la función 〈x1,…,xr〉
Å c es simplemente la función compuesta 〈x1,…,xr〉 Å h(g(x1,…,xr)).
2.10 Los Teoremas de Incompletud de Gödel 333

PR5a es en efecto superflua puesto que se la puede derivar de PR5b y PR2.


Gödel omite la condición PR3, la cual, sin duda, amplía la extensión del
concepto definido pero no modifica su definición de un modo intuitivamente
significativo. En particular, la omisión de PR3 no afecta su demostración de
los teoremas que enuncio en el próximo párrafo. Es fácil ver asimismo que
las funciones numéricas elementales —suma, multiplicación, exponien-
ciación— son todas recursivas primitivas. Por ejemplo, si ponemos g(x) =
π1(x) y h(x,y,z) = π2(x,y,z) + 1, la función binaria f: 〈x,y〉 Å x + y satisface
la condición PR5b. Como ilustración de PR5a doy siguiente definición de la
función factorial x Å x!: 0! = 1, (n+1)! = (n+1) ⋅ n!.20
En adelante, escribiré ‘pr-recursiva’ por ‘recursiva primitiva’, y “recursiva”
(entre comillas dobles) por ‘recursiva en el sentido restringido de Gödel
(1931)’. Un relación numérica n-ádica K se llama pr-recursiva si su función
característica es pr-recursiva; esto es, si es pr-recursiva la función χK defini-
da por:21

χK(x1,…,xn) = 0 si 〈x1,…,xn〉 ∈ K

χK(x1,…,xn) = 1 si 〈x1,…,xn〉 ∉ K

En la próxima nota muestro que estas dos relaciones diádicas son pr-

20 En este ejemplo, la función definida f es x Å x!; la constante k = 1 y la función auxi-


liar h es la multiplicación.
21 Obsérvese que defino la función característica de K asignando el valor 0 al caso afir-
mativo, el valor 1 al caso negativo, tal como hace Gödel. En el Capítulo 1.5 fue opor-
tuno adoptar la convención contraria; cf. p. 43, nota 12.
22 Para fortalecer su comprensión de lo dicho en el texto, el lector debe probar que las
funciones características de las relaciones numéricas ‘igual a’ y ‘menor que’ son pr-
recursivas. Puede utilizar para eso las cinco funciones pr-recursivas que defino a conti-
nuación:
(1) pd 0 = 0, pd(x+1) = x (pd asigna el predecesor de x a cada número x > 0).
(2) x ⱷ 0 = x, x ⱷ (y+1) = pd(x ⱷ y) (x ⱷ y es igual a x menos y si x ≥ y; de otro
modo, es igual a 0).
(3) |x – y| = (x ⱷ y) + (y ⱷ x) (|x – y| es el valor absoluto de la diferencia entre x y y).
(4) sg(0) = 1, sg(x+1) = 0 (sg es la función característica de la clase de números
{x:x > 0} = {x:x es el siguiente de algún número}).
(5) nsg(0) = 0, nsg(x+1) = 1 (nsg es la función característica de la clase de números
{x:x = 0} = {x:x no es el siguiente de ningún número}).
2.10 Los Teoremas de Incompletud de Gödel 334

recursivas: {〈x,y〉: x = y} y {〈x,y〉: x < y}.22 Una clase pr-recursiva se define


del mismo modo, con n = 1. En aras de la brevedad, utilizaré la palabra
‘relación’ para designar a clases y relaciones (entiéndase que una “relación
1-ádica” es una clase). Usaré las negritas para representar n-tuplos, con n ≥
1 arbitrario (Gödel usa con este propósito las letras góticas ᒕ, ᒖ,…). En
vez de ‘x ∈ K’ escribo K(x). Gödel demuestra los siguientes teoremas: Si K
es una relación pr-recursiva, su complemento K′ = {x:¬K(x)} es pr-recursivo.
Asimismo, si K y H son relaciones pr-recursivas, también lo es su unión K
∪ H. Si la función n-aria ϕ y la función m-aria ψ ambas son pr-recursivas,
la relación (n+m)-ádica {〈x,y〉:φ(x) = ψ(y)} es pr-recursiva. Por último, si la
función n-aria ϕ y la relación (m+1)-ádica R son pr-recursivas, también los
son las relaciones S y T y la función Ψ definidas por:

S(x,y) ↔ ∃z(z ≤ φ(x) ∧ R(z, y))


T(x,y) ↔ ∀z(z ≤ φ(x) → R(z,y)) (✥)
Ψ(x,y) = µz(z ≤ φ(x) ∧ R(z,y))

donde µzΦ(z) denota el más pequeño número z que cumple la condición Φ(z),
o el número 0 si ningún número cumple dicha condición. Obsérvese que la
condición impuesta al número x en la definición de Ψ incluye una cota su-
perior o tope bajo el cual ese número tiene que encontrarse. Esto es indis-
pensable para que la función Ψ sea pr-recursiva (cf. la nota 17). Omitiré las
demostraciones de estos teoremas, que no presentan mayor dificultad (véase
Gödel 1931, pp. 180-181; OC, pp. 63-65).23

El lector debe comprobar que la función característica de {〈x,y〉: x < y} es sg(y ⱷ x)


y que la función característica de {〈x,y〉: x = y} es nsg(|x – y|).
23 En todo caso, es claro que la función Ψ y los predicados S y T son computables en el
sentido intuitivo. Por ejemplo, para calcular el valor de la función Ψ en el (n+m)-tuplo
〈x1,…,xn,y1,…,ym〉 se procede así: 1º Se calcula el valor de la función pr-recursiva
φ en el n-tuplo 〈x1,…,xn〉; digamos que φ(x1,…,xn) = a. 2º Se calcula la función
característica de la relación pr-recursiva R en todos los (m+1)-tuplos 〈0,y1,…,ym〉,
〈1,y1,…,ym〉,…, 〈a,y1,…,ym〉 hasta encontrar uno en que dicha función tome el valor
0. Si el primer (m+1)-tuplo con esta propiedad es 〈b,y1,…,ym〉, entonces b es el valor
buscado de Ψ. Pero si la función característica de R toma el valor 1 en todos los (m+1)-
tuplos de la lista indicada, entonces el valor buscado de Ψ es 0. Para demostrar que Ψ
es pr-recursiva basta describir este procedimiento en términos de las condiciones PR1–
PR5.
2.10 Los Teoremas de Incompletud de Gödel 335

4º Inmediatamente antes de abordar el paso 3º aludí a la representación nu-


mérica de propiedades y relaciones de objetos del cálculo P mediante clases
y relaciones formadas por los respectivos gödel. Ahora bien, algunas de las
propiedades y relaciones sintácticas más importantes —como ‘ser una fór-
mula’ o ‘ser una prueba’— están representadas de este modo por relaciones
pr-recursivas. La definición de las funciones características correspondientes
provee, pues, un algoritmo para determinar si ciertos objetos del cálculo —
identificados por sus gödel— poseen esas propiedades o están en esas rela-
ciones. Ello era de esperarse, puesto que P es visiblemente un cálculo efec-
tivo (en el sentido explicado al comienzo del Capítulo 2.7). La verdadera
importancia del uso de la representación numérica de categorías sintácticas
mediante relaciones pr-recursivas se mostrará en el paso 5º. Veremos enton-
ces que a cada relación pr-recursiva n-ádica le corresponde una fórmula de
P con n-variables libres (n ≥ 1), que se convierte en una oración demostra-
ble si las variables se reemplazan con los nombres de números que tienen
esa relación y en una oración refutable si se las reemplaza con los nombres
de números que no la tienen. En virtud de ello, el cálculo P contiene una
teoría deductiva de su propia sintaxis o, más exactamente, de aquellos as-
pectos de la misma que son representables mediante relaciones pr-recursivas.
Así se cierra de un modo preciso y riguroso el círculo reflexivo que produce
el primer teorema de incompletud.

Gödel (1931, pp. 182-186) define 45 relaciones y funciones pr-recursivas


que representan categorías sintácticas o sirven para definir a otras que las
representan. Las que representan categorías sintácticas se designan con el
nombre de la categoría representada impreso en VERSALITAS (de acuerdo con
la convención que expliqué al final del 2º). Importa tener presente que las
definiciones no se enuncian en el cálculo P, sino en la lengua (alemán, cas-
tellano) en que se conduce el discurso sobre el cálculo. Para mayor claridad,
Gödel utiliza abreviaturas e ideogramas, introducidos ad hoc o tomados del
álgebra ordinaria y del cálculo predicativo de Hilbert y Ackermann (estos
últimos se sustituyen aquí con los signos homólogos de nuestro CP). Reco-
miendo enfáticamente al lector que, para su propio consumo, exprese en
palabras las 45 definiciones (así como la definición Nº 46 de una clase de
números que no es recursiva). A continuación doy unos pocos ejemplos. Los
2.10 Los Teoremas de Incompletud de Gödel 336

dos primeros ilustran las relaciones pr-recursivas S y T (destacadas arriba


con el signo ✥), respectivamente.
1. x es divisible por y —abreviado x/y— si y sólo si hay un z menor o
igual que x, tal que x = y ⋅ z.
2. x es primo —abreviado Prim(x)— si y sólo si no hay un z mayor que
1 y menor que x tal que x es divisible por z.
Los cinco ejemplos siguientes son funciones pr-recursivas análogas a la
función Ψ (destacada con ✥).
3. El n-ésimo factor primo del número x se designa con n Pr x.24 El si-
guiente esquema de recursión muestra que ésta es una función pr-recursiva:

0 Pr x = 0

(n+1) Pr x = µy(y ≤ x ∧ Prim(y) ∧ x/y ∧ y > n Pr x)

En palabras: El 0-ésimo factor primo de x es 0; el (n+1)-ésimo primo con-


tenido en x es ya sea (i) el más pequeño número y menor o igual que x tal
que y es primo, x es divisible por y y y es mayor que el n-ésimo primo con-
tenido en x, ya sea (ii) 0, si no existe un número y que cumpla estas condi-
ciones.
5. El n-ésimo primo es el valor asignado al número n por la función pr-
recursiva x Å px.25 Esta función se define así:

p0 = 0
pn+1 = µy(y ≤ 1 + pn! ∧ Prim(y) ∧ y > pn)

En palabras: El 0-ésimo primo x es 0 y el (n+1)-ésimo primo es el más pe-


queño número y, menor o igual que el siguiente de 1 ⋅ 2 ⋅ 3 ⋅…⋅ pn, tal que
24 Uso redonda para la abreviatura de los predicados recursivos (como Prim), y cursiva
para la de las funciones recursivas (como Pr). Gödel sigue esta norma en las primeras
definiciones, pero luego se aparta de ella (vgr. en las definiciones 13 y 17). Ello no
tendría la menor importancia si no fuese por su cuestionable práctica de utilizar el mismo
símbolo ‘≡’ como signo de equivalencia en la definición de los predicados y como
signo de identidad en la definición de las funciones. Por mi parte, usaré ‘↔’ para sig-
nificar equivalencia y ‘=’ para significar identidad.
25 En vez de px, Gödel escribe Pr x. Esta abreviatura difiere de la usada por él mismo (y
por nosotros) cuando asigna números de identidad a los objetos del cálculo. Además,
se parece mucho al nombre de la función binaria definida bajo el número 3.
2.10 Los Teoremas de Incompletud de Gödel 337

y es un número primo mayor que el n-ésimo primo. Para fijar el tope bajo el
cual ha de buscarse el (n+1)-ésimo primo Gödel aprovecha elegantemente la
clásica prueba de que tal número existe, para todo n (Euclides, IX.20).
6. La función binaria 〈n,x〉 Å n Gl x asigna al par 〈n,x〉 el exponente del
n-ésimo factor primo de x en la factorización prima de este número (siem-
pre, claro está, que n sea mayor que 0 y menor o igual que el número de
factores primos de x). Se define así:

n Gl x = µy(y ≤ x ∧ x/(n Pr x)y ∧ ¬x/(n Pr x)y+1)

En palabras: el número en cuestión es ya sea (i) el más pequeño número y


≤ x tal que x es divisible por la y-ésima potencia del n-ésimo factor primo
de x, pero no es divisible por la (y+1)-ésima potencia de ese primo; ya sea
(ii) 0 si ese número no existe. La utilidad de esta función reside en que, si
x es el gödel de una fila de signos o una lista de filas de signos de P, n Gl
x es el gödel del n-ésimo signo de esa fila o de la n-ésima fila de esa lista.26
7. La función x Å l(x) se define así:

l(x) = µy(y ≤ x ∧ (y Pr x) > 0 ∧ ((y+1) Pr x) = 0)

Según esto, l(x) es el más pequeño número y tal que existe un y-ésimo mas
no un (y+1)-ésimo factor primo de x (claro está que si x no tiene ningún
factor primo —esto es, si x = 0 ó x = 1— l(x) = 0, de acuerdo con la defi-
nición del operador µ). Así, l(x) asigna a cada número x el número total de
sus factores primos. Por lo tanto, si x es el gödel de una fila de signos o de

26 Conviene observar que la explicación en palabras de la definición 6 ofrecida por Gödel


es incorrecta. Dice que n Gl x es “el n-ésimo término (Glied) de la secuencia de núme-
ros correspondiente al número x” (1931, p. 182). Alude aquí a la biyección que esta-
bleció entre los números y los k-tuplos de números (para todo entero positivo k) en el
paso 2º (y que omití, por superflua, en mi explicación de ese paso). En virtud de ella,
cada k-tuplo corresponde a un número cuyo factor primo más grande es pk; en particu-
lar el k-tuplo 〈n(1),n(2),…,n(k)〉 corresponde al número 2n(1) ⋅ 3n(2) ⋅…⋅ pkn(k). Así,
el número 766.360, cuya factorización prima usé arriba como ejemplo, es igual a 23 ×
30 × 51 × 72 × 110 × 130 × 171 × 190 × 231 y corresponde, por lo tanto, al 9-tuplo
〈3,0,1,2,0, 0,1,0,1〉). Ahora bien, el quinto término de esta secuencia de números es 0,
pero según la fórmula de la definición 6 —como el lector verificará fácilmente— 5 Gl
766.360 = 1 (puesto que 5 Pr 766.360 = 23 y 766.360 es divisible por 231 mas no por
232). El error de Gödel es inocuo, porque no hay ningún objeto α del cálculo tal que
#[α] = 0.
2.10 Los Teoremas de Incompletud de Gödel 338

una lista de filas de signos, l(x) es el número total de signos en esa fila o de
filas en esa lista; en otras palabras, su “longitud”.
8. La función binaria 〈x,y〉 Å x * y está dada por:

x * y = µz(z ≤ pl(x)+l(y)x+l(y)y ∧ ∀n(n ≤ l(x) → n Gl z = n Gl x)


∧ ∀n(0 < n ≤ l(y) → (n+l(x)) Gl z = n Gl y))

Esta definición27 está pensada para asegurar (i) que si x = #[ξ] y y = #[η],
donde ξ y η son filas de signos de P, x * y = #[ξÁη], donde ξÁη es la fila
que se forma prefijando ξ a η, y (ii) que si x = #[X] y y = #[Y], donde X
y Y son listas de filas de signos de P, x * y es el gödel de la lista que se
forma añadiendo la lista Y a continuación de la lista X. Consideraré el caso
(i), dejando el (ii) como ejercicio al lector. Sean pues ξ y η dos filas de
signos, tales que x = #[ξ] y y = #[η]. Entonces, la fila ξÁη contiene preci-
samente l(x) + l(y) signos y el factor primo más grande de #[ξÁη] es pl(x)+l(y).
Verifiquemos que #[ξÁη] es el más pequeño número z que cumple las tres
condiciones enunciadas en el alcance de µz. Tenemos que

#[ξÁη] = p11 Gl x ⋅…⋅ pl(x)l(x) Gl x ⋅ pl(x)+11 Gl y ⋅…⋅ pl(x)+l(y)l(y) Gl y

Este número cumple evidentemente la segunda condición: los exponentes de


sus primeros l(x) factores primos coinciden uno por uno con los exponentes
de los factores primos de #[ξ] = x (ordenados de menor a mayor). También
cumple la tercera: sus últimos l(y) factores primos coinciden uno por uno
con los exponentes de los factores primos de #[η] = y (ordenados de menor
a mayor). Además, este número no puede ser mayor que pl(x)+l(y)x+l(y)y. En
efecto, #[ξÁη] = x ⋅ pl(x)+11 Gl y ⋅…⋅ pl(x)+l(y)l(y) Gl y. Obviamente x ≤ pl(x)+l(y)x.
Por consiguiente, bastará mostrar que pl(x)+11 Gl y ⋅…⋅ pl(x)+l(y)l(y) Gl y ≤
pl(x)+l(y)l(y)y. Ahora bien, cada uno de los factores primos del número de la
izquierda es menor o igual que pl(x)+l(y)y. Como el número de esos factores
es l(y), el producto de todos ellos, elevado al respectivo exponente es menor
o igual que pl(x)+l(y)l(y)y. Por lo tanto, #[ξÁη] cumple nuestras tres condicio-

27 He introducido un cambio inocuo en la definición de Gödel para facilitar la explica-


ción que sigue. El tope para el número z en la definición original es pl(x)+l(y)x+y. Al
adoptar un tope mayor me será más fácil probar que cierto número que vamos a con-
siderar no lo excede.
2.10 Los Teoremas de Incompletud de Gödel 339

nes. Supongamos ahora que hay otro número u que también las cumple. En
tal caso, obviamente, l(u) = l(x) + l(y), y para todo n, n Gl u = n Gl #[ξÁη].
Si #[ξÁη] ≠ u, por lo menos uno de los factores primos de #[ξÁη] no es un
divisor de u. Por lo tanto, hay un q ≥ 1 tal que para todo r mayor o igual
que q y menor o igual que l(x) + l(y), pr < r Pr u (el r-ésimo factor primo
de u). Como pr es el r-ésimo factor primo de #[ξÁη] y su exponente en la
factorización prima de #[ξÁη] es idéntico al exponente de r Pr u en la
factorización prima de u, es claro que #[ξÁη] ≠ u implica que #[ξÁη] < u.
Por lo tanto, #[ξÁη] es el número más pequeño que cumple las condiciones
en cuestión.
Después de esta justificación detallada de la definición 8, el lector podrá,
espero, entender el empleo de la función x * y en las definiciones siguientes.
Componiéndola con la función pr-recursiva R:x Å 2x, es posible definir cla-
ses pr-recursivas que representan numéricamente distintas categorías de ex-
presiones del cálculo. Obviamente, si x es el gödel de un signo del cálculo,
R(x) = 2x es el gödel de la fila que consta solamente de ese signo. Por lo
tanto, si α es una fila de signos y x = #[α], R(11) * x * R(13) —abreviado
E(x)— es el gödel de la fila (α); R(5) * E(x) —abreviado Neg(x)— es el
gödel de la fila ~(α); si ζ es una variable y z = #[ζ], R(z) * R(9) * E(x) —
abreviado z Gen x— es el gödel de la fila ζΠ(α), y así sucesivamente. Com-
binando varias de estas definiciones, Gödel logra definir, entre otras, la pro-
piedad pr-recursiva Form(x) —x es una FÓRMULA— que caracteriza a los gödel
de las fórmulas de P (Def. 23).
Me detendré un momento a considerar la definición de NUMERAL, el atri-
buto distintivo de los gödel de las expresiones 0, ƒ0, ƒƒ0, ƒƒƒ0,…, ƒn0,…
que representan en el cálculo P a los números naturales 0, 1, 2, 3,…, n,…
Primero se define la función pr-recursiva binaria 〈x,y〉 Å y N x:
16. 0 N x = x; (n+1) N x = R(3) * n N x.
Obviamente, si x es el gödel de la fila de signos α, n N x es el gödel de
la fila formada por α precedida de n copias del signo ƒ. Como 1 = #[0], n
N R(1) es el gödel del numeral que representa el número n en P. Por lo tan-
to, n N R(1) es el NUMERAL de n. En vez de n N R(1), escribimos con Gödel
Z(n) (Z por Zahl, ‘número’). Por ejemplo,

Z(4) = #[ƒƒƒƒ0] = 23 ⋅ 33 ⋅ 53⋅ 73 ⋅ 111 = 101.871.000


2.10 Los Teoremas de Incompletud de Gödel 340

Recomiendo especialmente al lector que estudie la definición 31, pues la fun-


ción Sb(x yv) a que se refiere tiene un papel destacado en la demostración del
Teorema VI. Si x, v e y son, respectivamente, los gödel de una fórmula φ,
una variable υ, y una fila de símbolos η, Sb(x yv) es el gödel de la fórmula
que se obtiene al reemplazar υ por η en cada una de las posiciones donde υ
está libre en φ.
La cadena de definiciones culmina con éstas:
43. Fl(x,y,z) ↔ y = (z Imp x) ∨ ∃u(u ≤ x ∧ Var(u) ∧ (x = u Gen y)
Léase: x es una CONSECUENCIA INMEDIATA DE y y z si y sólo si hay entre estos
tres números una de las dos relaciones enunciadas a la derecha del signo ↔.
Aquí Var es la clase de los gödel de las variables de P (Def. 12), u Gen y es
la función R(u) * R(9) * R(y) (Def. 15) y z Imp x es la función E(R(5) *
E ( z ) )
* R(7) * E(x) (Defs. 32, 13 y 14). Por lo tanto, si x, y, z y u son, respectiva-
mente, los gödel de las fórmulas ξ, η, ζ y de la variable υ, u Gen y = #[υΠη]
y z Imp x = #[~(η)⁄ξ]. Por lo tanto, Fl(x,y,z) si y sólo si x es el gödel de
una consecuencia inmediata por modus ponens de las fórmulas cuyos gödel
son y y z o de una consecuencia inmediata por generalización de la fórmula
cuyo gödel es y (en cuyo caso Fl(x,y,z), cualquiera que sea z).
44. Bw(x) ↔ (l(x) > 0) ∧ ∀n(0 < n ≤ l(x) → Ax(n Gl x) ∨ ∃u∃w(0
< u,w < n ∧ Fl(n Gl x,u Gl x,w Gl x))
Léase: x es una PRUEBA28 si y sólo si x tiene al menos un factor primo y el
exponente n Gl x de cada primo pn ≤ pl(x) en la factorización prima de x es
ya sea (i) el gödel de un axioma de P (véase Def. 42), ya sea (ii) el gödel de
una consecuencia inmediata por modus ponens de dos fórmulas cuyos gödel
son, respectivamente, los exponentes en la factorización prima de x de dos
primos pu y pw menores que pn, ya sea (iii) el gödel de una consecuencia

28 En alemán, BEWEISFIGUR, literalmente ‘figura de prueba’. Esta denominación es impro-


pia, puesto que lo que normalmente se llama así, también en alemán, es un esquema
que, al llenarse con fórmulas del cálculo, genera una prueba. Pero Bw(x) si y sólo si x
es el gödel de una lista de oraciones de P que constituye efectivamente una prueba.
Mosterín traduce ‘BEWEISFIGUR’ por ‘DEDUCCIÓN’ (Gödel, OC, p. 70). Esta traducción me
parece inobjetable. No la adopto, sin embargo, porque ello me obligaría a usar ‘deduc-
ción’ en otros pasajes de este libro como equivalente al inglés ‘proof’ —como, conse-
cuentemente, hace Mosterín en su traducción de Gödel 1934 (OC, p. 182)— y a llamar
‘teoría de la deducción’, en vez de ‘teoría de la prueba’, a la Beweistheorie de Hilbert.
2.10 Los Teoremas de Incompletud de Gödel 341

inmediata por generalización de una fórmula cuyo gödel es el exponente en


la factorización prima de x de un primo pu < pn. En otras palabras, Bw(x) si
y sólo si x es el gödel de una prueba en P.
45. xBy ↔ Bw(x) ∧ y = (l(x) Gl x).
Léase: x es una PRUEBA DE y si y sólo si x es una PRUEBA y y es el exponente
en la factorización prima de x del máximo divisor primo de x. Obviamente,
xBy si y sólo si hay una prueba cuyo gödel es x, e y es el gödel de la última
fórmula de esa prueba.
46. Bew(x) ↔ ∃y(yBx).
Léase: x es una FÓRMULA DEMOSTRABLE si y sólo si hay un número y tal que
y es una PRUEBA DE x. Obviamente, Bew(x) si y sólo si existe en P una prue-
ba cuya última fórmula tiene el gödel x.
Gödel observa agudamente que —en contraste con todas las definiciones
anteriores— no podemos aseverar que la def. 46 defina una clase
“recursiva”.29 Obsérvese que, si {x:Bew(x)} fuese “recursiva”, podríamos
emplear el algoritmo de su función característica para decidir, dada una fór-
mula φ, si #[φ] pertenece o no a {x:Bew(x)}. Podríamos, entonces, determi-
nar mediante un algoritmo si ∂φ o Îφ. En otras palabras, habríamos resuelto
el Entscheidungsproblem del cálculo P. Como veremos en el Capítulo 2.11,
en virtud de los hallazgos de Gödel, ni siquiera es posible resolver el Ent-
scheidungsproblem del cálculo predicativo de primer orden (que es sólo un
fragmento de P).

5º El próximo paso consiste en establecer que para cada relación “recursiva”30


n-ádica R y cada n-tuplo de números a hay una fórmula de P con n varia-
bles libres φ() tal que, si  es la lista de los numerales correspondientes a
a, ∂φ(/) si a ∈ R y ∂~(φ(/)) si a ∉ R. Como expliqué en la p. 250,

29 El predicado Bew(x), definido por generalización existencial sobre una de las variables
libres del predicado binario recursivo yBx, es lo que hoy se llama un predicado recur-
sivamente enumerable. Esta designación se basa en lo siguiente: puede demostrarse que
si un predicado definido de este modo es satisfecho por una clase no vacía de núme-
ros, dicha clase es el alcance de una función recursiva (general) con dominio ˆ; ésta
puede entonces utilizarse para enumerar la clase de números en cuestión (y también,
por cierto, cualquier clase de objetos identificados mediante esos números).
30 Recuérdese que llamo así —con el adjetivo entre comillas— a las relaciones recursivas
en el sentido restringido de Gödel (1931), o sea, las relaciones cuya función caracterís-
tica es pr-recursiva conforme a las reglas PR1, PR2, PR4, o PR5.
2.10 Los Teoremas de Incompletud de Gödel 342

nota 4, una relación numérica con esta propiedad es precisamente lo que


Gödel (1931) llama decidible (entscheidungsdefinit) en P. Estableceremos,
pues, que las relaciones “recursivas” son P-decidibles (como diré para evitar
la confusión con otras acepciones de ‘decidible’ a que me refiero en esa nota).
A la luz de lo expuesto en el paso 4º, esto significa que una parte conside-
rable de la sintaxis lógica de P es materia de una teoría deductiva formalizable
en P.
Este resultado está contenido en el Teorema V, el cual dice que para cada
relación “recursiva” n-ádica R hay un número r tal que (i) r es el gödel de
una fórmula con exactamente n variables libres †[17], †[19], †[23],…,
†[pn+6];31 (ii) si s es el gödel de la fórmula obtenida al reemplazar la varia-
ble †[pk+6], en todas las posiciones libres que ésta ocupa en la fórmula †[r],
por el numeral correspondiente a cierto número ak (1 ≤ k ≤ n), entonces
Bew(s) si R(a1,…,an) y Bew(R(5) * E(s)) si ¬R(a1,…,an). Como se re-
cordará, Bew(s) si y sólo si la fórmula †[s] es demostrable en P, y Bew(R(5)
* E(s)) si y sólo si la negación de la fórmula †[s] es demostrable en P.
Como tendremos que referirnos a menudo al Teorema V, conviene dispo-
ner de una terminología concisa para aludir a él. Si un número r tiene con
una relación R la conexión arriba descrita, diré que r es el número corres-
pondiente a R y que la fórmula †[r] expresa a R según el Teorema V. Esta
última designación (inspirada por Kleene 1952, p. 195) es, por cierto, pura-
mente convencional y arbitraria si P es un sistema deductivo inconsistente.
Pero si P es consistente, la designación se ajusta bien al significado corrien-
te del verbo ‘expresar’, puesto que, en tal caso, la fórmula obtenida al reem-
plazar por numerales todas las variables libres de †[r] es demostrable en P
si y sólo si los números designados por dichos numerales tienen entre sí la
relación R.32

31 Recuérdese nuestra convención: si a = #[b], b = †[a]. Gödel no especifica cuáles son


las n variables libres en la fórmula †[r]; pero en la nota 38 (1931, p. 186) sugiere el
método utilizado arriba.
32 Consíderese, por ejemplo, una relación diádica R(x,y) y sea ρ(u1,v1) la fórmula †[r]
que la expresa según el Teorema V. Sean m y n dos números. Según la convención
adoptada arriba, los numerales correspondientes son ƒm0 y ƒn0. En tal caso, ¬R(m,n)
implica que ∂~ρ(ƒm0,ƒn0) y, por lo tanto, si P es consistente, ∂ρ(ƒm0,ƒn0) implica que
¬∂~ρ(ƒm0,ƒn0) y, por ende, que ¬¬R(m,n) y que R(m,n).
2.10 Los Teoremas de Incompletud de Gödel 343

Aunque el Teorema V propiamente pertenece a la aritmética —habla sólo


de relaciones entre números— el razonamiento que Gödel ofrece como prueba
se funda en ciertas propiedades del cálculo P. Como observa en una nota,
“el Teorema V se basa, naturalmente, en que, si R es una relación recursiva,
es posible deducir de los axiomas del sistema P si un dado n-tuplo de núme-
ros posee o no esa relación” (1931, p. 186, n. 40). Basta probar el Teorema
V para toda relación “recursiva” n-ádica R que satisfaga la condición

R(x1,…,xn) ↔ x1 = ϕ(x2,…,xn) (1)

donde ϕ es una función “recursiva”; por cuanto, si R es una relación


“recursiva” n-ádica cualquiera, la relación R′ = {〈0,x1,…,xn〉:R(x1,…,xn)}
cumple la condición (1), con ϕ la función característica de R. Si φ, en la
condición (1), es la función ‘el siguiente de’ (“recursiva” por PR1), R es la
relación diádica que subsiste entre dos números si el segundo es el predece-
sor del primero. En tal caso, la ecuación a la derecha del signo ↔ en (1)
puede obviamente representarse en P mediante la fórmula x1 = ƒy1. Sea α la
fórmula obtenida al reemplazar aquí el par de variables 〈x1,y1〉 por el par de
numerales correspondientes a los números a1 y a2. Es claro que ∂α si a1 =
a2+1 y que ∂~α si a1 ≠ a2+1.33 Lo mismo vale, a fortiori, si ϕ, en la con-
dición (1), es una función constante (“recursiva” por PR2).34 Diré, con Gödel,
que una función “recursiva” tiene grado 1 si está definida según PR1 o PR2,
y que tiene grado n+1 si está definida según PR4 o PR5 a partir de otras
funciones “recursivas” entre las cuales hay por lo menos una de grado n ≥
1. Supongamos que el Teorema V ha sido demostrado para todas las relacio-
nes “recursivas” que cumplen la condición (1) con una función ϕ de grado
menor que un cierto entero positivo r. No es difícil ver que, en tal caso, el
Teorema V también vale para una relación “recursiva” que cumpla la condi-

33 Por ejemplo, si a1 = 4 y a2 = 3, α es la fórmula ƒƒƒƒ0 = ƒƒƒƒ0. Si a1 = 4 y a2 = 5. α


es la fórmula ƒƒƒƒ0 = ƒƒƒƒƒƒ0. Aquella fórmula y la negación de ésta se deducen
fácilmente de los axiomas I.2 y I.1.
34 Sea, por ejemplo, ϕ la función (n-1)-ádica 〈x2,…,xn〉 Å 2. Entonces, la ecuación a la
derecha del signo ↔ en (1) puede representarse en P mediante la fórmula x1 = ƒƒ0.
Sea α la fórmula obtenida al reemplazar aquí la variable x1 por el numeral correspon-
diente a un número cualquiera a1. Es claro entonces que, cualquiera que sea el (n-1)-
tuplo 〈a2,…,an〉, R(a1,…,an) ↔ a1 = 2 ↔ α es la fórmula ‘ƒƒ0 = ƒƒ0’.
2.10 Los Teoremas de Incompletud de Gödel 344

ción (1) con una función ϕ de grado r; aunque una demostración rigurosa
sería larga y tediosa. Puesto que el Teorema V vale, como vimos, si la fun-
ción ϕ es de grado 1, vale, con toda generalidad, para cualquier grado.

6º Nos falta todavía un breve paso antes de abordar por fin el primer teore-
ma de incompletud (Teorema VI). Es claro que si P fuese inconsistente, toda
oración sería deducible de los axiomas. Tendríamos entonces que, cualquiera
que fuese la oración α, ∂α y ∂~α. Por lo tanto, la consistencia de P cons-
tituye una condición sintáctica necesaria para que P sea incompleto (en el
sentido de Post). Rosser (1936) demostrará que esta condición también es
suficiente. Pero Gödel (1931) estableció originalmente la incompletud de P
bajo una condición sintáctica más fuerte, que llama “ω-consistencia”. Podría
pensarse que, en vista del resultado de Rosser, no vale la pena molestarse en
estudiarla. Pero —como indico al final del próximo párrafo— la noción de
ω-consistencia tiene cierto interés en relación con el programa de Hilbert.
Gödel la define de un modo preciso pero un tanto esotérico. Nuestro penúl-
timo paso consistirá, pues, en explicar esa definición.
Sea K una clase de fórmulas de P. La clase D(K) de las fórmulas deducibles
de K es la clase de fórmulas que contiene (i) todas las fórmulas de K, (ii)
todos los axiomas de P y (iii) toda fórmula de P que se deduzca de dos
fórmulas de D(K) por modus ponens o de una fórmula de D(K) por genera-
lización. (D(K) es, pues, el conjunto de teoremas de la teoría deductiva que
se obtiene añadiendo las fórmulas de K a los axiomas de P, o sea, lo que
comúnmente se llama la extensión de P determinada por K). Obsérvese que,
según esta definición, la clase de las fórmulas deducibles de los axiomas de
P es D(∅). Diré que K es ω-inconsistente si y sólo si hay una fórmula Φ(u),
con una sola variable libre u, tal que D(K) contiene a la vez la fórmula
~uΠ(Φ(u)) y todas las fórmulas que pueden obtenerse reemplazando la va-
riable libre u en Φ(u) por el nombre de un número natural.35 Si D(∅) cum-
ple la condición antedicha, todo conjunto de fórmulas de P será ω-inconsis-
tente; en tal caso, digo que el propio sistema P es ω-inconsistente. Si la cla-
se de fórmulas K no es ω-inconsistente, diremos que es ω-consistente. Dire-
mos, por otra parte, que K es (simplemente) consistente si D(K) no contiene

35 Como el lector recordará, la fórmula ~uΠ(Φ(u)) “traduce” la fórmula familiar ¬∀ξΦ(ξ)


al cálculo P.
2.10 Los Teoremas de Incompletud de Gödel 345

la negación ~α de una fórmula α ∈ D(K). Obviamente, si K es ω-consis-


tente, también es consistente; pero no es obvio que K sea ω-consistente, si
es consistente. Gödel fue, aparentemente, el primero en ver que hay casos
de consistencia acompañada de ω-inconsistencia. La representación formal
de la aritmética —o de una teoría matemática que la incluya— mediante un
sistema deductivo ω-inconsistente sería, por cierto, un desastre. Por lo tanto,
para fundamentar la matemática clásica en el espíritu del programa de Hilbert,
hay que valerse de medios finitos para certificar no sólo la consistencia, sino
también la ω-consistencia de la representación formal adoptada.
Fiel a la práctica que estudiamos en el paso 4º, Gödel define la ω-consis-
tencia como un atributo de ciertas clases de FÓRMULAS, esto es, de las clases
de números formados por los gödel de las fórmulas de ciertas clases. El
definiens se expresa también en términos de clases de números (1931, p. 187).
Sea κ la clase de los gödel de nuestra clase arbitraria K. Gödel llama Flg(κ)
—Flg por Folgen, ‘consecuencias’— a la intersección de todas las clases de
números que (i) incluyen la clase κ, (ii) incluyen la clase de los AXIOMAS
(esto es, los gödel de los axiomas) y (iii) están cerradas con respecto a la
relación CONSECUENCIA INMEDIATA (Def. 43).36 Obviamente, Flg(κ) es la clase
de los gödel de la fórmulas pertenecientes a nuestra clase D(K). La clase κ
de números es ω-consistente según la definición de Gödel si y sólo si la
clase K de fórmulas es ω-consistente según la nuestra, esto es, si no existe
ningún número a tal que, siendo a el gödel de una fórmula A(u) con la sola
variable libre u, Flg(κ) contenga a la vez (i) el número Neg(#[u] Gen a) =
#[~uΠ(A(u))] y (ii) para todo número n, el gödel de la fórmula obtenida al
reemplazar u por el numeral ƒn0 en todas las posiciones libres de u en A(u).
(El lector debe persuadirse de que el primer componente de la conjunción
utilizada por Gödel en su definición expresa la condición (ii) y el segundo
la condición (i); cf. Defs. 13, 15 y 30.).

7º Con los recursos que hemos acumulado en los pasos anteriores, podemos
demostrar el Teorema VI, llamado comunmente el primer Teorema de
Incompletud de Gôdel. En la parte introductoria de su artículo Gödel da una

36 Decimos que κ está cerrada respecto de la relación triádica CONSECUENCIA INMEDIATA si,
para cualquier trío de números x,y,z tales que y,z ∈ κ y Fl(x,y,z), también x ∈ κ.
2.10 Los Teoremas de Incompletud de Gödel 346

demostración informal del mismo, que reproduje al comienzo de esta sec-


ción. Ella ha inspirado la mayoría de las presentaciones posteriores. Como
numerosos filósofos han querido reclutar la fuerza de este teorema para di-
versas causas. me parece importante explicar lo mejor posible la cosa mis-
ma, esto es, la demostración formal de Gödel. Se trata de un argumento
estrictamente combinatorio, en que partiendo de premisas ya establecidas —
casos particulares del Teorema V— se avanza, por pura manipulación de
signos, hasta llegar a la conclusión. Hay que cerciorarse de la legitimidad de
las sustituciones efectuadas, y para esto hay que tener presente las corres-
pondencias entre los objetos designados por los diversos ideogramas que se
utilizan. Pero no siempre hace falta conocer a los objetos mismos. Hay que
atender a las relaciones de implicación o equivalencia entre las oraciones
mencionadas, pero no es preciso entender lo que estas oraciones significan.
Para refrescar la memoria, doy aquí una lista de ideogramas que se utiliza-
rán con frecuencia:

(i) #α designa el gödel de α (si α designa un objeto del cálculo P);


(ii) †[x] designa el objeto de P cuyo gödel es x (si x es un número que
es también un gödel);
(iii) ƒn0 designa una fila formada por n copias del signo ‘ƒ’ seguidas del
signo ‘0’; esta fila es el numeral que representa el número n en P;
(iv) Z(n) = #ƒn0; en otras palabras, Z(n) es el gödel del numeral que
representa al número n en el cálculo P;
(v) el 17 y el 19 —los dos primeros primos mayores que 13— son los
gödel de dos variables de tipo 1; llamaré u1 a la variable †[17] y v1
a la variable †[19];
(vi) 19 ) es el gödel de la fórmula que se obtiene al reemplazar la
Sb(y Z(y)
variable †[19] por el numeral de y (esto es, la fila ƒy0) en todas las
posiciones libres que ocupa dicha variable en la fórmula †[y];
(vii) 19 )] es la fórmula obtenida mediante el reemplazo descrito
†[Sb(y Z(y)
bajo el (vi);
(viii) Neg(r) es el gödel de la fórmula obtenida prefijando el signo ‘~’ a
la fórmula †[r];
(ix) 17 Gen r es el gödel de la fórmula que se obtiene prefijando a la
fórmula †[r] la variable †[17] seguida del signo de cuantificación
2.10 Los Teoremas de Incompletud de Gödel 347

universal ‘Π’, seguido del paréntesis izquierdo ‘(’ y agregando el


paréntesis derecho ‘)’ al final de la fila de signos así obtenida; por
lo tanto, †[17 Gen r] es la fórmula designada, conforme a nuestras
estipulaciones, por el ideograma u1Π(†[r]).

El primer Teorema de Incompletud de Gödel (Teorema VI) dice que para


cada clase “recursiva” ω-consistente κ de FÓRMULAS hay una FÓRMULA CON
UNA VARIABLE LIBRE r tal que ni v Gen r ni Neg(v Gen r) pertenecen a Flg(κ)
(donde v es el gödel de la variable libre en la fórmula †[r]). Esto significa
que, si K es la clase ω-consistente de fórmulas de P representada por la cla-
se “recursiva” de números κ, hay una fórmula Φ(u), con una sola variable
libre u, tal que ni uΠ(Φ(u)) ni ~uΠ(Φ(u)) pertenecen a D(K). Como ∅ es
obviamente “recursiva”, el teorema implica que hay una fórmula Φ(u), con
una sola variable libre u, tal que ni uΠ(Φ(u)) ni ~uΠ(Φ(u)) son deducibles
de los axiomas de P, de modo que el sistema deductivo P es incompleto en
el sentido de Post. Pero también implica que esta incompletud no puede
corregirse ampliando la lista de axiomas, si se requiere que la lista ampliada
sea ω-consistente y “recursiva”. Como ya señalé, Rosser (1936) demostró
que el requisito de ω-consistencia se puede reemplazar por el simple requi-
sito de consistencia. Además, en lugar de pedir que la lista de axiomas sea
“recursiva”, en el sentido restringido de Gödel (1931), basta exigir que sea
recursiva, en el sentido más amplio actual, para que el sistema ampliado siga
siendo incompleto, si es consistente. Por lo tanto, para que P se convierta en
un sistema deductivo completo en el sentido de Post habría que añadirle
axiomas hasta el punto de que (i) cualquier fórmula de P pueda deducirse de
ellos o (ii) sea imposible determinar, mediante el algoritmo de una función
recursiva, si una fórmula dada es o no es un axioma.
Diré que una lista de fórmulas de P es una prueba desde K si cada fórmu-
la de la lista es un axioma de P, o un miembro de K, o una consecuencia
inmediata de una o dos fórmulas que la preceden en la lista. Conforme a
nuestras definiciones, una fórmula es deducible de K si y sólo si es la última
fórmula de una prueba desde K. La definición de los conceptos Bwκ(x), xBκy
y Bewκ(x) que sigue al enunciado del Teorema VI, adapta a las pruebas des-
de K los conceptos Bw(x), xBy y Bew(x) (Defs. 44-46). Si la clase κ de los
gödel de las fórmulas de K es “recursiva”, también lo son la clase {x:Bwκ(x)}
de los gödel de las pruebas desde K y la clase {〈x,y〉:xBκy} de pares de
2.10 Los Teoremas de Incompletud de Gödel 348

números tales que el primero es el gödel de una prueba de la fórmula cuyo


gödel es el segundo; mas no la clase {x:Bewκ(x)} = Flg(κ), esto es, la clase
de los gödel de las fórmulas deducibles de K. Como es obvio, cualquiera
que sea la clase de fórmulas K representada por la clase de números κ, si la
fórmula †[x] tiene una prueba, tiene una prueba desde K. En otras palabras:

∀x(Bew(x) → Bewκ(x)) (2)

19 )).37 Esta relación, evidente-


Gödel llama Q(x,y) a la relación ¬xBκ(Sb(y Z(y)
mente “recursiva”, existe entre los números x e y si x no es el gödel de una
19 )] (descrita en la p. 346 bajo el (vii)).
prueba desde K de la fórmula †[Sb(y Z(y)
Combinando (2) con el Teorema V, concluimos que hay una fórmula con
sólo dos variables libres, tal que, si q es el gödel de esa fórmula, entonces:

19 )) → Bew (Sb(q 17 19 ) )
¬xBκ(Sb(y Z(y) κ Z(x) Z(p)
(3)
19 )) → Bew (Neg(Sb(q 17 19 ) ))
xBκ(Sb(y Z(y) κ Z(x) Z(p)

En lo sucesivo llamo G(u1,v1) a la fórmula †[q] que expresa según el


19 )], y sea Θ la
Teorema V la relación Q(x,y).38 Sea Ψ la fórmula †[Sb(y Z(y)

37 La abreviatura Q(x,y) no vuelve a figurar en la demostración del Teorema VI, pero le


19 )
sirve más adelante para referirse a la relación ¬xBκ(Sb(y Z(y) ) en la demostración del
Teorema XI (1931, p. 197). Nosotros también nos valdremos de ella en ese contexto.
38 Por cierto, ‘G(u1,v1)’ no es la fórmula con gödel q, puesto que no es una fórmula del
cálculo P. ‘G(u1,v1)’ es el nombre que le doy a la fórmula con gödel q en mi discurso
sobre el cálculo. Según la práctica descrita en el Apéndice IX.A, combino el nombre
‘G(u1,v1)’ con signos de P para formar nombres que designan otras fórmulas bien de-
terminadas de P. Por ejemplo, ‘~u1Π(G(u1,v1))’ designa la fórmula formada por la fila
~u1Π, seguida por el paréntesis izquierdo, seguida por la fórmula llamada G(u1,v1),
seguida por el paréntesis derecho. Para aligerar la tipografía, llamo G(u1,ƒp0) a la fór-
mula obtenida al reemplazar la variable v1 por el numeral ƒp0 en todas las posiciones
libres de v1 en G(u1,v1). Según la convención descrita al final del Apéndice IX.A, dicha
fórmula debiera llamarse G(u1,v1)[ƒp0/v1].
2.10 Los Teoremas de Incompletud de Gödel 349

17 19 ) ] obtenida al reemplazar en G(u ,v ) las variables li-


fórmula †[Sb(q Z(x) Z(y) 1 1
bres u1 = †[17] y v1 = †[19] por los numerales ƒx0 = †[Z(x)] y ƒy0 = †[Z(y)],
respectivamente. Con esta nomenclatura, las dos implicaciones enunciadas
en (3) pueden simbolizarse también así:

¬xBκ(#Ψ) → Bewκ(#Θ)
(3*)
xBκ(#Ψ) → Bewκ(Neg(#Θ))

Según esto, Θ es deducible de K si x no es el gödel de una prueba de Ψ


desde K y ~Θ es deducible de K si x es el gödel de una prueba de Ψ desde
K.
19 ). r es el gödel de
Sea p = 17 Gen q = #[u1Π(G(u1,v1))] y sea r = Sb(q Z(p)
p
la fórmula G(u1,ƒ 0) que se obtiene al reemplazar en G(u1,v1) la variable libre
v1 por el numeral ƒp0 = †[Z(p)]. Haciendo las sustituciones pertinentes com-
probamos que:

19 ) = Sb((17 Gen q)19 ) = 17 Gen Sb(q 19 ) = 17 Gen r


Sb(p Z(p) (4)
Z(p) Z(p)

17 19 ) = Sb(r 17 )
Sb(q Z(x) (5)
Z(p) Z(x)

Si reemplazamos y por p en (3) obtenemos las dos implicaciones siguientes:

19 )) → Bew (Sb(q 17 19 ) )
¬xBκ(Sb(p Z(p) (6)
κ Z(x) Z(p)

19 )) → Bew (Neg(Sb(q 17 19 ) ))
xBk(Sb(p Z(p) (7)
k Z(x) Z(p)

19 ) por 17
Invocando (4) y (5), reformulamos (6) y (7), reemplazando Sb(p Z(p)
17 19 ) por Sb(r 17 ) , respectivamente:
Gen r y Sb(q Z(x) Z(p) Z(x)

17 )
¬xBκ(17 Gen r) → Bewκ(Sb(r Z(x) ) (6*)

17 )
xBκ(17 Gen r) → Bewκ(Neg(Sb(r Z(x) ) (7*)
2.10 Los Teoremas de Incompletud de Gödel 350

De este resultado inferiremos con Gödel que, si κ es, como hemos su-
puesto, una clase “recursiva” ω-consistente, ninguno de los números 17 Gen
r y Neg(17 Gen r) pertenece a Flg(κ). Así se completa la demostración del
Teorema VI. Ahora bien, 17 Gen r es el gödel de la fórmula que, según la
nomenclatura adoptada, hay que llamar u1Π(G(u1,ƒp0)). Así pues, el argu-
mento presentado a continuación demostrará que, si la clase K de fórmulas
es ω-consistente, ni u1Π(G(u1,ƒp0)) ni ~u1Π(G(u1,ƒp0)) son deducibles de
K. Si K = ∅, la fórmula llamada u1Π(G(u1,ƒp0)) no es demostrable ni refu-
table en P.
Si 17 Gen r perteneciera a Flg(κ) tendríamos que hay un número n tal
17 )
que n Bκ (17 Gen r). Por lo tanto, en virtud de (7*), Bewκ(Neg(Sb(r Z(n) ).
Por otra parte, 17 Gen r ∈ Flg(κ) significa que hay una prueba desde K de
17 )
la fórmula u1Π(G(u1,ƒp0)) y, por ende, también de la fórmula †[Sb(r Z(n) ]
obtenida reemplazando en G(u1,ƒp0) la variable libre u1 por ƒn0. Pero enton-
17 )
ces tendríamos que Bewκ(Sb(r Z(n) ), y κ sería inconsistente y, por ende, ω-
inconsistente. Por lo tanto, bajo las hipótesis del Teorema VI, 17 Gen r ∉
Flg(κ).
Supongamos, entonces, que Neg(17 Gen r) ∈ Flg(κ). Como 17 Gen r ∉
Flg(κ), es claro que ∀n¬(n Bκ (17 Gen r)). En virtud de (6*), esto implica
17 )
que ∀nBewκ(Sb(r Z(n) ). Flg(κ) contendría a la vez el número Neg(17 Gen r)
= #[~u1Π(G(u1,ƒp0))] y el gödel de cada una de las fórmulas que se obtie-
nen insertando en G(u1,ƒp0) —esto es †[r]— los numerales 0, ƒ0, ƒƒ0,…
en lugar de la variable libre u1. Pero entonces κ sería ω-inconsistente. Por lo
tanto, bajo las hipótesis del Teorema VI, Neg(17 Gen r) ∉ Flg(κ).
Obsérvese que, si la clase κ cumple las condiciones requeridas y le aña-
dimos el número Neg(17 Gen r), la clase κ′ así formada es a la vez consis-
tente y ω-inconsistente. κ′ es consistente, puesto que (17 Gen r) ∉ Flg(κ) y,
por cierto, si κ y por ende ∅ son consistentes,

(17 Gen r) ∉ Flg({Neg(17 Gen r)}).

κ′ es ω-inconsistente, por la razón aducida para probar que Neg(17 Gen r)


∉ Flg(κ). Así queda probado, mediante un ejemplo, que la ω-consistencia
no equivale a la consistencia.
2.10 Los Teoremas de Incompletud de Gödel 351

Gödel subraya que la demostración precedente es constructiva, pues todas


las aseveraciones existenciales que contiene se basan en el Teorema V, el
cual, “como fácilmente se ve, es inobjetable desde un punto de vista intui-
cionista” (1931, p. 189, n. 45a). Por eso, Gödel recibirá con incredulidad la
noticia de que Wittgenstein cuestionaba su descubrimiento. En respuesta a
una carta de Karl Menger con citas de Wittgenstein, le escribe el 5 de mayo
de 1972:

En lo que respecta a mi teorema sobre proposiciones indecidibles, los


pasajes que usted cita39 muestran claramente que Wittgenstein no lo en-
tendió (o se hizo como que no lo entendía). Lo interpreta como una espe-
cie de paradoja lógica, cuando en realidad es todo lo contrario, a saber,
un teorema matemático perteneciente a una parte absolutamente incon-
trovertida de las matemáticas: la aritmética finitista o análisis combina-
torio.
(Citado por Wang 1987, p. 49; cursiva mía)

Gödel destaca asímismo que en la demostración del Teorema VI ha invo-


cado solamente dos propiedades del cálculo P: (1) la clase de los axiomas y
la relación ‘consecuencia inmediata’ —que epitomiza las reglas de infe-
rencia— se pueden definir recursivamente (paso 4º), si “reemplazamos de
algún modo los signos primitivos mediante números naturales” (paso 2º); (2)
toda relación “recursiva” es P-decidible (paso 5º). “Por lo tanto, en todo sis-
tema formal que satisfaga las condiciones (1) y (2) y sea ω-consistente hay

39 Tomados de Wittgenstein 1956, pp. 50-54 y 176. No viene a cuento examinar aquí
estos textos. Baste señalar que las dudas de Wittgenstein responden, en buena parte, al
aserto de que la fórmula cuya indemostrabilidad e irrefutabilidad ha sido establecida
por Gödel “habla” de sí misma y “dice” que es indemostrable. Este aserto, corriente en
las exposiciones de la obra de Gödel, vale, obviamente, para la fórmula [Rq;q] mencio-
nada en el argumento informal presentado en la Sección 2.10.1 (y en el §1 de Gödel
1931), pero no vale para la fórmula †[17 Gen r] a que se refiere el Teorema VI. Esta
fórmula “hablaría” de sí misma si contuviera el numeral correspondiente a 17 Gen r.
Pero el único numeral cuya presencia se requiere en †[17 Gen r] es ƒp0, correspon-
diente al número p = 17 Gen q ≠ 17 Gen r. Con todo, importando ideas que no perte-
necen ni contribuyen en nada al austero argumento combinatorio de Gödel, se puede
justificar la “traducción” de la fórmula †[17 Gen r] mediante la oración castellana ‘la
fórmula †[17 Gen r] no es demostrable’.
40 En la acepción explicada en la p. 250, nota 4. Véase lo dicho en la p. 342.
2.10 Los Teoremas de Incompletud de Gödel 352

proposiciones indecidibles40 de la forma ∀xFx, donde F es una propiedad de


números naturales definida recursivamente; y lo mismo ocurre en cualquier
extensión de un sistema tal mediante una clase de axiomas recursivamente
definible y ω-consistente” (1931, p. 190s.). Gödel anota que tanto el sistema
axiomático para la aritmética que consta de los axiomas de Peano, el esque-
ma de definición recursiva PR5 y “las reglas lógicas”, como los sistemas
axiomáticos para la teoría de conjuntos de Zermelo-Fraenkel y de von
Neumann cumplen las condiciones (1) y (2); y que “la condición (1) está
satisfecha por cualquier sistema que tenga las reglas de inferencia habituales
y cuyos axiomas se generen (como en P) por sustitución a partir de un nú-
mero finito de esquemas” (1931, p. 191).41
El Teorema VI no significa, por cierto, que haya una propiedad de núme-
ros, descriptible con los medios expresivos de P u otro sistema afín, tal que,
para cierto número m no es verdadero ni falso que m la tenga. Tal como
ocurre con otros teoremas matemáticos de imposibilidad, todo lo que el Teo-
rema VI quiere decir es que cierta cuestión no puede resolverse con deter-
minados recursos. Específicamente, si el sistema considerado es ω-consis-
tente (o siquiera consistente—Rosser 1936), siempre hay una propiedad así
cuya posesión por cierto número no se puede demostrar ni refutar en el sis-
tema. La imposibilidad comprobada por Gödel es comparable, por ejemplo,
a la imposibilidad de construir con regla y compás un segmento recto igual
a la circunferencia de un círculo de radio dado (el famoso problema de la
“cuadratura del círculo”). Pero habrá de parecernos mucho más grave si cree-
mos que P y los sistemas afines comprenden todos los recursos de que dis-
pone el hombre para conocer con certeza una verdad sobre números no in-
cluida ya en la aritmética finitista (Capítulo 2.6).

Completaré esta sección enunciando ciertas consecuencias del Teorema VI


que se demuestran en Gödel 1931, §3. Para ello, necesito una definición.
Diré con Gödel que una relación (o clase) numérica es aritmética si se la
puede definir mediante los conceptos de suma, multiplicación e identidad
(confinados a los números naturales), utilizando negaciones, disyunciones y

41 El Apéndice XVI contiene una caracterización general de los sistemas deductivos a los
que se aplica una “forma abstracta” del Teorema VI.
2.10 Los Teoremas de Incompletud de Gödel 353

generalizaciones (sobre el dominio de los naturales). Una proposición arit-


mética es una aseveración hecha con estos mismos recursos conceptuales.42
Gödel demuestra sin dificultad que toda relación “recursiva” es aritmética
(Teorema VII). Esto implica que para todo problema de la forma ∀xFx —
con F recursiva— existe un problema aritmético equivalente (esto es, un
problema aritmético cuya solución determina si ∀xFx es verdadera o falsa).
Como la prueba del Teorema VII puede formalizarse en P, se sigue que cual-
quiera de los sistemas formales a que se refiere el Teorema VI43 contiene
proposiciones aritméticas indemostrables e irrefutables en el sistema (Teore-
ma VIII). Mediante un argumento interesantísimo que no puedo reproducir
aquí, Gödel establece además que todo problema de la forma ∀xFx —con F
recursiva— puede reducirse a la cuestión de si una cierta fórmula del cálcu-
lo predicativo de primer orden es realizable (Teorema X). En otras palabras,
para cada F recursiva hay una fórmula del cálculo predicativo de primer orden
que es realizable si y sólo si ∀xFx es verdad. Esto implica que cualquiera de
los sistemas formales a que se refiere el Teorema VI contiene fórmulas de
primer orden (esto es, fórmulas sin variables ligadas de tipo superior a 1)
que no pueden deducirse en el sistema, sin que, por otra parte, sea posible
deducir la existencia de un contraejemplo (Teorema IX). Como Gödel (1930)
había demostrado que toda fórmula válida del cálculo predicativo de primer
orden es deducible en ese cálculo y por ende, a fortiori, en P o en una ex-
tensión de P, las fórmulas a que se refiere el Teorema IX no pueden ser
válidas; pero la realizabilidad de su negación es indemostrable en el sistema
pertinente (P o una extensión ω-consistente de P). Con el Teorema IX Gödel
está al borde de establecer que el Entscheidungsproblem del cálculo predica-
tivo de primer orden es insoluble (Teorema de Church). Mas para ello haría
falta (i) extender a las relaciones recursivas en general lo que el Teorema V
dice sobre las relaciones “recursivas” y (ii) reconocer que toda función com-
putable mediante un algoritmo es recursiva (Tesis de Church).44
42 Gödel cita dos ejemplos de relaciones aritméticas: La relación diádica ‘x es mayor que
y’ definida por: x > y ↔ ∀z¬(y = x + z); y la relación triádica ‘x es congruente con y
módulo n’, definida por: x ≡ y (mod n) ↔ ∃z(x = y + z⋅n ∨ y = x + z⋅n).
43 Vale decir, cualquier sistema deductivo con los signos, fórmulas y reglas de inferencia
de P y una clase recursiva ω-consistente de axiomas que incluya los axiomas de P.
44 Conforme a la Tesis de Church, si hubiera un algoritmo para determinar qué oraciones
de primer orden son válidas, la clase de esas oraciones y su complemento, la clase de
las oraciones de primer orden cuya negación es realizable, serían clases recursivas. Por
2.10 Los Teoremas de Incompletud de Gödel 354

2.10.3 La indemostrabilidad de la consistencia

El “segundo teorema de incompletud” (Gödel 1931, Teorema XI) concier-


ne directamente al programa de Hilbert. Simplificando, se lo puede resumir
así: si el sistema P es consistente, la consistencia de P no puede demostrarse
en P. Por eso, algunos escritores sensacionalistas han concluido que nunca
podremos saber si la aritmética es o no contradictoria. Smullyan los ridicu-
liza observando que “confiar en la consistencia de un sistema sobre la base
de que éste puede probar su propia consistencia es tan estúpido como con-
fiar en la veracidad de una persona porque ella dice que nunca miente” (1992,
p. 109). Aunque justa, esta observación no disminuye la importancia
metodológica del descubrimiento de Gödel. El programa hilbertiano para pro-
bar la consistencia de los axiomas de Peano no proponía deducir la consis-
tencia de P en el mismo P (o en otro sistema afín que incluya esos axio-
mas). Se trataba, más bien, de establecer dicha consistencia con recursos esen-
cialmente más débiles. Hasta 1930 se pensaba que todos los recursos nece-
sarios estaban contenidos en la aritmética finitista (Capítulo 2.6). Por otra
parte, parecía claro que la aritmética finitista es representable y deducible en
P. Por lo tanto, si la consistencia de P no se podía demostrar en P, tampoco
se podría establecerla con los recursos de la aritmética finitista.
El Teorema XI —al igual que el Teorema VI— se refiere no solamente a
P sino a cualquier extensión de P mediante una clase recursiva de axiomas.
Supondremos que K y D(K), κ y Flg(κ) son como en la explicación del paso

lo tanto, según el Teorema V (extendido), habría en P una fórmula con una variable
libre φ(u), tal que ∂φ(n) si n es el gödel de cualquier oración de primer orden cuya
negación es realizable. La prueba de φ(n) sería una prueba en P de que la negación de
la oración †[n] es realizable. Pero el Teorema IX enseña justamente que hay oraciones
de esta clase que no admiten tal prueba. La extensión del Teorema V a las funciones
recursivas se sigue inmediatamente de una observación expresada al final de Gödel
1934 (p. 27). Pero durante la visita a Princeton en que dictó las lecciones que forman
la base de este trabajo, Gödel no se avino a aceptar la Tesis de Church. Como indica
en la “posdata” de 1964 (impresa a continuación de la observación citada), sólo llegó
a convencerse a la luz de la obra de Turing (1936). El Teorema de Church sobre la
insolubilidad del Entscheidungsproblem del cálculo de primer orden —publicado en
Church 1936a— es un corolario de otro teorema más general, incluido en Church 1936
(véase el Capítulo 2.11).
2.10 Los Teoremas de Incompletud de Gödel 355

6º de la demostración del Teorema VI. K es consistente si y sólo si hay una


fórmula de P que no pertenece a D(K). Esto equivale a la existencia de un
número x tal que x es el gödel de una fórmula de P y no hay ningún número
y que sea el gödel de una prueba de esa fórmula desde K. Usando las abre-
viaturas introducidas en la demostración del Teorema VI (cf. Defs. 23 y 45),
esta condición necesaria y suficiente para la consistencia de K se expresa
así: ∃x∀y(Form(x) ∧ ¬(yBκx)). Abreviando aun más, escribo —como Gödel—
‘Wid(κ)’ en lugar de ‘∃x∀y(Form(x) ∧ ¬(yBκx))’ (no se pierda de vista que
‘Wid(κ)’ es aquí una expresión castellana abreviada). Supongamos ahora que
κ es una clase “recursiva” de FÓRMULAS. Es claro que, siguiendo una por una
las primeras 23 definiciones del paso 4º de la demostración del Teorema VI,
es posible construir en P una fórmula F(u1), con una sola variable libre u1,
que represente el predicado Form(x). Continuando hasta la Def. 45, y com-
binándola con la definición de κ como clase “recursiva”, se construye una
fórmula Bκ(v1,u1) que representa la relación (yBκx). Entonces, la fila

~u1Π~v1Π(F(u1) Ÿ ~Bκ(v1,u1)) (8)

es una oración de P que representa el aserto Wid(κ): (8) “dice” en P que la


clase “recursiva” κ es consistente. Sea w el gödel de la oración (8).45
El Teorema XI dice que, si κ es una clase recursiva de FÓRMULAS, Wid(κ)
→ ¬Bewκ(w). Con menos abreviaturas —y referido al cálculo P y sus
extensiones—, esto quiere decir que, si κ es una clase recursiva que reúne
los gödel de todas las fórmulas contenidas en una clase consistente K, no
existe una prueba desde K de la fórmula (8). En particular, si κ = ∅, podemos
leer P en vez de K. En tal caso, la fórmula (8) “dice” que P es consistente,
y el Teorema XI asevera que esto es así sólo si (8) es indemostrable en P.
Por cierto, la oración (8) = †[w] no es la única que representa en el cál-
culo P la consistencia de la clase recursiva κ. Supongamos que Wid*(κ) es
un enunciado —en castellano— equivalente a Wid(κ) y que w* es el gödel
de una oración que representa a Wid*(κ) en P. A menos que se probara que

45 Gödel (1931, p. 197) escribe: “Sei w die SATZFORMEL, durch welche in P Wid(κ)
ausgedrückt wird”; traducido: “Sea w la ORACIÓN mediante la cual Wid(κ) se expresa
en P”. Conforme a la convención sobre el uso de versalitas, esto quiere decir: “Sea w
el gödel de la oración mediante la cual Wid(κ) se expresa en P”.
2.10 Los Teoremas de Incompletud de Gödel 356

(~†[w] ⁄ †[w*]) ∉ D(K), el Teorema XI, en la forma en que ha sido enun-


ciado no nos fuerza a concluir que Wid*(κ) → ¬Bewκ(w*). Pero el argu-
mento con que Gödel prueba el Teorema XI no depende específicamente de
la estructura de (8). Antes bien, como enseguida veremos, suministra un
esquema para probar que Wid*(κ) → ¬Bewκ(w*), si Wid*(κ) y w* son lo
que dije. Por esta razón, la prueba del Teorema XI destruye toda esperanza
de establecer la consistencia de P mediante un razonamiento formalizable en
P, en que dicha consistencia se represente mediante una oración diferente de
(8).
El Teorema XI es simplemente una consecuencia del hecho de que el Teore-
ma VI se puede probar formalmente en el cálculo P. Construir tal prueba es
un trabajo largo y tedioso, que Gödel pospuso para la segunda parte de su
artículo (que nunca llegó a escribir). En todo caso, la tarea mayor sería cons-
truir las fórmulas de P correspondientes a las 45 funciones y relaciones
recursivas definidas en el paso 4º de la demostración del Teorema VI, y es
claro que esto es pura cuestión de paciencia: la definición semiformal de las
respectivas abreviaturas indica la pauta a seguir. Una vez que se dispone de
esas fórmulas no es difícil formalizar en P el argumento puramente combina-
torio que lleva a la conclusión (9). Así, Hilbert y Bernays (1939) probaron
rigurosamente en un sistema estrictamente más débil que P la oración que
representa al Teorema VI en dicho sistema.
Como se recordará, la etapa final de la prueba del Teorema VI consta de
dos partes. Se muestra (i) que si κ es consistente, 17 Gen r ∉ Flg(κ) y (ii)
que si κ es ω-consistente, Neg(17 Gen r) ∉ Flg(κ). Con las abreviaturas que
hemos estado usando, (i) puede escribirse:

Wid(κ) → ∀x¬(xBκ(17 Gen r)) (9)

19 ), donde r = Sb(q 19 ), p = 17 Gen q y


Recordemos que 17 Gen r = Sb(p Z(p) Z(p)
q es el número que corresponde según el Teorema V a la relación “recursiva”
19 )), abreviada Q(x,y). Reemplazando aquí y por p y 17
diádica ¬xBκ(Sb(y Z(y)
19 ), comprobamos que (9) también puede escribirse:
Gen r en (9) por Sb(p Z(p)

Wid(κ) → ∀xQ(x,p) (10)


2.10 Los Teoremas de Incompletud de Gödel 357

Ahora bien, Q(x,p) es una propiedad “recursiva” expresada en P según el


Teorema V por la fórmula †[r], y †[17 Gen r] es precisamente la fórmula de
P que consta de la variable †[17] seguida del signo Π seguida de la fórmula
†[r]. Es claro, entonces, que †[17 Gen r] “dice” en P que ∀xQ(x,p), y que la
oración

~†[w] ⁄ †[17 Gen r] (11)

“dice” en P lo que (9) y (10) dicen en castellano. La versión formal de la


prueba del Teorema VI en P incluirá, pues, una prueba de (11). Por lo tanto,
si hubiera una prueba de †[w] desde K, habría también una prueba de †[17
Gen r] desde K.46 Ahora bien, según lo que se vio en la demostración del
Teorema VI, tal prueba no puede existir a menos que K sea inconsistente.
Por lo tanto, si K es consistente no puede haber una prueba de †[w] desde
K. Usando abreviaturas: Wid(κ) → ¬Bewκ(w). Este es el Teorema XI.
Evidentemente, el enunciado preciso de Wid(κ) —esto es, ∃x∀y(Form(x)
∧ ¬(yBκx))— no juega ningún papel en el argumento anterior. Dicho enun-
ciado sirve tan sólo para fijar una fórmula de P —a saber, †[w]— que repre-
sente la consistencia de P en P. En la prueba formal del Teorema VI en P
tiene que figurar una fórmula así como antecedente de la implicación (11).
Pero, a la luz del argumento con que establecimos la correspondiente impli-
cación (9) en nuestra demostración del Teorema VI en castellano, es claro
que —tal como adelanté— †[w] podría reemplazarse con cualquier fórmula
†[w*] que represente en P un enunciado Wid*(κ) equivalente a Wid(κ).47

46 Únase la prueba de (11) —que es una prueba desde ∅ y por ende, a fortiori, desde
K— con la supuesta prueba de †[w] desde K y úsense estas dos fórmulas como premisas
de una inferencia final por modus ponens.
47 Como ya he indicado, a los Teoremas VI y XI suele dárseles el nombre de primer y
segundo “teorema de incompletud” de Gödel, designándoselos también mediante las
abreviaturas G1 y G2, respectivamente. La opinión mayoritaria estima que G2 asestó
un golpe de muerte al programa de Hilbert (sección 2.9.4). Ahora bien, G2 depende
visiblemente de G1 y no presupone ninguna premisa adicional no admitida por Gödel
2.10 Los Teoremas de Incompletud de Gödel 358

en la demostración de G1. En vista de ello, no es descabellado decir que el escollo


insalvable en que dicho programa naufraga es G1; sobre todo si se tiene en cuenta
que la cuestión de la consistencia de la matemática formalizada fue elegantemente
reducida por Hilbert y los suyos al Entscheidungsproblem, y G1 establece precisa-
mente que el Entscheidungsproblem es insoluble incluso en el caso de la aritmética.
Por otra parte, G1 puede extenderse más allá de esos “sistemas afines” a Principia
Mathematica considerados explícitamente por Gödel, a una clase de teorías formales
a las que, por su misma construcción, no se aplica G2. Considérese la propuesta si-
guiente. Los elementos de la teoría formalizada T se definen recursivamente como de
costumbre. Sea Π la definición recursiva de prueba en T (cf. Apéndice IX.F). Las
listas finitas de fórmulas que cumplen con la condición Π pueden ordenarse
lexicográficamente, o por el tamaño del respectivo gödel. Añadimos a Π esta estipu-
lación suplementaria: una lista Λ de formulas de T que cumple la condición Π es una
prueba en T sólo si la última fórmula de Λ no es la negación de la última fórmula de
ninguna prueba anterior a Λ en el orden adoptado. Evidentemente, es imposible deri-
var una contradicción en T, y si T es suficientemente rica debiera ser posible derivar
en T una oración que represente dicha imposibilidad y de este modo exprese la con-
sistencia de T. Michael Detlefsen (1986, 1990) sostiene que, no obstante los resulta-
dos de Gödel, el programa de Hilbert podría todavía revivirse empleando tales méto-
dos “atentos a la consistencia” (consistency-minded). Reconoce, sí, que “no estamos
actualmente en la posición de resolver” la cuestión “muy difícil” de si ello permitirá
cumplir dicho programa (1992a, p. 226). Pero pone especial cuidado en refutar a quie-
nes, como Smorynski (1985) vinculan el alegado fracaso del programa de Hilbert di-
rectamente con G1, ya que este teorema ciertamente sería aplicable a la referida teoría
T si ella es tan rica como sería necesario para que pruebe su propia consistencia.
2.11 FUNCIONES COMPUTABLES

Estudiaremos aquí las definiciones precisas de función numérica computable


propuestas por Alonzo Church, Alan Turing y otros autores. Según lo conve-
nido en el Capítulo 2.10, llamo función numérica a cualquier aplicación φ:
D Æ ˆ, tal que D ⊆ ˆr para algún entero positivo r. Es oportuno recordar
que cualquier función cuyo valor para un argumento dado pueda calcularse
mediante un algoritmo es numérica en este sentido. Por ejemplo, el conoci-
do algoritmo para calcular la raíz cuadrada de un entero positivo n hasta la
q-ésima decimal lo que en efecto determina es el numerador —un entero—
de la fracción con denominador 10q que menos dista de n . Y para calcular
la raíz cuadrada de un número real no entero tenemos primero que darnos
una fracción decimal que lo represente con la aproximación requerida y lue-
go aplicar el algoritmo al numerador de esta fracción.
En el resto de este capítulo diré ‘función’, en vez de ‘función numérica’.
Ocasionalmente convendrá distinguir entre funciones totales, cuyo dominio
D = ˆr para algún entero positivo r, y funciones parciales, cuyo dominio D
es una parte propia de ˆr. Distinguiré asímismo —al menos, de palabra—
las funciones computables, que caen bajo los conceptos precisos propuestos
por Church, Turing, etc. (ocurre que todos esos conceptos tienen la misma
extensión), de las funciones calculables, cuyo valor para un argumento dado
podría determinarse mediante un algoritmo, conocido o no. Generalmente se
admite que toda función computable es calculable en principio, pues los
métodos de definición contemplados, aunque pueden ser mucho más com-
plejos que ningún algoritmo tradicional, son siempre combinaciones finitas
de procedimientos elementales y cuando alguien nos los explica los recono-
cemos como algoritmos en el sentido intuitivo ordinario del término.1 Por

1 En un artículo reciente, Edward Nelson cuestiona la idea de calculabilidad en principio


contenida en el “el dogma finitista [de] que toda función recursiva es efectivamente
calculable” (1993, p. 9). Además de un argumento matemático, dependiente de su
Predicative Arithmetic (1986), propone la siguiente analogía:

359
2.11 Funciones computables 360

otra parte, la Tesis de Church afirma que toda función calculable es compu-
table. Trataremos de esclarecer la naturaleza de este aserto: ¿se trata, como
sugiere su nombre, de una conjetura matemática que aún no ha sido demos-
trada (ni refutada)? ¿o de una convención sobre el uso del lenguaje? ¿o de
un enunciado de otra índole?
En las primeras tres secciones de este capítulo consideraré sucesivamen-
te: el concepto general de función recursiva que Gödel propuso en 1934 si-
guiendo una sugerencia de Herbrand, y su notable simplificación por Kleene
(Sección 2.11.1); el concepto de función λ-definible propuesto por Church
en 1935 (Church 1936), la Tesis de Church según la cual este concepto co-
incide con el concepto intuitivo ordinario de función calculable, y el Teore-
ma de Church, que da —bajo este supuesto— una solución negativa al Ent-
scheidungsproblem del cálculo predicativo de primer orden (Sección 2.11.2);
y la concepción de Turing (1936) de un tipo de “máquinas” que incorporan
todos los ingredientes del calcular humano y la definición de computabilidad
basada en ella (Sección 2.11.3.). Luego, daré ejemplos y diagramas de má-
quinas de Turing (Sección 2.11.4), que utilizaré enseguida para demostrar
algunos resultados importantes al respecto y, basándome en ellos, el Teore-
ma de Church (Sección 2.11.5).

Los finitistas han verificado [que toda función computable es calculable] en casos
sencillos. En otros casos pueden darse por vencidos, pero saben que el cálculo se
completaría con sólo persistir lo suficiente. Si les preguntan cuánto es suficiente,
su respuesta sería: aproximadamente un número de operaciones igual al numeral
que estoy calculando.
Los niños malcriados tienen berrinches. Han comprobado en casos sencillos
que esto les procura lo que quieren. En otros casos, pueden darse por vencidos,
pero saben que conseguirían lo que quieren con sólo persistir lo suficiente. Si les
preguntan cuánto es suficiente, su respuesta sería: hasta que consiga lo que quie-
ro.
Con esto no busco desacreditar a quienes sustentan opiniones diferentes de la
mía; simplemente expreso mi opinión de que el finitismo es un sistema autovali-
dante de creencias que no tiene ninguna base y podría muy bien ser incorrecto.
(Nelson 1993, p. 10)
Nelson no pone en duda la Tesis de Church tal como la enuncio en el texto: toda fun-
ción efectivamente calculable es computable (recursiva).
2.11 Funciones computables 361

2.11.1 Funciones recursivas generales

En 1934 Gödel dictó en el Institute for Advanced Study de Princeton una


serie de lecciones sobre “Proposiciones indecidibles en sistemas matemáti-
cos formales”. Los apuntes de Kleene y Rosser, repartidos a la sazón a un
grupo de subscriptores, luego fueron publicados por Davis (1965) con notas
y correcciones de Gödel y una importante “Posdata”, fechada el 3 de junio
de 1964.2 En la mayor parte de este escrito Gödel utiliza un concepto de
función “recursiva” ligeramente más amplio que en 1931; el nuevo concepto
coincide exactamente con lo que en la Sección 2.10.2 llamé funciones
recursivas primitivas o pr-recursivas. Entre las funciones básicas a partir de
las cuales toda función “recursiva” puede definirse (aplicando los esquemas
PR4 y PR5 de la Sección 2.10.2) se cuentan ahora, no sólo la función suce-
sor y la función cero (definidas por PR1 y PR2), sino también, para cada
entero positivo r, la k-ésima proyección de ˆr en ˆ (1 ≤ k ≤ r), esto es, la
función 〈x1,…,xr〉 Å xk (PR3). Luego, en el §9 y final, Gödel advierte que
la función φ:ˆ2 Æ ˆ, definida a continuación a partir de dos funciones
“recursivas” dadas ψ y χ, en general no es “recursiva” en el sentido es-
pecificado por las condiciones PR1-PR5 (vale decir, no es pr-recursiva):

φ(x,0) = ψ(y)
φ(x+1,0) = χ(x)
φ(x+1,y+1) = φ(x,φ(x+1,y))

La definición precedente enseña a calcular la función φ mediante un proce-


dimiento de recursión simultánea con respecto a dos variables. En una nota
añadida en 1964, Gödel recuerda que Ackermann (1928) construyó una fun-
ción calculable por recursión con respecto a una sola variable y demostró
que ella crece más rápido que cualquier función pr-recursiva y, por lo tanto,
no puede ser pr-recursiva ella misma.3

2 El texto impreso en Davis 1965 figura ahora también en Gödel, CW, I, 346-371, y en
traducción castellana en OC, pp. 167-98. Las notas y correcciones con que Gödel su-
plementó los apuntes en 1934 están incorporadas al texto; las observaciones añadidas
en 1964 van entre corchetes.
3 Ackermann (1928) introduce una jerarquía de funciones con valores en ˆ. Una fun-
2.11 Funciones computables 362

Gödel se pregunta si no sería posible definir un concepto de función recur-


siva que abarque todas las formas de recursión imaginables. Enuncia ense-
guida la definición siguiente, “sugerida por Herbrand en una comunicación
privada”:

Si φ denota una función desconocida y ψ1,…, ψk son funciones cono-


cidas, y las ψ y φ se toman libremente, del modo más general, las unas
como argumento de las otras, y de entre las expresiones resultantes igua-
lamos ciertos pares (if the ψ’s and φ are substituted in one another in the
most general fashions and certain pairs of the resulting expressions are
equated), entonces, si el sistema resultante de ecuaciones funcionales tie-
ne una y sólo una solución para φ, φ es una función recursiva.

ción es de tipo 1 si sus argumentos son k-tuplos de números naturales (k ≥ 1); de tipo
2, si sus argumentos incluyen funciones de tipo 1; de tipo n+1, si sus argumentos in-
cluyen funciones de tipo n. Propone el siguiente ejemplo de una función de tipo 2, que
utiliza luego para definir la llamada función de Ackermann:

ρc(ƒ(c),x,0) = x
ρc(ƒ(c),x,σn) = ƒ(ρc(ƒ(c),x,n))
donde ƒ es cualquier función de tipo 1 y σn designa el siguiente de n. Ackermann
advierte que el subíndice c indica que ρc(ƒ(c),x,y) depende de ƒ, x e y, pero no depen-
de de c. Como fácilmente se comprueba, ρc(ƒ(c),a,n) es igual al valor de ƒ aplicada
iterativamente n veces al argumento a. Ackermann introduce además la función auxi-
liar binaria α, definida por α(x,0) = 0, α(x,1) = 1, α(x,n+2) = x. Con estos recursos
define la función ternaria ϕ mediante las ecuaciones:

ϕ(x,y,0) = x + y
ϕ(x,y,σn) = ρ c(ϕ(x,c,n),α(x,n),y)

El lector debe comprobar que ϕ(x,y,1) = xy y ϕ(x,y,2) = xy. ϕ(x,y,3) es el resultado de


repetir y veces, partiendo del argumento x, la operación de elevar al exponente x; ϕ(x,y,4)
es el resultado de repetir y veces, partiendo del argumento x, la operación de elevar al
exponente ϕ(x,y,3), etc. La función de Ackermann es la función unaria ψ definida, para
cada x ∈ ˆ, por la condición:

ψ(x) = ϕ(x,x,x)
Ackermann demostró que ψ(n) crece con n más rápidamente que cualquier función de
tipo 1. Como todas las funciones pr-recursivas son de tipo 1, ψ no puede ser pr-recursiva.
Por otra parte, obviamente, ψ es una función calculable.
2.11 Funciones computables 363

Por ejemplo, podríamos tener

φ(x,0) = ψ 1(x)
φ(0,y+1) = ψ 2(y)
φ(1,y+1) = ψ 3(y)
φ(x+2,y+1) = ψ 4(φ(x,y+2),φ(x,φ(x,y+2)))

(Gödel, CW, I, 368; OC, pp. 194s.)

Aunque Gödel no lo diga, debemos dar por supuesto que las funciones pr-
recursivas básicas —sucesor (PR1), cero (PR2) y las proyecciones (PR3)—
cuentan en todo caso como funciones conocidas (en el ejemplo se utiliza
visiblemente la función sucesor, además de las ψk). Gödel adopta la defini-
ción anterior con dos importantes restricciones.4 Requiere (i) que el lado
izquierdo de cada ecuación funcional del sistema que determina la función
r-aria φ tenga la forma

φ(ψi1(x1,…,xn),ψi2(x1,…,xn),…,ψir(x1,…,xn))

y (ii) que para cada r-tuplo 〈k1,…,kr〉 ∈ ˆr haya un y sólo un m ∈ ˆ tal


que la ecuación φ(k1,…,kr) = m pueda derivarse del sistema en virtud de
las reglas de derivación que Gödel prescribe. La restricción (i) parece desti-
nada sólo a facilitar el enunciado de estas reglas, pues la exigencia de que
todas las funciones ψij tomen n-tuplos como argumentos puede trivialmente
cumplirse así: elíjase n de modo que las funciones conocidas que van a uti-

4 Kalmár (1955) construyó una función que satisface la definición atribuida por Gödel a
Herbrand, mas no las restricciones añadidas por Gödel. Véase Hermes 1961, §21.7.
No hay un algoritmo que permita calcular efectivamente la función de Kalmár. En re-
lación con esto, conviene recordar que, como señalé en la Sección 2.6.3, Herbrand (1931)
imponía el requisito siguiente a todas las funciones admisibles en su aritmética formal:
“consideradas intuicionistamente” —esto es, “traducidas al lenguaje ordinario, como
propiedades de enteros, y no como puros símbolos”— “permiten hacer efectivamente
el cálculo” del valor que asignan a cada “sistema particular de números” (esto es, a
cada n-tuplo, cuando la función considerada es n-aria). En vista de esto, me parece que
el hallazgo de Kalmár indica que Gödel impuso, con certero instinto, a la definición de
función recursiva que Herbrand le había propuesto precisamente las restricciones in-
dispensables para ajustarla al propósito —y a las convicciones— del propio Herbrand.
2.11 Funciones computables 364

lizarse para determinar a φ sean a lo sumo n-arias; entonces, si entre ellas


hay una función m-aria ψ (m < n), reemplácesela con la función n-aria ψ′
definida por ψ′(x1,…,xm,xm+1,…,xn) = ψ(x1,…,xm). Las reglas de deri-
vación se definen inductivamente así:

(1a) Cualquier expresión obtenida al reemplazar por números naturales


todas las variables de una de las ecuaciones del sistema es una
ecuación derivada.
(1b) Si ψij es una de las funciones conocidas que figuran en el sistema,
〈k1,…,kn〉 es un n-tuplo de números naturales y m es un número
natural tal que ψij(k1,…,k n) es igual a m, entonces ψij(k1,…,kn)
= m es una ecuación derivada.
(2a) Si ψij(k1,…,kn) = m es una ecuación derivada, entonces la ecua-
ción obtenida al reemplazar ψij(k1,…,kn) por m en cualquiera de
los lugares en que la expresión ψij(k1,…,kn) figura en una ecua-
ción derivada es asimismo una ecuación derivada.
(2b) Si φ(k1,…,kr) = m es una ecuación derivada, donde k1,…, kr y
m son números naturales, la expresión obtenida al reemplazar
φ(k1,…,kr) por m en una posición ocupada por φ(k1,…,kr) en el
lado derecho de una ecuación derivada es asimismo una ecuación
derivada.

Combinada con las reglas de derivación, la restricción (ii) equivale a la condi-


ción siguiente: (ii*) los r-tuplos 〈k1,…,kr〉 que son los argumentos posibles
de φ pueden ordenarse de tal modo que para computar el valor de φ co-
rrespondiente a cierto r-tuplo 〈k1,…,kr〉 sea preciso conocer, a lo sumo, los
valores de φ correspondientes a r-tuplos que preceden a 〈k1,…,kr〉 en dicho
orden.
Llamamos función recursiva general a toda función numérica que satisfa-
ga estos criterios de Gödel (1934). En la literatura se ha solido llamarlas
funciones recursivas “en el sentido de Herbrand-Gödel”. Adviértase que, en
virtud de la restricción (ii), las funciones recursivas generales son funciones
totales. Esta fue históricamente la primera de las nociones equivalentes de
función computable a que aludí arriba. Es obvio que toda función recursiva
general es calculable mediante un algoritmo. Gödel se preguntó, a la inver-
sa, si las funciones calculables son todas recursivas, pero no aventuró una
2.11 Funciones computables 365

respuesta positiva a esta pregunta (cf. Church 1936, p. 356, n. 18). Años
más tarde, en la “Posdata” de 1964 a las lecciones de 1934, Gödel declara
que Turing (1936) fue el primero que dio un análisis satisfactorio de ‘proce-
dimiento mecánico’ (“alias ‘algoritmo’ o ‘procedimiento de cómputo’ o ‘pro-
cedimiento combinatorio finito’”—Gödel, CW, I, 369; OC, p. 196). Basán-
dose en ese análisis, Turing construyó su definición precisa de función com-
putable que tiene, demostrablemente, la misma extensión que el concepto de
función recursiva general. En vista de esto, Gödel acabó aceptando que to-
das las funciones calculables son recursivas en el sentido definido por él en
1934.
Gracias a un hallazgo de Stephen C. Kleene (1936) se puede dar una carac-
terización de las funciones recursivas generales mucho más perspicua y ele-
gante que la original de Gödel. Kleene demostró que basta suplementar las
operaciones PR4 y PR5 con una sencilla operación adicional para generar
todas las funciones recursivas generales a partir de las funciones pr-recursivas
básicas (PR1-PR3). Se trata de la operación de buscar, partiendo de 0, el
número natural más pequeño que cumple una condición pr-recursiva dada
(esto es, que posee una propiedad dada cuya función característica sea pr-
recursiva). En la p. 334 (✥), vimos que Gödel (1931) utilizó esta operación
restringida a un segmento de ˆ acotado por arriba para definir un tipo de
funciones pr-recursivas que luego figuran en la construcción del predicado
pr-recursivo Bw(x) (‘x es el gödel de una prueba’). Gödel demostró que si φ
es una función pr-recursiva n-aria y R es una relación pr-recursiva (m+1)-
aria, también es pr-recursiva la función que asigna a cada (n+m)-tuplo
〈x1,…,xn,y1,…,ym〉 el más pequeño número x ≤ φ(x1,…,xn) que cumple
la condición R(y1,…,ym,x), o el número 0 si no hay un x ≤ φ(x1,…,xn)
que la cumpla. Con el simbolismo utilizado en la p. 334, el valor de esta
función en el argumento 〈x1,…,xn,y1,…,ym〉 se llama µx(x ≤ φ(x1,…,xn)
∧ R(y1,…,ym,x)). Kleene se interesa por la operación de búsqueda simboli-
zada con µ, cuando no está restringida por una cota superior o tope. Su-
pongamos, pues, que hay por lo menos un número que cumple la condición
R(y1,…,ym,x) y sea µx(R(y1,…,ym,x)) el número más pequeño que la cum-
ple. Si χR es la función característica de la relación R, este número se desig-
na asimismo con la expresión µx(χR(y1,…,ym,x) = 0). Kleene (1943, p. 45)
muestra que si χR es una función recursiva general, la función 〈y1,…,ym〉
Å µx(χR(y1,…,ym,x) = 0) también es recursiva general. Para ello, introdu-
2.11 Funciones computables 366

ce una función auxiliar que llamaré ψ, definida por las ecuaciones

ψ(0,y1,…,ym,x) = x (1)
ψ(z+1,y1,…,ym,x) = ψ(χR(y1,…,ym,x+1),y1,…,ym,x+1) (2)

y luego define la función φ:〈y1,…,ym〉 Å µx(χR(y1,…,ym,x) = 0) median-


te la ecuación

φ(y1,…,ym) = ψ(χR(y1,…,ym,0),y1,…,ym,0) (3)

Esta ecuación define a φ en la forma requerida por Gödel, en términos de


las dos funciones “conocidas” ψ y χR. Para ver que φ realmente es la fun-
ción que he dicho, considérese un m-tuplo cualquiera q = 〈q1,…,qm〉. Cal-
culemos el valor de φ(q) mediante reemplazos en la ecuación (3). Primero
reemplazamos χR(q,0) por su valor. Si es igual a 0, la ecuación (1) nos da la
respuesta buscada: φ(q) = ψ(0,q,0) = 0. Si χR(q,0) = 1, tenemos que φ(q) =
ψ(1,q,0) = ψ(χR(q,1),q,1), por la ecuación (2). En la última expresión, reem-
plazamos χR(q,1) por su valor. Si es igual a 0, la ecuación (1) nos dice que
φ(q) = 1. En cambio, si χR(q,1) = 1, tenemos que φ(q) = ψ(1,q,1) =
ψ(χR(q,2),q,2), por la ecuación (2). El proceso se repite hasta encontrar un
número p tal que χR(q,p) = 0. (Como se recordará, hemos supuesto que hay
por lo menos un número tal). En virtud de la ecuación (1), es claro que φ(q)
= p. Porque los números se consideran consecutivamente, de menor a ma-
yor, a partir de 0, es claro que el primer número p que cumpla la condición
χR(q,p) = 0 es también el más pequeño que la cumple. De modo que φ(q) =
p = µx(χR(q,x) = 0).
Kleene (1936) demostró el siguiente teorema: Si ϕ es una función recursiva
general r-aria, entonces, para cada r-tuplo 〈x1,…,xr〉 ∈ ˆr,

φ(x1,…,xr) = ψ(µy(χ(x1,…,xr,y) = 0))

donde ψ es una función pr-recursiva r-aria y χ es una función pr-recursiva


(r+1)-aria tal que la ecuación χ(x1,…,xr,y) = 0 tiene por lo menos una solu-
ción y ∈ ˆ, para cada r-tuplo 〈x1,…,xr〉 ∈ ˆr. La demostración de este
teorema no es demasiado difícil, pero toma tiempo, y no puedo darla aquí.5

5 Recomiendo la demostración de Hermes 1961, §21 (hay traducción inglesa).


2.11 Funciones computables 367

En virtud del mismo, toda función recursiva general puede expresarse como
una función compuesta —en el orden indicado— de dos funciones pr-
recursivas y una aplicación del operador µ. Como toda función pr-recursiva
es evidentemente recursiva general, este hallazgo de Kleene nos permite re-
emplazar la definición gödeliana de función recursiva general por las seis
estipulaciones siguientes:

R1 La función sucesor x Å x + 1 es recursiva general.


R2 Si r es un entero positivo, la función cero 〈x1,…,xr〉 Å 0 es
recursiva general.
R3 Si r es un entero positivo, la función 〈x1,…,xr〉 Å xk (1 ≤ k ≤ r)
es recursiva general. Esta función se llama la k-ésima proyección
de ˆr, simbolizada πrk o simplemente πk.6
R4 Si h es una función recursiva general m-aria, y g1,…,gm son fun-
ciones recursivas generales n-arias, también es recursiva general la
función compuesta:

〈x1,…,xn〉 Å h(g1(x1,…,xn),…,gm(x1,…,xn))

R5 Si g es una función recursiva general (n-1)-aria (una constante, si n


= 1) y h es una función recursiva general (n+1)-aria, también es
recursiva general la función n-aria f definida por la doble condición
siguiente:

f(0,x2,…,xn) = g(x2,…,xn)
f(x1+1,x2,…,xn) = h(x1,f(x1,x2,…,xn),…,xn)

R6 Si h es una función recursiva general (r+1)-aria (r ≥ 1) y para cada


r-tuplo 〈x1,…,xr〉 ∈ ˆr hay un y ∈ ˆ tal que h(x1,…,xr,y) = 0,
también es recursiva general la función r-aria g definida por la con-
dición siguiente:

g(x1,…,xr,) = µy(h(x1,…,xr,y) = 0)

6 Como indiqué en la p. 332, nota 18, una notación rigurosa debería incluir el valor de
r en el símbolo de la proyección. En la práctica, este dato se omite porque normalmen-
te está implícito en el contexto.
2.11 Funciones computables 368

La condición R6 exige que la ecuación h(x1,…,xr,y) = 0 tenga por lo


menos una solución y para cada r-tuplo 〈x1,…,xr〉. Este requisito es indispen-
sable para que la función g cumpla el requisito (ii) prescrito por Gödel en su
definición de las funciones recursivas generales, esto es, para que, dado un
r-tuplo 〈k1,…,kr〉 ∈ ˆr haya un y sólo un m ∈ ˆ tal que g(k1,…,kr) = m.
Pero, visiblemente, se trata de una exigencia muy artificial. Si la elimina-
mos, obtenemos el concepto de función recursiva parcial, introducido por
Kleene (1938), el cual constituye nuestra noción más amplia de función recur-
siva. Kleene (1943) lo define así:

Una función φ(x1,…,xn) es recursiva parcial si existe un sistema E de


ecuaciones que la define recursivamente en el sentido que se explica a
continuación. Un sistema E de ecuaciones define recursivamente una fun-
ción recursiva parcial n-aria si, para cada n-tuplo 〈x1,…,xn〉 de números
naturales se puede derivar de E, conforme a las reglas [de derivación], a
lo sumo para un numeral x una ecuación de la forma f(x1,…,xn) = x,
donde x1,…,xn son los numerales que representan a los números natura-
les x1,…,xn. La función n-aria definida por E en este caso es la función
φ cuyo valor φ(x1,…,xn) para el argumento 〈x1,…,xn〉 es el número
natural x representado por el numeral x si ese numeral existe, y de otro
modo está indefinido.7

En virtud de esta definición, toda función recursiva general es recursiva par-


cial. Por eso, en vez de ‘función recursiva parcial’, se suele decir simple-
mente función recursiva.

7 Construí la definición arriba transcrita haciendo los reemplazos indicados por Kleene
(1943, p. 50s.) en su definición gödeliana de función recursiva general (1943, pp. 44s.).
En vez de “las reglas [de derivación]”, Kleene dice “las reglas R1 y R2”, con lo cual
alude, no por cierto a nuestras reglas R1 y R2, sino a su propia versión (p. 43) de las
reglas de derivación de Gödel.
2.11 Funciones computables 369

2.11.2 La Tesis y el Teorema de Church

El primero en reclamar que toda función efectivamente calculable es una


función recursiva general fue Alonzo Church (1936). En este trabajo —un
resumen de cuyos resultados se publicó en 1935— Church se propone dar
“una definición de calculabilidad efectiva que corresponda satisfactoriamen-
te a la noción intuitiva un tanto vaga” (p. 346) que solía invocarse en la
literatura matemática. Se vale para ello del concepto de función λ-definible
—desarrollado por él y Kleene— cuya extensión demostrablemente coincide
con la del concepto gödeliano de función recursiva general.
El concepto de función λ-definible se introduce en términos de un siste-
ma formal extraordinariamente simple, que llamaré el λ-cálculo. Los símbo-
los del formalismo son el operador λ, los tres pares de paréntesis (, ), [, ], {,
}, y una lista infinita de variables, que identifico con x, x|, x||,…, aunque,
siguiendo a Church, las llamaré a, b, c,… Una fórmula es cualquier se-
cuencia finita de símbolos. Usaré, como Church, caracteres en negrita como
variables metalingüísticas que representan fórmulas. (Por lo tanto, en la pre-
sente sección, una letra en negrita no representa un n-tuplo). Los conceptos
de fórmula bien formada (fbf), variable libre y variable ligada se definen
inductivamente como sigue. (i) Si x es una variable, x es una fbf y la varia-
ble x está libre en la posición que ocupa en esa fbf. (ii) Si F y X son fbfs,
{F}(X) es una fbf; si la variable x está libre (ligada) en cierta posición que
ocupa en F o X, también está libre (ligada) en la posición correspondiente
en {F}(X). (iii) si M es una fbf y x es una variable libre en M, λx[M] es una
fbf, x está ligada en todas las posiciones que ocupa en λx[M] y cualquier
variable z ≠ x que esté libre (ligada) en M también está libre (ligada) en la
posición correspondiente en λx[M].
Church introduce varias abreviaturas: si F consiste en (o se representa me-
diante) un solo signo, escribe F(X) en vez de {F}(X), F(X,Y) en vez de
{{F}(X)}(Y), etc.; en vez de λx1[λx2[…λxn[M]…]] escribe λx1x2…xn⋅M
o, si M no empieza con una variable, simplemente λx1x2…xnM. Luego dis-
tingue una secuencia de fbfs construidas según un procedimiento uniforme,
a las que designa abreviadamente con números, que indican el respectivo
lugar en la secuencia. Según esto,
2.11 Funciones computables 370

0 abrevia a λab⋅a(b)
1 abrevia a λab⋅a(a(b))
2 abrevia a λab⋅a(a(a(b)))

y así sucesivamente.8 A estas fbfs las llamaré numerales. Si F, G y H son


fórmulas, designo con SFGH| la fórmula que resulta al reemplazar F por G
en todas las posiciones que F ocupa en H.
Hay tres reglas para derivar una fbf F de una dada fbf G. Si M y N son
fórmulas y x y z son variables, la fórmula derivada F puede ser:

I La fbf resultante al reemplazar en G una parte λx[M] por λz[SxzM|],


donde z es una variable que no figura en M.
II La fbf resultante al reemplazar en G una parte {λx[M]}(N) por
SxNM|, siempre que las variables ligadas en M difieran de x y de
todas las variables libres en N.
III La fbf resultante al reemplazar en G una parte SxNM| (no precedida
inmediatamente por λ) por {λx[M]}(N), siempre que las variables
ligadas en M difieran de x y de todas las variables libres en N.

Si G es una fbf y F = G, o F se deriva de G según una de estas tres


reglas, decimos que G es inmediatamente convertible en F, simbólicamente
G ⇒ F.9 G es convertible en F —abreviado G conv F— si G ⇒ F o si hay
una fbf H tal que G conv H y H ⇒ F. Si G conv F, hay pues una secuencia
finita de fbfs G ⇒ H1 ⇒ H2 ⇒ …⇒ Hn ⇒ F, en la que cada fbf (excepto
la última) es inmediatamente convertible en la siguiente en virtud de alguna
de las reglas I-III. Tal secuencia es una conversión. Llamo sustitución de
variables a una conversión que sólo incluye aplicaciones de la regla I. Lla-
mo, con Church, reducción a una conversión que combina aplicaciones de la
regla I con una aplicación única de la regla II (pero no aplica la regla III).

8 Formalmente (sin abreviaturas) 0 es la fbf λx[λx|[{x}(x|)]], 1 es λx[λx|[{x}({x}(x|))]], 2


es λx[λx|[{x}({x}({x}(x|)))]], etc. Adviértase que en vez de 0, 1 y 2, Church escribe 1,
2 y 3, respectivamente, porque en todo su artículo identifica los números naturales con
los enteros positivos (cuenta desde uno, y no como nosotros desde cero). Por la misma
razón, Church estipula que la función característica de un conjunto C asigna el valor 2
a los elementos de C (y el valor 1 a los objetos que no pertenecen a C).
9 Church no emplea este simbolismo.
2.11 Funciones computables 371

Una función ϕ:ˆ Æ ˆ es λ-definible si hay en el λ-cálculo una fbf F tal


que, si ϕ(m) = r, y m y r son los numerales que, según la convención adop-
tada, designamos con los números m y r, respectivamente, entonces, {F}(m)
conv r. Esta definición se extiende sin dificultad a funciones cuyo dominio
es una potencia cartesiana de ˆ. Generalmente, ψ:ˆq Æ ˆ es λ-definible si
hay en el λ-cálculo una fbf F tal que, si ϕ(m1,…,mq) = r, y m1,…, mq, r
son los numerales que designamos con los números m1,…, mq, r, respecti-
vamente, entonces, {F}(m1,…, mq) conv r.10
Antes de seguir adelante, defino dos conceptos auxiliares que utilizare-
mos luego. Una fbf está en forma normal si no contiene ninguna parte de la
forma {λj[M]}(N). Si la fbf F está en forma normal, cualquier fbf que sea
parte de F está en forma normal. Decimos que una fbf F tiene la forma normal
G si F conv G y G está en forma normal. Una fbf puede tener varias formas
normales, pero todas ellas son mutuamente convertibles por sustitución de
variables. Church indica un modo de distinguir, entre las varias formas nor-
males de una fbf dada, una forma normal principal única, determinada por
la selección de las variables que figuran en ella y el orden en que aparecen.
La forma normal principal se define de tal modo que todo numeral es una
forma normal principal. Church destaca que “en el caso de cualquier fun-
ción λ-definible de enteros positivos,11 el proceso de reducción de fórmulas
a la forma normal provee un algoritmo para calcular efectivamente los valo-
res particulares de la función” (p. 349).
Después de presentar el λ-cálculo, Church da reglas para asignar un nú-
mero de identidad —un gödel— a sus símbolos y fórmulas. Luego define lo
que llama funciones recursivas en términos que difieren apenas —e inesen-
cialmente— de la definición gödeliana de función recursiva general presen-
tada en la Sección 2.11.1. En este contexto, introduce la noción de conjunto
recursivamente enumerable, que ha llegado a ocupar una posición central en
la teoría de las funciones recursivas (o computables). Hoy día decimos que
un conjunto C ⊆ ˆ es recursivamente enumerable si y sólo si C es el domi-
nio de una función recursiva parcial (en el sentido explicado al final de la p.

10 Recuérdese que {F}(m1,…,mq) es una abreviatura. Por ejemplo, {F}(m1,m2,m3) es pro-


piamente la fbf {{{F}(m1)}(m2)}(m3).
11 La restricción a “enteros positivos” se explicó en la nota 8.
2.11 Funciones computables 372

368). Un conjunto cualquiera es recursivamente enumerable si sus miembros


tienen números de identidad y el conjunto de estos números es recursivamente
enumerable. Estas definiciones son claras y simples, pero no dejan ver in-
mediatamente por qué dichos conjuntos se llaman de ese modo. En el escri-
to de Church, el concepto aparece bajo otra perspectiva. Una secuencia infi-
nita de objetos cualesquiera, a0, a1, a2,… puede verse como una aplicación
con dominio ˆ que asigna a cada número n el n-ésimo término de la se-
cuencia. Supongamos ahora que cada término an tiene un número de identi-
dad #an. Diremos, con Church, que la secuencia a0, a1, a2,… es recursiva
si la función n Å #an es recursiva. El conjunto {x|(∃n ∈ ˆ)(x = an)} es
recursivamente enumerable si la secuencia a0, a1, a2,… es recursiva.12
Obviamente, la función recursiva n Å #an enumera el conjunto descrito. Para
pasar de esta definición a la que formulé primero basta considerar lo siguiente:
(i) si ƒ es una función recursiva total, sus valores, ƒ(0), ƒ(1), ƒ(2),… for-
man una secuencia recursiva, de modo que el alcance de ƒ, esto es, el con-
junto {x|(∃n ∈ ˆ)(x = ƒ(n)} es un conjunto recursivamente enumerable, se-
gún nuestra segunda definición; (ii) si ƒ es una función recursiva total y g es
la función definida en el alcance de ƒ por la condición g(x) = µy(ƒ(y) = x),
e indefinida fuera del alcance de ƒ, se puede probar que g es una función
recursiva parcial; (iii) si g es una función recursiva parcial, se puede probar
que existe una función recursiva total ƒ cuyo alcance es el dominio de g. En
virtud de (ii) y (iii) es claro que un conjunto numérico es el dominio de una
función recursiva parcial si y sólo si es el alcance de una función recursiva
total. Por lo tanto, las dos definiciones de conjunto recursivamente enumera-
ble son equivalentes.
Church enuncia sin demostración una lista de doce teoremas que culmina
con estos dos:13

12 La definición original de Church se aplica sólo a conjuntos de fbfs: “Un conjunto de


fórmulas bien formadas se dice recursivamente enumerable si hay una secuencia
recursiva infinita que consta exclusivamente de fórmulas del conjunto y contiene cada
fórmula del conjunto por lo menos una vez” (1936, p. 96). Pero la generalización que
di arriba es enteramente natural.
13 Church indica que el Teorema XVI fue demostrado por Kleene, e independientemente,
en una forma ligeramente distinta, por Rosser, y que el Teorema XVII fue demostrado
independientemente por Kleene y el propio Church, más o menos al mismo tiempo.
2.11 Funciones computables 373

TEOREMA XVI. Toda función recursiva es λ-definible.


TEOREMA XVII. Toda función λ-definible es recursiva.

Llegado a este punto, Church está listo para dar la definición de calculabili-
dad efectiva anunciada al comienzo.

Ahora definimos la noción, ya comentada, de una función efectivamente


calculable de enteros positivos identificándola con la noción de una fun-
ción recursiva de enteros positivos (o de una función λ-definible de en-
teros positivos). Pensamos que esta definición se justifica por las siguientes
consideraciones, en la medida en que sea posible obtener una justifica-
ción positiva para la elección de una definición formal correspondiente a
una noción intuitiva.
(Church 1936, p. 356)

Junto con anunciar esta definición, Church anotó que ella está respaldada
por el hecho de que los conceptos de función recursiva y de función λ-defi-
nible, de construcción tan diversa, tienen la misma extensión;14 pero aquí
aduce otras razones. Por una parte, recuerda que (como señaló en el pasaje
que cité en la p. 371) cada función λ-definible tiene un algoritmo para cal-
cular sus valores. Por otra parte, arguye que toda función calculable median-
te un algoritmo tiene que ser λ-definible. Por ejemplo, si una función unaria
F es calculable mediante un algoritmo, tiene que haber en alguna notación,
para cada n ∈ ˆ, una serie finita de expresiones en0, en1,…, enr(n), tal que:

(i) dado el número n, en1 sea efectivamente calculable,,


(ii) dados n y las expresiones enh (0 ≤ h < k), enk sea efectivamente cal-
culable (1 ≤ k ≤ r(n)), y
(iii) cuando se ha construido la serie completa de expresiones hasta enr(n),
sea patente que el cálculo ha terminado y cuál es el valor de F(n).

Si asignamos el gödel #[a] a cada expresión a y acordamos que el gödel de


la lista 〈en0, en1,…, enk〉 sea el número 2#[en0] × 3#[en1]×…× pk#[enk], pode-

14 “El hecho de que dos definiciones de calculabilidad efectiva tan distantes entre sí (so
widely different) y, sin embargo, igualmente naturales (en opinión del autor) resulten
equivalentes refuerza las razones aducidas más abajo para creer que ellas caracterizan
dicha noción del modo más general que es compatible con nuestra habitual compren-
sión intuitiva de la misma” (Church 1936, p. 346, n. 3).
2.11 Funciones computables 374

mos definir las funciones binarias G y H como sigue:

G(n,x) = 0, si x es el gödel de 〈en0, en1,…, enr(n)〉;


G(n,x) = #[enk], si k = h+1, h < r(n) y x es el gödel de 〈en0, en1,…, enh〉;
G(n,x) = 1, en cualquier otro caso;
H(n,x) = F(n), si G(n,x) = 0;
H(n,x) = G(n,x), si G(n,x) ≠ 0.

Si G y H son λ-definibles o recursivas, también lo es F. Como señala Church,


no es fácil imaginarse en qué podría consistir la postulada calculabilidad de
las series en0, en1,…, enr(n), para cada n ∈ ˆ, si G y H no son λ-definibles
o recursivas.
Sin embargo, Church no se da por contento con este argumento, y adelan-
ta otro. Nos pide imaginarnos “un sistema particular de logica simbólica”
que contenga un signo = para la igualdad entre números naturales, un signo
{ } ( ) para indicar la aplicación de una función unaria al respectivo argu-
mento y numerales que representen unívocamente a los números naturales.
Los teoremas del sistema comprenden una lista finita o numerable de expre-
siones, los axiomas formales, así como todas las expresiones derivables de
éstas por una serie finita de aplicaciones de operaciones pertenecientes a una
lista finita o numerable de reglas procesales (rules of procedure). “Para que
el sistema sirva a todos los propósitos a que un sistema de lógica simbólica
normalmente se destina es necesario que cada regla procesal sea una opera-
ción efectivamente calculable, que el conjunto completo de las reglas proce-
sales (si es infinito) sea efectivamente enumerable y que la relación entre un
entero positivo y la expresión que lo representa sea efectivamente deter-
minable” (1936, p. 357). Hecha esta observación, Church nos invita a supo-
ner que ella significa que, en términos de una asignación de gödels a las
expresiones de la lógica, cada regla procesal es una operación recursiva, el
conjunto de tales reglas es recursivamente enumerable,15 el conjunto de los
axiomas formales es recursivamente enumerable y la función que asigna a
cada número el gödel del numeral respectivo es recursiva. Digamos con

15 ”En el sentido de que existe una función recursiva Φ tal que Φ(n,x) es [el gödel] del
resultado de aplicar la n-ésima regla procesal al conjunto ordenado finito de fórmulas
[cuyo gödel] es x” (Church 1936, p. 357).
2.11 Funciones computables 375

Church que una función unaria16 F es calculable en la lógica (within the


logic) si hay en la lógica una expresión f tal que {f}(µ) = ν es un teorema
si y sólo si F(m) = n y µ y ν son los numerales que corresponden a m y n,
respectivamente. Como el conjunto completo de los teoremas es recursi-
vamente enumerable, no cuesta nada probar que toda función unaria calcula-
ble en la lógica es recursiva (o λ-definible).

Se ha mostrado así que no es posible obtener una definición de calcula-


bilidad efectiva más general que la arriba propuesta por ninguna de las
dos vías que se ofrecen naturalmente, a saber, (1) definir una función como
efectivamente calculable si hay un algoritmo para calcular sus valores y
(2) definir una función F (de un entero positivo) como efectivamente cal-
culable si, para cada entero positivo m hay un entero positivo n tal que
F(m) = n es un teorema demostrable.
(Church 1936, p. 358)

Con estas palabras termina la presentación original de la llamada Tesis de


Church. Me ha parecido oportuno repetir sus pormenores para que el lector
se forme un juicio propio al respecto. Describirla como “definición” favore-
ce un equívoco. En rigor, si la expresión ‘efectivamente calculable’ en ade-
lante va a significar por convención lingüística lo mismo que ‘recursiva’ o
‘λ-definible’, no puede conservar su significado corriente, establecido mu-
cho antes de que estos dos términos técnicos hicieran su aparición.17 Gracias
a que en castellano tenemos los dos sinónimos, ‘computable’ y ‘calculable’,
he podido evitar ese equívoco, reservando ‘computable’ para los conceptos
precisos —y equivalentes— introducidos en los años 30, y dejándole a ‘calcu-
lable’ su sentido habitual. Con esta terminología, los argumentos de Church
pueden describirse así: se proponen dos análisis de lo que constituye un pro-
cedimiento de cálculo, basados, respectivamente, en el modo corriente de

16 Como dice Church con toda razón, la ampliación de este concepto a funciones n-arias
“es inmediata”.
17 No cabe alegar que como la extensión de ese significado corriente es “vaga”, el mate-
mático puede libremente deslindarla como le parezca oportuno. Si antes de 1928 al-
guien hubiera pretendido definir la expresión ‘efectivamente calculable’ identificándola
con ‘pr-recursiva’, el descubrimiento de la función de Ackermann habría puesto en
evidencia que esa definición no sirve. La ausencia de criterios precisos, enunciables de
una vez por todas, para aplicar un concepto corriente (“intuitivo”) no significa que no
sepamos reconocer cuando se lo usa bien o mal.
2.11 Funciones computables 376

ejecución de algoritmos “con papel y lápiz” y en el “cálculo lógico” à la


Frege-Russell; en ambos casos, la equivalencia calculable ⇔ computable se
deduce del análisis, pero sólo después que cada uno de los pasos simples
que, a la luz de ese análisis, constituyen el cálculo ha sido identificado con
una operación de cómputo (recursiva o λ-definible). La equivalencia global
de calculabilidad y computabilidad se deduce, pues, de su identidad postula-
da a nivel local. Por esto, el argumento no es propiamente circular, puesto
que avanza de lo simple a lo compuesto, de los elementos al todo. Pero re-
quiere que adoptemos como premisa, con respecto a los elementos de un
procedimiento de cálculo, la identidad que se busca establecer como conclu-
sión con respecto al procedimiento entero. En todo caso, gracias a los aná-
lisis de Church ha quedado muy claro que para convencernos de la falsedad
de su Tesis habría que producir un algoritmo “de papel y lápiz” en que el
tránsito de una línea a la próxima no pueda representarse mediante una fun-
ción recursiva, o un cálculo lógico efectivo que admita una regla de infe-
rencia no recursiva o tenga un conjunto de axiomas o de reglas de inferen-
cia no recursivamente enumerable. Como en más de medio siglo nadie ha
inventado un algoritmo o un cálculo lógico así, es razonable creer que no
hay ejemplos contrarios a la Tesis de Church. Por otra parte, la misma índo-
le del concepto corriente de calculabilidad no permite enunciar condiciones
necesarias y suficientes para su aplicación; al darlas uno justamente deja atrás
el concepto corriente —“natural” o, si se quiere, “histórico”— y lo reempla-
za con uno artificial. Pero eso mismo impide ofrecer una demostración ma-
temática de que el concepto corriente de función calculable coincide en ex-
tensión con el concepto artificial de función computable (recursiva, λ-defini-
ble). Por eso, no parece justo describir la Tesis de Church como una conje-
tura matemática que aguarda ser demostrada (comparable, digamos, a la con-
jetura de Legendre de que π es un número transcendental, antes de que fue-
ra demostrada por Lindemann). La veo más bien como una decisión de aceptar
la computabilidad como criterio de calculabilidad hasta que un contraejemplo
fuerce a pensar de otro modo. Como todo el enorme incremento reciente de
la capacidad humana de calcular (en el sentido ordinario) depende de la exis-
tencia de máquinas expresamente diseñadas para computar (en nuestro sen-
tido técnico), no es verosímil que esa decisión vaya a revocarse.18

18 Basándose en el análisis de la idea general de computación por Turing (vide infra,


2.11 Funciones computables 377

La lista de teoremas que desemboca en la equivalencia entre funciones λ-


definibles y recursivas también incluye los siguientes: VII. El conjunto de
las fbfs es recursivamente enumerable. XI. La relación de convertibilidad
inmediata entre fbfs es recursiva. XII. Es posible asociar a cada fbf F una
enumeración G0, G1, G2,… de todas las formulas que cumplen la condi-
ción F conv Gk (k ∈ ˆ), de tal modo que la función binaria 〈#[F],k〉 Å
#[Gk] sea una función recursiva. XIII. La propiedad de una fbf de estar en
forma normal principal es recursiva. XIV. El conjunto de las fbfs que están
en forma normal principal es recursivamente enumerable. XV. El conjunto
de las fbfs que tienen una forma normal es recursivamente enumerable.
Algunos de estos teoremas se emplean en la demostración del siguiente re-
sultado, que a su vez es la base de la demostración del Teorema de Church,

Sección 2.11.2) y la demostrada equivalencia de ‘función recursiva’ y ‘función compu-


table según Turing’, Mendelson 1990 arguye que la Tesis de Church no es menos cier-
ta que otras proposiciones básicas de la matemática que nadie sueña con llamar ‘tesis’.
Cita cuatro paralelos: (1) la definición habitual de ‘función’ (lo que en este libro lla-
mamos ‘aplicación’) como una relación binaria R tal que ∀x∀y∀z(Rxy ∧ Rxz → y =
z); (2) la definición de ‘verdad’ propuesta por Tarski (vide infra, Capítulo 3.1); (3) la
definición de ‘validez lógica’ en la teoría de modelos (también tratada en nuestro Ca-
pítulo 3.1), y (4) la definición de ‘límite’ por Weierstraß. Ninguno de estos paralelos
me parece convincente. (1) El citado concepto de ‘función’ amplía resueltamente el
concepto matemático que era corriente siglo XVIII, pero no cabe duda de que lo inclu-
ye; en cambio, quienes llaman ‘tesis’ a la definición de Church dirían que no sabemos
con seguridad que todas las funciones que son calculables en la acepción corriente son
λ-definibles o recursivas. (2) La definición de ‘verdad’ de Tarski se refiere a una pro-
piedad de las fórmulas de un sistema formal y sólo una persona ignorante o muy
irreflexiva puede entenderla como un intento de definir “rigurosamente” el concepto
ordinario de verdad. (3) La definición modelista de ‘validez lógica’ se halla en el mis-
mo caso, pero, claro está, no hay un concepto corriente con el que éste pudiera con-
fundirse (o identificarse); por otra parte, contra lo que sugiere Mendelson, no goza de
aceptación incuestionada entre los cultivadores de la lógica (cf. Etchemendy 1990). (4)
Me parece que la existencia de alternativas al análisis clásico (Weyl 1918; Brouwer
1918, 1919, 1923; Lorenzen 1965; Bishop 1967; cf. asimismo Robinson 1961, 1966) y
las sucesivas generalizaciones y redefiniciones del concepto de convergencia dentro de
la misma tradición clásica (Moore y Smith 1922, H. Cartan 1937, Weil 1937) indican
que el concepto de límite de Weierstraß no tiene el carácter definitivo que le atribuye
Mendelson, aunque todavía se enseñe a los principiantes (con toda razón, como se les
enseña la noción newtoniana de fuerza, igual a la masa invariable multiplicada por la
aceleración absoluta).
2.11 Funciones computables 378

que da una solución (negativa) al Entscheidungsproblem del cálculo predica-


tivo de primer orden:

TEOREMA XIX. No existe una función recursiva binaria ƒ tal que (i) ƒ(x,y)
= 0 si x = #[X], y = #[Y] y X e Y son fbfs tales que X
conv Y, y (ii) ƒ(x,y) = 1 en cualquier otro caso.

Church demuestra que el problema de hallar una función recursiva binaria ƒ


que cumpla las condiciones (i) y (ii) del Teorema XIX equivale al problema
de hallar una función recursiva unaria g tal que g(z) = 0 si z = #[Z] y Z es
una fbf que tiene una forma normal, y g(z) = 1 en cualquier otro caso. En
vista de esto, el Teorema XIX es un simple corolario del siguiente

TEOREMA XVIII. No existe una función recursiva unaria g tal que (i) g(x)
= 0 si x = #[X] y X es una fbf que tiene una forma nor-
mal, y (ii) ƒ(x) = 1 en cualquier otro caso.

De este modo, el Teorema XVIII viene a ser la pieza clave en la solución


del Entscheidungsproblem.19 No voy a dar aquí una demostración detallada
de este teorema, pero parafrasearé la explicación sumaria que Church mis-
mo da para aclarar la suya. Supongamos que el Teorema XVIII es falso, y
que existe la función recursiva g descrita en su enunciado. Sea R una fbf
cualquiera. Si g(R) = 0, R tiene formas normales, una de las cuales es su
forma normal principal R*. Según el Teorema XII, hay una enumeración de
todas las fbfs en las que R es convertible. Recorriéndola se encuentra, tarde
o temprano, la forma normal principal R*. R es convertible en un numeral si
y sólo si R* es un numeral (por cuanto (a) la forma normal principal de R
es única y (b) cada numeral está en forma normal principal). Por lo tanto, si
el Teorema XVIII es falso, es posible determinar mediante un procedimiento
de cómputo si una fbf cualquiera es o no convertible en un numeral. Según
el Teorema XV, hay una enumeración efectiva A0, A1, A2,… de todas las
fbfs que tienen una forma normal. Sea n el numeral correspondiente al nú-
mero n. Definimos la función unaria E por la doble condición: (i) E(n) = 0

19 Con certero sentido de la jerarquía, Kleene (1967, pp. 242, 246, 282) usa la expresión
‘Church’s Theorem’ —‘el Teorema de Church’— para referirse al Teorema XVIII. Pero
esa no es la nomenclatura habitual.
2.11 Funciones computables 379

si {An}(n) no es convertible en un numeral y (ii) E(n) = m+1 si {An}(n) conv


m y m es el numeral correspondiente a m. La función E es computable y,
por ende, λ-definible mediante una fórmula que Church llama e. La demostra-
ción rigurosa del Teorema XVIII culmina, precisamente, con la construcción
de esta formula e y la prueba de que, si n es un numeral, {e}(n) es converti-
ble en un numeral (Church 1936, p. 361). Siendo así parte de fbfs que tie-
nen una forma normal, e tiene también ella misma una forma normal. Ahora
bien, todas las fbfs que tienen una forma normal figuran en la lista A0, A1,
A2,…, pero e no puede ser una de las fórmulas de esta lista, puesto que,
según la definición de E, es imposible, para cada n ∈ ˆ, que {An}(n) sea
convertible en el numeral en que {e}(n) es convertible.20 La suposición de
que el Teorema XVIII es falso lleva así a una contradicción.
El Teorema XVIII exhibe un ejemplo de función numérica no recursiva:
la función g definida en su enunciado. Como el conjunto de las fbfs que
tienen una forma normal es recursivamente enumerable (por el Teorema XV),
el conjunto de las fbfs que no tienen una forma tal no puede serlo.21 El
conjunto de los gödel de este conjunto es, pues, un ejemplo de conjunto

20 Si {e}(n) es convertible en el numeral correspondiente a 0, {An}(n) no es convertible


en un numeral; si {An}(n) es convertible en un numeral m, {e}(n) es convertible en el
numeral siguiente a m y, por lo tanto, no es convertible en m (si una fbf es convertible
en un numeral, ese numeral es único, puesto que cada fbf tiene a lo sumo una forma
normal principal y todo numeral es una forma normal principal). Como puede advertirse,
el paso central de la prueba del Teorema XVIII reproduce el patrón clásico del argu-
mento diagonal. Específicamente, la función E se ha definido deliberadamente de tal
modo que ninguna fbf An —perteneciente a la lista A0, A1, A2,…— antepuesta al
numeral n —correspondiente a su posición en la lista— sea convertible en el mismo
numeral en que es convertible la fbf {e}(n), donde e es la fbf que representa a E en el
cálculo λ. Esta discrepancia garantiza que e ≠ An, para cada n ∈ ˆ.
21 Sea φ la función recursiva que enumera las fbfs que tienen una forma normal. Si hu-
biera una función recursiva ψ que enumerase las fbfs que no tienen una forma normal,
entonces mediante el examen de la secuencia φ(0), ψ(0), φ(1), ψ(1), φ(2), ψ(2),…
podríamos decidir en un número finito de pasos si una dada fbf A tiene o no una forma
normal. En efecto, A sería igual, digamos, al r-ésimo término de esa secuencia. Si r =
2n, A = φ(n) y por lo tanto tiene una forma normal; si r = 2n+1, A = ψ(n) y por lo
tanto no tiene una forma normal. De esto se infiere, por la Tesis de Church, que la
función característica de la clase de fbfs que tienen una forma normal es recursiva. De
hecho, construir una definición rigurosa de tal función recursiva, dadas φ y ψ, deman-
daría sólo un pequeño esfuerzo adicional. Pero su existencia contradiría al Teorema
XVIII. Por lo tanto, no puede existir la función recursiva ψ.
2.11 Funciones computables 380

numérico no recursivamente enumerable. El Teorema XVIII implica además,


como ya dije, el Teorema XIX. De éste Church infiere sin dificultad que “el
Entscheidungsproblem es insoluble en el caso de cualquier sistema de lógica
simbólica que sea ω-consistente […] y lo bastante poderoso como para
admitir ciertos métodos de definición y prueba comparativamente simples”
(1936, p. 363). Señala que en un sistema de esta clase se podrá expresar el
aserto de que los números a y b son los gödel de fórmulas A y B tales que
A es inmediatamente convertible en B. Como una conversión es una secuen-
cia finita de fórmulas cada una de las cuales es inmediatamente convertible
en la siguiente (si la hay), también cabe expresar en tal sistema —mediante
una fórmula que llamaremos Ψ(a,b)— el aserto de que a y b son los gödel
de fórmulas A y B tales que A conv B. Además, si A conv B y a = #[A] y b
= #[B], la fórmula Ψ(a,b) será deducible en el sistema mediante una prueba
consistente en una cierta secuencia finita de conversiones inmediatas que lleva
del numeral correspondiente a a al numeral correspondiente a b. Y si A no
es convertible en B, la ω-consistencia del sistema implica que Ψ(a,b) no es
deducible. Ahora bien, si el Entscheidungsproblem del sistema admitiera una
solución positiva, habría un algoritmo para determinar si Ψ(a,b) es o no
deducible. Ese algoritmo permitiría entonces determinar, para cualquier par
de fórmulas A y B, si A es o no convertible en B. En otras palabras, dicho
algoritmo permitiría calcular la función ƒ descrita en el enunciado del Teo-
rema XIX. Pero ƒ no es recursiva y, por lo tanto, según la Tesis de Church,
no puede calcularse mediante un algoritmo.
Aunque el razonamiento anterior emplea una terminología apropiada para
hablar del cálculo λ de Church, puede fácilmente adaptarse a cualquier cál-
culo lógico de cierta clase muy amplia. Al final de su artículo, Church ob-
serva que “en particular, si el sistema de Principia Mathematica es ω-con-
sistente, su Entscheidungsproblem es insoluble” (1936, p. 363); pero no en-
tra en detalles. En su “Nota sobre el Entscheidungsproblem”, publicada el
mismo año, Church aplica el Teorema XIX específicamente al cálculo predi-
cativo de primer orden de Hilbert y Ackermann (1928), concluyendo que “el
caso general del Entscheidungsproblem [de dicho cálculo] es insoluble”
(1936a, en Davis 1965, p. 114). En el Capítulo 2.7 consideramos dos formas
del Entscheidungsproblem, según que el procedimiento algorítmico en cues-
tión concierna la deducibilidad o la validez de las fórmulas de un cálculo
lógico. Como se recordará, distinguíamos entre d-decisión y v-decisión. En
2.11 Funciones computables 381

el caso del referido cálculo de Hilbert y Ackermann, los dos problemas co-
inciden puesto que —en virtud del Teorema de Completud de Gödel (Capí-
tulo 2.8)— una fórmula de ese cálculo es válida si y sólo si es deducible. A
este respecto, Church hace una observación importante. Él ha demostrado
constructivamente que no hay un algoritmo de d-decisión para dicho cálcu-
lo: no puede existir una función recursiva que asigne el valor 0 al gödel de
cada fórmula deducible y el valor 1 al gödel de cada fórmula no deducible.
Por lo tanto, en virtud del Teorema de Completud, tampoco hay un algorit-
mo de v-decisión. Pero la demostración del Teorema de Completud no es
constructiva, de modo que la insolubilidad del problema de la v-decisión no
se ha establecido constructivamente. Por esta razón, Church concluye que
“la insolubilidad de esta segunda forma del Entscheidungsproblem del [cál-
culo predicativo de primer orden de Hilbert y Ackermann] no puede consi-
derarse incuestionablemente establecida” (1936a, en Davis 1965, p. 115).

2.11.3 Las máquinas de Turing

El artículo de Alan Turing, “Sobre números computables, con una aplica-


ción al Entscheidungsproblem” (1936), aborda el tema del cálculo efectivo
desde un nuevo punto de vista, que lleva a una definición inesperadamente
simple de función computable, equivalente a las que hemos considerado hasta
aquí. Una definición esencialmente idéntica a la de Turing fue propuesta
independientemente por Emil Post (1936).22 Por su sencillez, esta definición
de computabilidad es la preferida por los autores de obras didácticas. Aquí
la utilizaré para demostrar, finalmente, el Teorema de Church (en la Sección
2.11.5). Para mayor claridad, basaré el razonamiento en una variante de la
definición original de Turing. Pero antes voy a presentarla en los términos

22 El artículo —muy conciso— de Post apareció un poco antes que el de Turing, con una
nota que reconoce la prioridad temporal de éste y aclara que los autores trabajaron con
total independencia. Ambos, por cierto, conocían la labor de Gödel y Church. En el
trabajo de Post falta completamente la idea de una máquina computadora. Lo que Turing
(1936) llama la configuración interna de la máquina —“el programa”, como decimos
hoy— Post (1936) lo presenta como instrucciones que ha de seguir un calculista (hu-
mano).
2.11 Funciones computables 382

empleados por él en 1936.


Turing, como Church, usa el mismo vocablo para referirse a la noción
corriente que le interesa deslindar con precisión y a la noción precisa defini-
da por él. Pero en vez de ‘calculable’ —como decía Church— Turing dice
‘computable’.23 Ocasionalmente encierra esta palabra entre comillas, para
indicar que se refiere a la noción precisa. Por mi parte, seguiré usando ‘cal-
culable’ para la noción corriente y ‘computable’ para la noción técnica. Diré
‘T-computable’ cuando sea necesario distinguir el concepto de Turing (o sus
variantes) de otras nociones equivalentes, como ‘recursiva general’ o ‘λ-de-
finible’.
El artículo de Turing se refiere expresamente a los números computables,
esto es, “los números reales cuya expresión digital es calculable con medios
finitos”.24 Pero, como Turing se apresura a señalar, su tratamiento se puede
adaptar sin dificultad a “las funciones computables de una variable entera, o
de una variable real o computable, los predicados computables, etc.” (1936,
p. 230). Con la variante arriba aludida aplicaré la noción de ‘T-computable’
a las funciones numéricas (aplicaciones de D ⊆ ˆr en ˆ) de que tratan las
dos subsecciones precedentes (las cuales, por lo demás —como señalé al
comienzo de el Capítulo 2.11— entran en el cálculo de cualquier “número
computable”). Pero primero atendamos a la noción original.
Números computables, en el sentido descrito, son precisamente los que
calculaban los calculistas (computers, en inglés), esos abnegados trabajado-
res que, antes del advenimiento de la computadora electrónica, aplicaban “a
mano” los algoritmos apropiados para construir tablas de logaritmos, senos,
cosenos, etc., evaluar integrales, sumar series, al servicio de la ciencia y la

23 Reserva ‘calculable’ —más precisamente, ‘effectively calculable’— para referirse al


concepto de Church. Turing 1936 muestra en un apéndice que el concepto de Church
tiene la misma extensión que el concepto de computabilidad definido por él.
24 Donde pongo “expresión digital”, Turing escribe “decimal expression”, pero lo que
quiere decir con eso es ‘expresión mediante dígitos de un sistema numérico cualquiera
(fijo)’. Como veremos, sus “máquinas” —prefigurando la computadora electrónica—
emplean el sistema binario. A propósito de ellas, Turing habla de “binary decimals”.
Ello tal vez no molesta en una lengua en que el nombre del 10 no proviene del latín
decem; pero a nosotros un ‘decimal binario’ nos suena disparatado y preferimos hablar
de ‘dígitos binarios’.
2.11 Funciones computables 383

ingeniería. Turing busca una definición precisa del término ‘calculable con
medios finitos’. Para eso, describe una clase de máquinas ideales concebidas
—según él— de modo que simulen perfectamente las operaciones de un
calculista. Llamaré máquina de Turing a cualquier objeto de esta clase. Un
número real es “computable” si hay una máquina de Turing que lo computa.
Después de explicar como operan sus máquinas, Turing introduce la idea que
inspirará la invención de la computadora moderna: la máquina de Turing
universal U, que computa el número computado por cualquier máquina de
Turing M cuando el número de identidad de M se registra como dato inicial
en la memoria de U. Siguiendo a Turing, daré primero la descripción gene-
ral de una MT, luego ciertos resultados importantes de su trabajo, y por úl-
timo repetiré el argumento en que basa su afirmación de que todo lo que
pueda calcular un calculista es computable por una máquina de Turing.
Una máquina de Turing M se caracteriza, ante todo, por una lista finita
q0,…, qm de estados (Turing dice “M-configurations”) en que M puede
encontrarse y un alfabeto finito S0,…, Sn de signos (“symbols”) que M
puede reconocer e imprimir. Uno de éstos, digamos S0, es sólo un espacio
en blanco. M lee y escribe en una cinta de papel cuadriculado
. Entendemos que la cinta tiene una orientación; evocando nuestros propios
hábitos de lectura y escritura, diré que M ‘avanza’ hacia la ‘derecha’ y ‘re-
trocede’ hacia la ‘izquierda’. En un dado momento, cada cuadrado de la cin-
ta contiene un solo signo (posiblemente, el blanco S0). Suponemos que la
cinta es infinita o, al menos, que le “crece” un cuadrado adicional en blanco
apenas M llega a leer uno de sus extremos (éste es el único rasgo ideal de
las máquinas de Turing, inimitable por calculistas y computadoras). Supone-
mos además que en el momento inicial hay a lo sumo un número finito de
cuadrados que “no están en blanco”, esto es, que contienen un signo dife-
rente de S0, (este supuesto mitiga lo irrealista del anterior). En cada momento,
M está en uno de sus estados, leyendo un cuadrado de la cinta. Ese estado
y el signo que hay en ese cuadrado determinan la próxima acción de M, la
cual consiste en ejecutar una de cada una de las tres alternativas siguientes:
(i) escribir uno de los signos S0,…, Sn en sustitución del signo que lee, (ii)
avanzar un cuadrado (llamemos a esto, A), retroceder un cuadrado (R) o
permanecer detenida leyendo el mismo cuadrado (D) y (iii) pasar a uno de
2.11 Funciones computables 384

los estados q0,…, qm.25 El funcionamiento de M queda, pues, completa-


mente caracterizado por una lista finita de quíntuplos 〈qh,Sv,Sw,C,qk〉, tales
que 1 ≤ h,k ≤ m, 1 ≤ v,w ≤ n, C es uno de los tres caracteres A, R, D, y no
hay dos quíntuplos que comiencen con el mismo par 〈qh,Sv〉.26 El quíntuplo
〈qh,Sv,Sw,C,qk〉 indica lo que M hace si lee el signo Sv cuando se encuentra
en el estado qh: (i) reemplaza Sv por Sw, (ii) efectúa la operación representa-
da por C y (iii) pasa al estado qk. Diré que la lista de quíntuplos caracterís-
tica de M es el programa de M (Turing lo llama “la configuración comple-
ta” de M, pero me parece que el término que he elegido no sólo es más
breve, sino también, hoy por hoy, más expresivo). Para mayor precisión,
supongo que el programa de una máquina de Turing está siempre ordenado
alfabéticamente (〈qh,Sv,Sw,C,qk〉 precede a 〈qf,Su,Sw,C,qk〉 si h < f, o si h = f y
v < u).27
Turing propone un método sencillísimo para darle un número de identi-
dad —un gödel— a cada máquina de Turing M. Si escribimos los subíndices
numéricos de sus estados y signos como listas de palotes (|), separamos con
punto y coma (;) los quíntuplos que forman el programa de M y eliminamos

25 Obsérvese que la alternativa (i) incluye la posibilidad de dejar intacto el signo leído,
puesto que es uno de los signos permitidos como sustituto. La alternativa (iii) incluye
la posibilidad de seguir en el mismo estado.
26 En otras palabras, el programa de M es el grafo de una aplicación cuyo dominio está
incluido en {0,…, m} × {0,…, n} y cuyo alcance está incluido en
{0,…, n} × {A, R, Q} × {0,…, m}.
27 La máquina M descrita es lo que Turing (1936, p. 232) llama una máquina automática
o a-máquina, porque su funcionamiento está completamente determinado por el pro-
grama. Menciona además lo que llama una “máquina a elección” (choice machine) y
que hoy llamamos una máquina de Turing con oráculo (MTO), cuyo funcionamiento
no está completamente determinado por el programa. Éste indica que cuando la máqui-
na está en ciertos estados leyendo ciertos signos hay que consultar una fuente externa
u “oráculo”—un operador humano, una tabla de números aleatorios, una ruleta, etc.—
para determinar lo que la máquina ha de hacer en esa situación. Así, si M0 es una
MTO, el programa de M0 consta en parte de quíntuplos como los arriba descritos, en
parte de triples de la forma 〈qh,Sv,?〉 donde el signo de interrogación indica que hay
que consultar el oráculo. La respuesta de éste tiene que ser un triple de la forma
〈Sw,C,qk〉, pero no está predeterminado cuál será ese triple en cada caso. (Evidentemen-
te, el programa de M0 puede fijar distintas listas finitas de respuestas posibles en las
diversas situaciones en que prevé una consulta al oráculo; también puede contemplar
varios oráculos, de modo que la respuesta de uno remita a veces a otro).
2.11 Funciones computables 385

los paréntesis angulares y las comas, podemos representar ese programa


inequívocamente mediante un número construido así: ponemos 1 en vez de
un palote, 2 en vez de S, 3 en vez de q, 4 en vez de A, 5 en vez de R, 6 en
vez de D y 7 en vez de punto y coma. Por ejemplo, si M1 es una máquina
de Turing con cinco estados y un alfabeto de dos signos cuyo programa,
escrito en la forma acordada, es
‘q S| S D q|; q| S S A q||; q|| S S| D q||||; q|| S| S D q|||; q||| S S A q|’,
su gödel #[M1] es el número28
321.263.173.122.431.173.112.216.311.117.311.212.631.117.311.122.431.
La descripción anterior es bastante general y se aplica lo mismo a las
máquinas de Turing que evalúan números computables, en el sentido de
Turing, que a las que computan el número natural que una determinada fun-
ción recursiva asigna a cada r-tuplo de números naturales, etc. Basaré en
ella la definición variante anunciada arriba. Pero antes de proponerla, com-
pletemos la descripción original de una máquina de Turing capaz de compu-
tar la expresión digital de un número real o MTR (como diré para abreviar).
Si se adopta, con Turing, el sistema numérico binario, una MTR requiere un
alfabeto de sólo dos dígitos, 0 y 1, además del blanco S0. Pero la programa-
ción se facilita si hay también signos auxiliares, que puedan usarse para “llevar
cuentas” durante la computación (por ejemplo, para marcar el punto de la
cinta en que la máquina debe interrumpir su avance y empezar a retroceder).
Turing (1936, p. 118) asigna a sus MTRs un alfabeto con dos clases de sig-
nos, aparte del blanco: los dígitos 0 y 1, y signos auxiliares “de segunda
clase”. Sea, pues, M una MTR con un alfabeto así. He aquí como Turing
concibe su funcionamiento: M empezará a operar en cierto estado q0 leyen-

28 El lector puede entretenerse en comprobar que M1 hace lo siguiente cuando trabaja


con una cinta vacía u ocupada sólo por una fila consecutiva y finita de palotes. Si M1
empieza a funcionar en el estado q0 leyendo el primer palote de la fila, o un blanco
cualquiera si la cinta está vacía, entonces, la cinta cesa de funcionar (i) leyendo un
blanco en una cinta vacía si el número inicial de palotes era par y (ii) leyendo el único
palote de una cinta por lo demás vacía si el número inicial de palotes era impar. Si
entendemos que una fila de n palotes consecutivos (n ≥ 0) representa al número natu-
ral n, es claro que M1 computa la función característica de la clase de los impares (si
esta función se define como en la p. 43; si la función característica se define —como
en la p. 333— a la manera de Gödel, M1 computa la de los pares).
2.11 Funciones computables 386

do un cuadrado cualquiera de una cinta enteramente en blanco; siguiendo


las instrucciones de su programa, imprimirá dígitos y signos auxiliares en la
cinta. Aunque Turing no lo dice, vamos a suponer que M nunca imprime un
dígito en un cuadrado a la izquierda del cuadrado inicial. Bajo este supues-
to, es claro que, si se ignoran los cuadrados en blanco u ocupados por sig-
nos que no son dígitos, los dígitos impresos por M forman una secuencia
(finita o indefinidamente creciente). Turing la llama “la secuencia computa-
da por la máquina”. Si la secuencia computada por M es finita, diremos con
Turing que M es una MTR circular. Obviamente, M es circular si y sólo si
hay un momento a partir del cual se estaciona para siempre en un cuadrado
o se sigue moviendo pero deja de escribir dígitos. Si M no es circular, la
secuencia (infinita) computada por ella es la mantisa —expresada en el sis-
tema binario— de un número real α en el intervalo [0,1].29 Turing llama a α
“el número computado por M”. Turing proclama que “un número es compu-
table si la diferencia entre él y el número computado por una máquina no
circular es un entero” (1936, p. 233).30 Si ‘computable’ significa aquí calcu-
lable (en el sentido corriente), esta declaración enuncia una “Tesis de Turing”
homóloga a la Tesis de Church.
Este concepto de circularidad entra en la demostración original de que hay
una máquina de Turing universal, que Turing caracteriza como una MTR
que, aplicada a una cinta que contiene el gödel de cualquier MTR no circu-
lar, computa la secuencia computada por ésta. También determina la formula-
ción —y demostración— del resultado más importante de Turing 1936. Tal
como allí se presenta, éste se refiere al “problema de la circularidad”, que
puede enunciarse así: determinar mediante un algoritmo si una MTR cuyo
programa se conoce es o no circular. Turing demuestra que no puede existir
una máquina de Turing que compute la función característica de la clase de
las MTRs no circulares. Combinado con la tesis de que todo lo que es calcu-
lable es T-computable, este resultado da una solución negativa al problema

29 Recuérdese que la mantisa de un número real es la parte de su expresión digital que se


escribe a la derecha de la coma (del punto en el sistema anglosajón utilizado por Turing).
30 Si hay una MTR que computa cierto número real α ∈ [0,1], no cuesta nada programar
una MTR circular que escriba la parte entera de un número real β tal que |α - β| ∈ ˆ,
y una tercera MTR (cuyo alfabeto incluya, posiblemente, la coma y el signo menos)
que combine el producto de las dos anteriores.
2.11 Funciones computables 387

de la circularidad. Como las MTRs nos interesan aquí muchísimo menos que
las máquinas de Turing que computan funciones numéricas, es preferible
estudiar la idea de la máquina de Turing universal en relación con éstas, así
como el problema homólogo al de la circularidad que se plantea con respec-
to a ellas: determinar mediante un algoritmo si una máquina de Turing cuyo
programa se conoce computa o no una función numérica. Este problema se
llama habitualmente “el problema de la detención” (the halting problem)
porque se lo puede formular asi: si x es un número ¿es x el gödel de una
máquina de Turing que, aplicada a cualquier dato numérico de cierto tipo
(que represente un r-tuplo para algún r fijo), acaba deteniéndose ante un
resultado numérico en la posición prescrita para recibirlo? En caso afirmativo,
la máquina de Turing †[x] computa la función que asigna ese resultado al
dato en cuestión. En caso negativo, esto es, si †[x] no se detiene nunca o se
detiene en una posición distinta de la prescrita para recibir un resultado, obvia-
mente †[x] no computa una función numérica. (Doy una explicación más
exacta del “problema de la detención” en la Sección 2.11.5).
A continuación doy una descripción canónica de las máquinas de Turing
que computan funciones numéricas. Usaré la abreviatura MT para designar
a las máquinas de Turing que obedecen a esta descripción. En primer lugar,
estipularemos que todas las MT tienen un mismo alfabeto y siguen un pro-
cedimiento convencional uniforme para la recepción de datos y entrega de
resultados. El alfabeto consta solamente de dos signos: S0, el blanco, que
llamaré B, y S1, el palote |. (Para un trabajo práctico de programación sería
cómodo disponer además de unos pocos signos auxiliares, pero su adopción
no expande el reino de las funciones computables). Una fila de palotes,
impresos en cuadrados consecutivos de la cinta, precedida y seguida de un
blanco, representa un número natural determinado. Como, según la con-
vención seguida generalmente en este libro, el primer número natural es 0,
representamos el número n con una fila de n + 1 palotes. Representamos el
r-tuplo 〈n1,…,nr〉 mediante r filas de n1+1,…, nr+1 palotes, respectiva-
mente, con un solo blanco entre cada dos filas consecutivas. Para mayor
brevedad, llamaré *número a la representación de un número mediante una
fila de palotes, *r-tuplo a la representación de un r-tuplo de números me-
diante una fila de r filas de palotes. Digo que una MT se aplica a un *nú-
mero cuando lee su primer palote, y que se aplica a un *r-tuplo cuando se
aplica a su primer *número. Digo que un blanco cierra un *número o un *r-
2.11 Funciones computables 388

tuplo cuando sigue inmediatamente a su último palote y que lo abre cuando


precede inmediatamente a su primer palote. Gracias a la sencillez del alfabe-
to, podemos simplificar los programas. Arriba postulamos que una máquina
de Turing reacciona en un cierto estado ante un signo dado con tres opera-
ciones: (i) reemplazar el signo leído con un signo dado (posiblemente el
mismo), (ii) permanecer ante el mismo cuadrado o avanzar o retroceder a un
cuadrado adyacente, (iii) adoptar cierto estado (posiblemente el mismo). Ahora
supondremos que la reacción de una máquina capaz de m estados diferentes
consiste en ejecutar una de cada una de las dos alternativas siguientes: (i)
reemplazar el signo leído con B o con |, o avanzar un cuadrado (A), o retro-
ceder un cuadrado (R);31 (ii) adoptar el estado qk (0 ≤ k < m). El programa
está dado entonces por una lista de cuádruplos de la forma 〈qh,Sv,C,qk〉, don-
de 1 ≤ h,k < m, v ∈ {0,1}, C es uno de los cuatro caracteres B, |, A, R, y no
hay dos cuádruplos que comiencen con el mismo par 〈qh,Sv〉.32 Supondremos
que una MT dada siempre empieza a operar en cierto estado, el estado ini-
cial de esa MT, que siempre llamaré q0. Obviamente, MT sólo llega a de-
tenerse si su lista de estados incluye por lo menos un estado final, esto es,
un estado que figura en cuarto lugar en uno o más cuádruplos del programa
(y así hay operaciones que conducen a él), pero no figura en primer lugar en
ningún cuádruplo del programa (y, por ende, no es el punto de partida de
ninguna operación). Finalmente, supondremos que una MT nunca retrocede
más de dos cuadrados a la izquierda de su posición inicial.
Sea M una MT. Diremos que M computa la función r-aria ƒ:ˆr Æ ˆ si
su programa determina el siguiente comportamiento: cuando M se aplica en

31 Nota sobre la notación. Hablando de máquinas de Turing, uso en adelante varias for-
mas de las letras a y r (mayúscula, minúscula, cursiva, recta, helvética, griega, gótica)
para referirme a objetos u operaciones relacionados, respectivamente, con las dos di-
recciones de la cinta: avance (hacia la derecha) y retroceso (hacia la izquierda). En
inglés y alemán, usan la r (de right, Rechte = derecha) en lugar de nuestra a, la l (de
left, Linke = izquierda) en vez de nuestra r. No quise usar el par de letras d e i, porque
la i minúscula tradicionalmente denota un índice y la mayúscula se parece demasiado
al 1 y al palote |.
32 Al asignar un gödel a uno de estos programas, hay que distinguir el palote que es un
signo del alfabeto, del palote que utilizamos como subíndice numérico para identificar
a cada estado. Escribiendo los cuádruplos como antes, separados por punto y comas,
podemos asignar el dígito 1 al palote subíndice (como antes), el 2 al palote signo, el 0
al blanco, el 3 a q, el 4 a A, el 5 a R y el 6 al punto y coma.
2.11 Funciones computables 389

su estado inicial al *r-tuplo 〈n1,…,nr〉, escrito en una cinta por lo demás


en blanco, M se detiene, al cabo de un número finito de operaciones, aplica-
da al *número ƒ(n1,…,nr) en una cinta por lo demás en blanco. En otras
palabras, si M recibe una representación de 〈n1,…,nr〉 como dato, entrega
una representación de ƒ(n1,…,nr) como resultado. En lo sucesivo, suelo
llamar Mƒ a la MT que computa cierta función ƒ. Si ƒ es una función parcial
(definida en una parte propia de ˆr), la máquina que la computa tiene el
comportamiento descrito cuando el contenido inicial de la cinta representa
un r-tuplo en que ƒ está definida, pero sigue operando sin detenerse jamás si
dicho contenido representa un r-tuplo en que ƒ no está definida.
De acuerdo con estas convenciones, el programa ‘q0B|q1; q0|Aq0; q1BAq2;
q1|Rq1’ define una MT que computa la función sucesor, x Å x+1. El lector
puede persuadirse de esto, ya sea ejecutando el programa, por ejemplo, en
una cinta en que está escrito el *número 3, ya sea estudiando la representa-
ción gráfica del programa que presento y explico al comienzo de la Sección
2.11.4 (p. 393).
En esa sección analizo los programas de otras MT elementales y enseño
a descomponerlos en partes que pueden combinarse para formar nuevos pro-
gramas. Los recursos presentados allí me ayudarán a probar en la Sección
2.11.5 que toda función recursiva es T-computable. Probaré también que toda
función T-computable es recursiva y utilizaré este resultado para demostrar,
a propósito de las MT que computan funciones numéricas, (I) que hay una
MT universal, esto es, una MT que computa la función 〈#[Mƒ],x〉 Å ƒ(x);33
y (II) que el problema de la detención es insoluble, esto es, que no hay una
MT que compute la función característica del conjunto de números {x:x es
el gödel de una MT que computa una función numérica}. Pero antes de
abordar estos temas, veamos cómo razonaba Turing para convencerse —y
convencernos— de que sus máquinas son capaces de simular perfectamente
las operaciones de un calculista humano.
El argumento de Turing incluye (i) un “llamado a la intuición”, esto es, a
nuestra idea de lo que puede o no puede hacer un calculista; (ii) una defini-
ción precisa de computabilidad —distinta de las presentadas aquí— que re-
sulta ser equivalente a la T-computabilidad, y (iii) una colección de ejem-

33 Aplicada a una cinta que contiene el gödel de la MT que computa la función ƒ seguido
del *número x, la MT universal produce el valor de ƒ correspondiente al argumento x.
2.11 Funciones computables 390

plos de “vastas clases de números que son computables”. Como las defini-
ciones de computabilidad conceptualmente diversas pero extensionalmente
equivalentes se han multiplicado desde 1936, si (ii) ya poseía alguna fuerza
persuasiva entonces, ahora ella tiene que ser arrolladora. En la Sección 2.11.5
probaré que una función numérica es T-computable si y sólo si es recursiva.
Omitiré, por eso, la parte (ii) del argumento de Turing. También la parte (iii)
se ha vuelto prescindible, puesto que en medio siglo nadie ha podido señalar
una clase de números —o una función numérica— que sea calculable pero
no computable (en particular, en virtud del diseño mismo de las computadoras
electrónicas, todo número o función calculable por una de ellas tiene que ser
T-computable). En cambio, la parte (i) merece nuestra atención por su gran
originalidad y sencillez, porque pone de manifiesto las consideraciones que
inspiraron el diseño de las máquinas de Turing y porque convenció a Gödel
de que los nuevos conceptos precisos de computabilidad capturaban la no-
ción ordinaria de algoritmo.34
Turing recuerda que los calculistas normalmente trabajan escribiendo sig-
nos en un papel. “Podemos suponer que ese papel está cuadriculado como el
cuaderno de aritmética de un niño. En la aritmética elemental suele aprove-
charse el carácter bidimensional del papel. Pero ello es prescindible y pienso
que todos estarán de acuerdo en que la bidimensionalidad del papel no es un
requisito esencial para calcular. Supongo, pues, que el cálculo se lleva a cabo
en papel unidimensional, esto es, en una cinta dividida en cuadrados” (1936,
p. 249).35 Cada cuadrado y los signos que pueden escribirse en él son, por
cierto, finitos. Por eso hay que suponer que el calculista sólo tiene un núme-
ro finito de signos diferentes a su disposición. En efecto, un alfabeto infinito
de signos legibles tendría que incluir figuras tan poco diferenciadas que nin-
gún calculista sería capaz de distinguirlas. Turing se apresura a señalar que
la restricción del número de signos no es grave, puesto que siempre se pue-
de usar una fila de signos como si fuera un signo más (así, en nuestro CP1
generamos infinitas variables con los dos signos x y |, etc.). La conducta de
un calculista está determinada en cada momento por los signos a que presta

34 Gödel, CW, I, 369; OC, p. 196; citado en la Sección 2.11.1.


35 ¿Fijó Turing con esta decisión el carácter distintivo de la computadora electrónica, que
ejecuta sus operaciones en serie y hasta el día de hoy (1 de abril de 1998) no era capaz
de trabajar “en paralelo”, como lo hace el cerebro humano?
2.11 Funciones computables 391

atención y por su “estado mental” (“state of mind”). Estos determinan ade-


más el estado mental del calculista en el próximo momento. Turing apunta
aquí a un carácter esencial del concepto de algoritmo: si el calculista no ajusta
cada una de sus operaciones —conforme a las reglas del cálculo— a la si-
tuación alcanzada anteriormente cometerá un error o interrumpirá su tarea; y
la situación —de la cinta y de su mente— después de una operación de-
pende exclusivamente de ésta y de los factores que la determinan.36 Hay que
suponer, además, que el número de signos que el calculista puede observar
en un momento dado no excede un cierto número B. Para observar más de
B signos, tiene que hacer observaciones sucesivas. Turing también supone
finito el número de estados mentales de que el calculista es capaz, porque,
según él, si fuesen infinitos habría algunos tan parecidos que el calculista no
sabría distinguirlos. Aunque Turing obviamente no puede probar que la va-
riedad de la conciencia de sí esté sujeta a esta limitación,37 creo que anota
aquí acertadamente un rasgo esencial de esa forma de actividad que llama-
mos ‘calcular’. Por otra parte, como Turing se apresura a señalar, esta limi-
tación puede obviarse escribiendo más signos en la cinta.

Imaginemos que las operaciones ejecutadas por el calculista se han di-


vidido en “operaciones simples” que son tan elementales que no es fácil
imaginar una división ulterior. Cada una de estas operaciones consiste en
cierta alteración del sistema físico formado por el calculista y su cinta.
Conocemos el estado del sistema si conocemos la secuencia de signos en

36 Hay que suponer, claro, que se trata de la situación pertinente, esto es, del estado de la
cinta y de la mente del calculista en cuanto es significativa para el procedimiento de
cálculo. Si, al tiempo que escribe el próximo símbolo, el calculista derrama una taza
de café sobre el papel, la nueva situación del papel y de su mente no depende exclu-
sivamente de la operación de cálculo ejecutada. Aunque parece idiota, esta observación
es importante, pues indica que para deslindar en el acontecer real lo que es o no es
pertinente a un procedimiento de cálculo hay que tener más o menos en claro qué en-
tendemos por ‘procedimiento de cálculo’.
37 Aunque identifiquemos, como ahora está de moda, la mente con el encéfalo o una parte
de él, siempre podría asumir infinitos estados diferentes en el trascurso de una vida,
puesto que el espacio y el tiempo son infinitamente divisibles. En cuanto a la aptitud
de la conciencia humana para distinguirlos, sabemos demasiado poco para aventurar
una conclusión al respecto. Distinto es el caso de los símbolos que son marcas de tinta
en un papel, puesto que podemos señalar umbrales bajo los cuales dos marcas son
indiscernibles a simple vista o bajo un microscopio.
2.11 Funciones computables 392

la cinta, cuáles de ellos observa el calculista (posiblemente en un cierto


orden) y el estado mental del calculista. Cabe suponer que en una opera-
ción simple no se altera más de un signo. Cualquier otra alteración puede
dividirse en cambios simples de esta clase. […] Cabe suponer, sin pér-
dida de generalidad, que los cuadrados cuyos signos se alteran son siem-
pre cuadrados “observados”.
Además de la alteración de signos, las operaciones simples tienen que
incluir cambios en la distribución de los cuadrados observados. Los nue-
vos cuadrados observados tienen que ser inmediatamente reconocibles para
el calculista. Me parece razonable suponer que sólo pueden ser cuadrados
cuya distancia del cuadrado más próximo de los observados recién no
exceda cierta magnitud fija. Digamos pues que cada uno de los nuevos
cuadrados observados dista L cuadrados o menos de uno de los que aca-
ban de observarses.
(Turing 1936, p. 250)

Turing contempla también la posibilidad de que algunos cuadrados estén


marcados, lo que permitiría al calculista encontrarlos en cualquier momento
aunque disten más de L cuadrados de cualquiera de los cuadrados bajo ob-
servación. Señala que, si cada uno está marcado con un signo, podemos
agregarlos a la colección de cuadrados observada en cada momento sin que
ésta deje de ser finita. Por otra parte, si están marcados con secuencias de
signos de longitud arbitraria su reconocimiento no puede ocurrir en un sólo
acto, sino que requiere operaciones sucesivas. Así, por ejemplo, para distin-
guir las secuencias
1111111111111111111111111111111 y 111111111111111111111111111111
hay que compararlas dígito por dígito, “tal vez marcando los dígitos con un
lápiz para asegurarse de que uno no los cuenta dos veces”.
Sin duda, una máquina de Turing puede ejecutar la labor descrita. “A cada
estado mental del calculista corresponde un estado (m-configuration) de la
máquina” (1936, p. 251). Cuando el calculista ve B cuadrados a la vez, la
máquina los lee consecutivamente. Llamemos a esto una etapa de su funcio-
namiento. En cada etapa E, la máquina puede alterar un signo en uno de los
cuadrados leídos en E o moverse de un cuadrado leído en E a un cuadrado
cualquiera que diste a lo sumo L cuadrados de alguno de los cuadrados leí-
dos en E. La operación ejecutada y el estado al que la máquina pasa depen-
den del signo leído y del estado en que la máquina se encontraba.
2.11 Funciones computables 393

2.11.4 Diagramas y ejemplos

Di arriba el programa de una MT que computa la función sucesor x Å


x+1. El diagrama siguiente —leído como explicaré enseguida— da una idea
más clara de su forma de operar.

1:A 1:R

(1)
0 1 2
0:1 0:A

Los tres círculos representan los tres estados posibles de la MT, identifica-
dos por su respectivo índice numérico (en negrita). Para mayor claridad, lla-
mo 0 al signo S0 (el blanco) y 1 al signo S1 (el palote). A y R denotan las
operaciones de avanzar y retroceder un cuadrado. Como puede observarse,
cada flecha se origina en un estado, va acompañada de dos caracteres (sepa-
rados por dos puntos), y apunta a un estado. Estos cuatro elementos consti-
tuyen obviamente un cuádruplo del programa. Cada flecha debe entonces
entenderse así: cuando la MT está en el estado donde la flecha se origina,
leyendo el signo anotado a la izquierda de los dos puntos, hace la operación
mencionada a la derecha de los dos puntos y pasa al estado adonde apunta
la flecha. El diagrama indica que cuando la MT en cuestión empieza a fun-
cionar en el estado 0 leyendo el primer palote de una fila de n, avanza y se
mantiene en el mismo estado. Sigue avanzando en el estado 0 hasta que lle-
ga a un blanco. Entonces reemplaza ese blanco con un palote y pasa al es-
tado 1. En ese momento la MT está leyendo el último palote de una fila de
n+1. La cinta contiene, pues, el resultado buscado. Con todo, según nuestras
convenciones, para “recibir” el resultado la MT tiene que estacionarse en el
primer cuadrado de la fila que lo representa. Por eso, el programa dispone
que la MT retroceda, en el estado 1, hasta encontrar el blanco que abre la
fila de palotes que representa el resultado. En cuanto da con él, avanza un
cuadrado, con lo cual se coloca ante el primer palote de la fila, y pasa al
estado 2. Como el círculo que representa al estado 2 no es el origen de nin-
guna flecha, se trata de un estado final, y la MT se detiene cuando lo alcan-
za.
El diagrama (2) representa —como el lector fácilmente comprobará— una
2.11 Funciones computables 394

MT que computa la función cero, x Å 0. (Recuérdese que representamos el


número cero mediante un palote solitario; vide p. 387):

0:1

0 1 2
1:0 (2)
0:A

En estos diagramas se pueden discernir componentes que representan tareas


parciales dentro de la computación total. Por ejemplo, en el diagrama (1), el
componente que forman los estados 0 y 1 con las dos flechas que se origi-
nan en el estado 0 simboliza la tarea de buscar un blanco en el cuadrado
inicial o a su derecha y escribir un palote en el primero que encuentre; el
componente formado por los estados 1 y 2 y las flechas que se originan en
el estado 1 simboliza la tarea de buscar un blanco en el cuadrado inicial o a
su izquierda y detenerse ante el primer palote a la derecha de ese blanco.
Obviamente, tales tareas pueden formar parte de la computación de diversas
funciones, en cuyo caso los componentes que representan a aquéllas figura-
rán en los diagramas de las MT que computan a éstas (con los estados po-
siblemente numerados de otra manera). Por otra parte, el diagrama de cual-
quier MT se deja analizar en componentes que representan tareas parciales
ejecutadas por esa MT.
Llamo diagrama parcial —abreviado DP— a cualquier sistema de círcu-
los unidos con flechas apto para representar del modo descrito una tarea
parcial de cómputo, aunque no represente el programa de una MT. Todo DP
satisface las condiciones siguientes:

(i) hay un círculo inicial que no es el destino de ninguna flecha proce-


dente de otro círculo;
(ii) hay un círculo final que no es el origen de ninguna flecha;
(iii) contiene un número finito (≥ 0) de círculos intermedios, cada uno de
los cuales recibe por lo menos una flecha procedente de otro círculo y
origina por lo menos una flecha que apunta a otro círculo;
(iv) cada flecha sale de un círculo y llega a un círculo (posiblemente el
mismo), y
2.11 Funciones computables 395

(v) de cada círculo sale a lo sumo una flecha marcada 0:C y a lo sumo
una flecha marcada 1:C (donde C es uno de los caracteres 0, 1, A,
R).

Según esta definición, el diagrama de una MT capaz de detenerse es un DP.


Si F y G son dos DP, el DP F⋅G se obtiene identificando el círculo final de
F con el círculo inicial de G (esto es, eliminando el círculo final de F y
llevando todas las flechas que apuntaban a él a desembocar en el círculo
inicial de G). A veces, digo que F⋅G se forma combinando F con G o aco-
plando G a F. Escribo F2 en vez de F⋅F y Fn en vez de F⋅Fn-1 (n > 1). Del
mismo modo, llamo (F⋅G)n al DP F⋅G⋅F⋅G⋅…⋅F⋅G —formado acoplando
n copias de F⋅G— el cual, por cierto, no es igual a F⋅F⋅…⋅F⋅G⋅G⋅…⋅G
= Fn⋅Gn. Diré generalmente que un DP hace o ejecuta tal o cual tarea, por
decir que la representa. Si n es el número que lleva un círculo en un diagra-
ma dado, el DP n —relativamente a ese diagrama— es el DP formado por
ese círculo, con todas las flechas que se originan en él, suplementado por un
único estado final al que apunten aquellas flechas que no retornan al círculo
n. Por ejemplo, en el diagrama (1), el DP 0 es éste:

1:A

(3)
0:1

Apliquemos estos recursos a la descripción de una MT que compute la


función constante x Å n, esto es, la función que asigna a cualquier número
x el sucesor del sucesor…del sucesor (n veces) de 0. Evidentemente, su
diagrama puede formarse acoplando al diagrama (2) de la función x Å 0, n
copias (acopladas) del DP (3), y acoplando al DP resultante una copia del
DP 1 del diagrama (1), que busca el primer blanco delante suyo o a su iz-
quierda y se detiene ante el primer palote a la derecha de ese blanco (la
ejecución de esta última tarea hace que nuestra MT se detenga en la posi-
ción prescrita para recibir el resultado que escribió al ejecutar las tareas
anteriores). Por ejemplo, el diagrama (4) representa el programa de una MT
que computa la función constante x Å 3.
2.11 Funciones computables 396

0:1 1:A 1:A

0 1 2 3 4
1:0 0:1 0:1
0:1
(4)
0:A 1:A 0:A
6 5

1:R

Consideremos ahora la MT que computa la k-ésima proyección de ˆr, esto


es, la función 〈x1,…,xk,…,xr〉 Å xk. Esta MT debe buscar el (k-1)-ésimo
blanco a la derecha del cuadrado inicial, borrando a su paso todos los palotes
que encuentre en el camino; enseguida debe recorrer la fila de palotes que
abre el (k-1)-ésimo blanco, preservándola intacta, pues ella representa a xk;
luego ha de borrar todos los palotes que encuentre entre el k-ésimo y el r-
ésimo blanco, y finalmente regresar al cuadrado que ocupa el primer palote
de la fila preservada y detenerse ahí. Doy el diagrama de la MT que compu-
ta 〈x1, x2,x3〉 Å x2, la segunda proyección de ˆ3.

0:A 0:A

0:R
0 1 2 3 4 5
1:0 0:A 1:0

0:A 1:R (5)


0:A 1:A
0:A
7 6
1:R

Sea F el DP 0⋅1 (esto es, el DP que forman los estados 0 y 1). Es fácil ver
que el DP 3⋅4 es una copia de F. Advertimos (i) que F borra el *número a
que se aplica y se detiene ante el primer palote del *número siguiente; (ii)
que el DP 2 recorre de comienzo a fin, sin alterarlo, todo *número al que se
2.11 Funciones computables 397

aplica y se detiene en el primer cuadrado después del blanco que cierra ese
*número; (iii) que el DP 5 busca el primer palote que haya delante suyo o a
su izquierda y se detiene a la izquierda del mismo cuando lo encuentra, y
(iv) que el DP 6⋅7 es igual al DP 5⋅6 del diagrama (4), cuya tarea es buscar
el primer blanco delante suyo o a su derecha y detenerse ante el primer palote
a la derecha de ese blanco. Es claro, entonces que el DP Fk-1⋅2⋅Fr-k⋅5⋅6⋅7
representa el programa de la MT que computa la k-ésima proyección de ˆr.
A continuación, enseñaré a construir diversos DP que ejecutan varias ta-
reas básicas de cómputo. Los uso luego (en la Sección 2.11.5) para describir
las MT capaces de computar cualquier función recursiva general definida a
partir de funciones de esa clase conforme a los esquemas R4, R5 y R6 de la
Sección 2.11.1 (o sea, por composición, recursión y búsqueda del número
mínimo que cumple cierta condición recursiva). Para facilitar las referencias
designaré a cada uno de estos DP con una abreviatura mnemotécnica apro-
piada.
Los primeros cuatro DP ejecutan las cuatro operaciones elementales de
que es capaz una MT: a avanza un cuadrado y r retrocede un cuadrado, haya
lo que haya en el cuadrado inicial; l escribe un palote en el cuadrado inicial
o lo preserva si ya lo hay, y Ø produce un blanco o lo preserva.

0:A 0:R

1:A 1:R
(a) (r)

0:1 0:0

1:1 0:1
(l) (Ø)

Los dos DP siguientes salen del cuadrado inicial buscando el primer blanco
a la derecha (A0) o a la izquierda (R0) y se detienen ante él cuando lo en-
cuentran.
2.11 Funciones computables 398

(A0 )
1:A
0:A

0:0
1:A

(R0 )
1:R
0:R

0:0
1:R

Al y Rl hacen otro tanto con el primer palote; para dibujarlos, reemplácese


simultáneamente 1 por 0 y 0 por 1 en A0 y R0.
Un ‘doble blanco’ es un par de blancos consecutivos. A00 busca el primer
doble blanco a la derecha del cuadrado inicial y se detiene ante el primero
de los dos cuadrados de ese doble blanco. A00 se detiene en el cuadrado inicial
si éste forma un doble blanco con el vecino de la derecha. R00 busca el pri-
mer doble blanco a la izquierda del cuadrado inicial y se detiene ante el
segundo de los cuadrados de ese doble blanco. R00 se detiene en el cuadra-
do inicial si éste forma un doble blanco con el vecino de la izquierda.

1:A (A00)

0:A 0:R

1:A
1:R (R00)

0:R 0:A

1:R

El próximo DP es algo más complejo. La tarea que representa puede des-


2.11 Funciones computables 399

cribirse así: si ø denota el blanco que cierra un cierto *número y no hay


ningún palote a la derecha de ø, copiar ese *número en la cinta inmediata-
mente a la derecha de ø y, concluida esa tarea, detenerse en el blanco que
cierra la copia. Para facilitar las referencias he numerado los estados.

1:A 1:R 0:R

1 2 3 4 (C)
0:1 0:R 0:0
1:0
0:A

0 0:1 0:A 5

0:R 0:1
1:A 1:A 0:A
1:A 8 7 6 9

1:A
0:1
1:A 1:0

13 12 11 10
0:0 0:A 1:R

Para verificar que C hace lo que dije, el lector debe escribir tres o cuatro
palotes consecutivos en una línea de un papel cuadriculado, situarse en el
cuadrado a la derecha del último palote y seguir las instrucciones del diagra-
ma. Si, después de escribir o borrar varios palotes, la línea en que está ope-
rando se torna confusa, copie en limpio su última configuración en una línea
nueva y siga operando sobre ésta.
Consideremos ahora una variante de la tarea que ejecuta C. Supongamos
que la cinta contiene un *n-tuplo seguido de blancos. Se trata de copiar al
final del *n-tuplo (inmediatamente después del blanco que lo cierra), el
(n-k)-ésimo *número del mismo y detenerse en el blanco que cierra la co-
pia. Llamaré Ck al DP que ejecuta esta tarea. (Con esta nueva nomenclatura,
C = C0). Supondremos que Ck parte del blanco ø que cierra el *n-tuplo.
2.11 Funciones computables 400

Contando de izquierda a derecha, sea kø el k-ésimo blanco anterior a ø. kø


es el blanco que cierra el *número que Ck va a copiar. Ck tiene que cruzar
varias veces de izquierda a derecha y de derecha a izquierda, sin alterarlo, el
*k-tuplo situado entre kø y ø. Para asegurar que esto ocurra hay que inser-
tar en puntos apropiados de C una cantidad suficiente de copias de los DP
R0 (que busca el primer blanco a la izquierda de la posición ocupada) y A0
(que busca el primer blanco a la derecha de la posición ocupada). Igual que
C, Ck empieza escribiendo un palote a la derecha de ø y retrocediendo a
leer el *número que debe copiar. Entre 3 y 4 la copiadora retrocede de ø a
øk, esto es, ejecuta la tarea del DP (R0)k. Entre 7 y 8 va del primer palote
del *k-tuplo al primer palote de la copia, para lo cual tiene que llegar a øk
y avanzar un cuadrado: esa es la tarea de (R0)k⋅a. Por último, cuando ha
terminado de hacer la copia y, después de restaurar en su sitio original el
*número que copió, llega a kø en estado 11, Ck repite la travesía de kø a ø
y sigue hasta el primer blanco a la derecha de ø, que es el blanco que cie-
rra la copia; en otras palabras, ejecuta la tarea del DP (A0)k+1. A continuación
represento gráficamente este análisis mediante un diagrama algo diferente de
los utilizados arriba.

0⋅⋅1 2⋅⋅3 (R0) k 4⋅5⋅6

1:A 0:A
0:1

8 (A0) k ⋅a 7
(Ck)
1:A
(A0) k +1 9⋅⋅10⋅11

Cada rectángulo representa el DP cuyo nombre contiene. Se entiende que


una flecha que une dos rectángulos A y B va del círculo final del DP repre-
sentado por A al círculo inicial del DP representado por B. Una flecha grue-
sa significa que la transición indicada ocurre cualquiera que sea el signo leído
y envuelve solamente un cambio de estado (en otras palabras, una flecha
gruesa representa dos flechas corrientes, con el mismo origen y el mismo
destino, acompañadas, respectivamente, de las indicaciones 0:0 y 1:1).
2.11 Funciones computables 401

En el curso de una computación puede ser necesario desplazar un *núme-


ro en una dirección en que la cinta está completamente en blanco. Conside-
remos la forma más simple de esta tarea. Llamo r al DP que empieza a
operar inmediatamente a la izquierda de un *número que sólo está precedi-
do por blancos, desplaza ese *número un cuadrado hacia la izquierda y se
detiene en el blanco que precede al *número desplazado. Obviamente

r = l⋅A0⋅Ø⋅R00

a ejecuta la tarea opuesta; para describirlo reemplácese ‘izquierda’ por ‘de-


recha’ y ‘precede’ por ‘sigue’ —o intercámbiense A y R— en la ecuación
precedente.
También puede ser necesario acercar dos *números que estén separados
en la cinta por más de un blanco. El DP siguiente, que llamaré Tr, empieza
a operar en el blanco que precede inmediatamente a un *número y traslada
este *número hacia atrás hasta que entre él y el *número anterior no queda
más que un blanco, en el cual Tr se detiene.

0:0
r2 a⋅l⋅A0⋅r⋅Ø⋅R0

1:1
(Tr)
a

Obsérvese cómo Tr retrocede inicialmente un cuadrado; si encuentra un pa-


lote, hay un solo blanco entre él y el *número siguiente; por ende, Tr no
tiene nada que hacer; avanza a ese blanco y se detiene. Pero si encuentra un
blanco, retorna al blanco inicial, lo llena con un palote, avanza al extremo
derecho del *número que va a trasladar, le quita el último palote, busca el
blanco que ahora precede ese *número y recomienza su trabajo. El lector
puede entretenerse en diseñar Ta, que hace el trabajo inverso: empieza en el
blanco que sigue inmediatamente a un *número y traslada ese *número ha-
cia adelante hasta que entre él y el *número siguiente no queda más que un
blanco, en el cual Ta se detiene.
2.11 Funciones computables 402

Es cómodo programar la MT que computa una función ƒ de tal modo que


escriba el valor de ƒ a la derecha del argumento y de cualesquiera *números
auxiliares que tenga que escribir mientras saca cuentas. Para que “reciba” el
resultado, conforme a nuestra descripción canónica, estacionada en el primer
palote de la fila que lo representa, en una cinta por lo demás en blanco, la
MT tendrá entonces que borrar primero los palotes que representan el argu-
mento y todos los *números auxiliares. El DP Bn hace eso precisamente, si
la cinta no contiene ningún *número separado por más de n blancos del
*número más próximo a su derecha: partiendo del blanco que precede inme-
diatamente al resultado, Bn retrocede borrando todos los palotes a su izquierda.
Cuando Bn ha borrado el último palote en esa dirección, retrocede n+1 cua-
drados y al detectar un blanco se pone a buscar el primer palote a su dere-
cha —que será justamente el primer palote del resultado— y se detiene allí.
Si todo lo que hay que borrar es el argumento de ƒ, se puede tomar n = 1,
que es la separación entre los *números de un *r-tuplo. Pero puede ocurrir
que el programa de la MT en cuestión prescriba anotar *números auxiliares
con una separación mayor (para distinguirlos). En todo caso, n será finito.
Doy el diagrama de B3, que tendremos ocasión de utilizar en la Sección
2.11.5.

1 :0
1 :0

1 :1 0 :R 0 :R

0 :R 0 :R
0 :R 1 :0 1 :0

1 :0
0 :0
(B3)

A1
2.11 Funciones computables 403

Daré dos ejemplos de MT que computan funciones aritméticas ordinarias.


M+ computa la función 〈x,y〉 Å x + y, esto es, la suma de cualquier par de
números naturales.

M+ = A0⋅l⋅A0⋅(r⋅Ø)2⋅R0⋅a.

Dada una fila de x+1 palotes seguida de un blanco seguido de una fila de
y+1 palotes, si M+ empieza a operar, conforme a la descripción canónica, en
el primer cuadrado de la primera fila, busca el primer blanco a la derecha,
esto es, el que separa las dos filas de palotes; lo llena con un palote; busca
nuevamente el primer blanco a la derecha; retrocede dos veces, borrando al
paso dos palotes; busca el primer blanco a la izquierda y avanza un cuadra-
do, con lo cual acaba situada ante el primer palote de una fila de x + y + 1
palotes consecutivos, que es justamente el *número que representa a x + y.
M× computa la función 〈x,y〉 Å xy, esto es, el producto de cualquier par
de números naturales, El programa de M× es, por cierto, bastante más com-
plejo que el de M+. Lo representaré mediante un diagrama como el que usé
para Ck.

0:A
a2 0:0 Rl

1:0
0:0

A 0 ⋅r2 a Ø r2 a⋅Al ⋅A00⋅C⋅R00 ⋅ R l


1:1 1:1
0:0

A0 a⋅A l

r ⋅ R 0 ⋅ Rl ⋅ Ø⋅ A l a r⋅l⋅R0 ⋅a⋅Ø⋅a⋅Ø
0:0 1:1
(M×)
2.11 Funciones computables 404

Veamos cómo M× computa el producto xy. Sean *x e *y los *números que


representan en la cinta a nuestros dos factores. M× avanza desde su posición
canónica inicial sobre el primer palote de *x hasta el blanco ñ entre *x e
*y. Retrocede dos cuadrados. Si x = 0, M× encuentra un blanco. Su tarea
restante —ejecutada por el DP en la línea superior del diagrama— consiste
en borrar *y e ir a pararse sobre el palote único de *x. Pero si el segundo
cuadrado anterior a ñ no está en blanco, x ≥ 1 y la tarea restante de M×
consiste en (i) escribir a la derecha de *y un *(x-1)-tuplo de copias de *y,
para que haya en la cinta x representaciones de y; (ii) llenar con palotes los
blancos que separan esas x representaciones de y, para que formen una fila
consecutiva de palotes; (iii) borrar los palotes que esa fila tiene en exceso
de xy + 1, el número de palotes de *(xy); (iv) borrar *x, y (v) ir a detenerse
sobre el primer palote de *(xy). El lector debe comprobar que el DP cuyo
componente inicial (marcado con a) está a la derecha del componente ini-
cial de M× ejecuta precisamente esta conjunción de tareas.
De acuerdo con nuestra descripción canónica, la MT que computa una fun-
ción numérica recibe una cinta en que sólo está representado un argumento
y entrega una cinta en que sólo está representado el valor correspondiente.
La MT borra, pues, los datos antes de entregar el resultado. Esta convención
es razonable, pero resulta incómoda en ciertas ocasiones. Por ejemplo, para
computar la función compuesta

〈x1,…,xn〉 Å h(g1(x1,…,xn),…, gm(x1,…,xn))

donde h es una función T-computable m-aria y g1,…, gm son funciones T-


computables n-arias, conviene disponer todo el tiempo del dato 〈x1,…,xn〉
mientras se computan sucesivamente los valores respectivos de g1,…, gm,
y tener todos estos valores a mano para computar el valor buscado de h.
Con este propósito, asociaré a cada función T-computable ƒ un diagrama
parcial Dƒ que entrega el valor de ƒ para cada argumento que se le suminis-
tre, sin borrar de la cinta la representación de ese argumento. Dƒ empieza a
trabajar en el blanco que cierra la representación de 〈x1,…,xn〉, escribe a su
derecha una fila de ƒ(x1,…,xn)+1 palotes y se detiene en el blanco que cierra
esta fila.
No es difícil probar que una función n-aria ƒ puede asociarse con un DP
Dƒ que cumpla las condiciones señaladas si y solo si existe una MT Mƒ que
2.11 Funciones computables 405

computa a ƒ con arreglo a nuestra descripción canónica.38 Llamaré Mƒ al DP


que ejecuta la tarea de Mƒ. (La diferencia más significativa entre Mƒ y Mƒ
consiste en que Mƒ puede trabajar en una cinta que contenga palotes a la
izquierda del *n-tuplo a que se aplica, cosa que, según nuestra descripción
canónica, Mƒ no puede hacer). Si Dƒ está dado, podemos poner

Mƒ = r00⋅Dƒ⋅R0⋅B1

Mƒ empieza en el primer palote del *n-tuplo que representa el argumento,


busca el primer doble blanco a su derecha, ejecuta la tarea de Dƒ, retrocede
al blanco que separa el argumento del correspondiente valor, y finalmente
ejecuta la tarea de B1 que borra el argumento y se detiene en el primer pa-
lote del valor. Supongamos ahora que Mƒ está dada y que sólo incluye “borra-
dores” del tipo Bk con k ≤ q. Ponemos entonces

Dƒ = a⋅l⋅a⋅(Cn)n⋅(R0)n⋅r⋅Ø⋅Rl⋅R00⋅((r)q⋅A0⋅Al⋅r)n⋅a⋅Mƒ⋅r⋅Tr⋅A00

Analicemos las tareas que Dƒ cumple antes de ejecutar la tarea de Mƒ. Em-
pieza a operar en el blanco a la derecha del *n-tuplo que representa el argu-
mento. Avanza un cuadrado, escribe un palote y avanza otro cuadrado, si-
tuándose en un blanco que llamaré ø. La tarea siguiente, ejecutada por el
DP (Cn)n, consiste en copiar el argumento a la derecha de ø. (Recuérdese
que Cn copia a la derecha del blanco inicial el *número que está separado
por n *números de ese blanco y se detiene en el blanco que cierra la copia;
en su primera aplicación, pues, Cn copia el primer *número del argumento,
que está separado de ø por los n-1 *números restantes y el palote recién
escrito; en la segunda aplicación, Cn copia el segundo *número del argu-
mento,…, en la n-ésima, el n-ésimo). Luego, el DP retorna a ø (que ahora
es el n-ésimo blanco a la derecha del blanco donde se concluye la última
aplicación de Cn), retrocede un cuadrado, borra el palote que escribió al

38 En verdad, Dƒ no es sino una máquina de Turing que computa ƒ de acuerdo con una
descripción canónica diferente, que pude muy bien adoptar —como hace Hermes
(1961)— en vez de la que dí en la Sección 2.11.3; pero esta última tiene ventajas
didácticas.
2.11 Funciones computables 406

principio, y busca el doble blanco que precede al *n-tuplo original. La tarea


siguiente, ejecutada por el DP ((r)q⋅A0⋅Al⋅r)n, consiste en desplazar el *n-
tuplo original q cuadrados a la izquierda, para ponerlo fuera del alcance de
los “borradores” incluidos en Mƒ. En efecto, (r)q desplaza q cuadrados a la
izquierda el *número que esté inmediatamente a la derecha del blanco don-
de empieza a operar; A0⋅Al llevan al primer palote del *número siguiente y
r al blanco que inmediatamente lo precede. La n-ésima aplicación de
((r)q⋅A0⋅Al⋅r desplaza q cuadrados a la izquierda al último *número del *n-
tuplo referido y se detiene en el blanco inmediatamente a la derecha de la
copia; la copia estará separada entonces por q+3 blancos del último *núme-
ro del *n-tuplo original.39 Avanzando un cuadrado, nos colocamos sobre el
primer palote de la copia, a la que se aplica Mƒ. Como sabemos, la tarea de
Mƒ consiste en reemplazar esa copia, por el *número que representa el valor
correspondiente de ƒ, eliminando con sus “borradores” todo *número que
preceda a ese valor y diste a lo sumo q blancos del *número siguiente. Con-
forme a la descripción canónica, Mƒ se detiene en el primer palote del resul-
tado. A gran distancia a la izquierda la cinta contiene el *n-tuplo original.
La tarea final de Dƒ, ejecutada por r⋅Tr, consiste en trasladar a la izquierda
el resultado hasta que entre éste y el *n-tuplo original no haya más que un
solo blanco, y avanzar desde allí hasta llegar al blanco que cierra el resulta-
do, donde Dƒ se detiene.

39 Para poner al *n-tuplo original fuera del alcance de los “borradores” de Mƒ basta en
rigor con una separación de q+1 blancos, de modo que sería suficiente utilizar (r)q-2
en vez de (r)q.
2.11 Funciones computables 407

2.11.5 Demostración de resultados

I. Toda función recursiva es T-computable. Hay que probar que cualquier


función numérica definida según uno de los esquemas R1-R6 de la Sección
2.11.1 es T-computable.40 Los diagramas (1) y (2) de la Sección 2.11.3 ex-
hiben las MT que computan la función sucesor σ:x Å x + 1 y la función
cero x Å 0, respectivamente. El diagrama (5) exhibe, a título de ejemplo, la
MT que computa 〈x1, x2,x3〉 Å x2, la segunda proyección de ˆ3. En general,
la k-ésima proyección de ˆr es computada por A00⋅Cr-k⋅A0⋅B1.
Si h es una función recursiva m-aria T-computable, asociada al DP Dh y
g1,…,gm son funciones recursivas n-arias T-computables, asociadas a los
DP D1,…, Dm, respectivamente, la función compuesta ƒ:〈x1,…,xn〉 Å
h(g1(x1,…,xn),…,gm(x1,…,xn)) es recursiva (por R4) y T-computable por
la MT descrita a continuación:

Mƒ = A00⋅a⋅l⋅a⋅(Cn)n⋅Rn⋅r⋅Ø⋅A00⋅D1⋅(Cn)n⋅D2⋅…⋅(Cn)n⋅Dm⋅
C(m-1)+n(m-1)⋅C(m-1)+n(m-2)⋅…⋅Cm-1⋅Dh⋅R0⋅B3

El funcionamiento de Mƒ es tan sencillo como ingenioso. Después de situar-


se en el primer blanco a la derecha del *n-tuplo que representa el argumento
〈x1,…, xn〉, escribe un palote en el blanco siguiente, avanza al próximo blanco
y copia ese *n-tuplo; luego borra el palote auxiliar, dejando tres blancos entre
el original y la copia; avanza al blanco que cierra la copia y escribe a su
derecha el *número que representa a g1(x1,…, xn); (Cn)n produce una se-
gunda copia del argumento a la derecha de ese *número y D2 escribe el
*número que representa a g2(x1,…, xn) a la derecha del blanco que cierra
esa segunda copia. Los puntos suspensivos indican la repetición de (Cn)n⋅Dk
con k = 3,…, n-1. Cuando Dm concluye su trabajo, Mƒ se encuentra situa-
da en el blanco que cierra un *m(n+1)-tuplo formado por representaciones
de 〈x1,…, xn,gk(x1,…, xn)〉 (1 ≤ k ≤ m), con un blanco intercalado entre
cada dos representaciones consecutivas. La tarea siguiente, efectuada por el
DP C(m-1)+n(m-1)⋅C(m-1)+n(m-2)⋅…⋅Cm-1 consiste en copiar, a continuación del

40 Con R6 ajustado a las indicaciones del párrafo que le sigue.


2.11 Funciones computables 408

*m(n+1)-tuplo indicado, precisamente los m *números que representan a


g1(x1,…,xn),…, gm(x1,…,xn).41 Por último, Dh, operando desde el blan-
co que cierra este *m-tuplo, escribe a su derecha el *número buscado, que
representa a h(g1(x1,…,xn),…, gm(x1,…,xn)) = ƒ(x1,…,xn). R0⋅B3 da los
últimos toques necesarios para entregar el resultado en la forma convencio-
nal prescrita en nuestra descripción canónica.
Sea g1 una función recursiva n-aria T-computable asociada al DP D1 (o
una constante, si n = 0) y g2 una función recursiva (n+2)-aria T-computable
asociada al DP D2. Sea ƒ la función (n+1)-aria definida por recursión así:42

ƒ(x1,…,xn,0) = g1(x1,…,xn)
ƒ(x1,…,xn,y+1) = g2(x1,…,xn,y,f(x1,…,xn,y))

41 Comprobemos este aserto, trabajando, por ejemplo, con m = 3 y n = 2. Llamo x al


*número que representa el número x, g1 a la representación de g1(x1,x2). ñ es un blan-
co. Empezamos a la derecha de la fila x1ñx2ñg1ñx1ñx2ñg2ñx1ñx2ñg3. C6 copia
g1. Luego C4, empezando a la derecha de x1ñx2ñg1ñx1ñx2ñg2ñx1ñx2ñg3ñg1,
copia g2. Luego, empezando a la derecha de x1ñx2ñg1ñx1ñx2ñg2ñx1ñx2ñg3ñg1,
C2 copia g3.
42 Mi definición de ƒ se aparta un poco del esquema R5, con el propósito de hacer más
sencillo el diagrama de la MT que la computa. Para tranquilizar al lector desconfiado,
mostraré aquí que la diferencia es inocua. Supongamos, pues, que ϕ es la función (n+1)-
aria definida, según el esquema R5, por las relaciones

ϕ(0,x1,…, xn) = γ1(x1,…, xn)


ϕ(y+1,x1,…,xn) = γ2(y,ϕ(x1,…,xn,y),x1,…,xn)
donde γ1 y γ2 son funciones recursivas y T-computables y las funciones g1 y g2 satisfa-
cen las condiciones g1 ≡ γ1 y g2(x1,…, xn+2) = γ2(xn+1, xn+2, x1,…, xn). Mostraré que
g2 es recursiva y T-computable. Sea πk la k-ésima proyección de ˆn+2; sabemos que πk
es recursiva (por R3) y T-computable. Por consiguiente, también lo es la función com-
puesta
g2:〈x1,…, xn+2〉 Å
γ2(πn+1(x1,…, xn+2),πn+2(x1,…, xn+2),π1(x1,…, xn+2),…,πn(x1,…, xn+2))
Por lo tanto, la función ƒ definida arriba en el texto es T-computable por la MT ahí
descrita. Es claro, entonces, que la función compuesta

ϕ:〈x1,…, xn+1〉 Å ƒ(πn+1(x1,…, xn+1),π1(x1,…, xn+1),…,πn(x1,…, xn+1))

también es T-computable.
2.11 Funciones computables 409

ƒ es recursiva (por R5) y T-computable por la MT representada en el diagra-


ma siguiente:

A00⋅ a⋅⋅ l⋅⋅a ⋅C 1⋅ (Cn+2) n⋅R0n+1 ⋅ r⋅⋅ Ø⋅⋅A00 ⋅ D1 ⋅ C n+1 ⋅ r⋅⋅ Ø⋅⋅ r

0:0 1:1

a⋅⋅ (Cn+1 ) n⋅ a

1:1
R0⋅ B3 a⋅⋅ (Cn+3 ) n+1 l⋅⋅ a⋅⋅ C n+2 ⋅ D 2⋅ C n+ 3⋅ r⋅⋅ Ø⋅⋅ r

0:0

Dejo a cargo del lector el análisis de su funcionamiento (para simplificar,


suponga que n = 1).
Sea g una función recursiva general (n+1)-aria T-computable, asociada al
DP D (n ≥ 0). Digamos que ƒ es la función n-aria definida por ƒ(x1,…, xn)
= µy(g(x1,…, xn,y) = 0. Entonces ƒ es recursiva (por R6) y T-computable
por la MT representada en el diagrama siguiente:

0:0
A00⋅ a l⋅⋅ a⋅⋅ D⋅⋅r ⋅Ø ⋅ r R0⋅ B 3

1:1
0:0

1:1 Ø ⋅r

¿Cómo trabaja? Supongamos que se aplica al *n-tuplo que representa el argu-


mento 〈x1,…, xn〉. Partiendo de su primer palote, busca el blanco que lo
cierra, avanza un cuadrado, escribe un palote, avanza otro cuadrado y aplica
D al *(n+1)-tuplo precedente, que representa 〈x1,…, xn,0〉. Si D produce un
solo palote, quiere decir que g(x1,…, xn,0) = 0. La ejecución de r⋅Ø⋅r colo-
2.11 Funciones computables 410

ca entonces a nuestra MT ante un blanco, inmediatamente a la derecha del


resultado buscado. Como siempre, R0⋅B3 asegura que éste se entregue en la
forma convenida. Pero si D produce más de un palote, g(x1,…,xn,0) ≠ 0.
La MT borra entonces el número que escribió D, agrega un palote al último
*número del *(n+1)-tuplo precedente, y repite el ejercicio anterior. De esto
modo, computará sucesivamente g(x1,…,xn,1), g(x1,…,xn,2),… hasta dar
con el primer número h tal que g(x1,…,xn,h) = 0.
Así queda demostrado que cualquier función recursiva es T-computable.

II. Toda función T-computable es recursiva. Sea ƒ una función r-aria T-com-
putable por la MT Mƒ. Ya sabemos identificar a Mƒ mediante un gödel.
Mientras Mƒ computa el valor de ƒ para un dado argumento x ∈ ˆr, la cinta
presenta sucesivamente distintas configuraciones; cada momento o etapa de
la computación queda exhaustivamente descrito por la indicación de (i) la
configuración de la cinta en esa etapa; (ii) el estado momentáneo de Mƒ y
(iii) el cuadrado que Mƒ está leyendo. Se puede definir un gödel que repre-
sente toda esta información. Como el tránsito de cada etapa a la próxima
está determinado por el programa finito de Mƒ, se pueden definir funciones
recursivas que asignen al gödel de cada etapa, el gödel de la etapa siguiente.
Sobre esta base, es posible definir una función recursiva que asigna el valor
ƒ(x) al par formado por el gödel de Mƒ y el gödel de la etapa inicial de la
computación de ƒ(x). Tal es el método estándar para demostrar este resulta-
do,43 que produce al mismo tiempo pruebas de los resultados III-VI. Pero
aquí seguiré otro método más simple, debido a Boolos y Jeffrey (1980, Cap.
8); luego completaré esquemáticamente la demostración estándar a propósi-
to del resultado IV.
Para llevar a cabo la demostración propuesta necesitaré algunos concep-
tos auxiliares, que explico a continuación en párrafos numerados del 1 al 6.
1. Definición de una función mediante una lista finita de condiciones. Sea
ϕ una función numérica definida en D ⊆ ˆr mediante n condiciones de la
forma

ϕ(x) = ψk(x) si y sólo si el r-tuplo x ∈ Ck (1 ≤ k ≤ n)

43 Ideado por Kleene; véase su tratado didáctico (1952), o la exposición muy clara y pre-
cisa de Davis (1958, Capítulo 4).
2.11 Funciones computables 411

donde {C1,…, Cn} es una partición de D. Sea χk la función característica


de Ck. Obviamente, ϕ es la función compuesta definida por

ϕ(x) = ψ1(x)(1 – χ1(x)) +…+ ψn(x)(1 – χn(x))

Decimos que ϕ es una función definida mediante una lista finita de condi-
ciones. Si ψ1,…, ψn, χ1,…, χn son funciones pr-recursivas, ϕ también es
pr-recursiva.
2. Maximización acotada. El lector conoce la función r-aria definida por
“minimización acotada” x Å µy(y ≤ φ(x) ∧ R(y,x)), cuyo valor, para cada r-
tuplo x, es el mínimo número y ≤ φ(x) que cumple la condición R(y,x). Como
indiqué en el paso 3º de la prueba del primer teorema de incompletud de
Gödel (p. 334, (✥)), esta función es pr-recursiva si la función φ y la relación
R lo son. Ahora definiré por maximización acotada la función x Å Μy(y ≤
φ(x) ∧ R(y,x)), cuyo valor es el máximo número y ≤ φ(x) que cumple la
condición R(y,x). Sea P la condición definida por P(y,x) ↔ (R(y,x) ∧ ∀z(z ≤
φ(x) → (z > y → ¬R(z,x)). Obviamente, Μy(y ≤ φ(x) ∧ R(y,x)) = µy(y ≤ φ(x)
∧ P(y,x)). Por lo tanto, nuestra función de maximización acotada es pr-
recursiva si la función φ y la condición R lo son. En particular, defino por
maximización acotada la función θ que asigna a cada x ∈ ˆ el máximo
número w ≤ x tal que 2w ≤ x; en el acto advertimos que θ(2z+1-1) = z.
3. Codificación de r-tuplos. Sea pk el k-ésimo número primo. La función
r-aria

Γr:〈x1,x2,…,xr〉 Å 2x1⋅3x1⋅…⋅prxr

es pr-recursiva (cf. pp. 336 y ss.) y puede utilizarse para identificar inequí-
vocamente un r-tuplo numérico mediante un solo número (un gödel). En vez
de Γr(x1,x2,…,xr) escribimos [x1,x2,…,xr]. Si x designa el r-tuplo
〈x1,x2,…,xr〉, escribo [x] por Γr(x). Consideremos ahora la función Πk que
asigna a cada número x el máximo número z ≤ x tal que x es divisible por
(pk)z. Según lo explicado en el párrafo 2, Πk es pr-recursiva. Obsérvese que,
si x es el gödel de un r-tuplo y 1 ≤ k ≤ r, Πk(x) es el k-ésimo número del r-
tuplo en cuestión. En otras palabras Πk([x]) = πk(x).
4. Codificación de computaciones. Sea Mƒ una MT que computa una fun-
ción r-aria ƒ. Las etapas de la computación de ƒ(x) pueden numerarse, diga-
2.11 Funciones computables 412

mos, de 0 a n. En la etapa t, Mƒ lee un determinado cuadrado de su cinta,


escrito o en blanco, que llamaré ñt. Si equiparamos cada palote con el dígito
1 y cada blanco con el dígito 0, podemos leer el contenido de la cinta, a la
izquierda de ñt, como la representación de un número natural en el sistema
binario. Llamo a ese número, el número de la izquierda ρt correspondiente a
la etapa t. El contenido del resto de la cinta, a partir de ñt, también puede
leerse de derecha a izquierda, como la representación binaria de un número
natural, el número de la derecha αt (en cambio, si lo leemos de izquierda a
derecha obtenemos una secuencia infinita de dígitos del sistema binario, que,
después del último palote, son todos ceros). Llamaré °αt (°ρt) a la represen-
tación binaria de αt (ρt). Obsérvese que αt es par si y sólo si ñt está en
blanco y que ρt es par si y sólo si está en blanco el cuadrado contiguo a la
izquierda de ñt. El tránsito de la etapa t a la etapa t+1 puede describirse,
como en nuestros diagramas, por un par de caracteres separados por dos
puntos, S:C, donde S ∈ {1,0} y C ∈ {1,0,A,R}. Hay, pues, ocho casos po-
sibles. Si el tránsito es 0:0 o 1:1, ρt+1 = ρt y αt+1 = αt. En los seis casos
restantes, no es difícil determinar los valores de ρt+1 y αt+1 en función de ρt,
y αt, respectivamente. En el caso 0:1, ρt+1 = ρt y αt+1 = αt + 1. En el caso
1:0, ρt+1 = ρt y αt+1 = αt – 1. En el caso 0:A, ρt+1 = 2ρt (°ρt+1 es igual °ρt
seguido de un 0) y αt+1 = αt/2 (°αt es igual a °αt+1 seguido de un 0). En el
caso 1:A, ρt+1 = 2ρt + 1 (°ρt+1 es igual °ρt seguido de un 1) y αt+1 = (αt–1)/
2 (°αt es igual a °αt+1 seguido de un 1). En los casos 0:R y 1:R el resultado
varía según que ρt sea par o impar; en cambio, la paridad de αt —depen-
diente de que ñt contenga un 0 o un 1— da lo mismo. Si ρt es par, ρt+1 =
ρt/2 y αt+1 = 2αt. Si ρt es impar, ρt+1 = (ρt–1)/2 y αt+1 = 2αt + 1. Recorde-
mos finalmente que en el sistema binario, una secuencia de p unos represen-
ta el número 2p - 1, una secuencia de p unos seguida de q ceros representa
a (2p - 1)2q, y una secuencia de p unos seguida de un cero seguido de q
unos representa a (2p - 1)2q+1 + (2q - 1). Por lo tanto, si ƒ es binaria (r = 2),
cuando Mƒ computa a ƒ(x,y), y se aplica en la primera etapa de la computa-
ción al *par formado por x+1 palotes a la izquierda de un blanco a la iz-
quierda de y+1 palotes (con el resto de la cinta en blanco), es claro que ρ0
= 0 y α0 = (2y+1 ⱷ 1)2x+2 + (2x+1ⱷ 1). Adviértase que la función ζ2:〈x,y〉 Å
(2y+1 ⱷ 1)2x+2 + (2x+1 ⱷ 1) es pr-recursiva.44 En el caso general (r ≥ 1),
44 La función pr-recursiva 〈x,y〉 Å xⱷy se definió en la p. 333, nota 22; es igual a x – y
si y ≤ x; de otro modo, es igual a 0.
2.11 Funciones computables 413

r
α 0 = (2 x 1+1ⱷ1) + Σ (2 x +1ⱷ1)(2 Σ
j =1
j k< j x k +2
) = ζ r(x 1,…,x r)

En la etapa n-ésima y final de la computación, Mƒ se aplica a una fila de


ƒ(x)+1 (en una cinta por lo demás en blanco), de modo que ρn = 0 y αn =
2ƒ(x)+1. Recordando lo dicho al final del párrafo 2, comprobamos que θ(αn) =
ƒ(x).
5. Codificación de programas. Sigamos considerando la MT Mƒ que com-
puta la función r-aria ƒ. Representamos numéricamente los estados, símbo-
los y operaciones de Mƒ de acuerdo con las convenciones siguientes: el es-
tado qk (0 ≤ k ≤ m) estará representado por el número k+1; los símbolos S0
(blanco) y S1 (palote) estarán representados por 0 y 1, respectivamente; las
operaciones 0, 1, A y R estarán representadas por 0, 1, 2, y 3, respectiva-
mente. Las dos funciones binarias O y Q que definiré en seguida están com-
pletamente determinadas por el programa —o el diagrama— de Mƒ y lo
representan de modo inequívoco. Ponemos O(x,y) = u y Q(x,y) = w si Mƒ
ejecuta la operación representada por u y pasa al estado representado por w
cuando lee el signo representado por y en el estado representado por x. Pero
si x e y no representan, respectivamente, un estado y un símbolo de Mƒ, o si
el programa de Mƒ no asocia una operación y un nuevo estado al estado y al
símbolo representados por el par 〈x,y〉, entonces O(x,y) = y y Q(x,y) = 0.
Obsérvese que, en virtud de esta estipulación, si x representa el estado final
de Mƒ, Q(0,y) = 0. Como el programa de Mƒ consta de un número finito de
cuádruplos, es claro que O y Q son funciones pr-recursivas definidas me-
diante una lista finita de condiciones.
6. La función Bƒ. Definiré una función pr-recursiva (r+1)-aria Bƒ con la
siguiente propiedad: si t es una etapa en la computación de ƒ(x) por Mƒ y
q(t) es el número que representa el estado de Mƒ en t —pero q(t) = 0 si Mƒ
se ha detenido antes de t— entonces Bƒ(t,x) = [ρt,q(t),αt]. Según la conven-
ción del párrafo 5, q(0) = 1. Recordando que ρ0 = 0 y α0 = ζr(x), definimos:

(i) Bƒ(0,x) = [0,1,ζr(x)]

Antes de seguir con la definición de Bƒ, introduzco algunos símbolos y abre-


viaturas. Sea x/y = x dividido por y, si x es divisible por y y x/y = 0 si x no
2.11 Funciones computables 414

es divisible por y; Sea ε:ˆ Æ {0,1} tal que ε(x) = 0 si x es par, e(x) = 1 si
x es impar. (Ambas funciones son pr-recursivas). Como vamos a definir Bƒ
de tal modo que Bƒ(t,x) —para un dado r-tuplo x— sea el gödel de un triple,
adoptaré tres abreviaturas para designar los tres números codificados en di-
cho gödel, para un dado t; llamaré ᒏt al primero, ᒎt al segundo y ᑾt al terce-
ro.45 Llamaré Qt al número Q(ᒎt,ε(ᑾt)).46 Obsérvese que (a) si ᒎt = q(t) y ᑾt
= αt, Qt es el número que representa el estado alcanzado por Mƒ en el trán-
sito de la etapa t a la t+1, y (b) si Mƒ se detiene en o antes de la etapa t, Qt
= 0. Completamos la definición de Bƒ con la siguiente estipulación:

ᒏ t ,Q t ,ᑾt si ε(ᑾt ) = 0 y O(ᒎt ,ε(ᑾt )) = 0


ᒏ t ,Q t ,ᑾt si ε(ᑾt ) = 1 y O(ᒎt ,ε(ᑾt )) = 1
ᒏ t ,Q t ,ᑾt + 1 si ε(ᑾt ) = 0 y O(ᒎt ,ε(ᑾt )) = 1
ᒏ t ,Q t ,ᑾt ⱷ1 si ε(ᑾt ) = 1 y O(ᒎt ,ε(ᑾt )) = 0
(ii) B ƒ(t+ 1,x) = 2ᒏ t ,Q t ,ᑾt /2 si ε(ᑾt ) = 0 y O(ᒎt ,ε(ᑾt )) = 2
2ᒏ t +1,Q t ,(ᑾt ⱷ1)/2 si ε(ᑾt ) = 1 y O(ᒎt ,ε(ᑾt )) = 2
ᒏ t /2,Q t ,2ᑾt si ε(ᑾt ) = 0 y O(ᒎt ,ε(ᑾt )) = 3
(ᒏ t ⱷ1)/2,Q t ,2ᑾt + 1 si ε(ᑾt ) = 1 y O(ᒎt ,ε(ᑾt )) = 3
0 en cualquier otro caso

La función Bƒ es pr-recursiva, puesto que la hemos definido mediante una


lista finita de condiciones pr-recursivas (cf. p. 411).47 Las alternativas pro-

45 Estrictamente hablando, con el vocabulario del párrafo 3, ponemos ᒏt = Π1(Bƒ(t,z)), ᒎt


= Π2(Bƒ(t,z)), ᑾt = Π3(Bƒ(t,z)). Conforme a esta definición, ᒏt = ᒎt = ᑾt = 0 si Bƒ(t,z) =
0.
46 Dicho sin abreviaturas: Qt = Q(Π2(Bƒ(t,z)),ε(Π3(Bƒ(t,z))).
47 Imitando a Boolos y Jeffrey (1980, p. 94), he tomado un atajo para facilitar la lectura
e interpretación de la cláusula (ii). En rigor, la definición de Bƒ debiera ajustarse al
esquema de recursión R5, con g y h definidas mediante una lista finita de condiciones
pr-recursivas. Ponemos g(x) = [0,1,ζr(x)]. En (ii), reemplazamos Bƒ(t+1,x) por h(t,y,x)
y redefinimos ᒏt, ᒎt, ᑾt y Qt como sigue: ᒏt = Π1(y), ᒎt = Π2(y), ᑾt = Π3(y), Qt =
Q(Π2(y),ε(Π3(y))). Entonces, la función Bƒ dada por
Bƒ(0,x) = g(x)
Bƒ(t +1,x) = h(t,Bƒ(t,x),x)
es idéntica a la definida en el texto.
2.11 Funciones computables 415

puestas en las primeras ocho líneas a la derecha de la llave corresponden


precisamente a los ocho casos posibles examinados en el párrafo 4. Compa-
rando lo dicho allí con los valores asignados a Bƒ(t+1,z) en esas ocho líneas,
comprobamos que, para cada t ≥ 0, Bƒ(t+1,x) = [ρt+1,q(t+1),αt+1], conforme a
nuestra exigencia inicial. Si en la computación de ƒ(x), Mƒ llega a su estado
final en la etapa t, la lista Bƒ(0,x),…, Bƒ(t,x) provee una descripción com-
pleta, etapa por etapa, de dicha computación, y Bƒ(y,x) = 0 para todo y > t.
Obviamente, ᒎy = Π2(Bƒ(y,x)) = 0 si y sólo si y > t, pues si y ≤ t, ᒎy es el
número que representa el estado en que se encuentra Mƒ en la etapa y, el
cual, según nuestras convenciones, es siempre positivo.
Con estos recursos podemos, finalmente, establecer el resultado. Acaba-
mos de ver que Mƒ se detiene en la etapa t de la computación de ƒ(x) si y
sólo si t = µy(Π2(Bƒ(y+1,x)) = 0). La función φ:x Å µy(Π2(Bƒ(y+1,x)) = 0)
es recursiva (aunque no necesariamente pr-recursiva). Como indiqué al final
del párrafo 4, si Mƒ se detiene en la etapa t de la computación de ƒ(x), ƒ(x)
= θ(αt) =. Pero αt = at = Π3(Bƒ(t,x)). Por lo tanto,

ƒ(x) = θ(Π3(Bƒ(φ(x),x)) (*)

Como función compuesta de funciones recursivas, ƒ es ciertamente recursiva.

III. Forma normal de una función recursiva. Sea ƒ una función recursiva r-
aria. Entonces, ƒ es T-computable (I). Por lo tanto, ƒ es idéntica a la función
compuesta al lado derecho de la ecuación (*). Dicha función se forma por
composición de la función pr-recursiva θ ∑ Π3 ∑ Bƒ con la función φ defini-
da por minimización (según el esquema R6) a partir de una función pr-
recursiva. Por lo tanto, toda función recursiva puede definirse por una serie
finita de aplicaciones de los esquemas de recursión primitiva R1-R5, con a
lo sumo una aplicación del esquema R6.48

48 El resultado III no es igual al Teorema de la Forma Normal de Kleene (1936) enuncia-


do en la p. 366 (inmediatamente antes de la nota 5). Kleene mostró que cualquier fun-
ción recursiva general según la definición de Herbrand-Gödel tiene una forma normal
como la descrita arriba, y basó en esto la conclusión de que las funciones recursivas
generales de Herbrand-Gödel pueden todas definirse mediante los esquemas R1-R6. Pero
nuestro resultado I, invocado en la prueba del resultado III, se basa él mismo en la
definición de función recursiva mediante los esquemas R1-R6.
2.11 Funciones computables 416

IV. La máquina universal de Turing. Turing (1936) da el programa de una


máquina que, aplicada al gödel de una MTR cualquiera, computa el número
real computable por ésta. La tarea de esa máquina consiste, esencialmente,
en descifrar el gödel a que se aplica y seguir el programa allí encapsulado.
Es probable que este concepto de una máquina universal haya inspirado a
von Neumann (hacia 1945) la idea matriz de la computadora moderna: en
vez de materializar el programa en los circuitos del aparato (como hardware),
suministrárselo como información (en la forma de software). A continuación
esbozaré una prueba de que, para cada entero positivo r hay una MT univer-
sal Ur que computa el valor de cualquier función T-computable r-aria en cada
r-tuplo x perteneciente a su dominio, cuando se le suministra el (r+1)-tuplo
〈i,x〉, donde i es el gödel de la MT que computa a ƒ.49 Llamaré Mi a la MT
cuyo gödel es i y ƒi a la función que ella computa. Diré que i es el indice de
la función ƒi. El índice i de la función T-computable ƒi encapsula el progra-
ma Mi y, por ende, contiene toda la información necesaria para definir la
función pr-recursiva Bƒi descrita en II.6; en adelante, escribo Bi en vez de
Bƒi. Si ƒi es r-aria y el r-tuplo x pertenece a su dominio, la computación de
ƒi(x) por Mi termina en cierta etapa t y —como se vio en II.6— la secuencia
finita Bi(0,x),…, Bi(t,x) contiene toda la información necesaria para descri-
bir dicha computación, etapa por etapa. Si conocemos t esta información
puede encapsularse en el gödel [Bi(0,x),…, Bi(t,x)]. Como Bi(u,x) ≠ 0 para
todo u ≤ t y Bi(u,x) = 0 para todo u > t, en verdad no hace falta conocer t
para definir un gödel que encapsule la información. Ponemos, simplemente,50
Γ(i,x) = Πk∞= 0 (p k+1)B i (k,x) . Si ƒi está definida en x, ocurre que a partir de
cierto valor finito del índice k los factores del producto infinito Γ(i,x) llevan
todos el exponente 0 y son, por ende, iguales a 1. En tal caso, Γ(i,x) es pre-
cisamente el gödel de la computación de ƒi(x) por Mi, tal como se lo definió
arriba. Si ƒi no está definida en x, Γ(i,x) excede a cualquier número señalable
y puede considerarse indefinido. Recordando la definición 7 en el paso 4º de
la Sección 2.10.2, vemos que, si Γ(i,x) está definido, l(Γ(i,x)) es igual al
número de los factores primos de Γ(i,x) y, por ende, es igual al número t de

49 El argumento bosquejado a continuación se debe a Kleene; vide p. 410, nota 43.


50 Recuérdese que, según la definición 5 en la p. 336, p0 = 0 y, para r > 0, pr es el r-
ésimo primo (p1 = 2, p2 = 3, p3 = 5,…).
2.11 Funciones computables 417

la etapa en que termina la computación de ƒi(x) por Mi. Definimos la fun-


ción ternaria Tr mediante una lista de dos condiciones:

Tr(u,v,w) = 0 si u es el índice de una función T-computable r-aria, v es el


gödel de un r-tuplo v en el dominio de ƒu y w = l(Γ(u,v)).
Tr(u,v,w) = 1 en cualquier otro caso.

Como las condiciones son recursivas, Tr es una función recursiva.51 También


es recursiva la función binaria ψ:〈u,v〉 Å µw(Tr(u,v,w) = 0), cuyo valor, en
cada par 〈u,v〉 en que esté definida, es precisamente el número de la etapa
en que la MT Mu se detiene en la computación de ƒu(v). Recordando la ecua-
ción (*) en la p. 415, defino la función (r+1)-aria
Φr:〈i,x〉 Å θ(Π3(Bi(ψ(i,[x]),x)).
Φr es una función recursiva y, por ende, T-computable. Sea Ur la MT que
computa a Φr. Ur es la MT buscada.

V. El problema de la detención es insoluble. El problema de la detención


puede formularse así: decidir mediante un algoritmo si una MT se detiene
cuando se aplica a cierto *número. Si aceptamos la tesis de Church (o el
análisis de la actividad de un calculista propuesto por Turing), el problema
equivale a este otro: hallar una función T-computable binaria ∆ tal que ∆(u,x)
= 0 si u es el índice de una función T-computable ƒu definida en x, y ∆(u,x)
= 1 en cualquier otro caso. Evidentemente ∆(u,x) = 0 si y sólo si la compu-
tación de ƒu(x) termina en alguna etapa t, esto es, si y sólo si ∃w(T1(u,[x],w)
= 0). Mostraré que el problema de la detención es insoluble o, mejor dicho,
que tiene una solución negativa: la función T-computable ∆ no existe. Con
ese propósito, defino la siguiente función total:

51 La recursividad de las condiciones impuestas a u y v puede establecerse utilizando los


predicados y funciones definidos en el paso 4º de nuestra demostración del primer teo-
rema de incompletud de Gödel (pp. 335-341). Pero también podemos invocar la Tesis
de Church, puesto que hay sin duda algoritmos para decidir si un número dado es o no
el índice de una función T-computable o el gödel de un r-tuplo (para un r > 0 fijo). La
condición impuesta a w depende de las condiciones anteriores y de las funciones
recursivas l y Γ.
2.11 Funciones computables 418

ϕ(x) = ƒx(x) + 1 si ∃w(T1(x,[x],w) = 0)


ϕ(x) = 0 en cualquier otro caso.

Si ϕ es T-computable, tendrá un índice a. En otras palabras, ϕ será idéntica


a la función T-computable unaria ƒa. Como ϕ es total, está definida en a, de
modo que ∃w(T1(a,[a],w) = 0). Por lo tanto, ƒa(a) = ϕ(a) = ƒa(a) + 1. Como
esto es imposible, concluimos que ϕ no es T-computable. Supongamos aho-
ra que existe la función T-computable ∆ arriba descrita. Entonces, la función
ϕ podría computarse así: dado un número x, computar ∆(x,x); si ∆(x,x) = 0,
x es el índice de la función T-computable ƒx definida en x y, por ende, po-
demos computar ƒx(x) + 1 que es el valor correcto de ϕ(x) en ese caso; si
∆(x,x) = 1, ponemos ϕ(x) = 0, que es su valor correcto en este caso. Como
ϕ no puede ser T-computable, so pena de contradicción, tampoco puede existir
una función T-computable ∆ como la arriba descrita.

VI. El cálculo predicativo de primer orden es indecidible. La solución nega-


tiva del problema de la detención es homóloga, en la teoría de las MT, al
Teorema XVIII de Church 1936 (Sección 2.11.2), en la teoría de la λ-
computabilidad. Por eso, no ha de sorprendernos que ella lleve directamente
a la solución negativa del Entscheidungsproblem de Hilbert y Ackermann.
Por su parte, Turing (1936), como era natural, derivó este resultado de su
solución negativa del problema de la circularidad, concerniente a sus MTRs.
El Entscheidungsproblem de Hilbert y Ackermann demanda un algoritmo para
determinar si una fórmula dada del cálculo predicativo de primer orden es
válida o no. En virtud del Teorema de Completud de Gödel (1929, 1930)
estudiado en el Capítulo 2.8, el problema tiene una solución positiva si y
sólo si hay un algoritmo para determinar si dicha fórmula es deducible o no
en el cálculo organizado como sistema deductivo completo. Por lo tanto, según
la Tesis de Church, el Entscheidungsproblem sólo podrá resolverse positiva-
mente si existe una función computable δ tal que (i) δ(x) está definida si y
sólo x es el gödel de una fórmula ξ del cálculo predicativo de primer orden
y (ii) δ(x) = 0 si ξ es deducible en el cálculo y δ(x) = 1 si ξ no es deducible
en el cálculo. Este problema está íntimamente ligado al problema de la de-
tención porque la teoría de las funciones T-computables se puede formalizar
en el cálculo predicativo de primer orden. En particular, es posible asociar a
cada par de números 〈x,y〉, una fórmula ξ(x,y) que es deducible en el cálculo
2.11 Funciones computables 419

si y sólo si x es el índice de una función T-computable unaria definida en y.


La función que asigna a 〈x,y〉 el gödel de la fórmula correspondiente ξ(x,y)
es computable. Llamémosla γ. Es claro que, si existiera la función computa-
ble δ arriba descrita tendríamos que δ(γ(x,y)) = 0 si y sólo si ∃w(T1(x,[y],w)
= 0). Por consiguiente, la función compuesta δ ∑ γ sería idéntica a la fun-
ción ∆ que resuelve el problema de la detención (véase el V). Pero hemos
demostrado que esa función no existe. Por lo tanto, δ no existe.52

52 Varios autores dan la demostración en detalle. Especialmente clara y simple es la ver-


sión de Boolos y Jeffrey (1980, Capítulo 10), basada en Büchi 1962.
2.12 CONSISTENCIA DE LA ARITMÉTICA:
LA PRUEBA DE GENTZEN

Los escritos de Gödel, Church, Kleene y Turing a que me refiero en los


Capítulos 2.10 y 2.11 son obras maestras de la “metamatemática”, que apli-
can con ejemplar virtuosismo los recursos de la aritmética finitista (Capítulo
2.5) al estudio de cálculos lógicos. Sus resultados no favorecen las aspira-
ciones de la escuela de Hilbert. Hilbert y Bernays (1939) anuncian a sus
lectores que, a la luz del descubrimiento de Gödel, su programa de funda-
mentación de las matemáticas demanda una ampliación del punto de vista
finitista.1 Toda la ampliación requerida consiste en admitir como un método
propiamente “finito” la inducción transfinita que Gerhard Gentzen invoca en
sus dos demostraciones de la consistencia de la aritmética formalizada (1935,
1938).
Las dos demostraciones de Gentzen difieren significativamente en los
detalles —el cálculo a que se aplica la segunda difiere del considerado en la
primera— pero ambas se inspiran en la misma idea. Se propone un sistema
deductivo para lo que Gentzen llama “teoría pura de los números” (reine
Zahlentheorie), que es lo mismo que aquí hemos estado llamando aritmética
elemental. Imitando a Gentzen, llamaré derivaciones a las pruebas de ese
sistema (él dice Herleitungen). Las derivaciones admisibles se ordenan por
niveles, a partir de un nivel mínimo. El orden está diseñado de tal modo
que, si hay una derivación  que concluye en una contradicción, tiene que
haber otra derivación ❊ con la misma conclusión, tal que ❊ tiene un nivel
más bajo que . Por otra parte, será obvio que las derivaciones de nivel
mínimo no pueden concluir en una contradicción. De esto se deduce, por

1 Bernays reconoce, en el prefacio al tomo II de Fundamentos de la matemática: “En


contraste con la definición anterior del ‘punto de vista finitista’, ha resultado necesario
ampliar el marco de los modos de inferencia sustantivos admitidos en la teoría de la
prueba” (“die Notwendigkeit [hat sich] ergeben […], den Rahmen der für die
Beweistheorie zugelassenen inhaltlichen Schlußweisen gegenüber der vorherigen
Abgrenzung des ‘finiten Standpunktes’ zu erweitern”—Hilbert y Bernays 1939, p. vii).

421
2.12 La prueba de Gentzen 422

inducción sobre el nivel de las derivaciones, que ninguna derivación del sis-
tema puede desembocar en una contradicción. Pero la inducción de que aquí
se trata rebasa los límites del “modo recursivo de pensar” patrocinado por
Skolem (1923) y aceptado sin reservas en la escuela de Hilbert. Aunque el
conjunto de las derivaciones admisibles es, por cierto, numerable,2 el orden
que hay que darle para los efectos del argumento de Gentzen no es isomórfico
a ω, sino a un ordinal mucho mayor.3 Por lo tanto, la inducción requerida se
extiende sobre todos los ordinales menores que ése. Se razona así: (i) Nin-
guna derivación del nivel ínfimo lleva a una contradicción. (ii) Si una deri-
vación de nivel ζ lleva a una contradicción, hay una derivación de un nivel
η < ζ que también lleva a una contradicción. (iii) Por lo tanto, si ninguna
derivación de nivel η < ζ lleva a una contradicción, las derivaciones de ni-
vel ζ tampoco llevan a una contradicción. Esta forma de razonar no me
merece ninguna duda, pero me cuesta trabajo llamarla finita o finitista.
La argumentación de Gentzen es tortuosa —tanto, que juzgó necesario
reescribirla— pero, exceptuando la inducción descrita, es enteramente ele-
mental; en particular, la construcción, para cada derivación con conclusión
contradictoria, de otra derivación equivalente de menor nivel es una simple
transformación de un objeto finito en otro objeto finito, y la complicación
viene sólo de la variedad de los casos posibles. Examinaré en detalle la ver-
sión de 1938. Presento el cálculo en la Sección 2.12.1. Este cálculo es in-
consistente si y sólo si hay derivaciones de la clase que llamaré “fatales”.
En la Sección 2.12.2 demuestro que toda derivación fatal se deja reducir a
otra de la misma clase, construida de tal modo que preceda a la primera en
el orden definido por Gentzen. En la Sección 2.12.3 doy la definición de
este orden, lo uso para fundamentar la inducción arriba esbozada y hago
algunas observaciones sobre la índole de ésta y su utilidad dentro y fuera
del programa de Hilbert.

2 Como cada derivación es una colección finita de signos es posible asignarle un gödel
a cada una, ordenarlos de menor a mayor y contarlos.
3 Concretamente, el primer ordinal ξ, tal que ωξ = ξ. Este es el número que Cantor lla-
mó ε0 (1895/97, §20). Es, por cierto, un número de la Clase II: el conjunto de sus
predecesores es infinito pero numerable (véase el capítulo 1.5).
2.12 La prueba de Gentzen 423

2.12.1 Un cálculo aritmético

En 1934, Gentzen y Jaßkowski introdujeron en sendas publicaciones


independientes los sistemas de “deducción natural” que prevalecen hoy en la
enseñanza de la lógica. En el Apéndice IX.G propuse, a modo de ejemplo,
un sistema deductivo de ese tipo, adaptado a nuestro CP1. El lector que no
lo haya visto debiera echarle una mirada ahora (pp. 496-99). Ese sistema es
muy parecido al que Gentzen adoptó en su artículo de 1935. En 1938 adopta
otro, que presentaré aquí. El cambio facilita la reducción en el nivel de las
derivaciones. Pero el nuevo cálculo es por lo menos tan poderoso como el
anterior. En su parte lógica, es por lo menos tan poderoso como el cálculo
de primer orden que Gödel (1930) demostró que era completo (véase Apén-
dice XVIII). Como se trata de probar la consistencia de la aritmética forma-
lizada en el cálculo, no importa que sea más poderoso: si no se puede deri-
var una contradicción en el cálculo más poderoso, tampoco se la puede de-
rivar en el más débil.
El cálculo de Gentzen (1938) es un cálculo predicativo de primer orden.
Gentzen no enuncia reglas para la formación de variables y predicados, pero
podemos adoptar las de nuestro CP1 (Apéndice IX.A). El signo 1 es la úni-
ca constante (en la aritmética formalizada, ‘1’ designa el primer número na-
tural).4 Cada variable es un término. 1 es un término. Si τ es un término, τ′
es un término. (El signo ′ opera pues como un functor pospuesto a su argu-
mento; en la aritmética formalizada, τ′ designa el siguiente del número de-
signado por τ). Un término que no contiene una variable es un término nu-
mérico. Se admite cualquier número de predicados de cualquier n-ariedad
con la única condición de que sean decidibles: si Φ es un predicado n-ario
y τ1,…, τn son términos en que no figura ninguna variable, tiene que haber
un procedimiento efectivo para decidir si Φτ1…τn es o no verdadero (en la
interpretación aritmética indicada). En los ejemplos de Gentzen figuran los

4 La elección del signo indica, sin duda, que Gentzen prefería contar desde uno: eins,
zwei, drei… Dadas nuestras preferencias, habría que entender que ‘1’ designa el nú-
mero cero (como en las representaciones gráficas de máquinas de Turing en la Sección
2.11.4), o reemplazarlo por el signo ‘0’. Pero el lector ya se habrá acostumbrado a
pensar que todo esto da lo mismo; el significado de la constante ‘1’ queda fijado tan
precisamente como es posible si estipulamos que ésta designa el único número que no
es el siguiente de otro.
2.12 La prueba de Gentzen 424

predicados binarios = y >, escritos, como es habitual, entre los términos a


que se aplican.5 El procedimiento de decisión en ambos casos es obvio: si τ1
y τ2 son términos sin variables, τ1 = τ2 es verdadero sí y sólo si hay igual
número de signos ′ en τ1 y τ2 y τ1 > τ2 es verdadero sí y sólo si hay mayor
número de signos ′ en τ1 que en τ2.6 Conviene advertir que ‘=’ no es aquí un
signo lógico: no hay reglas de inferencia para introducirlo ni su presencia o
ausencia desempeña un papel en las reducciones de nivel. Llamaré como
siempre fórmula elemental a la que consta de un predicado y el número jus-
to de términos (Gentzen dice Primformel).
Igual que en el cálculo del Apéndice IX.G, las fórmulas del cálculo se
organizan en secuentes. Un secuente está formado por dos listas finitas (posi-
blemente vacías) de fórmulas separadas por comas; entre las dos listas va el
signo ➛. Tal como en el Apéndice IX.G, llamo prefórmulas a las fórmulas
que preceden a ➛ y posfórmulas a las que le siguen. A diferencia del cálcu-
lo estudiado allí, cada secuente puede contener más de una posfórmula. Un
secuente sin variables libres es inválido (i) si todas sus prefórmulas son ver-
daderas y todas sus posfórmulas son falsas en cualquier interpretación en
que la constante 1 designa el primer número natural y el término τ′ designa
el siguiente del número designado por τ; (ii) si no tiene prefórmulas ni pos-
fórmulas, esto es, si se trata del secuente “vacío”. En cualquier otro caso, el
secuente es válido. En otras palabras: la conjunción de las prefórmulas de
un secuente válido garantiza la disyunción de las posfórmulas.
Hay seis símbolos lógicos. Como acabo de indicar, el signo ➛ separa las
prefórmulas de las posfórmulas en un secuente. Los otros cinco —que, imi-
tando a Gentzen, llamaré conectivos (él dice Verknüpfungszeichen)— son la
negación ¬, la conjunción ∧,7 la disyunción ∨ y los signos de cuantificación
∀ y ∃. Dichos conectivos tienen su significado habitual.8 Las fórmulas no

5 Para ajustarnos estrictamente al CP1 tendríamos que elegir dos predicados binarios, diga-
mos P2 y P21 y estipular que (τ1 = τ2) abrevia a P2τ1τ2 y (τ1 > τ2) abrevia a P21τ1τ2.
6 Fuera de = y >, veo un predicado más, el predicado ternario ‘x es congruente con y
módulo z’, que se utiliza una sola vez, en la fórmula ‘1′′′ ≡ 1 (mod 1′′)’, presentada
como ejemplo ilustrativo (Gentzen 1938, p. 23, al final del §1.4).
7 En vez de ∧, Gentzen usa & como signo de conjunción.
8 Conviene, sí, tener presente la siguiente advertencia de Gentzen (1935, p. 526): si ∀ᒕᑠ(ᒕ)
es una fórmula con un solo cuantificador y sin otra variable que ᒕ, “no tenemos que
asociar a ese ∀ la representación de una cantidad infinita cerrada de aseveraciones
2.12 La prueba de Gentzen 425

elementales se construyen a partir de las elementales, mediante conectivos y


paréntesis, tal como en el CP1.
Para construir los secuentes y las derivaciones se requieren tres nuevos
signos de puntuación: la coma, que separa dos prefórmulas o dos posfórmulas
de un secuente; el espacio, que separa dos premisas de una inferencia, y la
raya horizontal, que va en cada inferencia entre la o las premisas y la con-
clusión. El espacio que es un signo de puntuación del cálculo se distingue
de otros blancos en la página porque deslinda a derecha e izquierda con
secuentes y abajo con una raya.9 (A diferencia de lo que ocurre en nuestro
Apéndice IX.G, el espacio y la raya no son aquí signos auxiliares introduci-
dos para facilitar nuestra presentación en castellano de las reglas de inferen-
cia, sino que forman parte de las derivaciones y contribuyen a determinar su
estructura; son, pues, signos del cálculo).
Una inferencia (Gentzen dice Schlußfigur, “figura de inferencia”) consta
de uno o dos secuentes escritos sobre una raya horizontal y un secuente escrito
bajo esa raya. Aquéllos son las premisas; éste la conclusión (Gentzen los
llama Obersequenzen —“secuentes de arriba”— y Untersequenz —“secuente
de abajo”—, respectivamente). Cada inferencia se ajusta a uno de los veinte
esquemas presentados a continuación. Siguiendo a Gentzen, represento me-
diante una mayúscula griega una fila —posiblemente vacía— de fórmulas
separadas por comas; mediante una mayúscula gótica, una fórmula cualquie-
ra; la minúscula gotica ᒑ representa un término cualquiera, las minúsculas
góticas ᑾ y ᒕ representan variables, y los signos lógicos y de puntuación están
representados homónimamente por ellos mismos. ᑠ(ᒑ/ᒕ) es la fórmula que
se obtiene al reemplazar la variable ᒕ por el término ᒑ en todas las posicio-
nes donde ᒕ está libre en ᑠ (cf. Apéndice IX.A, p. 485). La variable repre-
sentada en algunos esquemas por la letra ᑾ está sujeta a las restricciones que
se indican; Gentzen la llama la variable propia (Eigenvariable) de la infe-
rencia respectiva. En la inferencia estructural llamada corte, las fórmulas

particulares, sino que podemos concebir su sentido ‘finitamente’ (‘finit’) así: ‘Si la ᒕ se
reemplaza sucesivamente por números, empezando con el 1, entonces, por mucho que
se avance en la formación de números, se obtiene en cada caso una aseveración verda-
dera’.”
9 Si esta caracterización no parece suficientemente precisa, se puede reemplazar el espa-
cio entre premisas por un signo impreso, por ejemplo, el punto y coma.
2.12 La prueba de Gentzen 426

iguales, representadas con ᑞ, son las fórmulas cortadas en el corte. En las


inferencias con conectivo, la fórmula con conectivo destacada en la conclu-
sión es la fórmula principal de la inferencia.

ESQUEMAS DE LAS INFERENCIAS ESTRUCTURALES10

Debilitamiento Γ➛Θ Γ➛Θ

ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑞ

Contracción ᑞ, ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑞ, ᑞ

ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑞ

Permutación ∆, ᑞ, ᑟ, Γ ➛ Θ Γ ➛ Θ, ᑞ, ᑟ, ∆

∆, ᑟ, ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑟ, ᑞ, ∆

Corte Γ ➛ Θ, ᑞ ᑞ, ∆ ➛ Λ

Γ, ∆ ➛ Θ, Λ

10 A la inferencia estructural que llamo debilitamiento, Gentzen la llama Verdünnung, esto


es, ‘dilución’ o ‘desleímiento’ (‘thinning’ en la traducción inglesa de Szabo); pero, como
luego señala, “un ‘desleímiento’ representa tan sólo un debilitamiento (Schwächung)
del sentido sustantivo de un secuente” (1938, p. 31; cursiva en el original).
2.12 La prueba de Gentzen 427

ESQUEMAS DE LAS INFERENCIAS CON CONECTIVOS

∧ ∨
Γ ➛ Θ, ᑛ Γ ➛ Θ, ᑜ ᑛ, Γ ➛ Θ ᑜ, Γ ➛ Θ

Γ ➛ Θ, ᑛ ∧ ᑜ ᑛ ∨ ᑜ, Γ ➛ Θ

ᑛ, Γ ➛ Θ ᑜ, Γ ➛ Θ Γ ➛ Θ, ᑛ Γ ➛ Θ, ᑜ

ᑛ ∧ ᑜ, Γ ➛ Θ ᑛ ∧ ᑜ, Γ ➛ Θ Γ ➛ Θ, ᑛ ∨ ᑜ Γ ➛ Θ, ᑛ ∨ ᑜ

∀ ∃
Γ ➛ Θ, ᑠ(ᑾ/ᒕ) ᑠ(ᑾ/ᒕ), Γ ➛ Θ

Γ ➛ Θ, ∀ᒕᑠ ∃ᒕᑠ, Γ ➛ Θ
si la variable ᑾ no figura en la conclusión si la variable ᑾ no figura en la conclusión

ᑠ(ᒑ/ᒕ), Γ ➛ Θ Γ ➛ Θ, ᑠ(ᒑ/ᒕ)

∀ᒕᑠ, Γ ➛ Θ Γ ➛ Θ, ∃ᒕᑠ

¬
ᑛ, Γ ➛ Θ Γ ➛ Θ, ᑛ

Γ ➛ Θ, ¬ᑛ ¬ᑛ, Γ ➛ Θ
2.12 La prueba de Gentzen 428

ESQUEMA DE LAS INFERENCIAS INDUCTIVAS

IM ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ)

ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒑ/ᒕ)

si la variable ᑾ no figura en la conclusión

Como puede verse, éste último esquema autoriza la inducción matemática


ordinaria como procedimiento normal de inferencia dentro del cálculo. El
lector debe cerciorarse de que los otros 19 esquemas llevan en todo caso de
premisas válidas a conclusiones válidas.
Una derivación es una colección finita secuentes, separados por rayas hori-
zontales o espacios, con las propiedades que se enumeran a continuación.

(i) Cada raya horizontal separa las premisas de la conclusión de una


inferencia ajustada a uno de los 20 esquemas.
(ii) Hay un y sólo un secuente final que no está sobre ninguna raya (no
es premisa de una inferencia).
(iii) Hay uno o más secuentes iniciales que no están bajo ninguna raya
(no son conclusiones de inferencias).
(iv) Los secuentes iniciales pertenecen a una de las dos clases de secuentes
básicos, definidas a continuación:
(a) si ᑠ es una fórmula cualquiera, ᑠ ➛ ᑠ es un secuente básico
lógico (un SBL);
(b) si Γ y ∆ son listas finitas (no vacías) de fórmulas elementales,
el secuente Γ ➛ ∆ es un secuente básico matemático (un SBM) si
todo secuente obtenido reemplazando uniformemente cada varia-
ble en Γ y ∆ por un término numérico es un secuente válido.

Según esto, una derivación puede considerarse como un árbol finito de


secuentes, ordenado parcialmente por la relación x < z definida recursivamente
como sigue: x < z (i) si x es una premisa y z es la conclusión de una misma
inferencia o (ii) si hay en la derivación un secuente u tal que x < u y u < z.
2.12 La prueba de Gentzen 429

El Apéndice XVIII contiene varios ejemplos de derivaciones que el lector


puede examinar a la luz de lo que llevamos dicho.
En la caracterización de las derivaciones el único ingrediente que requie-
re una explicación es la definición de los SBMs. Para apreciar su alcance,
conviene distinguir entre SBMs con y sin variables. Como ya indiqué, todos
los predicados del cálculo son decidibles. Por lo tanto, si Γ y ∆ son listas
finitas de fórmulas elementales sin variables, habrá un algoritmo para deci-
dir si el secuente Γ ➛ ∆ es válido o no, esto es, si Γ ➛ ∆ es o no un SBM.
Pero si hay una o más variables en Γ o en ∆, tal decisión es generalmente
impracticable, ya que las sustituciones posibles de esa o esas variables por
términos numéricos no pueden completarse en un número finito de pasos y
la validez del secuente no puede certificarse sin ensayarlas todas. Como los
SBMs operan, en rigor, como axiomas del cálculo, éste no es lo que llama-
mos un cálculo efectivo. Ello no obstaculiza la tarea que Gentzen se ha pro-
puesto. Al contrario: mientras más poderoso sea un cálculo, mayor es el riesgo
de que sea inconsistente. Por eso, la generosa aceptación de toda clase de
axiomas aritméticos, decidibles o no, realza el valor de la prueba de consis-
tencia.

2.12.2 Reducciones

El sistema deductivo descrito es inconsistente si y sólo si permite derivar


el secuente vacío ‘ ➛ ’, que no tiene prefórmulas ni posfórmulas. En
efecto, si ‘ ➛ ’ es el secuente final de una derivación y ᑛ es una fórmula
cualquiera, hay una derivación cuyo secuente final es ‘ ➛ ᑛ ∧ ¬ᑛ’; esta
derivación se obtiene simplemente añadiendo una raya horizontal y el secuente
‘ ➛ ᑛ ∧ ¬ᑛ’ bajo la derivación anterior. (La inferencia añadida

➛ ᑛ ∧ ¬ᑛ

es una inferencia estructural por debilitamiento). Por otra parte, si ‘ ➛ ᑛ’


y ‘ ➛ ¬ᑛ’ son los secuentes finales de dos derivaciones del cálculo, se las
2.12 La prueba de Gentzen 430

puede unir en una derivación cuyo secuente final es ‘ ➛ ’:

➛ᑛ

➛ ¬ᑛ ¬ᑛ ➛ (¬)

➛ (corte)

Llamaré, por eso, fatal (entiéndase: para la consistencia del cálculo) a cual-
quier derivación cuyo secuente final es ‘ ➛ ’.11 Probaremos que no puede
haber una derivación fatal. En la prueba se usarán algunos términos que defino
a continuación.
Si una fórmula empieza con un conectivo, éste es el conectivo principal
de esa fórmula; si empieza con un paréntesis, su conectivo principal es el
conectivo cuyo alcance incluye el signo que sigue inmediatamente a este
paréntesis.12
El grado de una fórmula es el número de conectivos que contiene. El grado
de un corte es el grado de las fórmulas cortadas en él (representadas por ᑞ
en el esquema). El grado de una inferencia inductiva es el grado de la fór-
mula a que se refiere la inducción (representada por ᑠ en el esquema).
Sea  una derivación cualquiera. Decimos que el secuente σ precede inme-
diatamente en  al secuente σ′ (y que σ′ sigue inmediatamente a σ) si σ es
una premisa de una inferencia en  cuya conclusión es σ′. Si σ < σ′ (en el
sentido definido en 2.12.1), decimos que σ precede a σ′ o que está sobre σ′
y que σ′ sigue a σ o está bajo σ.
Asignaremos una altura a cada secuente σ en la derivación . Para ello,
atendemos al grado de cada corte e inferencia inductiva cuya conclusión está
bajo σ en . El mayor de esos grados es la altura de σ en . Este número
se utiliza luego de un modo decisivo al ordenar las derivaciones.

11 Gentzen la llama Widerspruchsherleitung, esto es, ‘derivación de una contradicción’.


El término es correctísimo, pero el equivalente castellano es demasiado largo para usarlo
a cada momento. La versión inglesa dice ‘contradictive derivation’, lo que sugiere fal-
samente que habría un vicio lógico en la derivación misma.
12 Para que esta definición sea aplicable hay que suponer escritos todos los paréntesis
que convencionalmente omitimos; por ejemplo, ‘A ∧ B’ es propiamente ‘(A ∧ B)’. El
alcance de los conectivos está definido en el Apéndice IX.I.
2.12 La prueba de Gentzen 431

Un hilo en la derivación  es una lista de secuentes 〈σ1,…,σn〉 que fi-


guran en , cada uno de los cuales precede inmediatamente al siguiente (en
otras palabras, si 1 ≤ k < n, σk aparece en  como premisa de una inferen-
cia cuya conclusión es σk+1). Diré que el hilo 〈σ1,…,σn〉 es un hilo com-
pleto en  si σ1 es un secuente inicial en  y σn es el secuente final de .13
Consideremos ahora todos los hilos en la derivación  que (i) contienen el
secuente final y (ii) no contienen ninguna inferencia con conectivo. La unión
de todos estos hilos constituye un árbol de secuentes que es una parte —
generalmente, una parte propia— de la derivación entera. Lo llamaremos,
con Gentzen, el trozo final (Endstück) de la derivación .
Supongamos que  es una derivación fatal. Con este supuesto, construire-
mos otra derivación fatal ❊ diseñada de modo que preceda a  en el orden
que se definirá en la Sección 2.12.3 (en cierto modo no enteramente obvio,
❊ es más simple que ).

Eliminación de las variables libres ociosas. Podemos suponer, sin pérdida


de generalidad, que  no contiene ninguna variable libre que no sea la va-
riable propia de una inferencia. En efecto, las variables libres que no tienen
éste carácter no contribuyen en nada a una derivación y pueden todas reem-
plazarse, digamos, por la constante 1 sin que ello afecte la corrección de la
inferencias. Podemos asimismo suponer que, si ᑾ es la variable propia de
una inferencia I en , ᑾ no es la variable propia de ninguna inferencia si-
tuada sobre I. En efecto, si ᑾ es también la variable libre de otra inferencia
I° situada sobre I, se la puede reemplazar en todas las posiciones que ocu-
pa sobre la conclusión de I° por una variable nueva —que no figure en toda
la derivación— sin afectar la corrección de las inferencias. (Recuérdese que
la variable propia de una inferencia no puede figurar en la conclusión de esa
inferencia).
Eliminación de las inferencias inductivas en el trozo final. Sea  el trozo
final de la derivación . Por definición,  sólo puede contener inferencias
estructurales o inductivas. Supongamos que contiene una o más inferencias
inductivas. Elijamos una bajo la cual no haya otra inferencia de esa clase.

13 Gentzen (1938, p. 24) define ‘hilo’ (Faden) en los términos que he utilizado para de-
finir un ‘hilo completo’, pero luego emplea el término ‘hilo’ como si lo estuviera en-
tendiendo de acuerdo con mi definición.
2.12 La prueba de Gentzen 432

Ella tiene la forma

ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ)

ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ)

donde ᒋ es un término numérico. Sea ᒋ ≠ 1 (el caso ᒋ = 1 se examina en la


nota 16). La conclusión no puede contener ninguna variable libre, porque
bajo ella no hay ninguna inferencia con variables propias.14 Para facilitar las
referencias, llamo  al trozo de  formado por esta inferencia inductiva y
todo lo que hay sobre ella. Obviamente,  constituye por sí misma una de-
rivación cuyo secuente final es ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ). Ahora bien, este se-
cuente se puede derivar mediante inferencias estructurales de las premisas
ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(1′/ᒕ); ᑠ(1′/ᒕ), Γ ➛ Θ, ᑠ(1′′/ᒕ); ᑠ(1′′/ᒕ), Γ ➛ Θ, ᑠ(1′′′/ᒕ);
… ; ᑠ(ᒋ–1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ) (donde ᒋ–1 representa el término numérico
que tiene un signo ′ menos que el representado por ᒋ), como indica el si-
guiente esquema parcial,

ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(1′/ᒕ) ᑠ(1′/ᒕ), Γ ➛ Θ, ᑠ(1′′/ᒕ)

ᑠ(1′/ᒕ), Γ, Γ ➛ Θ, Θ, ᑠ(1′′/ᒕ) (corte)

ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(1′′/ᒕ) ᑠ(1′′/ᒕ), Γ ➛ Θ, ᑠ(1′′′/ᒕ)

ᑠ(1/ᒕ), Γ, Γ ➛ Θ, Θ, ᑠ(1′′′/ᒕ) (corte)


.
.
.

ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ) (corte)

donde las rayas dobles representan contracciones y permutaciones y la cons-


trucción continúa en forma similar en el trecho entre los últimos dos cortes.

14 En el trozo final no hay inferencias con variables propias de los tipos ∀ o ∃, ni


inferencias tipo IM bajo la elegida.
2.12 La prueba de Gentzen 433

Llamaré premisas iniciales del esquema a los secuentes de la forma


ᑠ(ᒊ/ᒕ), Γ ➛ Θ, ᑠ(ᒊ′/ᒕ)
que en él son premisas sin ser conclusiones. En la derivación , la premisa
ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ) de la última inferencia inductiva es el secuente final
de una derivación  ( es igual al trozo de  que llamé , quitando la
última raya horizontal y el secuente bajo ella). En  la variable libre ᑾ no
es la variable propia de ninguna inferencia.15 Por lo tanto, se la puede reem-
plazar uniformemente por un dado término numérico, sin afectar la corrección
de las inferencias. Sea (ᒊ/ᑾ) la derivación obtenida al reemplazar la variable
ᑾ por el término numérico ᒊ en todas las posiciones libres de ᑾ en . Reem-
placemos en el último esquema, la premisa inicial ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(1′/ᒕ)
por (1/ᑾ), la premisa inicial ᑠ(1′/ᒕ), Γ ➛ Θ, ᑠ(1′′/ᒕ) por (1′/ᑾ) y, en
general, cada premisa inicial de la forma ᑠ(ᒊ/ᒕ), Γ ➛ Θ, ᑠ(ᒊ′/ᒕ) por (ᒊ/
ᑾ). El producto de este reemplazo es una derivación que llamaré 1. Si
reemplazamos en  el trozo  por 1 obtenemos una derivación fatal 1
que contiene una inferencia inductiva menos que .16 Repitiendo este
procedimiento un número finito de veces se obtiene una derivación fatal °
que no contiene ninguna inferencia inductiva en su trozo final.
Alianza de fórmulas en una derivación. Nuestro próximo paso será mostrar
que, si ° es una derivación fatal que sólo contiene inferencias estructurales
en su trozo final, hay una derivación fatal ✫ que no contiene debilitamien-
tos ni secuentes básicos lógicos (SBLs) en su trozo final. Pero antes definiré
un concepto que luego nos será muy útil. Es una relación que agrupa fórmu-
las iguales (copias de una misma fórmula) en lugares diferentes en una de-
rivación; esto es, una relación entre fórmulas situadas (marcadas, si se quie-
re, con un índice de su posición). En una inferencia estructural hay, por re-

15 De otro modo, ᑾ sería la variable propia de la inferencia elegida y de otra inferencia


que la precede. Esto contradiría nuestra suposición inicial sobre la unicidad de las va-
riables propias.
16 Consideremos ahora el caso —que arriba dejé de lado— en que el término numérico ᒋ
en la conclusión de la última inferencia inductiva de  es la constante 1. Entonces, esa
conclusión puede derivarse del SBL ᑠ(1/ᒕ) ➛ ᑠ(1/ᒕ), por debilitamientos y permu-
taciones. Llamemos 0 a esta derivación trivial. Reemplazando el trozo  por esta de-
rivación 0 se obtiene una derivación fatal que contiene una inferencia inductiva me-
nos que la derivación .
2.12 La prueba de Gentzen 434

gla general, grupos de fórmulas situadas que consideramos homólogas; por


ejemplo, las tres fórmulas representadas por la letra ᑞ en los esquemas de
la contracción, las dos representadas por ᑞ en los esquemas de permutación
y corte, las dos representadas por ᑟ en los esquemas de permutación; pero
también las fórmulas que ocupan la misma posición (primera, segunda,…,
enésima) en las dos copias de la lista de fórmulas representada en un esque-
ma por cierta mayúscula griega. Diré que dos fórmulas iguales que ocupan
lugares diferentes en una derivación están aliadas si figuran en la misma
inferencia y son homólogas en el sentido indicado. Sea ᑠ una fórmula situa-
da en el trozo final  de una derivación . La alianza de ᑠ en  es el
conjunto Aᑠ de fórmulas situadas en  caracterizado así: (i) ᑠ ∈ Aᑠ; (ii) si
ᑠ1 ∈ Aᑠ y ᑠ2 está aliada a ᑠ1, ᑠ2 ∈ Aᑠ.17 Ahora bien, si  es una deriva-
ción fatal, es claro que Aᑠ contiene las dos fórmulas cortadas en un corte.
En efecto, toda fórmula de Aᑠ que no sea una de las fórmulas cortadas en
un corte está aliada a una fórmula del secuente que sigue inmediatamente al
suyo. Como el secuente final de  no contiene fórmulas,  tiene que incluir
un corte —y sólo uno18— cuyas fórmulas cortadas sean copias de ᑠ y per-
tenezcan a Aᑠ. Lo llamo el corte propio de la alianza Aᑠ. Todas las fórmu-
las de la alianza Aᑠ están situadas sobre la conclusión de su corte propio.
Distinguimos el lado izquierdo de Aᑠ, formado por copias de ᑠ situadas en
hilos que terminan en la primera premisa del corte propio, y el lado derecho
de Aᑠ, formado por copias de ᑠ situadas en hilos que terminan en la segun-
da premisa del corte propio. Se advertirá que todas las fórmulas del lado
izquierdo son posfórmulas de sus respectivos secuentes, y que todas las del
derecho son prefórmulas. Cada lado de la alianza tiene la estructura de un
árbol cuya raíz es una de las dos fórmulas cortadas en el corte propio. Éste
se ramifica dondequiera haya copias de ᑠ aliadas en la premisa de una con-
tracción. Si un elemento de un lado es la fórmula agregada en la conclusión
de un debilitamiento o pertenece a un secuente inicial de la derivación, de-
cimos que es una fórmula inicial de ese lado y de la alianza Aᑠ.

17 ‘Aliada’ y ‘alianza’ corresponden, respectivamente, a los términos ‘gebunden’ y ‘Bund’,


empleados por Gentzen. La traducción inglesa dice ‘clustered’ y ‘cluster’.
18 Si hubiera dos, uno precedería al otro; pero las fórmulas cortadas en un corte no pue-
den pertenecer a una alianza que incluya fórmulas situadas bajo las premisas de ese
corte.
2.12 La prueba de Gentzen 435

Eliminación de los debilitamientos y los secuentes básicos lógicos en el tro-


zo final. Ahora procederemos a eliminar los debilitamientos y los SBLs del
trozo final ° de la derivación fatal °.
Sea D un debilitamiento que figura en °, sobre el cual no hay ningún
otro debilitamiento en °. Sea ᑠ la fórmula agregada en la conclusión de D.
Para formar una nueva derivación fatal que no contenga la inferencia D sim-
plemente eliminamos la conclusión de D y todas las copias de ᑠ que com-
ponen la alianza Aᑠ. Dos casos merecen atención. (i) Puede haber dos co-
pias de ᑠ aliadas en la premisa de una contracción; al borrarlas junto con su
aliada en la conclusión, la nueva conclusión resulta ser una copia de la nue-
va premisa y, por ende, se la puede eliminar completamente (la contracción
desaparece). (ii) El corte propio de Aᑠ contiene una copia de ᑠ que no está
al mismo lado que ᑠ; esa copia se elimina junto con el secuente a que per-
tenece y todos los secuentes situados sobre él; la otra copia de ᑠ en el corte
propio de Aᑠ se borra simplemente (como las demás en su lado); la conclu-
sión del corte se infiere de la premisa sobreviviente por debilitamientos y
permutaciones, como se verá comparando los esquemas siguientes.

Γ ➛ Θ, ᑞ ∆, ᑞ ➛ Λ Γ➛Θ

Γ,∆ ➛ Θ, Λ Γ,∆ ➛ Θ, Λ

Reflexionando sobre los esquemas de las inferencias estructurales el lector


se persuadirá de que el producto de la transformación a que ° ha sido so-
metida también es una derivación fatal, que contiene un debilitamiento me-
nos que °. Repitiendo el mismo proceso un número finito de veces, se
obtiene una derivación fatal °° que no contiene debilitamientos en su trozo
final °°.
Si ° contiene uno o más SBLs, elijamos uno que represento con ᑛ ➛
ᑛ. Como el secuente final no contiene fórmulas, ᑛ ➛ ᑛ tiene que ser la
premisa de una inferencia. No puede serlo de una permutación ni de una
contracción. Por lo tanto, tiene que ser una de las premisas de un corte.
Entonces la conclusión de ese corte será igual a la otra premisa, como se ve
en los esquemas siguientes.
2.12 La prueba de Gentzen 436

ᑛ➛ᑛ ᑛ, ∆ ➛ Λ Γ➛Θ ᑛ➛ᑛ


ᑛ, ∆ ➛ Λ Γ ➛ Θ, ᑛ

Es posible, pues, eliminar el corte, borrando el SBL ᑛ ➛ ᑛ e identificando


la conclusión con la otra premisa, sin detrimento de las demás inferencias.
Repitiendo este proceso se eliminan en un número finito de pasos todos los
SBLs contenidos en el trozo final de la derivación °°.
Reducción del conectivo. Hemos demostrado que si existe una derivación fatal
, también hay una derivación fatal ✫ cuyo trozo final ✫ no contiene
variables libres, inferencias inductivas, debilitamientos o secuentes básicos
lógicos. Si ✫ no contiene ninguna inferencia con conectivo, ✫ coincide
con su trozo final. Las características de ✫ implican, en tal caso, que todos
sus secuentes iniciales son secuentes básicos matemáticos (SBMs). Estos
constan exclusivamente de fórmulas elementales. Como no contienen varia-
bles libres —puesto que ✫ no las contiene— dichos secuentes expresan
verdades aritméticas decidibles. Evidentemente, el secuente ‘ ➛ ’ no se
puede derivar de tales secuentes mediante cortes, contracciones y permu-
taciones. Por lo tanto, si ✫ es una derivación fatal, ✫ contiene al menos
una inferencia con conectivo. Voy a mostrar que en tal caso existe una deri-
vación fatal † que precede a ✫ en el orden que definiremos en la Sección
2.12.3 (como allí se verá). Llamaré a la transformación de ✫ en † la re-
ducción del conectivo —ya que Gentzen la llama Verknüpfungsreduktion—
pero ella no envuelve la eliminación de un conectivo; la preposición ‘de’
significa aquí ‘concerniente a’.
El trozo final ✫ de la derivación ✫ está formado por hilos que conver-
gen en el secuente final ‘ ➛ ’. Algunos de esos hilos pueden empezar —
por arriba— con SBMs que no contienen variables libres, pero al menos uno
de ellos empieza con la conclusión de una inferencia con conectivo, cuya
premisa o premisas quedan, por definición, fuera de ✫. Si hay varios hilos
de esta clase, asignamos un gödel a cada uno y elegimos el de numeración
más baja, que llamaré h. Sea ᑢ la fórmula principal de la inferencia con
conectivo cuya conclusión constituye el extremo superior del hilo elegido.
Diré que ᑢ es la fórmula crítica de la reducción. Consideremos la alianza
Aᑢ que ᑢ forma dentro de ✫ con otras fórmulas iguales a ella. En el corte
propio de Aᑢ las fórmulas cortadas son copias de ᑢ. Por lo tanto, la premi-
2.12 La prueba de Gentzen 437

sa de dicho corte que no está en el hilo h, pertenece a otro hilo g cuyo


extremo superior también es la conclusión de una inferencia con conectivo.
(De otro modo, dicha premisa pertenecería sólo a uno o más hilos comple-
tos contenidos enteramente en el trozo final ✫, que no contiene debilita-
mientos ni SBLs, y por ende no podría contener una fórmula con un
conectivo). Para fijar ideas, supongamos que ∀ es el conectivo principal de
la fórmula crítica de la reducción. Entonces la derivación fatal ✫ contiene
el trozo representado esquemáticamente en el Cuadro 1:

CUADRO 1

[h] . . [g]
. .
. .
Γ1 ➛ Θ1, ᑠ(ᑾ/ᒕ) ᑠ(ᒋ/ᒕ), Γ2 ➛ Θ2
Γ1 ➛ Θ1, ∀ᒕᑠ ∀ᒕᑠ, Γ2 ➛ Θ2 [a1]
.. ..
.. ..
.

.
..

..
.

.
..

..
..

..

.. ..
..

..
..

..

.. ..

Γ ➛ Θ, ∀ᒕᑠ ∀ᒕᑠ, ∆ ➛ Λ
Γ, ∆ ➛ Θ, Λ [b1]
..
..
.

..
.

..
..

..
..
..

..

Γ3 ➛ Θ3 [c1]
..
..
.

..
.

..
..

..
..
..

..


2.12 La prueba de Gentzen 438

Las líneas punteadas sobre los primeros secuentes anotados representan las
ramas de ✫ que confluyen en los hilos h y g, respectivamente. Cualquier
otra línea punteada vertical representa la continuación de h y g entre los
dos secuentes que enmarcan esa línea. Las líneas punteadas inclinadas que
salen de una misma vertical representan los hilos —0, 1, 2 o más— que
desembocan en el representado por ésta, entre los dos secuentes que la
enmarcan. El término ᒋ en la premisa de la inferencia con conectivos al lado
derecho tiene que ser un término numérico, ya que esa no es una inferencia
con variable propia y no hay otras inferencias con variable propia bajo ella.20
He escrito [a1] frente a las dos conclusiones de inferencias con conectivo
con que empiezan los hilos h y g; [b1] frente al corte propio de la alianza
de la fórmula ∀ᒕᑠ, y [c1] frente al primer secuente bajo dicho corte cuya
altura es menor que la altura de las premisas de ese corte (tiene que haber
un secuente así, puesto que el secuente final tiene altura 0).21 Este secuente
puede ser la conclusión de ese corte, en cuyo caso las líneas marcadas con
[b1] y [c1] coinciden. También puede ocurrir que las premisas del corte sean
las conclusiones marcadas con [a1] y que su conclusión sea el secuente final
‘ ➛ ’. Estas situaciones especiales simplifican la reducción del conectivo
sin afectarla.
La reducción del conectivo ∀ en la posición indicada transforma la deri-
vación ✫ en la derivación † presentada esquemáticamente en el Cuadro 2
(p. 456). Las líneas punteadas marcadas con [h] y [g] representan sendas
copias de los árboles marcados del mismo modo en el Cuadro 1. Se ha in-
vertido el orden para acomodar dos árboles nuevos marcados [h′] y [g′] que
se combinan en cortes con la continuación de [h] y [g], como se indica en
la línea [c2]. Hasta la línea [a2], [g′] es simplemente una copia de [g] y [h′]
es el resultado de reemplazar en [h] la variable ᑾ, en todas sus posiciones
libres, por el término numérico ᒋ. Bajo la línea [a2], [h′] y [g′] se continúan
con permutaciones y un debilitamiento para obtener las conclusiones que
ocupan la línea [b2]. La línea [d2] contiene los primeros secuentes cuya altu-

20 Según acordamos arriba, la derivación entera no contiene variables libres que no sean
variables propias de una inferencia. En virtud de la eliminación de las inferencias
inductivas en el trozo final, éste no contiene ninguna inferencia con variable propia.
21 Recuérdese que la altura de un secuente en una derivación es el más alto grado poseí-
do por un corte o inferencia inductiva cuya conclusión está bajo ese secuente.
2.12 La prueba de Gentzen 439

ra es inferior a la de las premisas del corte respectivo en la línea [c2] ([d2]


corresponde pues a [c1] en el Cuadro 1). Los secuentes de la línea [e2] se
derivan por cero, una o más permutaciones de sus respectivos predecesores
en la línea [d2]. La línea [f2] contiene la conclusión de lo que llamaremos
con Gentzen el nuevo corte. La línea [g2] se deriva de [f2] mediante contrac-
ciones y permutaciones. Las rayas horizontales dobles representan, pues, cero,
una o más inferencias estructurales triviales, según haga falta en cada caso.22
A la luz de estas indicaciones es fácil ver que † es una derivación genuina.
Aunque, a primera vista, † parece más compleja que ✫, una mirada más
atenta descubre sutiles simplificaciones. El corte propio de la alianza de ∀ᒕᑠᒕ
en ✫, marcado con [b1], es en cierto sentido homólogo a los cortes marca-
dos con [c2] en †; pero sobre cada uno de estos cortes hay una inferencia
con conectivo menos que sobre el corte propio de la alianza de ∀ᒕᑠᒕ en
✫. En otro sentido, al corte propio de la alianza de ∀ᒕᑠᒕ en ✫ le corres-
ponde en † el nuevo corte (entre las líneas [e2] y [f2]); pero el grado de
éste —esto es, el número de conectivos en las fórmulas cortadas— es menor
que el de aquél. Como pronto veremos, el orden que Gentzen establece en-
tre las derivaciones está pensado para aprovechar estas diferencias.
Si el conectivo principal de la fórmula crítica de la reducción no es ∀
hay que modificar algunos detalles de la transformación. Si es ∧, la fórmula
crítica tiene la forma ᑛ ∧ ᑜ. Entonces, en el esquema de la derivación ✫
la inferencia con conectivo al lado izquierdo tendrá la forma

Γ1 ➛ Θ1, ᑛ Γ1 ➛ Θ1, ᑜ
Γ1 ➛ Θ1, ᑛ ∧ ᑜ [a]

y la inferencia con conectivo al lado derecho tendrá una de las formas

ᑛ, Γ2 ➛ Θ2 ᑜ, Γ2 ➛ Θ2
ᑛ ∧ ᑜ, Γ2 ➛ Θ2 ᑛ ∧ ᑜ, Γ2 ➛ Θ2 [a]

22 Puede ocurrir que el secuente que precede inmediatamente a un par de rayas tenga ya
la forma del secuente que inmediatamente las sigue; en tales casos, se sobreentiende
que la derivación no contiene dichas inferencias y que hay un solo secuente donde el
esquema presenta dos.
2.12 La prueba de Gentzen 440

Bajo la línea [a], hallaremos también ᑛ ∧ ᑜ en lugar de ∀ᒕᑠ y una de las


fórmulas ᑛ o ᑜ en vez de ᑠ(ᒋ/ᒕ). La derivación † se ajusta facilmente a
estos cambios (ensáyelo el lector). En particular, el árbol marcado [h′] con-
tiene sobre la primera raya horizontal solamente una derivación del secuente
ᑛ, Γ2 ➛ Θ2 (respectivamente, ᑜ, Γ2 ➛ Θ2).
Si el conectivo principal de la fórmula crítica de la reducción es ¬, las
dos inferencias con conectivo en el esquema de la derivación ✫ tendrán la
forma

ᑛ, Γ1 ➛ Θ1 Γ2 ➛ Θ2, ᑛ
Γ1 ➛ Θ1, ¬ᑛ ¬ᑛ, Γ2 ➛ Θ2 [a]

En la derivación † los árboles designados con [h′] y [g] deben ir a la de-


recha de los designados con [h] y [g′]. Las partes superiores de [h′] y [g′]
tienen la forma

[g′] . . [h′]
. .
. .
Γ2 ➛ Θ2, ᑛ ᑛ, Γ1 ➛ Θ1 [a]

¬ᑛ, Γ2 ➛ Θ2, ᑛ ᑛ, Γ1 ➛ Θ1, ¬ᑛ [b]

El lector debe hacer los cambios correspondientes en el resto del esquema


que representa a † y verificar que el resultado es una derivación genuina.
Dejo también a su cuidado el caso de los dos conectivos restantes, que re-
solverá sin dificultad aprovechando las relaciones de dualidad entre ∨ y ∧ y
entre ∀ y ∃. (Cambie las prefórmulas en posfórmulas y viceversa y ponga a
la derecha el árbol de la izquierda y a la izquierda el de la derecha).
2.12 La prueba de Gentzen 441

2.12.3 Orden de las derivaciones e inducción transfinita

Gentzen ordena las derivaciones asignándole a cada una un elemento de


una colección bien ordenada de objetos definidos por él. Aunque los llama
‘números ordinales’ (Ordnungszahlen) y los designa con símbolos tomados
de Cantor, Gentzen advierte que esos símbolos y las operaciones con que
los combina “han de entenderse para nuestros propósitos de un modo ente-
ramente formal, sin que haya que atribuirles ningún sentido, como que ω es
‘un número infinito’ y el signo ‘+’ representa la ‘adición’” (1938, p. 38).
Luego diré algo sobre el sentido y los méritos de esta advertencia. Pero aten-
damos primero a la definición de los ordinales de Gentzen.
Gentzen define recursivamente una secuencia infinita ᑭ0, ᑭ1, ᑭ2,… de
“sistemas”, y relaciones de igualdad (=) y de orden (>) entre los objetos que
los forman. El sistema ᑭ0 consta de un solo objeto, llamado 0. En ᑭ0, las
dos relaciones mencionadas se definen por las condiciones: (i) 0 = 0 y (ii)
es falso que 0 > 0. Supongamos ahora que ya se ha definido la composición
del sistema ᑭn, así como las relaciones de igualdad y orden en ᑭn (n ∈
ˆ).23 Entonces, el sistema ᑭn+1 comprende (i) el 0 y (ii) todos los objetos
de la forma

ωα1 + ωα2 +…+ ωαm (*)

donde m ∈ ˆ, α1, α2,…, αm pertenecen a ᑭn y α1 ≥ α2 ≥ … ≥ αm. Las


relaciones de igualdad y orden en ᑭn+1 se definen así: Sean α = ωα1 + ωα2
+…+ ωαp y β = ωβ1 + ωβ2 +…+ ωβq elementos de ᑭn+1 (p ≤ q); entonces

(a) α = β si y sólo si p = q y αk = βk (1 ≤ k ≤ q);


(b) α > β si αi = βi para todo i < k ≤ q, αk ≠ β y αk > βk, o si αk = βk
para todo k ≤ q y q < p;
(c) α > 0, a menos que α = 0.

23 Gentzen escribe: “Die Zahlen des Systems ᑭρ (ρ sei eine natürliche Zahl oder 0) seien
bereits definiert, ebenso = und <-Beziehung zwischen diesen” (1938, p. 38). Tendré
ocasión de referirme a este pasaje al final de esta sección.
2.12 La prueba de Gentzen 442

Como de costumbre, si α > β (en palabras: α es mayor que β), decimos


también que β < α (en palabras: β es menor que α). Es claro que si α y β
pertenecen a ᑭn+1, se cumple una y solo una de las tres condiciones siguien-
tes: α > β, α = β o α < β.
Los ordinales de Gentzen son los elementos de los sistemas ᑭ0, ᑭ1,
ᑭ2,… Como el lector puede fácilmente verificar, si n y m son dos núme-
ros naturales tales que n es menor que m, ᑭn está incluido en ᑭm. La inyec-
ción canónica ᑭn Æ ᑭm, x Å x obviamente preserva las relaciones de igual-
dad y orden. Es obvio asimismo que, dada una expresión cualquiera, es po-
sible decidir efectivamente si posee o no la forma (*) y, por lo tanto, si es o
no un ordinal. Dadas dos expresiones de la forma (*) es posible decidir
efectivamente si son o no iguales, y en caso que no lo sean, cuál de las dos
es mayor. (También, por cierto, si una de las expresiones dadas es el 0). Por
lo tanto, todos estos conceptos son “finitistas” (“finit”) en el sentido de
Hilbert, concluye Gentzen (1938, p. 38). Con todo, la misma notación adop-
tada conduce inevitablemente a establecer una correspondencia biunívoca entre
los ordinales de Gentzen y un segmento de los ordinales de Cantor, como
sigue: 0 Å 0, ω0 Å 1, ω0 + ω0 Å 2,… , ω1 Å ω, ω1 + ω0 Å ω + 1,…
En suma, a cada ordinal de Gentzen le corresponde de manera exclusiva su
homónimo en el sistema de Cantor. Según Gentzen, esta correspondencia se
introduce —así como la nomenclatura que la sugiere— sólo para facilitar la
comprensión a los lectores familiarizados con la teoría de conjuntos. Pero es
mucho más profunda que las analogías y homonimias didácticas habituales.
La correspondencia es un isomorfismo de órdenes, puesto que la relación >
entre los ordinales de Gentzen se definió, como es obvio, en armonía con la
relación ‘mayor que’ entre sus homónimos cantorianos. En virtud del iso-
morfismo, cada sistema gentzeniano ᑭk (k ≥ 0) corresponde, a un conjunto
de ordinales cantorianos que también llamaré ᑭk. Tales conjuntos contienen
los ordinales que se indican a continuación:

ᑭ0 = {0}
ᑭ1 = ᑭ0 ∪ {1, 2,…} = {x: x < ω}
ᑭ2 = ᑭ1 ∪ {ω, ω+1, ω+2,…} = {x: x < ωω}
ω
ᑭ3 = {x: x < ωω }
ωω
ᑭ4 = {x: x < ωω }
.....................
2.12 La prueba de Gentzen 443

Cantor llamó ε0 al ordinal más pequeño que satisface la ecuación ωξ = ξ. Es


claro, pues, que el sistema ordenado que forman todos los ordinales de
Gentzen es isomórfico a ε0. El isomorfismo permite transferir a los ordinales
de Gentzen las operaciones de adición, multiplicación y exponenciación
transfinitas definidas en el Capítulo 1.5. En tal caso, el signo +, no obstante
la advertencia de Gentzen, funciona precisamente como signo de adición. En
su exposición, Gentzen aduce la multiplicación y la exponenciación, pero
advierte enfáticamente que estos conceptos “sirven, por cierto, sólo para
aclarar las cosas, ya que de ninguna manera están definidos para nosotros”
(1938, p. 40).24 Por otra parte, introduce formalmente una operación algebraica
binaria entre sus ordinales, como sigue. Sean α = ωα+ ωα2 +…+ ωαp y
β = ωβ1 + ωβ2 +…+ ωβq dos ordinales de Gentzen. Entonces la suma natu-
ral α ⱅ β es el ordinal que se obtiene escribiendo p + q copias de ω sepa-
radas por el signo + y asignándoles los “exponentes” α1,…, αp, β1,…,
βq, ordenados de mayor a menor. Evidentemente, la suma natural es una ope-
ración conmutativa y asociativa. Es fácil probar que (α ⱅ β) > α y que si α′
> α, (α′ ⱅ β) > (α ⱅ β).25 En adelante —imitando a Gentzen— llamo 1 al
ordinal gentzeniano ω0 y ω a ω1.
Gentzen asigna a cada derivación un ordinal de los suyos mediante el
procedimiento que paso a explicar. Sea  una derivación cualquiera.  consta
de uno o más secuentes y rayas horizontales. Asignamos un ordinal a cada
secuente y a cada raya, según la posición que ocupa en  (dos copias del
mismo mismo secuente pueden tener distintos ordinales). Llamo O(σ) al
ordinal asignado al secuente σ (en una determinada posición). Si σ es un
secuente inicial, O(σ) = 1. El ordinal O(λ) de una raya λ se determina así:
(i) si λ pertenece a un debilitamiento, permutación o contracción cuya pre-
misa es un secuente σ, O(λ) = O(σ); (ii) si λ pertenece a un corte con premisas
σ1 y σ2, O(λ) = O(σ1) ⱅ O(σ2); (iii) si λ pertenece a una inferencia con

24 Me confieso incapaz de entender cómo un concepto que para nosotros no está definido
de ninguna manera (gar nicht definiert) puede contribuir a la clarificación (zur Er-
läuterung dienen).
25 Como el lector habrá advertido, la suma natural así definida se aplica sólo a los ordinales
mayores que 0. Pero no cuesta nada incluir al 0 en el dominio de la operación estipu-
lando que α + 0 = 0, cualquiera que se α. Entonces, la condición α ⱅ β > α se cum-
ple sólo si β ≠ 0.
2.12 La prueba de Gentzen 444

conectivo con una sola premisa σ, O(λ) = O(σ); (iv) si λ pertenece a una
inferencia con conectivo con dos premisas σ1 y σ2, O(λ) = max(O(σ1), O(σ2));
(v) si λ pertenece a una inferencia inductiva cuya premisa tiene el ordinal α
= ωα1 + ωα2 +…+ ωαp, O(λ) = ωα1+1 (naturalmente, si α1 = 0, O(λ) = ω1 =
ω). Sea ς la conclusión bajo la raya λ. El ordinal O(ς) se determina compa-
rando la altura h de ς con la altura h* de las premisas sobre λ. Si h = h*,
O(λ)
O(ς) = O(λ). Si h = h*– 1, O(ς) = ωO(λ). Si h = h*– 2, O(ς) = ωω . Si h
ωO(λ)
= h*– 3, O(ς) = ωω , etc. La utilidad de estas reglas, al parecer capricho-
sas, se verá en la próxima etapa del razonamiento. Por ahora, basta que el
lector se convenza, analizando ejemplos, de que ellas asignan unívocamente
un genuino ordinal a cada secuente de la derivación . El ordinal O() asig-
nado a la derivación misma es el ordinal de su secuente final.
En la Sección 2.12.2 se demostró que, si existe una derivación fatal ,
también existe una derivación fatal †, construida a partir de  mediante la
serie de transformaciones que allí se explica. Ahora demostraré que O(†) <
O(), examinando dichas transformaciones una a una. Al leer los próximos
párrafos conviene tener presentes los párrafos de igual título en la Sección
2.12.2.
Eliminación de variables libres ociosas. Dimos por supuesto que  no con-
tenía ninguna variable libre que no fuera la variable propia de una inferen-
cia, ni dos variables iguales que fueran variables propias de dos inferencias
distintas. Esta suposición no afecta el ordinal O(). En efecto, si  no cum-
ple esta doble condición y ✠ es la derivación fatal obtenida mediante las
sustituciones de variables descritas bajo este mismo título en la Sección 2.12.2,
es claro que O() = O(✠).
Eliminación de las inferencias inductivas en el trozo final. Supongamos que
 contiene inferencias inductivas en su trozo final y que 1 es la derivación
obtenida al eliminar la última de esas inferencias inductivas del modo des-
crito bajo este mismo título en la Sección 2.12.2. Supongamos que, igual
que allí,

ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ)

ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ)
2.12 La prueba de Gentzen 445

es la forma de esa inferencia (con término numérico ᒋ ≠ 1). Sea ωα1 + ωα2
+…+ ωαn el ordinal de la premisa. Entonces, el ordinal de la raya horizon-
tal es ωα1+1. Ahora bien, la conclusión tiene la misma altura que la premisa,
ya que los cortes propios de las alianzas de ᑠ(1/ᒕ) y ᑠ(ᒋ/ᒕ) figuran bajo
ambas y tienen por lo menos el mismo grado que la inferencia inductiva
considerada. Por lo tanto, ωα1+1 es también el ordinal de la conclusión. En la
derivación 1, los “secuentes iniciales” del segmento de derivación que sus-
tituye a la inferencia inductiva eliminada se obtienen reemplazando la varia-
ble libre ᑾ por términos numéricos. Como tales reemplazos no afectan el
ordinal, esos “secuentes iniciales” tienen todos el mismo ordinal ωα1 + ωα2
+…+ ωαn. Los nuevos cortes que aparecen en 1 tienen todos el mismo
grado que la inferencia inductiva eliminada. Por lo tanto, el ordinal del
secuente ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ) al final del segmento sustituto es la suma
natural de los ordinales de dichos “secuentes iniciales” y su primer término
es ωα1, de tal modo que ese ordinal es menor que ωα1+1, el ordinal de la
conclusión de la inferencia inductiva eliminada. Como ahora se verá, esto
implica que O(1) < O(). En efecto, encontraremos bajo el referido secuente
ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ) solamente inferencias estructurales que la transfor-
mación de  en 1 no altera en nada. Los debilitamientos, permutaciones y
contracciones trasmiten a la conclusión el ordinal de la premisa. Por lo tan-
to, si no hay cortes bajo dicho secuente, es claro que O(1) < O(). Por otra
parte, un corte cuyas dos premisas tienen ordinales α y β trasmite a la con-
clusión el ordinal α ⱅ β. Si α1 < α, (α1 ⱅ β) < (α ⱅ β). Por lo tanto,
aunque haya cortes bajo el referido secuente, O(1) < O(). En la Sección
2.12.2 llamé 0 a la derivación fatal sin inferencias inductivas en su trozo
final obtenida eliminando una a una las inferencias de esa clase en el trozo
final de una derivación fatal cualquiera . Es posible que  misma no con-
tenga tales inferencias —en cuyo caso  = 0— pero, si las contiene, su
ordinal disminuye con la eliminación de cada una. Por lo tanto, O(0) ≤ O().
Eliminación de los debilitamientos y los secuentes básicos lógicos en el tro-
zo final. Nos toca ahora mostrar que O(✫) ≤ O(0), donde ✫ es la deriva-
ción fatal sin debilitamientos o secuentes básicos lógicos obtenida por trans-
formación de 0. Esta fase del razonamiento, aunque elemental, es engorro-
sa y Gentzen sugiere omitirla si uno se interesa sólo en “lo más esencial”
(das Wesentlichste—1938, p. 41). Pero en una demostración cualquier fase
2.12 La prueba de Gentzen 446

es igualmente esencial, a menos que sea superflua (en cuyo caso, se la pue-
de suprimir del todo). La transformación de 0 en ✫ consta de cero o más
etapas, en cada una de las cuales se elimina un debilitamiento o un SBL.
Una etapa dada puede envolver la eliminación de un corte o afectar única-
mente inferencias estructurales que no sean cortes. En este último caso, el
ordinal de la derivación transformada es igual al de la derivación obtenida.
Consideremos, pues, sólo el caso especial en que la transformación de 0 en
✫ consta de una sola etapa que elimina un corte en el trozo final. Entonces
puede ocurrir que disminuya la altura de los secuentes situados sobre ese
corte, no sólo en el trozo final, sino en la derivación entera.26 ¿Qué efecto
tiene tal reducción de alturas sobre el ordinal de la derivación? Para apre-
ciarlo mejor, y siguiendo el ejemplo de Gentzen, encaramos el asunto así:
sea σ la premisa del corte eliminado que sobrevive a la transformación; su-
pongamos que la altura de σ cae de h a h–1 y que esta reducción se propa-
ga, inferencia por inferencia, de conclusiones a premisas, a lo largo de todas
las ramas de la derivación que quedan sobre σ;27 si la altura de σ cae de h
a h–n, entendemos que el proceso se repite n veces; en todo caso, el efecto
global será el resultado de los efectos locales de la propagación (repetida o
no). Supongamos, entonces, que el “contagio” ha llegado a la conclusión ς
de cierta inferencia y pasa ahora a sus premisas π1 y π2 (a π1, si tiene sólo
una). Sean α y β, respectivamente, los ordinales de π1 y π2 antes de que
esto ocurra. Si π1 y π2 son secuentes iniciales, α = β = 1 y no cambian con
la reducción de altura. Por lo tanto, sólo nos interesa el caso en que π1 o π2
o ambas son conclusiones de inferencias. En tal caso, cuando el “contagio”
las alcanza, sus ordinales se transforman de α en ωα y de β en ωβ. El ordinal
de la raya horizontal, que, según el tipo de la inferencia en cuestión, era α,
o α ⱅ β, o max(α+1,β+1), o ωα1+1 (si se trata de una inferencia inductiva y
α = ωα1 + ωα1 +…+ ωαn), se convierte, respectivamente, en ωα, o en ωα ⱅ
ωβ, o en max(ωα+1,ωβ +1), o sigue siendo igual a ωα1+1. ¿Qué pasa con el
ordinal de la conclusión ς? Si antes del “contagio” la diferencia de altura
entre ς y sus premisas era 1, y se ha reducido, por ende, a 0, el ordinal de

26 La reducción de altura ocurre si y sólo si el corte eliminado tenía un grado g mayor


que el de cualquier otro corte situado bajo él.
27 La propagación hacia arriba llega hasta la conclusión del primer corte o inferencia
inductiva con grado g ≥ h, pero no pasa a sus premisas, cuya altura, por cierto, sigue
siendo g.
2.12 La prueba de Gentzen 447

ς después del “contagio” sigue siendo ωα, o se convierte de ωα ⱅ β en ωα ⱅ


α+1 α
ωβ, o de max(ωα+1,ωβ+1) en max(ωα +1,ωβ +1), o de ωω en ωω +…+1. En 1

cada caso, pues, el ordinal de ς es igual o menor que lo que era antes. Otro
tanto cabe decir si la diferencia entre ς y sus premisas era n > 1 y pasa a ser
n–1 (verifíquelo el lector). Este análisis demuestra que, cuando ocurre re-
ducción de alturas en el curso de la transformación de 0 en ✫, nunca au-
menta el ordinal de un secuente situado bajo otro cuya altura disminuye. En
particular, no puede aumentar el ordinal del secuente final, que es el ordinal
de la derivación. Si la transformación de 0 en ✫ tiene más de una etapa,
este resultado se aplica a cada una. Por lo tanto, O(✫) ≤ O(0).
La reducción del conectivo. Hemos logrado establecer que, si  es una de-
rivación fatal, hay derivaciones fatales 0 y ✫, con las propiedades señala-
das, cuyo ordinal es igual o menor que el ordinal de . Mas para demostrar
inductivamente que no hay ninguna derivación fatal es preciso comprobar
que, si hubiera una, existiría también otra cuyo ordinal es estrictamente menor
que el de la primera. La artificiosa operación que llamamos “reducción del
conectivo” garantiza justamente este resultado. Como sabemos, esta opera-
ción tiene que ser aplicable a una derivación fatal con las propiedades de
✫, si tal derivación existe, porque una derivación así tendría que incluir
por lo menos una inferencia con conectivo. Atendamos, pues, a la reducción
del conectivo aplicada al signo de cuantificación ∀, ilustrada en los Cuadros
1 y 2 de la Sección 2.12.2. Para facilitar las referencias, marqué allí ciertas
líneas con letras acompañadas del número del cuadro respectivo. Llamamos
✫ y † las derivaciones representadas en los Cuadros 1 y 2, respectiva-
mente. La líneas [c1] y [d2] son las primeras en que aparecen secuentes cuya
altura es menor que la altura de las premisas de los cortes en [b1] y [c2]. Sea
α el ordinal de la raya horizontal sobre [c1] y sean β y γ los ordinales de las
rayas horizontales sobre [d2]. Suponemos que β ≥ γ (β puede corresponder a
la raya de la derecha). Entonces α > β ≥ γ. Esta desigualdad se basa en lo
siguiente: (i) las alturas de los secuentes que preceden inmediatamente a
dichas rayas horizontales tienen el mismo valor —llamémoslo ρ— en ✫ y
†;28 (ii) sobre la raya en ✫ hay una inferencia con conectivo más que sobre

28 En efecto, dicha altura es el grado más alto de un corte bajo esas rayas (como se recor-
dará, no hay ninguna inferencia inductiva bajo ellas). Ahora bien, salvo por el nuevo corte
con grado 0 entre [d2] y [e2], todos los cortes bajo [c2] reproducen cortes bajo [b1].
2.12 La prueba de Gentzen 448

cada una de las rayas en †; (iii) si el ordinal de la premisa de esa inferen-
cia con conectivo es µ, el de su raya horizontal es µ+1 y ese 1 adicional se
trasmite a través de las inferencias —todas estructurales— que llevan de las
conclusiones anotadas en [a1] a las anotadas en [b1]; (iv) dicha inferencia
con conectivo ha sido reemplazada en † con inferencias estructurales cuyas
rayas horizontales tienen el mismo ordinal que las respectivas premisas. Como
ahora veremos, la desigualdad α > β ≥ γ implica que el secuente Γ3 ➛ Θ3
en la línea [g2] tiene un ordinal menor que el secuente Γ3 ➛ Θ3 en la línea
[c1]. Este último es el primer secuente bajo el corte propio de la alianza de
la fórmula ∀ᒕᑠ cuya altura —llamémosla u— es menor que la altura r de
las premisas de ese corte. Como ✫ y † son iguales bajo dicho secuente Γ3
➛ Θ3 es claro que la altura de éste en [g2] también es u. Asimismo, u es la
altura del secuente Γ3, Γ3 ➛ Θ3, Θ3 en la línea [f2], puesto que entre [f2] y
[g2] no hay ningún corte o inferencia inductiva. Entre las líneas [e2] y [f2]
ocurre el nuevo corte. Sea t la altura de sus premisas. Es claro que u ≤ t.
Comprobemos que t < r. En efecto, o bien t = u < r, o bien t es igual al
grado de la formula ᑠ(ᒋ/ᒕ) cortada en el nuevo corte; ahora bien, r es ma-
yor o igual que el grado de ∀ᒕᑠ, el cual, por cierto, es mayor que el grado
de ᑠ(ᒋ/ᒕ). Supongamos por el momento que las diferencias entre las alturas
r, t y u son mínimas, esto es, que r = t + 1 y t = u. Como el ordinal de la
raya horizontal sobre la línea [c1] es α, el ordinal de Γ3 ➛ Θ3 en ✫ es ωα.
Como los ordinales de las rayas horizontales sobre [d2] son β y γ (β ≥ γ),
los ordinales de los secuentes en [d2] son ωβ y ωγ. Estos ordinales se trasmi-
ten inalterados a través de las permutaciones entre [d2] y [e2]. Por lo tanto,
una de las premisas del nuevo corte tiene el ordinal ωβ y la otra el ordinal
ωγ, de modo que el ordinal de la conclusión del nuevo corte es ωβ ⱅ ωγ,
igual al ordinal de Γ3 ➛ Θ3 en †. Ahora bien, α > β ≥ γ implica que ωα
> ωβ + ωγ = ωβ ⱅ ωγ.29 Si las diferencias entre las alturas r, t y u exceden

29 Sea ᑭm el “sistema” de índice más bajo a que pertenecen α, β y γ. Utilizando la de-


finición de la relación < en ᑭm+1 es claro que ωα > ωβ + ωγ, puesto que el primer (y
único) “exponente” del ordinal de la izquierda es mayor que el primer “exponente” del
ordinal de la derecha. La desigualdad también puede probarse apelando al isomorfismo
entre los ordinales de Gentzen y un segmento de los ordinales cantorianos, puesto que,
si α, β, γ y ν son ordinales cantorianos tales que α > β ≥ γ y ν ≥ 3, να ≥ ν⋅νβ > 2νβ
≥ νβ + νγ. Pero esta prueba utiliza las propiedades de la multiplicación y la exponien-
ciación de ordinales, que sólo pueden definirse por inducción transfinita (cf. Apéndice
VIII).
2.12 La prueba de Gentzen 449

el mínimo, esto es, si r > t + 1 o t > u, en vez de la desigualdad ωα > ωβ +


ωγ se usa la desigualdad

. . . ωα . . . ω β+ ω . . . ω γ
ω..ω > ω..ω

Como ✫ y † son idénticas bajo el secuente Γ3 ➛ Θ3, la desigualdad en-


tre los ordinales de este secuente se trasmite al secuente final. Por lo tanto
O(†) < O(✫).

Hemos demostrado, pues, que si  es una derivación fatal, hay deriva-


ciones fatales, 0, ✫ y † tales que O(†) < O(✫) ≤ O(0) ≤ O(). Este
resultado lleva derechamente a la conclusión de que no hay derivaciones
fatales. Razonamos inductivamente, como sigue.

(I) Si  es una derivación tal que O() = 1,  no incluye cortes, inferen-


cias inductivas ni inferencias con conectivo.30 Consta, pues, de un
solo hilo y su secuente final reproduce las prefórmulas y posfórmulas
del secuente inicial (posiblemente acompañadas de otras, añadidas
por debilitamiento). Por lo tanto,  no es una derivación fatal.
(II) Sea α un ordinal de Gentzen mayor que 1. La hipótesis inductiva
dice que si  es una derivación tal que O() < α,  no es una de-
rivación fatal. Sea  es una derivación tal que O() = α. Entonces
 no puede ser fatal. En efecto, si lo fuera, existiría una derivación
fatal † tal que O(†) < O() = α, contradiciendo la hipótesis
inductiva.
(III) Como toda derivación tiene un ordinal de Gentzen igual o mayor
que 1, (I) y (II) implican que ninguna derivación es fatal.

En virtud del isomorfismo entre los ordinales de Gentzen y los ordinales


de Cantor, α recorre toda la serie de los ordinales entre 1 y ε0. Así, el argu-
mento enterior es una inducción transfinita hasta el ordinal cantoriano ε0. En

30 Como se recordará, en estas tres clases de inferencia, el ordinal de la conclusión es


mayor que el de las premisas y, por lo tanto, es mayor que 1. En cambio, las inferencias
por debilitamiento, contracción y permutación trasmiten a la conclusión el ordinal de
la premisa.
2.12 La prueba de Gentzen 450

este respecto, Gentzen subraya que si prescindimos de las inferencias induc-


tivas (de la clase IM; p. 428), la consistencia del cálculo puede establecerse
por su método sin recurrir a una inducción transfinita. Para ello, hay que
hacer los siguientes cambios en la asignación de ordinales a secuentes y de-
rivaciones: (i) escribir el número 3 donde antes escribíamos ω;31 (ii) reem-
plazar “suma natural” por “suma” (la operación aritmética ordinaria); (iii)
entender las relaciones < y =, así como las operaciones de multiplicación y
exponenciación, en su sentido aritmético ordinario (aplicado a números na-
turales). Si no hay inferencias IM en el cálculo, el argumento inductivo para
probar su consistencia puede utilizar el orden así definido. Entonces, obvia-
mente, el ordinal α mencionado en la hipótesis inductiva (II) es un número
natural y la conclusión (III) se obtiene por inducción ordinaria. Vemos así
que la inducción transfinita hasta el ordinal cantoriano ε0 se requiere sólo
para probar la consistencia del cálculo con inferencias IM. Ello no puede
sorprendernos. Al fin y al cabo, la escuela de Hilbert había establecido antes
de 1930, con métodos incuestionablemente finitistas, la consistencia de la
aritmética sin el Axioma P5 de Peano (que valida la inferencia inductiva
ordinaria). Por otra parte, en vista de los resultados de Gödel (1931), no es
posible probar la consistencia de un sistema de aritmética formalizada con
argumentos formalizables dentro de ese sistema, y la inducción matemática
ordinaria es obviamente formalizable en el cálculo de Gentzen si se admiten
las inferencias conforme al esquema IM. En suma, la prueba de Gentzen
excede los recursos corrientes de la metamatemática hilbertiana para lograr
un propósito que ya se sabía que era inalcanzable con ellos. A este respecto,
vale la pena anotar que Hilbert y Bernays (1939, §§5 y 3c) justificaron con
los recursos de la aritmética finitista la inducción transfinita hasta cualquier
ordinal menor que ε0,32 y que Gentzen (1943) estableció que la inducción
transfinita hasta ε0 no puede justificarse con dichos recursos. Esto quiere decir
que sus dos demostraciones de la consistencia de la aritmética (Gentzen 1935,
1938) exceden los recursos de la aritmética finitista sólo el mínimo indis-

31 Se usa el 3 por la razón indicada en la nota 29: 3 es el más pequeño número natural
n tal que si a, b, c ∈ ˆ y a > b ≥ c, na ≥ n⋅nb > 2nb ≥ nb + nc. Como vimos, esta
desigualdad se invoca en una etapa del razonamiento.
32 Gentzen aparentemente alude a este resultado cuando observa que la inducción trans-
finita hasta un ordinal menor que ε0 se puede demostrar en su cálculo (1938, p. 43).
33 El resultado de Gentzen 1943 puede verse como una confirmación independiente de
2.12 La prueba de Gentzen 451

pensable para no contradecir los resultados de Gödel (1931).33


Alfred Tarski observó en una ocasión que, aunque la prueba de consisten-
cia de Gentzen es sin duda muy interesante y puede resultar muy estimulan-
te y fecunda, no le parecía que “la consistencia de la aritmética fuese ahora
mucho más evidente para mí que antes de conocer esa prueba” (1954, p. 19;
cit. en Szabo 1969, p. 10). Pero Gentzen no pretendía demostrar la consis-
tencia de la aritmética. Como él mismo explica con insuperable claridad:

No se trata en absoluto de la consistencia (Widerspruchsfreiheit) del do-


minio de los números como tal, esto es, de las relaciones básicas entre los
números fijadas por los “axiomas” (por ejemplo, por los “Axiomas de
Peano” de la aritmética). Demostrar la consistencia de estos axiomas sin
dar ya por supuesto algo equivalente es impensable. Se trata más bien de
la consistencia de la deducción lógica (des logischen Schließens) aplicada
a los números naturales (a partir de sus axiomas), como se la practica en
las pruebas de la aritmética.
(Gentzen 1935, p. 498)

Concretamente, se trata de establecer que no es posible derivar contradicciones


en la aritmética formalizada en el cálculo de Gentzen, o en otro cálculo equi-
valente o menos poderoso. Para la escuela de Hilbert este resultado era
imprescindible, pues sólo sobre esa base se podía establecer la consistencia
de la teoría de conjuntos formalizada, recuperando así todas las comodidades
que ofrece al matemático “el paraíso de Cantor” sin suscribir la metafísica
cantoriana del infinito. En lo relativo al infinito, la postura de Gentzen era
bien decidida:

No se debe considerar un agregado infinito como cerrado y existente en


sí (infinitud actual), sino sólo como algo en devenir, que puede siempre
seguir edificándose constructivamente desde lo finito (infinitud potencial).
(Gentzen 1935, p. 524; cursiva en el original)34

Gödel 1931, que ilustra “de un modo directo la incompletud del formalismo aritméti-
co” (Szabo 1969, p. 17). Después de Gentzen, Ackermann (1940) y Schütte (1951) han
publicado nuevas pruebas de la consistencia de la aritmética elemental que, por cierto,
también se valen de la inducción transfinita hasta ε0.
34 Hablando de la tesis intuicionista de que las proposiciones sobre el infinito actual ca-
recen de sentido y deben, por ende, rechazarse aunque sean consistentes, Gentzen de-
clara: “Creo, por ejemplo, que en la teoría general de conjuntos una investigación
2.12 La prueba de Gentzen 452

Por eso mismo, como luego veremos, pone gran empeño en convencernos
de que su prueba de consistencia sólo emplea razonamientos finitistas, con-
forme a las exigencias de Hilbert. Pero esa prueba debe juzgarse valiosa
también aparte de todo melindre metafísico, especialmente ahora que tantos
resultados matemáticos son el producto de computaciones electrónicas que
sólo pueden verificarse cotejándolas con otras computaciones. Tal cotejo sólo
certifica —o, mejor dicho, hace sumamente probable— que las computacio-
nes son correctas, que las máquinas que las ejecutaron no han cometido
errores en la ejecución de las instrucciones del programa. Pero el resultado
de una computación correcta puede ser incorrecto si el programa mismo es
la versión electrónica de un cálculo inconsistente. De ahí que sea importante
probar la consistencia del cálculo incorporado en el programa, con métodos
evidentes para nosotros, aunque no sean formalizables en ese cálculo.
Aunque las alegaciones de Gentzen no acaben de persuadirnos de que su
inducción transfinita merece llamarse ‘finita’ o siquiera ‘finitista’ (finit), ex-
plican con gran claridad por qué tiene que resultarnos —y de hecho nos
resulta— evidente. Gentzen admite que, a diferencia de todos los otros pa-
sos de su prueba, la inducción transfinita no es propiamente elemental. Por
eso “encaramos aquí una tarea de índole completamente distinta: lo esencial
no es demostrar la inducción transfinita —lo cual no es difícil y se puede

metamatemática cuidadosa confirmará eventualmente que todas las cardinalidades ma-


yores que las numerables son en un sentido muy definido sólo una apariencia vacua y
que sería prudente prescindir de estos conceptos” (1936/37, en Gentzen, CP, p. 229).
35 Gentzen escribe “vielmehr sie auf finiter Grundlage zu beweisen”. Para el lector ale-
mán desapercibido finit no puede significar otra cosa que ‘finito, finita’. Pero entonces
la palabra tiene un significado inequívoco que no puede cubrir la inducción transfinita
de Gentzen, no sólo a causa de su nombre de mala fama (“ihres anrüchigen Namens
wegen”—Gentzen 1938, p. 44), sino porque ella recorre toda la serie de los números
naturales una multitud infinita —aunque numerable— de veces. Pero Gentzen dice
expresamente que el carácter ‘finit’ de su prueba no puede propiamente “demostrarse”
debido a que el concepto finit no está inequívocamente definido y malamente se puede
definir (“weil der Begriff ‘finit’ nicht eindeutig formal abgegrenzt ist und auch kaum
abgegrenzt werden kann”—1935, p. 557). Por eso, prefiero traducir finit con ‘finitista’
(los autores de habla inglesa dicen ‘finitary’) y dejar el significado de esta palabra en
la penumbra que el programa de Hilbert aparentemente necesita para sobrevivir.
2.12 La prueba de Gentzen 453

hacer de varias maneras— sino más bien demostrarla sobre una base
finitista,35 esto es, poner en claro que es un modo de inferencia acorde con
el principio de la concepción constructiva del infinito” (1938, p. 44). Para
que no quepa duda de esto, Gentzen subraya reiteradamente que sus ordinales
no son lo mismo que los ordinales de Cantor, sino unos objetos “formales”
—esto es, símbolos, figuras que pueden escribirse en un papel o en una pi-
zarra— definidos por él. Gentzen estima que su definición es estrictamente
constructiva: cada ordinal es una figura formada según reglas precisas con
los dos signos primarios 0 y ω. Dado un ordinal cualquiera α, sabemos cons-
truir su sucesor inmediato α + ω0. Pero ¿es justo llamar “constructivo” el
paso de cada sistema de ordinales ᑭn al sistema siguiente ᑭn+1? Dicho paso
presupone que los ordinales del sistema ᑭn ya estén definidos, y el número
de éstos es obviamente infinito (cf. p. 441, nota 23). Parecería que, contra-
riando el citado precepto de Gentzen, el sistema infinito ᑭn se tiene que con-
siderar aquí como cerrado, y no sólo como algo en devenir. Si este modo de
introducir sistema ᑭn+1 (para cada n ∈ ˆ) se ajusta a la “concepción construc-
tiva del infinito”, ¿en qué se aparta de ella la definición cantoriana de los
ordinales? Para responder a esta pregunta, conviene recordar los tres “prin-
cipios generadores” aducidos por Cantor (GA, pp. 195ss; vide supra, Capí-
tulo 2.5). El más aventurado de ellos, el principio “de inhibición o limita-
ción”, produce los ordinales cantorianos de las clases tercera y superior, y
por lo tanto no desempeña ningún papel en la definición de los ordinales de
Gentzen. Los otros dos presiden la generación (i) del ordinal siguiente a cada
ordinal dado y (ii) del ordinal límite de cada serie numerable infinita de
ordinales sucesivos. En virtud del isomorfismo entre los ordinales de Cantor
(< ε0) y los de Gentzen, es claro que éstos satisfacen tanto el principio (i)
como el principio (ii). Pero los ordinales de Gentzen no se generan según el
principio (ii) —que un finitista debiera cuestionar—, sino según una regla
que autoriza a escribir expresiones de la forma ωα1 + ωα2 +…+ ωαm con
cualquier número de exponentes αk seleccionados arbitrariamente en un sis-
tema de expresiones dado. Una regla como ésta, puramente sintáctica, es sin
duda constructiva. Para el finitista no hay pues ninguna dificultad en el trán-
sito de un sistema gentzeniano dado ᑭn al sistema siguiente ᑭn+1. Pero a la
luz de esta explicación resalta aún más la dificultad señalada arriba: si ex-
ceptuamos el sistema ᑭ0 cuyo único elemento es el objeto 0, ¿qué sistemas
de Gentzen están dados? El Axioma del Infinito de los conjuntistas nos da,
2.12 La prueba de Gentzen 454

por cierto, el sistema ᑭ1, y una vez que disponemos de él, no cuesta mucho
asegurarse los siguientes. Pero el Axioma del Infinito postula justamente un
agregado infinito actual, “cerrado y existente en sí”. ¿Puede uno aceptarlo y
seguir llamándose finitista? Y si uno acepta ese agregado y, como es habi-
tual, lo llama ω (en vez de concebir a este signo “de un modo enteramente
formal”, como pide Gentzen), ¿por qué inhibirse de aceptar Pω, P2ω,…,
Pωω,…? ¿Dónde se tira la raya?36
Después de Gentzen, la teoría de la prueba se consolida como una disci-
plina matemática que produce resultados interesantes mediante el análisis
combinatorio de la deducibilidad en los cálculos lógicos y las teorías mate-
máticas formalizadas en ellos (cf. los manuales de Schütte 1960 y Takeuti
1975); pero ya nadie la presenta a la manera de Hilbert como una fuente de
certeza filosóficamente incontrovertible, garantía de las ciencias y pilar de la
civilización (cf. p. 120, nota 10). En un artículo de enciclopedia publicado
en 1980,37 Schütte describe la teoría de la prueba (Beweistheorie) como una
de las divisiones de la “metamatemática” o investigación matemáticamente
exacta de teorías matemáticas formalizadas (se recordará que Hilbert usaba
Beweistheorie y Metamathematik como sinónimos). Schütte asigna a otra
división las cuestiones de computabilidad y decidibilidad que hemos visto
surgir de la problemática hilbertiana pero que ahora se estudian independien-
temente, en la teoría de las funciones recursivas y de los conjuntos recursi-
vamente enumerables (cf. los manuales de Rogers 1967 y Soare 1987), orien-
tada sobre todo hacia las “ciencias de la computación”. Por último, Schütte
incluye en la metamatemática una tercera división: “la teoría de modelos,
que se ocupa con las interpretaciones y las cuestiones de realizabilidad de
los sistemas de axiomas de la lógica y la matemática”. Como veremos en la
Parte 3, el enfoque y los métodos de la teoría de modelos han producido
desde los años 30 algunos hallazgos sumamente significativos para la filoso-
fía matemática conjuntista. Veremos allí que esta forma de “metamatemática”,
tal como la cultivan Tarski y Gödel, descarta el prejuicio finitista de Hibert
y aprovecha sin remilgos las facilidades de la teoría de conjuntos. En esta

36 Recomiendo leer las iluminadoras observaciones de Gödel sobre la inducción hasta ε0


(1958, pp. 281 s.; traducción inglesa en Gödel, CW, II, 243).
37 Ritter y Gründer, HWP, vol. 5, col. 1176, s.v. ‘Metamathematik, II’.
2.12 La prueba de Gentzen 455

forma, la “metamatemática” explora y perfecciona el paraíso de Cantor des-


de dentro, en vez de pretender cimentarlo y fortificarlo con recursos pedestres
desde fuera. La empresa alcanza su punto más alto cuando Gödel (1938, 1939;
cf. 1940) demuestra que la teoría de conjuntos de Zermelo-Fraenkel (ZF) es
compatible con el Axioma de Selección (AS) y la Hipótesis generalizada del
continuo (HGC). Quedó así establecido que las conjeturas más audaces de
Cantor —el teorema del buen orden, la hipótesis del continuo— son al me-
nos tan viables como el sistema ZF, cuya consistencia se acepta, en general,
sin discusión.38 El conjuntismo triunfante tendrá, sin embargo, un vuelco
sorprendente cuando Paul J. Cohen (1963/64, cf. 1966) demuestre, mediante
un novedoso método de construcción de modelos, que ZF es compatible tam-
bién con la negación de AS y la negación de HGC. Aunque aceptemos que
la citada demostración de Gödel prácticamente inmuniza al cantorismo con-
tra el riesgo de contradicción, ¿de qué vale esta seguridad, si el resultado
obtenido por Cohen muestra que el de Cantor no es el único paraíso conjun-
tista disponible y no tenemos cómo saber en cuál estamos parados?

38 Como ha dicho Boolos, “es apenas concebible que ZF sea inconsistente” (1987, en
Demopoulos, 1995, p. 219).
CUADRO 2

[h′] .. [g] .. .. [h] .. [g′]


. . . .
Γ1 ➛ Θ1, ᑠ(/) (/), Γ2 ➛ Θ2 Γ1 ➛ Θ1, (/) (/), Γ2 ➛ Θ2 [a2]

Γ1 ➛ (/), Θ1, ∀ (/), Γ2 ➛ Θ2 Γ1 ➛ Θ1, ∀ ∀, Γ2, (/) ➛ Θ2 [b2]
. . . .
.. .. .. ..
. . . .
..

..

..
..

..

..

..
.
..

..

..

..
..

..

..

..
.. .. .. ..

..

..

..

..
..

..

..

..
.. .. .. ..

Γ ➛ (/), Θ, ∀ ∀, ∆ ➛ Λ Γ ➛ Θ, ∀ ∀, ∆, (/) ➛ Λ


Γ, ∆ ➛ (/), Θ, Λ Γ, ∆, (/) ➛ Θ, Λ [c2]
. .
.. ..
. .
..

..
..

..
..

..
..

..
.. ..
..

..
..

..
.. ..

Γ3 ➛ (/), Θ3 Γ3, (/) ➛ Θ3 [d2]

Γ3 ➛ Θ3, (/) (/), Γ3 ➛ Θ3 [e2]


Γ3, Γ3 ➛ Θ3, Θ3

Γ3 ➛ Θ3
.
..
.
..

..
..
..

..
..
..

..


APÉNDICES
APÉNDICES

LAS DEFINICIONES CANTORIANAS DE


‘CONJUNTO BIEN ORDENADO’

Demostraré aquí que las dos definiciones de conjunto bien ordenado que dio
Cantor son equivalentes (v. Capítulo 1.5). Recordemos que un conjunto M
es un conjunto linealmente ordenado si y sólo si hay una relación binaria <
definida sobre M, tal que si a, b y c son distintos elementos de M (i) o bien
a < b o bien b < a, pero nunca las dos cosas a la vez; (ii) si a < b y b < c,
a < c; y (iii) nunca ocurre que a < a.
Formularé las condiciones características de un conjunto bien ordenado
según ambas definiciones en un cálculo predicativo de primer orden con
identidad =, predicados binarios ∈, ⊆, <, y una constante individual M que
designa el conjunto de referencia.1 Para simplificar la escritura empleo
cuantificadores restringidos. Esto quiere decir que la expresión ‘(∀x⊆M)Φ(x)’
debe leerse ‘todo objeto x que sea parte de M satisface la condición Φ’ y la
expresión ‘(∃y∈x)Φ(y)’ debe leerse ‘hay un elemento y del conjunto x, tal
que Φ(y)’. (En suma, (∀x⊆M)Φ(x) y (∃y∈x)Φ(y) abrevian, respectivamen-
te, a ∀x(x ⊆ M → Φ(x)) y ∃y(y ∈ x ∧ Φ(y))).

BUEN ORDEN (CANTOR 1899). Un conjunto linealmente ordenado M está bien


ordenado por la relación < si y sólo si toda parte no vacía de M tiene un
primer elemento (respecto al orden inducido por <), esto es, si y sólo si M
cumple la siguiente condición:

BO (∀x⊆Μ)(x ≠ ∅ → (∃y∈x)(∀z∈x)(z ≠ y → y < z))

1 En el Apéndice IX se explica el concepto de cálculo predicativo de primer orden para


beneficio de los lectores con cierta educación matemática que no hayan estudiado ló-
gica.

459
Apéndices 460

BUEN ORDEN (CANTOR 1883). Un conjunto linealmente ordenado M está bien


ordenado por la relación < si y sólo si M cumple las tres condiciones si-
guientes:

BO1 (∃x∈M)(∀y∈M)(x ≠ y → x < y)


(M tiene un primer elemento con respecto al orden inducido por <).

BO2 (∀x∈M)((∀y∈M)(y ≠ x → y < x)) ∨


(∃y∈M)(x < y ∧ (∀z∈M)(x < z ∧ z ≠ y → y < z)))
(Todo elemento de M que no sea el último elemento de M tiene un suce-
sor inmediato en el orden inducido por <).

BO3 (∀u⊆M)(u ≠ ∅ → (∃y∈M)((∀z∈M)(z ∈ u → z < y) ∧


(∀w∈M)((z ∈ u → z < w) → (y = w ∨ y < w)))
(Si una parte no vacía u de M tiene sucesores en el orden inducido por <
—esto es, si hay elementos de M que suceden a todos los elementos de
u—, u tiene un sucesor próximo — esto es, hay un elemento de M prece-
dido por todos los elementos de u pero a su vez precede a cualquier otro
elemento de M precedido por todos los elementos de u).

Paso a demostrar que si M ≠ ∅, la condición BO equivale a la conjunción


de BO1, BO2 y BO3.
BO implica BO1, puesto que M es una parte no vacía de M y por ende
tiene un primer elemento. Además, BO implica BO3. En efecto, sea u una
parte propia no vacía de M y sea u′ su complemento en M. Sea S(u) =
{w:z ∈ u → z < w}. Entonces, si S(u) ≠ ∅, la intersección u′ ∩ S(u) ≠ ∅ y
tiene un primer elemento y, que es el sucesor próximo de u. Si x es un ele-
mento de M que no es el último elemento de M, el mismo argumento prueba
que el conjunto {x} tiene un sucesor próximo, que es, por cierto, el sucesor
inmediato de x. Por lo tanto, BO implica BO2.
Por otra parte, si M no cumple la condición BO hay por lo menos una
parte no vacía que no tiene un primer elemento, esto es, un conjunto u ⊆ M
tal que u ≠ ∅ y para todo x ∈ u hay un y ∈ u tal que y < x. Sea [u] el
conjunto de los predecesores de u, es decir, sea [u] = {z ∈ M: (∀x∈M)(x ∈
u → z < x)}. Si [u] = ∅, M no tiene un primer elemento y, por ende, no
cumple la condición BO1. Si [u] ≠ ∅, [u] es una parte no vacía de M que
Apéndices 461

tiene sucesores pero no tiene un sucesor próximo, de modo que M no cum-


ple la condición BO3.

II

MÁS SOBRE EL BUEN ORDEN

Las definiciones y teoremas contenidos en este apéndice completan y preci-


san las ideas sobre conjuntos bien ordenados expuestas en el Capitulo 1.5.

DEFINICIÓN 1. Si los conjuntos K1 y K2 están ordenados, respectivamente, por


las relaciones <1 y <2, diremos que la aplicación ƒ: K1 Æ K2 es un morfismo
de órdenes si para todo x, y ∈ K1, x <1 y si y sólo si ƒ(x) <2 ƒ(y). Si ƒ
además es biyectiva decimos que es un isomorfismo de órdenes. Un isomor-
fismo cuyo dominio y codominio coinciden se llama un automorfismo. (Cuan-
do ello no dé lugar a confusión, omitiré la frase ‘de órdenes’ y diré sencilla-
mente ‘morfismo’, ‘isomorfismo’, ‘automorfismo’.)

DEFINICIÓN 2. Si 〈K,<〉 es un conjunto bien ordenado y x ∈ K, la sección


determinada por x en K es el conjunto bien ordenado 〈{z: z < x},<〉 y el re-
manente determinado por x en K es el conjunto bien ordenado 〈{z: x ≤ z},<〉.

PROPOSICIÓN 1. Si 〈K,<〉 es un conjunto bien ordenado y ƒ: K Æ K es un


morfismo, x ≤ ƒ(x) para todo x ∈ K.
Indudablemente, x ≤ ƒ(x) si x es el primer elemento de K. Supongamos
que x no es el primer elemento de K y que y ≤ ƒ(y) para todo y < x . Como
ƒ es un morfismo, ƒ(y) < ƒ(x). Por lo tanto, ƒ(x) está precedido por todos los
predecesores de x, de modo que x ≤ ƒ(x).

PROPOSICIÓN 2. Si 〈K,<〉 es un conjunto bien ordenado el único automorfismo


ƒ:K Æ K es la identidad, ƒ(x) = x.
Sea ƒ:K Æ K un automorfismo. Por la Proposición 1, x ≤ ƒ(x) para todo
Apéndices 462

x ∈ K. La aplicación inversa ƒ-1 también es un automorfismo, de suerte que


z ≤ ƒ-1(z) para todo z ∈ K. Reemplazando z por ƒ(x) en esta desigualdad,
tenemos que ƒ(x) ≤ ƒ-1(ƒ(x)) = x ≤ ƒ(x) para todo x ∈ K. Por lo tanto, x =
ƒ(x) para todo x ∈ K.

PROPOSICIÓN 3. Si los conjuntos bien ordenados 〈K1,<1〉 y 〈K2,<2〉 son isomór-


ficos, hay un solo isomorfismo ƒ: K1 Æ K2.
Sean ƒ: K1 Æ K2 y h: K1 Æ K2, isomorfismos. Entonces ƒ-1: K2 Æ K1 es
un isomorfismo y ƒ-1h es un automorfismo de 〈K1,<1〉. Por lo tanto ƒ-1h es
la identidad sobre K1, y ƒ = h.

PROPOSICIÓN 4. Si 〈K,<〉 es un conjunto bien ordenado y a es cualquier ele-


mento de K, 〈K,<〉 no es isomórfico a 〈[a],<〉, el segmento de K determinado
por a.
Para demostrar esta proposición, suponemos que es falsa y que hay un
isomorfismo ƒ con dominio K y alcance [a]. Por la Proposición 1, a ≤ ƒ(a),
ya que ƒ: K Æ K es un morfismo. Pero esto contradice la suposición de que
el alcance de ƒ es el conjunto de los predecesores de a.

PROPOSICIÓN 5. Si los conjuntos bien ordenados 〈K1,<1〉 y 〈K2,<2〉 no son iso-


mórficos, entonces 〈K1,<1〉 es isomórfico a una segmento de 〈K2,<2〉 o 〈K2,<2〉
es isomórfico a un segmento de 〈K1,<1〉.
Definiré una aplicación ƒx:[x] ∪ {x} Æ K2 para cada x ∈ K1 que cumpla
una de estas dos condiciones: o bien x es el primer elemento de K1, o bien
ƒz está definida para todo z <1 x y el alcance de ƒz no es igual a K2. Doy la
definición de ƒx mediante dos condiciones que corresponden, respectivamente,
a cada una de las dos partes disjuntas mencionadas en la descripción del
dominio de ƒx, a saber, {x} y [x] = {z ∈ K1: z <1 x}:

(1) Sea u el primer elemento de K2 tal que, para todo z <1 x, u ≠ ƒz(z).
ƒx(x) = u.
(2) Para todo z <1x, ƒx(z) = ƒz(z).

Como es obvio, esta definición implica que si x es el primer elemento de


〈K1,<1〉, ƒx(x) es el primer elemento de 〈K2,<2〉. Si ƒx está definida para cada
x ∈ K1, x Å ƒx(x) es un isomorfismo de 〈K1,<1〉 en un segmento de 〈K2,<2〉
Apéndices 463

(su alcance no puede ser igual a K2 ya que, por hipótesis, 〈K1,<1〉 y 〈K2,<2〉
no son isomórficos). En cambio, si ƒx no está definida para algún x ∈ K1 y
t es el primer elemento de K1 tal que ƒt no está definida, la aplicación ƒ: [t]
Æ K2; x Å ƒx(x) es un isomorfismo de un segmento de 〈K1,<1〉 en 〈K2,<2〉.

PROPOSICIÓN 6: Si 〈K,<〉 es un conjunto bien ordenado y H ⊆ K, 〈H,<〉 es un


conjunto bien ordenado isomórfico a 〈K,<〉 o a un segmento de 〈K,<〉.
Que 〈H,<〉 está bien ordenado se prueba así: si H = ∅, 〈H,<〉 está por
cierto bien ordenado; si H ≠ ∅ y G es una parte no vacía de H, sea G′ la
unión de los remanentes determinados en K por cada elemento de G. Enton-
ces, G′ es el remanente determinado en K por algún u ∈ G, y u precede a
todos los otros elementos de G. Ahora bien, si 〈K,<〉 fuese isomórfico a un
segmento [u] de 〈H,<〉 habría un isomorfismo ƒ: K Æ [u]. En tal caso, como
u ∈ K, ƒ(u) ∈ [u] y, por consiguiente, ƒ(u) < u. Pero según la Proposición
I esto no es posible si ƒ preserva el orden <. Por lo tanto, en virtud de la
Proposición 5, 〈H,<〉 es isomórfico a 〈K,<〉 o a un segmento de 〈K,<〉.

III

LA CARDINALIDAD DE LA SEGUNDA CLASE DE ORDINALES

Aquí bosquejaré una demostración de que (i) el conjunto de los ordinales


infinitos de la segunda clase es más numeroso que el conjunto [ω] de los
ordinales finitos y que (ii) no existe una numerosidad intermedia entre la de
este conjunto y la de aquél. Con la nomenclatura utilizada en el Capitulo
1.5, estas dos tesis pueden expresarse así: (i) ℵ0 < |[ω1]\[ω]| y (ii) no hay
un conjunto de ordinales K, tal que ℵ0 < |K| < |[ω1]\[ω]|. Ello implica que
|[ω1]\[ω]| = ℵ1. Los argumentos que aduciré para establecer este resultado
provienen de Cantor 1897 (GA, pp. 331–33).
(i) Sea n Å αn una aplicación inyectiva de [ω] en la Clase (II). Si la lista
α0, α1, α2,… contiene todos los ordinales de la Clase (II), éstos tienen que
Apéndices 464

figurar en ella en un orden distinto del fijado por la relación <.2 Sea k0 el
índice más bajo asignado en esta lista a un sucesor de α0 (esto es: α0 < αk0,
y αk0 < αk sólo si k0 ≤ k). Sea kn +1 el índice más bajo asignado en la lista a
un sucesor de αkn (n ≥ 0). Entonces, la lista α0, αk0, αk1,… es una secuen-
cia infinita, ordenada por la relación <, de números de la Clase (II) ninguno
de los cuales sucede a todos los otros. Por lo tanto, existe un ordinal α, de
la Clase (II), que es el sucesor próximo de los ordinales contenidos en la
lista α0, αk0, αk1,… En otras palabras, existe un α tal que αkn < α para
todo n ≥ 0 y α es menor que cualquier otro ordinal —si lo hubiere— que
sea mayor que todos los ordinales en la lista α0, αk0, αk1,… Si α figurara
en la lista α0, α1, α2,… tendríamos que α = αk ≤ αkn para algún k y n ≥ 0.
Por lo tanto, α no pertenece al alcance de la aplicación n Å αn. En conse-
cuencia, dicha aplicación no es biyectiva. Este razonamiento vale para cual-
quier inyección de [ω] en la Clase (II). Por lo tanto, la Clase (II) es más
numerosa que [ω].
(ii) Sea K un conjunto infinito de ordinales de la Clase (II). Sea K′ = K ∪
[ω]. Entonces, por la Proposición 6 del Apéndice III, 〈K′,<〉 es un conjunto
bien ordenado isomórfico a 〈[ω1],<〉 o a un segmento [α] de 〈[ω1],<〉, donde
α es un ordinal de la Clase (II). En el primer caso, |K′| = |[ω1]| y |K| =
|[ω1]\[ω]|. En el segundo caso, |K| ≤ |K′| = |[α]| = ℵ0. Por lo tanto, no hay
un conjunto de ordinales de la Clase (II) que sea menos numeroso que la
Clase (II) pero más numeroso que la Clase (I).

2 En el orden fijado por la relación < hay muchos ordinales de la Clase II que no tienen
sucesor inmediato; pero en el orden de la lista α1, α2,…, cada ordinal αn tiene un
sucesor inmediato αn+1.
Apéndices 465

IV

EL ARGUMENTO DE BURALI-FORTI

Burali-Forti (1897) se propone “demostrar que hay números transfinitos (o


tipos de orden) a y b, tales que a no es igual a b ni menor que b ni mayor
que b”. El trabajo adolece de cierta desidia terminológica, patente ya en esta
primera oración, que equipara las expresiones “número transfinito” y “tipo
de orden” (con explícita referencia a Cantor 1895). En el vocabulario del
grupo de Peano, al que pertenecía Burali-Forti, la palabra ‘clase’ (Fr. o It.
‘classe’) se usaba como sinónimo de ‘conjunto’ (“ensemble quelconque
d’objets”—Peano 1894, p. 4). Burali-Forti emplea ‘orden’ como sinónimo
de lo que aquí he llamado ‘orden lineal’ y define un tipo de orden como una
clase de clases ordenadas, equivalentes por isomorfismo. Por una inadver-
tencia (corregida en Burali-Forti 1897a), Burali-Forti entiende que una clase
bien ordenada en el sentido de Cantor es una clase ordenada que cumple las
condiciones BO1 y BO2 del Apéndice I. Por su parte, define una clase per-
fectamente ordenada como una clase ordenada 〈M,<〉 que reúne las condi-
ciones BO1 y BO2 y llena además el siguiente requisito:

BF Si x ∈ M y x tiene un predecesor inmediato,3 hay un u0 ∈ M tal


que u0 < x y una clase finita {u0, u1,…,un} ⊆ M, tales que uk es
el predecesor inmediato de uk+1 (0 ≤ k ≤ n) y un es el predecesor
inmediato de x.

BF se deduce de la condición BO que define un conjunto bien ordenado en


el genuino sentido cantoriano, pero no equivale a ella. Por lo tanto, si M
está bien ordenado en el sentido de Cantor, está perfectamente ordenado en
el sentido de Burali-Forti, pero no a la inversa. Burali-Forti define un ‘nú-
mero ordinal’ como el tipo de orden de un conjunto perfectamente ordena-
do. Evidentemente, habrá ordinales de Burali-Forti que no sean ordinales

3 Si < determina un orden lineal en M, digo que y ∈ M es el predecesor inmediato de x


∈ M si y < x y, cualquiera que sea z ∈ M, z < x ⇒ z ≤ y. La expresión ‘sucesor
inmediato’ se define reemplazando ‘<’ por ‘>’ y ‘≤’ por ‘≥’ en la definición anterior.
Apéndices 466

cantorianos. En el resto de este apéndice usaré minúsculas griegas para de-


signar ordinales de Burali-Forti. Designaré con O a la clase {ξ: ξ es un ordinal
de Burali-Forti}. Sean 〈A,R〉 y 〈B,S〉 dos clases perfectamente ordenadas, con
tipo de orden α y β, respectivamente. Burali-Forti dice que α < β (‘α es
menor que β’) si 〈A,R〉 es isomórfica a una parte de 〈B,S〉 y 〈B,S〉 no es
isomórfica a una parte de 〈A,R〉. La relación < es irreflexiva (si α < β, es
falso que α = β), antisimétrica (si α < β, es falso que β < α) y transitiva (si
α < β y β < γ, α < γ), pero < no ordena a la clase O debido a que, según
el teorema anunciado al principio, hay ordinales α y β tales que ni α < β, ni
α = β, ni β < α.
La prueba del teorema depende de dos proposiciones, P1 y P2, que de-
mostraré luego: (P1) Si ζ es un ordinal, existe un ordinal ζ′ mayor que ζ tal
que, si ξ es un ordinal mayor que ζ, ζ < ζ′ ≤ ξ (ζ′ es el sucesor inmediato
de ζ). (P2) Si 〈O,<〉 es una clase perfectamente ordenada, con tipo de orden
Ω ∈ O, y ξ es cualquier ordinal, ξ ≤ Ω. Burali-Forti argumenta así: Supon-
gamos que < ordena a O. Entonces 〈O,<〉 es una clase perfectamente orde-
nada,4 y su tipo de orden Ω ∈ O. En virtud de P1 existe un ordinal Ω′ > Ω.
En virtud de P2, Ω′ ≤ Ω. Esta contradicción implica que < no ordena a O y
que, por lo tanto, hay ordinales α y β tales que ni α < β, ni α = β, ni
β < α.
Para establecer la proposición P1, consíderese cualquier clase perfectamente
ordenada 〈A,R〉 con tipo de orden α y un objeto z ∉ A. En la clase A∪{z}
definimos una relación de orden T como sigue: xTy si xRy o si x ∈ A e y =
z. 〈A∪{z},T〉 es una clase perfectamente ordenada con tipo de orden α′ > α.

4 〈O,<〉 cumple las condiciones BO1 y BO2, puesto que hay un primer ordinal y cada
ordinal tiene un sucesor inmediato (por P1). Para ver que 〈O,<〉 cumple además la con-
dición BF recuérdese que si α es un ordinal, α es el tipo de orden de una clase perfec-
tamente ordenada 〈M,P〉. Como 〈M,P〉 cumple la condición BF, si α tiene un predece-
sor inmediato en 〈O,<〉, hay un u ∈ M tal que el predecesor inmediato de α es el tipo
de orden de la clase perfectamente ordenada 〈M\{u},P〉. u tiene un predecesor inme-
diato en 〈M,P〉 y en virtud de la condición BF, M contiene una subclase finita {u0,
u1,…,un = u}, tal que u0 no tiene predecesor inmediato y, para cada entero k (0 ≤ k
≤ n), uk es el predecesor inmediato de uk+1. 〈M\{uk,uk+1,…,un},P〉 es una clase per-
fectamente ordenada. Sea βk su tipo de orden. Vemos entonces que O contiene una
subclase finita {β0, β1,…, βn = α}, tal que β0 no tiene predecesor inmediato y para
cada entero k (0 ≤ k ≤ n), βk es el predecesor inmediato de βk+1. Por lo tanto, 〈O,<〉
cumple la condición BF.
Apéndices 467

En vista del modo como se ha construido α′, es claro que no puede haber
un ordinal ξ mayor que α y menor que α′. Esta demostración de P1 no sería
aplicable a un ordinal α si α fuera el tipo de orden de la clase perfectamente
ordenada de todo lo que hay (si hubiera tal clase), pues entonces no habría
un objeto z que pudiera agregarse a dicha clase para construir otra con tipo
de orden α′ > α. Pero en la demostración del teorema se considera sólo el
tipo de orden de 〈O,<〉, y hay por cierto muchos objetos que no son ordinales
de Burali-Forti. Si q ∉ O, es posible extender de una manera obvia el orden
< a la clase O ∪ {q}. Entonces 〈O ∪ {q},<〉 tiene un tipo de orden κ tal que
κ ∈ O y κ > Ω.
La proposición P2 se establece así: Sea α el tipo de orden de la clase
perfectamente ordenada 〈A,R〉 y sea Ax = {z : z ∈ A ∧ ¬xRz}, para cualquier
x ∈ A. Entonces, la clase W = {Ax: x ∈ A} es una clase de clases per-
fectamente ordenadas, cada uno de cuyos elementos es una subclase de A.
Digamos que AxSAy si y sólo si xRy. W está ordenada por la relación S y las
clases ordenadas 〈W,S〉 y 〈A,R〉 son isomórficas. Por lo tanto, 〈W,S〉 es una
clase perfectamente ordenada con tipo de orden α. Sea [α] la clase de
ordinales {αx: x ∈ A y αx es el tipo de orden de 〈Ax,S〉}. [α] reune todos los
ordinales menores que α. Evidentemente, 〈[α],<〉 es una clase ordenada
isomórfica a 〈W,S〉. Por lo tanto, el tipo de orden de 〈[α],<〉 es α. Como 〈[α],<〉
es isomórfica a una parte de 〈O,<〉, es claro que α ≤ Ω.
Como ya habrá advertido el lector, la contradicción generada por Burali-
Forti para probar su teorema no tiene nada de paradójica. Como en cual-
quier reductio ad absurdum, la contradicción sirve eficazmente para refutar
la negación de la tesis que el autor se ha propuesto demostrar. El teorema
puede probarse también sin mencionar el tipo de orden Ω de la clase de los
ordinales de Burali-Forti. Basta tener presente que hay ordinales de Burali-
Forti que no son ordinales de Cantor. Sea 〈A,R〉 un conjunto bien ordenado
con tipo de orden α y sea 〈B,S〉 un conjunto perfectamente ordenado pero no
bien ordenado, con tipo de orden β. Supongamos que |B| < |A|. En tal caso,
〈A,R〉 no puede ser isomórfico a una parte de 〈B,S〉, de modo que α ≠ β y α
no es menor que β. Sea H ⊆ A tal que |H| = |B| y sea ƒ:H → B biyectiva. ƒ
no puede ser un isomorfismo entre 〈H,R〉 y 〈B,S〉, por cuanto 〈H,R〉 es un
conjunto bien ordenado (por la Proposición 6 del Apéndice II).5
5 Como 〈B,S〉, por hipótesis, no es un conjunto bien ordenado, hay un subconjunto no
vacío K ⊂ B que no tiene un primer elemento (en el orden S). El conjunto ƒ-1K de los
Apéndices 468

El argumento de Burali-Forti es aplicable también a los ordinales canto-


rianos, esto es, los tipos de orden de los conjuntos bien ordenados. Pero en
este caso, tenemos también una prueba —basada en la Proposición 5 del
Apéndice II— de que la clase de los ordinales está bien ordenada por <.
Esta prueba depende esencialmente de la referencia al ordinal cantoriano de
la clase de todos los ordinales cantorianos y constituye una refutación de la
hipótesis de que dicho ordinal existe. En su correspondencia con Dedekind,
Cantor indica que su inexistencia se debe a que los ordinales no se dejan
reunir todos en un conjunto (Cantor, GA, pp. 443ss.).

LA NUEVA DEMOSTRACION DEL TEOREMA DEL BUEN ORDEN


(ZERMELO 1908)

Sea M un conjunto no vacío y ƒ un selector para PM\{∅}. Llamo A\ƒ al


conjunto A\{ƒ(A)}. (Zermelo lo llama A′, pero en la nomenclatura ahora
habitual esta expresión designa a M\A, el complemento de A en M). Una ƒ-
cadena de M es un conjunto K ⊆ PM tal que:

C1. M ∈ K.
C2. Si A ∈ K, A\ƒ ∈ K.
C3. Si H ⊆ K, πH ∈ K.

Esta definición implica que la intersección de varias ƒ-cadenas de M tam-


bién es una ƒ-cadena en M. Con Zermelo, llamaré M a la intersección de

elementos de H que ƒ envía a K es una parte del conjunto bien ordenado 〈H,R〉 y por
lo tanto tiene un primer elemento u (en el orden S). Pero ƒ(u) no puede ser el primer
elemento de ƒ-1K y por lo tanto hay un v ∈ K tal que vSƒ(u). ƒ-1(v) ∈ ƒ-1K y si ƒ
fuera un isomorfismo, tendríamos que ƒ-1(v)Ru, contraviniendo el supuesto de que u es
el primer elemento de ƒ-1K.
Apéndices 469

todas las ƒ-cadenas de M.6 El lector debe comprobar que M ⊆ PM cumple


las condiciones C1–C3.
El primer paso de la demostración consiste en construir un conjunto ∆ ⊆
M con propiedades interesantes para la tarea entre manos. A ∈ ∆ si y sólo si
A ∈ M y, para todo X ∈ M, X ≠ A implica que, o bien X ⊆ A, o bien A ⊆ X.
Mostraremos que ∆ es una ƒ-cadena en M. Como M es la intersección de
todas las ƒ-cadenas de M, esto implica que M ⊆ ∆ ⊆ M, es decir, que
∆ = M.
∆ cumple la condición C1, puesto que, evidentemente, M ∈ ∆.
Si A ∈ ∆, llamo UA al conjunto {X ∈ M: X ≠ A ∧ X ⊆ A} y VA al conjunto
{X ∈ M: X ≠ A ∧ A ⊆ X}. En virtud de la definición de ∆, tenemos que M =
UA ∪ {A} ∪ VA. Sea WA = {X ∈ M: X ⊆ A\ƒ}. Demostraré que WA = UA.
Obsérvese que si V ∈ VA, V\A ≠ ∅ y que si U ∈ UA, A\U ≠ ∅. Ello
implica que si V ∈ VA, V\ƒ ∉ UA. En efecto, o bien ƒ(V) ∈ A, en cuyo caso
V\A ⊆ V\ƒ y V\ƒ contiene elementos que no pertenecen a A ni, por ende, a
ningún U ∈ UA, o bien ƒ(V) ∉ A, en cuyo caso A\U ⊆ V\ƒ para cada U ∈
UA. Como V\ƒ ∈ M (por C2), tenemos que V\ƒ ∈ {A} ∪ VA. Por la misma
razón, si F ⊆ VA, πF ∈ {A} ∪ VA. Por otra parte, A\ƒ ∈ WA, y si F ⊆ M,
πF ∩W ∈ WA. Por consiguiente, WA ∪ {A} ∪ VA es una ƒ-cadena en M, de
suerte que M ⊆ (WA ∪ {A} ∪ VA) ⊆ M. Por lo tanto, (WA ∪ {A} ∪ VA) =
M = (UA ∪ {A} ∪ VA). Si X ∈ M, X ∈ WA ⇔ X ∉ {A} ∪ VA ⇔ X ∈ UA.
Por lo tanto, UA = WA.
Este resultado nos permitirá probar que para todo A ∈ ∆, A\ƒ ∈ ∆, de modo
que ∆ cumple la condición C2. Sean UA* = {X ∈ M: X ≠ A\ƒ ∧ X ⊆ A\ƒ} y
VA* = {X ∈ M: X ≠ A\ƒ ∧ A\ƒ ⊆ X}. Obviamente VA* = {A} ∪ VA y UA =
UA ∪ {A\ƒ}. Por lo tanto, M = UA* ∪ {A\ƒ} ∪ VA*, y A\ƒ ∈ ∆.
Para comprobar que ∆ cumple también la condición C3, considérese un
conjunto cualquiera Γ ⊆ ∆. Si X ∈ M\{πΓ}, o bien existe un Y ∈ Γ tal que
πΓ ⊆ Y ⊆ X, o bien X ⊆ Y para todo Y ∈ Γ y por ende X ⊆ πΓ. Esto indica
que πΓ ∈ ∆, como exije C3.

6 Esta nomenclatura no está exenta de peligro. En la p. 109, línea 10 del texto original,
el tipógrafo de Mathematische Annalen escribió ‘M’ en lugar de ‘M’. El mismo error
se repite, triplicado, en la traducción inglesa de van Heijenoort. Espero que el invento
de la computadora de mesa, que me permite componer yo mismo este libro para la
imprenta a medida que lo voy redactando, protegerá al lector contra este riesgo.
Apéndices 470

∆ cumple, pues, todos los requisitos para ser una ƒ-cadena de M. Así queda
demostrado que ∆ = M. Escribo ‘Y ⊃ X’ para decir que Y incluye a X como
una parte propia (X ⊆ Y ∧ X ≠ Y). En virtud de la misma definición de ∆, es
claro que, si A y B son dos elementos distintos de ∆ = M, o bien A ⊃ B, o
bien A ⊃ B. M está, pues, ordenado linealmente por la relación ⊃. 〈M,⊃〉 es
un conjunto bien ordenado, puesto que cumple las condiciones BO1, BO2 y
BO3 del Apéndice I. En efecto, 〈M,⊃〉 tiene un primer elemento, a saber, M;
cada H ∈ M tiene un sucesor inmediato, a saber H\ƒ; por último, si F ⊂ M
tiene sucesores en 〈M,⊃〉 (vale decir, si ∅ ∉ F ), πF ∈ M es el sucesor
próximo de F.
Para demostrar que ƒ aplica M biyectivamente sobre M, Zermelo usa un
argumento muy ingenioso. Muestra primero que si ∅ ≠ P ⊆ M, hay un y
sólo un conjunto P0 ∈ M tal que ƒ(P0) ∈ P ⊆ P0. Reemplazando P por {k}
en este resultado preliminar, se sigue que, para cada k ∈ M hay un único K0
∈ M tal que ƒ(K0) ∈ {k} ⊆ K0, esto es, tal que ƒ(K0) = k. El resultado pre-
liminar se establece así: Sea ∅ ≠ P ⊆ M y P0 = π{X ∈ M : P ⊆ X}. P0 ∈
M (por C3) y ƒ(P0) ∈ P, ya que, si ƒ(P0) ∉ P, P ⊆ P0\{ƒ(P0)} y P0 no es
la intersección de todos los elementos de M que incluyen a P. Por otra parte,
si P ⊆ P1 ∈ M y P1 ≠ P0, P1 ⊃ P0, de modo que ƒ(P1) ∉ P0. Como P ⊆ P0,
ƒ(P1) ∉ P. Así, P0 resulta ser el único X ∈ M tal que ƒ(X) ∈ P ⊆ X.
Como el selector ƒ restringido a M es biyectivo, induce en M el buen
orden de 〈M,⊃〉, según expliqué en el Capitulo 1.7. Zermelo prueba además
que el buen orden determinado de este modo en un dado conjunto M por un
dado selector ƒ: PM → M es único. Supongamos, en efecto, que 〈M,<〉 es
un conjunto bien ordenado de tal modo que, para cada A ⊆ M, ƒ(A) es el
primer elemento de 〈A,<〉. Entonces, cada k ∈ M determina una parte de M
formada por k y sus sucesores. Sea Hk = {x ∈ M: k ≤ x}. Es claro que k =
ƒ(Hk). Sea H = {Hk: k ∈ M}. Para cada P ⊆ M hay un y sólo un HP ∈ H tal
que ƒ(P) = ƒ(HP). HP contiene el primer elemento de P y todos sus suceso-
res y, por ende, cumple la condición ƒ(HP) ∈ P ⊆ HP. No es difícil compro-
bar que H cumple las condiciones C1, C2 y C3. En otras palabras, H es una
ƒ-cadena de M. Sea M, como antes, la intersección de todas las ƒ-cadenas
de M. Sabemos que, si Z ∈ H, hay un y sólo un U ∈ M tal que ƒ(U) ∈ Z ⊆
U. Como M ⊆ H y Z mismo es el único X ∈ H tal que ƒ(X) ∈ Z ⊆ X,
tenemos que U = Z. Por lo tanto, H = M y el orden < es precisamente el
buen orden inducido en M por el selector ƒ restringido a M.
Apéndices 471

VI

LOS AXIOMAS DE ZERMELO

Doy enseguida una traducción de los siete axiomas para la teoría de conjun-
tos formulados por Ernst Zermelo (1908b). En el artículo original el enun-
ciado de los axiomas está enmarcado en explicaciones que en lo esencial he
reproducido en la Sección 1.8.1. Allí traduje la definición del término definit
utilizado en el Axioma III. Es oportuno advertir que Zermelo escribe © en
vez de ⊆, 0 en vez de ∅, T en vez de PT, y T en vez de UT.

AXIOMA I Si cada elemento de un conjunto M es a la vez un elemento de


un conjunto N y vice versa, o sea, si M ⊆ N y N ⊆ M, enton-
ces M = N. En suma, cada conjunto está determinado por sus
elementos. (Axioma de Determinación).
AXIOMA II Hay un conjunto (impropio), el conjunto vacío ∅, que no con-
tiene ningún elemento. Si a es una cosa cualquiera del domi-
nio, existe un conjunto {a} que contiene a a y sólo a a como
elemento. Si a y b son dos cosas cualesquiera del dominio,
existe un conjunto {a, b} que contiene como elementos a a y
b, pero no a otra cosa diferente x. (Axioma de los conjuntos
elementales).
AXIOMA III Si la proposición universal (x) está bien definida (definit) para
todos los elementos de un conjunto M, M posee siempre un sub-
conjunto M que contiene como elementos a todos los elemen-
tos x de M para los cuales (x) es verdadera, y sólo a ellos.
(Axioma de Separación).
AXIOMA IV A cada conjunto T le corresponde un segundo conjunto PT (el
conjunto potencia de T), que contiene como elementos a todos
los subconjuntos de T, y sólo a ellos. (Axioma del Conjunto Po-
tencia).
AXIOMA V A cada conjunto T le corresponde un conjunto UT (el conjunto
unión de T), que contiene como elementos a todos los elemen-
tos de los elementos de T, y sólo a ellos. (Axioma de Unión).
Apéndices 472

AXIOMA VI Si T es un conjunto todos cuyos elementos son conjuntos no


vacíos que no comparten elementos,7 la unión UT incluye8 al
menos un subconjunto S1 que tiene con cada elemento de T un
y sólo un elemento en común. (Axioma de Selección).
AXIOMA VII El dominio contiene al menos un conjunto Z que contiene como
elemento al conjunto vacío y está constituido de tal modo que
a cada elemento suyo a le corresponde otro elemento de la
forma {a}, o que junto con cada elemento a contiene también
como elemento el conjunto correspondiente {a}. (Axioma del
Infinito).

VII

INDEPENDENCIA DEL AXIOMA DE SELECCIÓN


(FRAENKEL 1922a)

Para demostrar que una proposición ϕ es independiente de un conjunto de


proposiciones Γ se concibe una situación objetiva en la cual se cumplen las
proposiciones de Γ, pero ϕ es falsa. Una situación objetiva en la que se
cumplen todas las proposiciones de Γ se llama un modelo de Γ. Para demos-
trar que el Axioma VI de Zermelo es independiente de los Axiomas I–V y
VII, Fraenkel (1922a) propone un modelo cuyo dominio D consta exclusi-
vamente de estos objetos: (i) el conjunto vacío ∅; (ii) una colección infinita

7 La frase “no comparten elementos” corresponde a la expresión “untereinander elementen-


fremd sind” utilizada por Zermelo. Debe entenderse que los elementos de T son mu-
tuamente disjuntos por pares, esto es, que si A y B son elementos de T, o bien A = B,
o bien A ∩ B = ∅.
8 Zermelo usa aquí, para expresar la relación entre un conjunto y sus subconjuntos, el
mismo verbo alemán ‘enthalten’ con que expresa la relación entre un conjunto y sus
elementos en los Axiomas II, III, IV, V y VII. Para distinguir las dos relaciones, tra-
duzco ‘enthalten’ por ‘incluir’ en el presente pasaje y por ‘contener’ en los otros.
Apéndices 473

pero enumerable de objetos distintos, a1, a 1‹ , a2, a‹2,…, ninguno de los cua-
les es un conjunto; (iii) el conjunto Z0 = {∅, {∅}, {{∅}},…} postulado
por el Axioma VII; (iv) el conjunto A = {{a1, a 1‹ }, {a2, a‹2},…}; y (v) to-
dos los conjuntos que existen en virtud de los Axiomas I–V si existen los
objetos descritos en las cuatro cláusulas anteriores. Todos los objetos de D,
excepto los mencionados en la cláusula (ii), son conjuntos y pueden cons-
truirse a partir de los “objetos primitivos” mencionados en las cláusulas (i),
(ii) y (iii) mediante un número finito de aplicaciones de los Axiomas I–V.
Para facilitar la exposición, Fraenkel introduce algunos términos. El con-
junto {ak, a k‹ } se llama la celda Ak, con elementos conjugados ak y ak‹ (k ≥ 1).
Un conjunto principal es un conjunto que difiere de A a lo sumo por la
ausencia de un número finito de celdas. Si M es un conjunto cualquiera, el
conjunto M‹ k conjugado con M respecto de la celda Ak es el conjunto que
difiere de M solamente en cuanto cada elemento de Ak que entra en la cons-
trucción de M ha sido sustituido por su elemento conjugado. Si M = M‹ k,
decimos que M es simétrico respecto de Ak. Si el conjunto M es simétrico
respecto de todas las celdas de un conjunto principal diré que M es idóneo
(Fraenkel no se vale de este término). Es fácil ver que todos los objetos
primitivos postulados en las cláusulas (i)–(iii) son idóneos: en efecto, cual-
quiera que sea el entero positivo k, un intercambio entre ak y ak‹ en nada
afecta a los conjuntos ∅, Z0 y A; por su parte, ak y ak‹ son obviamente simé-
tricos respecto de todas las celdas del conjunto principal A\{ak, a k‹ }. Diré
asimismo que una función ϕ (en el sentido de Fraenkel 1922a explicado en
la Sección 1.8.2) es idónea si existe un conjunto principal Bϕ tal que, para
todo k ≥ 1, si Ak ∈ Bϕ, entonces, para todo x, ϕ(x k‹ ) es el conjunto conjugado
con ϕ(x) respecto de Ak.
La falsedad del Axioma de Selección en el modelo propuesto es una con-
secuencia inmediata de la siguiente “proposición fundamental”, verdadera en
dicho modelo:

PF. Todo conjunto es idóneo.

En efecto, si el Axioma de Selección es verdadero, existe un conjunto S que


“selecciona” un y sólo un elemento de cada celda en el conjunto A y eviden-
temente S no puede ser simétrico respecto de todas las celdas de un conjun-
to principal.
Apéndices 474

La verdad de PF en el modelo de Fraenkel resulta de cinco lemas que me


limito a enunciar:

I. Si M es un conjunto, también existe el conjunto conjugado M‹ k (para


cada entero positivo k).
II. Si M es un conjunto construido a partir de conjuntos idóneos por
aplicación de los Axiomas II, IV y V (exclusivamente), M es idó-
neo.
III. Sea ϕ una función que se define sustituyendo por una variable al-
guno de los conjuntos idóneos presupuestos en la construcción del
conjunto M mencionado en el lema II. Entonces ϕ es una función
idónea.
IV. Si ϕ y ψ son funciones como la descrita en el lema III y M es un
conjunto idóneo, entonces también son idóneos los subconjuntos de
M determinados por las condiciones ϕ ∈ ψ y ϕ ∉ ψ conforme al
Axioma III (en la versión de Fraenkel reproducida en la Sección
1.8.2).
V. Si en el enunciado de las condiciones del lema IV el conjunto M o
uno de los argumentos de las funciones ϕ o ψ es reemplazado por
una variable, la condición ϕ ∈ ψ (o la condición ϕ ∉ ψ) determina
una función idónea χ.

No es difícil probar que los cinco lemas son verdaderos en el modelo con-
siderado (de hecho, Fraenkel sólo estima necesario dar pruebas del II y el
IV). PF se deriva luego por inducción sobre la “clase” de cada objeto o fun-
ción de D. Este concepto de “clase” se define recursivamente así:

[0] Un objeto de D es un objeto de clase 0 si es uno de los objetos


primitivos mencionados en las cláusulas (i)–(iii) o se construye por
aplicación de los Axiomas II, IV y V a objetos primitivos. Una
función definida sustituyendo por una variable alguno de los obje-
tos primitivos presupuestos en la construcción de un objeto de cla-
se 0 es una función de clase 0.
[n ⇒ Si el conjunto M y las funciones ϕ y ψ son de clase ≤ n y M′ es el
n+1] subconjunto de M determinado conforme al Axioma III por la con-
dición ϕ ∈ ψ o por la condición ϕ ∉ ψ, M′ es un conjunto de clase
Apéndices 475

≤ n+1. Si χ es la función determinada en tal caso por la condición


ϕ ∈ ψ o por la condición ϕ ∉ ψ cuando el conjunto M o uno de
los argumentos de las funciones ϕ o ψ es reemplazado por una
variable, χ es una función de clase ≤ n+1.

El argumento inductivo procede así: Todo objeto de clase ≤ 1 es idóneo en


virtud de los lemas I y IV y toda función ϕ de clase ≤ 1 es idónea en virtud
de los lemas III y V. Supongamos que se ha establecido que todos los obje-
tos y funciones de clase ≤ n son idóneos. Entonces el lema IV implica que
todo objeto de clase ≤ n+1 es idóneo y el lema V implica que toda función
de clase ≤ n+1 es idónea.
A propósito de esta prueba de independencia es oportuno hacer algunas
observaciones. Ella demuestra que el Axioma de Selección es independiente
de los demás axiomas del sistema de Zermelo (1908a), con el Axioma III
ajustado a la formulación de Fraenkel 1922a (Sección 1.8.2). Pero no se ha
demostrado que el Axioma de Selección sea independiente del restante siste-
ma de Zermelo enriquecido con el Axioma de Reemplazo propuesto en
Fraenkel 1922 (Sección 1.8.3). De hecho, Fraenkel pensó en un comienzo
que el Axioma de Selección se podía inferir de dicho sistema enriquecido.
Por otra parte, si ‘función’ se entiende en el sentido de Fraenkel 1922a, el
Axioma de Reemplazo no fortalece el sistema original de los Axiomas I–V
y VII de Zermelo sino que se infiere de ellos (von Neumann 1928). El mo-
delo de los Axiomas I–V y VII utilizado en la prueba de independencia com-
prende, como hemos visto, infinitos objetos que no son conjuntos. Como
indiqué en la p. 75, nota 5, tales objetos se conocen en la literatura matemá-
tica por su nombre alemán de Urelemente. Zermelo estimaba que la teoría
de conjuntos debía postular su existencia para que la matemática se pudiera
aplicar al mundo real, en el cual hay por cierto muchas cosas que no son
conjuntos. Pero la matemática pura puede vivir muy bien sin Urelemente.
Por lo demás, tampoco los necesita la matemática aplicada, si lo que hace es
representar realidades naturales mediante objetos ideales que perfectamente
pueden ser conjuntos. En 1963 Paul Cohen demostró, sin presuponer Urele-
mente, que el Axioma de Selección es independiente de los axiomas restan-
tes de Zermelo suplementados con el Axioma de Reemplazo (en la versión
fuerte de Skolem).
Apéndices 476

VIII

LA DEFINICIÓN POR INDUCCIÓN TRANSFINITA


(VON NEUMANN 1928a)

La inducción matemática (finita) es el arma principal de la aritmética. Una


demostración inductiva establece que todos los números naturales tienen una
propiedad P, probando (a) que el número 0 tiene la propiedad P y (b) que,
si un número cualquiera n tiene la propiedad P, también la tiene su sucesor
inmediato n+1. En el penúltimo párrafo del Apéndice VII hay un ejemplo de
este método de demostración. Una definición por inducción (o definición
recursiva) determina la extensión C de un concepto aplicable a objetos de
cierta categoría K, por “estratos”, como sigue:9

(i) Se estipula que cierta parte de K constituye el estrato básico C0.


(ii) Se fija una relación funcional10 φ entre las partes de K y se estipu-
la que si n es cualquier número natural y el estrato Cn tiene la re-
lación φ con una parte φCn de K, el estrato Cn+1 = Cn ∪ φCn.
(iii) C se define como la unión de todos los estratos Cn.

Dedekind fue el primero en comprender que la definición por inducción


sólo es admisible si la sucesión de estratos Cn (n ∈ ˆ) queda unívocamente
determinada con sólo fijar el estrato básico C0 y la relación φ. La unicidad
de los estratos y, por ende, de su unión C está garantizada por el siguiente
teorema, que Dedekind (1888, #126) demuestra inductivamente: Dado un
triple 〈W, w0, φ〉, donde W es un dominio de objetos, w0 es un objeto distin-
guido de W y φ es una aplicación de W en W, existe una sola aplicación ƒ:
ˆ → W tal que ƒ(0) = w0 y para cada n ∈ ˆ, ƒ(n+1) = φ(ƒ(n)). Sea W = PK

9 Acabamos de ver una definición recursiva (de ‘clase’) en el Apéndice VII. Hay otras
dos en las pp. 78 y 81. El Apéndice IX contiene definiciones recursivas de ‘término’,
‘predicado’, ‘fórmula’, ‘verdad/falsedad’ de una fórmula en una interpretación, etc. Con-
viene examinar dichos ejemplos a la luz de la explicación que doy aquí.
10 Una relación diádica R se dice funcional si la conjunción Rxy ∧ Rxz implica que y = z;
en otras palabras, si la relación R admite un solo terminus ad quem para cada terminus
a quo.
Apéndices 477

y w0 = C0. Entonces, debido a la existencia y unicidad de la aplicación ƒ


descrita en el teorema, hay una y sólo una aplicación de ˆ en W, k Å Ck,
tal que para cada n ∈ ˆ, Cn+1 = ƒ(n) ∪ Cn. Esto asegura la unicidad de la
unión C = Uk∈ˆCk.11
La demostración inductiva se puede extender al transfinito. Se demuestra
por inducción transfinita que cada ordinal tiene una propiedad P, probando
(α) que el 0 tiene la propiedad P y (β) que, si todos los ordinales menores
que un ordinal cualquiera ξ tienen la propiedad P, también la tiene ξ.
También hay un método de definición por inducción transfinita, que cons-
truye la extensión de un concepto C por estratos C0, C1, C2,…, Cω, Cω+1,…
correspondientes a los ordinales. Parafraseando a Hausdorff (1914, p. 113),
este género de definición se puede caracterizar así:

Cκ está definido para todo ordinal κ si


(i) C0 está definido y
(ii) para cualquier ordinal α, Cα queda definido mediante la definición
de Cξ para todo ξ < α.

Aunque este método de definición se utiliza implícitamente desde los albo-


res de la teoría de conjuntos, von Neumann parece haber sido el primero
que juzgó necesario justificarlo. En la exposición siguiente seguiré a von
Neumann 1928c. Imitando al autor, me expreso en términos de una teoría de
conjuntos “ingenua”, pero fácilmente adaptable al sistema ZF. La caracteri-
zación precisa de la definición por inducción transfinita se facilita mucho
gracias al concepto de ordinal de von Neumann 1922. Recordemos que un
ordinal así concebido es un conjunto α bien ordenado por la relación ∈, de
modo que cada elemento de α contiene a todos sus predecesores; el sucesor
de α es el conjunto α ∪ {α}; el primer ordinal es 0 = ∅ (Sección 1.8.4).
Llamaré  —con Zermelo— al dominio de la teoría de conjuntos y Ω —
con Cantor— al subdominio constituido por los ordinales (von Neumann lo
llama OZ). Si ƒ es una aplicación de Ω, o de un segmento de Ω, en  y α
es un ordinal, llamaré con von Neumann F(ƒ,α) al grafo de la restricción de
ƒ a α; en otras palabras, F(ƒ,α) = {〈ξ,ƒ(ξ)〉: ξ ∈ α}. Von Neumann demues-

11 En el Apéndice XI doy una demostración y ejemplos de aplicaciones del Teorema de


la Definición por Inducción de Dedekind.
Apéndices 478

tra el siguiente Teorema de la Definición por Inducción Transfinita (TDIT),


visiblemente similar al teorema de Dedekind (1888, #126) enunciado arriba:

Si ϕ es una aplicación definida en  ×  hay una y sólo una apli-


cación ƒ: Ω →  tal que para cada ordinal ξ, ƒ(ξ) = ϕ(F(ƒ,ξ),ξ).

No es difícil ver que el TDIT legitima la definición por inducción transfinita.


Recordemos que cada estrato Cξ (ξ > 0) de la extensión C de un concepto
definido por este método queda definido por la colección {Cζ: ζ ∈ ξ} de los
estratos anteriores. La regla que coordina cada estrato con los que le prece-
den puede representarse, pues, mediante una aplicación ϕ:  ×  → , tal
que ϕ(0,0) = C0 y, para cada ordinal ξ > 0, Cξ = ϕ({〈ζ,Cζ〉: ζ ∈ ξ},ξ).12 En
virtud del TDIT, la aplicación ξ Å Cξ existe y es única. El definiendum C
puede entonces identificarse con la unión de los estratos Cξ: C = Uξ∈Ω ΩCξ.
Ahora bosquejaré la demostración de von Neumann. Diremos que un
ordinal ξ es normal si, dada una aplicación ϕ:  ×  → , existe una apli-
cación ƒξ: ξ →  tal que para cada ζ ∈ ξ, ƒξ(ζ) = ϕ(F(ƒξ,ζ),ζ). Llamaré,
con von Neumann, “elemento funcional hasta ξ” a una aplicación ƒξ como
la descrita. Von Neumann demuestra (I) que dados ϕ y ξ no puede existir
más que un elemento funcional hasta ξ. Por lo tanto, si ξ es normal, la ex-
presión ϕ(F(ƒξ,ξ),ξ) designa exactamente un objeto del dominio .13 Así pues,
la correspondencia ξ Å ϕ(F(ƒξ,ξ),ξ) asigna un y sólo un objeto ƒ(ξ) a cada
ordinal normal ξ. Von Neumann demuestra (II) que todo ordinal es normal.
Por lo tanto, dada la aplicación ϕ, existe una única aplicación ƒ: Ω →  tal
que para cada ordinal ξ, ƒ(ξ) = ϕ(F(ƒξ,ξ),ξ). Q.E.D.
La proposición (I) se prueba así: Sea ξ un ordinal normal y ƒξ y gξ
dos elementos funcionales hasta ξ. Es claro que si ƒξ ≠ gξ hay uno o
más ordinales ζ mayores que 0 y menores que ξ tales que ƒξ(ζ) ≠ gξ(ζ).
Sea ζ0 el menor de estos ordinales. Como ƒξ(η) = gξ(η) para todo ordinal
η ∈ ζ0, tenemos que, contra lo que se había supuesto, ƒξ(ζ0) = ϕ(F(ƒξ,ζ0),ζ0)

12 Por cierto, podría representársela también, más sencillamente, mediante una aplicación
ψ:  →  tal que ψ(0) = C0 y, para cada ordinal ξ > 0, Cξ = ψ(Cζ: ζ ∈ ξ). La
representación arriba descrita fue elegida por von Neumann con vistas a la demostra-
ción del TDIT.
13 Recuérdese que F(ƒξ,ξ) = {〈ζ,ƒξ(ζ)〉: ζ ∈ ξ}, de suerte que esta expresión está bien
definida si ƒξ es una aplicación definida en ξ.
Apéndices 479

= ϕ({〈η,ƒξ(η)〉: η ∈ ζ0},ζ0) = ϕ({〈η,gξ(η)〉: η ∈ ζ0},ζ0) = ϕ(F(gξ,ζ0),ζ0) =


gξ(ζ0). Por lo tanto, ƒξ = gξ.
La proposición (II) se infiere casi inmediatamente de las proposiciones
siguientes:

(III) Si ξ es un ordinal normal y ζ ∈ ξ, ζ es normal y ϕ(F(ƒζ,ζ),ζ) =


ϕ(F(ƒξ,ζ),ζ);
(IV) Si todo ordinal ζ ∈ ξ es normal, ξ es normal.

Para probar (III) suponemos que ξ es normal y designamos con ƒξ|ζ la


restricción de ƒξ a ζ ∈ ξ. Si η es cualquier ordinal menor que ζ, ƒξ|ζ(η) =
ƒξ(η)= ϕ(F(ƒξ,η),η) = ϕ(F(ƒξ|ζ,η),η). Por lo tanto, ζ es normal y ƒζ = ƒξ|ζ.
Es claro, pues, que ϕ(F(ƒζ,ζ),ζ) = ϕ(F(ƒξ|ζ,ζ),ζ) = ϕ(F(ƒξ,ζ),ζ).
(IV) se prueba así: Sea ξ un ordinal tal que si ζ ∈ ξ, ζ es normal. En
virtud de los resultados ya obtenidos, existe entonces para cada ζ ∈ ξ un
objeto único ƒξ(ζ) = ϕ(F(ƒζ,ζ),ζ). ζ Å ƒξ(ζ) es, pues, una aplicación defini-
da en ξ.14 En particular, por P3, si η ∈ ζ ∈ ξ, ƒ(η) = ϕ(F(ƒη,η),η) =
ϕ(F(ƒζ,η),η), de suerte que para todo ζ ∈ ξ, F(ƒ,ζ) = F(ƒζ,ζ), lo cual impli-
ca a su vez que

ƒξ(ζ) = ϕ(F(ƒζ,ζ),ζ) = ϕ(F(ƒξ,ζ),ζ)

Como sabemos, esto significa que ξ es normal.


Para probar (II) suponemos que es falsa y que existe un ordinal α que no
es normal. Entonces, por (IV), no son normales todos los ordinales ξ tales
que ξ ∈ α. Von Neumann muestra que los ordinales no normales que son
elementos de α constituyen un conjunto A ≠ ∅, el cual tiene, por lo tanto,
un primer elemento ξ0. Si ζ ∈ ξ0, ζ ∈ α\A; luego, ζ es normal. Pero en-
tonces (IV) implica que ξ0 es normal. ¡Contradicción!

14 Von Neumann dedica una larga nota a demostrar, en términos adaptables a la teoría
axiomática ZF, que la aplicación ξ → B definida por ζ Å ƒξ(ζ) = ϕ(F(ƒζ,ζ),ζ) efecti-
vamente existe si todo ζ < ξ es normal (1928a, pp. 389s., n. 28). Pero a la luz de lo
que llevamos dicho su existencia debiera resultar obvia desde un punto de vista “inge-
nuo”.
Apéndices 480

IX

EL CÁLCULO PREDICATIVO

Cálculo predicativo es el nombre genérico de los lenguajes artificiales o


“escrituras conceptuales” (cf. Capítulo 2.2) utilizados en la lógica y la mate-
mática actuales. Distinguimos entre cálculos de primer orden, en los que es
posible representar formalmente generalizaciones relativas a objetos indivi-
duales (vgr. ‘hay una montaña en América que es más alta que todas las
montañas de Europa’), y cálculos de orden superior, en los que además pue-
den representarse generalizaciones relativas a propiedades y relaciones (vgr.
‘hay una relación X que cualquier entero positivo z mayor que 3 tiene con
algún número primo menor que z’). En los cálculos de segundo orden se
representan generalizaciones relativas a individuos y a propiedades y rela-
ciones de individuos; en los de tercer orden, se representan asímismo gene-
ralizaciones relativas a propiedades y relaciones de tales propiedades o rela-
ciones, etc.
A continuación presento la gramática —sintaxis y semántica— común a
toda una familia de cálculos predicativos de primer orden. Para facilitar la
comprensión, presento primero reglas para cálculos sin signo de identidad,
que llamo versiones del CP1, y luego enuncio reglas adicionales para cálcu-
los con signo de identidad, que llamo versiones del CP1=. Enseguida, bajo
el título “Decisión y deducción”, considero dos vías para determinar cuáles
son las fórmulas del CP1= que según nuestras estipulaciones semánticas
representan verdades lógicas. Por último, me refiero brevemente a una fami-
lia de cálculos predicativos de segundo orden con identidad, que llamo CP2=.
En el curso de la exposición, se definen diversas categorías sintácticas
(términos, fórmulas, etc.). Generalmente, la definición es recursiva: se fija
primero una base formada por uno o más objetos bien definidos pertene-
cientes a la categoría en cuestión; luego se describe un procedimiento bien
determinado para construir nuevos objetos de esa categoría a partir de obje-
tos ya reconocidos como tales. Se sobreentiende que todo objeto de la cate-
goría así definida satisface uno de estos dos criterios de definición y que
aquellos objetos que no pertenecen a la base se generan desde ella mediante
un número finito de aplicaciones del procedimiento descrito. Consíderese, por
Apéndices 481

ejemplo, la definición de variable bajo el acápite Vocabulario en la sección


A: el objeto x es una variable (éste es el único elemento de la base); si un
objeto dado ξ es una variable, se forma una nueva variable agregando el
palote ı a la derecha de ξ; por lo tanto, un objeto cualquiera es una variable
si y sólo si ese objeto es el signo x, o es el signo x seguido de un número
finito de palotes. Me parece que este es el modo natural de entender una
definición así y por eso, a diferencia de otros autores, me doy por contento
con la presente advertencia general y no la repito en cada caso.

A. SINTAXIS

Las expresiones del CP1 están formadas por secuencias finitas o filas de sig-
nos tomados de una lista finita o alfabeto de ideogramas y letras.15 Si la fila
η es una secuencia de n signos (n ≥ 0), decimos que n es la longitud de η;
simbólicamente, Λ(η) = n. Decimos que la fila η es más breve que la fila ζ,
si Λ(η) < Λ(ζ). Si Λ(η) = m y Λ(ζ) = n, η¥ζ es la fila de longitud m + n
cuyo h-ésimo signo es el h-ésimo signo de η (1 ≤ h ≤ m) y cuyo (m+k)-ésimo
signo es el k-ésimo signo de ζ (1 ≤ k ≤ n). En vez de η¥ζ escribiré simple-
mente ηζ.

El alfabeto. El alfabeto del CP1 consta de los siete ideogramas ¬, →, ∀, (,


), ı, *, y de las tres letras x, a, P. Los ideogramas se llaman, respectivamen-
te, signo de negación, signo de implicación (o flecha), signo de cuantificación
universal, paréntesis izquierdo, paréntesis derecho, palote y asterisco; pero,
en aras de la brevedad, los usaré a ellos mismos para nombrarlos. Por ejem-
plo, si η es una fila de longitud 3 y ζ es una fila de longitud 2, (ηıı → ζ) es
la fila de longitud 10 formada por un paréntesis izquierdo seguido del pri-
mer, segundo y tercer signo de η (en ese orden), seguidos de dos palotes,
seguidos de una flecha, seguida del primer y segundo signo de ζ, seguidos
de un paréntesis derecho. Los signos ¬ y → suelen llamarse conectivos.
[Obsérvese que, según las convenciones introducidas en los dos últimos pá-
rrafos una fila Φ de letras griegas entremezcladas o no con ideogramas del

15 Algunos autores dicen ‘cuerda’ de signos en vez de ‘fila’, pero me parece esa una tra-
ducción demasiado literal y poco expresiva del término inglés ‘string’.
Apéndices 482

cálculo representa una colección infinita de filas de signos del cálculo, espe-
cificada por la estructura de Φ. Por ejemplo, la fila (α → ∀β) representa
todas las filas de signos del cálculo que empiezan con (, terminan con ) y
contienen la fila →∀ entre dos filas cualesquiera (de longitud ≥ 0). Cuando
atribuyo propiedades sintácticas o semánticas a una tal fila Φ, debe enten-
derse que la aseveración se refiere a cada fila representada por Φ.]

Vocabulario. Las expresiones del CP1 combinan ideogramas con palabras


formadas conforme a ciertas reglas precisas. Distinguimos dos clases princi-
pales de palabras del CP1.

(i) Términos: En el CP1 hay dos clases de términos, llamados variables y


constantes.
La letra x es una variable. Si ξ es una variable, ξı es una variable.
La letra a es una constante. Si ω es una constante, ωı es una constante.
(ii) Predicados: Distinguimos, para cada número natural n ≥ 0, la clase de
los predicados n-ádicos. (Suele llamárselos variables proposicionales si
n = 0, predicados monádicos si n = 1 y predicados poliádicos si n > 1).
La letra P es un predicado 0-ádico.
Si π es un predicado n-ádico, πı es un predicado n-ádico.
Si π es un prédicado n-ádico que no contiene palotes, π* es un predi-
cado (n+1)-ádico.

Una versión del CP1 incluye siempre todas las variables y todos los predi-
cados 0-ádicos.16 Incluye además una parte de las constantes y una parte de
los predicados n-ádicos para uno o más valores de n > 0. (Las partes en
cuestión pueden ser propias o impropias y aun vacías). El conjunto de las
constantes y predicados n-ádicos (n > 0) de una dada versión del CP1 cons-
tituye lo que llamaré el léxico de esa versión. Obsérvese que cada versión se

16 Como se verá en la sección C. Tautologías, los predicados 0-ádicos sirven para repre-
sentar fórmulas indeterminadas y, por ende, las proposiciones expresables con ellas.
De ahí el nombre de variables proposicionales que, como dije, suele dárseles (con cierta
impropiedad). Por eso también se llama Cálculo proposicional al fragmento del cálcu-
lo predicativo que puede construirse utilizando solamente predicados 0-ádicos, conectivos
y paréntesis (estos son los únicos ingredientes de las fórmulas del CP1 que llamaré
verifuncionales; véase su definición en la sección C).
Apéndices 483

distingue de las demás únicamente por su léxico.17 Una versión del CP1 con
léxico L1 es una extensión de otra con léxico L2 si y sólo si L2 ⊆ L1. La
versión cuyo léxico contiene todas las constantes y todos los predicados n-
ádicos (n > 0) del CP1 es la máxima extensión posible de cualquier otra
versión. La llamo la versión máxima del CP1. Su léxico, Lmax, es el léxico
máximo.
Sean η y ζ dos filas de signos (posiblemente de longitud 0) y sea θ la fila
η¥α¥ζ, donde α es una variable, una constante o un predicado. Suponga-
mos que ζ no comienza con un palote ni con un asterisco. Diremos entonces
que la fila ζ determina una posición en θ y que α figura en θ en la posición
determinada por ζ, o que α ocupa en θ la posición que precede a ζ.18 Una
misma variable, constante o predicado puede figurar en varias posiciones en
una fila dada; estas posiciones se numeran —primera, segunda, tercera,…—
según decrece la longitud de la fila que las determina.

Fórmulas. Una fila de signos formada por un predicado n-ádico seguido de


n términos es una fórmula elemental. Toda fórmula elemental es una fórmu-
la. Si α y β son fórmulas y ξ es una variable, también son fórmulas las filas
de signos descritas a continuación:

[F¬] ¬α
[F→] (α → β)
[F∀] ∀ξα

La fila ∀ξ es un cuantificador (universal) que liga la variable ξ. El alcance


del cuantificador ∀ξ en la fórmula ∀ξα es precisamente la fórmula α que
comienza inmediatamente a la derecha del mismo. Por aplicaciones repeti-

17 Chang y Keisler, en su espléndida Model Theory (tercera edición, 1990), llaman ‘len-
guaje’ (language) a lo que yo llamo ‘léxico’. Ambas denominaciones se salen del uso
común del respectivo vocablo, pero la adoptada por ellos me parece menos afortunada:
si aprendo una palabra castellana que antes desconocía y al mismo tiempo me olvido
de otra, no diríamos que he cambiado de lenguaje sino que ha variado mi léxico.
18 Exigimos que ζ no comience con palote ni asterisco para que no se pueda decir que la
variable (constante, predicado) α figura en una cierta posición en θ cuando aparece allí
formando parte de otra variable (constante, predicado). Conforme a nuestra estipula-
ción, el predicado P** no figura en ninguna posición en la fórmula P***xııxıxııı y la
variable xı figura en una sola, a saber, la determinada por la fila xııı.
Apéndices 484

das de la regla [F∀], puede obviamente ocurrir que una fórmula dada con-
tenga más de un cuantificador que ligue a la misma variable. Sea β una fór-
mula en que figura una variable ξ. Ésta puede ocupar tres tipos de posicio-
nes en β: (A) inmediatamente a la derecha de un signo de cuantificación;
(B) dentro del alcance de uno o más cuantificadores que ligan a ξ; (C) fuera
de todo cuantificador y también fuera del alcance de todo cuantificador que
ligue a ξ. Diremos que ξ está libre en β en cada posición del tipo C y que
tal posición es una posición libre de ξ en β. Diremos que ξ está ligada por
un determinado cuantificador que liga a ξ (i) en la posición que ocupa den-
tro de él y (ii) en cada una de sus posiciones libres dentro del alcance de ese
cuantificador.19 Una fórmula que contiene una o más variables libres se dice
abierta. Una fórmula que no contiene ninguna variable en una posición libre
se dice cerrada. La clausura universal de una fórmula α que contiene las
variables libres ξ1,…,ξn (numeradas según el orden de su primera apari-
ción en α) es la fórmula cerrada ∀ξ1…∀ξnα.
Si α y β son fórmulas, decimos que β es una subfórmula de α si α =
η¥β¥ζ, donde η y ζ son filas de signos (posiblemente de longitud 0) y ζ no
empieza con un palote o un asterisco.20 En tal caso, decimos también que β
ocupa en α la posición determinada por ζ, o que precede a ζ.
A veces hay que reemplazar en una fórmula dada una cierta variable libre
por otro término (variable o constante). Nos conviene tener una expresión
simbólica concisa que denote en nuestro idioma el producto de esta opera-
ción. Para evitar repeticiones, definiré tal expresión de modo que nos sirva
no sólo mientras hablamos del CP1, en que todo término es idéntico a una
constante o a una variable, sino también más tarde, al hablar de cálculos
(como el CP1=) en que los términos pueden ser expresiones más complejas.
Sea ϕ una fórmula, ξ una variable y τ un término del cálculo estudiado.
Consideremos primero un caso sencillo: ninguna posición libre de ξ en ϕ
está situada dentro del alcance de un cuantificador que ligue alguna de las

19 Por ejemplo, si la fórmula β es la fila γ∀ξαδ y α es el alcance del cuantificador ∀ξ


precedido inmediatamente por la fila γ, ∀ξ sólo liga a ξ dentro de sí y en las posicio-
nes libres de ξ en α, pero no liga a ξ en ninguna de las posiciones que ξ ocupa en las
filas γ y δ ni en las posiciones de ξ en α dentro de otro cuantificador que ligue a ξ o
dentro del alcance de tal cuantificador. (No se olvide que α podría ser una fila κ∀ξλ).
20 En virtud de la condición impuesta a ζ, las fórmulas Pıı , ¬P y P*x no son subfórmulas
de la formula (Pııı → ¬P*xıı).
Apéndices 485

variables contenidas en τ. Entonces, la expresión simbólica ϕτ/ξ designa (en


castellano) la fórmula obtenida al insertar τ en vez de ξ en todas las posicio-
nes donde ξ está libre en ϕ. Por cierto, si ξ no figura en ϕ o sólo figura en
posiciones donde está ligada, ϕτ/ξ = ϕ. En el caso general, algunas posicio-
nes libres de ξ en ϕ se hallarán posiblemente dentro del alcance de cuanti-
ficadores que ligan a ciertas variables η1,…, ηk que también figuran en el
término τ. Ordenemos las variables del cálculo según el número de palotes
que contienen: x, xı, xıı, xııı,…. Sean ζ1,…, ζk las k primeras variables
(en ese orden) que no figuran en la fórmula ϕ ni en el término τ. Sea ϕ′ la
fórmula que se obtiene al reemplazar ηi por ζi en todas las posiciones liga-
das que ηi ocupa en ϕ (1 ≤ i ≤ k). Entonces, la expresión ϕτ/ξ designa la fór-
mula obtenida al insertar τ en vez de ξ en todas las posiciones donde ξ está
libre en ϕ′.21 En forma análoga puede introducirse la expresión ϕτ1,…,τν/ξ1,…,ξν
para simbolizar el producto de la sustitución simultánea del ν-tuplo de va-
riables 〈ξ1,…,ξν〉 por el ν-tuplo de términos 〈τ1,…,τν〉 en todas las posi-
ciones libres que dichas variables ocupan en ϕ. Suelo escribir φ(τ/ξ) en vez
de ϕτ/ξ y φ(τ1/ξ1,…,τν/ξν) en vez de ϕτ1,…,τν/ξ1,…,ξν.

B. SEMÁNTICA

Como el lector habrá notado, las reglas sintácticas se refieren únicamente a


signos y combinaciones de signos, esto es, a figuras inscritas en una pizarra
o una hoja de papel (o, si se quiere, a los prototipos ideales de tales figuras),
sin tener en cuenta lo que dichos signos significan. Las reglas semánticas se
refieren al significado de las fórmulas construidas conforme a las reglas
sintácticas. Específicamente, las reglas semánticas del CP1 establecen las
condiciones necesarias y suficientes para que una dada fórmula de una ver-
sión particular de CP1 sea verdadera relativamente a una cierta interpreta-
ción de dicha versión. Sea, pues, CP1† una tal versión particular. Como ya

21 En otras palabras: para transformar ϕ en ϕτ/ξ primero reemplazo en ϕ toda variable


ligada que figure en τ por una variable nueva, la primera que no figure en ϕ ni en τ;
así obtengo la fórmula ϕ′; luego reemplazo ξ por τ en todas las posiciones libres de ξ
en ϕ′. Doy un ejemplo. Sea ϕ la fórmula ∀x(P**xııx ∨ ∃xııP***xxııxıııı). Entonces, la
primera variable que no figura en φ es xı; aplicando la receta antedicha, tenemos pues
que ϕxıı/xıııı es la fórmula ∀x(P**xııx ∨ ∃xıP***xxıxıı).
Apéndices 486

he indicado, el vocabulario de CP1† incluye todos los ideogramas, variables


y predicados 0-ádicos del CP1, más una selección bien definida de constan-
tes y de predicados n-ádicos para ciertos valores de n > 0. Las reglas semán-
ticas se formulan de modo que sean aplicables, como quiera que se haga esa
selección.
Sea D una colección (no-vacía) de objetos cualesquiera. Sea V el conjun-
to de los términos y predicados del CP1† y sea F el conjunto de todas las
fórmulas formadas con palabras de V conforme a nuestras reglas sintácticas.
Una interpretación del CP1† es un par 〈D,ƒ〉, donde D un conjunto (no-va-
cío) de objetos cualesquiera y ƒ es una aplicación, definida en V ∪ F, que
satisface las estipulaciones que se enuncian a continuación. (D se llama el
dominio de la interpretación; también se suele decir que ƒ es una interpreta-
ción en el dominio D).

[Iτ] Para todo término τ ∈ V, ƒ(τ) ∈ D.


[I0] Para todo predicado 0-ádico π ∈ V, ƒ(π) ∈ {0,1}.
[In] Para todo predicado n-ádico π ∈ V (n ≥ 1), ƒ(π) ⊆ Dn (ƒ(π) es un
conjunto de n-tuplos de elementos de D).
[Iα] Si α es una fórmula formada por un predicado n-ádico π ∈ V segui-
do de los términos τ1,…, τn, ƒ(α) = 0 si 〈ƒ(τ1),…,ƒ(τn)〉 ∈ ƒ(π)
—esto es, si el n-tuplo formado por los objetos que ƒ asigna a los
términos τ1,…, τn es uno de los n-tuplos comprendidos en el con-
junto que ƒ asigna al predicado π— y ƒ(α) = 1 si 〈ƒ(τ1),…,ƒ(τn)〉
∉ ƒ(π).
[I¬] Si α es la fórmula ¬β, ƒ(α) = 0 si ƒ(β) = 1 y ƒ(α) = 1 si ƒ(β) = 0.
[I→] Si α es la fórmula (β → γ), ƒ(α) = 0 si ƒ(β) = 1 ó ƒ(γ) = 0, y ƒ(α)
= 1 sólo si ƒ(β) = 0 y ƒ(γ) = 1.
[I∀] Sea α la fórmula ∀ξβ. Diré que ƒ′ es una ξ-variante de 〈D,ƒ〉 si ƒ′
es una interpretación de CP1† en D y para cualquier predicado o
término ω ≠ ξ perteneciente al vocabulario de CP1†, ƒ′(ω) = ƒ(ω).
Entonces, ƒ(α) = 0 si para toda ƒ′ que sea una ξ-variante de ƒ, ƒ′(β)
= 0; y ƒ(α) = 1 si hay una ƒ′, ξ-variante de 〈D,ƒ〉, tal que ƒ′(β) = 1.

Una fórmula α es verdadera en la interpretación 〈D,ƒ〉 si y sólo si ƒ(α) =


Apéndices 487

0.22 De otro modo, α es falsa en la interpretación 〈D,ƒ〉. Si hay al menos


una interpretación 〈D,ƒ〉 en la cual la fórmula α es verdadera, decimos que
α es una fórmula realizable. Si α es verdadera en toda interpretación, deci-
mos que una fórmula α es válida (o universalmente válida). Si α no es ver-
dadera en ninguna interpretación decimos que α es irrealizable. Claramente,
las fórmulas válidas representan lo que llamamos comúnmente verdades ló-
gicas, aseveraciones verdaderas en todo caso, mientras que las fórmulas irrea-
lizables representan aseveraciones lógicamente falsas, que bajo ninguna cir-
cunstancia pueden ser verdaderas. Por eso, decimos a veces ‘fórmula lógica-
mente verdadera (falsa)’ por ‘fórmula válida (irrealizable)’. Decimos asimis-
mo que una fórmula α es una consecuencia lógica o simplemente una con-
secuencia de un conjunto de fórmulas ∆ (simbólicamente, ∆ µ α), si ƒ(α) =
0 en toda interpretación 〈D,ƒ〉 tal que ƒ(β) = 0 para cada fórmula β ∈ ∆. Si
∆ µ α y el conjunto ∆ contiene una sola fórmula β, decimos también que α
es una consecuencia de β (simbólicamente, β µ α). Si α es consecuencia de
β y viceversa, esto es, si en toda interpretación 〈D,ƒ〉, ƒ(α) = ƒ(β), decimos
que α y β son lógicamente equivalentes. Obsérvese que, en virtud de nues-
tras definiciones, una fórmula α es válida si y sólo si ∅ µ α.

C. TAUTOLOGÍAS

A principios de siglo solía usarse ‘tautología’ como sinónimo de ‘verdad lógi-


ca’ (o de ‘fórmula válida’), pero aquí empleamos esa palabra en una acep-
ción más restringida que procedo a explicar.
Como el lector habrá observado, una interpretación 〈D,ƒ〉 asigna a cada
predicado 0-ádico un valor 0 ó 1, pero no le atribuye propiamente un signi-
ficado. Por otra parte, con arreglo a nuestras estipulaciones, cada predicado
0-ádico Π es una fórmula verdadera en 〈D,ƒ〉 si ƒ(Π) = 0 y falsa en ƒ si
ƒ(Π) = 1. Asímismo, una fórmula α que sólo contenga predicados 0-ádicos
se llama verdadera o falsa en 〈D,ƒ〉 según el valor de ƒ(α), calculable de

22 Obsérvese que, al revés de muchos libros de texto, asocio el número 0 a la verdad, el


número 1 a su ausencia. Cualquier decisión en esta materia es, por cierto, arbitraria; la
mía se inspira en palabras de la diosa que instruyó a Parménides, según las refiere
Simplicio: ÉAlhye¤hw eÈkukl°ow étrem¢w ∑tor (Parménides, fr. 1.11 DK).
Apéndices 488

acuerdo con [I¬] y [I→]. Aunque pueden parecer extravagantes y arbitrarias,


estas prácticas tienen un sentido, como ahora veremos. También se entende-
rá por qué exigimos que cada versión del CP1 incluya todos los (infinitos)
predicados 0-ádicos.
Digamos que una fórmula es una fórmula verifuncional si en ella no figu-
ran variables, constantes, predicados monádicos o poliádicos ni cuantifica-
dores. En otras palabras, una fórmula verifuncional sólo puede contener pre-
dicados 0-ádicos, conectivos y paréntesis. Cada predicado 0-ádico diferente
que figura en una o más posiciones en una fórmula verifuncional α es un
componente de α. El epíteto cacofónico pero consagrado ‘verifuncional’ (del
inglés truth-functional) se explica fácilmente. Sea 〈D,ƒ〉 una interpretación
del CP1†. Si α es una fórmula verifuncional del CP1† con componentes
Π1,…, Πn, es claro que ƒ(α) está unívocamente determinado por ƒ(Π1),…,
ƒ(Πn), y en la jerga matemática esto suele expresarse diciendo que el valor
veritativo (verdadero o falso) de α depende funcionalmente del valor veritativo
de sus componentes.
Supongamos ahora que α es una fórmula cualquiera. Sea β una fórmula
verifuncional cuyos componentes Π1,…, Πn (n ≥ 1) no figuran en α. Deci-
mos que β es un prototipo verifuncional de α si hay una lista de fórmulas
diferentes 〈α1,…,αn〉 tal que α es el resultado de reemplazar con αk el com-
ponente Πk en todas las posiciones que Πk ocupa en β (1 ≤ k ≤ n). En tal
caso diremos también que α se deriva de β por reemplazo y que las fórmu-
las α1,…, αn son los componentes verifuncionales de α relativos al proto-
tipo β. Obviamente el valor de α en una interpretación 〈D,ƒ〉 depende funcio-
nalmente de ƒ(α1),…, ƒ(αn).
Ahora puedo explicar lo que en este libro se llama ‘tautología’. Una fór-
mula α de uno de los cálculos predicativos descritos en este apéndice es una
tautología si y sólo si α se deriva por reemplazo de una fórmula verifuncional
válida β (en cuyo caso, obviamente, ƒ(α) = 0 cualquiera que sea el valor de
ƒ en los componentes verifuncionales de α relativos a β, y por ende también
α es válida). El uso del término se extiende por analogía a los cálculos predi-
cativos de que se habla en el cuerpo del libro.
Apéndices 489

D. ACLARACIONES Y ABREVIATURAS

Se advertirá que una interpretación 〈D,ƒ〉 de una versión cualquiera CP1†


del CP1 asigna un objeto del dominio D a cada término del CP1†, el cual
puede entonces considerarse como un nombre del objeto respectivo. Asigna
asimismo una colección de objetos de D a cada predicado monádico, una
colección de pares de objetos a cada predicado diádico, una colección de
tríos a cada predicado triádico, etc., de suerte que cada predicado monádico
del CP1† viene a designar la propiedad de pertenecer a la respectiva colec-
ción de objetos; y cada predicado poliádico, la relación que subsiste entre
los componentes de un elemento de la respectiva colección de n-tuplos de
objetos. Por último, la interpretación asigna a cada fórmula del CP1† uno de
los valores 0 ó 1, que la última estipulación semántica asocia respectivamente
a la verdad o falsedad de esa fórmula. De este modo, nuestras reglas
semánticas caracterizan a las fórmulas del CP1† como oraciones declarativas.
Analicemos un ejemplo. Sean a una constante, P* un predicado monádico
y P** un predicado diádico del CP1†. ¿En qué condiciones precisas es verda-
dera en 〈D,ƒ〉 la fórmula ∀x(P*x → P**xa)? De acuerdo con la regla [I∀],
∀x(P*x → P**xa) es verdadera si y sólo si (P*x → P**xa) es verdadera en
toda interpretación 〈D,ƒ′〉 tal que ƒ′ sea una x-variante de 〈D,ƒ〉. Según la
regla [I→], (P*x → P**xa) es verdadera en 〈D,ƒ′〉 a menos que x ∈ ƒ′(P*)
y 〈x,a〉 ∉ ƒ′(P**). Por lo tanto, para que la fórmula ∀x(P*x → P**xa) sea
verdadera en la interpretación 〈D,ƒ〉 es necesario y suficiente que cualquier
objeto del dominio D que tenga la propiedad designada en esa interpreta-
ción por P* tenga con el objeto llamado a la relación designada por P**.
He elegido para el CP1 un alfabeto paupérrimo, lo cual permite reducir la
gramática a unas pocas reglas muy simples, pero dificulta la lectura. Para
hacerla más fácil empleamos abreviaturas. Así, en vez de la fila de r palotes
que individualizan un cierto término o predicado, escribimos el subíndice
numérico r (x5 en vez de xııııı, etc.); en vez de la fila de n asteriscos que
indican la n-adicidad de un predicado, escribimos el exponente numérico n
(P43 en vez de P****ııı). Para mayor brevedad, podemos omitir los expo-
nentes, ya que en una fórmula bien escrita la n-adicidad del predicado está
indicada por el número de términos que lo acompañan. Asímismo, en con-
textos en que se usan pocas variables, constantes o predicados diferentes,
escribimos x, y, z, u, v, w en vez de x0, x1, x2, x3, x4, x5; a, b, c, d en vez de
Apéndices 490

a0, a1, a2, a3; y cualquier mayúscula cursiva, sin subíndice ni exponente, en
vez de P seguida de astericos y palotes.
Otras abreviaturas, combinadas con las reglas semánticas antedichas, englo-
ban ciertas ideas lógicas corrientes. Por ejemplo, es claro que la fórmula
¬∀x¬P**xa es verdadera en la interpretación 〈D,ƒ〉 si y sólo si hay por lo
menos un objeto en D que tiene con el objeto llamado a la relación desig-
nada por P**. Como esta condición es fácilmente comprensible por sí mis-
ma, se adopta la fila ‘∃ξ’ como abreviatura para representar a la fila ‘¬∀ξ¬’,
que forman el signo de negación ¬, seguido por el signo de cuantificación
universal ∀, seguido por una variable ξ, seguida por el signo de negación ¬.
Se estipula asímismo que, si α y β son fórmulas, la fórmula (¬α → β) se
abrevia (α ∨ β), la fórmula ¬(α → ¬β) se abrevia (α ∧ β) y la fórmula
¬((α → β) → ¬(α → β)) se abrevia (α ↔ β). Si el lector no está familia-
rizado con el tema, debe armarse ahora de papel y lápiz y verificar que las
reglas semánticas del CP1 implican que:

[I∨] Si α es la fórmula (β ∨ γ), ƒ(α) = 0 si ƒ(β) = 0 o ƒ(γ) = 0, y ƒ(α)


= 1 sólo si ƒ(β) = ƒ(γ) = 1.
[I∧] Si α es la fórmula (β ∧ γ), ƒ(α) = 1 si ƒ(β) = 1 o ƒ(γ) = 1, y ƒ(α)
= 0 sólo si ƒ(β) = ƒ(γ) = 0.
[I↔] Si α es la fórmula (β ↔ γ), ƒ(α) = 0 si y sólo si ƒ(β) = ƒ(γ), y ƒ(α)
= 1 si y sólo si ƒ(β) ≠ ƒ(γ).
[I∃] Si α es la fórmula ∃ξβ, ƒ(α) = 0 si hay alguna ƒ′, ξ-variante de
〈D,ƒ〉, tal que ƒ′(β) = 0; y ƒ(α) = 1 sólo si para toda ƒ′ que sea una
ξ-variante de 〈D,ƒ〉, ƒ′(β) = 1.

Los ideogramas ∨, ∧, ↔, son los signos (conectivos) de disyunción, conjun-


ción y equivalencia, respectivamente; ∃ es el signo de cuantificación exis-
tencial (∃ seguido de una variable es un cuantificador existencial).
Minimizar los ideogramas facilita el estudio de las propiedades generales
de un cálculo, pues reduce el número de casos alternativos que hay que
considerar para demostrarlas. Pero para el uso de un cálculo predicativo es
más cómodo incluir también en su alfabeto “oficial” los cuatro ideogramas
∧, ∨, ↔ y ∃. Para ello hay que introducir reglas sintácticas [F∨], [F∧], [F↔]
y [F∃] que legitimen las fórmulas (α ∨ β), (α ∧ β), (α ↔ β) y ∃ξα, y agre-
gar las reglas semánticas [I∨], [I∧], [I↔] y [I∃] a las estipulaciones que defi-
Apéndices 491

nen la aplicación ƒ. Tal es la convención que seguimos en el resto de este


apéndice y, en general, en este libro. Bajo dicha convención, por ejemplo, la
expresión (α ∨ β) no es ya una mera abreviatura de la fórmula (¬α → β)
sino, al igual que ésta, una fórmula genuina del cálculo. Por otra parte, es
claro que (α ∨ β) y (¬α → β) son lógicamente equivalentes. El lector para
quien esto no sea obvio debe ejercitarse en probarlo; debe probar también la
equivalencia lógica de (α ∧ β) con ¬(α → ¬β), de (α ↔ β) con ¬((α → β)
→ ¬(α → β)) y de ∃ξα con ¬∀ξ¬α.
Ocasionalmente es útil emplear la negrita para abreviar una fila de símbo-
los consecutivos de la misma clase. Por ejemplo, en vez de x1x2x3x4x5 escri-
bimos simplemente x o, si deseamos mayor precisión, x5. Asímismo &x4 y
"x6 representan, respectivamente, una fila de 4 cuantificadores existenciales
y una de 6 cuantificadores universales.

E. CÁLCULO PREDICATIVO CON IDENTIDAD

Una escritura conceptual sirve para expresar las matemáticas sólo si en ella
se puede decir, llegado el caso, que tal objeto es el (único) valor de una
cierta función para un dado argumento; por ejemplo, que 12 es la suma de 7
y 5. En el CP1 esto es posible si reservamos un predicado diádico para re-
presentar la relación de identidad, representamos mediante predicados (n+1)-
ádicos las funciones —o, más generalmente, las aplicaciones— cuyos argu-
mentos son n-tuplos, y acompañamos cada uso de estos predicados de una o
más aseveraciones que los caractericen como tales. Pero este procedimiento
no es cómodo. Así, por ejemplo, si abreviamos con I el predicado diádico
con que representaremos la identidad, tenemos que postular, para cada fór-
mula α, la aseveración ∀x∀y(Ixy → (α ↔ αx/y)). Si F es un predicado triádico
elegido para representar una aplicación cuyo dominio es un conjunto de pares,
hay que incluir la condición ∀x∀y∀z(Fxyz → ∀w(Fxyw → Izw)). Más prác-
tico y, en cierto modo, más natural, es agregar al alfabeto del CP1 un ideo-
grama que signifique la identidad y un método para construir términos que
denoten el valor de aplicaciones en cada argumento dado y postular nuevas
reglas sintácticas y semánticas que gobiernen el uso de estos signos. Llama-
ré cálculo predicativo con identidad o CP1= a la escritura conceptual así
ampliada. He aquí la gramática del CP1=:
Apéndices 492

El alfabeto. El alfabeto del CP1= consta de los doce ideogramas ¬, →, ∧,


∨, ↔, ∀, ∃, =, (, ), ı, *, y de las cuatro letras x, a, f, P. El ideograma = es
el signo de identidad.

Vocabulario.
(i) Functores: Distinguimos, para cada entero positivo n ≥ 1, la clase de
los functores n-arios. f* —la letra f seguida de un asterisco— es un
functor 1-ario. Si ϕ es un functor n-ario (n ≥ 1), ϕı es un functor n-
ario. Si ϕ es un functor n-ario que no contiene palotes, ϕ* es un functor
(n+1)-ario.
(ii) Términos: Las variables y constantes del CP1= se definen como las
del CP1. Además, cualquier functor n-ario seguido de n términos es un
término.
(iii) Predicados: Se definen como en el CP1.

Léxicos. Un conjunto (vacío, finito o infinito) de constantes, predicados n-


ádicos y functores m-ádicos (para uno o más valores positivos de n y m)
constituye el léxico de una versión del CP1=.

Fórmulas. A las reglas de formación de fórmulas propias del CP1 hay que
agregar la siguiente: Si τ y σ son términos, la fila de signos descrita a conti-
nuación es una fórmula simple:

[F=] (τ = σ)

Semántica. Sea CP1=† una versión del cálculo predicativo de primer orden
con identidad. Sea 〈D,ƒ〉 una interpretación de CP1=†. Sea V el conjunto
de los functores, variables, constantes y predicados de CP1=†. Se mantie-
nen todas las reglas semánticas que dimos para CP1†, excepto [Iτ] que se
reemplaza por la regla [I′τ] enunciada abajo. Además, se agregan las reglas
[I0] y [I=]. Las nuevas reglas determinan la interpretación de los términos
precedidos por functores y de las fórmulas construidas según la regla [F=].

[I0] Para todo functor n-ario ϕ ∈ V, ƒ(ϕ) es una aplicación cuyo domi-
nio es el producto cartesiano de n partes de D —no necesariamente
distintas— no vacías y bien definidas, y cuyo codominio es una parte
Apéndices 493

bien definida de D.
[I′τ] Si τ es una variable o una constante, ƒ(τ) ∈ D. Si τ es un término
formado por un functor n-ario ϕ seguido de n términos σ1,…,σn,
entonces (i) si 〈ƒ(σ1),…,ƒ(σn)〉 pertenece al dominio de ƒ(ϕ), ƒ(τ)
es el valor de la aplicación ƒ(ϕ) en el argumento 〈ƒ(σ1), …,ƒ(σn)〉;
y (ii) si 〈ƒ(σ1),…,ƒ(σn)〉 no pertenece al dominio de ƒ(ϕ), ƒ(τ) no
está definida.
[I=] Si α es la fórmula (τ = σ), ƒ(α) = 0 si ƒ(τ) = ƒ(σ) y ƒ(α) = 1 si
ƒ(τ) ≠ ƒ(σ).23

F. DECISIÓN Y DEDUCCIÓN

El cálculo predicativo y otros sistemas similares de “lógica simbólica” se


inventaron ante todo para poder juzgar si un razonamiento es correcto o in-
correcto por la sola inspección visual de los signos que lo representan (cf. la
cita de Leibniz en la p. 129). Evidentemente, este propósito se habrá logra-
do con todos los razonamientos representables en el CP1= si se dispone de
un algoritmo que permita calcular si una fórmula dada α es o no es válida.
En efecto, si las premisas de un razonamiento se pueden representar con las
fórmulas π1, π2,…, πn y su conclusión con la fórmula κ, el razonamiento
en cuestión será correcto si y sólo si la fórmula (π1 ∧ π2 ∧ …∧ πn) → κ
es válida. (El lector para quien esto no sea enteramente obvio debe, como
siempre, comprobarlo con papel y lápiz: muestre que, si la forma antedicha
no es válida, puede ocurrir que la fórmula κ sea falsa aunque todas las fór-
mulas π1, π2,…, πn sean verdaderas).

23 El lector alerta advertirá que en el enunciado de la regla [I=] el signo ‘=’ que figura
entre τ y σ no es igual al signo ‘=’ que figura tres veces después de la coma. El signo
más largo es el signo de igualdad del CP1=; el signo más breve es el familiar signo
de igualdad común al castellano y los demás idiomas modernos. Este distingo no se
observa en la mayor parte de este libro, en que el signo corriente ‘=’ se emplea como
signo de igualdad en cualquier contexto, sea formal o informal. Con todo, uso el signo
de igualdad largo cuando me refiero a la versión final de la escritura conceptual BS de
Frege (Capitulo 2.2, Sección 2.3.3 y Apéndice XII), en la cual dicho signo representa
a la vez la identidad entre objetos y la equivalencia entre oraciones (la cual presupone
la identidad de sus valores veritativos).
Apéndices 494

Un algoritmo para determinar la validez de las fórmulas de un cálculo


lógico (o de un fragmento de un cálculo lógico) se llama un procedimiento
de decisión para ese cálculo (o fragmento). Para las fórmulas verifuncionales
del CP1= hay un procedimiento de decisión —propuesto ya en 1880 por
Peirce (CP, 3.387) y difundido en este siglo por Post (1921) y Wittgenstein
(1922)— que consiste en la construcción de lo que se llaman “tablas de
verdad”. Dicho procedimiento se funda en los hechos siguientes: (i) Cada
una de las reglas semánticas [I¬], [I→], [I∨], [I∧] y [I↔] puede leerse como la
definición de una operación sobre el conjunto {0,1} y permite calcular sim-
plemente el valor asignado por esa operación a cada argumento admisible
(que son dos en el caso de la operación 1-aria definida por [I¬], cuatro en
cada uno de los casos restantes).24 (ii) Si α es una fórmula verifuncional con
n componentes distintos α1,…, αn, cada interpretación ƒ pertenece a una y
sólo una de 2n clases de interpretaciones posibles, determinada por la lista
de valores ƒ(α1),…, ƒ(αn). Computando 2n veces ƒ(α) con arreglo a lo dicho
bajo (i), se sabrá si α es válida (esto es, si ƒ(α) = 0 en todos los casos).25
Obviamente si α es válida y es un prototipo verifuncional de una fórmula β,
también β es válida.
En los años 20, varios seguidores de Hilbert buscaron afanosamente un
procedimiento de decisión para el CP1. Mas, como se explica en el Capítulo
2.11, no puede haber tal procedimiento (al menos, si nos atenemos a la de-
finición precisa de ‘algoritmo’ propuesta por Church e insuperada hasta aho-
ra). Hay, con todo, otro camino —más incierto, pero más viable— para ve-
rificar si un razonamiento es correcto o no, por la sola inspección visual de
su representación simbólica. Este camino, que ya fue seguido por Frege
(Capítulo 2.2), consiste en organizar el cálculo lógico como un sistema de-
ductivo, premunido de axiomas y reglas de inferencia. Un axioma es una
fórmula distinguida del cálculo. El conjunto de los axiomas puede ser finito

24 Simbolizando cada operación con el conectivo correspondiente, escribimos ¬0 = 1, ¬1


= 0; 0 → 0 = 0, 0 → 1 = 1, 1 → 0 = 0, 1 → 1 = 0; etc.
25 Supongamos que α tiene la estructura (α1 → (α2 → α1)). Para saber si α es o no
válida hay que calcular ƒ(α) para los cuatro valores posibles del par 〈ƒ(α1),ƒ(α2)〉, a
saber, 〈0,0〉, 〈0,1〉, 〈1,0〉 y 〈1,1〉. Reemplazando α1 y α2 en α por el valor correspon-
diente y utilizando la “tabla de multiplicar para el operador →” presentada en la nota
23, calculamos que ƒ(α) = 0 en todos los casos. Por lo tanto, cualquier fórmula de la
estructura indicada es una tautología.
Apéndices 495

o infinito, pero en todo caso tiene que haber un procedimiento que permita
decidir, por la sola inspección visual de una fórmula, si ella es o no es un
axioma. Por ejemplo, podemos estipular que cualquier fórmula obtenida re-
emplazando α por una fórmula del cálculo en la fila de signos (α ∨ ¬α) es
un axioma. Una regla de inferencia n–aria (n ≥ 1) es una receta para asociar
una fórmula llamada conclusión a un n-tuplo de fórmulas llamadas premisas,
atendiendo exclusivamente al aspecto visual de éstas y aquélla. Esto quiere
decir que cada regla n–aria R provee un algoritmo para decidir si una fór-
mula dada es o no una conclusión, según R, de un cierto n-tuplo de premisas.
Por ejemplo, la regla de inferencia por modus ponens prescribe que, si α y
β son dos fórmulas cualesquiera, β se puede asociar como conclusión al par
de premisas 〈α, (α → β)〉;26 y obviamente, basta deletrear un trío cualquiera
de fórmulas para constatar si una de ellas es o no la conclusión por modus
ponens de las otras dos.
Una vez que el cálculo se ha organizado como sistema deductivo, se pue-
de definir lo que llamaremos una deducción o prueba. Sea H un conjunto de
fórmulas. Una lista finita de fórmulas α1,…, αn constituye una prueba de
la fórmula αn a partir de las hipótesis H si, para cada k (1 ≤ k ≤ n), o bien
αk ∈ H, o bien αk es un axioma, o bien hay una regla de inferencia r-aria (r
< k) que asocia αk como conclusión a un r-tuplo de premisas contenidas en
la lista α1,…, αk-1. Si H = ∅, decimos simplemente que α1,…, αn es
una prueba de αn. A la luz de esta definición es claro que, dada la índole de
los axiomas y las reglas de inferencia, hay un algoritmo para decidir si la
lista α1,…, αn constituye o no una prueba de αn a partir de determinadas
hipótesis. Si hay una prueba de la fórmula α a partir de las hipótesis H
decimos que, en el sistema deductivo adoptado, α se deduce de H o es de-
ducible de H; simbólicamente: H ∂α. Si los axiomas se eligen entre las fór-
mulas de validez conocida, y las reglas de inferencia se diseñan de modo
que la conclusión sea siempre una consecuencia lógica de las premisas, di-
remos que el sistema deductivo es correcto. En tal caso, como es obvio, α
se deduce de H sólo si α es una consecuencia lógica de H (H ∂α sólo si

26 Recuérdese que según la convención adoptada ‘(α → β)’ designa la fila de signos que
forman el paréntesis izquierdo, seguido por la fila α, seguida por la flecha, seguida por
la fila β, seguida por el paréntesis derecho.
Apéndices 496

H µα). En particular, sólo si α es válida hay una prueba de α (sin hipóte-


sis).
Un sistema deductivo incorrecto sería, por cierto, inservible para el pro-
pósito original del cálculo lógico. Pero un sistema correcto sólo acabará de
satisfacernos si a la vez es completo, esto es, si toda fórmula α que sea una
consecuencia lógica de un conjunto de fórmulas H se deduce de H en el
sistema. Entonces, H ∂α si y sólo si H µα, y la relación puramente sintáctica
de deducibilidad simula cabalmente la relación semántica de consecuencia
lógica. Gödel (1930) demostró que el sistema deductivo ostensiblemente
correcto para el CP1= que él toma de Russell y Whitehead es un sistema
deductivo completo (Capítulo 2.8).

G. UN SISTEMA DEDUCTIVO PARA


EL CÁLCULO DE PRIMER ORDEN

A modo de ejemplo, propongo a continuación un sistema deductivo para


el CP1, basado en uno de los sistemas de “deducción natural” introducidos
por Gentzen en su tesis doctoral, “Investigaciones sobre la deducción lógi-
ca” (1934). Para mayor claridad, incluyo en el alfabeto —además de los sig-
nos indicados en la sección A— los conectivos ∧ y ∨ y el signo de cuantifi-
cación ∃ (el significado de estos signos se explicó en la sección D). La ca-
racterística más notable de los cálculos de Gentzen es que los componentes
de una deducción —premisas, conclusión, etapas intermedias— no represen-
tan, por regla general, aseveraciones incondicionales, sino aseveraciones con-
dicionadas por ciertos supuestos o hipótesis, tal como ocurre en la vida real
y especialmente en el razonamiento matemático.27 Por eso, tales componen-
tes no son fórmulas, sino filas de fórmulas estructuradas en cierta forma.
Para indicar esa estructura, agregamos al CP1 dos signos de puntuación: la
coma [,] y la flecha secuencial [➛]. Un secuente es una fila de fórmulas del

27 Como bien observa Gentzen, “una prueba matemática no está, en general, construida
de un modo tan simple, que en ella se avance, mediante inferencias, de aseveraciones
válidas a nuevas aseveraciones válidas. Ocurre también que una aseveración se supone
válida y de ella se infieren nuevas aseveraciones cuya validez depende entonces de la
validez de esa suposición” (1935, p. 511).
Apéndices 497

CP1 separadas por comas, seguida del signo ➛, seguida de una fórmula del
CP1.28 Las fórmulas que preceden al signo ➛ son las prefórmulas del
secuente; la fórmula precedida por el signo ➛ es la posfórmula. La semán-
tica de los secuentes es muy simple. Consideremos una determinada versión
del CP1. Sea ϕ una fórmula de esa versión y Γ una fila de fórmulas separa-
das por comas. El secuente Γ ➛ ϕ es válido si y sólo si ϕ es verdadero en
cada interpretación (de la versión considerada) en que ninguna de las fórmu-
las de Γ sea falsa. En virtud de esto, las prefórmulas de un secuente válido
representan hipótesis cuya verdad en una interpretación dada asegura la ver-
dad —en esa misma interpretación— de la aseveración representada por la
posfórmula.
Llamo secuente básico a cualquier secuente de la forma ϕ ➛ ϕ, donde ϕ
es una fórmula cualquiera. Cada secuente básico es válido de un modo tri-
vial y puede usarse como axioma en las deducciones. No se admiten otros
axiomas lógicos. El poder deductivo del sistema radica, pues, enteramente
en sus reglas de inferencia. Cada regla de inferencia determina una relación
entre una, dos o tres premisas y una conclusión. Llamo inferencia al conjun-
to ordenado que forman premisa(s) y conclusión. Distinguimos (i) reglas
estructurales (que llevan de una premisa con cierta estructura secuencial a
una conclusión de estructura diferente), (ii) reglas de eliminación e intro-
ducción de los conectivos binarios y los signos de cuantificación y (iii) dos
reglas peculiares a la negación. En la siguiente formulación esquemática de
las reglas de inferencia, las letras griegas mayúsculas Γ y ∆ representan filas
—posiblemente vacías— de fórmulas separadas por comas, las minúsculas
ϕ, χ, ψ representan fórmulas, la minúscula τ representa un término, las mi-
núsculas ξ y η representan variables, y los signos lógicos y de puntuación
están, como de costumbre, representados por ellos mismos. Cada regla se
presenta mediante una figura con una raya horizontal en el centro; el esque-
ma de la o las premisas va sobre la raya, el esquema de la conclusión bajo
la raya. Las inferencias por eliminación de ∧ e introducción de ∨ tienen dos
figuras cada una.

28 Gentzen dice ‘Sequenz’, que es la forma alemana de la misma palabra latina que en
nuestro idioma se ha convertido en ‘secuencia’. Pero lo que nosotros llamamos ‘se-
cuencia’ se llama ‘Folge’ en alemán. Por eso digo ‘secuente’ por ‘Sequenz’, siguiendo
el ejemplo de los escritores de habla inglesa, que dicen ‘sequent’ (no ‘sequence’).
Apéndices 498

Reglas estructurales:
DEBILITAMIENTO CONTRACCIÓN PERMUTACIÓN
Γ➛χ ϕ, ϕ, Γ ➛ χ Γ, ϕ, ψ, ∆ ➛ χ
ϕ, Γ ➛ χ ϕ, Γ ➛ χ Γ, ψ, ϕ, ∆ ➛ χ

Reglas de introducción y eliminación:


INTRODUCCIÓN ELIMINACIÓN

∧ Γ➛ϕ Γ➛ψ Γ➛ϕ∧ψ Γ➛ϕ∧ψ


Γ➛ϕ∧ψ Γ➛ϕ Γ➛ψ

∨ Γ➛ϕ Γ➛ψ Γ➛ϕ∨ψ ϕ, ∆ ➛ χ ψ, ∆ ➛ χ


Γ➛ϕ∨ψ Γ➛ϕ∨ψ Γ, ∆ ➛ χ

→ ϕ, Γ ➛ ψ Γ➛ϕ ∆ ➛ (ϕ → ψ)

Γ ➛ (ϕ → ψ) Γ, ∆ ➛ ψ

∀ Γ ➛ ϕη/ξ Γ ➛ ∀ξϕ
Γ ➛ ∀ξϕ Γ ➛ ϕτ/ξ
siempre que η no figure en Γ ni en ∀ξϕ donde τ es un término cualquiera

∃ Γ ➛ ϕτ/ξ Γ ➛ ∃ξϕ ϕη/ξ, ∆ ➛ ψ


Γ ➛ ∃ξϕ Γ, ∆ ➛ ψ
donde τ es un término cualquiera siempre que η no figure en Γ, ∆, ψ ni ∃ξϕ

Reglas de la negación:
REFUTACIÓN ELIMINACIÓN DE ¬¬
ϕ, Γ ➛ ψ ϕ, ∆ ➛ ¬ψ Γ ➛ ¬¬ϕ
Γ, ∆ ➛ ¬ϕ Γ➛ψ
Apéndices 499

Con un poco de reflexión el lector podrá comprobar que, si las premisas


de cada una de las inferencias arriba representadas son secuentes válidos, la
conclusión respectiva también es un secuente válido. Si no conocía el tema
de antemano, debe poner especial empeño en entender por qué la restricción
impuesta a la variable η en las reglas de introducción de ∀ y de eliminación
de ∃ (se exige que η sea una variable “nueva”) es a la vez necesaria y su-
ficiente para que las inferencias gobernadas por esas reglas sean correctas.
Una prueba (Gentzen dice Herleitung, ‘derivación’) es una lista finita de
secuentes cada uno de los cuales es un secuente básico o es la conclusión de
una inferencia (conforme a alguna de las reglas indicadas) cuya(s) premisa(s)
lo precede(n) en la lista. En otras palabras, si ∆ = 〈S0,…,Sn〉 es una lista
finita de secuentes (n ≥ 0), ∆ es una prueba si y sólo si, para cada índice k
(0 ≤ k ≤ n), tenemos que Sk es un secuente básico o la conclusión de una
inferencia con premisas Sh, Si, Sj (0 ≤ h ≤ i ≤ j < k).
Ilustraré estas ideas con un ejemplo modesto, una prueba de la conocida
tautología (P → (P1 → P)). La prueba va en la columna del centro; los nú-
meros de la izquierda sirven para identificar a los secuentes; la columna de
la derecha indica la regla en que se basa la introducción del secuente res-
pectivo, así como el número de identidad de la premisa correspondiente. SB
significa “secuente básico”.

(1) P➛P SB
(2) P1,P ➛ P Debilit., (1)
(3) P ➛ (P1 → P) Int. →, (2)
(4) ➛ (P → (P1 → P)) Int. →, (3)

El secuente (1) es válido. La prueba se ajusta a las reglas. Por lo tanto, el


secuente (4) es válido. Su posfórmula es, por ende, verdadera en cualquier
interpretación del cálculo en que no sea falsa una de sus prefórmulas. Como
el secuente (4) no tiene prefórmulas, no hay ninguna interpretación en que
una de ellas sea falsa. Por lo tanto, la posfórmula (P → (P1 → P)) es válida
(verdadera en cualquier interpretación).
Apéndices 500

H. CÁLCULO PREDICATIVO DE SEGUNDO ORDEN

Como se dijo, un cálculo predicativo de segundo orden debe permitirnos ex-


presar generalizaciones acerca de propiedades y relaciones de los objetos
individuales a que se refiere nuestro discurso. Ello demanda muy pocas in-
novaciones sintácticas.
Alfabeto. Además de los ocho ideogramas y cuatro letras del CP1=, inclui-
mos las letras X y F.
Variables. Distinguimos tres clases de variables: variables individuales, for-
madas como en el CP1= por la letra x seguida o no de palotes; variables
funcionales y variables predicativas. Los nuevos tipos de variables se carac-
terizan así: Una variable predicativa n-ádica consiste de la letra X, seguida
de n asteriscos (n ≥ 1), seguidos por 0 o más palotes. Una variable funcional
r-aria consiste de la letra F seguida de r asteriscos (r ≥ 1), seguidos por 0 o
más palotes.
Esta innovación justifica los siguientes cambios en nuestra terminología:
Llamamos constantes a las antiguas constantes, así como a los antiguos
predicados y functores. Las constantes que empiezan con la letra a son cons-
tantes individuales, las que empiezan con la letra f son constantes funciona-
les y las que empiezan con la letra P son constantes predicativas. Llamamos
signos individuales a las variables y constantes individuales, functores a las
variables y constantes funcionales y predicados a las variables y constantes
predicativas.
Functores. Conforme a la estipulación anterior, la segunda cláusula de la regla
(i) concerniente al vocabulario del CP1= debe reemplazarse por ésta: “f* y
F* son functores 1-arios”. El resto queda igual.
Términos. Se mantiene lo dicho arriba, entendiéndose ahora que las varia-
bles y constantes aludidas bajo este título en la sintaxis del CP1 son varia-
bles y constantes individuales, y que en el párrafo homónimo de la sintaxis
del CP1=, ‘functor’ significa ‘variable o constante funcional’.
Predicados. Para que todas las variables predicativas queden comprendidas
en esta categoría basta insertar esta cláusula en la regla pertinente del CP1:
“La letra X es un predicado 0-ádico”.
Fórmulas. En las reglas [F∀] y [F∃] se entiende ahora que ξ designa una
variable de cualquier clase, individual, funcional o predicativa.
Apéndices 501

Llamaré CP2= a la familia de cálculos de segundo orden con identidad


gobernado por estas reglas de sintaxis (además a las ya formuladas para el
CP1 y el CP1=). Una versión del CP2= incluye todas las variables de las
tres clases, y un cierto subconjunto —posiblemente finito o incluso vacío—
de las constantes, los functores y los predicados.
La semántica de los cálculos de segundo orden no se deja precisar con
tanta facilidad como la sintaxis. Además de la llamada semántica estándar,
descrita enseguida, se han propuesto otras muy diferentes (Henkin 1950).
Una interpretación estándar del CP2= se obtiene extendiendo a las nue-
vas variables (funcionales y predicativas) la función ƒ característica de una
interpretación del CP1=. Específicamente, una interpretación 〈D,ƒ〉 asigna
un objeto del dominio no vacío D a cada signo individual, un conjunto de
n-tuplos de objetos de D a cada predicado n-ádico (constante o variable) y
una aplicación de Dn en D a cada functor n-ario (constante o variable). Las
reglas de semántica del CP1= se pueden mantener inalteradas, con tal que
las palabras ‘functor’, ‘término’, ‘predicado’ y ‘variable’ se entiendan en sus
nuevas acepciones.

I. ALCANCES

En la Sección B definí el alcance de un cuantificador. Este concepto de


alcance puede extenderse también a los conectivos, predicados y functores.
En las definiciones siguientes me refiero en cada caso a una ocasión en que
el objeto de que se habla figura en una fórmula dada. El alcance de un pre-
dicado n-ádico (o de un functor n-ario) es la fila de n términos precedida
inmediatamente por él. El alcance de un cuantificador o de un signo de ne-
gación es la subfórmula que comienza inmediatamente a su derecha. El al-
cance de un conectivo que no sea el signo de negación son las dos subfór-
mulas que lo flanquean. El lector que tenga dudas sobre estas definiciones
debe hacer ejercicios. Diga, por ejemplo, cuáles son, respectivamente, los
alcances de ∀x1, ∃x2, ¬, ∨, P2, P3 y f2 en la fórmula

¬∀x1(P3x1x2x3 ∨ ∃x2¬P2x2f2x1x3).29

29 Solución en la p. 540.
Apéndices 502

J. OMISIÓN DE PARÉNTESIS

Para alivianar la lectura, en general no se imprimen todos los paréntesis que,


según la sintaxis, pertenecen a una fórmula dada. Desde luego, se omite el
primer y el último paréntesis de una fórmula cuando son, respectivamente,
su primer y su último símbolo: en vez de (¬α → β), escribimos ¬α → β.
Estipulamos un orden de prioridad de las asociaciones que los conectivos
establecen entre las expresiones inmediatamente adyacentes. La conjunción
∧ y la disyunción ∨ asocian las fórmulas adyacentes más estrechamente que
la flecha → y la doble flecha ↔. Según esto, α ∧ β → β ∨ γ es la fórmula
((α ∧ β) → (β ∨ γ)). Si una fórmula figura entre dos flechas, la asociación
determinada por la flecha a su derecha tiene prioridad sobre la asociación
determinada por la flecha a su izquierda. Así, α → β → γ → δ es la fórmula
(α → (β → (γ → δ))). Por último, es corriente omitir los paréntesis que,
según la regla [F=], rodean a las expresiones unidas por el signo de identi-
dad =. No hay riesgo de confusión, porque, a diferencia de los conectivos
∧, ∨, → y ↔, la identidad se intercala entre términos, no entre fórmulas.
Por lo tanto, si σ y τ son términos y α y β son fórmulas, en vez de ((σ =
τ) → (α → β)), podemos escribir sin ambigüedad σ = τ → α → β. La
convención relativa al signo = también nos permite omitir los paréntesis en
¬(σ = τ) y escribir ¬σ = τ; pero lo corriente en este caso es usar el signo
≠ y escribir simplemente σ ≠ τ.

AXIOMAS DE LA LÓGICA
(FREGE 1879)

Las nueve fórmulas de la escritura conceptual BS reproducidas a continua-


ción son las leyes lógicas que Frege (1879) adopta como premisas inde-
mostradas de sus deducciones. Están numeradas como en el libro de Frege.
El lector hará bien en verificar que equivalen, respectivamente, a las nueve
fórmulas del CP1 señaladas con los mismos números hacia el final del Ca-
pítulo 2.2. También debe verificar que esas nueve fórmulas son verdades
lógicas conforme a las reglas semánticas del CP1 (Apéndice IX).
Apéndices 503

!$$ a
%^ b
^@ a (1 (1.

14™$2$2¤ a
º 5º%ºº^2¤ c
º 5º^$™¤2¤ b
º5ººººº^2¤™¤ c
º6™$$@ a
ºººº %^@ b
^@™™™™ c (2 (2.

1$$2$2 a
%% ^2 d
%^@™2™ b
^$$@ aº
º ºº %^@ b
6@™™™™™ d (8 (8.

!$$# b
%^# a
^$™¤2 a
ºººº º^2¤™ b (28 (28.

!2$@™ a
^33™ a (31 (31.

!2$33™ a
^@™ a (41 (41.

!$$ ƒ(d)
%^ ƒ(c)
^@ c ∫ d (52 (52.

!@@™ c ∫ c (54 (54.


!$@™ ƒ(c)
%
^a™ ƒ() (58 (58.
Apéndices 504

XI

DEFINICIONES RECURSIVAS (DEDEKIND 1888)

En el Capítulo 2.3 expliqué lo que Dedekind llama un sistema simplemente


infinito ordenado por una aplicación. En el presente apéndice, una expre-
sión de la forma 〈A,φ,a〉 designa un sistema simplemente infinito A, orde-
nado por la aplicación φ y con elemento básico a. Si m, n ∈ A y m > n (m
es mayor que n) en el sentido definido en la p. 158, digo también que n <
m (n es menor que m). Digo, asímismo, que m es el primer elemento de A
que satisface una condición dada si m ∈ A y satisface dicha condición, pero
ésta no es satisfecha por ningún n ∈ A que sea menor que m. Si χ y ψ son
dos aplicaciones, escribo ψχ para referirme a la aplicación compuesta ψ ∑
χ.
Dedekind fue quizás el primero en entender que sólo es legítimo dar defini-
ciones recursivas o “por inducción” si se ha demostrado que tales definicio-
nes caracterizan en forma inequívoca aquello que se pretende definir con ellas.
Su Teorema de la Definición por Inducción (TDI) responde justamente a esta
necesidad. En el Apéndice VIII lo enuncié de un modo apropiado al contex-
to. El enunciado siguiente se ajusta mejor al texto de Dedekind:

TDI Sea Ω un sistema cualquiera. Sea 〈N,σ,1〉 un sistema simplemente


infinito. Si θ es una aplicación de Ω en Ω y ω es un elemento de-
terminado de Ω, hay una y sólo una aplicación ψ: N Æ Ω que satis-
face las condiciones siguientes:
I. ψ(1) = ω
ΙΙ. Para todo n ∈ N, ψσ(n) = θψ(n).

La demostración del TDI se basa en el siguiente lema:

Λ Sea Ω un sistema cualquiera y n un elemento del sistema simple-


mente infinito 〈N,σ,1〉. Sea Zn al sistema formado por todos los ele-
mentos de N iguales o menores que n. Si θ es una aplicación de Ω
en Ω y ω es un elemento determinado de Ω, hay una y sólo una
aplicación ψn: Zn Æ Ω que satisface las condiciones siguientes:
(α) ψn(1) = ω
(β) Para todo t < n, ψnσ(t) = θψn(t).
Apéndices 505

El lema Λ se demuestra por inducción. Evidentemente, hay una y sólo una


aplicación ψ1 de Z1 = {1} en Ω tal que ψ1(1) = ω; ψ1 satisface trivialmente
la condición (β) para n = 1, pues no hay un número t < 1. Por lo tanto, Λ
vale para n = 1. Supongamos ahora que Λ vale para n = q. Demostraré que
en tal caso también vale para n = σ(q). Por hipótesis, existe una única apli-
cación ψq: Zq Æ Ω que cumple las condiciones (α) y (β). Hay, por lo tan-
to, en Ω un único objeto υ = θψq(q). Por consiguiente, la aplicación ψσ(q):
Zσ(q) Æ Ω, definida por x Å ψq(x) (si x ∈ Zq) y σ(q) Å υ, existe y satis-
face las condiciones (α) y (β), y es claramente la única aplicación de Zσ(q)
en Ω que las satisface. Por lo tanto, Λ vale para cualquier número n.
Una vez asegurado el lema Λ, la demostración del TDI es fácil. Tenemos
que para cada n ∈ N hay una única ψn: Zn Æ Ω que cumple las condiciones
del lema. Por lo tanto, la aplicación ψ: N Æ Ω, definida por ψ(n) = ψn(n)
para cada n ∈ N, existe y cumple las condiciones I y II del TDI.30 Supon-
gamos ahora que χ: N Æ Ω también cumple ambas condiciones pero χ ≠ ψ.
Sea µ el primer elemento de N tal que ψ(µ) ≠ χ(µ). Como χ y ψ cumplen
la condición I, es claro que µ > 1. Hay, pues, un número ν tal que µ = σ(ν)
y ψ(ν) = χ(ν). Como χ y ψ cumplen la condición II, ψ(µ) = ψσ(ν) = θψ(ν)
= θχ(ν) = χσ(ν) = = χ(µ), contradiciendo la hipótesis de que ψ(µ) ≠ χ(µ).
Por lo tanto, no hay una χ: ˆ Æ Ω, diferente de ψ, que cumpla las condi-
ciones del TDI.31
Mediante el TDI Dedekind puede demostrar que todos los sistemas simple-
mente infinitos son isomórficos. Sean 〈N,σ,1〉 y 〈M,τ,0〉 dos sistemas sim-
plemente infinitos. Se trata de probar que hay un isomorfismo entre ellos,
esto es, una biyección ψ: N Æ M, con inversa ψ-1, tal que ψ(1) = 0, τψ =
ψσ y τψ-1 = ψ-1σ. Según el TDI hay una y sólo una aplicación ψ: N Æ M
tal que ψ(1) = 0 y τψ = ψσ. Probaremos que ψ es biyectiva. Supongamos,
por el contrario, que ψ no es ni siquiera inyectiva. Si hay un n ∈ N tal que

30 Obsérvese que Dedekind usa aquí ya en 1888 el método de diagonalización que Can-
tor hará famoso con su segunda —y más conocida— prueba de la indenumerabilidad
del continuo de 1890/91. Por lo demás, ese método había sido empleado antes por du
Bois- Reymond (1875); vide supra p. 43, nota 11.
31 Como ψσ(n) concuerda con ψn en Zn, para cada n ∈ ˆ, resulta que ψn es precisamente
la restricción de ψ a Zn.
Apéndices 506

n ≠ 1 y ψ(n) = 0, hay un m ∈ N tal que n = σ(m) y 0 = ψσ(m) = τψ(m) ∈


τ(M), lo cual es imposible. Sea pues m > 1 el primer elemento de N tal que
ψ(m) = ψ(n) para un n ∈ N tal que n ≠ m. Sea h = σ-1(m) y k = σ-1(n).
Como k ≠ h < m, ψ(h) ≠ ψ(k) por hipótesis. Como τ es inyectiva, τψ(h) ≠
τψ(k). Pero τψ(h) = ψσ(h) = ψσ(k) = τψ(k). ¡Contradicción! Por lo tanto, ψ
es inyectiva. Supongamos ahora que ψ, aunque inyectiva, no es biyectiva.
Entonces hay elementos de M que no pertenecen a ψ(N). Sea a el primer
elemento de M tal que a ∉ ψ(N). Como 0 = ψ(1), a ≠ 0. Por lo tanto, hay
un b ∈ M tal que a = τ(b) y hay un c ∈ N tal que b = ψ(c). Pero entonces
a = τψ(c) = ψσ(c), de modo que a ∈ ψ(N). ¡Contradicción! Por lo tanto, ψ
es biyectiva. Sea, pues, ψ -1: M Æ N la biyección inversa. Tenemos que
ψ -1(0) = 1. Además, ψ -1τ = ψ -1τ(ψψ -1) = ψ -1(τψ)ψ -1 = ψ -1(ψσ)ψ -1 =
(ψ -1ψ)σψ -1 = σψ -1. Esto completa la demostración de que ψ es un isomor-
fismo. Se observará que ψ -1 es precisamente la aplicación de M en N cuya
existencia y unicidad establece el TDI.
La unicidad de ψ y ψ -1 significa que cada elemento de M puede tomarse
como representante canónico de un determinado elemento de N y viceversa.
Por esta razón, se justifica plenamente sostener con Dedekind que cada sis-
tema simplemente infinito puede servirnos de “serie numérica” lo mismo que
cualquier otro (cf. Capítulo 2.3). En lo que resta de este apéndice, hablaré
sólo de una tal estructura fija 〈ˆ,σ,0〉, que elijo como representativa.32 Si-
guiendo a Dedekind, definiré la adición, la multiplicación y la exponenciación
en esta estructura y demostraré que la adición y la multiplicación así defini-
das tienen las propiedades tradicionales: conmutatividad, asociatividad, distri-
butividad de la multiplicación con respecto a la adición. Las demostraciones
se hacen por inducción. Para facilitar la lectura sigo en todas el mismo es-
quema: enuncio una tesis [T] concerniente a un número indeterminado n;
establezco la base de la inducción [B]: la tesis es verdadera si n = 0; y doy
el llamado “paso inductivo” [P], esto es, pruebo que si la tesis vale para un
dado n ∈ ˆ también vale para el elemento siguiente σ(n).

32 Conforme a la práctica matemática actual, designo con 0 el elemento básico de la “se-


rie numérica” representativa (contamos: “cero, uno, dos,…”). Como se verá, ello per-
mite definir elegantemente la adición de modo que la operación de sumar el elemento
básico (x Å x + 0) coincida con la identidad Iˆ: ˆ → ˆ; x = x+1.
Apéndices 507

Adición. En virtud del TDI existe, para cada n ∈ ˆ, una y sólo una aplica-
ción σn: ˆ Æ ˆ, tal que σn(0) = n y σnσ = σσn. En particular, σ0 es la
identidad en ˆ, Iˆ: x Å x, pues ésta es la única aplicación de ˆ Æ ˆ que
conmuta con σ y asigna el valor 0 al argumento 0. La adición queda enton-
ces definida inequívocamente por la condición: n + m = σm(n). Probaremos
por inducción que, para todo m, n ∈ ˆ, σ(n + m) = n + σ(m).
[T] σσm(n) = σσ(m)(n).
[B] Es claro que σσ(m)(0) = σ(m) = σσm(0).
[P] Si σ(n + m) = σσm(n) = σσ(m)(n) = n + σ(m), entonces σ(σ(n) + m)
= σσmσ(n) = σσσm(n) = σσσ(m)(n) = σσ(m)σ(n) = (σ(n) + σ(m)).
Por lo tanto, σ(n + m) = n + σ(m), para todo n, cualquiera que sea m. Si
ponemos m = 0, comprobamos que σσ(0) = σσ0 = σ.

La adición es asociativa.
[T] Si a, b y n son cualesquiera elementos de ˆ, entonces
(a + b) + n = a + (b + n).
[B] (a + b) + 0 = a + b = a + (b + 0)
[P] Si (a + b) + n = a + (b + n), entonces (a + b) + σ(n) =
σ((a + b) + n ) = σ(a + (b + n)) = a + σ(b + n) = a + (b + σ(n)).
Por lo tanto, la adición es asociativa.

La adición es conmutativa.
[T] Si a y n son cualesquiera elementos de ˆ, a + n = n + a.
[B] a + 0 = σ0(a) = a = σa(0) = 0 + a.
[P] Si a + n = n + a, esto es, si σnσa(0) = σaσn(0), tenemos que
a + σ(n) = σσnσa(0) = σσaσn(0) = σaσσn(0) = σ(n) + a.
Por lo tanto, la adición es conmutativa.33

33 Como Dedekind cuenta “uno, dos, tres,…”, tiene que definir la adición de modo que
el elemento básico sumado a cualquier n no dé n sino el siguiente de n. Sea pues el
sistema simplemente infinito ˆ ordenado por la aplicación σ la serie numérica repre-
sentativa elegida por Dedekind, y designemos con 1 su elemento básico. Dedekind
considera para cada n ∈ ˆ la única aplicación ϕn: ˆ Æ ˆ, tal que ϕn(1) = σ(n) y ϕnσ
= σϕn. Obviamente, ϕ1 = σ. La adición se define por la condición m + n = ϕn(m), la
cual implica que (i) m + 1 = σ(m) y (ii) σ(m + n) = m + σ(n). La conmutatividad y
asociatividad de la adición pueden establecerse entonces como arriba.
Apéndices 508

Multiplicación. Para definir la multiplicación, conviene tener presente que,


en virtud del TDI, si n ∈ ˆ hay una y una sola aplicación χn: ˆ Æ ˆ tal
que χn(0) = 0 y σnχn = χnσ. Obsérvese, en particular que, para todo n ∈ ˆ,
χ0(n) = 0 y χσ(0)(n) = n.34 La multiplicación queda inequívocamente defini-
da por la condición m × n = χn(m). En virtud de la observación recién he-
cha, n × 0 = 0 = 0 × n y n × σ(0) = n.

La multiplicación es distributiva.
[T] n × (a + b) = (n × a) + (n × b).
[B] 0 × (a + b) = 0 = (0 × a) + (0 × b).
[P] Si n × (a + b) = (n × a) + (n × b), σ(n) × (a + b) = χa+bσ(n) =
σa+bχa+b(n) = (n × (a + b)) + a + b = (n × a) + (n × b) + a + b =
(n × a) + a + (n × b) + b =, σaχa(n) + σbχb(n) = χaσ(n) + χbσ(n) =
(σ(n) × a) +(σ(n) × b).
Por lo tanto, la multiplicación es distributiva (con respecto a la adición).

La multiplicación es conmutativa.
[T] n × a = a × n.
[B] 0 × a = 0 = a × 0.
[P] Si n × a = a × n, σ(n) × a = χaσ(n) = σaχa(n) = (n × a) + a =
(a × n) + (a × σ(0)) = a × (n + σ(0)) = a × σ(n).
Por lo tanto, la multiplicación es conmutativa.

La multiplicación es asociativa.
[T] n × (a × b) = (n × a) × b.
[B] 0 × (a × b) = 0 = (0 × a) × b
[P] Si n × (a × b) = (n × a) × b, σn × (a × b) = χa×bσ(n) = σa×bχa×b(n) =
(n × (a × b)) + (a × b) = ((n × a) × b) + (a × b) = (b × (n × a)) + (b ×
a) = b × ((n × a) + a) = b × ((a × n) + (a × σ(0)) =
b × (a × (n + σ(0))) = b × (a × σ(n)) = ((σ(n) × a) × b.
Por lo tanto, la multiplicación es asociativa.

34 Por una parte, χ0σ(n) = σ0χ0(n) = χ0(n) + 0 = χ0(n) = 0, puesto que χ0(0) = 0. Por
otra parte, χσ(0)(σ(0)) = σ(0) y si χσ(0)(n) = n, entonces χσ(0)σ(n) = σσ(0)χσ(0)(n) =
σσ0χσ(0)(n) = σχσ(0)(n) = σ(n).
Apéndices 509

Exponenciación. Para definir la exponenciación, consideramos que, en vir-


tud del TDI, si n ∈ ˆ hay una y sólo una aplicación εn: ˆ Æ ˆ tal que
εn(0) = σ(0) y χnεn = εnσ. Definimos: mn = εn(m). El lector puede ejercitarse
en probar que m0 = σ(0), mpmq = mp+q y (mp)q = mpq, cualesquiera que sean
m, p, q ∈ ˆ.

XII

EXTENSIÓN Y RECORRIDO
(FREGE 1891, 1893)

Según Frege (1884), cada número natural es la extensión de un concepto, a


saber, el concepto mediante el cual se piensa la propiedad de ser equinumeroso
con cierto concepto (éste puede ser cualquiera de los conceptos a que —en
sentido fregeano— corresponde el número en cuestión). Para Frege, las ex-
tensiones de conceptos son objetos, que pueden naturalmente caer bajo otros
conceptos —por ejemplo, la extensión del concepto equinumeroso con el
concepto ‘día de la semana’ (esto es, el número 7) y la extensión del con-
cepto equinumeroso con el concepto ‘mes del año’ (esto es, el número 12)
caen ambas bajo el concepto número finito. Como Frege (1884, p. 80n.) dice
que da por sabido lo qué es la extensión (Umfang) de un concepto, en mi
presentación de su filosofía de la aritmética en la Sección 2.3.3 asigné a ese
término su significado tradicional, con arreglo al cual la extensión de un
concepto es la suma o agregado de todas las cosas que caen bajo ese con-
cepto.
En su versión original, la escritura conceptual BS no incluía un medio
específico para nombrar la extensión de un concepto. Frege (1891) remedia
esta deficiencia introduciendo lo que luego describe como “uno de los
enriquecimientos más fecundos (folgenreichsten) de mi escritura conceptual”
(1893, p. 14). De ahí en adelante, la notación §F(e) designa la extensión —
Apéndices 510

en el sentido de Frege— del concepto expresado por la letra F.35 Con todo,
las explicaciones que rodean la introducción del nuevo recurso expresivo
parecen indicar que, en su obra madura, Frege no entiende el término ‘ex-
tensión de un concepto’ en la acepción tradicional arriba señalada.
Como indiqué en el Capítulo 2.2, desde 1891 Frege entiende que los
conceptos constituyen una especie del género función. Un concepto es una
función que asigna a cada objeto del universo uno de los dos valores v (“lo
verdadero”) o f (“lo falso”). Frege supone que cada función esta asociada a
un objeto característico, que llamaré su recorrido (Frege dice Wertverlauf,
literalmente, “recorrido del valor”). Frege no explica en qué consiste el re-
corrido de una función. Se limita a decir que “emplea universalmente las
palabras ‘la función Φ(ξ) tiene el mismo recorrido que la función Ψ(ξ)’ como
sinónimas de las palabras ‘las funciones Φ(ξ) y Ψ(ξ) tienen siempre valores
iguales para argumentos iguales’” (1893, p. 7). La notación §Φ(e) se intro-
duce precisamente para designar el recorrido de la función Φ (1891, p. 10).36
Frege adopta la siguiente convención léxica: “Podemos designar como
extensión de un concepto (Begriffsumfang) al recorrido de una función cuyo
valor para cada argumento es un valor veritativo (Wahrheitswert)”, esto es,
uno de los objetos v o f (1891, p. 16). En virtud de ella, si la función Φ es
un concepto, la expresión ‘§Φ(e)’ denota su extensión —en el nuevo sentido
fregeano— mas no parece que ésta pueda identificarse con la colección de
todas las cosas que caen bajo ese concepto.
Las funciones fregeanas son, como sabemos, aplicaciones del universo de
objetos en sí mismo. La equivalencia §Φ(e) = §Ψ(e) ↔ ∀x(Φ(x) ↔ Ψ(x))
sugiere, pues, que el recorrido de la función Φ es lo que hoy llamaríamos su
grafo, esto es, el conjunto de todos los pares 〈x, Φ(x)〉 que se forman toman-

35 Hay una ironía involuntaria en el epíteto folgenreichste —literalmente, ‘más rico en


consecuencias’— aplicado a la nueva notación pues gracias al axioma introducido por
Frege para regular su uso resulta que todas las aseveraciones expresables en la escritu-
ra BS son derivables en el sistema fregeano.
36 La notación se extiende fácilmente a lo que Frege llama ‘funciones con dos (o más)
argumentos’, tal como la suma, designada por la expresión insaturada j + z (en que las
letras griegas marcan los “huecos”). Si fijamos uno de los dos argumentos, poniendo,
digamos, z = 3, obtenemos una función de un argumento, cuyo recorrido es §(e + 3).
Entonces, la expresión insaturada ‘§(e + z)’ designa una función de un argumento, cuyo
recorrido es é§(e + a).
Apéndices 511

do cada argumento x de la función Φ junto con el valor correspondiente Φ(x).


Los argumentos de una función fregeana son todos los objetos del universo.
Si la función es un concepto, los valores admisibles son sólo los dos valores
veritativos. Por lo tanto, el grafo de un concepto consta de dos clases de
pares, aquellos cuyo segundo miembro es v y aquellos cuyo segundo miem-
bro es f, y divide exhaustiva y exclusivamente los objetos del universo en
dos grupos, aquellos que forman el primer miembro en un par de la primera
clase y aquellos que forman el primer miembro de un par de la segunda cla-
se. Si entendemos, pues, que el recorrido de una función fregeana es preci-
samente su grafo, entonces la extensión fregeana §F(e) del concepto expre-
sado por la letra F puede verse como una partición del universo —lo que
propongo llamar una cortadura de Frege (Frege-Schnitt en alemán, Frege-
cut en inglés)— en la que cada objeto x figura marcado con uno de los dos
valores veritativos. Por otra parte, dos conceptos F y G tienen el mismo re-
corrido si y sólo si los objetos que caen bajo F son precisamente los mismos
que caen bajo G. (Como es obvio, si Φ y Ψ son conceptos, §Φ(e) = §Ψ(e)
↔ ∀x(Φ(x) ↔ Ψ(x)) ↔ ∀x(Φ(x) = v ↔ Ψ(x) = v).)
Frege (1893) utiliza eficazmente la notación §F(e) para expresar en BS la
definiciones de conceptos aritméticos fundamentales que había formulado en
alemán en 1884. Las nuevas definiciones son sumamente ingeniosas y es una
lástima que no pueda comentarlas aquí. La nueva notación figura sólo en
dos de las “leyes lógicas fundamentales” en que descansa el sistema deduc-
tivo de Frege. Aquí sólo nos interesa la primera:37

(V) (§f(e) = ég(a)) = (2u2 f() = g())

37 La otra ley fundamental en que figura la notación §F(e) es esta:


(VI) 1@ a = \§(a = ε)

Ella incorpora formalmente al sistema la notación ‘\ξ’ que Frege 1893, p. 19, explica
informalmente en estos términos:
Distinguimos dos casos:
1) Si, para el argumento [de la función \ξ] existe un objeto ∆ tal que \§(∆ = ε)
sea el argumento, entonces ∆ mismo es el valor de la función \ξ.
2) Si para el argumento [de la función \ξ] no existe ningún objeto ∆ tal que \§(∆
= ε) sea el argumento, entonces el argumento mismo es el valor de la función \ξ.
Apéndices 512

Ella repite formalmente y a título de axioma la indicación arriba citada acer-


ca de las condiciones en que los recorridos de dos conceptos son iguales.
Este Axioma V de Frege 1893 lleva derechamente a la paradoja de Russell.
La siguiente derivación fue publicada por Frege (1903, Nachwort) poco des-
pués de que Russell le escribió al respecto. Para facilitar la lectura, “traduz-
co” las fórmulas de Frege al simbolismo lógico actual, enriquecido con la
notación fregeana para nombrar recorridos. En particular, reemplazo el signo
fregeano de identidad ‘=’ por nuestro signo ‘=’ cuando figura entre nombres
de objetos, y por nuestro signo de equivalencia ‘↔’ cuando figura entre ora-
ciones. Apelaré asímismo a reglas de inferencia y teoremas familiares de la
lógica proposicional y predicativa, todos los cuales pueden por cierto validarse
en el sistema de Frege (sin recurrir al Axioma V).
“Traducido”, el Axioma V reza así:

∀G∀F(§Fe = éGa ↔ ∀u(Fu ↔ Gu)) (V)

Con nuestros símbolos de conjunción y cuantificación existencial, combina-


dos con la notación §Φ(e), se puede expresar perspicuamente, mediante la
fórmula ∃G(§Ge = ∆ ∧ ¬G∆), que ∆ es una clase que no pertenece a sí misma.
Frege (1903, p. 256) emplea la fórmula 3G3$ ( ∆) la cual equi-
^ §(@( e)) = ∆
vale lógicamente a la anterior, aunque sería más exacto traducirla así:
¬∀G(§Ge = ∆ → G∆). La clase de todas las clases que no se pertenecen a
sí mismas debe, pues, designarse con el nombre del recorrido de la función
¬∀G(§Ge = j → Gj), vale decir, §(¬∀G(§Ge = e → Ge)). En aras de la
brevedad, denotaré este objeto con la constante k.38 Así, por definición:

Según esto, \§(∆ = ε) = ∆ es lo verdadero y ‘\§Φ(ε)’ denota el objeto que cae


bajo el concepto Φ(ξ) si Φ(ξ) es un concepto bajo el cual cae un y sólo un objeto.
En todos los demás casos, ‘\§Φ(ε)’ denota lo mismo que ‘§Φ(ε)’.
38 Frege también usa una abreviatura para nombrar la clase de todas las clases que perte-
necen a sí mismas, pero, como cabía esperar, es mucho más rebuscada que la adoptada
aquí. Usa la letra A invertida, creando así —con otro significado— el símbolo moder-
no del cuantificador universal (∀).
Apéndices 513

§(¬∀G(§Ge = e → Ge)) = k (1)

Si en el Axioma V ejemplificamos las variables predicativas F y G, respec-


tivamente con las funciones Hξ y ¬∀G(§Ge = ξ → Gξ), deducimos la pro-
posición siguiente:

§He = §(¬∀G(§Ge = e → Ge)) ↔ ∀u(Hu ↔ ¬∀G(§Ge = u → Gu))


(2)

Para facilitar la comprensión de los pasos siguientes abrevio con ∀uΨ(u) la


subfórmula a la derecha del primer signo ↔. La convención (1) me permite
reemplazar con §He = k la subfórmula a la izquierda de dicho signo. Usando
estas abreviaturas, (2) se escribe:

§He = k ↔ ∀uΨ(u) (2a)

(2a) implica que §He = k → ∀uΨ(u). De esta fórmula —utilizando el esque-


ma (12) del Apéndice XIII (p. 518)— se deduce la fórmula siguiente:

∀u(§He = k → Ψ(u)) (3)

Ejemplificando la variable individual u con el objeto k, obtenemos:

§He = k ↔ Ψ(k) (4a)

Si recordamos que Ψ(u) representa el alcance del cuantificador ∀u en (2),


vemos que (4a) abrevia la fórmula siguiente:

§He = k ↔ (Hk ↔ ¬∀G(§Ge = k → Gk)) (4)

La proposición (4) implica que:39

¬∀G(§Ge = k → Gk) → (§He = k → Hk) (5)

39 (4) es una función veritativa de los componentes §He = k, Hk y ¬∀G(§Ge = k → Gk),


que representaremos con P, Q y R, respectivamente. Un breve cálculo permite compro-
bar que (P ↔ (Q → R)) → (R → (P → Q)) es una tautología.
Apéndices 514

Como H es una variable predicativa arbitraria que no figura en las premisas


iniciales de nuestra deducción, es lícito generalizar:

∀H(¬∀G(§Ge = k → Gk) → (§He = k → Hk)) (6)

Invocando los análogos de segundo orden de los esquemas (12) y (7) del
Apéndice XIII, derivamos de (6) la proposición (7), que Frege deriva directa-
mente de (5):

¬∀G(§Ge = k → Gk) → ∀G(§Ge = k → Gk) (7)

Por otra parte, mediante una simple aplicación del Axioma IIb de Frege 1893
(que es la versión de segundo orden del Axioma 58 de Frege 1879, reprodu-
cido arriba en la p. 503), obtenemos:

∀G(§Ge = k → Gk) → (§He = k → Hk) (8)

Reemplazando la función arbitraria Hj con ¬∀G(§Ge = j → Gj), deduci-


mos:

∀G(§Ge = k → Gk) →
(§(¬∀G(§Ge = e → Ge)) = k → ¬∀G(§Ge = k → Gk)) (9)

Utilizando la convención (1), (9) se puede abreviar así:

∀G(§Ge = k → Gk) → (k = k → ¬∀G(§Ge = k → Gk)) (10)

Por lo tanto,

∀G(§Ge = k → Gk) → ¬∀G(§Ge = k → Gk)) (11)

Sustituyendo P por ∀G(§Ge = k → Gk) en la tautología (P → ¬P) → ¬P y


aplicando la regla modus ponens deducimos:

¬∀G(§G(e) = k → Gk) (12)


Apéndices 515

De (12) y (7), por modus ponens, se deduce:

∀G(§Ge = k → Gk) (13)

que combinada con (12) da

∀G(§Ge = k → Gk) ∧ ¬∀G(§Ge = k → Gk) (14)

La contradicción (14) es una consecuencia lógica del Axioma V de Frege


combinado con sus demás axiomas y reglas de inferencia. (14) implica, a su
vez, todas las proposiciones enunciables en BS.
En el mismo Epílogo que contiene la deducción anterior, Frege sugiere
un remedio. Descompone el Axioma V en dos implicaciones:

∀G∀F(∀u(Fu ↔ Gu) → §Fe = éGa) (Va)

∀G∀F(§Fe = éGa → ∀u(Fu ↔ Gu)) (Vb)

Según él, la paradoja de Russell es una consecuencia de (Vb). El remedio


propuesto consiste en reemplazarla por

∀G∀F(§Fe = éGa → ∀u(u ≠ §Fe → (Fu ↔ Gu))) (Vb′)

Años más tarde, Leßniewski (en 1938; vide Sobociñski 1949), Quine (1955)
y Geach (1956) demostraron que el sistema así modificado implica una con-
tradicción si suponemos que existen por lo menos dos objetos.40 Pero Frege

40 Resnik 1980, pp. 214ss., explica bien este asunto. Al comienzo de su exposición Resnik
observa que (Vb) es manifiestamente incompatible con el Teorema de Cantor (cuya
demostración —como vimos en la p. 50— sugirió a Russell su paradoja). En efecto,
podemos entender que el Axioma V postula la existencia de una aplicación del reino
de los conceptos en el universo de los objetos, y, en tal caso, (Vb) dice que dicha
aplicación es inyectiva. Según Resnik, ello contradice el Teorema de Cantor, conforme
al cual “hay más conjuntos de objetos que objetos” (1980, p. 214). Esta observación
me parece muy confusa. Los conjuntos de objetos, en el sentido de Cantor, también
son objetos, no conceptos, y lo que el Teorema de Cantor dice es que si S es un con-
junto cualquiera de objetos —sean ellos objetos individuales o conjuntos— no puede
haber una aplicación inyectiva de PS en S, donde PS es el conjunto de objetos cons-
Apéndices 516

debe haber sabido que su remedio no servía, puesto que después de 1903
dejó de interesarse en la derivación de las verdades aritméticas de leyes ló-
gicas.

XIII

FÓRMULAS PRENEXAS

Este es un suplemento del Apéndice IX. Me referiré específicamente a una


versión del CP1= que contenga un número ilimitado de predicados n-ádicos,
para cada entero n ≥ 0; pero todo lo que digo puede aplicarse, mutatis
mutandis, a otros cálculos análogos, de orden primero o superior. Recorde-
mos que si α es una fórmula y ξ y ζ son variables, αζ/ξ es la fórmula que se
obtiene al sustituir ξ por ζ en todas las posiciones libres de ξ en α.
Es fácil mostrar, apelando a las reglas semánticas, que los siguientes esque-
mas representan fórmulas válidas:

(1) α ↔. ¬¬α
(2) ∃ξα ↔. ¬∀ξ¬α
(3) ∀ξα ↔. ¬∃ξ¬α
(4) ∀ξ¬α ↔. ¬∃ξα
(5) ∃ξ¬α ↔. ¬∀ξα

Usaré en adelante la letra Q para representar indistintamente los signos de

tituido por las partes (subconjuntos) de S. Sólo si presuponemos que cada concepto
determina un objeto que le corresponde en forma exclusiva —sea éste su extensión
clásica, su recorrido fregeano, o lo que se quiera— podemos relacionar las correspon-
dencias entre objetos a que se refiere el Teorema de Cantor con la correspondencia
entre conceptos y objetos postulada por el Axioma V de Frege.
Apéndices 517

cuantificación ∀ y ∃. Sabemos que, si ξ es una variable, Qξα es una fórmu-


la si y sólo si α es una fórmula. En tal caso, α es el alcance del cuantificador
Qξ, el cual liga la variable ξ en la posición que ξ tiene dentro de él y en
todas las posiciones libres que ξ ocupa en α. Entenderemos que Q represen-
ta el mismo signo de cuantificación todas las veces que ligue una misma
variable en una expresión dada.
Sea α una fórmula en que la variable ξ no ocupa ninguna posición libre.
Entonces todas las fórmulas representadas por el esquema siguiente son vá-
lidas en virtud de las reglas semánticas [I∀], [I∃] y [I↔]:

(6) Qξα ↔ α

Por lo tanto, Qξα y α se pueden sustituir mutuamente en cualquier fórmula


β en la cual una de ellas figure como subfórmula, sin que dicha sustitución
afecte la verdad o la falsedad de β. Decimos, por eso, que el cuantificador
Qξ está ocioso en la fórmula Qξα.
Por otra parte, si β es una fórmula cualquiera en que la variable ζ no
ocupa ninguna posición libre, y ninguna posición de ξ en β cae dentro del
alcance de un cuantificador que ligue a ζ, es fácil comprobar que, según las
reglas semánticas del CP1=,

(7) Qξβ ↔ Qζβζ/ξ

Diré que una fórmula φ es regular si cumple las siguientes condiciones:


(i) φ no contiene ningún cuantificador ocioso; (ii) ninguna variable ligada en
β por un cuantificador ocupa en β posiciones donde esté libre o ligada por
otro cuantificador. Obsérvese que si una fórmula es regular, también son
regulares todas sus subfórmulas. Aplicando repetidamente (6) y (7) se puede
construir, para cada fórmula ψ, una fórmula regular lógicamente equivalente
a ψ. Hay muchos modos de hacerlo, pero es fácil prescribir un método que
determine una fórmula regular única ψ* tal que (ψ ↔ ψ*) sea válida. En-

41 Por ejemplo, se puede adoptar el método siguiente. Sea 〈Q1,…,Qr〉 la lista de los
cuantificadores no ociosos de ψ, en el orden de sus posiciones respectivas, y ζ1, ζ2,…
las secuencia de las variables que no figuran en ψ, ordenadas según el número de palotes.
Sea ψ* la fórmula resultante cuando ψ es sometida a las operaciones siguientes: (i)
eliminar todos los cuantificadores ociosos; (ii) reemplazar por ζi la variable ligada por
Apéndices 518

tonces ψ* es la fórmula regular correspondiente a ψ.41


Suponemos que en las equivalencias (8)–(14), el esquema a la izquierda
del signo ↔ representa una fórmula regular. Recordando que (α → β) ↔
(¬α ∨ β) y (α ∧ β) ↔ ¬(¬α ∨ ¬β) son válidas, es fácil establecer la validez
de:

(8) (Qξα ∨ β) ↔ Qξ(α ∨ β)


(9) (α ∨ Qξβ) ↔ Qξ(α ∨ β)
(10) (Qξα ∧ β) ↔ Qξ(α ∧ β)
(11) (α ∧ Qξβ) ↔ Qξ(α ∧ β)
(12) (α → Qξβ) ↔ Qξ(α → β)
(13) (∀ξα → β) ↔ ∃ξ(α → β)
(14) (∃ξα → β) ↔ ∀ξ(α → β)

Y si tenemos en cuenta que (α ↔ β) equivale lógicamente a (α ∧ β) ∨ (¬α


∧ ¬β), un breve cómputo confirmará que:

(15) (∀ξα ↔ β) ↔ ∀ξ∃ζ((α ∧ β) ∨ (¬αζ/ξ ∧ ¬β))


(16) (∃ξα ↔ β) ↔ ∃ξ∀ζ((α ∧ β) ∨ (¬αζ/ξ ∧ ¬β))

donde (Qξα ↔ β) es regular y ζ es una variable que no figura en α ni en β.


Como (β ↔ Qξα) equivale lógicamente a (Qξα ↔ β), también son válidas
las fórmulas que se obtienen intercambiando Qξα y β en la subfórmula que
precede inmediatamente al segundo signo ↔ en (15) y (16).
Siguiendo a Whitehead y Russell, llamaré matriz a una fórmula que no
contiene cuantificadores. Una fórmula prenexa es una fórmula que consta de
una fila de cuantificadores seguida de una matriz. La fila de cuantificadores

el cuantificador Qi en todas las posiciones en que dicho cuantificador la liga en ψ.


Entonces, si ψ es la formula (∀xP1x3 → ∀x2∃x1(P2x1x2 → ∃x2∀x3(P1x2 ↔ P2x1x3))),
ψ* es la fórmula (P1x3 → ∀x4∃x5(P2x5x4 → ∃x6∀x7(P1x6↔ P2x5x7))).
Apéndices 519

que precede a la matriz es el prefijo de la fórmula. Cada fórmula φ es lógi-


camente equivalente a una fórmula prenexa regular, que puede construirse a
partir de φ en los cinco pasos siguientes:

(i) Se construye la fórmula regular φ* correspondiente a φ.


(ii) Se sustituye en φ* cada subfórmula de la forma (α → β) por otra
de la forma (¬α ∨ β) y cada subfórmula de la forma (α ↔ β) por
otra de la forma ((α ∧ β) ∨ (¬α ∧ ¬β)); la fórmula φ1 obtenida
mediante estas sustituciones es, como sabemos, lógicamente equi-
valente a φ*.
(iii) Se construye, mediante repetidas aplicaciones de (1), una fórmula
φ2 lógicamente equivalente a φ1 en la cual no hay dos signos de
negación consecutivos.
(iv) Mediante repetidas aplicaciones de (2)–(5), se obtiene una fórmula
φ3 lógicamente equivalente a φ2 en que ningún signo de negación
precede inmediatamente a un cuantificador.
(v) Mediante repetidas aplicaciones de (8)–(11), se obtiene una fórmula
prenexa φ4 lógicamente equivalente a φ3.

Evidentemente, (φ ↔ φ4) es válida. Como se puede ver, gracias al paso (ii),


no hace falta recurrir a (12)–(16).42
Una fórmula prenexa de Skolem es una fórmula prenexa en que cada
cuantificador universal precede a todos los cuantificadores existenciales (SWL,
p. 104).43 Skolem (1920) estableció un importante resultado que en nuestros
términos se deja enunciar así:

42 Observemos de paso que dos fórmulas prenexas son equivalentes si difieren sólo en el
orden de los cuantificadores consecutivos de la misma clase. Pues es claro que (φ ↔
ψ) es válida, si φ es la fila α∀ξ∀ζβ y ψ es α∀ζ∀ξβ o si φ es α∃ξ∃ζβ y ψ es α∃ζ∃ξβ,
donde α es una fila de cuantificadores de longitud ≥ 0 y β es una fórmula prenexa o
una matriz.
43 Muchos libros de texto —desde Hilbert y Ackermann 1928— definen, a la inversa,
una fórmula prenexa de Skolem (o “fórmula en la forma normal prenexa de Skolem”)
como una fórmula prenexa en que cada cuantificador existencial precede a todos los
cuantificadores universales. Como ésta no es la definición de Skolem, llamo a las fór-
mulas que la satisfacen fórmulas prenexas de seudo-Skolem.
Apéndices 520

FPS Si φ es una fórmula, hay una fórmula prenexa de Skolem φ∀∃ tal
que φ es realizable si y sólo si φ∀∃ es realizable.44

La demostración se facilita mediante el siguiente arreglo: si ψ es una fórmu-


la en la que r variables diferentes ξ1,…, ξr ocupan posiciones libres, intro-
ducimos un predicado r-ádico Π (que no figura en ψ) que caracterizamos
mediante la definición siguiente ∀ξ1…∀ξr(Πξ1…ξr ↔ ψ). Es claro que
ψ equivale lógicamente a la fórmula elemental Πξ1…ξr.45 Para aligerar el
texto usaré la negrita para representar filas de símbolos similares, como se
explica en la p. 491. Por ejemplo, Q␨k representa una fila de k cuantificadores
mixtos. Sea φ una fórmula cualquiera y φ′ una fórmula prenexa regular lógi-
camente equivalente a φ construida según el método descrito arriba. Si φ′ no
es una fórmula prenexa de Skolem, su prefijo contiene por lo menos una fila
de cuantificadores existenciales consecutivos seguida inmediatamente por un
cuantificador universal. Sea (φ′) el número de tales filas. Consideraremos
en primer lugar el caso en que (φ′) = 1. Entonces φ′ tiene la forma
"␩m&␰h"␨kα, donde α es una matriz o una fórmula prenexa cuyo prefijo
contiene sólo cuantificadores existenciales. Como α es regular, contiene m +
h + k + r variables libres diferentes (r ≥ 0). Por lo tanto, φ′ equivale lógica-
mente a

(17) "␩m&␰h"␨kΠ␩m␰h␨k␹r

donde Π es un predicado (m+h+k+r)-ádico definido —como propuse arri-

44 Como la negación de una fórmula prenexa de Skolem equivale lógicamente —en vir-
tud de (4) y (5)— a una fórmula prenexa de seudo-Skolem, el resultado enunciado
equivale a este otro: Si φ es una fórmula, hay una fórmula prenexa de seudo-Skolem
φ∃∀ tal que φ es válida si y sólo si φ∃∀ es válida.
45 La aplicación de un arreglo como éste a cada fórmula con variables libres —sugerida
por la misma notación en el cálculo de relativos de Schröder empleado por Skolem—
es legítima también en la versión del CP1= con un repertorio ilimitado de predicados
que consideramos en este apéndice. En el caso de una fórmula φ perteneciente a una
versión del CP1= sin tal repertorio ilimitado de predicados, se puede probar que hay
una extensión de esta versión que se distingue de ella sólo en cuanto contiene cierto
número adicional de predicados y en la cual puede construirse una fórmula prenexa de
Skolem que es realizable en una interpretación de la versión extendida si y sólo si φ es
realizable en una interpretación de la versión original.
Apéndices 521

ba— por "␩m"␰h"␨k"␹r(Π␩m␰h␨k␹r ↔ α). Sea Ω un predicado (m+h)-ádico


que no figura en φ. Postulamos que

(18) "␴m"␶h(Ω␴m␶h ↔ "␹r"␨kΠ␴m␶h␨k␹r)

(donde la subfórmula que sigue inmediatamente a la doble flecha contiene


precisamente m + h variables libres). Ahora bien, (18) equivale lógicamente
a

(19) "␴m"␶h((¬Ω␴m␶h ∨ "␹r"␨kΠ␴m␶h␨k␹r)


∧ (&␹r&␨k¬Π␴m␶h␨k␹r ∨ Ω␴m␶h))

y por ende a

(20) "␴m"␶h"␹r"␨k&␭r&␷k((¬Ω␴m␶h ∨ Π␴m␶h␨k␹r)


∧ (Ω␴m␶h ∨ ¬Π␴m␶h␭k␷r))

Por otra parte, en virtud de (18) y (7), tenemos que φ′ equivale lógicamente a

(21) "␩m&␰hΩ␩m␶h

La conjunción de (20) y (21) equivale a la siguiente fórmula prenexa de


Skolem:

(22) "␩m"␴m"␶h"␹r"␨k&␭r&␷k&␰h(Ω␩m␰h ∧
((¬Ω␴m␶h ∨ Π␴m␶h␨k␹r) ∧ (Ω␴m␶h ∨ ¬Π␴m␶h␭k␷r)))

Es claro que (22) es realizable sólo si lo son (21) y su equivalente φ′. Por
otra parte, si φ′ es realizable, esto es, si hay una interpretación 〈D,ƒ〉 tal que
ƒ(φ′) = 0, hay también una interpretación 〈D,ƒ1〉 tal que ƒ1 concuerda con ƒ
en todas las subfórmulas de φ′ y ƒ1(Ω) es precisamente la clase de (m+h)-
tuplos de elementos de D que, antepuestos a cualquier (k+r)-tuplo de tales
elementos, integran la clase de (m+h+k+r)-tuplos ƒ1(Π).46 De esto se sigue
que ƒ1(φ′) = ƒ1((18)) = ƒ1((22)) = 0 —ya que (22) equivale lógicamente a la

46 En jerga matemática, ƒ1(Ω) es la proyección de ƒ1(Π) ⊆ Dm+h × Dk+r sobre Dm+h.


Apéndices 522

conjunción de φ′ y (18). Por lo tanto, (22) es realizable si φ′ lo es. Con esto


se completa la demostración de FPS en el caso especial en que (φ′) = 1. En
el caso general, φ′ tiene la forma Q␩m&␰h"␨kα, donde Q␩m es una fila mix-
ta de cuantificadores que termina con un cuantificador universal. Mediante
un razonamiento igual al anterior probamos que φ′ es realizable si y sólo si
lo es una fórmula ψ que difiere de (22) únicamente en que ψ comienza con
la fila mixta Q␩m en vez de "␩m. ψ no es prenexa de Skolem, pero está más
cerca de serlo que φ′, por cuanto (φ′) = (ψ) + 1. Nuestro razonamiento es
aplicable a ψ y repitiéndolo un número finito de veces se obtiene una fór-
mula prenexa de Skolem que es realizable si y sólo si φ′ es realizable. Dicho
de otro modo: el resultado de Skolem que llamé FPS se establece para cual-
quier fórmula φ por inducción sobre el número  de filas de cuantificadores
existenciales consecutivos que preceden inmediatamente a un cuantificador
universal en una fórmula prenexa ordinaria que equivalga lógicamente a φ.

XIV

EL CÁLCULO DE PREDICADOS MONÁDICOS ES DECIDIBLE

Diré que un cálculo lógico es decidible con respecto a la validez o v-decidible


si hay un algoritmo para determinar mediante un número finito de operacio-
nes simples si una fórmula cualquiera de ese cálculo es o no válida. Como
se narra en el Capítulo 2.7, Löwenheim (1915) demostró un teorema del cual
se deduce que el cálculo de predicados monádicos —esto es, aquel fragmen-
to del CP1= (o de otro cálculo lógico equivalente o análogo) que no contie-
ne predicados poliádicos— es v-decidible. Bernays y Schönfinkel (1928, pp.
352–355) dieron una demostración muy elegante del mismo resultado, que
presento aquí en una forma adaptada a la notación del Apéndice IX. Para no
distraer al lector con detalles sutiles pero inesenciales, expondré primero una
demostración aplicable a fórmulas sin functores, y luego daré las indicacio-
nes necesarias para generalizarla.
Llamemos CP1␮ al fragmento del CP1 que sólo contiene predicados mo-
Apéndices 523

nádicos y 0-ádicos. Sea α una fórmula cualquiera del CP1 . Traducido a


nuestro modo de hablar, el teorema demostrado por Löwenheim dice que si
α es verdadera en toda interpretación del CP1 en un dominio finito (esto
es, si no hay un entero positivo n y una interpretación 〈D,ƒ〉 tal que |D| = n
y ƒ(α) = 1), entonces α es válida (esto es, ƒ(α) = 0 cualquiera que sea la
interpretación 〈D,ƒ〉). Ahora bien, si α no es válida, ¬α es realizable, de modo
que la aseveración precedente equivale a esta otra: si β es una fórmula del
CP1 y β es realizable, entonces β es realizable en un dominio finito (esto
es, hay un entero positivo n y una interpretación 〈D,ƒ〉 tal que |D| = n y ƒ(β)
= 0).
Sea φ una fórmula realizable del CP1 en la que figuran k predicados
monádicos diferentes, Π1,…,Πk; φ puede contener cualquier número finito
n ≥ 0 de predicados 0-ádicos (“variables proposicionales”). Demostraré que
φ es realizable en un dominio D tal que |D| = 2k. Sea 〈D*,ƒ*〉 una interpre-
tación tal que |D*| > 2k y ƒ*(φ) = 0. Como sabemos, ƒ* asigna a cada pre-
dicado Πh (1 ≤ h ≤ k) un conjunto —posiblemente vacío— ƒ*(Πh) ⊆ D*. Si
a es un elemento cualquiera de D*, ƒ* le asocia lo que llamaré su signatura
σ(a) y que defino así: σ(a) es un k-tuplo de ceros y unos cuyo h-ésimo tér-
mino es igual a 0 si a ∈ ƒ*(Πh) y es igual a 1 si a ∉ ƒ*(Πh). Obviamente,
no hay más que 2k signaturas diferentes entre las cuales se reparten todos
los objetos del dominio D*, cualquiera que sea su cardinalidad. Ordenémos-
las lexicográficamente y llamemos Dj al conjunto de elementos de D* que
comparten la j-ésima signatura. Sea D = {D1,…,D2k}. Diré que una inter-
pretación 〈D,ƒ〉 se ajusta a 〈D*,ƒ*〉 si satisface las tres condiciones siguien-
tes: (i) Dj ∈ ƒ(Πh) si y sólo si Dj ⊆ ƒ*(Πh) (1 ≤ h ≤ k; 1 ≤ j ≤ 2k); (ii) si ξ
es una variable individual que figura en φ, ƒ(ξ) = {x ∈ D*|σ(x) = σ(ƒ*(ξ))},47
y (iii) si Ψ es un predicado 0-ádico que figura en φ, ƒ(Ψ) = ƒ*(Ψ). Demos-
traré que si 〈D,ƒ〉 se ajusta a 〈D*,ƒ*〉 y, como hemos supuesto, ƒ*(φ) = 0,
también ƒ(φ) = 0. Ello es evidente si φ es una fórmula elemental Ψ o Πξ, y
se establece fácilmente por inducción con respecto al número de conectivos
si φ no contiene ningún cuantificador. Supongamos ahora que φ es una fór-
mula prenexa (Apéndice XIII). Razonamos por inducción con respecto al
número q(φ) de cuantificadores en φ. Ya vimos que la tesis puede demos-

47 En otras palabras, ƒ(ξ) ∈ D es el conjunto de objetos que comparten la signatura de


ƒ*(ξ) ∈ ∆.
Apéndices 524

trarse para el caso q(φ) = 0. Supongamos que se la ha establecido también


para fórmulas prenexas con r cuantificadores, y que q(φ) = r + 1. Entonces
hay una variable ξ y una fórmula prenexa ψ con r cuantificadores y los k
predicados Π1,…,Πk tal que φ = ∃ξψ o φ = ∀ξψ. En el primer caso, ƒ*(φ)
= 0 implica que ƒξ*(ψ) = 0 en alguna ξ-variante ƒξ* de 〈D*,ƒ*〉 de suerte
que, por la hipótesis inductiva, hay una ξ-variante ƒξ de 〈D,ƒ〉, ajustada a
〈D*,ƒ*〉, tal que ƒξ(ψ) = 0; por lo tanto, ƒ(φ) = 0. En el segundo caso, ƒ*(φ)
= 0 implica que ƒξ*(ψ) = 0 en toda ξ-variante ƒξ* de 〈D*,ƒ*〉. Debido a la
finitud de D, cada ξ-variante ƒξ de 〈D,ƒ〉 se ajusta a alguna ξ-variante de
〈D*,ƒ*〉, de suerte que, por la hipótesis inductiva, ƒξ(ψ) = 0. Esto implica
que ƒ(φ) = 0. Ahora bien, como se vio en la p. 519, si φ no es una fórmula
prenexa, existe siempre una fórmula prenexa φ′ lógicamente equivalente a φ,
cuyo valor, por ende, es idéntico al de φ en cualquier interpretación. Por lo
tanto, ƒ*(φ) = 0 implica que ƒ*(φ′) = 0; pero entonces, según acabamos de
probar, ƒ(φ′) = 0, de modo que ƒ(φ) = 0. Por lo tanto, si una fórmula cual-
quiera φ del CP1 es realizable en un dominio cualquiera, φ es realizable en
un dominio finito.
De esto se sigue que el CP1 es v-decidible, ya que la realizabilidad o no
realizabilidad de una fórmula dada φ en un dominio finito D puede deter-
minarse en un número finito de pasos, calculando el valor de φ en cada una
de las interpretaciones en D que φ admite.
Doy para terminar el complemento anunciado, que permite extender el
resultado anterior a las fórmulas con functores. Llamemos CP1 = al frag-
mento del CP1= que no contiene predicados poliádicos y supongamos que
el argumento anterior se refiere a una fórmula φ del CP1 =. Para que que
el argumento sea concluyente tenemos que agregar una cuarta condición a
las tres arriba prescritas para una interpretación 〈D,ƒ〉 que se ajusta a 〈D*,ƒ*〉.
La nueva condición concierne a la interpretación de los functores. Considé-
rese la aplicación θ: D* Æ D que asigna a cada objeto a el conjunto de los
objetos que tienen la misma signatura que a. Como es habitual, llamo θn a
la “aplicación producto” que envía cada n-tuplo 〈a1,…,an〉 ∈ D*n al n-tuplo
〈θ(a1),…,θ(an)〉 ∈ Dn. Entonces, diremos que 〈D,ƒ〉 que se ajusta a 〈D*,ƒ*〉
sólo si, además de (i)–(iii), cumple la condición siguiente: (iv) si  es un
functor n-ario que figura en φ, ƒ() ∑ θn = θ ∑ ƒ*() (en otras palabras: si
ƒ*() envía el n-tuplo 〈a1,…,an〉 ∈ D*n a cierto objeto a ∈ D*, ƒ() envía
el n-tuplo 〈θ(a1),…,θ(an)〉 ∈ Dn precisamente a θ(a)).
Apéndices 525

XV

EL CÁLCULO PROPOSICIONAL ES COMPLETO

Como dije en el Capítulo 2.7, Post (1921) demostró que toda fórmula del
cálculo proposicional que sea “positiva” en su interpretación algebraica —y
por ende válida en la interpretación lógica habitual— es deducible por sus-
titución y modus ponens de los axiomas de su Postulado IV. La demostra-
ción es constructiva, en cuanto enseña a construir una deducción apropiada
para cada fórmula positiva dada. Imitando a Post, la divido en cuatro etapas.
Aunque la definición de fórmula que Post da en su Postulado I supone que
los únicos conectivos son los signos de negación y disyunción, la demostra-
ción discurre como si los signos de conjunción, implicación y equivalencia
también pertenecieran al cálculo.
[A] Digamos que una fórmula α tiene rango 0 —abreviado: (α) = 0—
si consta únicamente de una variable proposicional sin conectivos; que (¬α)
= 1 + (α), y que (α ∨ β) = 1 + max( (α), (β)). Designemos con ϕ(p)
y ϕ(q) a dos fórmulas cualesquiera tales que la segunda se deriva de la pri-
mera reemplazando uniformemente cierta variable proposicional p por una
variable proposicional q. Post prueba, por inducción sobre el rango de ϕ(p),
que toda aseveración de la forma ∂(p ↔ q) → (ϕ(p) ↔ ϕ(q)) es deducible
de los postulados. Si (ϕ) = 0, la tesis se reduce a una de las dos siguien-
tes: (i) a ∂(p ↔ q) → (p ↔ q), que se deriva por sustitución del familiar
teorema ∂(p → p);(ii) a ∂(p ↔ q) → (r ↔ r), que se deriva por modus
ponens y sustitución de ∂p → (q → p) y ∂r ↔ r. Si la tesis se supone vá-
lida para fórmulas de rango menor que m, vale también si (ϕ) = m + 1. En
efecto, en tal caso ϕ(p) puede escribirse en una de las formas (ϕ1(p) ∨ ϕ2(p))
o ¬ϕ1(p), donde max( (ϕ1), (ϕ2)) = m; y la tesis se deriva por modus ponens
y sustitución de los teoremas ∂(p ↔ q) → (p ↔ q), ∂(p ↔ q) → (p ↔ q)
y ∂(p ↔ q) → (p ↔ q). Como Post señala en una nota, todos los asertos
que aquí se invocan han sido deducidos en Principia Mathematica.
[B] Si ϕ(p1,…,pk) es una fórmula que contiene k variables proposicionales
diferentes, se puede probar que hay una fórmula ϕ′(p1,…,pk) tal que
∂ϕ(p1,…,pk) ↔ ϕ′(p1,…,pk), en la cual no hay otros conectivos binarios
que ∨ y ∧, y el signo ¬ sólo figura —si acaso— inmediatamente a la iz-
Apéndices 526

quierda de variables proposicionales. La prueba utiliza el metateorema de-


mostrado bajo la letra [A] y tres teoremas deducidos en Principia, a saber,
∂¬(p ∨ q) ↔ (¬p ∧ ¬q), ∂¬¬p ↔ p, y ∂(p ↔ q) → ((q ↔ r) ↔ (p ↔ r)).
[C] Invocando las propiedades distributivas y asociativas de ∨ y ∧ se puede
establecer que ∂ϕ′(p1,…,pk) ↔ (ψ1 ∨…∨ ψn), donde cada subfórmula ψi
(1 ≤ i ≤ n) es una conjunción de variables proposicionales o sus negaciones
en la cual cada variable pj (1 ≤ j ≤ k) figura a lo sumo una vez precedida
por el signo ¬ y a lo sumo una vez sin ir precedida por dicho signo. Si la
variable pk no figura en cierta subfórmula ψi, sustituimos esa subfórmula por
(ψi ∧ pn) ∨ (ψi ∧ ¬pn). Sea ψ′ el producto final de estas sustituciones; es
claro que ∂ϕ′(p1,…,pk) ↔ ψ′.48 Apelando otra vez a las propiedades
distributivas y asociativas de ∨ y ∧ se construye una fórmula ψ tal que:

(i) ∂ψ′ ↔ ψ

(ii) ψ = (ϕ1 ∧ pk ∧ ¬pk) ∨ (ϕ2 ∧ pk) ∨ (ϕ3 ∧ ¬pk)

(iii) pk no figura en ϕ1, ϕ2 y ϕ3

[D] Es claro entonces que ∂ϕ(p1,…,pk) ↔ ψ. Por lo tanto, si ϕ(p1,…,pk)


es positiva, también ψ es positiva (puesto que la positividad de una fórmula
es una condición necesaria de su deducibilidad, como se mostró en las pp.
256-57). La deducibilidad de ψ se prueba por inducción sobre el número de
variables proposicionales que contiene. Si no contiene más que una, enton-
ces ψ es idéntica a la fórmula (p ∨ ¬p) o a la fórmula ((p ∧ ¬p) ∨ p ∨ ¬p)
o se deduce de una de ellas por simple sustitución de una variable por otra.
Ambas fórmulas son deducibles de los axiomas.49 Supongamos ahora que ψ
contiene k variables y la tesis se ha probado para cualquier fórmula positiva
con menos de k variables. Si ψ es positiva, tanto ϕ2 como ϕ3 tienen que ser
positivas.50 Por la hipótesis inductiva, ∂ϕ2 y ∂ϕ3. De esto se deduce ∂ψ,

48 De ∂p ∨ ¬p y ∂p → (q ↔ (p ∧ q)) se deducen los teoremas ∂ψi ↔ (ψi ∧ (pk ∨ ¬pk))


y ∂(ψi ∧ (pk ∨ ¬pk)) ↔ ((ψi ∧ pk) ∨ (ψi ∧ ¬pk)). Por lo tanto, el metateorema [A]
autoriza a deducir ∂(ψ1 ∨…∨ ψn) ↔ ψ′.
49 La segunda se deduce de la primera y el axioma ∂p → (q ∨ p).
50 Supongamos ϕ2 no es positiva, de modo que ƒ(ϕ2) = 1 para cierta asignación ƒ de
valores 0 ó 1 a las variables contenidas en ϕ2. Extendamos ƒ a pk mediante la estipu-
Apéndices 527

aduciendo ∂p → (q → (p ↔ q)), ∂((p ∧ q) ∨ (p ∧ ¬q)) ↔ (p ∧ (q ∨ ¬q)),


∂p → (q → (p ∧ q)) y ∂p → (q ∨ p). Por lo tanto, se deduce asimismo
∂ϕ(p1,…,pk). Q.E.D.

XVI

UNA FORMA ABSTRACTA DEL


PRIMER TEOREMA DE INCOMPLETUD DE GÖDEL
(SMULLYAN 1992)

Como se explica en la Sección 2.10.2, Gödel 1931 demostró sus teoremas


de incompletud para un cálculo bien determinado P, aunque haciendo hinca-
pié en que la conclusión podía extenderse a una vasta familia de “sistemas
afines”. La siguiente versión “abstracta” del primer teorema, publicada por
Smullyan (1992), aclara y precisa la índole de esa familia.
Para motivar la exposición utilizaré palabras como ‘cálculo’, ‘oración’,
‘demostrable’, ‘verdadera’, pero no hay que perder de vista que un “cálcu-
lo” aquí es un conjunto cualquiera y que las “oraciones” que llamo “verda-
deras” o “demostrables” son sencillamente ciertas partes de ese conjunto que
cumplen los requisitos que se indican. Por otra parte, cuando hablo de nú-
meros me refiero a los números naturales (0, 1, 2,…) en el sentido ordina-
rio del término. Como se verá, la conclusión a que llegaremos sobre los
“cálculos” depende solamente de ciertas relaciones de inclusión y exclusión
entre sus partes y de dos relaciones, simples pero bien determinadas, entre
el cálculo bajo consideración y el sistema ˆ de los números.
Un conjunto no vacío C es un cálculo en la presente acepción si y sólo si:

lación ƒ(pk) = 0. Es claro entonces que ƒ(ψ) = 1, lo cual contradice la suposición de


que ψ es positiva. Asimismo, si ϕ3 no es positiva, tendremos que ƒ′(ϕ3) = 1 para cierta
asignación ƒ′ de valores 0 ó 1 a las variables contenidas en ϕ3. Extendamos ƒ′ a pk
mediante la estipulación ƒ′(pk) = 1. Es claro entonces que ƒ′(ψ) = 1, lo cual contradice
la suposición de que ψ es positiva.
Apéndices 528

(I) C incluye (i) un conjunto denumerable E de expresiones; (ii) un


conjunto O ⊆ E de oraciones; (iii) un conjunto D ⊆ O de oracio-
nes demostrables; (iv) un conjunto R ⊆ O de oraciones refutables;
(v) un conjunto V ⊆ O de oraciones verdaderas; (vi) un conjunto
H ⊆ E de predicados;
(II) existe una aplicación Φ: E × ˆ Æ E tal que Φ(H × ˆ) ⊆ O (la
imagen de H × ˆ por Φ está contenida en O).

La condición (I) se entiende sin dificultad, si uno se abstiene de atribuir


un significado específico a las palabras en cursiva, introducidas únicamente
para motivar la exposición. La aplicación postulada en (II) asigna a cada
expresión E ∈ E y a cada número n una expresión única que llamaré E(n).
En particular, si la expresión es un predicado H, H(n) es una oración. Si
H(n) ∈ V, decimos que el número n satisface el predicado H y que H se
aplica a n. Decimos que el predicado H expresa el conjunto numérico K si
K es precisamente el conjunto de los números a que H se aplica. En otras
palabras, H expresa K si y sólo si H(n) ∈ V ↔ n ∈ K. El conjunto K es
expresable en C si hay un H ∈ H ⊆ C que expresa a K.
C es un cálculo correcto si toda oración demostrable es verdadera y no lo
es ninguna oración refutable. Nos interesa establecer las condiciones sufi-
cientes para que un cálculo correcto contenga una oración verdadera que no
es demostrable. (Esto es, la condición suficiente para que V\D ≠ ∅, dado
que D ⊆ V y R ∩ V = ∅).
Como E es numerable, podemos asignar un número de identidad #[E] a
cada expresión E. Supondremos que la aplicación #:E Æ ˆ es biyectiva, de
modo que cada número natural es el número de identidad de alguna expre-
sión. (véase el Apéndice XVII). Llamaré En a la expresión cuyo número de
identidad es n. En otras palabras, n = #[En]. (En = †[n] en la nomenclatura
del Capítulo 2.10). La diagonalización de En es la expresión En(n). Si En es
un predicado, En(n) es una oración. Esta oración es verdadera si y sólo si el
predicado En se aplica a su propio número de identidad. Las estipulaciones
anteriores definen completamente la función ∆: ˆ Æ ˆ por n Å #[En(n)]. ∆
es la función diagonal del sistema determinado por C y #.
Si K ⊆ ˆ, llamo K′ al conjunto ˆ\K, esto es, el complemento de K con
respecto a ˆ. Normalmente llamaríamos ∆-1(K) a la imagen inversa de K
bajo la función diagonal ∆, pero para aligerar la tipografía, la llamaré K*
Apéndices 529

(como hace Smullyan). En otras palabras: n ∈ K* ↔ ∆(n) ∈ K.


Sea D el conjunto de los números de identidad de las oraciones
demostrables de C: D = {x:x ∈ ˆ ∧ Ex ∈ D}. Probaremos el siguiente

TEOREMA: SiC es un cálculo correcto y el conjunto (D′)* es expresable en C,


V\D ≠ ∅.
DEMOSTRACIÓN: Supongamos que C es correcto y que el predicado H expresa
el conjunto (D′)*. Sea h = #[H]. Comprobaremos que la oración H(h) es ver-
dadera pero no es demostrable. Si H expresa (D′)*, entonces, para cada nú-
mero n, H(n) ∈ V ↔ n ∈ (D′)*. En particular, H(h) ∈ V ↔ h ∈ (D′)*.
Ahora bien, h ∈ (D′)* ↔ ∆(h) ∈ D′ ↔ ∆(h) ∉ D. Por definición, ∆(h) =
#[Eh(h)] = #[H(h)] (puesto que h = #[H]). Por lo tanto, ∆(h) ∉ D ↔ H(h) ∉
D. Uniendo nuestras tres cadenas de equivalencias, concluimos que H(h) ∈
V ↔ H(h) ∉ D. Tenemos pues que, o bien H(h) ∈ D\V, o bien H(h) ∈
V\D. Si C es correcto, D\V = ∅. Por lo tanto, H(h) ∈ V\D ≠ ∅.

XVII

NÚMEROS DE GÖDEL: UNA ALTERNATIVA

En las pp. 329-30 se explica el método adoptado por Gödel (1931) para asig-
narle un número de identidad —lo que he llamado un ‘gödel’— a cada ob-
jeto de un cálculo lógico. El método de Gödel es muy elegante pero no
permite determinar con facilidad cuál es el número asignado a cierto objeto,
o el objeto que corresponde a cierto número. (De hecho, hay números a los
que no corresponde ningún objeto). Desde 1931 se han introducido varios
otros métodos. En las pp. 384-85 expliqué el adoptado por Turing para asig-
narle un gödel a sus programas de cómputo. Siguiendo a Smullyan (1992),
aplicaré aquí una variante del método de Turing a los objetos de un cálculo
lógico. Para fijar ideas, me refiero al cálculo predicativo de segundo orden,
CP2=, descrito en el Apéndice IX.H, pero el método se puede adaptar fácil-
Apéndices 530

mente a cualquier otro cálculo.


Para empezar, se le asigna un dígito a cada signo del cálculo. El número
denotado por ese dígito es el gödel de ese signo. El gödel de una fila de
signos es el número denotado por la correspondiente fila de dígitos. Para
que este método de identificación pueda extenderse a las listas de filas de
signos, introducimos un nuevo signo ‡, para separar las filas de una lista.
Estipulamos que (i) una fila de signos del cálculo que no contiene el signo
‡ es una expresión; (ii) si α es una expresión, α‡ es una lista de una ex-
presión, y (iii) si α es una expresión y β es una lista de n expresiones, α‡β
es una lista de n+1 expresiones (n ≥ 1). El CP2= tiene 18 signos, a saber,
¬, →, ∧, ∨, ↔, ∀, ∃, =, (, ), |, *, x, X, F, a, P, f. Para aplicarle nuestro
método de identificación tenemos, pues, que utilizar un sistema numérico con
19 dígitos, esto es, un sistema de base 19. Los programadores, que usan un
sistema de base 16, designan los números del 0 al 9 con los dígitos corrientes
y los números 10, 11, 12, 13, 14 y 15 con las letras A, B, C, D, E y F,
respectivamente. Sigamos la misma convención, poniendo G = 16, H = 17 y
J = 18 (omito la I porque puede confundirse con el 1). Si asignamos el 0 al
signo ‡ y los restantes dígitos a los signos del CP2= en el orden en que los
presenté arriba, tenemos que el gödel de la fórmula ∀xPx es 6DHD, que
equivale, en nuestro sistema decimal, a 6×193 + 13×192 + 17×19 + 13 =
46.183. Por otro lado, es claro que cualquier número es el gödel de un sig-
no, una fila de signos o una lista de filas de signos. Por ejemplo, el número
1.000.000 = 7×194 + 12×193 + 15×192 + 1×19 + 11 = 7CF1B es el gödel de
la expresión ∃*X¬|, la cual, claro está, no es una fórmula. En situaciones
especiales será oportuno adoptar otras convenciones. Por ejemplo, en el cál-
culo que usa Smullyan, diseñado para representar la aritmética, hay una
constante 0 que denota el cero, y un functor ′, ‘el siguiente de’, que se es-
cribe pospuesto a su argumento. Así la expresión 0′′′′ denota el número 4.
Smullyan asigna el dígito 1 al signo 0 y el dígito 0 al signo ′. Con estas
convenciones, el gödel de la expresión que denota el número n se representa
muy convenientemente —en el sistema numérico utilizado por Smullyan—
con un 1 seguido de n ceros.
Apéndices 531

XVIII

LOS AXIOMAS DEL CÁLCULO DE PRIMER ORDEN


INVESTIGADO POR GÖDEL (1930) SON DERIVABLES EN
EL CÁLCULO DE SECUENTES PROPUESTO POR GENTZEN (1938)

Doy aquí varios ejemplos de derivaciones en el cálculo de secuentes utiliza-


do por Gentzen en su segunda demostración de la consistencia de la aritmé-
tica elemental (1938). Aunque el principal propósito de este apéndice es ilus-
trar el concepto de derivación en dicho cálculo, explicado en la Sección
2.12.1, aprovecho la oportunidad para mostrar que cada uno de los axiomas
1-6 del cálculo de primer orden que Gödel (1930) demostró completo (Ca-
pitulo 2.8) es la posfórmula (única) de un secuente sin prefórmulas derivable
en el cálculo de Gentzen, y por lo tanto también se puede invocar como
axioma en este último.51
Presento las derivaciones en forma de esquemas. Igual que en la presen-
tación de los esquemas de inferencias en la Sección 2.12.1, las mayúsculas
griegas representan listas de fórmulas separadas por comas; las mayúsculas
góticas representan fórmulas y las minúsculas góticas, variables. A la dere-
cha de cada conclusión anoto el tipo de inferencia utilizado para derivarla.
Antes de derivar los axiomas de Gödel, doy el esquema de un “hilo” —en
el sentido explicado en la Sección 2.12.2— que suele figurar en las deriva-
ciones: partiendo de un secuente de la forma Γ, ➛ ∆,  se puede derivar
siempre el secuente correspondiente Γ ➛ ∆, ¬ ∨ .

51 Cada secuente ➛ A, en que A es uno de los seis axiomas en cuestión, puede insertarse
como secuente inicial en cualquier derivación, sobreentendiéndose que sobre él va una
derivación como las dadas aquí. Obsérvese que los axiomas 7 y 8 de Gödel no pueden
justificarse así, porque contienen el signo =, el cual no es un símbolo lógico del cálcu-
lo de Gentzen. Pero el axioma 7 (x = x) es evidentemente la posfórmula única de un
secuente básico matemático sin prefórmulas. También lo es el axioma 8, si exigimos
que las fórmulas F(x) y F(y) que figuran en él sean elementales.
Apéndices 532

Γ, ➛ ∆, 

Γ ➛ ∆, , ¬ (¬)

Γ ➛ ∆, , ¬ ∨ (∨)

Γ ➛ ∆, ¬ ∨ ,  (Permutación)

Γ ➛ ∆, ¬ ∨ , ¬ ∨ (∨)

Γ ➛ ∆, ¬ ∨ (Contracción)

Omitiendo las líneas 2-5 (y las rayas horizontales que las preceden), el es-
quema precedente puede condensarse en el siguiente esquema de inferencia
auxiliar que, siguiendo el ejemplo de los manuales de lógica, llamo teorema
de la deducción (TD).

TD Γ, ➛ ∆, 

Γ ➛ ∆, ¬ ∨

Ahora derivo los axiomas 1-6. Para ahorrar espacio, no anoto las permu-
taciones efectuadas.

1 ➛ ➛ (SB | SB)

∨ ➛ (∨)

➛ ¬( ∨ )∨ (TD)
Apéndices 533

2 ➛ (SB)

➛ ∨ (∨)

➛¬ ∨( ∨ ) (TD)

3 ➛ ➛ (SB | SB)

➛∨ ➛∨ (∨ |∨)

∨➛∨ (∨)

➛ ¬( ∨ ) ∨ ( ∨ ) (TD)

4 ➛ (SB)

➛ ➛ , (SB|deb.)

¬ , ➛ ¬ , ➛ ➛ (deb.| ¬|SB)

¬ , ∨ ➛ ➛ ∨ (∨ |∨)

¬ , ∨ ➛ ∨ ∨ ,➛ ∨ (∨|deb.)

¬ ∨ , ∨ ➛ ∨ (∨)

¬ ∨ , ➛ ¬( ∨ )∨( ∨ ) (TD)

➛ ¬(¬ ∨ ) ∨ ¬( ∨ )∨( ∨ ) (TD)


Apéndices 534

5 ( /) ➛ ( /)

∀ ➛ ( /) (∀)

➛ ¬∀ ∨ ( /) (TD)

6 ➛ ( /) ➛ ( /) (SB|SB)

➛ , ∀ ( /) ➛ ( /), (deb.|deb.)

➛ , ∀ , ( /) ( /) ➛ ( /), , ∀ (deb.|deb.)

∨ ( /) ➛ , ∀ , ( /) (∨)

∨ ( /) ➛ , ∀ , ∀ (∀)

∨ ( /) ➛ , ∀ (contr.)

∨ ( /) ➛ ∨ ∀ , ∀ (∨)

∨ ( /) ➛ ∨ ∀ , ∨ ∀ (∨)

∨ ( /) ➛ ∨ ∀ (contr.)

➛ ¬( ∨ ( /)) ∨ ( ∨ ∀ ) (TD)

(donde es una variable que no figura en la fórmula )


Apéndices 535

XIX

ALGUNAS IDEAS DE BROUWER

Luitzen Egbertus Jan Brouwer (1881-1966) alcanzó muy joven una concep-
ción de la matemática radicalmente opuesta a la de los autores que estudia-
mos en este libro. Ella se perfila claramente en su tesis doctoral (1907), sobre
todo en la primera versión, cuyos pasajes más audaces suprimió por reco-
mendación de su consejero, D. J. Korteweg (van Stigt, 1979). Korteweg le
sugirió a su joven y extraordinariamente brillante discípulo que se aplicara
primero a resolver problemas de la matemática tradicional, para asegurar su
autoridad y prestigio. En cumplimiento de este plan, Brouwer sentó las ba-
ses de la teoría topológica de la dimensión, demostrando que el número de
dimensiones de un espacio es invariante bajo biyecciones bicontinuas (1911,
1913). Tras este importante logro, con el cual rescató una intuición que
muchos creían destruida por Cantor (vide p. 26), Brouwer empezó a publi-
car artículos de carácter filosófico en las Actas de la Academia Neerlandesa
de Ciencias y en revistas internacionales de matemáticas.
Brouwer solía decir que sus ideas sobre la matemática emanaban de su
personal concepción del mundo y de la vida. Esta tiene sólo un tenue víncu-
lo —a través de Schopenhauer— con la tradición filosófica europea, y me
confieso incapaz de comprenderla y explicarla.52 Por suerte, aquí busco sólo
marcar el contraste entre Brouwer y el conjuntismo, y para ello no es preci-
so calar muy hondo. Me limitaré a citar algunas palabras de Brouwer sobre
la intuición fundamental que según él es la raíz de las matemáticas, para
luego, a partir de ahí, resumir sus ideas sobre el infinito matemático y el
principio del tercero excluido.
Según Brouwer, el “fenómeno fundamental del intelecto humano” es “la
disociación de los momentos de la vida en partes cualitativamente diversas,
que sólo pueden reunirse en cuanto permanezcan separadas por el tiempo”;

52 Cf. especialmente sus artículos “Matemática, ciencia y lenguaje” (1929) y “Concien-


cia, filosofía y matemáticas” (1948), ambos reproducidos en Brouwer, CW, tomo I. En
el mismo tomo, pp. 1-10, pueden consultarse extractos, traducidos al inglés, del libro
juvenil de Brouwer, Vida, arte y mística (1905).
Apéndices 536

hecha abstracción de su “contenido emocional” este fenómeno pasa a ser “el


fenómeno fundamental del pensamiento matemático, la intuición de la nuda
duo-unidad (two-oneness)” (1913a; CW I, 127).

Esta intuición de la duo-unidad, la intuición básica de las matemáticas,


crea no sólo los números uno y dos, sino también todos los números
ordinales finitos, en cuanto uno de los elementos de la duo-unidad puede
pensarse como una nueva duo-unidad, y este proceso puede repetirse in-
definidamente. Ello da nacimiento además al más pequeño número ordinal
infinito ω. Por último, esta intuición básica de las matemáticas, en la que
se unen lo conexo y lo separado, lo continuo y lo discreto, genera inme-
diatamente la intuición del continuo lineal, es decir, del “entre” que no se
agota con la interposición de nuevas unidades y que, por lo tanto, no puede
nunca pensarse como una mera colección de unidades.
(Brouwer 1913a; CW I, 127-28)

En la ponencia que presentó al IV Congreso Internacional de Matemáti-


cos, titulada “Las potencias posibles” (1908a),53 Brouwer fue más explícito.
En la intuición originaria de la duo-unidad (Zweieinigkeit) se reúnen las in-
tuiciones de lo continuo y lo discreto, “justamente porque lo segundo no se
piensa por sí mismo, sino bajo retención del recuerdo de lo primero” (CW I,
102). En este tener o sostener a lo uno con lo otro (Zusammenhaltung) con-
siste precisamente la intuición de lo con-tinuo. Vaciada de su contenido, esta
“sensación” (Empfindung) de lo fijo y lo evanescente juntos, de lo perma-
nente y lo cambiante juntos, es la intuición matemática originaria. En ella se
basan los dos desarrollos siguientes:

(1) Uno piensa la intuición de la duo-unidad como una nueva unidad, a la


que se agrega una nueva alteridad —llamada ‘tres’— y así sucesiva-
mente; de este modo se establece el tipo de orden de los números
naturales, que Brouwer, como Cantor, llama ω.
(2) Al vivir la intuición originaria como tránsito entre lo primero y lo
segundo se establece el tipo de orden η de los racionales mayores que
0 y menores que 1, ordenados de menor a mayor.

53 Recuérdese que Cantor llamó ‘potencia’ (Mächtigkeit) a lo que en este libro llamamos
‘numerosidad’; cf. p. 21.
Apéndices 537

Según esto, no puede haber más que una numerosidad infinita, a saber, la
denumerable. Con todo, Brouwer admite que se hable de una numerosidad
superior en cualquiera de los dos sentidos siguientes:
(a) Cada conjunto denumerable dado perteneciente a un sistema matemá-
tico genera un nuevo elemento que también pertenece al sistema. Por esta
vía sólo pueden construirse conjuntos denumerables, no el sistema comple-
to, porque este no puede ser denumerable. “Es incorrecto considerar a este
sistema entero como un conjunto matemático, pues no es posible terminar
de edificarlo desde la intuición matemática originaria” (1908a; CW I, 103).
Brouwer propone estos ejemplos: la totalidad de los números de la segunda
clase (vide pp. 37-38), la totalidad de los puntos definibles del continuo, la
totalidad de los sistemas matemáticos.
(b) Al continuo entre lo primero y lo segundo se lo puede considerar como
una matriz generadora de unidades o puntos, y postularse que dos puntos
deben considerarse distintos si y sólo si es posible distinguir sus respectivas
posiciones en una cierta escala de tipo de orden η. ‘Se observa entonces que
el continuo definido de este modo no puede agotarse nunca como matriz de
puntos” (1908a; CW I, 103).
Brouwer concluye que existe sólo una “potencia” o numerosidad para
conjuntos matemáticos infinitos, “a saber, la denumerable”. A ella cabe agregar
(a) la denumerablemente inconclusa, “pero ello denota un método, no un
conjunto”; y (b) la continua, la cual, sí, “denota algo terminado (etwas
Fertiges), pero sólo como matriz, no como conjunto“ (1908a; CW I, 104).
A Brouwer se lo conoce en los círculos filosóficos sobre todo porque negó
la validez universal del principio lógico del tercero excluido. El alcance y la
justificación de su rechazo sólo se puede apreciar contra el trasfondo de las
ideas precedentes. Brouwer no estaba en el negocio de crear una lógica al-
ternativa, como la que, revestida de una parafernalia formal muy semejante
a la que detestaba en sus adversarios, circula con el nombre de “lógica
intuicionista”. Para él, la actividad matemática, alimentada de la intuición
originaria, es extralingüística. El lenguaje matemático no es más que un re-
curso defectuoso de los hombres para comunicarse las matemáticas unos a
otros y para reforzar su memoria de las matemáticas (Brouwer 1907; CW I,
92). La verdad sólo se encuentra “en la realidad, esto es, en las experiencias
presentes y pasadas de la conciencia”, las cuales incluyen cosas y sus cuali-
dades, emociones, reglas (jurídicas, de cooperación, de juego), actos mate-
Apéndices 538

riales, actos de pensamiento, actos matemáticos (mathematical deeds).

Las verdades suelen trasmitirse con palabras o complejos de palabras,


generalmente tomados en préstamo de los lenguajes cooperativos, de tal
modo que para el sujeto una cierta palabra o complejo de palabras siem-
pre evoca una verdad determinada […]. Hay además un sistema de re-
glas generales llamado lógica, que permite al sujeto deducir de sistemas
de complejos de palabras que trasmiten verdades, otros complejos de pa-
labras que generalmente también trasmiten verdades. […] Ello no signi-
fica que dichos complejos adicionales de palabras trasmitan verdades an-
tes de que estas verdades se hayan experimentado, ni que estas verdades
siempre puedan experimentarse. En otras palabras, la lógica no es un ins-
trumento fiable para descubrir verdades y no puede deducir verdades que
no fueran accesibles también de otra manera.
(Brouwer 1948; CW I, 488)

Brouwer se refiere expresamente a tres principios lógicos: el principio del


silogismo,54 el principio de contradicción y el principio del tercero excluido.
Con respecto a ellos se plantea la cuestión siguiente:

Supóngase que una construcción matemática intuicionista se ha descrito


cuidadosamente con palabras y que luego, ignorando de momento el ca-
rácter introspectivo de la construcción matemática, su descripción lin-
güística es considerada por sí misma y sometida a la aplicación lingüís-
tica de un principio de la lógica clásica. ¿Es siempre posible entonces
ejecutar una construcción matemática sin palabras que halle expresión
en la figura lógico-lingüística en cuestión?
(Brouwer 1952; CW I, 510; cursiva de Brouwer)

Haciendo reserva de “la inevitable inadecuación del lenguaje como modo de


descripción”, Brouwer admite una respuesta afirmativa en el caso de los
principios de contradicción y del silogismo. En cambio, “salvo en casos es-
peciales”, la respuesta es negativa en el caso del principio del tercero ex-
cluido, de modo que “este último principio debe rechazarse como instrumento

54 Este principio infiere “de la inclusión de un sistema b en un sistema c combinada con


la inclusión de un sistema a en el sistema b, la inclusión directa de a en c” (Brouwer
1908b; CW I, 109). Se trata, en suma, del esquema del modo barbara. ¿Pensaba Brouwer
que todo silogismo podría reducirse a este solo esquema, sin recurrir a otros principios
(excepto quizás el de contradicción)?
Apéndices 539

para descubrir nuevas verdades matemáticas” (Ibid.). La validez de este prin-


cipio, dice Brouwer, equivale a la tesis de que no hay problemas matemáti-
cos insolubles, para sostener la cual no tenemos el más mínimo indicio
(1908b; CW I, 109).
Naturalmente, el principio es enteramente admisible cuando se trata de
sistemas finitos. Cada construcción de carácter finito y acotado en un siste-
ma de esta clase puede intentarse solamente en un número finito de formas
diferentes; cada intento, o bien tendrá éxito, o continuará hasta el punto en
que se vuelva imposible. Por lo tanto, se puede siempre alcanzar una deci-
sión sobre cualquier aserto concerniente a la posibilidad de una construcción
de carácter finito y acotado en un sistema matemático finito.
Para mostrar que ello no es así en el caso de los sistemas infinitos, Brouwer
introduce el concepto de una propiedad fugitiva de los números naturales
(1929; CW I, p. 425). Diremos que la propiedad ƒ es fugitiva si satisface las
condiciones siguientes:
1. Para cada número natural n es posible decidir si n tiene ƒ o si es absur-
do que n tenga ƒ.
2. No se conoce ningún método para calcular un número n que tenga ƒ.
3. No se puede probar que sea absurda la hipótesis de que existe un nú-
mero natural que tiene ƒ.
He aquí un ejemplo sencillo. Digamos que el número natural n tiene la pro-
piedad ƒπ si y sólo el n-ésimo, el (n+1)-ésimo, el (n+2)-ésimo,…, y el (n+9)-
ésimo dígito en la expansión decimal de π, tomados en ese orden, forman la
secuencia 0123456789. ƒπ es una propiedad fugitiva.
Brouwer usa el término λƒ para denotar el más pequeño número natural
que tenga la propiedad fugitiva ƒ, en el caso hipotético de que haya núme-
ros que la tienen. Digo que x es un infra-número de la propiedad ƒ si x < λƒ,
y que x es un supra-número de ƒ si λƒ ≤ x. (Evidentemente, en el instante
mismo en que se demuestre que un cierto número es un supra-número de ƒ,
ƒ dejará de ser una propiedad fugitiva.) Considérese la secuencia de raciona-
les a1, a2,…, definida por:
k
a k = −1 si k es un infra-número de ƒ
2
λƒ
a k = −1 si k es un supra-número de ƒ
2
Apéndices 540

Es claro que la secuencia converge a un límite pƒ. También es claro que, si


ƒ es una propiedad fugitiva, tenemos que pƒ no es igual a 0, pero tampoco
es diferente de 0.
Hay importantes teoremas del análisis matemático que no pueden demos-
trarse sin los recursos rechazados por Brouwer. Doy un ejemplo: Toda fun-
ción continua ϕ: I Æ Â, definida en un intervalo cerrado I ⊂ Â, tiene un
máximo; en otras palabras, hay un α ∈ I y un entorno U de α tales que
ϕ(α) ≥ ϕ(ξ) para todo ξ ∈ U ∩ I. Brouwer (1924; CW I, p. 271) propone
el siguiente caso en el cual, según él, este pretendido teorema no se cumple:
Enúmerense las fracciones irreducibles, mayores que 0 y menores que 1, cuyo
denominador es una potencia de 2, en el orden siguiente: (a) la fracción con
menor denominador precede a la con denominador mayor; (b) cuando los
denominadores son iguales, la fracción con menor numerador precede a la
con numerador mayor. Las fracciones duales así ordenadas constituyen una
secuencia de Cauchy δ1, δ2,… Sea λπ el más pequeño número natural que
tenga la propiedad fugitiva ƒπ definida arriba. Sea ϕn: [0,1] Æ Â una fun-
ción lineal en [0,δn) y en (δn,1], tal que ϕn(0) = ϕn(1) = 0 y ϕn(δn) = 2-n.
Sea gn(x) = ϕn(x) si n = λπ y gn(x) = 0 si n ≠ λπ. Entonces la función g,
definida por g(x) = Σ n∞ = 1 gn(x), es una función continua, definida en el in-
tervalo cerrado [0,1], que no tiene un máximo.55

55 Largeault 1992 y Mancosu 1998 son libros introductorios que recomiendo calurosa-
mente a quien desee saber más sobre el intuicionismo.

SOLUCIÓN DEL EJERCICIO EN LA PÁGINA 501.


El alcance de ¬ en su primera posición es la fila ∀x1(P3x1x2x3 ∨ ∃x2¬P2x2 f 2x1x3); el
de ∀x1 es (P3x1x2x3 ∨ ∃x2¬P2x2 f 2x1x3); el de P3 es x1x2x3; el de ∃x2 es ¬P2x2 f 2x1x3; el
de ¬ en su segunda posición es P2x2 f 2x1x3; el de f2 es x1x3, y el de ∨ es el par de filas
〈P3x1x2x3, ∃x2¬P2x2 f 2x1x3〉.
GLOSARIO

El signo † indica que la palabra así señalada


es materia de otro artículo de este glosario.
El artículo Aplicación explica varios términos
utilizados en el libro y en los otros artículos.

Aplicación (alemán, Abbildung; francés, application; inglés, mapping). Sean


G y H dos conjuntos cualesquiera. Una aplicación ƒ de G en H asigna a
cada elemento x ∈ G un único elemento ƒ(x) ∈ H. Decimos que G es el
dominio y H el codominio de la aplicación ƒ. ƒ(x) es el valor de ƒ en el
argumento x. El alcance de ƒ es el conjunto V ⊆ H de los valores de ƒ. Si
el alcance V coincide con el codominio H, decimos que ƒ aplica G sobre H
y que ƒ es una aplicación epiyectiva o una epiyección (F. surjection). Deci-
mos que ƒ es una aplicación inyectiva o una inyección (F. injection) si tiene
valores diferentes en cada par de argumentos diferentes (esto es, si para todo
x, y ∈ G, x ≠ y implica que ƒ(x) ≠ ƒ(y)). Si ƒ es a la vez inyectiva y epi-
yectiva, decimos que es una aplicación biyectiva o una biyección (F. bijection).
Designamos la aplicación ƒ de G en H mediante la expresión simbólica ƒ: G
Æ H. La expresión simbólica ƒ: x Å ƒ(x) dice que ƒ asigna el valor ƒ(x) al
argumento x. Si A ⊆ G, el conjunto {ƒ(x):x ∈ A} se llama la imagen de A
por ƒ y se designa ƒ(A). Si B ⊆ H, el conjunto {x:ƒ(x) ∈ B} se llama la pre-
imagen de B por ƒ y se designa ƒ-1(B).
Si ƒ: G Æ H es una aplicación y F ⊆ G, la restricción de ƒ a F (simbo-
lizada ƒ|F) es la aplicación ƒ1: F Æ H, definida por ƒ1(x) = ƒ(x) para todo
x ∈ F. Por otro lado, si ƒ: G Æ H es una aplicación y G ⊆ K, cualquier
aplicación ƒ2: K Æ H definida de tal modo que ƒ = ƒ2|G es una extensión de
ƒ a K.
Considérense dos aplicaciones, ƒ: G Æ H y g: H Æ K. Entonces, la apli-
cación g ∑ ƒ : G Æ K, x Å g(ƒ(x)) es la aplicación compuesta de ƒ por g,
la cual tiene, para cada x ∈ G, un valor idéntico al valor de g en ƒ(x). A
veces, en vez de g ∑ ƒ, escribimos simplemente gƒ.

541
Glosario 542

El grafo de la aplicación ƒ: G Æ H; x Å ƒ(x) es el conjunto de pares


ordenados {〈x,y〉: x ∈ G, y = ƒ(x) ∈ H}. Mediante el concepto de grafo se
suele dar la siguiente definición conjuntista de aplicación: Una aplicación ƒ:
G Æ H; x Å ƒ(x) es un trío ordenado 〈Q,G,H〉, donde Q = {〈x,ƒ(x)〉: x ∈ G,
ƒ(x) ∈ H} y, para cada x, y ∈ G, ƒ(x) ≠ ƒ(y) sólo si x ≠ y.
Una aplicación ƒ: G Æ H cuyo dominio y codominio son conjuntos de
números (naturales, enteros, racionales, reales o complejos) suele llamarse
función.
Supongamos que hay una relación n-aria RG entre los miembros del con-
junto G. La aplicación ƒ: G Æ H induce en H la relación n-aria RƒG definida
como sigue: Si h1,…, hn ∈ H, RƒG(h1,…, hn) si y sólo si h1 = ƒ(g1),…,
hn = ƒ(gn) y RG(g1,…, gn). Si RƒG coincide con una relación n-aria preexis-
tente en H solemos dar a ésta el mismo nombre que a RG y decir que la
aplicación ƒ preserva esa relación. Por ejemplo, la función x Å x2 definida
en el dominio de los números naturales preserva la relación binaria “mayor
que”, puesto que x < y si y sólo si x2 < y2. (No así, en cambio, la función x
Å x2 definida en el domino de los enteros, puesto que –x < –y implica que
(–x)2 > (–y)2.)

Boole, álgebra de. Consíderese un conjunto no vacío B, en que se han dis-


tinguido dos objetos 0 y 1 y se han definido una †operación algebraica unaria
C y dos operaciones binarias ∩ y ∪. Sean a, b y c elementos cualesquiera
de B. La estructura 〈B,0,1,C,∩,∪〉 constituye un álgebra de Boole si cum-
ple con las siguientes condiciones B1–B11. Como es habitual, escribo a′ en
vez de C(a), y a ∩ b, a ∪ b en vez de ∩(a,b), ∪(a,b).
B1 a ∩ b=b∩a
B2 a ∪ b=b∪a
B3 a ∩ (b ∩ c) = (a ∩ b) ∩ c
B4 a ∪ (b ∪ c) = (a ∪ b) ∪ c
B5 a ∪ (b ∩ c) = (a ∪ b) ∩ (a ∪ c)
B6 a ∩ (b ∪ c) = (a ∩ b) ∪ (a ∩ c)
B7 a ∪ (a ∩ b) = (a ∪ b) ∩ a=a
B8 a ∪ 0=a
B9 a ∪ 1=1
B10 a ∪ a′ = 1
B11 a ∩ a′ = 0
Glosario 543

Las operaciones ∪ y ∩ son pues conmutativas (B1, B2) y asociativas (B3,


B4). Además, cada una es distributiva con respecto a la otra (B5, B6). Las
condiciones B1–B7 implican que las operaciones ∪ y ∩ son idempotentes
(a ∪ a = a y a ∩ a = a). Se puede demostrar que el álgebra de Boole
〈B,0,1,C,∩,∪〉 obedece a las leyes de De Morgan: (a ∪ b)′ = a′ ∩ b′ y (a
∩ b)′ = a′ ∪ b′. Diremos que a es menor o igual que b (a ≤ b) si y sólo si
a ∪ b = b. 〈B,≤〉 constituye un †orden parcial. En virtud de B8 y B9, 0 =
min B y 1 = max B. Como a ∪ (a ∪ b) = (a ∪ a) ∪ b = a ∪ b, es claro
que a ≤ a ∪ b = b ∪ a. Por otra parte, con arreglo a B7, (a ∩ b) ∪ a = a,
de modo que a ∩ b ≤ a.
Sea K un conjunto cualquiera, y PK su conjunto potencia (p. 3). Designa-
mos con A ∩ B la intersección de A y B, esto es, el conjunto {x:x ∈ A y x
∈ B}; con A ∪ B la unión de A y B, esto es, el conjunto {x:x ∈ A o x ∈ B};
y con CK(A) el complemento de A en K, esto es, el conjunto K\A = {x:x ∈
K y x ∉ A}. La estructura 〈PK,∅,K,CK,∩,∪〉 es un álgebra de Boole. (De-
muéstrelo el lector). Comúnmente, el contexto fija el conjunto K con respec-
to al cual se toma el complemento, y escribimos A′ en vez de CK(A);

Cuerpo (alemán, Körper; francés, corps; inglés, field). Sea 〈K,⊕〉 un †grupo
abeliano, con elemento neutro 0 ∈ K. Suponemos que K contiene por lo
menos un elemento distinto de 0. Sea ⊗:K × K Æ K una †aplicación tal
que (i) 〈K\{0},⊗〉 es un grupo abeliano con elemento neutro 1,1 (ii) para
cualquier k ∈ K, k ⊗ 0 = 0 ⊗ k = 0, y (iii) cualesquiera que sean a,b,c ∈
K, a ⊗ (b ⊕ c) = (a ⊗ b) ⊕ (a ⊗ c) = (b ⊕ c) ⊗ a. Entonces, 〈K,0,1,⊕,⊗〉
es un cuerpo. Sea a ∈ K. Si a ≠ 0, a tiene dos inversos: uno por ⊕, que
denotamos con -a, y uno por ⊗ que denotamos con a-1. Si a = 0, obvia-
mente, es su propio inverso por ⊕ y no tiene un inverso por ⊗.
El lector comprobará fácilmente que, si K es el conjunto de todas las frac-
ciones (propias e impropias), 0 y 1 son el cero y el uno, y ⊕ y ⊗ son, res-
pectivamente, la adición y la multiplicación de fracciones, 〈K,0,1,⊕,⊗〉 es
un cuerpo: el cuerpo de los racionales, habitualmente llamado Œ.

1 K\B designa el conjunto de todos los elementos de K que no pertenecen a B. Por lo


tanto, K\{0} es el conjunto de todos los elementos de K con excepción de 0. En
rigor, habría que formular la condición (i) así: Sea ⊗′ la restricción de ⊗ a (K\{0})2;
〈K\{0},⊗′〉 es un grupo abeliano con elemento neutro 1. Entonces, la regla (ii) carac-
teriza a ⊗ como una extensión de ⊗′ a K2.
Glosario 544

El cuerpo  de los reales se suele definir como una extensión de Œ, pero


aquí daré la definición, menos intuitiva pero mucho más elegante, propuesta
por David Hilbert en 1900. Sea ⺛ = 〈K,0,1,⊕,⊗〉 un cuerpo cualquiera.
Supongamos que K incluye una parte no vacía P ⊆ K tal que (i) si a ∈ P y
b ∈ P, a ⊕ b ∈ P y a ⊗ b ∈ P, y (ii) si a ∈ K, a cumple con una y sólo
una de las tres condiciones siguientes: a ∈ P, a = 0, o -a ∈ P. En tal caso,
decimos que P es el conjunto de los elementos positivos de ⺛ y que ⺛ es un
cuerpo ordenado. Esta denominación se justifica porque la existencia de P
determina en ⺛ la relación de †orden lineal < definida por: a < b (léase: “a
es menor que b”) si y sólo si b ⊕ -a ∈ P. Como es habitual, escribimos ‘a
≤ b’ por ‘a < b o a = b’. Decimos que un elemento a ∈ K es una cota
superior del conjunto C ⊆ K si c ≤ a para todo c ∈ C. Si existe una cota
superior de C, decimos que C es un conjunto acotado por arriba. En parti-
cular, decimos que a0 es el supremo o cota superior mínima de C si a0 es
una cota superior de C y cualquier otra cota superior de C es mayor que a0.
(Los conceptos de conjunto acotado por abajo, cota inferior e ínfimo o cota
inferior máxima se definen en forma análoga). Decimos que el cuerpo orde-
nado ⺛ es completo si todo conjunto C ⊆ K acotado por arriba tiene una
cota superior mínima. Decimos que el cuerpo ordenado ⺛ es arquimédico
si, cualesquiera que sean los elementos a, b ∈ ⺛, si a ∈ P (esto es, si 0 <
a) siempre existe un número natural n tal que b es menor que n veces a
(vale decir, b < a ⊕ a ⊕ … ⊕ 0, con ⊕ repetido n veces). Se puede demos-
trar que si ⺛ y ⺛′ son dos cuerpos ordenados, completos y arquimédicos
hay un †isomorfismo ƒ: ⺛ Æ ⺛′, esto es, una biyección que preserva todas
las propiedades estructurales de ⺛ (por ejemplo: ƒ(a ⊗ b) = ƒ(a) ⊗ ƒ(b),
ƒ(P) = P′, etc.). Por lo tanto, es lícito hablar de una estructura única, Â,
realizada por todo cuerpo ordenado, completo y arquimédico. Â se llama el
cuerpo de los reales. (Obsérvese que Œ es un cuerpo ordenado arquimédico,
pero no completo: el conjunto de todas las fracciones cuyo cuadrado es mayor
que 2 está acotado por abajo, pero no tiene una cota inferior máxima).
Dado el cuerpo  de los reales, el cuerpo Ç de los complejos puede
definirse como sigue. Un elemento de Ç —un número complejo— es cual-
quier par ordenado de números reales: 〈a,b〉 ∈ Ç si y sólo si a, b ∈ Â. En
vez de 〈a,b〉 escribimos (a,b). La adición y la multiplicación de complejos
se define como sigue: (a,b) + (c,d) = (a+b,c+d), (a,b) × (c,d) =
(ac+bd,ad-bc), donde los signos +, – y × que figuran dentro de los parénte-
Glosario 545

sis designan, respectivamente, la adición, la subtracción (esto es, la adición


del inverso) y la multiplicación en Â. En Ç, el elemento neutro de la adición
es (0,0) y el elemento neutro de la multiplicación es (1,1). El lector puede
tratar de probar que la estructura así definida es un cuerpo.

Equivalencia. Sea C un conjunto cualquiera. Considérese una relación R entre


pares de elementos de C tal que (i) R es reflexiva: cada elemento de C la
tiene consigo mismo (simbólicamente: xRx); (ii) R es simétrica: si a tiene la
relación R con b, b tiene R con a (aRb ⇒ bRa); y (iii) R es transitiva: si
aRb y bRc, entonces aRc. Si la relación R cumple estas condiciones decimos
que R es una equivalencia. Dada una equivalencia R definida en un conjun-
to C, los elementos de C pueden clasificarse en clases de equivalencia: a y
b pertenecen a la misma clase de equivalencia si y sólo si aRb. Esta clasifi-
cación es exhaustiva, puesto que, en virtud de (i) todo elemento de C tiene
R con algo; además, en virtud de (iii), las clases son mutuamente exclusivas.
Por lo tanto, la clasificación de C en clases de equivalencia constituye una
†partición.

Espacio topológico. Sea E un conjunto cualquiera. Decimos que T ⊆ P(E)


es una topología en E si cumple las cuatro condiciones siguientes:

(i) E ∈ T;
(ii) ∅ ∈ T;
(iii) si X e Y pertenecen a T, la intersección X ∩ Y también pertenece a
T;
(iv) si X1, X2,… es una lista (posiblemente infinita) de elementos de
T, la unión ¨k∈ˆXk de todos los elementos de la lista también es
un elemento de T.

Un espacio topológico es un par 〈E,T〉 tal que E es un conjunto no vacío y


T es una topología en E. Llamamos puntos a los elementos de E y abiertos
a los elementos de T. Si X es un abierto, decimos que su complemento E\X
es un cerrado. Este vocabulario se comprenderá mejor a la luz de las si-
guientes explicaciones. Si 〈E,T〉 es un espacio topológico y x es un punto
de E, cualquier subconjunto de E que contenga a x se llama un entorno de
x. Sea x ∈ E y X ⊆ E. Entonces (a) x es un punto de acumulación (o punto
Glosario 546

límite) de X si todo entorno de x contiene a lo menos un punto de X; (b) x


es un punto fronterizo de X si todo entorno de x contiene a lo menos un
punto de X y un punto de E\X; (b) x es un punto interior de X si por lo
menos un entorno abierto de x (esto es, un subconjunto de E que contiene a
x y pertenece a T) no contiene ningún punto que no pertenezca a X (según
esta definición, x sólo puede ser un punto interior de X, si x ∈ X). La unión
de X y el conjunto todos sus puntos de acumulación se llama la clausura de
X. El conjunto de todos los puntos fronterizos de X se llama la frontera de
X. El conjunto de todos los puntos interiores de X se llama el interior de X.
Se puede demostrar fácilmente que todo abierto es idéntico a su propio inte-
rior y que todo cerrado es idéntico a su propia clausura; además, la clausura
de cualquier conjunto X ⊆ E es igual a la unión de su interior y su frontera.
Sean 〈E,T〉 y 〈E′,T′〉 dos espacios topológicos y ƒ una †aplicación de E
en E′. Decimos que ƒ es una aplicación continua si y sólo si la pre-imagen
por ƒ de cada abierto de 〈E′,T′〉 es un abierto de 〈E,T〉. En otras palabras,
ƒ:E Æ E′ es continua si y sólo si, para cada X ∈ T′, ƒ-1(X) ∈ T. Si la
aplicación continua ƒ:E Æ E′ es biyectiva y su inversa ƒ-1:E′ Æ E también
es continua, ƒ es un homeomorfismo, esto es, un †isomorfismo de espacios
topológicos, y 〈E,T〉 y 〈E′,T′〉 son espacios homeomórficos (vale decir,
indistinguibles en cuanto espacios topológicos).

Grupo. Sea G un conjunto no vacío, e un elemento determinado de G, i una



operación algebraica unaria en G y ⊗ una operación algebraica binaria en
G. 〈G,e,i,⊗〉 es un grupo si se cumplen las tres condiciones siguientes: (i) ⊗
es asociativa: si x, y, z ∈ G, x ⊗ (y ⊗ z) = (x ⊗ y) ⊗ z; (ii) para cada x ∈ G,
x ⊗ e = e ⊗ x = x; (iii) para cada x ∈ G, x ⊗ i(x) = i(x) ⊗ x = e. La ope-
ración ⊗ se llama el producto del grupo, e es el elemento neutro, i(x) es el
elemento inverso de x. Normalmente, se escribe xy en vez de x ⊗ y y el
elemento inverso de x se llama x-1 en vez de i(x); en el caso de ciertos gru-
pos es tradición escribir x + y por x ⊗ y y llamar –x al inverso de x.

Grupo abeliano. El grupo 〈G,e,i,⊗〉 es abeliano si la operación ⊗ es conmu-


tativa, esto es, si (x ⊗ y) = (y ⊗ x) para cada par de elementos si x, y ∈ G.

Isomórfico, isomorfismo. Sea ƒ una aplicación biyectiva de un conjunto A


en un conjunto B. Si A tiene una estructura —digamos, un orden parcial, o
Glosario 547

una estructura de cuerpo o de espacio topológico— ƒ induce en B una es-


tructura de la misma clase. Por ejemplo, si A contiene en virtud de su es-
tructura un elemento distinguido e, ƒ(e) es un elemento distinguido de B en
virtud de la estructura inducida por ƒ; si la estructura de A está definida (en
parte) por una relación diádica R y aRb, la estructura inducida estará defini-
da (en parte) por una relación diádica R* tal que ƒ(a)R*ƒ(b); si la estructura
de A incluye una operación binaria que asigna el objeto z ∈ A al par de
objetos x, y ∈ A, la estructura inducida asigna precisamente el objeto ƒ(z) al
par de objetos ƒ(x) y ƒ(y); si la estructura de A selecciona una clase T de
subconjuntos de A, la estructura inducida selecciona una clase T* de
subconjuntos de B tal que X ∈ T si y sólo si ƒ(X) ∈ T*. Supongamos aho-
ra que tanto A como B tienen una estructura y que la estructura de B coin-
cide con la estructura inducida por ƒ. Decimos entonces que la biyección ƒ
es un isomorfismo. En tal caso, obviamente, la biyección inversa ƒ-1 tam-
bién es un isomorfismo. Dos conjuntos estructurados A y B son isomórficos
si existe un isomorfismo entre ellos.

Operación algebraica. Si C es un conjunto cualquiera, llamamos Cn al con-


junto de todos los n-tuplos ordenados que pueden formarse con elementos
de C (Cn = {〈x1,…,xn〉:xk ∈ C, 1 ≤ k ≤ n}. Una operación algebraica n-aria
en un conjunto C es sencillamente una aplicación de Cn en C. En vez de
‘operación algebraica’, solemos decir ‘operación’. Si ƒ:C2 Æ C es una ope-
ración binaria matemáticamente significativa (como la suma o la multiplica-
ción de enteros, etc.) es corriente simbolizarla mediante un ideograma ad
hoc (+, ×, etc.) que se intercala entre los miembros del par ordenado a que
se aplica la operación: escribimos ‘5 + 3’, en vez de +(〈5,3〉). Consideremos
ahora una operación binaria * en un conjunto C. Decimos que * es conmu-
tativa si para cualesquiera objetos x, y ∈ C, x * y = y * x. Decimos que * es
asociativa si, para cualesquiera objetos x, y, z ∈ C, x * (y * z) = (x * y) * z.
Si • es otra operación binaria en C decimos que * es distributiva con res-
pecto a • si, para cualesquiera objetos x, y, z ∈ C, x * (y • z) = (x * y) • (x
* z).

Orden. Considérese un conjunto C y una relación diádica ≤ entre pares or-


denados de elementos de C. Para indicar que a ∈ C tiene la relación ≤ con
b ∈ C escribimos ‘a ≤ b’ (en vez de ≤(a,b)). Diremos que ≤ define un orden
parcial en C y que C está parcialmente ordenado por ≤, si se cumplen las
condiciones siguientes:

(i) la relación ≤ es reflexiva: si a ∈ C, a ≤ a;


(ii) la relación ≤ es antisimétrica: a ≤ b y b ≤ a sólo si a = b;
(iii) la relación ≤ es transitiva: si a ≤ b y b ≤ c, entonces a ≤ c.

Decimos que ≤ define un orden total en C y que C está totalmente ordena-


do por ≤, si además de las condiciones (i), (ii) y (iii) se cumple la condición
siguiente:

(iv) si a, b ∈ C, entonces siempre ocurrirá que a ≤ b o que b ≤ a.

En vez de ‘orden total’ suele decirse ‘orden simple’ u ‘orden lineal’. Dado
un orden total definido por la relación ≤, la relación diádica < está definida
por la condición: a < b si y sólo si a ≤ b y a ≠ b. La relación < es asimétrica:
a < b implica que es falso que b < a. El concepto de orden total puede
definirse también en términos de una relación transitiva y asimétrica < que
satisfaga el requisito de tricotomía: si a, b ∈ C, siempre ocurrirá que a < b,
o que b < a, o que a = b. En tal caso, la relación ≤ definida por la condición
‘a ≤ b si y sólo si a < b o a = b’ define en C un orden total de acuerdo con
nuestra primera definición.
Sea C un conjunto parcialmente ordenado por la relación ≤. Sea U ⊆ C.
Decimos que u es un elemento maximal de U si u ∈ U y no existe un v ∈
U tal que u < v. Decimos que u es un elemento minimal de U si u ∈ U y no
existe un v ∈ U tal que v < u. Un elemento a ∈ C es una cota superior de
U si todo x ∈ U cumple la condición x ≤ a. a es una cota inferior de U si
todo x ∈ U cumple la condición a ≤ x. Si U tiene una cota superior, deci-
mos que está acotado por arriba; si tiene una cota inferior, decimos que
está acotado por abajo; si tiene una cota superior y una cota inferior, deci-
mos simplemente que U es un conjunto acotado. Obsérvese que a lo sumo
una cota superior de U puede pertenecer a U. Si tal cota superior existe la
llamamos el máximo de U (abreviado: max U). Obviamente, si max U exis-
te, es un elemento maximal de U (en efecto, el único). Por otra parte, no
más de una cota inferior de U puede pertenecer a U. Si tal cota inferior existe,
la llamamos el mínimo de U (abreviado: min U). Si min U existe, es un

548
elemento minimal de U (en efecto, el único). Supongamos ahora que U tie-
ne una cota superior p tal que, si q es una cota superior de U, p ≤ q. Obvia-
mente, no puede haber más de un objeto p con esta propiedad. Si tal objeto
existe, lo llamamos la cota superior mínima o el supremo de U (abreviado:
sup U). Del mismo modo, la cota inferior máxima o infimo de U (abrevia-
do: inf U) es el objeto r tal que r es una cota inferior de U y si r es cual-
quier cota inferior de U, s ≤ r; obviamente, si inf U existe, es único.

Partición. Sea C un conjunto y P(C) el conjunto de los subconjuntos (las


partes) de C. Decimos que P ⊆ P(C) constituye una partición de C si cada
elemento de C pertenece a uno y sólo uno de los conjuntos contenidos en P.
Si P es una partición de C y x ∈ C, el elemento de P al que pertenece x
suele llamarse [x]. Sea R la relación entre pares de elementos de C definida
por la condición: xRy si y sólo si x ∈ [y]. En tal caso, [y] es el único ele-
mento de P a que pertenece x, esto es, [y] = [x]. Por ende, si x ∈ [y] y z ∈
[x], z ∈ [y]; esto es, si zRx y xRy, entonces zRy: R es una relación transitiva.
Como obviamente y ∈ [y], tenemos además que si xRy, yRx: R es reflexiva
y simétrica. En otras palabras, R es una †equivalencia. Hemos demostrado
así que toda partición de un conjunto C define una equivalencia entre los
elementos de C.

Producto cartesiano. Sean A y B dos conjuntos cualesquiera. El producto


cartesiano A × B es el conjunto de todos los pares ordenados 〈a,b〉 tales que
a ∈ A y b ∈ B. Si C es un tercer conjunto, A × B × C = (A × B) × C. El
producto cartesiano de n conjuntos se define en forma análoga. Como es
obvio, también se puede formar el producto cartesiano de un conjunto con-
sigo mismo: A × A = A2 ={〈x,y〉: x, y ∈ A}. Repitiendo esta operación dos,
tres,…, n-1 veces, se obtienen los productos cartesianos A3, A4, An. An es
llamado a veces el n-ésimo producto cartesiano de A (entiéndase: consigo
mismo).

549
OBRAS CITADAS

Ackermann, W. (1924). “Begründung des Tertium non datur mittels der Hilbertschen
Theorie der Widerspruchsfreiheit”. Mathematische Annalen. 92: 1–35.
Ackermann, W. (1928). “Zum Hilbertschen Aufbau der reellen Zahlen”. Mathe-
matische Annalen. 99: 118–133.
Ackermann, W. (1940). “Zur Widerspruchsfreiheit der Zahlentheorie”. Mathematische
Annalen. 117: 162–194.
Ash, J. M. (1989). “Uniqueness of representation by trigonometric series”. American
Mathematical Monthly. 96: 873–885.
Baker, G. P. y P. M. S. Hacker (1984). Frege: Logical Excavations. Oxford:
Blackwell.
Baldwin, J. M., ed. (1901-1905). Dictionary of Philosophy and Psychology. New
York: Macmillan. 3 vols. in 4.
Becker, O. (1954). Grundlagen der Mathematik in ihrer geschichtlichen Entwicklung.
Freiburg i. Br.: Karl Alber.
Behmann, H. (1922). “Beiträge zur Algebra der Logik, insbesondere zum Ent-
scheidungsproblem”. Mathematische Annalen. 86: 163–229.
Benacerraf, P. y H. Putnam, eds. (1983). Philosophy of Mathematics: Selected
Readings. Second Edition. Cambridge: Cambridge University Press.
Bernays, P. (1926). “Axiomatische Untersuchungen des Aussagenkalküls der Princi-
pia Mathematica”. Mathematische Zeitschrift. 25: 305–320.
Bernays, P. (1935). “Hilberts Untersuchungen über die Grundlagen der Arithmetik”.
En Hilbert GA, vol. III, pp. 196–216.
Bernays, P. y M. Schönfinkel (1928). “Zum Entscheidungsproblem der mathe-
matischen Logik”. Mathematische Annalen. 99: 342–372.
Birkhoff, G. y J. v. Neumann (1936). “The logic of quantum mechanics”. Annals of
Mathematics. 37: 823–843.
Bishop, E. (1967). Foundations of Constructive Analysis. New York: McGraw-Hill.
Bolzano, B. (1964). Paradoxien des Unendlichen. Hamburg: Felix Meiner. (primera
edición: 1851).
Boole, G. (1847). The Mathematical Analysis of Logic. Cambridge: Macmillan.

551
Obras citadas 552

Boole, G. (1854). An Investigation of the Laws of Thought on which are Founded


the Mathematical Theories of Logic and Probabilities. London: Macmillan.
Boolos, G. (1987). “The consistency of Frege’s Foundations of Arithmetic”. En
Demopoulos 1995, pp. 211-233. (Originalmente publicado en J. J. Thomson,
ed., On Being and Saying: Essays for Richard Cartwright, Cambridge MA,
MIT Press, 1987, pp. 3-20).
Boolos, G. (1990). “The standard of equality of numbers”. En Demopoulos 1995,
pp. 234-254. (Originalmente publicado en Meaning and Method: essays in
honor of Hilary Putnam, Cambridge, Cambridge University Press, 1990, pp.
261-277).
Boolos, G. y R. Jeffrey (1974). Computability and Logic. Cambridge: Cambridge
University Press.
Boolos, G. y R. Jeffrey (1989). Computability and Logic. Third Edition. Cambridge:
Cambridge University Press.
Bourbaki, N. (1970). Théorie des ensembles. Paris: Hermann.
Browder, F. E., ed. (1976). Mathematical Developments Arising from Hilbert
Problems. Proceedings of the Symposium in Pure Mathematics of the American
Mathematical Society held at Northern Illinois University, Dekalb, Illinois in
May 1974. Providence, RI: American Mathematical Society. Proceedings of
Symposia in Pure Mathematics, XXVIII.
Brouwer, L. E. J. (CW). Collected Works. Volume 1, Philosophy and the Foundations
of Mathematics. Edited by A. Heyting. Amsterdam: North-Holland, 1975.
Brouwer, L. E. J. (1905). Leven, Kunst en Mystiek. Delft: Waltman. (Extractos, tra-
ducidos al inglés, en Brouwer, CW I, 1-10; traducción inglesa completa por
W. P. van Stigt en Notre Dame Journal of Formal Logic, 37 (1996)).
Brouwer, L. E. J. (1908a). “Die möglichen Mächtigkeiten”. Atti IV Congresso
Internazionale di Matematici. Bologna. Pp. 569-571. (Reproducido en Brouwer,
CW I, 102-104).
Brouwer, L. E. J. (1908b). “The unreliability of the logical principles”. En Brouwer
CW, vol. I, pp. 107-111. (Traducción inglesa de Brouwer, “De onbetrouw-
baarheid der logische principes”, Tijdschrift voor wijsbegeerte, 2: 152-158
(1908)).
Brouwer, L. E. J. (1911). “Beweis des Invarianz des n-dimensionalen Gebiets”.
Mathematische Annalen. 71: 314–319.
Brouwer, L. E. J. (1913). “Über den natürlichen Dimensionsbegriff”. Journal für die
reine und angewandte Mathematik. 142: 146–152.
Brouwer, L. E. J. (1913a). “Intuitionism and formalism”. Bulletin of the American
Mathematical Society. 20: 81-96.
Obras citadas 553

Brouwer, L. E. J. (1918). “Begründung der Mengenlehre unabhängig vom logischen


Satz vom ausgeschlossenen Dritten. Erster Teil: Allgemeine Mengenlehre”. K.
Nederlandse Akademie van Wetenschappen. Verhandelingen. 1e Sectie 12, Nº
5 (1918). (Reproducido en Brouwer, CW, I, 150-190).
Brouwer, L. E. J. (1919). “Begründung der Mengenlehre unabhängig vom logischen
Satz vom ausgeschlossenen Dritten. Zweiter Teil: Theorie der Punktmengen”.
K. Nederlandse Akademie van Wetenschappen. Verhandelingen. 1e Sectie 12,
Nº 7 (1919). (Reproducido en Brouwer, CW, I, 191-221).
Brouwer, L. E. J. (1923). “Begründung der Funktionenlehre unabhängig vom
logischen Satz vom ausgeschlossenen Dritten. Erster Teil: Stetigkeit, Mess-
barkeit, Derivierbarkeit”. K. Nederlandse Akademie van Wetenschappen.
Verhandelingen. 1e Sectie 13, Nº 2 (1923). (Reproducido en Brouwer, CW, I,
246-267).
Brouwer, L. E. J. (1924). “Über die Bedeutung des Satzes vom ausgeschlossenen
Dritten in der Mathematik, insbesondere in der Funktionentheorie”. Journal
für die reine und angewandte Mathematik. 154: 1-7. (Reproducido en Brouwer,
CW I, 508-515; publicado originalmente en holandés en 1923; traducción in-
glesa, “On the significance of the principle of the excluded middle in mathe-
matics, especially in function theory”, en van Heijenoort 1967, pp. 334-341).
Brouwer, L. E. J. (1929). “Mathematik, Wissenschaft und Sprache”. Monatshefte für
Mathematik und Physik. 36: 153-164. (Reproducido en Brouwer, CW I, 417-
428).
Brouwer, L. E. J. (1948). “Consciousness, philosophy and mathematics”. Proceedings
of the 10th International Congress of Philosophy. Amsterdam. III, pp. 1235-
1249. (Reproducido en Brouwer, CW I, 480-494).
Brouwer, L. E. J. (1952). “Historical background, principles and methods of
intuitionism”. South African Journal of Science. 49: 139-146. (Reproducido
en Brouwer, CW I, 508-515).
Büchi, J. R. (1962). “Turing machines and the Entscheidungsproblem”. Mathematische
Annalen. 148: 201-213.
Burali-Forti, C. (1897). “Una questione sui numeri transfiniti”. Rendiconti del Circolo
matematico di Palermo. 11: 154–164.
Burali-Forti, C. (1897a). “Sulle classi ben ordinate”. Rendiconti del Circolo mate-
matico di Palermo. 11: 260.
Cantor, G. (GA). Gesammelte Abhandlungen mathematischen und philosophischen
Inhalts. Nebst einem Lebenslauf Cantors von A. Fraenkel. Mit erläuternden
Anmerkungen sowie mit Ergänzungen aus dem Briefwechsel Cantor-Dedekind
herausgegeben von Ernst Zermelo. Hildesheim: Olms, 1962. (Reprografischer
Nachdruck der Ausgabe Berlin 1932).
Obras citadas 554

Cantor, G. (1870). “Beweis, daß eine für jeden reellen Wert von x durch eine
trigonometrische Reihe gegebene Funktion ƒ(x) sich nur auf eine einzige Weise
in dieser Form darstellen läßt”. Journal für die reine und angewandte Mathe-
matik. 72: 139–142. (Reproducido en Cantor GA, pp. 80-83.
Cantor, G. (1871). “Notiz zu dem Aufsatze: Beweis, daß eine für jeden reellen Wert
von x durch eine trigonometrische Reihe gegebene Funktion ƒ(x) sich nur auf
eine einzige Weise in dieser Form darstellen läßt”. Journal für die reine und
angewandte Mathematik. 73: 294–296. (Reproducido en Cantor GA, pp. 84-
86).
Cantor, G. (1872). “Über die Ausdehnung eines Satzes aus der Theorie der trigono-
metrischen Reihen”. Mathematische Annalen. 5: 123–132. (Reproducido en
Cantor GA, pp. 92-102).
Cantor, G. (1874). “Über eine Eigenschaft des Inbegriffes aller reellen algebraischen
Zahlen”. Journal für die reine und angewandte Mathematik. 77: 258–262.
(Reproducido en Cantor GA, pp. 115-118).
Cantor, G. (1878). “Ein Beitrag zur Mannigfaltigkeitslehre”. Journal für die reine
und angewandte Mathematik. 84: 242–258. (Reproducido en Cantor GA, pp.
119-133).
Cantor, G. (1883). “Über unendliche, lineare Punktmannichfaltigkeiten, Nr. 5”.
Mathematische Annalen. 21: 545–591. (Reproducido en Cantor GA, pp. 165-
209).
Cantor, G. (1886). “Über die verschiedenen Standpunkte in Bezug auf das aktuelle
Unendliche”. Zeitschrift für Philosophie und philosophische Kritik. 88: 224–
233. (Reproducido en Cantor GA, pp. 370-377).
Cantor, G. (1887/88). “Mitteilungen zur Lehre vom Transfiniten”. Zeitschrift für
Philosophie und philosophische Kritik. 91: 81–125; 92: 240–265. (Reproduci-
do en Cantor GA, pp. 378-439).
Cantor, G. (1890/91). “Über eine elementare Frage der Mannigfaltigkeitslehre”.
Jahresbericht der Deutschen Mathematiker-Vereinigung. 1: 75–78. (Reprodu-
cido en Cantor GA, pp. 278-281).
Cantor, G. (1895/97). “Beiträge zur Begründung der transfiniten Mengenlehre”.
Mathematische Annalen. 45: 581–512; 49: 207–246. ((Reproducido en Cantor
GA, pp. 282-351).
Cantor, G. (1899). “Carta a Richard Dedekind del 3 de agosto de 1899”. En Cantor
GA, pp. 443–447. (Nótese que esta carta se imprimió fundida con otra, del 28
de julio de 1899, a la cual pertenecen sólo los cuatro primeros párrafos de la
p. 443; cf. Grattan-Guinness 1974).
Cartan, H. (1937). “Théorie des filtres”. Comptes rendus de l'Académie des Sciences.
205: 595-598.
Obras citadas 555

Chang, C. C. y H. J. Keisler (1990). Model Theory. Third edition. Amsterdam: North-


Holland..
Church, A. (1936). “An unsolvable problem of elementary number theory”. American
Journal of Mathematics. 58: 345-363 (1936). (Reproducido en Davis 1965, pp.
89-107. Este artículo fue sometido el 19 de abril de 1935. Se publicó un resu-
men en el Bulletin of the American Mathematical Society, 41: 333 (1935)).
Church, A. (1936a). “A note on the Entscheidungsproblem”. Journal of Symbolic
Logic. 1: 40-41, 101-102 (1936). (Reproducido en Davis 1965, pp. 110-115;
mis citas remiten a este libro, que funde las dos publicaciones citadas, inte-
grando en la primera la corrección aportada por la segunda).
Church, A. (1976). “Comparison of Russell’s resolution of the semantical antinomies
with that of Tarski”. Journal of Symbolic Logic. 41: 747–760. (Versión revisa-
da en R. L. Martin 1984, pp. 289–306).
Church, A. (1984). “Comparison of Russell’s resolution of the semantical antinomies
with that of Tarski”. En R. L. Martin 1984, pp. 289–306. (Versión revisada de
Church 1976).
Chwistek, L. (1922). “Über die Antinomien der Principien der Mathematik”.
Mathematische Zeitschrift. 14: 236–243.
Cocchiarella, N. (1980). “The development of the theory of logical types and the
notion of a logical subject in Russell’s early philosophy”. Synthese. 45: 71–
115.
Coffa, J. A. (1981). “Russell and Kant”. Synthese. 46: 247-263.
Coffa, J. A. (1991). The Semantic Tradition from Kant to Carnap: To the Vienna
Station. Edited by L. Wessels. Cambridge: Cambridge University Press.
Copi, I. M. (1950). “The inconsistency or redundancy of Principia Mathematica”.
Philosophy and Phenomenological Research. 11: 190–199.
Copi, I. M. (1971). The Theory of Logical Types. London: Routledge & Kegan Paul.
Dauben, J. W. (1979). Georg Cantor: His Mathematics and Philosophy of the Infinite.
Cambridge, MA: Harvard University Press.
Davis, M. (1965). The Undecidable: Basic Papers on Undecidable Propositions,
Unsolvable Problems and Computable Functions. New York: Raven Press.
Dedekind, R. (1888). Was sind und sollen die Zahlen? Braunschweig: Vieweg.
Dedekind, R. (1893). Was sind und sollen die Zahlen? Braunschweig: Vieweg. (Se-
gunda edición).
Demopoulos, W., ed. (1995). Frege’s Philosophy of Mathematics. Cambridge MA:
Harvard University Press.
Obras citadas 556

Descartes, R. (1637). Discours de la méthode pour bien conduire sa raison, et


chercher la vérité dans les sciences. Plus la Dioptrique, les Météores et la
Géométrie qui sont des essais de cette méthode. Leyde: Jean Maire.
Detlefsen, M. (1979). “On interpreting Gödel’s Second Theorem”. En S. G. Shanker
1989, pp. 131–154. (Publicado originalmente, sin el “Postscript”, en Journal
of Philosophical Logic, 8: 297–313).
Detlefsen, Michael (1986). Hilbert’s Program: An essay on mathematical instrument-
alism. Dordrecht: D. Reidel.
Detlefsen, M. (1990). “On an alleged refutation of Hilbert’s Program using Gödel’s
First Incompleteness Theorem”. En M. Detlefsen 1992a, pp. 199-235. (Publi-
cado originalmente en Journal of Philosophical Logic, 18).
Detlefsen, M., ed. (1992). Proof and Knowledge in Mathematics. London: Routledge.
Detlefsen, M., ed. (1992a). Proof, Logic and Formalization. London: Routledge.
Dreben, B. (1963). “Corrections to Herbrand”. American Mathematical Society,
Notices. 10: 285.
Dreben, B. y S. Aanderaa (1964). “Herbrand analyzing functions”. Bulletin of the
American Mathematical Society. 70: 697–698.
Dreben, B., P. Andrews y S. Aanderaa (1963). “Errors in Herbrand”. American
Mathematical Society, Notices. 10: 285.
Dreben, B., P. Andrews y S. Aanderaa (1963a). “False lemmas in Herbrand”. Bulletin
of the American Mathematical Society. 69: 699–706.
Dreben, B. y J. Denton (1966). “A supplement to Herbrand”. Journal of Symbolic
Logic. 31: 393–398.
Dreben, B. y W. D. Goldfarb (1979). The Decision Problem. Solvable Classes of
Quantificational Formulas. Reading MA: Addison-Wesley.
du Bois-Reymond, P. (1875). “Über asymptotische Werte, infinitäre Approximationen
und infinitäre Auflösungen von Gleichungen”. Mathematische Annalen. 8: 363–
414.
Etchemendy, John (1990). The Concept of Logical Consequence. Cambridge, MA:
Harvard University Press.
Euripides (1960). Bacchae. Second Edition. Edited with an Introduction and Com-
mentary by E. R. Dodds. Oxford: Clarendon Press.
Felgner, U., ed. (1979). Mengenlehre. Darmstadt: Wissenschaftliche Buchgesellschaft.
Fourier, J. (1822). Théorie analytique de la chaleur. Paris: Firmin Didot.
Fraenkel, A. A. (1922). “Zu den Grundlagen der Cantor-Zermeloschen Mengenlehre”.
Mathematische Annalen. 86: 230–237. (Reproducido en Felgner 1979).
Obras citadas 557

Fraenkel, A. A. (1922a). “Der Begriff “definit” und die Unabhängigkeit des Auswahls-
axioms”. Preußische Akademie der Wissenschaften. Physikalisch-mathematische
Kl. Sitzungsberichte. Pp. 253–257. (Traducción inglesa en J. van Heijenoort
1967).
Fraenkel, A. A. (1925). “Untersuchungen über die Grundlagen der Mengenlehre”.
Mathematische Zeitschrift. 22: 250–273.
Frege, G. (BSA). Begriffschrift und andere Aufsätze. Zweite Auflage mit E. Husserls
und H. Scholz’s Anmerkungen. Herausgegeben von I. Angelelli. Darmstadt:
Wissenschaftliche Buchgesellschaft, 1971.
Frege, G. (KS). Kleine Schriften. Herausgegeben von I. Angelelli. Darmstadt:
Wissenschaftliche Buchgesellschaft.
Frege, G. (LS). Siete escritos sobre lógica y semántica. Introducción, traducción y
selección bibliográfica de Gómez-Lobo, A. Valparaíso: Universidad Católica
de Valparaíso, 1972.
Frege, G. (WB). Wissenschaftlicher Briefwechsel. Herausgegeben, bearbeitet,
eingeleitet und mit Anmerkungen versehen von G. Gabriel, H. Hermes, F.
Kambartel, C. Thiel y A. Veraart. Hamburg: Felix Meiner.
Frege, G. (1879). Begriffschrift, eine der arithmetischen nachgebildete Formelsprache.
Halle a.S.: Louis Nebert.
Frege, G. (1884). Die Grundlagen der Arithmetik. Eine logisch mathematische
Untersuchung über den Begriff der Zahl. Breslau: Wilhelm Koebner.
Frege, G. (1891). Funktion und Begriff. Vortrag, gehalten in der Sitzung vom 9. Januar
1891 der Jenaischen Gesellschaft der Medizin und Naturwissenschaft. Jena:
H. Pohle. (Reproducido en G. Frege, KS, pp. 125–142).
Frege, G. (1892). “Über Sinn und Bedeutung”. Zeitschrift für Philosophie und
philosophische Kritik. 100: 25–50 (1892). (Reproducido en G. Frege, KS, pp.
143–162).
Frege, G. (1892a). “Über Begriff und Gegenstand”. Vierteljahrschrift für wissen-
schaftliche Philosophie. 16: 192–205 (1892). (Reproducido en G. Frege, KS,
pp. 167–178).
Frege, G. (1893). Grundgesetze der Arithmetik, begriffschriftlich abgeleitet. I. Band.
Hildesheim: Georg Olms, 1962. (Reimpresión repográfica de la edición origi-
nal, publicada en Jena en 1893; encuadernada en un volumen con el tomo II).
Frege, G. (1895). “Kritische Beleuchtung einiger Punkte in E. Schröders Vorlesungen
über die Algebra der Logik”. Archiv für systematische Philosophie. 1: 433–
456. (Reproducido en Frege, KS, pp. 193–210).
Obras citadas 558

Frege, G. (1903). Grundgesetze der Arithmetik, begriffschriftlich abgeleitet. II. Band.


Hildesheim: Georg Olms, 1962. (Reimpresión repográfica de la edición origi-
nal, publicada en Jena en 1903, encuadernada en un volumen con el tomo I).
Frege, G. (1903a). “Über die Grundlagen der Geometrie”. Jahresbericht der
Deutschen Mathematiker-Vereinigung. 12: 319–324. (Reproducido en G. Frege,
KS, pp. 262–266).
Frege, G. (1903b). “Über die Grundlagen der Geometrie, II”. Jahresbericht der
Deutschen Mathematiker-Vereinigung. 12: 368–375. (Reproducido en G. Frege,
KS, pp. 267–272).
Frege, G. (1959). The Foundations of Arithmetic: A Logico-Mathematical Enquiry
into the Concept of Number. Second revised edition. English translation, with
facing German text, by J. L. Austin. Oxford: Basil Blackwell.
Freudenthal, H. (1974). “The impact of von Staudt’s foundations of geometry”. En
R. S. Cohen y otros, eds., For Dirk Struik. Dordrecht: Reidel. Pp. 189-200.
Geach, P. (1956). “On Frege’s way out”. En Geach 1972, pp. 235-237. (Publicado
originalmente en Mind, 65).
Geach, P. (1972). Logic Matters. Oxford: Basil Blackwell.
Gentzen, G. (CP). The Collected Papers of Gerhard Gentzen. Translated by M. E.
Szabo. Amsterdam: North-Holland.
Gentzen, G. (1934). “Untersuchungen über das logische Schließen”. Mathematische
Zeitschrift. 39: 176-210, 405-431.
Gentzen, G. (1935). “Die Widerspruchsfreiheit der reinen Zahlentheorie”. Mathe-
matische Annalen. 112: 493-565.
Gentzen, G. (1936/37). “Der Unendlichkeitsbegriff in der Mathematik”. Semester-
Berichte, Münster in W. 9. Semester, Winter 1936/37: 65-80. (Traducción in-
glesa en Gentzen, CP, pp. 223-233).
Gentzen, G. (1938). “Neue Fassung des Widerspruchsfreiheitsbeweises für die reine
Zahlentheorie”. Forschungen zur Logik und zur Grundlegung der exakten
Wissenschaften. Neue Folge, 4: 19-44 (1938).
Gentzen, G. (1943). “Beweisbarkeit und Unbeweisbarkeit von Anfangsfällen der
transfiniten Induktion in der reinen Zahlentheorie”. Mathematische Annalen.
113: 140-161.
Gergonne, J. D. (1818). “Essai sur la théorie des définitions”. Annales des mathé-
matiques. 9: 1–35.
Gillies, D. A. (1982). Frege, Dedekind, and Peano on the Foundations of Arithmetic.
Assen: Van Gorcum.
Obras citadas 559

Gödel, K. (CW). Collected Works. Volume I: Publications 1929–1936; Volume II:


Publications 1938–1974; Volume III: Unpublished essays and lectures. Edited
by S. Feferman et al. New York: Oxford University Press, 1986–95.
Gödel, K. (OC). Obras completas. Segunda edición. Introducción y traducción de J.
Mosterín. Madrid: Alianza, 1989.
Gödel, K. (1929). “Über Vollständigkeit des Logikkalküls”. En Gödel CW, vol. I,
pp. 60–122. (Tesis doctoral, Universidad de Viena).
Gödel, K. (1930) “Die Vollständigkeit der Axiome des logischen Funktionenkalküls”.
Monatshefte für Mathematik und Physik. 37: 349–360. (Reproducido en Gödel,
CW, vol. I, pp. 102–122).
Gödel, K. (1930a). “Einige metamathematische Resultate über Entscheidungs-
definitheit und Widerspruchsfreiheit”. Anzeiger derAkademie der Wissenschaften
in Wien. 67: 214–215 (1930). (Reproducido en Gödel, CW, vol. I, pp. 140–
142).
Gödel, K. (1931). “Über formal unentscheidbare Sätze der Principia Mathematica
und verwandten Systeme”. Monatshefte für Mathematik und Physik. 7: 173–
198. (Reproducido en Gödel, CW, vol. I, pp. 145-195).
Gödel, K. (1932). “Ein Spezialfall des Entscheidungsproblems der theoretischen
Logik”. Ergebnisse eines mathematischen Kolloquiums. 2: 27–28 (1932). (Re-
producido en Gödel, CW, vol. I, pp. 230–234).
Gödel, K. (1934). “On undecidable propositions of formal mathematical systems”.
En Gödel CW, vol. I, pp. 346–371. (Notas tomadas en clase por S. C. Kleene
y J. B. Rosser, mimeografiadas en 1934 e impresas por primera vez, con co-
rrecciones de Gödel, en Davis 1965).
Gödel, K. (1940). The Consistency of the Axiom of Choice and of the Generalized
Continuum Hypothesis with the Axioms of Set Theory. Princeton: Princeton
University Press. (Reproducido en Gödel, CW, vol. II, pp. 33-101).
Gödel, K. (1944). “Russell’s mathematical logic”. En Gödel CW, vol. II, pp. 119–
141. (Publicado originalmente en P. A. Schilpp, ed. The Philosophy of Bertrand
Russell, Evanston: Northwestern University Press).
Gödel, K. (1958). “Über eine bisher nicht benutzte Erweiterung des finiten Stand-
punktes”. Dialectica. 12: 280-287. (Reproducido en Gödel, CW, vol. II, pp.
240-251).
Goldfarb, W. (1979). “Logic in the twenties: the nature of the quantifier”. Journal
of Symbolic Logic. 44: 351–368.
Grattan-Guinness, I. (1974). “The rediscovery of the Cantor-Dedekind correspond-
ence”. Jahresbericht der Deutschen Mathematiker-Vereinigung. 76: 104–139.
Obras citadas 560

Grelling, K. y L. Nelson (1908). “Bemerkungen zu den Paradoxien von Russell und


Burali-Forti”. Abhandlungen der Fries’schen Schule. 2: 301-324.
Hall, A. R. y M. B. Hall, eds. (1962). Unpublished Scientific Papers of Isaac Newton.
A Selection from the Portsmouth Collection in the University Library,
Cambridge. Cambridge: Cambridge University Press.
Hallett, M. (1984). Cantorian Set Theory and Limitation of Size. Oxford: Clarendon
Press.
Hartogs, F. (1915). “Über das Problem der Wohlordnung”. Mathematische Annalen.
76: 436–443.
Hausdorff, F. (1914). Grundzüge der Mengenlehre. Leipzig: Veit.
Henkin, L. (1949). “The completeness of the first-order functional calculus”. Journal
of Symbolic Logic. 14: 159-166. (Reproducido en Hintikka 1969, pp. 42-50).
Henkin, L. (1950). “Completeness in the theory of types”. Journal of Symbolic Logic.
15: 81–91 (1950). (Reproducido en Hintikka 1969, pp. 51–63).
Herbrand, J. (EL). Écrits logiques. Avec une Préface de J. van Heijenoort, une Notice
Biographique par C. Chevalley et A. Lautmann et une Note sur la pensée de
Herbrand par C. Chevalley. Paris: Presses Universitaires de France, 1968.
Herbrand, J. (LW). Logical Writings. A Translation of the ‘Écrits logiques’, edited
by J. van Heijenoort. Edited by W. D. Goldfarb. Cambridge, MA: Harvard
University Press, 1971.
Herbrand, J. (1929). “Non-contradiction des axiomes arithmétiques”. Comptes rendus
de l'Académie des Sciences. 188: 303-304. (Reproducido en Herbrand, EL, pp.
221–232).
Herbrand, J. (1930). Recherches sur la théorie de la démonstration. Varsovia: Prace
Towarzystwa Naukowego Warszawskiego. Wydzial III, nº 33. (Reproducido en
Herbrand, EL, pp. 221–232).
Herbrand, J. (1931). “Sur la non-contradiction de l’arithmétique”. Journal für die
reine und angewandte Mathematik. 166: 1-8. (Reproducido en Herbrand, EL,
pp. 221–232).
Hermes, H. (1961). Aufzählbarkeit, Entscheidbarkeit, Berechenbarkeit: Einführung
in die Theorie der rekursiven Funktionen. Berlin: Springer.
Hessenberg, G. (1906). Grundbegriffe der Mengenlehre. Abhandlungen der Friesschen
Schule, N.R. [I] 4.
Hilbert, D. (GA). Gesammelte Abhandlungen. New York: Chelsea, 1965. 3 vols.
(Reimpresión de la edición original: Berlin, Springer, 1933–35).
Hilbert, D. (GG). Grundlagen der Geometrie. Zehnte Auflage. Mit Supplementen
von P. Bernays. Stuttgart: Teubner. (Primera edición, 1899).
Obras citadas 561

Hilbert, D. (GG7). Grundlagen der Geometrie. Siebente umgearbeitete und vermehrte


Auflage. Leipzig: Teubner, 1930.
Hilbert, D. (Hilbertiana). Hilbertiana. Fünf Aufsätze. Darmstadt: Wissenschaftliche
Buchgesellschaft, 1964.
Hilbert, D. (1899). “Grundlagen der Geometrie”. En Festschrift zur Feier der
Enthüllung des Gauss-Weber-Denkmals in Göttingen. Leipzig: Teubner. Pp. 3–
92.
Hilbert, D. (1900). “Über den Zahlbegriff”. En Hilbert GG7, pp. 241-246. (Publica-
do originalmente en Jahresbericht der Deutschen Mathematischen Vereinigung,
8: 180-194 (1900)).
Hilbert, D. (1900a). “Mathematische Probleme”. En D. Hilbert GA, vol. III, . (Pu-
blicado originalmente en Göttinger Nachrichten, 1900, pp. 253–297; repro-
ducido en Archiv für Mathematik und Physik, (3) 1: 44–63, 213–237 (1901)).
Hilbert, D. (1904). “Über die Grundlagen der Logik und der Arithmetik”. En Hilbert
GG7, pp. 247-261. (Publicado originalmente en Verhandlungen des Dritten
Internationalen Mathematiker-Kongresses in Heidelberg vom 8. bis 13. August
1904, Leipzig: Teubner, 1905, pp. 174-185. Traducción inglesa en van Heijen-
oort 1967, pp. 129–138).
Hilbert, D. (1922). “Neubegründung der Mathematik (Erste Mitteilung)”. Abhand-
lungen aus dem mathematischen Seminar der Hamburgischen Universität. 1:
155–177. (Reproducido en Hilbert GA, III, 157–177 y en Hilbertiana).
Hilbert, D. (1923). “Die logischen Grundlagen der Mathematik”. Mathematische
Annalen. 88: 151–165. (Reproducido en Hilbert GA, III, 178–191 y en
Hilbertiana).
Hilbert, D. (1926). “Über das Unendliche”. Mathematische Annalen. 95: 161-190.
(Reproducido en Hilbertiana y en GG7; traducción inglesa en van Heijenoort
1967).
Hilbert, D. (1928). “Die Grundlagen der Mathematik”. En Hilbert GG7, pp. 289-
312. (Versión ligeramente abreviada del texto publicado originalmente en
Abhandlungen aus dem mathematischen Seminar der Hamburgischen
Universität, 6: 65-85 (1928)).
Hilbert, D. (1928a). “Probleme der Grundlegung der Mathematik”. En Hilbert GG7,
pp. 313-323. (Conferencia leída en el Congreso Internacional de Matemáticos
de Bologna el 3 de septiembre de 1928 y publicada en el tomo VI de sus
Actas; reproducida en Mathematische Annalen, 102: 1-9 (1930)).
Hilbert, D. (1931). “Zur Grundlegung der elementaren Zahlenlehre”. Mathematische
Annalen. 104: 485–494.
Obras citadas 562

Hilbert, D. (1931a). “Beweis des Tertium non datur”. Göttinger Nachrichten (Math.-
phys. Klasse). Pp. 120–125.
Hilbert, D. y W. Ackermann (1928). Grundzüge der theoretischen Logik. Berlin:
Springer.
Hilbert, D. y P. Bernays (GM). Grundlagen der Mathematik. Zweite Auflage. Berlin:
Springer, 1968/1970. 2 vols.
Hilbert, D. y P. Bernays (1934). Grundlagen der Mathematik. Band I. Berlin: Springer.
Hilbert, D. y P. Bernays (1939). Grundlagen der Mathematik. Band II. Berlin:
Springer.
Hintikka, J., ed. (1969). The Philosophy of Mathematics. Oxford: Oxford University
Press. (Oxford Readings in Philosophy).
Isaacson, D. (1992). “Some considerations on arithmetical truth and the ω-rule”. En
M. Detlefsen 1992a, pp. 94-138.
Jaßkowski, S. “On the rules of suppositions in formal logic”. Studia Logica. 1: 5–32
(1934). (Reproducido en McCall 1967, pp. 231-258).
Jeffrey, R. (1981). Formal Logic: Its Scope and Limits. Second edition. New York:
McGraw-Hill.
Johnson, D. M. (1979/81). “The problem of the invariance of dimension in the growth
of modern topology”. Archive for History of Exact Sciences. 20: 97–188; 25:
85–267.
Kalmár, L. (1955). “Über ein Problem, betreffend die Definition des Begriffes der
allgemein-rekursiven Funktionen”. Zeitschrift für mathematische Logik und
Grundlagenforschung. 1: 93-96.
Kleene, S. C. (1936). “General recursive functions of natural numbers”. Mathe-
matische Annalen. 112: 727-742. (Reproducido en Davis 1965, pp. 237-252,
con importantes rectificaciones en la p. 253. Mis citas remiten a esta edición.).
Kleene, S. C. (1938). “On notation for ordinal numbers”. Journal of Symbolic Logic.
3: 150–155.
Kleene, S. C. (1943). “Recursive predicates and quantifiers”. American Mathematical
Society Transactions. 53: 41-73 (1943). (Reproducido en Davis 1965, pp. 255-
287. Mis citas remiten a esta edición.).
Kleene, S. C. (1952). Introduction to Metamathematics. Amsterdam: North-Holland.
Kleene, S. C. (1967). Mathematical Logic. New York: Wiley.
König, D. (1926). “Sur les correspondances multivoques des ensembles”. Funda-
menta Mathematicae. 8: 114-134.
König, J. (1905). “Zum Kontinuum-Problem”. Mathematische Annalen. 60: 177–180,
462.
Obras citadas 563

König, J. (1905a). “Über die Grundlagen der Mengenlehre und das Kontinuums-
problem”. Mathematische Annalen. 61: 156-160. (Traducción inglesa en van
Heijenoort 1967, pp. 145-149).
König, J. (1914). Neue Grundlagen der Logik, Arithmetik und Mengenlehre. Leipzig.
Kreisel, G. (1976). “What have we learnt from Hilbert’s Second Problem”. En F. E.
Browder 1976, pp. 93–130.
Kronecker, L. (1887). “Über den Zahlbegriff”. Journal für die reine und angewandte
Mathematik. 101: 337–355.
Largeault, J. (1992). L’intuitionisme. Paris: Presses Universitaires de France.
Leibniz, G. W. (EF). Escritos filosóficos. Edición de E. de Olaso. Buenos Aires:
Charcas, 1982.
Leibniz, G. W. (GP). Die philosophischen Schriften. Herausgegeben von C. J.
Gerhardt. Hildesheim: Olms, 1965. 7 vols.
Leibniz, G. W. (LP). Logical Papers. A Selection Translated and Edited with an
Introduction by G. H. R. Parkinson. Oxford: Clarendon Press.
Levy, A. (1979). Basic Set Theory. Berlin: Springer.
Lewis, C. I. (1918). A Survey of Symbolic Logic. Berkeley: University of California
Press.
Lewis, D. (1991). Parts of Classes. With an appendix by J. P. Burgess, A. P. Hazen
and D. Lewis. Oxford: Basil Blackwell.
Lorenzen, P. (1965). Differential und Integral. Frankfurt a. M.
Löwenheim, L. (1915). “Über Möglichkeiten im Relativkalkül”. Mathematische
Annalen. 76: 447-470.
Maddy, P. (1990). Realism in Mathematics. Oxford: Clarendon Press.
Mancosu, P. (1998). From Brouwer to Hilbert: The Debate on the Foundations of
Mathematics in the 1920s. New York: Oxford University Press.
Manin, Y. I. (1977). A Course in Mathematical Logic. Translated from the Russian
by N. Koblitz. New York: Springer.
Mannheim, J. H. (1964). The Genesis of Point Set Topology. Oxford: Pergamon.
Mates, B. (1970). Elementary Logic. New York: Oxford University Press.
Matijasévic, Y. V. (1970). “Diofantovost pereçislimyh mnozestv”. Doklady Akad. Nauk
SSSR. 191: 279-282.
Matijasévic, Y. V. (1970a). “Enumerable sets are Diophantine”. Soviet Math. Doklady.
11: 354-357. (Versión inglesa corregida de Matijasévic 1970).
Obras citadas 564

McCall, S., ed. (1967). Polish Logic 1920–1939. Papers by Adjukiewicz, Chwistek,
Jaßkowski, Jordan, Leßniewski, Lukasiewicz, Slupecki, Sobociñski, and
Wajsberg. With an Introduction by T. Kotarbinski. Translated by B. Gruchman
et al. Oxford: Clarendon Press.
Mendelson, E. (1958). “The Axiom of Fundierung and the Axiom of Choice”. Archiv
für mathematische Logik und Grundlagenforschung. 4: 65–70.
Mendelson, E. (1990) “Second thoughts about Church’s Thesis and mathematical
proofs”. Journal of Philosophy. 87: 225–233.
Meschkowski, H. (1967). Probleme des Unendlichen: Werk und Leben Georg Cantors.
Braunschweig: Vieweg.
Mirimanoff, D. (1917). “Les antinomies de Russell et de Burali-Forti et le problème
fondamentale de la théorie des ensembles”. L’Enseignement Mathématique. 19:
37–52.
Mirimanoff, D. (1917a). “Remarques sur la théorie des ensembles et les antinomies
cantoriennes – I”. L’Enseignement Mathématique. 19: 209–217.
Mirimanoff, D. (1920). “Remarques sur la théorie des ensembles et les antinomies
cantoriennes – II”. L’Enseignement Mathématique. 21: 29–52.
Mittelstraß, J., ed. (EPW). Enzyklopädie Philosophie und Wissenschaftstheorie.
Mannheim: Bibliographisches Institut / Stuttgart: J.B. Metzler. 1980–1996. 4
vols.
Moore, E. H. y H. L. Smith (1922). “A general theory of limits”. American Journal
of Mathematics. 44: 102-121.
Moore, G. H. (1982). Zermelo’s Axiom of Choice: Its origins, development, and
influence. New York: Springer.
Nagel, E. (1939). “The formation of modern conceptions of formal logic in the
development of geometry”. Osiris. 7: 142-224.
Nelson, E. (1986). Predicative Arithmetic. Princeton: Princeton University Press.
Nelson, E. (1993). “Taking formalism seriously”. The Mathematical Intelligencer.
15 3: 8-11.
Neumann, J. von (CW). Collected Works. Volume I. New York: Pergamon, 1961.
Neumann, J. von (1922/23). “Zur Einführung der transfiniten Zahlen”. Acta Litterarum
ac Scientiarum Regiae Universitatis Hungaricae, Sectio Sc. Math. : 199–208.
(Reproducido en von Neumann, CW, vol. I, pp. 24–33 y en Felgner 1979, pp.
92–101; traducción inglesa en Heijenoort 1967, pp. 346–354).
Neumann, J. von (1925). “Eine Axiomatisierung der Mengenlehre”. Journal für die
reine und angewandte Mathematik. 154: 219-240 (1925). (Reproducido en von
Neumann, CW, vol. I, pp. 35–56).
Obras citadas 565

Neumann, J. von (1927a). “Mathematische Begründung der Quantenmechanik”.


Göttinger Nachrichten. 1 Nr. 9: 1–57.
Neumann, J. von (1927). “Zur Hilbertschen Beweistheorie”. Mathematische
Zeitschrift. 26: 1–46 (1927). (Reproducido en von Neumann, CW, vol. I, pp.
256–300).
Neumann, J. von (1928). “Die Axiomatisierung der Mengenlehre”. Mathematische
Zeitschrift. 27: 669–752. (Reproducido en von Neumann, CW, vol. I, pp. 339–
422).
Neumann, J. von (1928a). “Über die Definition durch transfinite Induktion und
verwandte Fragen der allgemeinen Mengenlehre”. Mathematische Annalen. 99:
373-391. (Reproducido en von Neumann, CW, vol. I, pp. 320–338).
Neumann, J. von (1928b). “Zur Theorie der Gesellschaftsspiele”. Mathematische
Annalen. 100: 295–320.
Neumann, J. von (1931). “The formalist foundations of mathematics”. En P.
Benacerraf y H. Putnam 1983, pp. 61-65. (Traducido al inglés por Erna Putnam
y G. J. Massey del original alemán publicado en Erkenntnis en 1931).
Neumann, J. von (1932). Mathematische Grundlagen der Quantenmechanik. Berlin:
Springer.
Neumann, J. von y O. Morgenstern (1944). Theory of Games and Economic Behavior.
Princeton: Princeton University Press.
Pasch, M. (1882). Vorlesungen über neuere Geometrie. Leipzig: Teubner.
Peano, G. (1889). Arithmetices principia nova methodo exposita. Torino: Bocca.
Peano, G. (1895-1908). Formulaire des Mathématiques. Torino: Bocca. 5 vols.
Peano, G. (1894). Notations de Logique Mathématique: Introduction au Formulaire
de Mathématique publiée par Rivista di Matematica. Turin: Guadagni.
Peano, G. (1906). “Super theorema de Cantor-Bernstein”. Rendiconti del Circolo
matematico di Palermo. 21: 360.
Peirce, C. S. (CP). Collected Papers. Edited by C. Hartshorne, P. Weiss y A. W.
Burks. Cambridge MA: The Belknap Press of Harvard University Press. 8 vols.
Peirce, C. S. (1880). “On the algebra of logic”. En Peirce CP, vol. 3, pp. 104–157.
(Publicado originalmente en American Journal of Mathematics, 3: 15–97).
Peirce, C. S. (1882). “Brief description of the algebra of relatives”. En Peirce CP,
vol. 3, pp. 180–186. (Publicado póstumamente aquí por primera vez).
Peirce, C. S. (1883). “A theory of probable inference. Note B. The logic of relatives”.
En Peirce CP, vol. 3, pp. 195–209. (Publicado originalmente en Studies in Logic
by Members of the Johns Hopkins University, Boston, pp. 187–203).
Obras citadas 566

Peirce, C. S. (1870). “Description of a notation for the logic of relatives, resulting


from an amplification of the conceptions of Boole’s calculus of logic”. En
Peirce CP, vol. 3, pp. 27–98. (Publicado originalmente en Memoirs of the
American Academy of Arts and Sciences, 9: 317–78).
Peirce, C. S. (1901). “Insolubilia”. En Peirce CP, vol. 2, pp. 370-371. (Publicado
originalmente en Baldwin 1901-1905, vol. I, p. 554).
Péter, R. (1934). “Über den Zusammenhang der verschiedener Begriffe der rekursiven
Funktion”. Mathematische Annalen. 110: 612-632.
Poincaré, H. (CM). Ciencia y método. Traducción castellana por M. García Miranda
y L. Alonso. Madrid: Espasa-Calpe, 1963. (Traducción de Poincaré 1908).
Poincaré, H. (DP). Dernières Pensées. Paris: Flammarion, 1963. (Primera edición,
1913).
Poincaré, H. (SH). La science et l’hypothése. Paris: Flammarion, 1968. (Primera
edición, 1902).
Poincaré, H. (1894). “Sur la nature du raisonnement mathématique”. Revue de
métaphysique et de morale. 2: 371–384.
Poincaré, H. (1905/1906). “Les mathématiques et la logique”. Revue de Métaphysique
et de Morale. 13: 815–835; 14: 17–34, 294–317.
Poincaré, H. (1908). Science et méthode. Paris: Flammarion.
Poincaré, H. (1909). “La logique de l’infini”. Revue de Métaphysique et de Morale.
17: 461–482.
Poncelet, J. V. (1822). Traité des propriétés projectives des figures. Paris: Bachelier.
Pollack, S. (1982). “The development of computer science”. En Pollack SCS, pp.
1–51.
Pollack, S. V., ed. (SCS). Studies in Computer Science. Washington: Mathematical
Association of America, 1982.
Pollard, S. (1990). Philosophical Introduction to Set Theory. Notre Dame: University
of Notre Dame Press.
Poncelet, J. V. (1822). Traité des propriétés projectives des figures. Paris: Bachelier.
Post, E. L. (1921). “Introduction to a general theory of elementary propositions”.
En van Heijenoort 1967, pp. 264–283. (Publicado originalmente en Bulletin of
the American Mathematical Society, 43: 163–185 (1921)).
Post, E. L. (1936). “Finate combinatory processes: Formulation I”. Journal of Sym-
bolic Logic. 1: 103-105 (1936). (Reproducido en Davis 1965, pp. 289-291. Mis
referencias remiten a esta edición).
Obras citadas 567

Post, E. L. (1944). “Recursively enumerable sets of positive integers and their decision
problems”. Bulletin of the American Mathematical Society. 50: 284-316 (1944).
(Reproducido en Davis 1965, pp. 305-337. Mis citas remiten a esta edición).
Post, E. L. (1965). “Absolutely unsolvable problems and relatively undecidable
propositions: Account of an anticipation”. En Davis 1965, pp. 340–433.
Quine, W. V. O. (1941). “Whitehead and the rise of modern logic”. En Quine 1966,
pp. 3–36. (Publicado originalmente en P. A. Schilpp, ed. The Philosophy of
Alfred North Whitehead, Evanston: Northwestern University Press).
Quine, W. V. O. (1955). “On Frege’s way out”. En Quine 1966, pp. 146-158. (Pu-
blicado originalmente en Mind, 64: 145-159).
Quine, W. V. O. (1966). Selected Logic Papers. New York: Random House.
Ramsey, F. P. (1925). “The foundations of mathematics”. En Ramsey 1931, pp. 1–
61. (Publicado originalmente en Proceedings of the London Mathematical
Society (2) 25: 338–384).
Ramsey, F. P. (1931). The Foundations of Mathematics and other Logical Essays.
London: Routledge & Kegan Paul.
Rang, B. y W. Thomas (1980). “Zermelo’s discovery of the ‘Russell paradox’”.
Historia Mathematica. 8: 15–22.
Resnik, M. D. (1980). Frege and the Philosophy of Mathematics. Ithaca: Cornell
University Press.
Richard, J. (1905). “Les principes des mathématiques et le problème des ensembles”.
Revue générale des sciences pures et appliquées. 16: 541 (1905). (Traducción
inglesa en van Heijenoort 1967, pp. 142–144).
Ritter, J. y K. Gründer, eds. (HWB). Historisches Wörterbuch der Philosophie.
Darmstadt: Wissenschaftliche Buchgesellschaft, 1971– .
Robinson, A. (1961). “Non-standard analysis”. K. Nederlandse Akademie van
Wetenschappen. Proceedings. 64: 432-440.
Robinson, A. (1966). Non-standard Analysis. Amsterdam: North-Holland Publishing
Co.
Rodríguez-Consuegra, F. A. (1989). “Russell’s Theory of Types, 1901-1910: Its
complex origins in the unpublished manuscripts”. History and Philosophy of
Logic. 10: 131-164.
Rodríguez-Consuegra, F. A. (1991). The Mathematical Philosophy of Bertrand
Russell: Origins and Development. Basel: Birkhäuser.
Rogers Jr., H. (1967). Theory of Recursive Functions and Effective Computability.
New York: McGraw-Hill.
Obras citadas 568

Rosser, J. B. (1936). “Extensions of some theorems of Gödel and Church”. Journal


of Symbolic Logic. 1: 87-91 (1936). (Reproducido en Davis 1965, pp. 231-
235. Mis citas remiten a esta edición).
Russell, B. (EA). Essays in Analysis. Edited by D. Lackey. London: Allen & Unwin,
1973.
Russell, B. (LK). Logic and Knowledge. Essays 1901-1950. Edited by R. C. Marsh.
London: Allen and Unwin.
Russell, B. (1903). The Principles of Mathematics. Volume I. Cambridge: Cambridge
University Press.
Russell, B. (1906). “On some difficulties in the theory of transfinite numbers and
order types”. London Mathematical Society Proceedings. 4: 29–53. (Reprodu-
cido en Russell EA, pp. 135-164).
Russell, B. (1906a). “On the substitutional theory of classes and relations”. En Russell
EA, pp. 165-189. (Publicado postumamente en 1973).
Russell, B. (1906b). “Les paradoxes de la logique”. Revue de métaphysique et de
morale. 14: 627–650 (1906). (El original inglés es Russell 1906c).
Russell, B. (1906c). “On ‘insolubilia’ and their solution by symbolic logic”. En
Russell EA, pp. 190–214. (Este es el original inglés de Russell 1906b, publi-
cado postumamente en 1973).
Russell, B. (1908). “Mathematical logic as based on the theory of types”. American
Journal of Mathematics. 30: 222-262.
Russell, B. (1910). “La théorie des types logiques”. Revue de métaphysique et de
morale. 18: 263-301. (El original inglés, titulado “The theory of logical types”,
se publicó postumamente en Russell EA, pp. 215-252).
Russell, B. (1919). Introduction to Mathematical Philosophy. London: Allen & Unwin.
Russell, B. (1945). Introducción a la filosofía matemática. Traducción de J.B.
Molinari. Anotada y revisada por F. D. Jaime. Buenos Aires: Losada.
Russell, B. (1937). The Principles of Mathematics. Second edition. London: Allen
& Unwin.
Schilpp, P. A. (1944). The Philosophy of Bertrand Russell. Evanston IL: Northwestern
University Press. (Library of Living Philosophers).
Scholz, H. (1930). “Die Axiomatik der Alten”. Blätter für deutsche Philosophie. 4:
259–278.
Schröder, E. (VAL). Vorlesungen über die Algebra der Logik (Exakte Logik). New
York: Chelsea, 1966. 3 vols. (Reimpresión corregida de la edición original,
publicada en Leipzig, 1890–1905).
Obras citadas 569

Schröder, E. (1877). Der Operationskreis des Logikkalkuls. Leipzig: Teubner.


(Reimpresión inalterada: Darmstadt, Wissenschaftliche Buchgesellschaft, 1966).
Schütte, K. (1951). “Beweistheoretische Erfassung der unendlichen Induktion in der
Zahlentheorie”. Mathematische Annalen. 122: 369–389.
Schütte, K. (1960). Beweistheorie. Berlin: Springer.
Shanker, S. G., ed. (1989). Gödel’s Theorem in Focus. London: Routledge.
Shoenfield, J. R. (1967). Mathematical Logic. Reading, MA: Addison-Wesley.
Skolem, T. (SWL). Selected Works in Logic. Edited by J. E. Fenstad. Oslo:
Universitetsforlaget, 1970.
Skolem, T. (1920). “Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit
und Beweisbarkeit mathematischen Sätze nebst einem Theorem über dichte
Mengen”. En Skolem SWL, pp. 103–136. (Publicado originalmente en
Videnskabsakademiet i Kristiania, Skrifter, I, Nº 4, pp. 1-36).
Skolem, T. (1922). “Einige Bemerkungen zur axiomatischen Begründung der
Mengenlehre”. En Skolem SWL, pp. 137–152. (Publicado originalmente en
Proceedings of the 5th Scandinavian Math. Congress, Helsinki, 1922, pp. 217–
232).
Skolem, T. (1923). “Begründung der elementären Arithmetik durch die rekurrierende
Denkweise ohne Anwendung scheinbarer Veränderlichen mit unendlichem
Ausdehnungsbereich”. En Skolem SWL, pp. 153–188. (Publicado originalmente
en Videnskabsakademiet i Kristiania, Skrifter, I, Nº 6).
Skolem, T. (1930). “Einige Bemerkungen zu der Abhandlung von E. Zermelo: “Über
die Definitheit in der Axiomatik”.”. En Skolem SWL, pp. 275–279. (Publica-
do originalmente en Fundamenta Mathematicae, 15: 337–341 (1930)).
Smorynski, C. (1977). “The incompleteness theorems”. En J. Barwise, ed. Handbook
of mathematical logic. Amsterdam: North-Holland Publishing Co., 1977. Pp.
821-865.
Smorynski, C. (1985). Self-Reference and Modal Logic. New York: Springer Verlag.
Smullyan, R. M. (1992). Gödel’s Incompleteness Theorems. New York: Oxford
University Press. xiii + 139 pp.
Soare, R. I. (1987). Recursively Enumerable Degrees: A Study of Computable
Functions and Computably Generated Sets. Berlin: Springer.
Sobociñski, B. (1949). “L’analyse de l’antinomie russellienne para Leßniewski”.
Methodos. 1: 94-107, 220-228, 308-316.
Takeuti, G. (1975). Proof Theory. Amsterdam: North-Holland.
Tiles, M. (1991). Mathematics and the Image of Reason. London: Routledge.
Obras citadas 570

Torretti, R. (1978). Philosophy of Geometry from Riemann to Poincaré. Dordrecht:


D. Reidel.
Torretti, R. (1993). “El método axiomático”. En La ciencia: estructura y desarrollo.
Edición de C. U. Moulines. Madrid: Trotta. Pp. 89-110. (Enciclopedia Ibero-
americana de Filosofía, vol. 4).
Turing, A. M. (1936). “On computable numbers, with an application to the
Entscheidungsproblem”. London Mathematical Society Proceedings. 42: 230-
265.. (Reproducido en Davis 1965, pp. 116-151).
Turing, A. M. (1937). “On computable numbers, with an application to the
Entscheidungsproblem: A correction”. London Mathematical Society
Proceedings. 43: 544-546 (1937). (Reproducido en Davis 1965, pp. 152-154).
van Dalen, D. (1990). “The War of the Frogs and the Mice, or the Crisis of the
Mathematische Annalen”. Mathematical Intelligencer. 12, 4: 17-31.
van Heijenoort, J. (1967). From Frege to Gödel: A Source Book in Mathematical
Logic, 1879-1931. Cambridge MA: Harvard University Press.
van Stigt, W. P. (1979). “The rejected parts of Brouwer’s dissertation”. Historia
Mathematica. 6: 385-404.
Wang, Hao (1987). Reflections on Kurt Gödel. Cambridge MA: The MIT Press.
Webb, J. C. (1980). Mechanism, Mentalism, and Metamathematics: An Essay on
Finitism. Dordrecht: D. Reidel.
Weil, A. (1937). Sur les espaces à structure uniforme et sur la topologie générale.
Paris: Hermann.
Weyl, H. (GA). Gesammelte Abhandlungen. Herausgegeben von K. Chandrasekharan.
Berlin: Springer, 1968. 4 vols.
Weyl, H. (1910). “Über die Definitionen der mathematischen Grundbegriffe”. En
Weyl GA, vol. I, pp. 298–304. (Publicado originalmente en Mathematisch-
naturwissenschaftliche Blätter, 7: 93–95, 109–113 (1910)).
Weyl, H. (1918). Das Kontinuum. Kritische Untersuchungen über die Grundlagen
der Analysis. New York: Chelsea, 1973. (Reimpresión de la obra aparecida
originalmente en Leipzig en 1918).
Weyl, H. (1921). “Über die neue Grundlagenkrise der Mathematik”. Mathematische
Zeitschrift. 10: 39–79.
Whitehead, A. N. y B. Russell (1910-13). Principia Mathematica. Cambridge:
Cambridge University Press. 3 vols.
Wittgenstein, L. (PB). Philosophische Bemerkungen. Aus dem Nachlaß herausgegeben
von R. Rhees. Frankfurt/M: Suhrkamp, 1964.
Obras citadas 571

Wittgenstein, L. (1922). Tractatus Logico-Philosophicus. With a facing English


translation by C. K. Ogden. London: Routledge & Kegan Paul.
Wittgenstein, L. (1956). Bemerkungen über die Grundlagen der Mathematik.
Herausgegeben und bearbeitet von G. H. von Wright, R. Rhees and G. E. M.
Anscombe. Oxford: Basil Blackwell. (With a facing English translation by G.
E. M. Anscombe).
Wittgenstein, L. (1974). Letters to Russell, Keynes and Moore. Edited with an
introduction by G. H. von Wright, Ithaca: Cornell University Press.
Wright, C. (1983). Frege’s Conception of Numbers as Objects. Aberdeen: Aberdeen
University Press.
Zermelo, E. (1904). “Beweis, daß jede Menge wohlgeordnet werden kann”.
Mathematische Annalen. 59: 514-516.
Zermelo, E. (1908). “Neuer Beweis für die Möglichkeit einer Wohlordnung”.
Mathematische Annalen. 65: 514-535.
Zermelo, E. (1908a). “Untersuchungen über die Grundlagen der Mengenlehre I”.
Mathematische Annalen. 65: 261-281.
Zermelo, E. (1929). “Über den Begriff der Definitheit in der Axiomatik”. Funda-
menta Mathematicae. 14: 339–344.
Zermelo, E. (1930). “Über Grenzzahlen und Mengenbereiche”. Fundamenta Mathe-
maticae. 16: 29–47.
ABREVIATURAS Y SÍMBOLOS

Abreviaturas Sistemas numéricos Teoría de conjuntos


AS 64 ˆ 289, 331 ∈ 2
BS 131 Œ 543 ∉ niega ∈
CP1 480, 481 Â 30, 544 {a,b,c} 2
CP1= 480, 491 Ç 544 {x: Kx} 4
CP2= 480, 500 ⊆ 2
Dƒ 404 Símbolos lógicos ⊂ 2
DP 394 ∅ 3
¬ 481
fbf 369 PK 3
∧ 490
HGC 41 ∩ 543
∨ 490
inf U 549 ∪ 543
→ 481
Mƒ 389 A\B 543
↔ 490
Mƒ 405 A′ 543
∀ 481
max U 548 ƒ: G Æ H 541
∃ 490
min U 548 ƒ: x Å ƒ(x) 541
Q 517
MT 387 ƒ-1 541
" 520
MTO 384 ƒ|G 541
& 520
MTR 385 g∑ƒ 541
Q 520
NGB 80 ω 31
ϕξ/ζ 485
SBL 428 ε0 319, 422, 443
ϕ(ξ/ζ) 485
SBM 428 [α] 32
µ 487
sup U 549 [k] 46
∂ 255, 323, 495
TIC 155 α<β 32
Î 323
TD 532 x<y 39
TDI 504 x≤y 39
ZF 80, 87 ℵ, ℵ0, ℵ1 39
ZFC 87 |K| 41
ᑾᑿ 42
χΗ 43

573
Símbolos asociados a determinados autores

CHURCH GÖDEL PEANO

λx[M] 369 ⁄ 326, 327 ç 146


{F}(X) 369 xΠ 327
SFGH| 370 ƒ0, ƒk0 326, 327 RUSSELL

G conv H 370 #[ϕ] 329,346 ~ 183, 324


ⱷ 333 ⊃ 242n., 255
[α;n] 324 ϕΩ 192
FREGE †[n] 325 φ!x 198
⁄ 133 ✥ 334 Λ 200
≡ 133, 255 µzΦ(z) 334, 365
≈ 169 pn 336 SHEFFER

§F(e) 509-510 n Gl x 337


p|q 208
l(x) 337
GENTZEN Bw(x) 340 SKOLEM
xBy 341
θ 411 (∀x≤a) 215
Bew(x) 341
τ′, τ′′, τ′′′ 423 (∃x≤a) 215
Bwκ(x) 347
➛ 424 aŸb 216n.
xBκy 347
ᑠ(ᒑ/ᒕ) 425 a⁄b 216n.
Bewκ(x) 347
ⱅ 443 µxU(x) 217
19 )
Sb(y Z(y) 346
17 Gen r 346 VON NEUMANN

Wid(κ) 355 τ 236


HILBERT
ZERMELO

ε 226-27 © 471
a‹ 300
A|B 300

574
ÍNDICE DE PERSONAS Y CONCEPTOS

La numeración de las páginas indicadas corresponde a la edición impresa en 1998


y en algunos casos se aparta —aunque solo mínimamente— del presente pdf.
El índice no cubre la lista de obras citadas. En algunas partidas correspondientes
a conceptos figuran números de página seguidos de la letra n. Esta letra indica que
en una nota al pie de la página mencionada hay una referencia importante al con-
cepto respectivo. La letra n se omite cuando el concepto pertinente se menciona en
el texto principal de la página, aunque además se refiera a él una nota al pie de la
misma. En las partidas correspondientes a nombres propios normalmente no se in-
dica la región de la página en que aparece el nombre respectivo.
Imitando al Diccionario de María Moliner, el orden alfabético seguido aquí pres-
cinde de la curiosa convención castellana, que trata la combinación ‘ch’ como una
sola letra, aunque a todas luces son dos; por ende, ‘ch’ va entre ‘ce’ y ‘ci’.

a priori (Hilbert), 308 ámbito de significación, 192, 194, 196


Aanderaa, Stål, 259 analítico/sintético, 130n., 177n.
abeliano, grupo, 546 Andrews, Peter, 259
abierto, 545 antinomia, 188n.; véase también
Ackermann, Wilhelm, 219-31, 232, paradoja
234, 236, 238, 244, 274, 276, 283, antiprenexa: véase fórmula antiprenexa
292, 306, 317, 322, 324, 335, 361, aplicación, 42, 118, 152-53, 377n.,
380, 381, 418, 451; véase también 541-42; biyectiva, 541; compuesta,
función de Ackermann 541; continua, 546; epiyectiva, 541;
acotado: véase cota, cuantificación inyectiva, 541; véase también
acotada; maximización acotada; función
minimización acotada argumento, 94, 541
adición, 213-14, 507 Aristóteles, 24, 61, 62, 66, 71, 72, 191
alcance: de aplicación, 541; de símbo- aritmética: de segundo orden, 174n.;
los lógicos, 483, 501-502 finita o primitivo-recursiva, 212-18,
aleph, 39 232, 450; sustantiva, 312n.
alfabeto, 481, 492, 500 transfinita, 41-43; véase también
álgebra de Boole, 3, 4, 542-43 proposición aritmética, relación
algoritmo, 247, 365, 376, 390, 391, aritmética
494; para calcular la validez, 493, aritmética, consistencia de la, 115-16,
494 318;
alianza (Bund) de fórmulas en deriva- aritmetización de sintaxis, 322-23, 329-
ción, 434 30, 335-41
altura de una fórmula (Herbrand), 263; Arquímedes, 99, 291
de un secuente (Gentzen), 430 Ash, Marshall, 15
ambigüedad característica de funciones, asociativa, operación, 547
192

575
Índice de personas y conceptos 576

autológico: véase heterológico/autoló- Axiomas de Post para el cálculo


gico proposicional, 255
axioma, axiomatización, 71, 72, 73, 74, Axiomas de von Neumann para la
115, 233-34, 295-97, 302, 304, 305, teoría de conjuntos, 95-98, 352
494-95; razón para aceptar axiomas Axiomas de Zermelo para la teoría de
es empírico-inductiva, según White- conjuntos, 76-79, 186n., 471-72, 475
head y Russell, 207 Axiomas de Zermelo-Fraenkel (ZF)
Axioma de Completud Lineal (Hilbert), para la teoría de conjuntos, 80, 87,
99n., 291n. 174, 352, 455
Axioma de Determinación, 471 axiomas lógicos: (Frege), 141-42, 502-
Axioma de Fundación, 102 503; (Gentzen), 497; (Gödel), 275,
Axioma de las Paralelas (Hilbert), 74; 531-34; (Post) 255; independencia y
véase también Postulado V de lógicas alternativas, 294
Euclides
Axioma de Limitación, 99-100 Bacon, Francis, 60
Axioma de Reducibilidad, 93, 204-209, Baker, G. P. , 138
228, 322n., 327; es teorema en Baldwin, James M., 191
sistema de von Neumann, 95-96 Becker, Oskar, 118
Axioma de Reemplazo, 87-90, 91, 96, Behmann, Heinrich, 250
103, 475 Bernays, Paul, 80, 127, 250, 258, 259,
Axioma de Regularidad, 103 268, 274, 278, 287, 288, 293, 304,
Axioma de Selección, 55, 64, 66, 67, 317, 356, 421, 450, 522
68, 79, 83, 87, 92, 96, 102, 103, Bernstein, Felix, 26, 64
154, 181, 202, 232, 287, 288, 455, Berry, G. G., 189; véase también
472-75; descrito como “principio paradoja de Berry
lógico”, 66 Birkhoff, Garrett, 90
Axioma de Separación, 78, 83, 96, Bishop, Errett, xii, 204, 377
103, 471 biyección, 541
Axioma del Infinito, 77, 96, 103, 109, Black, Max, 179
201-202, 202n., 454, 472; “demos- Bolzano, Bernhard, 8
trado” por Dedekind, 154 n. 12 Boole, George, 4-5, 66, 129, 145;
Axiomas de Ackermann para la véase también álgebra de Boole
matemática clásica, 221-22, 225-26 Boolos, George, 154, 174, 410, 414,
axiomas de continuidad, 291 419, 454
axiomas de la teoría de conjuntos, 52, Borel, Émile, 66
76-79, 80, 93-94; véase también Bourbaki, Nicolas, 318
Axiomas de von Neumann, Axiomas Brouwer, Luitzen Egbertus Jan, xi, 25,
de Zermelo, Axiomas de Zermelo- 27, 93, 116, 117, 118, 119, 121,
Fraenkel 124, 125, 204, 207, 377, 535-540
Axiomas de Peano para la aritmética Büchi, J. R., 419
elemental, 146, 149-51, 156, 174, buen orden, 34; véase también conjunto
236, 302-303, 309n., 327, 352, 354, bien ordenado; Teorema del Buen
450, 451 Orden
Índice de personas y conceptos 577

Burali-Forti, Cesare, 53, 465-68; véase categórica (teoría), 76, 98, 101
también paradoja de Burali-Forti Cauchy, Augustin-Louis, 61, 62, 69,
310; véase también secuencia de
cadena (Kette), 154 Cauchy
calculable, 321n., 375-76, 382; efecti- cerrado lógicamente, 84
vamente, 373, 375, 382n.; “en César, Cayo Julio, 166
principio”, 359n.; véase también Chang, C. C., 483
computable Christoffel, Elwin Bruno, 297, 298
calculista (computer), 382, 389-92 Church, Alonzo, 196n., 199, 259, 271,
cálculo lógico, 312n., 376, 527-28; 317, 354, 359, 360, 365, 369-81,
compacto, 290; completo, 257-58, 382, 417, 418, 421, 494; véase
273, 496; correcto, 258, 495, 528; también Teorema de Church, Tesis
efectivo, 243n., 247, 429; véase de Church
también cálculo predicativo; cálculo Chwistek, Leon, 205
proposicional; sistema formal Cicerón, Marco Tulio, 191
cálculo predicativo, 480-502 círculo vicioso, principio del, 187, 190,
cálculo predicativo de primer orden, 192, 194, 196, 205, 208n., 209
481-91; con identidad, 491-93; clase, 2, 5, 41, 49, 50, 71, 95, 179,
definición, 274n.; es completo, 273- 182, 186, 200, 206; nula, 200;
94; es indecidible, 418-19 perfectamente ordenada, 465;
cálculo predicativo de segundo orden, Principia Mathematica neutral ante
500-501 la existencia de clases, 187, 200n.,
cálculo predicativo monádico, 522; es 208; propia, 95, 183, 184n.
decidible, 522-24 clase-como-muchos/clase-como-uno,
cálculo proposicional, 253, 255-58, 179, 179n.-181n.
482n.; es completo, 525-27; es clases, teoría sin, 183, 184, 185-87,
decidible, 256-57, 494 200n.; relación con “teoría susti-
Calímaco, 191 tucional de las clases”, 184n.
Cantor, Georg, xi, xii, 7-70, 75, 79, 90, clausura (topología), 546; universal (de
96, 102, 115, 117, 118, 119, 151, una fórmula), 484
296, 297, 299, 422, 441, 442, 443, Cocchiarella, Nino, 179
459-64, 465, 467, 468, 477, 505, codominio, 153n., 541
535; véase también paradoja de Coffa, J. Alberto, 177
Cantor; paraíso de Cantor; principios Cohen, Paul J., xi, 455, 475
generadores de Cantor; Teorema de compacto, 290
Cantor complemento, 2
cardinal, 33, 39; definición de von completo en el sentido de Post, 258, 344
Neumann, 92; de la clase K, 200; completud (Vollständigkeit), xiii, 99n.,
inaccesible, 105, 106, 110 126n., 296; véase también cálculo
cardinalidad, véase numerosidad completo
Carnap, Rudolf, 125 componente (de una formula), 488
Cartan, Henri, 377 computable, 321, 359, 375-76, 382
Índice de personas y conceptos 578

computable: véase también calculable; constructiva, demostración, 257


funciones recursivas; números contenido (Frege), 131, 134
computables continua: véase aplicación continua
computable según Turing: véase T- continuo: más numeroso que los
computable enteros, 22, 23; véase también
computadora, 90, 390n., 416; véase Hipótesis del Continuo
también calculista contradicción, 300
concepto, 510; véase también extensión convergencia uniforme, 15
de concepto conversión (Church), 370
conclusión, 495 Copi, Irving M., 205
conectivo principal de fórmula, 430 correcto/incorrecto, 220, 235, 300;
conectivos, 424 véase también cálculo correcto;
conjunción, 327, 490 verdadero/falso
conjunto (Menge), 1, 7-11, 71, 93, 94, corte, 425-26; propio, 434; véase
110, 152, 179, 182, 186, 237, 303n. también Teorema del Corte de
(véase también axiomas de la teoría Gentzen
de conjuntos); acotado, 544, 548; cota: inferior, 548; superior, 548; véase
bien definido, 9, 10, 11, bien también ínfimo, supremo
ordenado 34, 35, 459-63 (véase Couturat, Louis, 68
también buen orden, segmento); cuantificación, 309; acotada, 215;
derivado, 19, 31; potencia, 78, 96, universal, 138
471; unitario, 3, 19, 152; vacío, 3, cuantificador, 301, 327; existencial,
4, 10, 20, 77, 103, 152 (véase 490; universal, 483, 512n.; véase
también clase nula) también cuantificación
conjuntos similares, 45 cubrimiento (Belegung), en el sentido
conmutativa, operación, 547 de Cantor, 42
consecuencia lógica, 487 cuerda de signos, 481n.; véase también
consistencia (Widerspruchslosigkeit), fila
consistente, xiii, 80, 116n., 126, cuerpo, 543-45; arquimédico, 115, 202,
235, 241, 292n., 296, 297, 305, 344, 296, 544; completo, 544; ordenado,
350. 429-30; absoluta y relativa, 17, 296; véase también números
116; como criterio de existencia, complejos, números racionales,
118-19, 293; criterio de (Acker- números reales
mann), 221; prueba directa, 302;
según Frege, sólo puede demostrarse d’Alembert, Jean Le Rond, 8, 13
exhibiendo un ejemplo, 122; ω- Dauben, Joseph, 15, 25, 51, 60, 61
consistencia, 344, 350; véase Davis, Martin, 259, 361, 381, 410
también aritmética, consistencia de De Morgan, leyes de, 543
consistente, pluralidad (o conjunto): debilitamiento (Verdünnung), 426
véase pluralidad consistente decidibilidad, 306; véase también
constante, 482, 500 decidible, decisión, Entscheidungs-
construccionismo, 82 problem, indecidibilidad
Índice de personas y conceptos 579

decidible: en sentido de Gödel (Ent- diferencia, 215


scheidungsdefinit), 250n., 342; v- dimensión: invariante bajo biyecciones
decidible (Entscheidbar), 522-24 bicontinuas, 27, 535
decisión (Entscheidung), 234, 239, 418; diofántica, ecuación, 270n.
diversos conceptos de, 250, 250n.; Diógenes Laercio, 191
procedimiento de (Entscheidungs- Dirichlet, Peter Lejeune, 8, 13, 14
verfahren), 248, 494; véase también distributiva, operación, 547
Entscheidungsproblem; indecidibilidad disyunción, 490
Dedekind, Richard, xi, xii, 4, 10, 25, divisible, 215
27, 34, 51, 54, 56, 74, 115, 117, división, 215
145, 150, 151-58, 160, 161, 163, Dodds, E. R., 165
166, 167, 200, 203, 214, 297, 299, dominio, 94, 486; de una aplicación,
305, 307, 468, 476, 477, 478, 504- 153, 541; normal (Zermelo), 103,
509 106-109; unitario (Zermelo)
deducción natural, 423, 496-99 Dreben, Burton, 249, 259, 287
deducibilidad, 250, 495; no equiparable du Bois-Reymond, Paul , 43, 505
a verdad, 325; véase también duo-unidad (two-oneness, Zwei-
sintáctico/semántico einigkeit—Brouwer), 536
definición: implícita, 73-74; por
inducción transfinita, 216, 476-79; ecuación numérica (Zahlgleichung),
recursiva, 476, 480-81, 504 251n.; detenible (Haltgleichung),
definido, bien (definit, wohldefiniert), 252; huidiza (Fluchtgleichung), 252;
9, 78, 81-87 idéntica, 252; véase también diofán-
Demopoulos, William, 174, 455 tica, ecuación
demostrable, formula; véase fórmula elevación de tipo (Gödel), 329
demostrable Eneström, G., 61
denotación (Bedeutung), 135, 166 entorno, 545
Denton, John, 259 Entscheidungsproblem (problema de la
derivación (Herleitung—Gentzen), 421, decisión), 248-71, 292, 341, 353,
499; árbol finito de secuentes, 428; 358n., 360, 377, 380, 418-19
fatal, 422, 430; trozo final, 431 enumerable recursivamente, 341n., 371-
Desargues, Girard, 313 72
Descartes, René, 7, 61, 99 enumerador (Anzahl), 32, 33
descripción definida (Russell), 184-85, enunciados finitos, 311, 314, 315
213n. enunciados ideales, 311-316
designador distributivo, 56 epiyección, 541
Detlefsen, Michael, 319, 358 epsilóntica, 310
diagonal, método/argumento; véase equinumerosidad: de algebraicos con
diagonalización enteros, 22-23; de segmento recto
diagonalización, 43, 49, 325, 379n., con cuadrado, 22, 25-26
505n., 528 equinumeroso, 21, 168, 169
diagrama, 393; parcial (DP), 394
Índice de personas y conceptos 580

equivalencia, 17, 169, 327, 336n., 490, formal o formalista, razonamiento


545, 549; clases de, 169, 545; (opuesto a razonamiento sustantivo),
deductiva, 278; lógica, 278, 487 124n., 254; véase también sistema
escepticismo, argumento contra, 198n. formal
escritura conceptual (Begriffschrift), 50, formalismo, 306, 307; véase también
131-42, 174, 493n., 509 formalización; programa de Hilbert;
escritura universal (Leibniz), 129 sustantivo
espacio: absoluto, 159, euclidiano, 73, formalización, 122, 295-97, 299, 304
74, 99n., 291n., 115, 295-96; fórmula, 232, 327, 369, 483, 492, 500;
topológico, 545-46 abierta, 484; antiprenexa, 263,
esquema, 302 267n.; atómica, 254; bien formada
esquemas de inferencias (Gentzen), (fbf), 369; cerrada, 278n., 484;
426-28, 498 deducible o demostrable, 234, 250,
estructuralismo matemático, 159, 200 275, 276, 324, 325; elemental, 254,
Etchemendy, John, 377 261, 327, 424, 483; lógica, 274n.;
Eubúlides de Mileto, 191 numérica, 220; prenexa, 197n., 263,
Euclides, 35, 71, 99, 315 267n., 516-22; prenexa de Skolem,
Eulenburg, A., 57 519, 521, 522; prenexa de seudo-
Eurípides, 165 Skolem, 519n.; principal de una
existencia de objetos matemáticos, 58- inferencia (Gentzen), 426; regular,
59, 118-19, 122, 293 263, 517; válida, 251; verdadera
exponenciación, 509 (Herbrand), 260; verdadera (Tarski),
expresar, expresable, 528 486; verifuncional, 254, 260, 482n.,
expresión, 530 488
extensión: de aplicación, 541; de Fourier, Joseph, 14
concepto, 2, 4, 41, 168, 169, 509- Fraenkel, Abraham, 76, 80, 83, 87, 88,
16; de teoría, 344 91, 93, 99, 207, 472-75
Frege, Gottlob, xi, xii, 2, 41, 50, 51,
factores primos, 329 66, 73, 80, 117, 118, 122, 125, 130-
fila, 481 43, 145, 146, 148, 151, 153, 159-75,
Filón de Megara, 138 189, 200, 213, 234, 273, 292, 295,
finitismo, 360n.; de Cantor (según M. 297, 298, 303, 305, 307, 308, 325,
Hallett), 62n.; de Hilbert, 121n., 376, 493, 494, 502-503, 509-16
123, 124, 126, 298n., 308-309, 454; Freudenthal, Hans, 159
necesidad de ampliar este punto de Fries, Jakob Friedrich, 7
vista, 127n., 421, 422, 452; véase frontera, 546
también aritmética finita; finito fugitiva, propiedad, 539-40
(finit); sustantivo (inhaltlich) función, 13, 14, 83, 88, 94, 118, 131,
finito, (finit), 127n., 219, 221, 317, 135, 136, 137, 153, 237, 476n., 510,
442, 452; véase también enunciados 542; característica, 43, 385n.; de
finitos Ackermann, 362n., 375; diagonal,
forma normal, 366, 371, 415 528; λ-definible, 369, 371, 376, 377,
Índice de personas y conceptos 581

382; numérica, 359, 387; parcial, Goldfarb, Warren, 130, 249, 259, 270
215, 359, 368; predicativa, 190n., grado: de una fórmula (Gentzen), 430;
198; proposicional, 49, 50, 86, 180, de una K-fórmula (Gödel), 279
181, 192, 196, 197, 200, 211, 212n.; grafo, 510-11, 542
total, 359, 364; veritativa, 208 Grattan-Guinness, I., 51
funcional, 220 Grelling, Kurt, 189n.
funciones computables, 359-419 Gründer, Karlfried, 454
funciones recursivas, 321, 330-34, 361- grupo, 546; abeliano, 546
68, 371, 376, 377, 377n.; cursiva guédel, 329n.
usada para nombrarlas, 336n.; “en el
sentido de Herbrand-Gödel”, 364, Hacker P. M. S., 138
415n.; en el sentido restringido de Hall, A. Rupert, 159
Gödel (1931), 331, 333; generales, Hall, Mary Boas, 159
362, 364, 382; parciales, 368; Hallett, Michael, 62
primitivas, 331-33, 331n., 361; todas Hartogs, F., 40
son T-computables, 407-10; Hausdorff, Felix, 105, 477
funciones T-computables, 365, 377n., Heijenoort, Jean van, 83, 212, 251,
382, 407; todas son recursivas, 410- 259, 287, 299
15 Helmholtz, Hermann, 297
functor, 85-86, 492, 500 Henkin, Leon, 273
Henkin, Leon, 501
Gauß, Carl G., 61, 62, 310 Herbrand, Jacques, 125, 241-46, 247,
Geach, Peter, 515 249, 250, 251, 259-71, 273, 292,
generalización irrestricta es prescindible 306, 317, 322, 360, 362, 363, 415
(Skolem), 212; véase también hereditaria, propiedad, 161, 162
cuantificación acotada Hermes, Hans, 363, 366, 405
generalización universal, 140, 276, 327 Hermite, Charles, 310
Gentzen, Gerhard, xi, 318, 319, 421- Hessenberg, G., 42
55, 496, 487, 499, 531-34 heterológico/autológico, 189n.
geometría euclidiana: véase espacio Heyting, Arendt, 125
euclidiano Hilbert, David, xi, xii, 54, 63, 71, 73,
geometría proyectiva, 313-14 74, 75, 76, 84, 99, 115-27, 129,
Gergonne, Joseph-Diez, 73 130, 145, 160, 167, 197, 211, 213,
Gillies, Donald A., 145 219, 220, 225, 226, 239, 248, 249,
Gödel, Kurt, xi, xii, 43, 80, 87, 95, 250, 273, 276, 283, 287, 288, 292,
126, 127, 142, 143, 178, 209, 211, 295-319, 322, 324, 325, 335, 354,
243, 244, 250, 251, 254, 259, 270, 380, 381, 421, 450, 451, 494, 544;
273-94, 295, 316-19, 321-58, 360, véase también problemas de Hilbert
361-68, 381, 385, 390, 415, 417, para el siglo XX; programa de
421, 423, 450, 451, 454, 455, 496, Hilbert
527, 529, 531 hilo (en derivación), 431; completo,
gödel, 329-30, 384-85, 529-30 431
Índice de personas y conceptos 582

Hipótesis del Continuo (HC), 27, 40, por Inducción; Teorema de la


44, 55, 63, 64, 115 Inducción Completa
Hipótesis Generalizada del Continuo inducción transfinita hasta el ordinal
(HGC), 40-41, 44, 106, 455 ε0, 319, 421, 449, 451n., 452
Hobson, E. W., 181, 182 inferencia, 497; figura de (Schluß-
homeomorfismo, 546 figur—Gentzen), 425; reglas de,
hueco, 510n. 220, 275-76, 426-28, 495, 498;
véase también corte; debilitamiento;
ideales, elementos, 311; véase también generalización universal; modus
enunciados ideales ponens; regla ω; reglas estructurales;
idempotente (operación), 543 reglas de eliminación e introducción;
identidad (aplicación), 153n.; (fórmula), sustitución, regla de
260, 269; (relación), 199 ínfimo (cota inferior máxima), 549
identidad, signo de, 327, 336n., 492; infinitésimos, 310
ambiguo en Principia Mathematica, infinito: absoluto, 51; actual, 24, 29,
200; no es signo lógico en cálculo 61, 62, 451, 454; definición de
de Gentzen, 424; utilizado para Dedekind, 154; impropio (Uneigent-
simbolizar equivalencia, 142n., 148 lich-unendliches), 29; limitaciones
imagen (de aplicación), 541 humanas no impiden estudiarlo,
implicación, 138n., 139, 327, 481 según Cantor, 57-58; postura de
impredicativo como sinónimo de Gentzen, 451; potencial, 24, 29,
‘transfinito’, 237: véase también 451; una manera de hablar, 311;
predicativo/impredicativo véase también punto en el infinito
inclusión, 153n. insaturada, expresión, 510n.; véase
incompleto en el sentido de Post, véase también saturado
completo interior, 546
inconsistente: véase consistencia, interpretación, 486
pluralidad inconsistente, ω-consisten- intuición: concepción hilbertiana, 308;
te crisis decimonónica, 26-27, 535
indecidibilidad, indecidible, 235; véase intuicionismo, 82, 237, 451n.
también decidibilidad, decidible, intuicionista, como sinónimo de
decisión, Entscheidungsproblem ‘sustantivo’ (q.v.), 125n., 232, 243,
independencia, 83, 305, 472, 475 244n., 247, 363n.
individuo, 193 inversa, biyección, 547
inducción matemática 150, 163, 216, inverso, elemento (en grupo), 546
217, 219, 243, 286, 298n., 309n., inyección, 541
428, 450, 474-75; forma intuitiva, irracionalidad de √2, 315n.
298n., 309n.; transfinita, 477; véase irrealizable, 487
también definición por inducción Isaacson, David, 317
transfinita; inducción transfinita isomorfismo, 546-47; canónico, 18
hasta el ordinal ε0; recursivo, modo
de pensar; Teorema de la Definición
Índice de personas y conceptos 583

Jacobi, Carl Gustav Jacob, 310 Liebmann, Otto, 160


Jaßkowski, Stanislaw ligar una variable, 483, 484
Jeffrey, Richard, 131, 410, 414 limitación del tamaño, teoría del, 183
Jevons, William Stanley, 129, 145 límite, 377n.
Johnson, Dale M., 27 Lindemann, Ferdinand, 376
Jourdain, Philip, 67, 183 Lipschitz, Rudolf, 33
lista, 530
Kalmár, L., 363 Lobachevsky, Nikolai Ivanovich, 74,
Kant, Immanuel, 7, 130, 308 116
Keisler, H. J., 483 Locke, John, 61
Kepler, Johannes, 313 lógica matemática: su problema fun-
Kleene, Stephen, 250, 331, 360, 361, damental según Herbrand, 262
365-68, 369, 372, 377, 410, 415, lógica moderna: fundadores, 130
416, 421 lógica: véase axiomas lógicos, ley
König, Dénes, 287 lógica, verdad lógica
König, Julius, 63, 64, 93, 239, 304 lógicas alternativas, 294
Korteweg, D. J., 535 logicismo, 161n., 174n., 201, 202
Kreisel, Georges, 125 longitud, 481
Kronecker, Leopold, xi, 15, 33, 117, Lorenzen, Paul, xi, xii, 204, 377
118, 212, 296, 297, 298, 310 Lotze, Rudolf Hermann, 61
Löwenheim, Leopold, 98, 251-53, 269,
λ-cálculo, 369-71, 380; véase también 270, 273, 522, 523; véase también
función λ-definible Teorema de Löwenheim-Skolem
Lackey, D., 186, 187
Lambert, Johann Heinrich, 129 MacColl, Hugh,145
Largeault, Jean, 540 Maddy, Penelope, 21
Lebesgue, Henri, 66, 98, 232 Mancosu, Paolo, 540
Legendre, Adrien-Marie, 376 Manin, Y. I., 271
Leibniz, Gottfried Wilhelm, 61, 129, mantisa, 386n.
159, 310, 493 máquina de Turing, 360, 383-92;
lenguaje (en el sentido de Chang y circular, 386, 418; con oráculo,
Keisler), 483n. 384n.; para computar números
lenguaje natural, 56 reales, 382, 385-86; universal, 383,
León XIII, 61 386, 389, 416-17
Leßniewski, Stanislaw, 515 matemática: éxito en la ciencia natural,
Levy, Azriel, 26, 42, 92 310; libertad es su esencia, 60; no
Lewis, Clarence Irving, 129, 130, 254 admite medias verdades, 120; todos
Lewis, David, 4, 61 sus problemas son solubles, 249n.,
léxico, 482-83, 492 293, 306;
ley lógica, 141 matemática clásica, 232, 237
libertad del matemático, 58-60 matemática y progreso científico, 120n.
Liebmann, Heinrich, 160 Mates, Benson, 131
Índice de personas y conceptos 584

Mathematische Annalen: conflicto entre neutro, elemento (en grupo), 546


Hilbert y Brouwer, 119n. Newton, Isaac, 60, 159, 310
Matijasévic, Yu. V., 271 norma (Hobson), 181, 182
matriz, 197, 198, 261, 518; de control, numeral (Zahlzeichen), 164, 220, 229,
266-67, 270n.; véase también 230, 231, 287, 298, 308, 315, 316,
reducida de una matriz 317, 326, 328n., 343, 370
maximización acotada, 411 número: definición de Frege, 169;
máximo, 548 definición de Hilbert, 307; finito
Mendelson, Elliott, 103, 377 (Frege), 171-72; límite (Zermelo),
Menger, Karl, 351 104, 110
Méray, Charles, 115 números: algebraicos, 167n.; cardinales,
Meschkowski, Herbert, 93 véase cardinal; complejos, 544-45;
metamatemática, 124, 219, 306, 315; computables, 382; de Gödel, 329n.
más amplia que teoría de la prueba (véase también gödel); de la
454-55 primera, segunda y tercera clase, 36-
minimización acotada, 217, 334, 365, 38; naturales, 146, 150-51, 156,
411 157-58, 169-74, 209, 213, 307, 509;
mínimo, 548 ordinales, véase ordinales; raciona-
Mirimanoff, Dimitry, 87, 91 les, 16, 543; reales, 16-19, 98, 115,
Mittelstraß, Jürgen, 70 121, 202, 543
modelo, 84, 472 numerosidad, 21, 39, 463-64, 536n.
modus ponens, 139, 220, 241, 267n., numerosidades incomparables, 40
275, 327, 328, 495
monomórfica (teoría), véase categórica objeto y función, 136
Moore, E. H., 377 Ockam, William, 191
Moore, G. H., 54, 66, 79, 88, 93 operación algebraica, 547
Morgenstern, Oskar, 90 operador τ (von Neumann), 236-37
Mosterín, Jesús, 273, 331, 340 operadores ε y π (Hilbert), 226-28, 236
multiplicación, 508 oración, 327
orden, 547-48; bueno, véase buen
Nagel, Ernest, 159 orden; ciclico, 45; lineal, 33, 459,
naturaleza: equiparada por Cantor con 548; parcial, 548; total, 548; tipo de,
“lo posible”, 60 45, 90, 102, 536
negación, 481; reglas de, 498; simbo- ordinal ε0, 319, 422n., 443
lismo hilbertiano, 275n. ordinales (Ordnungszahlen), 32, 45-47,
Nelson, Edward, 359, 360 90, 102, 449, 467, 468; clases de, 36-
Nelson, Leonard, 189 39; definidos por von Neumann, 91-
Neumann, John von, xi, 32, 56, 76, 80, 92, 102; de Burali-Forti, 465-68; de
88, 90-101, 102, 104, 107, 124-26, Gentzen, 441-43, 448n., 449, 453;
183, 184, 211, 228, 232-40, 241, están bien ordenados, 34; ordinal
242, 244, 248, 253, 304, 306, 317, límite, 37; ordinal sucesor, 37
322, 416, 475, 476-79 Orígenes, 57
Índice de personas y conceptos 585

π es un número transcendental, 376 321, 344, 381, 494, 524-26


palote (stroke) de Sheffer, 208n. Postulado de Arquímedes, 99n., 291n.,
paradoja de Berry, 189, 198, 199, 209; 305n.
de Burali-Forti, 51, 53, 68, 107, Postulado V de Euclides, 35; véase
179, 181, 188, 194, 199, 209; de también Axioma de las Paralelas
Cantor, 179, 181. 194, 209; de postulados matemáticos: cómo justificar
Grelling, 189n., 199, 205n., 210; de su adopción (Zermelo), 67-68; razón
Richard, 188-89, 199, 205n., 209, para aceptarlos es empírico-inductiva
210, 325; de Russell, 50, 51, 68, 71, (Whitehead y Russell), 207
79, 87, 143n., 161, 174, 177, 179, potencia (Mächtigkeit), 21, 536n.;
189, 194, 199, 205, 209, 325, 512- véase también conjunto potencia,
15; del mentiroso, 191n., 198, 209, numerosidad
325; russelliana del predicado, 192 pr-recursiva, 333; véase también
paradojas, 79, 80, 110-11, 187, 188, funciones recursivas primitivas
191; sintácticas y semánticas, 210 pre-imagen (de aplicación), 541
paraíso de Cantor, xii, 311n., 319, 454- predicado, 86, 482, 493, 500; monádi-
55 co, 482; n-ádico, 482; poliádico, 482
paréntesis, omisión de, 502 predicativo/impredicativo, 69-70, 182,
Parménides de Elea, 487 190; véase también función predica-
parte (subconjunto), 2 tiva
parte propia, 2 prefijo, 518
partición, 545, 549 premisas, 495; iniciales de esquema, 433
Pascal, Blaise, 313 prenexa: véase fórmula prenexa
Pasch, Moritz, 72, 73, 295, 313 primitivo-recursiva: véase aritmética
pasigrafía, 50, 188n. primitivo-recursiva, funciones
Peano, Giuseppe, xi, xii, 50, 68, 71, recursivas primitivas
80, 145-51, 160, 167, 204, 210, 213, primitivos (términos), 71, 72, 73, 75,
450, 465; véase también Axiomas de 149
Peano principios generadores de Cantor, 36-
Peirce, Charles Sanders, 129, 130, 145, 38, 46
191, 494 problema de la detención (halting
Péter, Rosza, 331 problem), 387; insoluble, 417-18
Platón, 60 problemas de Hilbert para el siglo XX:
pluralidad: consistente (conjunto), 52, primero, 115; segundo, 115-16;
299n.; inconsistente, 51, 52, 182, 299 décimo, 271
Poincaré, Henri, xi, 68, 69, 70, 187-90, producto cartesiano, 549
191, 308, 309, 310 producto de grupo, 546
Pollack, Seymour, 90 programa de Hilbert, xii, 123-27, 247,
Pollard, Stephen, 1 295-319, 344, 345, 354, 357n., 422,
Poncelet, Jean-Victor, 313 452n.
posible, 60, 308 programa (máquina de Turing), 384;
Post, Emil, 248, 253-59, 260, 261, 274, codificación, 413
Índice de personas y conceptos 586

proposición (Herbrand), 260n. también equivalencia; identidad


proposición aritmética, 352-53 relaciones recursivas, 330-34, 341-43;
proposición elemental, 198 redonda usada para nombrarlas,
prueba, 126, 323, 495, 499; véase 336n.
también teoría de la prueba Resnik, Michael, 160, 515
punto: de acumulación, 545; en el restricción (de aplicación), 541
infinito, 313; fronterizo, 546; Riemann, Bernhard, 7, 15, 16, 98
interior, 546; límite, 19 Ritter, Joachim, 454
Robinson, Abraham, 377
Quine, Willard Van Orman, 178, 515 Rodríguez Consuegra, Francisco, xiii,
177, 178, 179, 191
Ramsey, Frank P., 178, 202, 203, 209, Rogers Jr., Hartley, 454
210 Rosser, J. B., 345, 347, 361, 372
Rang, B., 51 Russell, Bertrand, xi, xii, 43, 49, 50,
rango de un conjunto, 89 51, 68, 69, 93, 122, 125, 126, 130,
reales: véase números reales 143, 177-210, 211, 212, 213, 215,
realidad inmanente de los números, 59, 234, 247, 248, 249, 253, 254, 260,
60, 119 273, 304, 305, 308, 328, 376, 496,
realidad trascendente de los números, 512, 515, 518; véase también
59, 60 paradoja de Russell
realizable, 84, 116, 276, 487
realización, 292 San Agustín, 57
recorrido de una función, 510 San Pablo, 191
recta parametrizada, 13 Santo Tomás de Aquino, 57, 62
recursivo: modo de pensar, 212, 422; saturado (gesättigt), 135-37
véase también definición recursiva, Schilpp, Paul A., 179
enumerable recursivamente, funcio- Schoenflies, Arthur M., 67
nes recursivas, relaciones recursivas Scholz, Heinrich, 71
reducción (Church), 370; del conectivo Schönfinkel, M., 250, 268, 522
(Gentzen), 436-40, 447-49 Schopenhauer, Arthur, 535
reducida de una matriz (Herbrand) 265 Schröder, Ernst, 2, 26, 52, 129, 145,
referencia colectiva y distributiva, 56, 214, 251, 520
179n. Schütte, Kurt, 451, 454
refutable, 276, 324, 325 secuencia de Cauchy, 16, 24, 98, 121,
regla ω, 317n., 322n. 296
reglas estructurales, 497, 498 secuencia fundamental: (Cantor), véase
reglas de eliminación e introducción, secuencia de Cauchy; (Zermelo),
497, 498 104
relación: antisimétrica, 548; aritmética, secuente, 424. 496-97; básico lógico
352-53; asimétrica, 548; funcional, (SBL), 428, 497; básico matemático
476n.; reflexiva, 545, 548; simétrica, (SBM), 428; final, 428; inicial, 428;
545; transitiva, 545, 548; véase vacío, 424; válido, 424
Índice de personas y conceptos 587

segmento (Abschnitt) de un conjunto Skolem, Thoralf, xii, 76, 78, 86-87, 89-
bien ordenado, 46-47 90, 98, 207, 211-18, 232, 251, 422,
semántica, 276-77, 484-87, 492-93, 475, 519, 520, 522; véase también
501; véase también sintáctico/ fórmula prenexa de Skolem; Teore-
semántico ma de Löwenheim-Skolem
sentencial, cálculo, 253n.; véase Smith, H. L., 377
también cálculo proposicional Smorynski, C., 315, 358
sentido (Sinn), 135, 166 Smullyan, Raymond M., 322, 329, 354,
serie determinada por un procedimien- 527-29, 529-30
to, 161 Soare, Robert I., 454
serie natural de los números (Frege), Sobociñski, Boleslaw, 515
170 software, 90, 416
serie numérica, la: véase números solubilidad de todos los problemas
naturales matemáticos, 249n., 293, 306, 539
series trigonométricas, 14-20 Spinoza, 60, 61
Sheffer, H. M., 208n. subconjunto, 2
Shoenfield, Joseph R., 174 subfórmula, 484
signo individual, 500 subtracción, 215
signos como objeto de la aritmética, sujeto y predicado, 134, 136
307 suma mereológica, 181n.
similar (ähnlich); véase conjuntos supremo (cota superior mínima), 69,
similares 202-204, 205, 544, 549
Simplicio, 487 sustantivo (inhaltlich), 123-24, 124n.,
sintáctico/semántico, 210, 275, 278; 125n., 243n., 254, 306, 312n.
véase también deducibilidad; validez sustitución de variables, 370; regla de,
sintaxis, aritmetización: véase aritme- 220, 276n., 302n.; signo de, 234
tización de sintaxis Szabo, M. E., 426, 451
sintético; véase analítico/sintético
sistema (System): sinónimo de ‘conjun- T-computable: véase funciones T-
to’, 10, 74, 121, 152 computables
sistema deductivo, 494-95; para el tablas de verdad, 494
cálculo predicativo de primer orden, Takeuti, Gaisi, 454
496-99; completo: véase cálculo Tarski, Alfred, xi, xii, 98, 210, 251,
completo; correcto: véase cálculo 277, 377, 451, 454
correcto tautología, 241, 261n., 328, 487-88
sistema formal afín a Principia Mathe- Teorema de Cantor, 30, 42, 43, 49, 50,
matica, 315, 322 179, 325, 515n., 516n.
sistema simplemente infinito ordenado Teorema de Church, 353, 354n., 360,
por una aplicación (Dedekind), 156, 369-81, 418-19; uso peculiar del
504; cualquiera sirve de “serie nombre por Kleene, 378n.
numérica”, 506; son todos isomór- Teorema de Completud de Gödel, 273-
ficos, 505 94, 381, 418
Índice de personas y conceptos 588

Teorema de Herbrand, 242, 246, 267-70 228, 322n.; teoría simple, 192-94,
Teorema de la Deducción (TD), 532 322n.; véase también elevación de
Teorema de la Definición por Induc- tipo
ción (TDI), 158, 166, 504-505 topología, 545
Teorema de la Forma Normal de Torretti, Roberto, 71
Kleene, 366, 415n. transfinito, véase aritmética transfinita;
Teorema de la Inducción Completa cardinal; infinito actual; ordinales;
(TIC), 155-56, 161n., 163 principios generadores de Cantor
Teorema de Löwenheim-Skolem, 87, tricotomía, 546, 548
98, 251, 278n., 289; ascendente, trozo final (Endstück) en derivación,
252n. 431
Teorema de Pitágoras, 73 Turing, Alan, 259, 271, 317, 331, 354,
Teorema del Buen Orden, 35, 40, 54, 359, 360, 365, 376, 381-419, 421,
55, 63, 64-65, 66-67, 68, 181, 207, 529
468-70 Ulam, Stanislas, 93
Teorema del Corte de Gentzen, 267n.
Teorema Fundamental del Álgebra, 69 universo del discurso, 56, 252
Teorema fundamental de Post para el Urelemente, 75, 102, 104, 106, 107,
cálculo proposicional, 256-57 109, 475
Teoremas de incompletud de Gödel,
126, 127, 295, 321-58; primer validez, 250, 251n., 377n., 487; véase
teorema: enunciado, 347; demostra- también fórmula válida; sintáctico/
ción, 347-50; discusión general, semántico
326-53; forma abstracta, 527-30; tres valor (de una aplicación en un argu-
corolarios, 352-53; segundo teorema, mento), 541
354-57 valor lógico (Herbrand), 260
teoría de la prueba (Beweistheorie), valor veritativo (Wahrheitswert, truth-
124, 125, 304-16, 340n., 454 value), 136, 241n., 488, 510; véase
Tercero excluido, 9, 117, 118 n., 119, también verdadero/falso
124, 219, 221, 222n., 309-10, 538- valuación parcial, 239
39 valuación, 235, 261
término, 180, 482, 492, 500 van Dalen, Dirk, 119
Tertium non datur, véase Tercero van Stigt, Walter P., 1979
excluido variable, 481, 482, 500; aparente, 241
Tesis de Church, 331, 353, 354n., 360, (véase también variable ligada);
369-81, 386, 417, 418, 494 funcional, 500; general, 263;
Tesis de Turing, 386 individual, 500; libre, 369, 484;
Thiel, Christian, 69-70 ligada, 369, 484; predicativa, 500;
Thomas, W., 51 propia de una inferencia, 425;
Tiles, Mary, 177 proposicional, 482; restringida, 263;
tipo lógico, 180, 192-204; teoría rami- véase también ligar una variable,
ficada, 195-98, 203, 207, 209-10, sustitución de variables
Índice de personas y conceptos 589

variedad (Mannigfaltigkeit), 7, 8 Weierstraß, Karl, 26, 98, 115, 305, 377


verdad en un sistema formal (Tarski), Weil, André, 377
377n., 485-87 Weyl, Hermann, xi, xii, 78, 80-82, 84,
verdad lógica, 275, 487 87, 93, 116, 117, 121, 124, 202,
verdad matemática no es equiparable a 204, 207, 228, 377
deducibilidad en un sistema consis- Whitehead, Alfred North, xi, xii, 49,
tente, 325 50, 122, 126, 130, 178, 187, 190,
verdadero/falso, 260, 486-87; en un 192-208, 211, 212, 215, 234, 247,
campo infinito, 268-69; véase 248, 253, 254, 260, 273, 328, 496,
también correcto/incorrecto; tablas 518
de verdad; valor veritativo Wittgenstein, Ludwig, xi, 206n., 208,
verifuncional; véase fórmula verifun- 304, 351, 494
cional Wright, Crispin, 145, 172, 173, 174
Veronese, Giuseppe, 60
versalitas: uso simbólico en Capitulo Zermelo, Ernst, xi, xii, 34, 35, 51, 52,
2.10, 335 55, 64-70, 71-87, 88, 89, 93, 97, 98,
versión, 482-83, 492 101, 102-11, 177, 181, 186, 202,
Viena, Círculo de, 125 207, 468-72, 477; véase también
Vivanti, 60 Axiomas de Zermelo, Axiomas de
vivencia, 308 Zermelo-Fraenkel
vocabulario, 482 zigzag, teoría del, 183

Wang, Hao, 351 ω-consistente, 344, 350


Webb, Judson C., 154, 319

También podría gustarte