5BRoberto Torretti 5D El Paraiso de Can
5BRoberto Torretti 5D El Paraiso de Can
5BRoberto Torretti 5D El Paraiso de Can
RobertoTorretti
© Roberto Torretti, 1998
A JOAQUÍN CORDUA Y ENRIQUE DʼÉTIGNY
SUMARIO
Prefacio xi .....................................................................................................
1 CONJUNTOS
1.1 La palabra ʻconjuntoʼ en la matemática del siglo XX ..............1
1.2 ʻConjuntoʼ (ʻMengeʼ) en el vocabulario de Cantor ...................7
1.3 Series trigonométricas ...............................................................13
1.4 Diversos infinitos .......................................................................21
1.5 Aritmética transfinita .................................................................29
1.6 Paradojas y filosofemas .............................................................49
1.7 El Teorema del Buen Orden y el Axioma de Selección .......63
1.8 Axiomas para una teoría de conjuntos .....................................71
1.8.1 Zermelo (1908) ......................................................................71
1.8.2 ¿Qué está ʻbien definidoʼ? ....................................................80
1.8.3 El Axioma de Reemplazo .....................................................87
1.8.4 Aportes de von Neumann .....................................................90
1.8.5 Zermelo (1930) ....................................................................102
2 CÁLCULOS
2.1 El programa de Hilbert ........................................................... 115
2.2 Escritura conceptual.................................................................129
2.3 Fundamentos de la aritmética .................................................145
2.3.1 Peano (1889)........................................................................145
2.3.2 Dedekind (1888) ..................................................................151
2.3.3 Frege (1884) ........................................................................159
2.4 La teoría de los tipos lógicos .................................................177
2.5 Aritmética finitista ................................................................... 211
2.6 Pruebas de consistencia ...........................................................219
2.6.1 Ackermann (1925) ...............................................................219
2.6.2 Von Neumann (1927) ..........................................................232
2.6.3 Herbrand (1931b) ................................................................241
2.7 El Entscheidungsproblem y el Teorema de Herbrand ...........247
Sumario viii
APÉNDICES
I Las definiciones cantorianas de ʻconjunto bien ordenadoʼ ...........459
II Más sobre el buen orden ................................................................461
III La cardinalidad de la segunda clase de ordinales .........................463
IV El argumento de Burali-Forti..........................................................465
V La segunda demostración del Teorema del Buen Orden
(Zermelo 1908) ................................................................................468
VI Los axiomas de Zermelo (1908a) ..................................................471
VII Independencia del Axioma de Selección (Fraenkel 1922a) ..........472
VIII Definición por inducción transfinita (von Neumann 1928) ..........476
IX El cálculo predicativo .....................................................................480
X Axiomas de la lógica (Frege 1879) ...............................................502
XI Definiciones recursivas (Dedekind 1888) ......................................504
XII Extensión y recorrido (Frege 1891, 1893a) ...................................509
Sumario ix
GLOSARIO .................................................................................................541
OBRAS CITADAS ......................................................................................551
ABREVIATURAS Y SÍMBOLOS .............................................................573
ÍNDICE DE PERSONAS Y CONCEPTOS ..............................................575
PREFACIO
xi
Prefacio xii
CONJUNTOS
1.1 LA PALABRA ʻCONJUNTOʼ
EN LA MATEMÁTICA DEL SIGLO XX
1
2 El Paraíso de Cantor
3 Como se puede ver, la noción matemática de conjunto nada tiene que ver con la no-
ción lógica de clase o extensión de un concepto. Contrastando esta última con lo que
Schröder llamó ʻdominioʼ (Gebiet) —y que corresponde casi exactamente a nuestra
noción de ʻconjuntoʼ— Frege (1895, p. 455) escribe: “Considero fallido el intento de
basar la extensión del concepto como clase no sobre el concepto sino sobre los objetos
individuales. […] La extensión de un concepto no consta de los objetos que caen
bajo el concepto, como un bosque de árboles, sino que tiene en el concepto mismo su
único sostén (Halt). Así, el concepto tiene primacía lógica sobre su extensión.”
1.1 La palabra ʻconjuntoʼ 3
Lewis (1991) arbitrariamente define el conjunto vacío ∅ como la fusión de todos los
objetos individuales existentes (esto es, el objeto individual que comprende a todos
los demás dentro de sí). Esta definición asegura que ∅ existe y está bien determinado
como quiera que esté constituido el universo.
5 George Boole introdujo el álgebra que lleva su nombre como una estructura discer-
nible en el sistema lógico de las clases (extensiones de conceptos). Para ello tuvo
1.1 La palabra ʻconjuntoʼ 5
que completar dicho sistema, por convención terminológica, con dos “objetos” que
normalmente no se habrían considerado como clases, a saber, el “universo” y la “clase
sin miembros”:
Por clase se entiende usualmente una colección de individuos, a cada uno de los
cuales se puede aplicar un nombre o descripción particular; pero en esta obra el
significado del término se extenderá de modo que incluya el caso en que no existe
más que un solo individuo que responde al nombre o descripción requeridos,
así como los casos denotados por los términos “nada” y “universo”, los cuales,
considerados como “clases”, debe entenderse que comprenden, respectivamente,
“ningún ente” (“no beings”) y “todos los entes”.
(Boole 1854, p. 28)
1.2 ʻCONJUNTOʼ (ʻMENGEʼ) EN EL VOCABULARIO DE CANTOR
7
8 El Paraíso de Cantor
explica al comienzo del último trabajo que Cantor dedica al tema, “Con-
tribuciones a la fundamentación de la teoría de los conjuntos transfinitos”
(Cantor 1895/97):
un conjunto bien definido; pero supongo que en todo caso serán variantes
de los dos que mencioné al final del Capítulo 1.1: o bien se da una lista de
todos los elementos del conjunto, nombrando o describiendo a cada uno de
una manera inequívoca; o bien se establece una condición que cumplen todos
los elementos del conjunto y sólo ellos y un procedimiento para decidir si un
objeto cualquiera satisface o no dicha condición. El requisito de “determina-
ción interna” podría entonces suponerse cumplido con sólo prescribir tal con-
dición, aunque no se conozca el procedimiento de decisión correspondiente.
La caracterización de ʻconjuntoʼ que trascribí de las “Contribuciones” (GA,
p. 282) significa, a mi modo de ver, que la teoría general de los conjuntos
concierne solamente a conjuntos bien definidos, en este sentido.
En suma, un conjunto en el sentido de Cantor es un objeto constituido
por otros objetos —los elementos del conjunto— de tal modo que su iden-
tidad depende de la determinación precisa de cuáles objetos son elementos
suyos y cuáles no.3 Esta noción de conjunto concuerda en lo esencial con la
expuesta en el Capitulo 1.1. De hecho, a pesar de su explícita insistencia en
que los conjuntos constan de “elementos bien distinguidos”, Cantor se refiere
ocasionalmente a un conjunto que consiste de un solo elemento (GA, p. 98).
En cambio, su postura con respecto al conjunto vacío es menos clara. En
el Nº 1 de la serie “Sobre variedades lineales infinitas de puntos” dice que
“conviene tener un símbolo que exprese la ausencia de puntos, para lo cual
elegimos la letra O. P = O significa entonces que el conjunto de puntos P
no contiene ni un solo punto, o sea que, estrictamente hablando, no existe
como tal” (GA, p. 146). Así, pues, al mismo tiempo que niega la existencia
del conjunto vacío, Cantor le pone un nombre, lo cual es quizás la vía más
segura —en matemáticas como en literatura— para darle realidad a una fic-
ción. En el Nº 6 de la misma serie da un paso más hacia el reconocimiento
del conjunto ∅. Cantor considera allí un conjunto de puntos P incluido en
una región H de un espacio n-dimensional G. Si H se descompone en un
número finito o infinito de regiones conexas disjuntas H1, H2,… Hk,…,
P también se divide en “un número correspondiente” de partes disjuntas P1,
P2,… Pk,…, donde Pν = Hν ∩ P (ν = 1, 2,…). Cantor comenta que
“Pν puede, entonces, ser igual a cero (Null), en caso de que ningún punto
de P caiga dentro de la región Hν” (GA, p. 210). Cantor no dice que el cero
que aquí se nombra sea un conjunto, pero lo ve sin duda como un objeto
por derecho propio, y además lo equipara a una parte de un conjunto. El
lector advertirá que el ∅ se presenta aquí justamente como la intersección
de dos conjuntos disjuntos. El pasaje sugiere, además, que la letra O se le
impuso a Cantor como símbolo cuando escribía el Nº1 por su parecido con
el número 0.
1.3 SERIES TRIGONOMÉTRICAS
13
14 El Paraíso de Cantor
Sean a y b dos valores fijos y sea x una cantidad variable tal que x
toma paulatinamente todos los valores entre a y b. Si un único y finito
corresponde a cada x de modo que, mientras x recorre continuamente el
intervalo desde a hasta b, y = ƒ(x) también varía gradualmente, se dice
que y es una función continua o regular de x sobre este intervalo. No es
necesario que y esté sujeta a la misma regla con respecto a x a través de
todo el intervalo. Ni siquiera es necesario que la relación pueda expresarse
mediante operaciones matemáticas.1
a0 ∞
f (x) = + ∑ ( an cos nx + bn sen nx )
2 n=1 (1)
1 π
π ∫− π
an = f ( x )cos nx dx
(2)
y
1 π
π ∫− π
bn = f ( x )sen nx dx
(3)
Fourier demostró su tesis para algunos casos especiales y esbozó, con escaso
rigor, una demostración general.2 Años más tarde, Dirichlet, en el escrito
1 Dirichlet, “Über die Darstellung ganz willkürlicher Functionen durch Sinus und Cosinus-
reihen”, Repertorium der Physik, Berlin: Veit, 1837, vol. I, p. 152; citado por Mannheim
1964, pp. 52s.
2 Fourier, Théorie analytique de la chaleur (1822).
1.3 Series trigonométricas 15
arriba citado, estableció ciertas condiciones suficientes para que una función
ƒ pueda representarse de este modo y Riemann, en su Habilitationschrift de
1854, intentó establecer condiciones necesarias. En este trabajo, Riemann dio
la definición de integral que todavía sirve de base a la enseñanza elemental
del cálculo y demostró varios resultados importantes. Pero la cuestión de
las condiciones necesarias y suficientes de la representación (1) quedó —y
sigue— pendiente.
Aunque no se sepan exactamente las condiciones en que una función
real admite la representación (1), es importante saber si esa representación
es única, cuando existe, o si, por el contrario, una misma función puede
representarse mediante dos o más series trigonómetricas diferentes. Esta
es la cuestión que Cantor abordó y resolvió en varios artículos publicados
entre 1870 y 1872.3 Cantor (1870) considera una función real ƒ definida en
un intervalo finito I y representable mediante una serie trigonométrica de la
forma (1), convergente para todo x ∈ I. No presupone que ƒ sea integrable
o que los coeficientes de la serie (1) estén dados por (2) y (3). Tampoco
requiere la convergencia uniforme de la serie (1) en I.4 La unicidad de la
representación (1) es un corolario del siguiente teorema:
3 Los trabajos de Cantor aludidos a continuación —como todos sus escritos más impor-
tantes— han sido resumidos en inglés por Dauben (1979), pero en esta parte, como en
otras, la exposición de Dauben tiene mucho que envidiarle a la claridad del original.
J. Marshall Ash (1989) ofrece una demostración rigurosa y detallada de los resultados
de Cantor (1870).
∑
∞
4 Decimos que la serie k =1
ƒ k ( x ) converge uniformemente al límite ƒ(x) en el intervalo
I, si para cada número real positivo ε hay un entero positivo N(ε) tal que, para todo
∑
n
x ∈ I y todo n > N(ε), |ƒ(x) – k =1
ƒ k ( x )| < ε.
16 El Paraíso de Cantor
cada caso igual a 0 o, en otras palabras, que las dos representaciones sean
idénticas. El teorema T1 se deduce fácilmente del siguiente resultado, que
Cantor demuestra utilizando un ingenioso artificio aprendido de Riemann:
N tal que |an – bn| < ε si N < n, se asocia un mismo índice a las secuencias
(ai) y (bi). Diremos en tal caso que (ai) y (bi) son secuencias equivalentes.5
Si (ai) y (bi) son dos secuencias fundamentales en A asociadas a dos índices
diferentes α y β, decimos que α < β si hay un número racional positivo
q y un entero positivo N tales que q < (bn – an) si N < n. Cantor llama
B al dominio formado por los índices de las secuencias fundamentales de
racionales. Claramente, la relación < establece un orden lineal en B. Cantor
define asimismo la adición y la multiplicación en B:
5 Como fácilmente se puede comprobar, la relación entre (ai) y (bi) es una genuina
relación de equivalencia, puesto que es una relación simétrica, transitiva y reflexiva.
Cabe, pues, entender que el índice asociado a cada secuencia fundamental no es otra
cosa que la clase de equivalencia a la que pertenece en virtud de esta relación.
6 La adición determina el 0 en B, a saber, aquel objeto cuya suma con cualquier otro es
igual a este último. Los demás objetos de B quedan entonces clasificados en positivos y
negativos, según sean mayores o menores que el 0. Si α y β están en B, α – β designa
la suma de α y el único objeto de B cuya suma con β es igual a 0. Una secuencia
fundamental en B puede entonces definirse en los mismos términos utilizados arriba
para definir una secuencia fundamental en A, con una sola diferencia: ε > 0 debe ser
un objeto de B, no de A.
18 El Paraíso de Cantor
8 Sea dicho de paso, aquí tenemos un ejemplo de conjunto unitario, propuesto por
Cantor mismo. El texto, traducido, dice así: “Si el conjunto P consiste de los puntos
correspondientes a las abscisas 1, 1/2, 1/3,…,1/n,… el conjunto P´ consiste del solo
punto 0 y no tiene un conjunto derivado.” (Cantor, GA, p. 98).
20 El Paraíso de Cantor
Si la serie trigonométrica
a0 ∞
Como veremos en el Capítulo 1.5, con sus reflexiones sobre los conjuntos
derivados Cantor dio un primer paso decisivo para la construcción de la
aritmética del infinito expuesta en los trabajos “Sobre variedades lineales
infinitas de puntos” de 1879–1884. Pero antes explicaré ciertos hallazgos
sobre conjuntos infinitos que Cantor publicó en 1874 y 1878 y que contri-
buyeron poderosamente a motivar sus estudios posteriores. Se refieren a lo
que Cantor llama la “potencia” (Mächtigkeit), esto es, la numerosidad de
un conjunto, que es la única propiedad que lo caracteriza si se hace caso
omiso de su estructura y de la naturaleza de sus miembros.1 Decimos que
dos conjuntos a y b son equinumerosos, o que tienen la misma potencia, si
hay una aplicación† biyectiva de a sobre b. En cambio, si hay una aplica-
ción inyectiva de a en b, pero no hay una aplicación biyectiva de a sobre
b, diremos que b es más numeroso que a, o que su potencia es mayor que
la de a. Evidentemente, estas definiciones prescinden de la índole de a y b,
y de sus respectivos elementos. Utilizando estos conceptos, Cantor (1874)
demuestra las proposiciones siguientes:
21
22 El Paraíso de Cantor
Se llama número algebraico a cualquier número real que sea una solución
de una ecuación con coeficientes enteros, de la forma:
2 Cantor, GA, pp. 115, 116, menciona expresamente “der Inbegriff aller ganzen positi-
ven Zahlen”, “die reellen algebraischen Zahlen in ihrer Gesamtheit” y “die sämtlichen
reellen Zahlen, welche ≥ 0 und ≤ 1 sind”.
3 Adviértase que si σ es una secuencia fundamental y se modifican de cualquier manera
los n primeros términos de σ, donde n es un entero determinado, tan grande como se
desee, se obtiene una secuencia fundamental σ′ equivalente a σ. Así, la identidad de
cada número real, según la teoría de Cantor, depende de la última parte —infinita— de
la secuencia fundamental que lo representa (esto es, de lo que resta de la secuencia
después de remover los n primeros términos, para n fijo, pero arbitrario).
1.4 Diversos infinitos 25
4 Si el conjunto de los enteros positivos existe, no cabe duda de que hay por lo menos
una aplicación inyectiva del mismo en el dominio de los reales, a saber, la inclusión
canónica que asigna a cada entero positivo z el número real correspondiente a la se-
cuencia constante (z, z,…).
5 P1 se cumple si para todo entero positivo k hay dos valores de la secuencia σ en el
intervalo (αk, βk). P2 se cumple si hay un entero positivo k tal que en el intervalo
(αk, βk) no hay dos valores de σ.
6 El texto alemán original aparece en Cantor, GA, pp. 119–133. Dauben 1979, pp. 58–66,
da una buena paráfrasis en inglés.
26 El Paraíso de Cantor
7 Las primeras demostraciones del teorema de Schröder y Bernstein solían aducir premi-
sas más fuertes de lo necesario. Se hallará una demostración más económica en Levy
1980, pp. 85s.
8 Se agrega a la “curva sin dirección” de Weierstraß, una función real continua pero
no diferenciable. Precede a la “curva que llena una superficie” de Peano, aplicación
continua de un segmento recto sobre un cuadrado.
1.4 Diversos infinitos 27
9 Cantor (1878) subraya que su rotulación de cada punto del plano mediante una sola
coordenada supone que la parametrización no sea continua, pero expresamente deja
abierta la cuestión que será resuelta por Brouwer (GA, p. 121).
1.5 ARITMÉTICA TRANSFINITA
29
30 El Paraíso de Cantor
La idea de una tal continuación surge con toda naturalidad del estudio de
los conjuntos derivados de un conjunto de puntos. Cuando hablé de ellos
en el Capítulo 1.3 me referí expresamente sólo a conjuntos de la n-ésima
especie, cuyo n-ésimo conjunto derivado es finito, de suerte que el conjunto
derivado (n + 1)-ésimo está vacío. Pero la recta incluye por cierto más de un
conjunto de puntos P tal que, para cualquier entero positivo n, el conjunto
derivado P(n) ≠ ∅. Tenemos además que, si bien P(1) generalmente no es
una parte de P (por ejemplo, si P es el conjunto de los puntos con coorde-
nadas algebraicas, P(1) = Â), en cambio, P(n+1) ⊆ P(n) para todo n ≥ 1. Por
∞
ende, P(n) ≠ ∅, la intersección infinita ∩ i=1 P ( i ) ≠ ∅ . Cantor llama a esta
intersección “la derivación de orden ∞” y la designa con el símbolo P(∞).
Considera en seguida la serie de sus conjuntos derivados P(∞+1), P(∞+2),…
También P(∞) tiene su derivación de orden ∞, generalmente no vacía. Cantor
la designa con P(2∞). “Prosiguiendo con estas construcciones conceptuales
uno llega a derivaciones que es consecuente designar con P(n∞+m), donde n
∞
y m son números enteros positivos” (GA, p.147). La intersección ∩ k =1 P ( k∞ )
2
debe llamarse entonces P(∞ ). El próximo paso natural es formar derivacio-
nes cuyo orden está dado por un polinomio en ∞ de grado n (n > 1). La
∞
intersección infinita de tales derivaciones es, lógicamente, P(∞ ).
1 Conviene observar que este distingo es tan ajeno al alemán como al castellano. En la vida
diaria, ʻAnzahlʼ se usa en frases como “eine große Anzahl Kinder” (“un gran número
de niños”), “eine Anzahl von 100” (ʻun centenar”). El uso matemático en tiempos de
Cantor puede ilustrarse con el siguiente pasaje de Lipschitz, que Kronecker cita con
aprobación en “Sobre el concepto de número” (1887, p. 342n.; cursiva mía):
Wenn man bei der Betrachtung getrennter Dinge von der Merkmalen absieht,
durch welche sich die Dinge unterscheiden, so bleibt der Begriff der Anzahl der
betrachteten Dinge zurück.
Cuando en la consideración de cosas separadas se prescinde de los caracteres que
las distinguen resta el concepto del número de las cosas consideradas.
[κ] es lo que Cantor llama un conjunto bien ordenado por la relación <.3
En el referido escrito Nº 5 Cantor explica que un conjunto bien ordenado
(eine wohlgeordnete Menge) es un conjunto bien definido cuyos elementos
están ordenados linealmente de tal modo que:
BO1 Hay un primer elemento, esto es, un elemento que precede a todos
los otros.
BO2 Todo elemento que precede a otros tiene un sucesor inmediato, esto
es, un elemento que le sigue y precede a cualquier otro elemento
precedido por él.
BO3 Si A es una parte no vacía —finita o infinita— del conjunto y los
elementos del conjunto que siguen a todos los elementos de A
forman otra parte no vacía B, entonces B tiene un primer elemento
(esto es, hay un elemento de B que precede a cualquier otro ele-
mento de B).
3 Como luego se verá, las condiciones BO1–3 con que Cantor inicialmente define el
concepto de buen orden están calculadas para garantizar que el mismo sea aplicable
a la sucesión de ordinales resultante de los “principios generadores” enunciados en
Cantor 1883 (vide infra, pp. 36 s.). Por eso, quizás, Cantor no se molesta en demos-
trar que la sucesión de los ordinales —y, por ende, cada segmento inicial suyo— está
bien ordenada por la relación <. Para los lectores a quienes esto no les parezca obvio,
Zermelo prueba —en una nota a su edición de los escritos de Cantor— que la sucesión
de los ordinales cumple la condición BO (Cantor, GA, p. 208, n.4). Sea K cualquier
conjunto de ordinales. Sea K* = {ξ: ∀ζ(ζ ∈ Κ → ξ < ζ)} (K* es el conjunto de los
ordinales menores que cada elemento de K). Entonces, o bien K contiene el primer
ordinal y éste es su primer elemento; o bien no lo contiene, y entonces K* ≠ ∅. En
este caso, o bien K* tiene un elemento máximo µ, y el ordinal µ + 1, determinado
por el primer principio generador, es el primer elemento de K; o bien K* no tiene un
elemento máximo, en cuyo caso el segundo principio generador determina un ordinal
límite, sucesor próximo de todos los elementos de K*, que es el primer elemento de
K. Así, en las tres alternativas posibles, K tiene un primer elemento.
4 Demuestro la equivalencia de ambas definiciones en el Apéndice I. El lector habrá
advertido que la condición BO1 presupone que el conjunto en cuestión no está vacío.
Por otra parte, ∅ cumple trivialmente la condición BO: como ∅ no tiene ninguna parte
1.5 Aritmética transfinita 35
Más tarde, Cantor no volverá a calificar esta proposición tan poco evidente
como “ley del pensamiento”, y hasta hará un intento por demostrarla, que
explico en el Capitulo 1.6. En el Capítulo 1.7 y en el Apéndice VI consideraré
las demostraciones publicadas por Zermelo en 1904 y 1908. Desde entonces
la proposición se conoce como el Teorema del Buen Orden y así me referiré
a ella en lo sucesivo. Veremos que, al igual que el célebre Postulado V de
Euclides, no puede demostrársela a menos que se acepte otra proposición
que no es más obvia. Me parece, por eso, que Cantor puso de manifiesto
un certero instinto matemático cuando intentó hacer pasar el Teorema del
Buen Orden por un principio del pensamiento que no requiere demostración
(así como Euclides mostró su genio al dar rango axiomático al Postulado
V). Para su programa, el Teorema del Buen Orden era indispensable: la
sucesión de los ordinales alcanza para enumerar todo lo que se presente en
no vacía, no tiene una que carezca de un primer elemento. BO equivale a BO1 ∧ BO2
∧ BO3 si y sólo si M ≠ ∅. Como Cantor no contemplaba la existencia de ∅ entendía
seguramente que el conjunto al que se refiere la condición BO no estaba vacío.
36 El Paraíso de Cantor
(II). Dicha propiedad puede verse como un tercer principio “de inhibición o
limitación” (Hemmungs- oder Beschränkungsprinzip), en virtud del cual:
La Clase (II) está formada por ω y los ordinales sucesores y ordinales lí-
mites que cumplen con la exigencia (a1). Cumple además las condiciones
siguientes:
Sea ω1 el enumerador del conjunto de los ordinales de las Clases (I) y (II),
ordenados de menor a mayor. Consíderese ahora la condición
que forman todos los impares 1, 3, 5,… seguidos por todos los pares 2, 4, 6,… y (ii)
el conjunto ordenado que forman los números primos 2, 3, 5, 7, 11,… seguidos por
sus respectivos cuadrados, cubos,…; y, evidentemente, cada uno de estos conjuntos
puede biyectarse sobre el conjunto de los predecesores de ω (con el cual se confunde,
si olvidamos el orden).
7 En el Apéndice III bosquejo su demostración de estas dos proposiciones.
1.5 Aritmética transfinita 39
que, para cada entero positivo n, (i) el conjunto [ξ] de los predecesores de
cualquier ordinal ξ de la clase (n+1)-ésima clase es equinumeroso con el
conjunto de los ordinales de la clase n-ésima; (ii) la clase n-ésima es me-
nos numerosa que la clase (n+1)-ésima; y (iii) no existe una numerosidad
intermedia entre las de las clases n-ésima y la (n+1)-ésima. Por otra parte,
como Zermelo observa en su edición de los escritos de Cantor (GA, p. 199),
los principios citados no bastan para establecer la existencia de una clase
ω-ésima de ordinales.
En sus obras más maduras, Cantor se refiere a esta serie ascendente de
numerosidades infinitas conjurada por los sucesores de ω como a una serie
numérica transfinita distinta de la de los ordinales, aunque asociada a ella: la
sucesión de los números cardinales transfinitos o alephs (llamados así por la
letra hebrea aleph, ℵ, que Cantor adoptó para nombrarlos). Para Cantor, el
cardinal de un conjunto epitomiza lo que él llamaba su potencia o valencia y
aquí he llamado su numerosidad. Si olvidamos todas las particularidades de
los elementos de un conjunto K, recordando únicamente que son diferentes
entre sí, obtenemos, según Cantor, un concepto que se aplica igualmente
a K y a cualquier otro conjunto equinumeroso con K. Este concepto es lo
que él llama el número cardinal (Kardinalzahl) de K. Si K es menos nu-
meroso que otro conjunto L, decimos que el cardinal de K es menor que el
cardinal de L. El conjunto de los cardinales finitos está bien ordenado por
la relación ʻx es menor que yʼ —que simbolizaremos: x < y—, puesto que,
evidentemente, hay un isomorfismo† de órdenes entre los cardinales finitos,
ordenados por la relación <, y los enumeradores de los conjuntos respec-
tivos, ordenados por la relación <. (Usaré también la abreviatura ʻx ≤ yʼ
para decir ʻx < y o x = yʼ.) En virtud de este isomorfismo los cardinales
finitos se identifican naturalmente con los respectivos ordinales y se conocen
por los mismos nombres que éstos. Pero, como hemos visto, tal correspon-
dencia no existe en el dominio transfinito. Cantor insiste, por ello, en que
los cardinales transfinitos son otra clase de objetos que los ordinales y los
designa con nombres peculiares. Así, el cardinal del conjunto [ω] —o del
conjunto de los predecesores de cualquier ordinal de la segunda clase— se
llama ℵ0 (aleph cero); el cardinal del conjunto de los ordinales de segunda
clase —o del conjunto de los predecesores de cualquier ordinal de la tercera
clase— se llama ℵ1, etc.
Como dije arriba, Cantor demostró que entre ℵ0 y ℵ1 no puede haber
40 El Paraíso de Cantor
HGC implica el Teorema del Buen Orden (pero no es implicada por él).
Por lo tanto, sólo cabría admitirla como un principio que no se demuestra.
Volveremos sobre esto en la Tercera Parte. Es claro que bajo HGC los
alephs darían abasto para cubrir todas las numerosidades de la “naturaleza
corpórea y espiritual”.
Con clara conciencia de lo que se espera de un “número” de veras digno de
ese nombre, Cantor pone especial cuidado en definir las operaciones aritmé-
ticas elementales aplicables a sus ordinales y cardinales. No podemos entrar
en detalles, pero un par de indicaciones darán una idea de este asunto.
Aunque la aritmética transfinita ordinal precede históricamente a la car-
dinal, es más fácil explicarla si hablamos primero de ésta. Este es el orden
que Cantor mismo sigue en su presentación final del tema (Cantor 1895/97;
GA, pp. 282ff.), en la que me basaré. Como ya he dicho, para Cantor el
cardinal de un conjunto K es el concepto abstracto que se forma olvidando
todas las propiedades y relaciones de los elementos de K excepto una sola, a
saber, que cada uno de esos elementos es idéntico consigo mismo y diferente
de todos los demás. Como es obvio, el mismo concepto se obtiene a partir
de cualquier conjunto equinumeroso con K.8 Para referirme a los cardinales
—finitos o transfinitos— usaré como Cantor letras góticas, , , ,… Can-
tor designa el cardinal del conjunto K mediante el símbolo , pero aquí lo
llamaremos |K|, como es ahora habitual. Por definición, la suma + de
dos cardinales y es el cardinal de la unión de dos conjuntos disjuntos
cualesquiera tales que y sean sus repectivos cardinales. En otras palabras,
si = |A| y = |B| y A ∩ B =∅, + = |A ∪B|. El producto de dos
cardinales y se define así: si = |A| y = |B|, sea A × B el conjunto
de todos los pares ordenados 〈a,b〉, tales que a ∈ A y b ∈ B; entonces =
|A × B|. Cantor muestra que bajo las condiciones antedichas, es asimismo el
cardinal del conjunto construido formando la unión de conjuntos disjuntos
11 Aunque suele atribuírsele a Cantor, el método diagonal fue empleado antes por Paul du
Bois-Reymond (1875, p. 365n.) para demostrar que, dada una secuencia de funciones
reales λ1, λ2,…que crecen monotónicamente sin cota ( lim λ k ( x ) = ∞ ), pero cada cual
λ k +1 ( x ) x→∞
más lentamente que la anterior ( lim = 0 ), existe siempre una función real λ que
x→∞ λ ( x )
k
crece sin cota, pero más lentamente que cualquiera de las λk. En términos generales, el
método puede describirse así: dado un conjunto D y una “función de dos variables” g
definida en D2, pasamos a considerar la diagonalización de g, esto es, la “función de
una variable” h definida en D por la condición h(x) = g(x,x). El nombre ʻdiagonalizaciónʼ
se justifica fácilmente en caso que D sea finito o enumerable, ya que entonces los
valores de g se pueden desplegar naturalmente en una matriz cuya diagonal exhibe los
valores de h. La popular demostración de la indenumerabilidad del continuo publicada
en Cantor 1890/91 (GA, pp. 278f.) ilustra el método diagonal en esta forma: Sea ϕ
una aplicación inyectiva de [ω] en I = (0,1]. Sea 0,ak0ak1ak2…akn… la representación
de ϕ(k) mediante su expansión decimal infinita. Sea, para todo ordinal finito h, ah = 1
si ahh ≠ 1 y ah = 2 si ahh = 1. Entonces, 0,a0a1a2…an… es la expansión decimal
infinita de un elemento de I que cae fuera del alcance de la aplicación ϕ, puesto que
difiere de ϕ(k) en el k-ésimo decimal. Por lo tanto, no existe una aplicación biyectiva
de [ω] en I, de suerte que [ω] es menos numeroso que I.
12 Mas adelante, cuando hablemos de Gödel, será preferible definir con él la función ca-
racterística χH de un conjunto H por la condición χH(k) = 0 si k ∈H y χH(k) = 1 si k
∉ H. Como es obvio, cualquier decisión en esta materia es puramente convencional.
44 El Paraíso de Cantor
ℵ1 = 2ℵ0 (HC)
El argumento anterior ofrece una prueba más de que el conjunto de los ordi-
nales finitos es menos numeroso que el continuo.
Para entender la aritmética ordinal conviene explicar primero el concepto
1.5 Aritmética transfinita 45
1 “Una clase es…todos los objetos que satisfacen una función proposicional” (Whitehead
y Russell, 1910–13, t. I, p. 23). El término ʻfunción proposicionalʼ se explica así: “Sea
φx un enunciado (statement) que contiene una variable x y que se convierte en una
proposición cuando se le asigna a x cualquier significado determinado fijo. Entonces
49
50 El Paraíso de Cantor
Cantor dice, pues, que cualquier clase es menos numerosa que la clase de sus
subclases.2 En la misma obra, Russell nos cuenta que descubrió la paradoja
que hoy lleva su nombre reflexionando justamente sobre las consecuencias
del Teorema de Cantor. Dicha paradoja surge al considerar la clase de todas
las clases que no son miembros de sí mismas. Si llamamos CR a esta clase
russelliana, designamos con ʻ{x: ϕx}ʼ la clase de todos los objetos x que sa-
tisfacen la condición ϕx, y simbolizamos con ʻy ∈ zʼ e ʻy ∉ zʼ los enunciados
ʻy pertenece a la clase zʼ e ʻy no pertenece a la clase zʼ, tenemos que:
CR ∈ CR ↔ CR ∉ CR
φx se llama una ʻfunción proposicionalʼ” (p. 14). Cada objeto a tal que la proposición
φa es verdadera “satisface” la función proposicional φx y es, por ende, un miembro de
la clase determinada por esta función proposicional. Aunque hay profundas diferencias
entre Principia Mathematica, de donde tomo estas definiciones, y The Principles of
Mathematics de 1903, en este punto concuerdan. Leemos en The Principles que “φx
es una función proposicional si, para todo valor de x, φx es una proposición, determi-
nada si x es dado” (Russell 1903, § 22) y que “los valores de x que hacen verdadera
la función proposicional φx […] en general forman una clase y de hecho una clase
puede definirse como todos los términos que satisfacen alguna función proposicional”
(§23).
2 No es obvio para mí que el argumento que Russell toma de Cantor demuestre el teorema
en su nueva versión. En efecto, si tomamos en serio la explicación lógico-lingüística
de la noción de clase recogida en la nota 1, el número de subclases no vacías de una
clase C no es mayor que el número de funciones proposicionales diferentes que satis-
facen uno o más miembros de C. Si cada función proposicional es un enunciado, el
número de las mismas dependerá de la índole del lenguaje que se usa. En particular,
si el lenguaje es la “escritura conceptual” de Frege (1879), o la pasigrafía de Peano
(1895 y ss.), o el sistema desarrollado más tarde por el mismo Russell (Whitehead y
Russell, 1910–13), cualquiera de los cuales sólo admite oraciones de longitud finita
con a lo sumo ℵ0 predicados diferentes, el número total de enunciados diferentes que
es posible hacer en él no es mayor que ℵ0. A menos, claro está, que haya enunciados
—específicamente, funciones proposicionales— inefables.
1.6 Paradojas y filosofemas 51
En efecto, una pluralidad puede ser de tal índole que el supuesto de que
todos sus elementos “existen conjuntamente” (die Annahme eines “Zusam-
menseins” aller ihrer Elemente) lleva a una contradicción, de modo que
es imposible captar esa pluralidad como una unidad, como “una cosa aca-
bada”. A tales pluralidades las llamo pluralidades absolutamente infinitas
o inconsistentes. […]
Siguen tres asertos, en el estilo que se usará más tarde para enunciar axiomas
de la Teoría de los Conjuntos:
6 Conviene quizás anotar que la expresión que usa Cantor para abreviar ʻOrdnungszahlʼ
(ʻnúmero ordinalʼ) es ʻZahlʼ (ʻnúmeroʼ).
7 El razonamiento resulta quizás más claro si invocamos la Proposición 4 del Apéndice
II: Un conjunto bien ordenado no puede ser isomorfo a uno de sus segmentos. Pero
si el ordinal ζ ∈ Ω es el tipo de orden de Ω, Ω es isomorfo a [ζ], el segmento de Ω
determinado por ζ. El lector a quien, con toda razón, le moleste la idea de que una
pluralidad inconsistente se diga bien ordenada puede reordenar así el razonamiento de
Cantor: Suponga primero que Ω es un conjunto; muestre que si lo es, está bien orde-
nado por <. Por lo tanto, Ω tiene un tipo de orden ζ ∈ Ω y es isomorfo al segmento
[ζ] ⊆ Ω. Como esto es imposible si Ω está bien ordenado, Ω no es un conjunto.
8 Burali-Forti 1897. Explico el argumento de Burali-Forti en el Apéndice IV.
54 El Paraíso de Cantor
(en virtud del primero de los tres asertos iniciales de Cantor arriba citados).
Cantor basa en esta conclusión un argumento que según él demuestra que
el cardinal de un conjunto infinito siempre es un aleph: Sea V una plura-
lidad infinita cuya numerosidad no es un aleph. Es claro, entonces, que,
cualquiera que sea el ordinal α, si ƒα es una inyección de [α] en V, ƒα no
es una biyección. De esto se sigue, según Cantor, que Ω es equinumeroso a
una pluralidad V′ ⊆ V.9 Por lo tanto, en virtud de los dos primeros asertos
iniciales de Cantor citados arriba, V′ y V son pluralidades inconsistentes y V
no puede ser un conjunto. Si el argumento precedente es válido, constituye
una demostración fácil del Teorema del Buen Orden: toda pluralidad cuyo
cardinal sea un aleph se deja biyectar en un segmento de Ω y bien ordenar
por ésta, y una pluralidad que no se deja bien ordenar, lisa y llanamente no es
un conjunto.10 Esta demostración —“por exclusión de lo disconforme”— en-
cierra un peligro. Como nadie sabría coordinar los puntos de un trazo con
un segmento de Ω, se puede pensar —o decidir— que ellos no constituyen
un conjunto. Este diagnóstico afectaría asímismo al sistema  de los nú-
meros reales y a todas las pluralidades equinumerosas con él. Para eliminar
9 Cantor no explica cómo llega a esta conclusión. Pero he aquí un modo como pudiera
haberla defendido. Digamos que una aplicación g está incluida en una aplicación h
(simbólicamente, g ⊆ h) si el dominio de g está incluido en el dominio de h y g(x) =
h(x) para cada x en el dominio de g. Sea V una pluralidad infinita cuyo cardinal no es
un aleph. Como V es infinito, es claro que hay una inyección ƒω: [ω] Æ V. Como el
cardinal de V no es ℵ0, es claro que ƒω no es biyectiva y que hay por lo menos un
elemento de V que no está en el alcance de ƒω. Partiendo de ƒω puede establecerse una
secuencia transfinita de aplicaciones ƒα: [α] Æ V tales que, para cualesquiera ordinales
transfinitos α y β < α, (i) ƒβ ⊆ ƒα, (ii) ƒα es inyectiva y (iii) ƒα no es biyectiva. Sea
α > ω y supongamos que ƒβ está definida y satisface las condiciones (i)–(iii) para todo
ordinal transfinito β < α. Si α es un ordinal sucesor, hay un β ≥ ω tal que α = β +1,
y hay un elemento vβ ∈ V que no está en el alcance de ƒβ. ƒα: [β + 1] Æ V se define
así: si γ < β, ƒα(γ) = ƒβ(γ); ƒα(β) = vβ. Si α es un ordinal límite, ƒα se define así: para
cada ordinal transfinito β < α, ƒα|[β] = ƒβ (ƒα coincide con ƒβ en el dominio de esta
última). Estas definiciones aseguran que ƒα cumple en ambos casos las condiciones (i)
y (ii). Es obvio que también cumple la condición (iii), ya que de otro modo el cardinal
de V sería un aleph. La correspondencia α Å ƒα(α) entre Ω y la pluralidad {ƒα(α):α
∈ Ω} = V′ ⊂ V es biunívoca.
10 Se sabe que en 1896 ó 1897 Cantor envió a Hilbert una demostración del Teorema del
Buen Orden. No conocemos su tenor, pero G. H. Moore (1982, p. 51) conjetura que
se basaba en el mismo argumento utilizado en la carta a Dedekind del 2 de agosto de
1899. Hilbert no se dejó convencer.
1.6 Paradojas y filosofemas 55
12 Por ejemplo, la frase ʻuniverso del discursoʼ, empleada en semántica para referirse a
todo cuanto pueda ser tema de conversación en el lenguaje bajo estudio, es ciertamente
un designador distributivo si el lenguaje en cuestión es natural.
1.6 Paradojas y filosofemas 57
Esta respuesta tiene dos aspectos que consideraré sucesivamente: (A) La duda
señalada afecta a la aritmética finita no menos que a la transfinita. (B) El
matemático tiene la libertad de superar tales dudas postulando axiomas.
Por otra parte, en cuanto las distintas clases de números, (I), (II), (III), etc.,
son representantes de numerosidades que efectivamente se encuentran en la
naturaleza,
13 Cantor prosigue: “En particular, al introducir nuevos números [la matemática] sólo
está obligada a dar de ellos definiciones que les confieran una tal determinación y,
eventualmente, una tal relación con los números más antiguos, que, dado el caso, se
puedan distinguir entre ellos de un modo determinado. En cuanto un número satisface
todas estas condiciones se puede y se debe considerarlo como existente y real (existent
und real) en la matemática” (GA, p. 182).
60 El Paraíso de Cantor
disciplinas: “Digo cosas que ahora están ocultas, pero llegará el tiempo en
que una persistente diligencia las saque a la luz del día.”
La polémica apasionada de Cantor en la década de 1880 contra quienes,
desde Aristóteles, han negado el infinito actual, puede entenderse como un
primer paso hacia la certificación de la realidad trascendente de los conceptos
inventados por él, pero también como un intento para demostrar informal-
mente su consistencia.16 En una carta a G. Eneström del 4 de noviembre
de 1885 (Cantor 1886), distingue tres modos como puede considerarse —y
cuestionarse— el infinito actual: (i) en cuanto es “lo absoluto” en Dios eterno
omnipotente y extramundano o natura naturans; (ii) en cuanto es “lo transfi-
nito”, presente en concreto en la natura naturata, y (iii) en cuanto puede ser
captado en abstracto por el conocimiento humano “en la forma de números
actualmente infinitos —o transfinitos, como los he llamado— o en la forma
aún más general de los tipos de orden transfinitos” (GA, p. 372). Dejando
de lado el primer modo, Cantor señala que los otros dos dan lugar a cuatro
posiciones filosóficas diferentes: algunos, como Cauchy, Gauß, León XIII (en
la encíclica De philosophia christiana) y “todos los llamados positivistas”,
niegan el infinito actual en concreto y en abstracto; otros, como Descartes,
Spinoza, Leibniz, Locke, Lotze, lo sostienen en concreto y lo niegan en
abstracto; algunos neoescolásticos lo niegan en concreto pero lo afirman en
abstracto; por último,
posible”, sino que “lo posible” es nada menos que “la naturaleza”: para Cantor, como
para nuestro contemporáneo David Lewis, lo posible es lo realmente real.
16 Cantor 1883, 1886, 1887/88 (GA, pp. 165ss., 370ss., 379ss.). Dauben 1979, Capítulo
6, resume y comenta muy bien “la filosofía del infinito” contenida en estos escritos.
62 El Paraíso de Cantor
17 Trascribo este pasaje, destacado en el original por el autor, porque Michael Hallett,
en un libro por lo demás bastante instructivo, hace gran caudal de lo que llama “el
principio del finitismo de Cantor”, que formula así: “Lo transfinito está a la par con
lo finito y matemáticamente se lo debe tratar, en lo posible, igual que a lo finito (like
the finite)” (Hallett 1984, p. 7).
1.7 EL TEOREMA DEL BUEN ORDEN
Y EL AXIOMA DE SELECCIÓN
63
64 El Paraíso de Cantor
1
König 1905 es una versión corregida de esta ponencia. Allí König admite que sólo
ha demostrado la proposición condicional: “Si el lema (1) de Bernstein vale para
todo ordinal α, entonces la Hipótesis del Continuo es falsa”. Como, por otra parte,
la falsedad de la hipótesis del continuo implica el lema (1), la negación de este lema
puede tomarse como una formulación alternativa de la Hipótesis del Continuo que los
partidarios de ésta podrían ensayarse en demostrar. König 1905a combate la posibilidad
de bien ordenar el continuo con otro argumento.
1.7 El Teorema del Buen Orden 65
2
Algunos autores de habla castellana prefieren decir ʻAxioma de Elecciónʼ.
1.7 El Teorema del Buen Orden 67
3
En el Apéndice V doy una paráfrasis de la segunda demostración del Teorema del
Buen Orden por Zermelo.
68 El Paraíso de Cantor
luego se prueba— es ella también una de esas ƒ-cadenas (v. Apéndice V).
Debido a un desplazamiento semántico que ya se manifiesta en este texto
de Zermelo, las definiciones que Poincaré juzga circulares y los términos
definidos por ellas suelen distinguirse con el epíteto ʻno predicativoʼ o
ʻimpredicativoʼ.4 Zermelo observa que el uso de términos no predicativos
es endémico en el análisis: ellos figuran en cada demostración “en que el
máximo o el mínimo de un conjunto numérico ʻcerradoʼ definido previamente
se utiliza para llegar a nuevas conclusiones. Así ocurre, por ejemplo, en la
conocida prueba del Teorema Fundamental del Álgebra por Cauchy, sin que
hasta ahora se le haya ocurrido a nadie hallar en ella algo ilógico” (Zermelo
1908, p. 524).5 Y la verdad es que nadie reconocería un procedimiento falaz
en la descripción de diciembre como “el último mes del año” o del perihelio
de Mercurio como “el punto de la órbita de Mercurio que está más cerca
del sol”. En un diccionario filosófico reciente, Christian Thiel, que milita
entre los enemigos de la ʻimpredicatividadʼ, amaña su definición para evi-
tar los contraejemplos de este género. Impredicativo, según Thiel, es “un
4
Russell (1906) llama ʻpredicativaʼ a una condición (“función proposicional”) que de-
termina un conjunto; ʻno predicativaʼ, entonces, es una que no logra hacerlo, como la
condición ʻx es el conjunto de todos los conjuntosʼ. Poincaré (1905/1906) dice que “las
definiciones que deben ser consideradas como no predicativas son aquellas que contie-
nen un círculo vicioso” (CM, p. 147). Zermelo, que probablemente no había leído el
artículo de Russell, da la impresión de entender que Poincaré en este pasaje —destacado
en cursiva— está definiendo el término ʻdefinición no predicativaʼ. Poincaré acepta
aparentemente esta interpretación en su “Logique de lʼinfini” (1909), cuando distingue
“dos especies de clasificaciones aplicables a los elementos de las colecciones infinitas:
las clasificaciones predicativas, que no pueden ser quebrantadas por la introducción de
nuevos elementos, y las clasificaciones no predicativas, que la introducción de nuevos
elementos obliga a modificar incesantemente” (DP, p. 10). Doy más detalles sobre este
asunto en el Capitulo 2.4.
5
El Teorema Fundamental del Álgebra dice que todo polinomio de grado n ≥ 1, con
coeficientes complejos, a0 + a1x1 +…+ anxn, tiene por lo menos una raíz (en el cuerpo
Ç de los complejos). Un caso ejemplar de impredicatividad es la definición habitual del
supremo o cota superior mínima de un conjunto K ⊂ Â: para todo x, z, y w ∈ Â, x
es el supremo de K si y sólo si (i) si w ∈ K, entonces w ≤ x, y (ii) si para cualquier
w ∈ K, z ≥ w, entonces z ≥ x. (El ínfimo o cota inferior máxima de K ⊂ Â se define
análogamente, mutatis mutandis). Buena parte del análisis clásico depende de un teo-
rema que dice que todo conjunto de números reales que tiene una cota superior posee
un supremo y todo conjunto de números reales que tiene una cota inferior posee un
ínfimo.
procedimiento para delimitar o caracterizar un objeto, que en la descripción
del mismo hace referencia a una totalidad de objetos que…comprendería
al propio objeto en cuestión, y cuyos elementos no pueden todos generarse
constructivamente” (cursiva mía).6 Conforme a esta nueva definición, claro
está, el vicio de impredicatividad no consiste en que se aduzca “circularmen-
te”, para fijar la referencia a cierto objeto, una totalidad que lo presupone,
sino más bien en que la totalidad en cuestión no satisface un requisito de
construibilidad que habría que especificar y justificar. Como la matemática
conjuntista no se deja imponer tales requisitos, el desacuerdo entre Poincaré
y Zermelo nos sitúa, de hecho, en la línea divisoria entre dos grandes ver-
tientes del pensamiento matemático del siglo XX.
6
Mittlestraß, EPW, s.v. imprädikativ/Imprädikativität.
1.8 AXIOMAS PARA UNA TEORÍA DE CONJUNTOS
El escrito anunciado apareció ese mismo año (Zermelo 1908a). Con él nace
la teoría axiomática de conjuntos.
La idea de una teoría axiomática procede de Aristóteles, para quien todo
conocimiento científico propiamente tal (§pistÆmh) se establece por inferencia
deductiva a partir de principios (érxa¤) de dos clases, a saber, conceptos
que no se definen y aseveraciones que no se demuestran. En la literatura
filosófica posterior se los llama, respectivamente, ʻprimitivosʼ y ʻaxiomasʼ.
Los primitivos no tienen que definirse porque cualquiera los entiende. No
es posible, pero tampoco es preciso, demostrar los axiomas, porque son de
suyo evidentes.1 Tradicionalmente se ha visto en los Elementos de Euclides
(publicados alrededor de un cuarto de siglo después de muerto Aristóteles)
una realización ejemplar de esta idea de ciencia. No comparto esta opinión.2
1
Aristóteles explica su idea de una ciencia deductiva en los Segundos Analíticos. Scholz
(1930) ofrece una interpretación de esa obra a la luz de la axiomática moderna (en
el estilo de Hilbert). Sobre esta materia, puede también consultarse mi artículo, “El
método axiomático” (1993).
2
Véase Torretti 1978, pp. 5–9.
71
72 El Paraíso de Cantor
Este pasaje anticipa el nuevo giro que Hilbert le dará poco más tarde a la
idea de una ciencia deductiva, y que inspirará, prácticamente sin rivales, todas
1.8 Axiomas para una teoría de conjuntos 73
12
3 2
δ(v, u) = ∑ ( vi − ui )
i=1
que simplemente llamamos ʻcosasʼ, una parte de las cuales está formada
por los ʻconjuntosʼ.”5 Para comprender esta oración no tenemos que saber
lo que significa la palabra ʻconjuntoʼ, ya que esto es lo que los axiomas
buscan determinar, pero ciertamente tenemos que entender la frase ʻdominio
de objetosʼ. Ahora bien, se preguntará el lector ¿no denota esta frase exac-
tamente lo que hasta aquí, siguiendo a Cantor, hemos llamado ʻconjuntoʼ?
¿asistimos, entonces, a un acto de prestidigitación verbal? En la Sección
1.8.5 presentaré la profunda y original respuesta a tales preguntas que años
más tarde ofrecerá Zermelo (1930). Pero por ahora podemos encarar este
asunto así: la expresión ʻel conjunto Kʼ, en su acepción cantoriana, designa
colectivamente a los elementos de K; en cambio, la frase ʻel dominio ʼ
designa distributivamente a las cosas cuyos atributos y relaciones Zermelo
busca caracterizar con sus axiomas. En efecto, si ʻel dominio ʼ designase
un objeto formado por esas cosas, se podría discernir en otro objeto ,
formado por aquellas cosas de que son conjuntos; entonces , no importa
como se lo describa, sería en efecto el conjunto de todos los conjuntos, cuya
existencia es contradictoria.
Otra diferencia notoria entre la teoría de Zermelo y las axiomáticas habi-
tuales concierne al número y complejidad de los primitivos. Mientras la
geometría de Hilbert tiene ocho, a saber, tres predicados monádicos (ʻpun-
toʼ, ʻrectaʼ, ʻplanoʼ), cuatro diádicos (dos especies de incidencia y dos de
congruencia) y uno triádico (ʻel punto x está entre los puntos z y wʼ), la
teoría de Zermelo sólo tiene un predicado monádico, ʻx es un conjuntoʼ, y
uno diádico, ʻx es un elemento del conjunto yʼ (simbolizado ʻx ∈ yʼ). Entre
esos ocho primitivos, los axiomas de Hilbert postulan relaciones sumamente
complejas, las cuales caracterizan su dominio con tal precisión que, a fin
de cuentas, cualquier modelo (realización) de la geometría de Hilbert es iso-
mórfico† a cualquier otro. Si una teoría axiomática posee esta propiedad se
dice que es monomórfica o categórica. La teoría de Zermelo no es categórica,
5
“Die Mengenlehre hat zu tun mit einem ʻBereichʼ von Objekten, die wir einfach
als ʻDingeʼ bezeichnen wollen, unter denen die ʻMengenʼ einen Teil bilden” (Zermelo
1908a, p. 262). En virtud del Axioma II si a es una “cosa” del dominio hay en
por lo menos un conjunto k tal que a ∈ k. Así, pues, todas las “cosas” de que habla
la teoría axiomática de Zermelo son elementos de conjuntos. Aquéllas que no son con-
juntos a su vez se conocen en la literatura matemática como Urelemente (ʻelementos
primordialesʼ).
76 El Paraíso de Cantor
6
“Nuestro sistema de axiomas justamente es no-categórico, lo que en este caso no es
un inconveniente, sino una ventaja. Pues precisamente sobre este hecho descansa la
enorme significación y la aplicabilidad ilimitada de la teoría de conjuntos en general”
(Zermelo 1930, p. 45). Zermelo se refiere aquí a su sistema ZF′ de 1930, pero el pasaje
también es aplicable al sistema de 1908a.
7
El Axioma I 8 de Hilbert es un buen ejemplo de aserto existencial absoluto: “Hay por
lo menos cuatro puntos que no están todos en un mismo plano”. El Axioma II 2 es
un aserto existencial condicional: “Dados dos puntos A y C, hay siempre un punto B
sobre la recta AC tal que C está entre A y B.” Entre los 18 primeros axiomas de Hilbert
sólo siete no son asertos de existencia: los Axiomas I 5 y II 3 niegan la existencia de
ciertos objetos; los Axiomas I 6, II 1, III 2, III 3 y III 5 afirman que ciertas relaciones
subsisten cada vez que se cumplen ciertas relaciones. Los dos axiomas restantes son
peculiares. El Axioma V afirma que, dados dos segmentos rectos α y β, tales que
α < β, siempre hay un número entero n tal que β < nα. Se trata pues de un aserto
existencial, pero, como n no es un punto, una recta, o un plano, lo que V 1 asevera
1.8 Axiomas para una teoría de conjuntos 77
si hay una cosa b tal que b ∈ a (Zermelo 1908, p. 262, §1.2). Eso es todo
lo que la teoría nos brinda para visualizar qué podría ser un ʻconjuntoʼ y en
qué consiste la relación ʻ∈ʼ.
Los asertos existenciales absolutos establecen el contenido mínimo del
dominio .
Conforme al Axioma II (Axioma de los Conjuntos Elementales), hay un
conjunto tal que no contiene elementos, “el conjunto cero”, simbolizado
“0”. Me parece justificado identificarlo sin más con el conjunto vacío ∅.
Obsérvese que lo que aquí se está diciendo es (a) que hay en (por lo
menos) una cosa, (b) que (por lo menos) una de las cosas que hay en no
contiene elementos, y (c) que no obstante la característica general atribuida
a los conjuntos por la indicación preliminar (§ 1.2), cierta cosa ∅ que no
contiene elementos será tratada como conjunto en nuestro discurso. Evi-
dentemente, como la identidad de un conjunto depende de sus elementos
(Axioma I), este privilegio no puede conferirse más que a una sola cosa.
Completan el Axioma II dos aseveraciones condicionales: si hay en una
cosa cualquiera a, entonces también hay en un conjunto {a}, cuyo único
elemento es a; si hay en dos cosas a y b, entonces también hay en un
conjunto {a,b}, cuyo únicos elementos son a y b.
Conforme al Axioma VII (Axioma del Infinito), hay en por lo menos un
conjunto Z tal que (i) ∅∈ Z y (ii) si a ∈ Z, {a} ∈ Z. Invocando el Axioma
III, Zermelo demuestra que existe en un cierto conjunto Z0 —que es la
parte común a todos los conjuntos Z que cumplen la condición del Axioma
VII— cuyos elementos son ∅, {∅}, {{∅}},… Zermelo propone llamar a
Z0 “la serie numérica”, porque sus elementos puede hacer las veces de nú-
meros. “Constituye el ejemplo más simple de un conjunto ʻenumerablemente
infinitoʼ” (Zermelo 1908, p. 267).
Los asertos existenciales condicionales postulan una expansión colosal
del contenido de .
Como vimos, si hay dos cosas distintas, a y b, las cláusulas condicionales
del Axioma II certifican la existencia de los infinitos conjuntos {a}, {{a}},
{{{a}}},…,{b}, {{b}}, {{{b}}},…, {a,b}, {a,{b}}, {{a},{a,b}}, etc.
Aunque a primera vista parece que la frase “deciden sin arbitrariedad” (ohne
Willkür entscheiden) no es suficientemente precisa (Weyl 1910, p. 304),
una breve reflexión permite extraer del pasaje citado la siguiente definición
recursiva: Una condición P está bien definida (a) si P expresa la presencia
o ausencia de la relación ∈ entre dos cosas; (b) si P se refiere a todas las
cosas que cumplen una cierta condición bien definida con respecto a cada una
de ellas; o (c) si P se infiere de otras condiciones bien definidas, en virtud
de los Axiomas I–VII y de las leyes de la lógica.8 Cabe todavía preguntarse
qué hay que entender aquí por ʻleyes de la lógicaʼ. Como veremos en la
Sección 1.8.2, Skolem (1922) dará a esta pregunta una respuesta radical que
ha tenido mucha aceptación.
El Axioma IV (Axioma del Conjunto Potencia) dice que si T es un con-
junto existente en , también existe en el conjunto potencia PT cuyos
elementos son todos los subconjuntos de T. Combinado con el Axioma VII,
que postula la existencia en de un conjunto infinito (enumerable), el
Axioma IV asegura la existencia en de conjuntos indenumerables cuyos
8
Apliquemos esta definición a los ejemplos de ʻcuestión bien definidaʼ propuestos por
Zermelo. ʻa ∈ bʼ está siempre bien definida en virtud de (a). ʻM ⊆ Nʼ abrevia la
condición ∀x(x ∈ Μ ⊃ x ∈ Ν), la cual está bien definida en virtud de (b), ya que
ʻx ∈ Νʼ —en virtud de (a)— y por ende ʻx ∈ Μ ⊃ x ∈ Νʼ —en virtud de (c)— son
condiciones bien definidas para toda cosa x.
1.8 Axiomas para una teoría de conjuntos 79
ℵ0
cardinales son 2ℵ , 22 ,…
0
9
La apódosis del Axioma VI se puede expresar con más claridad así:
Zermelo estima que sus siete axiomas cumplen este propósito. Confiesa que
no ha podido aún demostrar rigurosamente su consistencia (Widerspruchs-
losigkeit), pero subraya que “todas las ʻantinomiasʼ conocidas hasta ahora
desaparecen en cuanto se adoptan como base los principios aquí propuestos”
(1908a, p. 262).
Weyl observa con razón que hablar de una “decisión unívoca y exenta de
arbitrariedad” es un tanto vago, y propone en cambio una definición re-
cursiva más precisa pero posiblemente más estrecha que la que extraje del
texto original de Zermelo en la Sección 1.8.1. De hecho, Weyl no llega a
formular tal definición, sino que nos invita a construirla por analogía con
ciertos “principios de definición” de los conceptos geométricos enunciados
en la misma conferencia (1910, pp. 299s.). Es lo que intento a continuación.
(El importante concepto de definición recursiva se explica en el Apéndice
VIII. En el siguiente ejemplo, la cláusula señalada con el índice 0 constituye
la base de la recursión):
10
Una proposición P es independiente de un conjunto de proposiciones S si P no es
una consecuencia lógica de S. Como toda proposición es una consecuencia lógica de
Ssi S es inconsistente, la tesis de que P es independiente de S se entiende siempre
sujeta a la condición tácita de que S sea consistente.
11
En el Apéndice VII bosquejo la prueba de que el Axioma VI de Zermelo es indepen-
diente de los Axiomas I–V y VII (Fraenkel 1922a).
84 El Paraíso de Cantor
13
He aquí una traducción literal del texto de Zermelo: “Suponemos dado un domi-
nio B (o en general una pluralidad de dominios B1, B2,…) así como una sistema
R de relaciones fundamentales de la forma r(x, y, z,…), donde las variables x, y,
z,…pertenecen respectivamente a los dominios B” (1929, p. 342). En el simbolismo
matemático actual, las expresiones ʻB1, B2,…ʼ y ʻx, y, z,…ʼ indicarían que Zermelo
está hablando de unas secuencias infinitas de dominios y de variables. En tal caso,
las generalizaciones universales y existenciales a que se refiere la cláusula II.3 de la
definición de ʻdefinitʼ irían precedidas por infinitos cuantificadores. Pero no creo que
Zermelo haya contemplado aquí tan inusitada formación sintáctica. Tampoco creo que
haya pretendido establecer una correspondencia biunívoca entre su lista de variables
y su lista de dominios, como sugiere la frase “las variables x, y, z,… pertenecen
respectivamente a los dominios B”. Por otra parte, no habría inconveniente en admitir
una partición del dominio en infinitos subdominios, y sólo en aras de la brevedad
he omitido mencionar esta posibilidad en mi paráfrasis.
86 El Paraíso de Cantor
esta acepción. Significa más bien lo que hoy llamaríamos un predicado, esto
es, un símbolo que, acompañado de un número idóneo de términos, forma
una proposición. Así, lo que esa cláusula nos está diciendo es que se puede
formar una proposición bien definida cuantificando sobre variables predica-
tivas. Ello implica que la teoría de conjuntos no se deja formalizar en un
cálculo predicativo de primer orden.14
La misma revista —Fundamenta Mathematicae— en que apareció el
artículo de Zermelo (1929) publicó poco después una nota polémica de
Thoralf Skolem (1930). Skolem observa que la definición de ʻdefinitʼ pro-
puesta por Zermelo, en la medida en que es aceptable, equivale a la suya,
publicada mucho antes (Skolem 1922), y se sorprende de que Zermelo no la
mencione. Conforme a la definición de Skolem, una aseveración bien defi-
nida (eine definite Aussage) es cualquier expresión finita construida a partir
de aseveraciones elementales de la forma a ∈ b, o a = b, mediante una o
más de las cinco operaciones siguientes: conjunción, disyunción, negación,
cuantificación universal —“validez en cada caso”— y cuantificación exis-
tencial —“validez al menos en un caso” (Skolem, SWL, p. 139).15 En otras
palabras, una aseveración bien definida es una aseveración bien formada de
un cálculo predicativo de primer orden con identidad y un primitivo único,
el predicado diádico ʻ∈ʼ. Al permitir la cuantificación sobre funciones pro-
posicionales, la cláusula 4 de la definición de Zermelo ciertamente asigna a
ʻdefinitʼ una extensión más amplia que la definición de Skolem. La crítica
de Skolem se dirige principalmente contra esta cláusula. Según él, no está
claro el significado de la expresión ʻF(ƒ)ʼ que allí figura. Designa, al pa-
recer, una función de funciones proposicionales; pero Zermelo no explica
como debe entenderse este concepto. Skolem reclama una mayor precisión
sobre esto. En efecto, según él, si el concepto de función proposicional se
piensa con tal amplitud que abarque el concepto de función de funciones
proposicionales, puede generarse la paradoja de Russell. Por otra parte, si
sólo se admiten funciones de funciones proposicionales construidas a partir
de éstas mediante las cinco operaciones lógicas arriba mencionadas, los
14
Para los lectores que no estén familiarizados con la lógica moderna, doy una versión
de cálculo predicativo de primer orden en el Apéndice IX.
15
Nótese que esta definición concuerda con la de Weyl (1910), que Skolem no mencio-
na.
1.8 Axiomas para una teoría de conjuntos 87
Por lo tanto, si el cardinal del continuo es menor que ℵω, no es posible es-
tablecer en el sistema de Zermelo que hay conjuntos cuyo cardinal sea igual
o mayor que ℵω.18 El Axioma VII, claro está, se puede reformular de modo
que asegure la existencia del conjunto {Z0, Z1,…}, pero el procedimiento
utilizado para definirlo podría entonces aplicársele a él mismo, caracterizando
así nuevos conjuntos cuya existencia, aunque manifiestamente plausible, no
estaría garantizada por el sistema. Fraenkel propone, en cambio, una solución
general de la dificultad que consiste en adoptar el axioma siguiente:
por los estudiosos de la teoría de conjuntos antes de 1925, cuando fue citada por von
Neumann (vide infra, nota 20).
18
Fraenkel hizo esta objeción a Zermelo en una carta fechada el 6 de mayo de 1921
(citada en Moore 1982, p. 263 n. 10).
1.8 Axiomas para una teoría de conjuntos 89
Sea U una aseveración bien definida (definite) que vale para ciertos pa-
res ordenados 〈a,b〉de objetos pertenecientes al dominio de modo que
para cada a hay a lo sumo un b tal que U es verdad. Según a recorre
los elementos de un conjunto Ma, b recorre todos los elementos de un
conjunto Mb.
(Skolem, SWL, pp. 145s.)
John von Neumann fue uno de los matemáticos más versátiles y fecundos
del siglo XX. Su teoría matemática de los juegos y sus ideas sobre el diseño
de computadoras han revolucionado el mundo de los negocios. Su aporte a
la sistematización matemática y la clarificación conceptual de la mecánica
cuántica, aunque muy discutida, también ha tenido una influencia enorme.19
Contribuyó decisivamente a la teoría de conjuntos con una serie de trabajos
publicados cuando tenía entre 20 y 25 años. En esta sección presentaré su
innovadora concepción de los ordinales (1922/23) y las ideas centrales de
su sistema axiomático (1925, 1928), aunque sin dar una presentación com-
pleta del mismo. En el Apéndice VIII explico cómo empleó su teoría de los
ordinales para justificar la definición por inducción transfinita.
Como sabemos, Cantor llegó a definir los ordinales como “tipos de orden”.
Dos conjuntos ordenados tienen el mismo “tipo de orden” si son “similares”,
esto es, si hay entre ellos un isomorfismo de órdenes. Un ordinal es el tipo
de orden de un conjunto bien ordenado. Von Neumann considera que este
procedimiento es “algo vago” y propone reemplazarlo por otro, “basado en
operaciones unívocas con conjuntos”. La definición de Cantor se deja traducir,
por cierto, a términos estrictamente conjuntistas: “El ordinal de un conjunto
bien ordenado es la clase de todos los conjuntos similares a él”. Pero si esto
es un ordinal, no hay ninguna garantía de que existan conjuntos de ordinales
y el intento de formarlos puede generar paradojas.
19
Sobre la teoría de los juegos, véase von Neumann 1928b, von Neumann y Morgenstern
1944. Sobre la mecánica cuántica, véase en particular von Neumann 1927a, 1932;
Birkhoff y von Neumann 1936. La principal contribución de von Neumann al diseño
de la computadora moderna consistió nada menos que en la idea misma de software,
esto es, la idea de que las instrucciones para resolver un problema deben registrarse
temporalmente en la memoria electrónica del aparato —al igual que los datos del
problema, aunque premunidas de un codificación que diferencie estas dos clases de
input— en vez de incorporarlas en la configuración fija de sus circuitos eléctricos. La
idea es simple, pero genial, y aparentemente no se le había ocurrido a ninguno de los
matemáticos e ingenieros que trabajaron en el diseño de computadoras electrónicas antes
de que von Neumann entrase en este campo en 1944. En las primeras computadoras,
construidas para las fuerzas armadas de Gran Bretaña y los Estados Unidos durante la
Segunda Guerra Mundial, había que reconfigurar los circuitos cada vez que se quería
abordar otro tipo de problemas. Cf. Pollack 1982, p. 19.
1.8 Axiomas para una teoría de conjuntos 91
ƒ(x1) = {∅}
ƒ(x2) = {∅,{∅}}
ƒ(x3) = {∅,{∅},{∅,{∅}}}.20
20
Este ejemplo lo daba ya Mirimanoff (1917, p. 46), quien descubrió antes que von
Neumann esta forma de construir los ordinales. Von Neumann conocía la obra del
matemático ruso y la menciona expresamente (1925, p. 230n.).
92 El Paraíso de Cantor
21
Véase la carta de von Neumann a Zermelo del 15 de agosto de 1923 en Meschkowski
1967, pp. 271–73.
1.8 Axiomas para una teoría de conjuntos 93
22
Las dos citas de Fraenkel están tomadas de una carta suya a Ulam, transcrita en parte
en Moore 1982, p. 264.
94 El Paraíso de Cantor
tal modo que de ellos se sigan todos los teoremas deseados de la teoría de
conjuntos cantoriana, pero no las antinomias” (p. 220).
Von Neumann dice que su escrito pertenece a la segunda corriente. Con
todo, el término matemático tradicional que caracteriza mediante axiomas
no es ʻconjuntoʼ, sino ʻfunciónʼ, utilizado luego para definir ʻconjuntoʼ.
Obviamente cualquier conjunto M (en el sentido intuitivo del término) puede
representarse de un modo inequívoco mediante su función característica, que
asigna un valor fijo (por ejemplo, 1) a todos los objetos que pertenecen a
M y otro valor fijo (por ejemplo, 0) a todos los objetos que no pertenecen a
M. El sistema de von Neumann se apoya en esta observación. Sus axiomas
se refieren a dos clases de objetos, llamados informalmente ʻfuncionesʼ y
ʻargumentosʼ (el título formal es ʻcosas-Iʼ y ʻcosas-IIʼ —I. Dinge y II. Din-
ge— pero lo evitaré en mis explicaciones). Hay dos argumentos distinguidos,
A y B (que hacen el papel de 0 y 1 en el ejemplo anterior). Si a y b son
argumentos, 〈a,b〉 es un argumento, el par ordenado cuyo primer elemento es
a y cuyo segundo elemento es b. (Repitiendo la operación de formar pares,
se obtiene el n-tuplo 〈a1,…, an〉 = 〈〈a1,…, an-1〉,
an〉).Si ƒ es una función y
a es un argumento, [ƒ,a] es un argumento, el valor de ƒ en a. Puede haber
argumentos que a la vez son funciones —los llamaré ʻfunciones-argumentosʼ
(el título formal es I.II. Dinge)— y es esencial que haya funciones que no
pueden ser argumentos, esto es, objetos cuyo nombre sólo puede ocupar el
primer lugar —nunca el segundo— en una expresión de la forma [ƒ,a].
Un dominio (Bereich) es una función ƒ tal que, para todo argumento x, o
bien [ƒ,x] = A, o bien [ƒ,x] = B. Si el dominio ƒ es una función-argumen-
to, von Neumann dice que ƒ es un conjunto. Introduce la abreviatura a ∈
ƒ para decir que ƒ es una función y a es un argumento tal que [ƒ,a] ≠ A.
Obsérvese que para usar esta abreviatura no se requiere que [ƒ,a] = B; en
otras palabras, es lícito escribir a ∈ ƒ aunque ƒ no sea un dominio. Por otra
parte, si ƒ y g son funciones, la expresión ʻƒ ∈ gʼ tiene sentido si y sólo si
ƒ es una función-argumento. Evidentemente, si ƒ es un dominio pero no es
un conjunto —esto es, si ƒ no es una función-argumento—, no puede existir
un dominio g tal que ƒ ∈ g. En tal caso, diré que ƒ es un dominio propio.23
23
Entiéndase ʻpropioʼ como lo contrario de ʻimpropioʼ. Más castizo sería decir ʻdominio
propiamente talʼ pero la expresión es incómodamente larga. En la terminología de
Gödel (1940), comúnmente aceptada en la literatura matemática actual, un objeto k es
1.8 Axiomas para una teoría de conjuntos 95
una clase (class) si es el conjunto vacío, k = {x: x ≠ x}, o cumple la condición ∃x(x
∈ k). Si ∀x(k ∉ x), decimos que la clase k es una clase propia (proper class).
24
Gracias a los axiomas del grupo II von Neumann (1928, pp. 670ss.) puede demostrar el
siguiente Teorema de Reducibilidad: Sea τ una expresión formada según las reglas del
grupo I con nombres de argumentos y funciones, los símbolos [, ], 〈, 〉, y n variables
ξ1,…,ξn. Sea τ(a1,…, an) la expresión que se obtiene al reemplazar consistentemente
96 El Paraíso de Cantor
El grupo III postula (1) que hay una función ƒ tal que, para todo par orde-
nado 〈x,y〉, 〈x,y〉 ∈ ƒ si y sólo si x = y; (2) que, si ƒ es una función, hay
una función h tal que para todo argumento x, x ∈ h si y sólo si para todo
argumento y, 〈x,y〉 ∉ ƒ; y (3) que, si ƒ es una función, hay una función h
tal que para todo argumento x, [h,x] = y cuando quiera que y es el único
argumento tal que 〈x,y〉 ∈ ƒ.25
El grupo IV demanda más atención. Los dos axiomas de que consta
sirven, respectivamente, para distinguir a las funciones-argumentos de los
argumentos que no son funciones y de las funciones que no son argumentos.
No obstante la simetría de sus propósitos, su alcance es muy diferente. El
Axioma IV.1 es prescindible, pues no habría ningún inconveniente formal
en suponer que todos los argumentos son a la vez funciones, esto es, que
cualquier objeto de la teoría puede nombrarse en primer lugar en una expre-
sión encerrada por corchetes (aunque esta suposición contraría evidentemente
nuestras ideas intuitivas de argumento y función). En cambio, el Axioma
IV.2 es la pieza central del sistema de von Neumann y de él se deducen el
Axioma de Separación, el Axioma de Reemplazo y el Axioma de Selección.
He aquí una traducción literal de estos axiomas (seguida de una paráfrasis
entre paréntesis):
IV.1 Hay una cosa-II a tal que una cosa-I x es una cosa-I/II si y sólo
si [a,x] ≠ A.
(Hay una función a tal que un argumento x es una función-argu-
mento si y sólo si x ∈ a.)
Como se puede ver, el Axioma IV.2, con toda su tremenda fuerza, es suma-
mente simple. Restringido a cosas-II (funciones) que sean dominios lo que
dice es esto: Un dominio a es un dominio propio— y no un mero conjun-
to— si y sólo si hay una función b que lo aplica sobre el universo de todos
los argumentos. Recordando el distingo tardío de Cantor entre pluralidades
inconsistentes y consistentes (Capítulo 1.6), podemos decir que en el sistema
de von Neumann una pluralidad es “demasiado grande” para ser recogida
como elemento en otra pluralidad si, pero solamente si es “tan grande”
como la pluralidad de todos los objetos ordinarios (conjuntos y elementos
de conjuntos). Pero en este sistema un objeto así “tan grande” admite una
interpretación natural como función que no es a su vez argumento de otra,
y no hace falta entender que los objetos que esa función admite como
argumentos no pueden “existir todos conjuntamente” (Cantor, GA, p. 443;
citado en el Capitulo 1.6).
Los tres axiomas del grupo V —”axiomas del infinito”— equivalen precisa-
mente al Axioma del Infinito, el Axioma de Unión y el Axioma del Conjunto
Potencia. Sólo el primero difiere significativamente en su formulación del
respectivo axioma de Zermelo, pues, aunque postula como éste la existencia
de un conjunto enumerablemente infinito, lo construye de otro modo. Doy
una paráfrasis de este axioma:
26
Pido excusas por este neologismo feísimo, pero firmemente arraigado entre los especia-
listas de habla castellana (algunos prefieren decir ʻcompletitudʼ, que no suena mejor).
Corresponde al sustantivo alemán ʻVollständigkeitʼ y al inglés ʻcompletenessʼ, que
designan justamente la calidad de lo es o está completo (vollständig, complete). Más
eufónico hubiera sido quizás ʻcomplenitudʼ, ligado al verbo latino compleo (de donde
completus, ʻcompletoʼ) del mismo modo que ʻplenitudʼ está ligado con el verbo pleo
(ʻllenarʼ). Pero los profesores de lógica ya no estudian lenguas clásicas.
27
“V.2 (Axioma de completud lineal). El sistema de los puntos de una recta con sus re-
laciones de orden y congruencia no admite una ampliación que preserve las relaciones
entre los elementos anteriores así como las propiedades fundamentales que se derivan
de los Axiomas I–III de orden lineal y de congruencia y V.1” (Hilbert, GG, p. 30; el
Axioma V.1 es el Postulado de Arquímedes). Sin este axioma la teoría de Hilbert no
es categórica, pues el modelo numérico mencionado en la Sección 1.8.1 incluye una
parte propia que satisface los axiomas restantes si se mantiene la interpretación de
los primitivos y la definición pitagórica de distancia, a saber, el conjunto de los tríos
ordenados de números algebraicos. Esta estructura no es isomórfica a la primera, pues
el conjunto de los números algebraicos es numerable, mientras que  no es numerable.
Obsérvese que en virtud del Axioma V.2, el sistema de los puntos construibles con
regla y compás, estudiado por Euclides, no es un modelo de la teoría de Hilbert, 2ª
edición, a pesar de que satisface los Axiomas I–IV y V.1; porque dicho sistema es una
parte propia del espacio homeomorfo a Â3 estudiado por Descartes y los geómetras
modernos, que es un modelo de esta teoría.
100 El Paraíso de Cantor
Von Neumann señala que la relación ʻser un subsistema deʼ que aquí figura
no puede asimilarse a la relación ʻ⊆ʼ definible en su teoría (u ⊆ v si y sólo
si u y v son funciones y para todo argumento x, x ∈ u implica que x ∈ v),
por cuanto el modelo Σ de que se habla necesariamente contiene funciones
(cosas-II) que no son argumentos (cosas-I), y por lo tanto no puede ser él
mismo una función con la que otra función tenga la relación ʻ⊆ʼ. Parecería
pues que hay que entender la relación ʻser un subsistema deʼ en su acep-
ción conjuntista ingenua, que tendríamos que dar por supuesta. El intento
de rescatar la teoría de Cantor mediante la caracterización axiomática de
sus conceptos fundamentales se vería entonces abocado al fracaso. Como
solución de esta dificultad, von Neumann adelanta la idea que me interesa
presentar. Consideremos un modelo P de la teoría de von Neumann que
comprende un sistema IP de argumentos y un sistema IIP de funciones, con
operaciones 〈 , 〉P y [ , ]P y argumentos distinguidos AP y BP. Supongamos
que todas las cosas-I y las cosas-II del anterior modelo Σ están contenidas
en IP y que para toda cosa-II ƒ de Σ hay una función φ en IIP tal que, para
toda cosa-I x de Σ, [φ,〈ƒ,x〉P]P es idéntico al valor [ƒ,x] determinado por la
28
Menciono dos objetos distinguidos A′ y B′ (o, respectivamente, A y B) por seguir a
von Neumann, pero en rigor para obtener un modelo de sus axiomas basta distinguir
una sola cosa del tipo I. En efecto, los axiomas de von Neumann mencionan un solo
argumento distinguido (A); el segundo (B) aparece en las definiciones de ʻdominioʼ y
ʻconjuntoʼ, términos que no se utilizan en los axiomas.
1.8 Axiomas para una teoría de conjuntos 101
Aunque la nueva idea enseguida se revela impotente para fundar una teoría
categórica,29 abre a la reflexión matemática perspectivas insondables. Vere-
mos ahora cómo Zermelo las despliega —con decidido espíritu cantoriano
(y leibniziano)— en la presentación de su segundo sistema de axiomas para
la teoría de conjuntos.
29
Sea N la teoría determinada por los cinco grupos de axiomas de von Neumann y NL
la determinada por N y el axioma ALN. NL es categórica por definición, pero habría
que ver si es consistente (relativamente a N). Para ello hay que formular condiciones
necesarias y suficientes para que un subsistema de un modelo de N sea un submodelo
y hallar un modelo de N ninguno de cuyos subsistemas las satisfaga. Von Neumann
considera imposible formular tales condiciones sin incurrir en un círculo vicioso. Por
ejemplo, el Axioma II.1 es verdadero en un subsistema Σ′ de un modelo Σ de N si y
sólo si hay en Σ′ una función ƒ tal que, para todo argumento x en Σ′, [ƒ,x] = x. Según
von Neumann no es lícito cuantificar sobre los argumentos del subsistema Σ′ en el
enunciado de las condiciones que deben servir para caracterizarlo. Podemos, claro está,
cuantificar sobre los argumentos (y funciones) de Σ, pero entonces obtenemos condi-
ciones suficientes, mas no necesarias para que un subsistema de Σ sea un submodelo.
Von Neumann da una lista de estas condiciones y muestra que todo modelo Σ de N
contiene un submodelo mínimo Σµ que las cumple todas. Entonces ningún subsistema
de Σµ cumple todas esas condiciones, pero cualquiera de ellos podría ser un submodelo
aunque no las cumpla.
102 El Paraíso de Cantor
30
Zermelo (1930) concibe los ordinales como tipos de orden, a la manera de Cantor. Así
entendido, el ordinal α está realizado en el modelo M si existe en M un conjunto bien
ordenado con tipo de orden α. Pero si concebimos a los ordinales a la manera de von
Neumann la expresión ʻα está realizado en Mʼ puede entenderse en sentido literal: ʻel
conjunto α existe en Mʼ. Evidentemente, si α está realizado en M en esta segunda
acepción también lo está en la primera. Por otra parte, si hay en M un conjunto bien
ordenado a con tipo de orden α, los axiomas de Zermelo (1930) aseguran que el ordinal
de von Neumann α también existe en M (α es el alcance de la enumeración de a).
1.8 Axiomas para una teoría de conjuntos 103
delimitar los dominios [de los modelos]” y Zermelo ahora lo considera como
“un principio lógico universal presupuesto por toda nuestra investigación”
(1930, p. 31). 2º Se excluyen los asertos existenciales absolutos, es decir,
la postulación del conjunto vacío ∅ (Ι, primera parte) y el Axioma del
Infinito (VII).31 Se incluyen, pues, aseveraciones equivalentes a los Axio-
mas de Determinación, Separación, Formación de Pares (I, última parte),
Conjunto Potencia y Unión. Se incluye además el Axioma de Reemplazo y
un nuevo “Axioma de Fundación” (mejor conocido en la literatura actual
como “Axioma de Regularidad”), en virtud del cual no puede haber ninguna
secuencia infinita a1, a2,… tal que an+1 ∈ an para todo n ≥ 1 (por ende, no
hay cadenas infinitas de la forma …∈ a3 ∈ ∈
a2 a1, ni ciclos de la forma
a ∈ b ∈ … ∈a).32 Zermelo designa cada uno de estos axiomas por letras
que —con una excepción— corresponden a la inicial del respectivo nombre
alemán. Llama ZF al sistema BAPUVE de los primeros seis, y ZF′ al sistema
completo BAPUVEF (F por Fundierung, ʻfundaciónʼ).33 La presentación de
los axiomas termina con esta importante observación metodológica:
31
El Axioma del Infinito reaparecerá al final, fortalecido a ultranza, como postulado “me-
tateórico”. Con respecto a ∅ tenemos sólo la indicación, en el Axioma del Conjunto
Potencia, de que cualquiera que sea el conjunto m, el respectivo conjunto Pm no está
vacío, sino contiene en cada caso el mismo Urelement arbitrariamente escogido u0
(“que hace las veces del ʻconjunto vacíoʼ”). Esta no es una aseveración absoluta de
existencia, pero implica que, si existe un conjunto, existe al menos un objeto que no
es un conjunto.
32
Gracias a que da por supuesto el Axioma de Selección, Zermelo puede enunciar elegan-
temente su Axioma de Fundación así: Todo conjunto no vacío x contiene un conjunto
y tal que para todo z ∈ x, z ∉ y. Cf. Mendelson 1958.
33
Cito el Axioma de Separación A (Aussonderung): “Toda función proposicional ƒ(x)
separa en cada conjunto m un subconjunto mƒ que contiene todos los elementos x tales
que ƒ(x) es verdad” (Zermelo 1930, p. 30). En una nota al pie de esa página Zermelo
explica que la función proposicional ƒ(x) —así como la función de reemplazo en el
Axioma de Reemplazo— puede ser “enteramente arbitraria”, de modo que “todas las
consecuencias derivadas de limitar estas funciones a una clase especial caducan desde
el punto de vista aquí adoptado ”.
104 El Paraíso de Cantor
34
Por el Axioma de Reemplazo: sea u el reemplazante del primer elemento de r; réem-
placese cualquier otro elemento de r por el conjunto de los reemplazantes de sus
predecesores.
1.8 Axiomas para una teoría de conjuntos 105
35
DEMOSTRACIÓN DE (I). Sea δ la característica de un dominio normal D. Si δ no es un
cardinal hay un ordinal γ < δ, tal que |γ| = |δ|. En tal caso, γ está realizado en D. Por
el Teorema de Cantor, |Pγ| > |γ| = |δ|. Pγ existe en D (por el Axioma del Conjunto
Potencia) y admite un buen orden similar a algún ordinal β. Entonces |β| = |Pγ| >
|δ|, de suerte que δ no es mayor que todos los ordinales realizados en D, contra la
hipótesis. Por lo tanto, δ es un cardinal. Supongamos ahora que σ es un subconjunto
de δ tal que 〈σ,<〉 es similar a 〈α,<〉 para algún ordinal α < δ y que hay un ξ ∈ σ tal
que para todo β < δ, β ≤ ξ. En tal caso, Uσ existe en D (por el Axioma de Unión).
Pero Uσ, por ser la unión de un conjunto de ordinales, también es un ordinal, a saber,
limξ∈σξ = δ. Por lo tanto, Uσ no puede existir en D. En consecuencia, no existe un σ
⊂ δ que cumpla la condición señalada. Por lo tanto, δ es un cardinal regular.
Con un argumento similar al primero de los anteriores, Zermelo prueba también
que si δ es la característica de un dominio normal D, δ = ℵα para algún ordinal límite
α. En efecto, por ser un cardinal, δ = ℵα para algún ordinal α. Pero si α fuera un
ordinal sucesor, α = ξ + 1, el cardinal ℵξ estaría realizado en D y también, por lo
tanto, el cardinal |Pℵξ| ≥ ℵξ+1 = ℵα = δ, y δ no podría ser la característica de D. Por
consiguiente, α es un ordinal límite.
36
DEMOSTRACIÓN DE (II). Sea δ la característica de un dominio normal D. Probaré por
inducción transfinita (Apéndice VIII) que si α es un ordinal menor que δ, ƒ(α) < δ.
Supongamos que ƒ(ξ) < δ para todo ξ < α. Entonces, para todo ξ < α, Pƒ(ξ) existe
en D, de modo que ƒ(ξ + 1) = |Pƒ(ξ)| < δ. Por lo tanto, si α es un ordinal sucesor,
ƒ(α) < δ. Si α es un ordinal límite, sea α′ = {ƒ(ξ): ξ < α}. Como α está realizado
en D, α′ existe en D por el Axioma de Reemplazo y Uα′ existe en D por el Axioma
de Unión. Pero Uα′ = limξ<αƒ(ξ) = ƒ(α), de modo que ƒ(α) < δ, puesto que es un
ordinal que está realizado en D. En la demostración de (I) se vio que δ no puede ser
un ordinal sucesor. Por lo tanto es un ordinal límite y ƒ(δ) = limξ<δƒ(ξ). Si δ < ƒ(δ)
habría un α < δ tal que ƒ(α) > δ, contra lo que se acaba de probar. Por lo tanto, δ =
ƒ(δ).
106 El Paraíso de Cantor
(S1) D 1 = U = Q 0.
(Sα) Si 0 < α < δ, y α es un ordinal límite, Dα = Uξ<α Dξ; si α no es
un ordinal límite, α = β+1 y Dβ+1 contiene todos los objetos de D
cuyos elementos pertenezcan a Dβ.
39
El lector habrá advertido que Zermelo formula su “hipótesis general” en dos versiones
tales que la primera es plausible, pero la consecuencia buscada sólo se infiere de la
segunda, a saber:
Aunque en el texto de Zermelo van unidos por la expresión “es decir” (das heißt),
los asertos (1) y (2) no dicen lo mismo, y no es posible establecer su equivalencia
lógica sin premisas adicionales. ʻConjuntoʼ se usa en (1) en su significado “ingenuo”
ordinario, y no está dicho que sólo un objeto que se llame ʻconjuntoʼ en un modelo
de la teoría ZF′ sea admisible como ejemplo ilustrativo de ese significado.
1.8 Axiomas para una teoría de conjuntos 111
CÁLCULOS
2.1 EL PROGRAMA DE HILBERT
1 En la Sección 1.8.1 me referí brevemente a esta obra. Mario Pieri (1899) publicó casi
al mismo tiempo otra axiomatización de la geometría clásica, muy diferente de la de
Hilbert, pero no menos idónea.
2 Los axiomas de Hilbert definen el sistema de los reales como un cuerpo arquimédico
completo (véase el Glosario, s.v. ‘cuerpo’). Las definiciones clásicas de Weierstraß,
Méray, Dedekind y Cantor determinan sendos modelos (realizaciones) de esta especie
de estructura. Como todos los modelos de un cuerpo arquimédico completo son
isomórficos, dichas definiciones pueden aceptarse como equivalentes.
115
2.1 El programa de Hilbert 116
cia3 de “los axiomas aritméticos”, expresión con la que designa a los axio-
mas de la teoría de los reales. La importancia de este último problema se
puede explicar así: Varias pruebas propuestas en el siglo XIX referían la
consistencia de una teoría dudosa a la de otra teoría incuestionada.
Lobachevsky, por ejemplo, había mostrado que las fórmulas trigonométricas
de su geometría no-euclidiana podían generar una contradicción sólo si la
trigonometría esférica euclidiana era inconsistente. El mismo Hilbert (1899)
había probado que su axiomatización de la geometría euclidiana no era in-
consistente a menos que la teoría de los números reales también lo fuera.
Con ello, ancló las anteriores pruebas de consistencia relativa en la consis-
tencia de la aritmética. Ésta tendría que demostrarse directamente, estable-
ciendo la imposibilidad, no condicional, sino absoluta de inferir una contra-
dicción de sus axiomas. Ante el Tercer Congreso Internacional, celebrado en
Heidelberg, Hilbert (1904) explicó a grandes rasgos cómo habría que proce-
der a tal demostración directa. Esta ponencia, que manifiestamente subesti-
ma la dificultad de la empresa, adelanta ya algunos planteamientos y méto-
dos característicos de su programa de los años 20.4 Pero su renovado interés
en el tema fue motivado al parecer por las críticas de Brouwer (1907, 1912)
y de Weyl (1921) a la fundamentación conjuntista del análisis y el consi-
guiente rechazo por parte de estos eminentes matemáticos de la metodología
matemática habitual.
La filosofía matemática de Brouwer y Weyl cae fuera de los límites de
este libro. Pero para apreciar los motivos y la orientación del programa de
Hilbert no es preciso conocer el pensamiento de estos autores, sino solamen-
te la idea que se hacía al respecto el propio Hilbert (quien, al parecer, no
falsa: no hay una tercera alternativa (non datur tertium); simbólicamente: p ∨ ¬p. Apli-
7 El Principio del Tercero Excluido afirma que cualquier aseveración p es verdadera o es
cias contradictorias), tiene que reputar existente a cualquier objeto cuya per-
tenencia al sistema se infiera de dichas condiciones. Hilbert le da un giro un
tanto distinto a esta idea en la citada ponencia ante el Congreso de París:
8 Cantor exigía además que todo nuevo sistema introducido mediante una caracteriza-
ción consistente estuviese firmemente arraigado en la tradición matemática. En sus pa-
labras: los nuevos conceptos deben “estar en relaciones firmes, ordenadas mediante de-
finiciones, con los conceptos previamente formados, ya existentes y probados” (Can-
tor, GA, p. 182; citado en la Sección 1.6). Podría decirse que Hilbert introduce una
exigencia similar cuando compara un problema matemático nuevo —especialmente cuan-
do lo suscita la investigación de la naturaleza— con “una ramita joven que sólo pros-
pera y da fruto si se la injerta cuidadosamente según las reglas rigurosas del arte del
jardinero en el tronco viejo, el seguro patrimonio de nuestro saber matemático” (1900a;
GA, III, 293s.).
9 Van Dalen (1990) narra cómo Hilbert, que era el director de Mathematische Annalen,
hizo sacar a Brouwer de la lista de colaboradores distinguidos impresa en la portadilla
de la revista —donde figuró desde 1915 hasta 1928— porque, según le notificó, “no
me es posible colaborar con usted, dada la incompatibilidad de nuestros puntos de vis-
ta sobre cuestiones fundamentales”. Una conferencia dictada por Hilbert en 1928 ante
el Seminario Matemático de Hamburgo, contiene la siguiente indisimulada alusión a
Brouwer: “Quitarle al matemático el tertium non datur sería como querer prohibirle el
telescopio al astrónomo o el uso de los puños al boxeador. La prohibición de las ase-
veraciones existenciales y el tertium non datur viene a ser más o menos lo mismo que
la renuncia a la ciencia matemática en general. […] Me asombra que un matemático
ponga en duda la validez rigurosa del modo de inferencia basado en el tertium non
datur. Más me asombra que, al parecer, se haya formado ahora toda una comunidad de
2.1 El programa de Hilbert 120
no era quizás traerlos de vuelta al redil, sino sólo neutralizar de una vez por
todas el efecto descorazonador que sus objeciones pudieran tener sobre los
buenos matemáticos. En interés de la matemática misma, pero también de
toda nuestra cultura, quiere establecer que “las proposiciones matemáticas
de hecho son verdades inexpugnables y definitivas” (1922; GA, III, 162).10
La incertidumbre que todavía prevalece al respecto se debe, según él, a que
los estudios sobre los fundamentos de las matemáticas realizados hasta en-
tonces
matemáticos que lo hace. Pero sobre todo me asombra el hecho de que incluso entre
matemáticos el poder de sugestión de un solo hombre ingenioso y temperamental (die
Suggestivkraft eines einzelnen temperamentvollen und geistreichen Mannes) sea capaz
de ejercer los efectos más excéntricos y más inverosímiles” (Hilbert 1928; GG7, p. 307).
10 Más de una vez Hilbert ha descrito su programa como una cruzada cultural. Por ejem-
plo, en su alocución al Congreso de Matemáticos de Bologna:
¿En qué pararía la verdad de nuestro saber en general y la existencia y el progre-
so de la ciencia si ni siquiera en las matemáticas hubiese una verdad segura? Y en
efecto, hoy por hoy, el escepticismo y el desánimo con respecto a la ciencia sue-
len expresarse incluso en la literatura especializada y en conferencias públicas.
Esto es como una especie de ocultismo, que juzgo dañina. La Teoría de la Prueba
hace imposible tal actitud y nos procura la convicción entusiasta de que al menos
el entendimiento matemático no tiene límites y puede incluso rastrear las leyes
del pensamiento mismo.
(Hilbert 1928a, en GG7, p. 323)
2.1 El programa de Hilbert 121
dos más refinados, reina una total seguridad en las inferencias y una concor-
dancia patente de todos los resultados” (Hilbert 1922; GA, III, 159), y por
lo tanto se justifica aceptar los axiomas que cimientan esa seguridad y con-
cordancia. “Disputar esa justificación sería privar de antemano a toda cien-
cia de la posibilidad de operar” (ibid.). Subsiste, con todo, el problema de
probar la consistencia de los axiomas. Este es justamente el problema que
Hilbert quiere resolver con su nuevo programa.
Contestando a la citada carta de Hilbert (del 29.XII.1899), Frege se pre-
gunta qué medios hay para demostrar que ciertas propiedades o requisitos
no se contradicen mutuamente. Responde así:
El único que conozco es este: Exhibir un objeto que posea todas esas
propiedades, indicar un caso en que se cumplan todos esos requisitos. No
sería posible demostrar la consistencia (Widerspruchslosigkeit) por otra vía.
(Frege, KS, p. 414)
do’. Por eso el término hilbertiano inhaltlich se ha solido traducir al inglés por
‘contentual’, un neologismo que es feo en ese idioma y sería prácticamente ininteligi-
ble en el nuestro. Me parece en cambio que el contraste que hacemos en castellano
corriente (no filosófico) entre la “mera forma” y la “sustancia” de un asunto justifica
mi traducción de inhaltlich.
14 Von Neumann (1927, pp. 1–2) describe estos dos tipos de razonamiento con insupera-
ble claridad:
Hay que distinguir tajantemente entre dos modos diferentes de “demostrar”: El
demostrar formalista (“matemático”) dentro del sistema formal y el demostrar
sustantivo (“metamatemático”) concerniente al sistema. Mientras aquél es un jue-
go lógico definido arbitrariamente (aunque tiene que ser, por cierto, en buena
medida análogo a la matemática clásica), éste consiste en un encadenamiento de
intuiciones sustantivas (inhaltlicher Einsichten) inmediatamente evidentes.
2.1 El programa de Hilbert 125
negación” (Kreisel 1976, p. 94). Este es el objetivo de las tres primeras ta-
reas que von Neumann asigna a la Teoría de la Prueba en la ponencia que
leyó como portavoz del grupo de Hilbert en el simposio sobre fundamentos
de la matemática celebrado en Königsberg en septiembre de 1930 (en que
también hablaron Heyting, por la escuela de Brouwer, y Carnap, por el
logicismo à la Frege-Russell favorecido en el Círculo de Viena):
15 La última cita sigue inmediatamente al texto traducido en la nota 14. Justifica el uso
común en la escuela de Hilbert del epíteto ‘intuicionista’ para calificar los métodos de
razonamiento “sustantivo” admitidos por ella. Herbrand (1931; EL, p. 225, n. 3) define
dicho epíteto con admirable claridad:
Entendemos por razonamiento intuicionista un razonamiento que satisfaga las si-
guientes condiciones: en él se considera sólo un número finito determinado de
objetos y de funciones; éstas están bien definidas, de modo que su definición
permita calcular unívocamente su valor; nunca se afirma la existencia de un obje-
to sin dar el medio de construirlo; nunca se considera el conjunto de todos los
objetos x de una colección infinita; y cuando se dice que un razonamiento (o un
teorema) es verdadero para todo x, esto significa que para cada x tomado particu-
larmente se puede repetir el razonamiento general en cuestión, el cual no debe
considerarse sino como el prototipo de estos razonamientos particulares.
(Herbrand, EL, p. 225 n.3)
2.1 El programa de Hilbert 126
Como estas tres tareas ya fueron ejecutadas casi a cabalidad por Whitehead
y Russell antes de que Hilbert siquiera concibiese su programa, sólo queda
por resolver una cuarta y última tarea, que von Neumann describe aproxi-
madamente en estos términos:
axiomas”. Adviértase que el trabajo en que Hilbert propone este problema no fue in-
cluido en sus Gesammelte Abhandlungen (editados después de la publicación de los
teoremas de incompletud de Gödel).
2.1 El programa de Hilbert 127
ramente con los recursos del análisis combinatorio finito. Por una curiosa
coincidencia, Gödel anunció en la misma reunión de Königsberg sus céle-
bres teoremas de incompletud (Gödel 1930a, 1931). Los estudiaremos en el
Capítulo 2.10. Por ahora, baste indicar, grosso modo, que en virtud de ellos,
si T es una formalización de la aritmética elemental ajustada a las condicio-
nes 1, 2 y 3 no es posible que T sea a la vez consistente y completa. Ade-
más, aunque en dicha formalización T habrá más de una fórmula apta para
representar la oración ‘T es consistente’, ninguna de ellas se puede “probar”
en T a menos que T sea inconsistente. Como los razonamientos del análisis
combinatorio finito ciertamente se dejarían representar mediante “pruebas”
en una tal formalización de la aritmética, sería imposible ejecutar la tarea
cuarta y final del programa de Hilbert “de modo combinatorio finitista”. Pero
Hilbert nunca había explicado con tanta precisión como von Neumann el
significado de su “postura finita” y gracias a eso pudo eventualmente “am-
pliar el marco metódico” de su programa a la luz de los hallazgos de Gödel,
sin admitir su fracaso.17
17 Véase la Sección 2.9.4. También el Capitulo 2.12, primer párrafo y nota 1, donde me
refiero a Hilbert y Bernays 1939, § 5, “Der Anlaß zur Erweiterung des methodischen
Rahmens der Beweistheorie” (“El motivo para ampliar el marco metódico de la Teoría
de la Prueba”). El tomo I de la misma obra contiene la siguiente explicación, elocuente
pero no muy precisa, sobre el significado del adjetivo ‘finit’ (que generalmente traduz-
co ‘finitista’):
Con la palabra “finit” queremos siempre expresar que la reflexión, aseveración o
definición así calificada se ciñe a los límites de la representabilidad de objetos y
de la ejecutabilidad de procesos y por lo tanto se realiza en el marco de una con-
sideración concreta.
(Hilbert y Bernays 1934, p. 32)
Leibniz soñó con “una lengua o escritura universal” en que “los caracteres y
las palabras dirigirían la razón y los errores que no fuesen errores de hecho
no serían sino errores de cálculo” (GP, III, 605). En dicho lenguaje artificial,
toda falacia del razonamiento estaría vedada por la sintaxis, de modo que
Para lograr este resultado, Leibniz propuso extender a la lógica los méto-
dos algebraicos utilizados con tanto éxito en aritmética y geometría. Entre
sus papeles quedaron —inéditos hasta el siglo XIX— algunos ensayos rudi-
mentarios de lógica algebraica. Pero la idea de un álgebra de la lógica sólo
toma vuelo con los libros de Boole (1847, 1854).2 La tradición booleana,
cultivada en Inglaterra por Jevons y en América por Peirce, fue recogida y
promovida en Alemania por Ernst Schröder (1877, VAL: 1890–1905). Para
el filósofo norteamericano C. I. Lewis —que publica un Panorama de la
lógica simbólica en 1918— “el álgebra clásica de la lógica” lleva los apelli-
dos de Boole y Schröder. En cambio, Hilbert, que sin duda los conocía, no
suele nombrarlos entre los precursores de su programa, cuya iniciación atri-
1 Véase asímismo Leibniz, GP, VII, 204–207 (traducción castellana en Leibniz, EF, pp.
188–193).
2 Los aportes más interesantes de Leibniz son quizás los dos “especímenes” en GP, VII,
228–247 (traducción inglesa en Leibniz, LP, pp. 122–144). En el siglo XVIII hubo
algunos intentos aislados por desarrollar un cálculo lógico; al respecto, véase C. I. Lewis
1918, pp. 18–51, quien destaca sobre todo la obra de J. H. Lambert.
129
2.2 Escritura conceptual 130
buye, como hemos visto, a Gottlob Frege —a quien Lewis dedica menos de
una página de su Panorama (1918, pp. 114s.)— y a sus continuadores Russell
y Whitehead.
Varias razones justifican, a mi modo de ver, esta preferencia de Hilbert
por Frege. En primer lugar, Frege creó su propia lengua artificial (Escritura
conceptual, 1879) con el propósito específico de expresar en ella razonamien-
tos matemáticos y utilizarla en la fundamentación estrictamente lógica de la
aritmética. En cierto modo, pues, el proyecto de Frege anticipa directamente
el programa de Hilbert. Además —como reconoce el propio Lewis— Frege
entendió antes que nadie los requisitos que ha de cumplir la representación
escrita de un razonamiento deductivo para que la corrección o incorrección
del mismo pueda controlarse mediante un cálculo. Pero, sobre todo, debe-
mos a Frege el análisis moderno de los predicados relacionales y la genera-
lización universal, que hizo posible entender muchas demonstraciones mate-
máticas como casos de simple inferencia lógica.3
Frege abraza sin reservas la clasificación kantiana de las verdades en
analíticas y sintéticas. Mejorando a Kant, caracteriza ambas clases de modo
que constituyan una genuina partición: verdades analíticas son las que se de-
ducen de leyes lógicas y meras definiciones; cualquier verdad que no es ana-
lítica es sintética.4 La meta de sus investigaciones lógico-matemáticas es de-
mostrar que las verdades de la aritmética y del análisis son, en este sentido,
3 Conviene, sí, recordar que también Peirce (1870, 1880, 1882, 1883) desarrolló por esos
mismos años —independientemente de Frege— la lógica moderna de la generalización
y de los predicados poliádicos. Por otra parte, como ha mostrado Goldfarb (1979), la
generalización vino a entenderse cabalmente como la entendemos ahora sólo después
de 1920, precisamente en la escuela de Hilbert.
4 Para Kant una aseveración es analítica si el predicado está contenido en el concepto
del sujeto y es sintética si el predicado no está contenido en el concepto del sujeto. Las
aseveraciones disyuntivas y condicionales, que no se dejan analizar en sujeto y predi-
cado, no caen, pues, en ninguna de estas dos clases, según Kant. Frege tuvo que pro-
poner una caracterización diferente porque en un comienzo rechazó el análisis tradicio-
nal de las aseveraciones en sujeto y predicado (Frege 1879, p. 3). Su caracterización
aventaja también a la kantiana en cuanto permite clasificar sin dificultada como analí-
ciones S si α ocupa el último lugar en una lista de aseveraciones cada una de las cuales
una de ellas, diremos que α se deduce de S, por cuanto α ocupa ciertamente el último
lugar de la lista cuyo único miembro es α y, por hipótesis, α ∈ S.
5 Antes de leer el resto de este capítulo —y los siguientes— el lector que no haya estu-
diado algo de lógica moderna debiera darle una ojeada al Apéndice IX sobre el cálculo
predicativo. Como la exposición es bastante concisa, no creo que le aproveche a quien
no tenga ya cierta práctica en la lectura de obras matemáticas. El lector que no la ten-
ga debe leer uno o dos manuales de lógica. Recomiendo a Jeffrey 1981 y Mates 1970,
cuyas virtudes se complementan.
6 Ello genera sorpresas. Así, a la luz de los ejemplos de Frege 1879, p. 51, y de una
lectura desaprensiva de los §§ 9–12, el lector pensará ingenuamente que, en la expre-
siones f(b), g(b), h(b) de la Proposición 60 (p. 52), la letra b es una constante o varia-
ble individual, y las letras f, g y h son predicados. Pero en la p. 69 se nos manda
de la forma f(Γ) por expresiones de la forma Γ(y), de modo que f(b) ha de reemplazar-
sustituir, en la Proposición 60, la letra b por la variable predicativa ᑠ y las expresiones
se con ᑠ(y).
2.2 Escritura conceptual 132
7 Los tres artículos mencionados están bien traducidos al castellano en Frege, LS.
8 Frege dice que esta clasificación de los signos y sus funciones se inspira en el ejemplo
como +, × , √ con un significado fijo. Pero los matemáticos, según él, no son entera-
de la matemática que usa letras a, b, x, y,… con significado variable e ideogramas
mente consecuentes, puesto que usan combinaciones de letras, como log, sen, Lim, como
ideogramas (1879, p. 1 n.).
9 Frege 1879, p. 2n., dice que las mayúsculas griegas son “abreviaturas” a las que el
lector ha de asignar cualquier sentido apropiado, cuando no estén expresamente defini-
das por el autor.
2.2 Escritura conceptual 133
10 Nótese que Frege identifica aquí la representación evocada por los signos —que puede
variar mucho de lector en lector— con el pensamiento expresado mediante ellos —que
ha ser el mismo para todos si la escritura sirve como medio de comunicación—; más
tarde distinguirá enfáticamente estas dos cosas. Más grave me parece la confusión si-
2.2 Escritura conceptual 134
tratar el par 〈‘la casa’, ‘Juan’〉 como variable.11 En Escritura conceptual, Frege
emplazar ‘la casa’ por ‘la mujer’, ‘la profesión’, ‘el país’, etc., o fijar ‘de’ y
go, tomado del álgebra lineal: Si V es un espacio vectorial sobre el cuerpo Â, las apli-
caciones lineales de V en  forman otro espacio vectorial V* sobre Â. Las aplicacio-
1879. Pero este análisis rebasa ahora los estrechos límites a que lo confina-
ba la tradición. Según ella, cada aseveración simple se refería a un solo objeto,
el sujeto, denotado por una expresión saturada, y le atribuía una propiedad,
designada con una expresión insaturada, el predicado. En cambio, como Frege
entiende que las expresiones insaturadas denotan funciones —en una acep-
ción del vocablo inspirada en la terminología matemática—, puede con toda
naturalidad admitir que una aseveración simple se refiera a un n-tuplo de
objetos (n = 1, 2,…) y les atribuya una relación (si n > 1). Por otra parte,
a la luz del análisis fregeano, es claro que un predicado (expresión insaturada)
no puede hacer las veces de sujeto (expresión saturada). Así, si ‘Hp’ signifi-
ca ‘Píndaro es hombre’ y ‘Gp’ significa ‘Píndaro es griego’, no es lícito poner
en la primera oración ‘G’ en el lugar de ‘p’ para significar (i) ‘Todo griego
es hombre’ o (ii) ‘Algún griego es hombre’. En estas oraciones del lenguaje
corriente, el sujeto gramatical —‘todo griego’, ‘algún griego’— no denota
un objeto al cual se atribuye el predicado sino que circunscribe la clase a
que ese objeto pertenece (mediante un predicado común a todos los miem-
bros de esa clase). Así, según Frege, lo que dicen las oraciones citadas que-
da mejor expresado por (i) ‘Si algo es griego, también es hombre’ y (ii) ‘Hay
lo predicativo: (i) ∀x(Gx → Hx); (ii) ∃x(Gx ∧ Hx)). Gracias a estas innova-
algo que es griego y también hombre’ (en el simbolismo estándar del cálcu-
ciones, Frege pudo poner de manifiesto, como dije, la índole puramente ló-
gica de muchas demostraciones matemáticas.14
Ahora puedo dar con Frege una definición más clara y satisfactoria de la
línea @ y de los cuatro signos de BS que arriba dejamos sin definir (cf.
Frege 1893, pp. 9–12). Usaré la letra negrita v para nombrar lo verdadero y
la f para nombrar lo falso. La línea @ designa la función cuyo valor es v en
el argumento v y cuyo valor es f en cualquier otro argumento.15 El signo #
con ‘R2rd ∧ r > 0’), “Cuatro es el cuadrado de dos” (‘Qcd’) y “Toda raíz cuadrada de
14 Por ejemplo, de las premisas “√2 es la raíz cuadrada positiva de dos” (que representaré
un número es una raíz cuarta del cuadrado de ese número” (‘∀x∀y(Qyx → ∀z(R2zx →
R4zy))’) se deduce fácilmente que “√2 es una raíz cuarta de cuatro” (‘R4rc’), una con-
clusión obvia que sin embargo es inaccesible a la lógica aristotélica.
Así pues, la función @, restringida a valores veritativos, es precisamente la aplicación
x Å x (@‚Γ = v si Γ = v y @‚Γ = f si Γ = f), lo cual explica que no haya una signo
15
para ella en el simbolismo lógico actual: normalmente sería superfluo. Pero Frege no
deslinda explícitamente el dominio de sus funciones, a las que trata como si cada una
2.2 Escritura conceptual 138
de ellas estuviera definida en todo el universo de objetos. Esto es una ilusión, pues si
W designa el universo de objetos, una función irrestricta binaria (una “función de dos
variables”) no está definida en W sino en W2, una función ternaria en W3, etc.
16 Esta función, como todas las de Frege, está definida para cada objeto (nota 15). Según
esto, #x es v aunque ‘x’ no denote un valor veritativo.
17 Frege 1879, p. 5, dice que “si Α y Β significan contenidos aseverables, hay las cuatro
posibilidades siguientes: (1) se afirma Α y se afirma Β; (2) se afirma Α y se niega Β;
(3) se niega Α y se afirma Β; (4) se niega Α y se niega Β. ¡$ Α significa entonces la
^Β
aseveración de que la tercera de estas posibilidades no se cumple, sino una de las
otras tres.” A la luz de esta caracterización, Baker y Hacker (1984), concluyen que en
1879 Frege no había dado aún con la definición verifuncional de la implicación, des-
cubierta por Filón de Megara en el siglo III a.C. El texto citado respalda este diag-
nóstico sólo si se toma al pie de la letra, esto es, si se entiende que ¡$ Α es una
^Β
aseveración biográfica relativa a lo que alguna persona indeterminada de hecho aseve-
10–11 del mismo libro trata como equivalentes las expresiones ‘se afirma Β’ (‘Β wird
ra o no asevera. Pero no creo que fuera la intención de Frege entenderlo así. En las pp.
18
(Α → Β) se lee ‘si Α, entonces Β’ y tienen luego que enfrentar la mirada escéptica de sus
Su buen sentido contrasta con la irreflexión de esos profesores de lógica que enseñan que
alumnos cuando, a resultas de ello, se ven forzados a sostener que un enunciado como ‘si
la luna está hecha de queso, entonces 2 + 2 = 4’ expresa una verdad necesaria.
2.2 Escritura conceptual 140
/A
^B
!B
!A
19 En la nota 6 mencioné las sustituciones que Frege aventura para probar la Proposición
90. Hay otros ejemplos.
20 Por ejemplo, el axioma 1 excluye el caso en que p es f, q es v y p es v, el cual es
evidentemente imposible, puesto que p no puede ser v y f a la vez (Frege 1879, § 14).
Por cierto, esto no es una demostración del axioma; pero al aclarar lo que éste signi-
fica se pone de manifiesto que no es posible negarlo.
2.2 Escritura conceptual 142
1. (p → (q → p))
2. ((p → (q → r)) → ((p → q) → (p → r)))
8. ((p → (q → r)) → (q → (p → r)))
28. ((p → q) → (¬q → ¬p))
31. (¬¬p → p)
41. (p → ¬¬p)
52. ((c = d) → (Φ(c) → Φ(d)))
54. (c = c)
58. (∀xΦ(x) → Φ(a))
cos” se llenen todos con τ. Entonces, como demostrará Gödel (1930), los
una expresión insaturada que se convierte en una oración en cuanto sus “blan-
21 Doy a cada axioma el número que tiene en el libro de Frege (los números intermedios
corresponden a teoremas deducidos de los axiomas precedentes). La “traducción” ofre-
cida demanda algunos comentarios. Debemos recordar que en BS, el signo ‘=’ (‘≡’ en
1879) funciona como nuestro símbolo de identidad ‘=’ si las expresiones a la izquierda
y la derecha son variables individuales o nombres de objetos, y como nuestro símbolo
de equivalencia ‘↔’ si dichas expresiones son oraciones. Frege permite sustituir las
letras c y d que figuran en los Axiomas 52 y 54 tanto por nombres como por oracio-
nes. Por último, como señalé en la nota 6, en 1879 Frege se permite reemplazar la
variable ligada en el Axioma 58 no sólo por nombres, sino también por predicados.
2.2 Escritura conceptual 143
22 En una carta dirigida a Frege en esa fecha, Russell vincula directamente la paradoja
que hoy se conoce por su nombre a la liberalidad con que Frege admite y maneja las
variables predicativas en Escritura conceptual. Esa liberalidad se manifiesta
específicamente en la práctica fregeana —a que aludí en la nota 6— de sustituir por un
predicado la variable c que figura en la línea superior del Axioma 58, . Sea w el pre-
dicado “…es un predicado no predicable de sí mismo”. Russell se pregunta si w es
predicable de sí mismo. Como quiera que se conteste esta pregunta, se obtiene una
contradicción. Por lo tanto, concluye Russell, w no es un predicado. Pero la contradic-
ción es inevitable bajo las reglas (o prácticas) de Escritura conceptual. En efecto, en el
1‚((@ºw(w)) ≡ (#ºw(w)))
Russell agrega: “Asímismo, no hay ninguna clase (como un todo) de aquellas clases
que —como todos— no se pertenecen a sí mismas. De ello concluyo que bajo ciertas
circunstancias un conjunto definible no forma un todo (eine definierbare Menge kein
Ganzes bildet).” (Frege, WB, p. 211). La paradoja de Russell surge, por cierto, tam-
bién en el sistema más riguroso de Frege 1893/1903 (véase el Apéndice XII).
2.3 FUNDAMENTOS DE LA ARITMÉTICA
1 Al redactar este capitulo tuve a la vista con mucho provecho la obra de Gillies (1982)
y la Sección XIX del libro de Crispin Wright (1983).
145
2.3 Fundamentos de la aritmética 146
P1 1 ε N.
a ε N. ç . a + 1 ε N.
(1 es un número.)
P2
a, b ε N. ç . a = b. = . a + 1 = b + 1.
(Si a es un número, el siguiente de a es un número.)
P3
(Si a y b son números, a es igual a b si y sólo si el siguiente de a
a ε N. ç . a + 1 ⴚ= 1.
es igual al siguiente de b.)
P4
k ε K. ç ∴ 1 ε k ∴ x ε N. x ε k : çx . x + 1 ε k : : ç . N ç k.
(Si a es un número, el siguiente de a no es igual a 1.)
P5
(Si k es una clase tal que (i) 1 pertenece a k y (ii) para todo objeto
x, si x es un número y x pertenece a k, también el siguiente de x
pertenece a k, entonces k incluye a toda la clase de los números.)
2 En un artículo sobre “Los principios de la lógica matemática” aparecido dos años más
tarde, Peano cita a Frege 1879, pero sólo para informar al lector que, “en vez de a ç
b, [Frege] escribe / a ” (Peano 1891, n. 5). El 30 de enero de 1894, contestando a una
^b
carta de Frege, Peano le comunica que “j’ai acheté il y a quelques temps vos Die
Grundlagen der Arithmetik [Frege 1884]” y el 3 de octubre de 1896 le cuenta que acaba
de releer Begriffschrift (1879) y Grundgesetze (tomo I, 1893), “avec nouveau plaisir”
(Frege, WB, p. 177, 189), pero no sabemos cuando leyó estas obras por primera vez.
Peano publicó en 1895 una reseña del tomo I de Grundgesetze que dio lugar a una
interesante respuesta de Frege.
3 En el libro de Peano los axiomas P2–P5 llevan los números 6, 7, 8 y 9, respectivamen-
te. Los números 2–5 corresponden a axiomas que gobiernan el uso entre números del
signo ‘=’, el cual se emplea a la vez como símbolo de la equivalencia entre asevera-
ciones y de la igualdad aritmética. Peano (1898) enuncia sólo cinco axiomas de la arit-
mética, correspondientes a P1–P5 (supongo que esta simplificación se debe a que lle-
gó a pensar como Frege que los axiomas que gobiernan el símbolo ‘=’ en ambos usos
pertenecen a la lógica general; cf. nota 5). Allí emplea el símbolo ‘0’ en vez de ‘1’
para designar al miembro distinguido de la clase N, esto es, el objeto que según P1 es
un número y según P4 no es igual al siguiente de ningún número; con ello se evita la
perniciosa confusión entre ‘1’ y ‘+1’ que comento en la nota 4.
2.3 Fundamentos de la aritmética 147
çx, la constante K y los puntos. Hay además tres símbolos nuevos, no defi-
nidos, que son los primitivos de su aritmética, a saber, N, 1 y la expresión
+1.4 Antes de examinar la índole sintáctica de estos primitivos y las condi-
ciones semánticas que les imponen los axiomas, conviene hacer algunas ob-
servaciones sobre los signos de uso general. Peano dice que “K significa clase
o agregado de entes”. Los puntos funcionan como los paréntesis en el álge-
bra, entendiéndose que, en una fórmula dividida por puntos, se asocian, ante
todo, los signos que no están separados por ningún punto; enseguida, los
binaria que asigna a cada par de números 〈x,y〉 el número que es la suma de x e y.
P1, y el signo ‘+’ que lo precede no representa aquí la adición, es decir, la función
a, b e N. ç . a + (b + 1) = (a + b) + 1
Peano explica que ε debe leerse ‘es’ (§st¤ en griego; è en italiano). Cabría,
uno de los elementos de— la clase o colección de objetos llamada k. Pero
pues, entender este signo meramente como una cópula que une el sujeto
haga falta suponer que hay una clase de todas las clases denotada por la
constante K.
sólo si, cualquiera que sea el objeto x, x ε a implica que x ε b. En esta fun-
(o conjuntos), simbolizada por ç. Si a y b son clases, entonces a ç b si y
5 Como vimos en la p. 142, n. 21, también Frege utiliza su signo de identidad = para
expresar la equivalencia entre oraciones. Pero en su sistema esto no constituye un uso
equívoco de dicho signo, ya que, según él, una oración denota su valor veritativo. Ob-
viamente, si dos oraciones son equivalentes, el valor veritativo que ambas denotan es
uno y el mismo.
2.3 Fundamentos de la aritmética 149
a, b ε Κ. ç ∴ a ç b : = : x ε a. çx. x ε b (50)
Aquí ç significa inclusión cuando está escrito entre los nombres de clase a
y b, pero significa implicación en los otros casos. Con el subíndice x que
acompaña a la última implicación Peano quiere decir que ésta vale cualquie-
clase N está incluida en cualquier clase k que reúna los dos requisitos si-
guientes: (i) k contiene el elemento distinguido 1 y (ii) si x es cualquier objeto
entendemos —como parece haber entendio Peano— que cada propiedad atri-
buible a objetos determina una clase formada por los objetos que tienen esa
propiedad, el axioma P5 justifica un método para demostrar que una propie-
dad es común a los objetos de la clase N. Sea k la clase formada por los
objetos que tienen la propiedad k*. En virtud de P5, para probar que todos
cumplir 〈N,σ,1〉 para que satisfaga además el axioma P5? En Was sind und
sollen die Zahlen? (1888), Dedekind había dado a esta pregunta una respuesta
que Peano no incorpora a su tratamiento del asunto, posiblemente porque
cuando redactó Arithmetices Principia (1889) todavía no había estudiado bien
aquel libro (que cita, sin embargo, en su Prefacio). Pero antes de hablar de
ella, conviene tener presentes algunos ejemplos de estructuras que efectiva-
mente satisfacen los cinco axiomas P1–P5. Sea N el conjunto de los símbo-
7 Nótese que digo los símbolos, no los objetos (números) que ellos supuestamente repre-
sentan. Qué sean estos objetos es lo que Peano y Dedekind buscaban establecer. Para
que el conjunto de símbolos {1, 2, 3,…} esté bien definido es preciso, claro está,
disponer de una regla que determine la figura del sucesor inmediato de cualquier sím-
bolo dado. Pero evidentemente disponemos de ella. ¿No sabe acaso el lector escribir
en el acto el número que sigue a 37.045.622.876.359? Con un pequeño esfuerzo puede
también sin duda nombrarlo, en castellano, en inglés y en cuántas lenguas conozca.
2.3 Fundamentos de la aritmética 151
10 Esto se debe, seguramente, a la índole misma de las aplicaciones que Dedekind consi-
dera en su libro. El codominio B de una aplicación ƒ: A Æ B cobra importancia como
factor individualizador cuando atendemos a las propiedades inherentes a ƒ en virtud de
las estructuras características de A y B. Por ejemplo, si S es una superficie curva en el
espacio euclidiano E, la métrica estándar de E induce una métrica en S (que determi-
na, por ejemplo, cuales son las rutas más cortas que puede seguir una hormiga que
camina sobre S). La inclusión : S Æ E, x Å x, que asigna a cada punto x de la
superficie S el mismo punto considerado como elemento del espacio E, difiere enton-
ces de la identidad IS: S Æ S, x Å x, puesto que IS es una isometría, pero normal-
mente no lo es (dos pares de puntos equidistantes en S generalmente no equidistan en
E).
2.3 Fundamentos de la aritmética 154
se verá más adelante, un conjunto equinumeroso con ω). Mas para establecer la equi-
Dedekind también es infinito en el sentido intuitivo (pues necesariamente incluye, como
equinumeroso con ω puede biyectarse sobre una parte propia suya (1888, #159).
de hecho implícitamente en su demostración de que cualquier conjunto que sea
12 Dedekind razona así: Sea G el sistema de todas las cosas que pueden ser objeto de mi
pensamiento. Si g es un elemento cualquiera de G, llamaré g′ al pensamiento de que g
ser objeto de mi pensamiento). No todo elemento de G pertenece a ϕ(G) (ya que hay
que g puede ser objeto de mi pensamiento es distinto del pensamiento de que t puede
objetos posibles de nuestro pensamiento que no son pensamientos acerca de otros ob-
jetos). Por lo tanto, G es infinito. (Boolos 1990 hace interesantes observaciones sobre
este argumento de Dedekind).
Años más tarde, Dedekind retirará esta “prueba” porque la suposición de que existe
el sistema G lleva directamente a las paradojas de la teoría de conjuntos, aunque ex-
presaba todavía la confianza en que “una investigación rigurosa de la capacidad crea-
dora del espíritu para formar con elementos determinados un nuevo [objeto] determi-
nado, su sistema, que necesariamente se distingue de cada uno de esos elementos,
conducirá sin duda a una reformulación de los fundamentos de mi escrito que supere
todas las objeciones” (citado por Webb 1980, p. 63). Como vimos en el Capítulo 1.8,
los conjuntistas del siglo XX simplemente postulan que existe al menos un conjunto
infinito. Es más claro y honesto.
2.3 Fundamentos de la aritmética 155
propia imagen ϕ(K). En otras palabras, un sistema K es una cadena con res-
pecto a una aplicación ϕ: S Æ S si y sólo si ϕ(K) ⊆ K ⊆ S. En aras de la
brevedad diré ‘ϕ-cadena’ en vez de ‘cadena con respecto a ϕ’. Obviamente,
el propio sistema S es una ϕ-cadena. Consideremos ahora una parte cual-
quiera A ⊆ S. La ϕ-cadena de A —designada en el libro de Dedekind por
A0— es la intersección de todas las ϕ-cadenas que incluyen a A. Obsérvese
13
Ahora bien, (i) equivale a la cláusula 1 ∈ k (‘1 ε k’) del axioma P5; por
otra parte, si N = 10, (ii) dice precisamente que ∀x((x ∈ N ∧ x ∈ k) → σ(x)
∈ k) (‘x ε N. x ε k : çx . x + 1 ε k’). Por lo tanto, bajo las condiciones
antedichas, N ⊆ k. Por otra parte, si N ≠ 10, tenemos que N å 10 aunque 1
∈ 10 y si x ∈ N y x ∈ 10, σ(x) ∈ 10. Por lo tanto, si N ≠ 10, el propio
sistema 10 proporciona un ejemplo de una colección de objetos que reúne
las condiciones prescritas a k en el axioma P5 y sin embargo no incluye a
N.
existe un objeto 1 ∈ S tal que 1 ∉ σ(S) (el lector recordará que esto sólo es
los números naturales. En efecto, 〈10,σ,1〉 satisface P1–P4 por la forma cómo
puede por lo tanto prestar todos los servicios que la matemática espera de
α. ϕ(N) ⊆ N.
β. N = 10 (la ϕ-cadena de 1).
γ. 1 ∉ ϕ(N).
δ. ϕ es similar (inyectiva).15
γ, δ en el #71 y por ende son siempre las mismas en todos los sistemas
ordenados simplemente infinitos, —cualesquiera que sean los nombres que
casualmente se asignen a los elementos particulares— constituyen el ob-
jeto inmediato de la ciencia de los números o aritmética.
(Dedekind 1888, #73)
15 Dedekind 1888, #71. He colocado el texto de los postulados α–δ fuera de la cita entre
comillas porque no uso la misma notación que Dedekind.
16 En efecto, si ƒ: S Æ S es cualquier aplicación y A ⊆ S, la ƒ-cadena de A, A0 = A ∪
ƒ(A0) (Dedekind 1888, #58). Por lo tanto, N = 10 = {1} ∪ ϕ(10) = 1 ∪ ϕ(N). La citada
(ya que A ⊆ A0) y, como L es una ƒ-cadena, la demostración del lema utilizado en la
nota 13 para probar la proposición #57 indica que también K es una ƒ-cadena tal que
2.3 Fundamentos de la aritmética 158
determinado por dos de ellas, entonces H, así descrito, realiza todos los teo-
remas de la geometría proyectiva plana. Sorprende por eso que Frege, cuya
tesis doctoral (1873) versó sobre un tema de geometría proyectiva, haya re-
sistido el enfoque estructuralista aun allí donde, como en la teoría axiomática
de la geometría de Hilbert, su necesidad saltaba a la vista.22 La diferencia
esencial entre su fundamentación de la aritmética y la propuesta por Dedekind
se debe justamente a esta extraña resistencia —o, mejor dicho, ceguera— de
Frege. Así como los teólogos demandan un concepto de Dios que no tenga
más que un solo ejemplar, Frege exige una definición de número que certi-
fique la unicidad del uno, el dos, el tres, etc. Como veremos, esta exigencia
lo indujo a la contradicción que arruina su teoría.23
La primera contribución importante de Frege a la fundamentación de la
aritmética aparece en la tercera parte de Escritura conceptual (1879, pp. 55–
87). Consiste en la demostración de varios teoremas de lo que Frege llama
“Teoría general de las series (allgemeine Reihenlehre)”. Uno de ellos pro-
vee, como el TIC de Dedekind, una justificación directa para la inducción
matemática finita. Camuflados en la escritura BS, estos resultados de Frege
no llamaron la atención de Dedekind y Peano cuando elaboraban sus teorías
de la aritmética. Como suele ocurrir en matemáticas, el genio del autor se
24 Las palabras ‘se puede …únicamente’ corresponden a la frase alemana ‘wird es allein
möglich’ empleada por Frege. Con ella expresa una apreciación singularmente exage-
rada de su propia obra. Como vimos, Dedekind no necesita los conceptos fregeanos
para llegar al TIC con una soltura y elegancia que una persona condenada a leer úni-
camente a Frege no se soñaría siquiera. Claro que el TIC es un teorema de una teoría
general de conjuntos, y como tal —diríamos hoy— no logra reducir la inducción ma-
temática a “leyes lógicas universales”. Pero inmediatamente después de probar el TIC
en la versión conjuntista que hemos visto (Sección 2.3.2), Dedekind da un paso que —
tomado al pie de la letra— reduciría en efecto la teoría de conjuntos a la lógica, si no
que una cadena A0 está incluida en un dado sistema Σ. Por lo tanto, según Dedekind,
la hiciera inconsistente. Me explico: El TIC enuncia ciertas condiciones que aseguran
el TIC puede invocarse para establecer que todos los elementos de A0 tienen cierta
poner que Σ designa “el sistema de todas las cosas que poseen la propiedad ᑟ (o para
propiedad ᑟ (o cumplen con la condición especificada en cierta oración ᑭ): basta su-
las cuales vale la oración ᑭ)” (1888, #60). Pero el supuesto de que existe, para cada
propiedad ᑟ (o condición ᑭ), el sistema de las cosas que poseen ᑟ (o satisfacen ᑭ)
implica, como sabemos, la paradoja de Russell. Gracias a Dios, para edificar la aritmé-
cumplen con la condición ᑭ). Así restringido, el supuesto no implica, que yo sepa,
contradicción alguna.
25 Véase el Apéndice IX. Adviértase que para explicar a Frege no puedo limitarme a uti-
lizar el conocido cálculo de primer orden que allí se explica en detalle, sino que debo
2.3 Fundamentos de la aritmética 162
u <ƒ v.
[S4] Supongamos ahora que ƒ es un procedimiento tal que ƒuv y ƒuw
sólo si v = w. En tal caso, decimos con Frege que ƒ es un pro-
cedimiento unívoco (eindeutig).26 Como puede verse, un proce-
dimiento unívoco es simplemente una aplicación de todo el uni-
verso de objetos en sí mismo: ƒxy si y es el valor de tal aplica-
ción en el argumento x.
la fórmula ∃R∀x∀y(Rxy → ¬(x = y)) dice que hay una relación binaria R que subsiste
cho apéndice. Éste envuelve cuantificación sobre variables predicativas. Por ejemplo,
la operación ƒ a que éste se refiere no tiene que ser una aplicación: es lisa
y llanamente una relación binaria cualquiera. La demostración es facilísima,
si tenemos presentes las definiciones de ‘propiedad ƒ-hereditaria’ y ‘ƒ-suce-
por la conjunción de las tres premisas siguientes: (i) Fx, (ii) ᑢƒF, o sea, ∀u(Fu
de’. La proposición 81 queda establecida si probamos que Fy está implicada
58, implica que (v) (∀v(ƒxv → Fv) → Fy).27 La conjunción de (iv) y (v)
implica Fy. Evidentemente, si entendemos que x denota el primer número
natural y ƒuv significa ‘v es el siguiente del número u’, la proposición 81
combinada con la regla modus ponens autoriza la inducción matemática fini-
ta.
Convencido de que la aritmética sólo puede ser una ciencia si sus asertos
se refieren a objetos bien determinados, Frege dedica la parte positiva de
Fundamentos de la aritmética (1884) a establecer qué objetos son los núme-
ros. No puedo examinar aquí las otras soluciones de esta cuestión que Frege
27 En esta segunda aplicación del Axioma 58, (∀xΦ(x) → Φ(a)), hay que entender como
con la variable Γ que aparece ligada en la premisa (iii). Frege nos pediría sustituir en
Frege que la variable ligada x puede ser predicativa y por ende puede ser sustituida
(∀xΦ(x) → Φ(a)), x por Γ, a por Φ, y Φ(Γ) por (ᑢƒΓ → (∀v(ƒxv → Γv) → Γy)); cf.
p. 131, nota 6.
2.3 Fundamentos de la aritmética 164
Frege rechaza esta propuesta en el acto, aunque admite que es tan natural
que el rechazo demanda una explicación. Su principal defecto consiste, se-
gún él, en que se ha definido la expresión ‘a C le corresponde el número n
+ 1’ mediante la expresión ‘a C* le corresponde el número n’, cuyo signifi-
cado se desconoce. Utilizando las definiciones ofrecidas,
29 La primera oración de este pasaje muestra que en 1884 Frege todavía utilizaba —como
en alemán corriente— Bedeutung (‘significado’) y Sinn (‘sentido’) como sinónimos.
2.3 Fundamentos de la aritmética 167
30 Hilbert llama Ω al sistema de los números algebraicos, esto es, los números reales que
son soluciones de ecuaciones polinomiales con coeficientes enteros. Frege, 1903b, p.
374, escribe:
〈x,y〉 del dominio Ω”, etc. Si mediante la definición y los axiomas pertinentes se
En la p. 20 [de Hilbert 1899] se dice: “Tomamos como punto un par de números
un par de números del dominio Ω, que es de primer orden, igual que el concepto
podría hacerlo aquí otra vez. La cosa hay que pensarla así quizás: el concepto es
euclidiano de punto, debe caer bajo el concepto hilbertiano de segundo orden (si
es que hay tal concepto). Molesta, claro está, el uso de la palabra ‘punto’ en ambos
casos, pues evidentemente tiene en cada uno una denotación diferente.
El 27 de diciembre de 1899 Frege ya le había objetado por carta a Hilbert que sus
conceptos de ‘punto’ y ‘entre’ no son unívocos (WB, p. 63). Hilbert le envió a vuelta
de correo la declaración sobre “el sistema amor, ley, deshollinador,…” que cité al
comienzo de la Sección 1.8.1.
2.3 Fundamentos de la aritmética 168
objetos que caen bajo el concepto F con los objetos que caen bajo
el concepto G’.
31 Usando las ideas de Frege 1891, diríamos que φ coordina a con b si y sólo si la fun-
ción φ toma el valor v en el argumento 〈a,b〉. Como Frege (1884, p. 84) explica
prolijamente, es enteramente legítimo decir que φ coordina los objetos que caen bajo F
2.3 Fundamentos de la aritmética 169
cumple los dos requisitos siguientes: (i) si el par 〈a,b1〉 cae bajo el concepto
φ, entonces 〈a,b2〉 cae bajo φ sólo si b1 = b2; (ii) si el par 〈a1,b〉 cae bajo el
concepto φ, entonces 〈a2,b〉 cae bajo φ sólo si a1 = a2. Utilizaré la abreviatu-
ra ‘F ≈ G’ para significar que el concepto F es equinumeroso con el concep-
to G. En nuestra jerga actual diríamos pues que, con arreglo a [N≈], F ≈ G
si y sólo si existe una aplicación biyectiva de la extensión de F en la exten-
cia puesto que (i) cada concepto es equinumeroso consigo mismo, (ii) si F ≈
sión de G. La relación de equinumerosidad es evidentemente una equivalen-
con los objetos que caen bajo G —simbólicamente: ∀x(Fx → ∃y(Gy ∧ φxy))— aunque
la extensión de F esté vacía. En efecto, si ∀x(Fx ↔ x ≠ x), es claro que ∀x¬Fx, de
modo que ∀x(¬Fx ∨ ∃y(Gy ∧ φxy)). La última oración equivale a ∀x(Fx → ∃y(Gy ∧
φxy)).
2.3 Fundamentos de la aritmética 170
fórmula ‘x ≠ x’.
[N0] 0 es el número correspondiente al concepto expresado mediante la
32 No escapará al lector que, conforme a [Nσ], un número puede ser su propio predecesor
inmediato. Por ejemplo, si n es el número correspondiente al concepto ‘punto del cír-
céntrico del círculo con centro P y radio r’, [Nσ] implica que σmn aunque m = n (pues
culo con centro P y radio r’ y m es el número correspondiente al concepto ‘punto ex-
ambos conceptos son equinumerosos). Por lo tanto, contra lo que parecen creer algu-
nos traductores, la serie natural de los números, en el sentido de Frege, no es lo mismo
que la serie de los números naturales, en el sentido corriente. Nuestros números natu-
necientes a la σ-serie iniciada con 0 (cf. [S3]). Por cierto, un número tal que 0 ≤σ x,
rales son lo que Frege (1884, p. 96) llama números finitos, esto es, los números perte-
la fórmula ‘x = 0 ∧ x ≠ 0’.
es precisamente el número correspondiente al concepto expresado mediante
Es fácil comprobar que, si σmn, no hay otro número p ≠ n tal que σmp:
si el siguiente de un número existe, es único. La relación binaria σ constitu-
Como 0 <σ x → Nx, tenemos además que (por [S3] y Frege 1879, Teorema
81, demostrado arriba en la p. 163):
que σmn.
[F2] Si m es un número finito cualquiera, existe un número finito n tal
0 ≤σ x <σ m, o bien x = m’). Como Frege (1884, p. 95) nos advierte, esta
observación presupone que ningún número finito se σ-sucede a sí mismo,
esto es, que ∀x(Nx → ¬(x <σ x)).35 No puedo detenerme a demostrarlo.36
35 Supongamos, por el contrario, que m <σ m. En tal caso, el concepto ‘número finito
perteneciente a la σ-serie que llega al predecesor inmediato de m’ sería equinumeroso
con el concepto ‘número finito perteneciente a la σ-serie que llega a m’, y el número
correspondiente a este último concepto no podría ser el siguiente de m..
36 La proposición ∀x(Nx → ¬(x <σ x)) es el Lema 52 en Wright 1983, Sección XIX.
Wright bosqueja una demostración en las pp. 165–67. Ella depende de una definición
∧ H’ designa el concepto bajo el cual caen precisamente todos los objetos que caen
bajo G y bajo H). Los sublemas demostrados por Wright se pueden enunciar así: [521]
Si u <σ v y u es el número correspondiente a un concepto U y v es el número corres-
a Sm. Como N es σ-hereditaria, es claro que σmνm implica que Nνm (νm es
un número finito). Así, para demostrar [F2] bastaría establecer que σmνm.
sólo si x es un número finito tal que σxνx. (En otras palabras: el número
Para ello, conviene prestar atención a la propiedad S definida por: Sx si y
mismo). Con los supuestos de Wright es fácil demostrar además que si x es un número
ro, [Nσ] implica que Fw. Así pues, trivialmente, F es una propiedad σ-hereditaria. Por
que Gu y x es el número correspondiente a G. Si w es el siguiente de cualquier núme-
extensión de F si y sólo si hay una relación φ que coordina biunívocamente los objetos
‘Para todo concepto F existe un único objeto x tal que, para todo concepto G, x es la
que caen bajo el concepto F con los objetos que caen bajo el concepto G’. Boolos
ofrece además una prueba de consistencia del sistema deductivo así formado, relativa
a la consistencia de la teoría de conjuntos de Zermelo-Fraenkel (ZF), y también a la
consistencia del sistema, estrictamente más débil que ZF, que Shoenfield (1967, § 8.5)
llama “aritmética de segundo orden”. Ni el axioma de Wright, ni el de Boolos pueden
pasar por verdades lógicas (Boolos subraya que el suyo, combinado con los susodichos
principios lógicos, implica la existencia de infinitos objetos; vide Demopoulos 1995, p.
231). Por este camino no se llega, pues, a vindicar la pretensión de Frege de que la
matemática es parte de la lógica. Pero sí se pone de manifiesto —como destaca Boolos—
el enorme logro simplificador y elucidatorio del análisis fregeano del concepto de nú-
mero, “mediante el cual podemos ver cómo un vasto cuerpo de matemáticas puede
deducirse de un único principio simple y obviamente consistente” (Boolos 1987, en
Demopoulos 1995, p. 232).
2.3 Fundamentos de la aritmética 175
177
2.4 La teoría de los tipos lógicos 178
de Black (en Schilpp 1944)— aceptará Russell verla así (Schilpp 1944, p. 691).
La versión publicada en el tomo I de Principia Mathematica en 1910 es el fruto
de una meditación compleja y vacilante, atenta a preocupaciones metafísicas, y
ello se le nota. En lo que sigue trazaré a grandes rasgos su desarrollo.5
A la teoría cantoriana del transfinito se le imputaban dos paradojas que
algunos juzgaban fatales: (i) La paradoja de Cantor: el cardinal del con-
junto de todos los conjuntos tiene que ser mayor que cualquier otro cardinal
pero, según el Teorema de Cantor, es menor que el cardinal del conjunto de
las partes del conjunto de todos los conjuntos. (ii) La paradoja llamada de
Burali-Forti: el conjunto de los ordinales está bien ordenado y por lo tanto
tiene un ordinal, mayor que cualquier ordinal perteneciente a dicho conjun-
to, el cual, por ser un ordinal, pertenece sin embargo a ese conjunto. La
paradoja de Russell, inspirada por la demostración del Teorema de Cantor
(Capítulo 1.6), se deja insertar en este mismo orden de ideas, si entendemos,
con Russell (1903, § 68), que las clases a que se refiere la paradoja son
precisamente los objetos que en la jerga matemática se llaman conjuntos. Se
distingue, empero, de las dos paradojas citadas en cuanto no envuelve los
conceptos de cardinal u ordinal ni ningún otro concepto específicamente
matemático, de modo que es propiamente una paradoja de la lógica univer-
sal, no de una disciplina matemática particular. En su primer intento de re-
solverla, Russell apela al distingo —introducido en Russell 1903, Cap. VI—
entre una clase considerada como pluralidad de objetos (the class as many)
y una clase considerada como siendo ella misma un objeto (the class as one).
Damos por descontado —dice Russell— que dondequiera hay una clase-plu-
ralidad también hay una clase-objeto, pero este axioma no tiene que valer
universalmente y parecería ser la fuente de la contradicción. “Así pues, con
sólo negarlo se superará toda la dificultad” (1903, § 104).6
nada si x está dado” (1903, § 22). “Una clase puede definirse como todos
los términos que satisfacen una cierta función proposicional” (§ 23). En el
vocabulario de Russell 1903, un ‘término’ (term) no es una palabra o frase
de cierto género, sino “cualquier cosa que pueda ser objeto del pensamiento
es, un ámbito dentro del cual x debe hallarse si φx ha de ser una proposi-
(range of truth), un ámbito de significación (range of significance), esto
Las seis apretadas páginas que Russell dedica a “La doctrina de los tipos”
(1903, Apéndice B) no son un dechado de claridad,7 pero es bastante claro
class as one, la clase-objeto. Pero no toda expresión especificadora k tiene esta virtud.
Así, si k es la frase sustantiva “clase que no es miembro de sí misma”, la paradoja de
Russell implica que no puede existir la clase-objeto de todas las k. Pero —contra lo
que Russell va a sostener más tarde— ello no nos impediría hablar con sentido de una
k, cualquier k, cada k.
7 Especialmente desconcertante es la relación que establece Russell aquí entre su inci-
piente doctrina de los tipos y el par de conceptos clase-como-muchos/clase-como-uno.
Según él, una clase-como-uno es un objeto del mismo tipo que los comprendidos en
2.4 La teoría de los tipos lógicos 181
ría sin clases (the no classes theory). La teoría del zigzag supone que si φx
(a) la teoría del zigzag, (b) la teoría de la limitación de tamaño y (c) la teo-
~φx no puede serlo. Russell opina que “una gran dificultad de esta teoría
los ordinales. Pudiera ser que ya ω sea ilegítimo, en cuyo caso todas las
consiste en que no nos dice hasta dónde es legítimo avanzar en la serie de
clases propiamente tales (all proper classes) serían finitas” (EA, p. 153).10
9 Uso aquí la notación de Russell 1903. Russell 1906 designa una función proposicional
guida de un signo de admiración y una minúscula latina cursiva, vgr. φ!x. Pero en
cualquiera, predicativa o no, con una expresión formada por una minúscula griega se-
En 1906, todas las simpatías de Russell van a la teoría sin clases. El es-
crito que comentamos concluye con una nota suplementaria, fechada el 6 de
febrero de 1906, en la que dice que sus últimas investigaciones lo han per-
suadido de que la teoría sin clases proporciona “la completa solución” de las
dificultades suscitadas por las paradojas (EA, p. 164). Se refiere, sin duda, a
los resultados que presenta en su artículo “Sobre la teoría sustitucional de
las clases y las relaciones” (1906a), sometido a la London Mathematical
Society el 24 de abril de 1906, pero retirado antes de que saliera impreso,
porque dejó de satisfacerlo (se publicó póstumamente en 1973). El nombre
‘teoría sustitucional’ alude al método de sustitución de expresiones con que
propone eliminar —o hacer ontológicamente inocuos— los ingredientes del
lenguaje que aparentemente hacen referencia a las clases.11 Dicho método le
fue sugerido seguramente por su brillante análisis de las descripciones defi-
nidas (Russell 1905), que paso a explicar.
Afligido por la dificultad de asignar una denotación a expresiones tales
como ‘la esposa favorita del obispo de Roma’ o ‘el río de oro derretido que
desemboca en el Orinoco’, que describen algo que no existe, Russell optó
por concebirlas como abreviaturas que sirven para representar en contextos
de un cierto género a otras expresiones más largas, las cuales, a su vez, no
denotan nada. Concretamente, cuando se dice que
Neumann— llaman clases impropias (propias son precisamente las clases que no son
conjuntos). Recordemos de paso que —como se vio en la Sección 1.8.4— la teoría de
conjuntos de von Neumann da una respuesta precisa a la dificultad mencionada por
Russell: una clase es “demasiado grande” —y por lo tanto es propia en el sentido de
von Neumann, impropia en el sentido de Russell— si y sólo si es equinumerosa con la
clase de todos los conjuntos.
11 Como Russell abandona muy pronto la teoría de 1906a pero sigue simpatizando con la
idea de la eliminación de las clases, los expertos distinguen entre la ‘teoría sin clases’
y la ‘teoría sustitucional de las clases’. Pero, comparando textos, no hay duda de que
la ‘teoría sin clases’ bosquejada en Russell 1906 (EA, pp. 154-56) y aludida en la nota
suplementaria al final (EA, p. 164), no es otra que la teoría sustitucional explicada en
1906a.
2.4 La teoría de los tipos lógicos 185
(1*) Existe un objeto x tal que (i) x es un río de oro derretido que desem-
boca en el Orinoco, (ii) x es más caudaloso que el Guadalquivir y
(iii) si cualquier objeto y es un río de oro derretido que desemboca
en el Orinoco, entonces y es idéntico a x.
En (1*), la descripción del río de oro figura sólo como predicado, no como
frase nominal. La oración es falsa porque no hay nada que satisfaga ese
predicado, y no, como sugiere (1), porque el objeto denotado por la frase
nominal sea un río no más caudaloso que el Guadalquivir.
No es raro que Russell, después de eliminar con tanta soltura la denotación
de las descripciones definidas, se sintiera animado a hacer lo propio con los
nombres de clases. Se trata “de proveer un modo de interpretar las asevera-
ciones corrientes sobre clases sin suponer que las clases son entes” (1906c,
p. 200). Por esta vía, resultará que todas las proposiciones significativas en
que se mencionan clases pueden entenderse como proposiciones acerca de
así dan lugar a contradicciones. “Por lo tanto, es natural suponer que las clases
son meramente abreviaturas lingüísticas o simbólicas” (Ibid.). Russell reco-
noce que el procedimiento de eliminación propuesto por él es complicado,
un truco técnico que debe reemplazarse por otro más conveniente. Las si-
guientes indicaciones, basadas en su primera presentación sumaria de la teo-
ría (Russell 1906, en EA, pp. 154-56), darán una idea de lo que se trata.
Sea p una proposición y p(x/a) lo que se obtiene cuando x reemplaza a a
en todos los lugares en que a figura en p; p(x/a) nos da, para distintos valo-
res de x lo que solíamos llamar los distintos valores de una función propo-
sicional.12 Si b es un ente cualquiera que no es un ingrediente de p y q =
p(b/a), tenemos que la aseveración ‘q(x/b) es verdadera para todo valor de x’
12 Lo anterior traduce literalmente palabras de Russell. No pretendo que sean claras. Como
una proposición es un estado de cosas —real o posible— la letra a designa aquí un
ingrediente objetivo del mismo. La variable x, en cambio, no puede sino ser un objeto
lingüístico: un pronombre si está ligada, la indicación de un “hueco” (en el sentido de
Frege) si está libre ¿Cómo se puede reemplazar un ingrediente objetivo de un estado
de cosas con un “hueco”? ¿Cuál es el modo de ser del producto de tal procedimiento?
Incapaz de responder a estas preguntas, las tomo como un indicio más de la confusión
que, en diversas modalidades, acompañó a Russell durante casi toda su carrera filosó-
fica.
2.4 La teoría de los tipos lógicos 186
equivale a ‘p(x/a) es verdadera para todo valor de x’. Cabe, pues, decir que
la aseveración ‘p(x/a) es verdadera para todo valor de x’ no depende del sujeto
a, sino “sólo de la forma de p” (EA, p. 155). Russell propone que usemos
aseveraciones de este tipo en vez de mencionar funciones proposicionales o
clases determinadas por ellas.
sólo un x tal que φx es verdad’), tendremos ‘Hay un ente b tal que p(x/a)
Por ejemplo, en vez de ‘φ es una función unitaria’ (esto es, ‘Hay un y
Como advertí en la nota 9, altero un poco la notación de Russell: él escribe φ!x donde
yo φx. También Lackey, el editor de EA, se ha tomado libertades con la notación ori-
13
probado duradera. En cambio, Russell, que buscaba certificar —como si hiciera fal-
ta— las matemáticas hechas por otros, daba solamente con axiomas implausibles, ins-
pirados por un principio que él mismo juzgaba insuficiente (1906, en EA, p. 147, cita-
do arriba en la p. 183).
15 Esto puede deberse a que Whitehead no favorecía la eliminación de las clases. El 22
de febrero de 1906 —o sea, dos semanas después de la fecha de la nota suplementaria
en que Russell abraza sin reservas esa alternativa— Whitehead le escribió protestando
contra su teoría sustitucional, que “funda toda la matemática en un artificio tipográfico
(a typographical device) y de este modo contradice las doctrinas principales del tomo
I [= Russell 1903]” (citado por Lackey en Russell, EA, p. 131; cf. las otras citas y
comentarios de Lackey en las pp. 131-32).
16 Una versión revisada de estos ensayos forma los Capítulos III, IV y V del libro II de
Science et méthode (Poincaré 1908). A ella remiten mis referencias.
2.4 La teoría de los tipos lógicos 188
Más, por otra parte, es claro que β ∈ E, puesto que acabamos de caracterizarlo
re de ƒ(n) en el n-ésimo dígito de la respectiva expansión decimal infinita.
17 Cf. también este otro pasaje, referente a la paradoja de Burali-Forti: “Mientras se trate
de demostrar que uno es un número, la pasigrafía basta; pero si se presenta una difi-
cultad, si hay una antinomia que resolver, la pasigrafía se torna impotente” (Poincaré,
CM, p. 123). ‘Pasigrafía’ —esto es, ‘escritura para todos’ (o ‘para todo’)— es el nom-
bre que daba Peano a su escritura conceptual.
18 ‘Antinomia’ —es decir, antilegalidad— llamó Kant al “conflicto de la razón pura con-
sigo misma” que estudia en su Crítica de la razón pura. Dicho conflicto se manifiesta,
según Kant, en la demostración de varios pares de aseveraciones contradictorias. Con-
forme a un precedente establecido por el propio Kant, la palabra ‘antinomia’ se usa
comúnmente para designar a cada uno de estos pares. Por ejemplo, la segunda antino-
mia kantiana consta de la tesis, “Todo cuerpo consta de partes indivisibles” y la antí-
tesis, “Todo cuerpo es indefinidamente divisible”.
2.4 La teoría de los tipos lógicos 189
apela, es cierto, a la noción de conjunto y se vale una vez más del método
diagonal de Cantor para generar una contradicción, pero se puede formular
una paradoja esencialmente análoga a ésta sin esos recursos. Poincaré (CM,
p. 144) cita la siguiente paradoja que atribuye Russell, pero que según éste
le fue sugerida por G. G. Berry (Russell LK, p. 60n.). Considérese el entero
positivo más pequeño que no se puede describir en castellano con menos de
diechiocho palabras. Como, obviamente, hay enteros positivos que sólo pue-
llamémosle α— que sea menor que todos los demás. Según esto, α no pue-
den describirse con 18 palabras o más, tiene que haber uno entre ellos —
20 Véase el Capítulo 1.7, nota 4. Para mayor confusión, Russell (1908) emplea la palabra
‘predicativo’ en una tercera acepción. Como, en virtud de la teoría sin clases, no hay
funciones proposicionales predicativas en el sentido de Russell (1906), y en virtud de
la sintaxis adoptada, no es posible representar en la escritura conceptual una función
proposicional impredicativa en el sentido de Poincaré (1906), la palabra ha quedado
vacante y se la redefine entonces como sigue: Una función de orden n y una sola va-
riable es predicativa, si esa variable es de orden n – 1; una función de varias variables
es predicativa, si al reemplazar por constantes todas sus variables excepto una se ob-
tiene una función predicativa de la variable restante (Russell LK, p. 78). Más adelante
veremos qué es lo que aquí se llama el orden de una función o de una variable.
Whitehead y Russell 1910/13 reiteran esta definición (PM, I, 53), pero dan también
otra más sencilla que, en virtud de la sintaxis adoptada en ese libro, resulta ser equiva-
lente a la anterior: “Se dice que una función es predicativa cuando es una matriz”, esto
es, cuando “no envuelve variables ligadas (apparent variables)” (PM, I, 164, 163).
2.4 La teoría de los tipos lógicos 191
Por lo tanto, “φx” sólo tiene un significado bien definido (es decir, bien
φa, φb, φc, etc., están bien definidos. En otras palabras, una función no es
definido excepto en cuanto es de su esencia ser ambigua) si los objetos
una función bien definida a menos que todos sus valores ya estén bien
definidos. De esto se desprende que ninguna función puede tener entre
sus valores algo que presuponga la función, pues, si lo tuviera, no podría-
mos considerar que los objetos ambiguamente denotados por la función
están definidos mientras la función no estuviera definida, mientras que, a
la inversa, como acabamos de ver, la función no puede estar definida
mientras no lo estén sus valores. Este es un caso particular, pero tal vez
el más fundamental, del principio del círculo vicioso.
(Whitehead y Russell, PM, I, 39)
φa, φb, φc, etc. con el símbolo ‘φΩ’. A la luz del texto citado, es claro que
Imitando a Whitehead y Russell, designaré a la función cuyos valores son
φφΩ no puede ser un valor de esa función. Más aún, una expresión como
‘φφΩ’ simplemente no tiene sentido.23 Así, la paradoja russelliana del predi-
cado ‘…es un predicado que no es predicable de sí mismo’ no puede si-
φΩ —esto es, los objetos a, b, c,… tales que φa, φb, φc,… son valores de
los objetos que forman el ámbito de significación de una función proposicional
23
24 La primera razón propuesta es esta: Una función no puede servir de argumento a otra
cuyo ámbito de significación incluya objetos individuales, porque una función no es
un objeto definido sino “una mera ambigüedad a la espera de una determinación […],
y obviamente no la obtiene con sólo reemplazar a algo determinado en una proposi-
ción”. Por eso los nombres ‘Whitehead’ y ‘Poincaré’ pueden sustituir a la variable x en
la función proposicional ‘x es un matemático inglés’, generando, respectivamente, una
proposición verdadera y una falsa, pero si reemplazamos la x por el nombre de una
función proposicional como, por ejemplo, ‘z es una estrella de quinta magnitud’ el re-
sultado carece de sentido. Whitehead y Russell reconocen que el citado argumento no
se aplica a una función proposicional de una o más variables si todas estas están liga-
proposicional sino una proposición generalizada). Sirva ‘(x).Px ⊃ Kx’ para abreviar la
das (de modo que lo que tenemos entre manos no es propiamente una función
rece de sentido, aunque las partes de que consta no adolecen de indefinición. “Necesi-
tamos, entonces, una nueva objeción, a saber, la siguiente: Una proposición no es un
ente singular, sino una relación entre varios; por lo tanto, una aseveración en que figu-
re una proposición como sujeto sólo será significativa si puede reducirse a una aseve-
ración sobre los términos que figuran en la proposición. […] Pero esto no es posible
en el caso de una aseveración tal como ‘p es un hombre’, donde p es una proposición.
Por eso ‘{(x).φx} es un hombre’ carece de sentido” (PM, I, 48; cursiva mía). El argu-
mento depende de la oración que he destacado en cursiva. No logro imaginarme qué
pudo inducir a los autores a pensar que esa oración es verdadera. El ejemplo siguiente
demuestra que no lo es: ‘El Teorema de Pitágoras se deduce de los axiomas de Hilbert
para la geometría euclidiana’. La relación de deducibilidad que aquí se afirma que
subsiste entre una cierta proposición y un determinado grupo de proposiciones no pue-
de aseverarse de los términos —puntos, rectas, etc.— que figuran en dichas proposi-
ciones, ni siquiera es equivalente a una relación que subsista entre esos términos.
25 PM, I, 51, 132. En la p. 162 los autores dicen: “Podemos explicar un individuo como
algo que existe por su propia cuenta; entonces, obviamente no es una proposición, puesto
que las proposiciones, según se explicó en el Capítulo II de la Introducción (p. 43),
son símbolos incompletos, que no tienen significado sino cuando de las usa [en un
contexto].” Pero en la p. 161 advierten que “en la práctica no es necesario saber qué
objetos pertenecen al tipo más bajo, ni si el tipo más bajo de variable que figura en un
2.4 La teoría de los tipos lógicos 194
con tanta nitidez. Sea φΩ1…Ωn una función de n variables y φa1…an una
dos o más variables —las relaciones— no podrían en ningún caso ordenarse
y d es justamente la relación del tipo (0,0) que antes llamé ψΩ≈. Por lo tan-
jeto del tipo 0, c es un atributo de individuos, esto es, un objeto del tipo (0),
to, φ≈¥Ω es una función del tipo (0,(0),(0,0)). Como es concebible que haya,
por ejemplo, funciones del tipo
(((0),(0)),(0,0,(0,(0))),((((0))),0))
dado contexto es el de los individuos o es otro. Pues en la práctica sólo importan los
tipos relativos de las variables; así el tipo más bajo que figura en un dado contexto
puede llamarse ‘de los individuos’ por lo que hace a ese contexto. […] Lo esencial
es el modo cómo los otros tipos se generan a partir de individuos, como quiera que
esté constituido el tipo de los individuos.”
2.4 La teoría de los tipos lógicos 195
Sea ƒ(φΩ,x) una función de las dos variables φΩ y x. Entonces si, mante-
(φ).ƒ(φΩ,x).
función envuelve una totalidad de valores de φΩ, no puede ser ella misma
Aquí, si x es una variable, tenemos una función de x; pero como esta
una fórmula representativa de una función proposicional que llamaré ψΩ. Pero
ción. Si en ella reemplazamos la constante a por la variable x obtenemos
26
parecido lícito alterarlo en esta cita textual. Nótese que la variable φΩ de la primera
Pido al lector disculpas por el simbolismo confuso e inconsecuente, pero no me ha
β1,…,βm son r-tipos (m ≥ 0), hay un r-tipo (β1,…,βm)/n integrado por variables pre-
constantes de distinto r-tipo. Hay un tipo i integrado por las variables individuales. Si
ble ligada. De una matriz φ≈1…≈n se derivan funciones que no son matri-
tales objetos son funciones de n-ésimo orden.32 Una matriz se dice de pri-
mer orden si sólo contiene variables de orden 0. Una función se dice de
primer orden si es una matriz de primer orden o se deriva de una matriz de
primer orden por generalización. Si se ligan por generalización todas las
variables libres de una matriz de primer orden, se obtiene una proposición
de primer orden. Una matriz cuyas variables son todas de orden menor que
n > 1 y que contiene por lo menos una variable de orden n – 1 se dice de
n-ésimo orden. Una función se dice de n-ésimo orden si es una matriz de n-
ésimo orden o se deriva de una matriz de n-ésimo orden por generalización.
Si se ligan por generalización todas las variables libres de una matriz de n-
ésimo orden, se obtiene una proposición de n-ésimo orden. Evidentemente,
una función o proposición de n-ésimo orden sólo contendrá variables de orden
menor que n y por lo menos una variable de orden n – 1. Con exasperante
exuberancia terminológica, Whitehead y Russell, en vez de matriz, suelen
decir función predicativa (vide supra, p. 190, n. 20).† Para distinguir la re-
presentación simbólica de una función predicativa o matriz de la de otras
inicial, por ejemplo, así: φ!x, ψ!(x,y). Este método de representación se ex-
funciones insertan un signo de admiración después de la minúscula griega
simbólica ‘Ψξ’ para decir que ξ es una función proposicional de una varia-
describir en castellano con menos de dieciocho palabras’. Usaré la expresión
menos eso que asevera. Según la teoría de los tipos, la oración ‘no sé nada’ sólo puede
expresar que no hay ninguna proposición de orden menor que cierto entero positivo n
que diga algo que yo sé. Pero el orden de la proposición así expresada es, entonces,
por lo menos igual a n.
34 Las dos soluciones citadas y otras cinco más —correspondientes a las paradojas de
Burali-Forti y Richard y dos formas de la paradoja de Russell— aparecen en Whitehead
y Russell, PM, I, 62–64. Church 1976 da una formulación y solución rigurosas de la
paradoja de Grelling citada en la nota 19.
2.4 La teoría de los tipos lógicos 200
cripciones de dos cosas distintas, cualesquiera que sean. Pero según la teoría
de los tipos no puede haber una función proposicional cuyo ámbito de sig-
nificación sea la totalidad de las cosas (ni, mucho menos, el producto carte-
siano de dicha totalidad consigo misma). Tiene que haber por eso muchas
relaciones de identidad diferentes, una para cada tipo. El símbolo ‘=’, en que
veíamos un paradigma de la univocidad, se nos revela así como infinitamen-
Russell designan lo que llaman la clase nula, esto es, la clase ≈(x ≠ x) que
te ambiguo. No menos ambiguo es el símbolo ‘Λ’ con que Whitehead y
35 Cuando se habla de clases a propósito de Principia Mathematica hay que entender esto
a la luz del *20 de ese libro, donde se expone una “Teoría General de las Clases” que
‘≈(φx)’ —léase: ‘la clase de los x tales que φx’— no tiene ningún significado por sí
“evita suponer que haya algo así como clases” (PM, I, 187). La expresión simbólica
existe por lo menos una clase —del tipo en cuestión— que contiene precisa-
mos que pesa cada uno de los dedos de mi mano derecha en la expresión ‘x es un
número real mayor que y’).
2.4 La teoría de los tipos lógicos 202
37
que dice que si α es un cardinal inductivo, existe un objeto x tal que x ∈ α. Para
*120.03 designa con el nombre “Infin ax” a la aseveración ambigua en cuanto al tipo
mayor claridad, supongamos que α es un cardinal del tipo más bajo posible (lo que
todas las clases similares a x (dos clases a y b son similares si son del mismo tipo y
cuyo único miembro es el objeto a y Λ a la clase nula o vacía, tenemos que el cardinal
0 es la clase de todas las clases similares a Λ y el cardinal 1 es la clase de todas las
clases similares a ι‘x (donde x es un cierto individuo, que evidentemente puede ser
cualquiera sin afectar la identidad del objeto designado por ‘1’). Si α es un cardinal, α
+ 1 es la clase de todas las clases similares a z ∪ ι‘x, donde z ∈ α y x ∉ z, y por
ende también es un cardinal. Si β = α + 1, digo que β tiene con α la relación (+1)
(simbólicamente: β(+1)α). Digo que β tiene con α la relación (+1)* (simbólicamente:
β(+1)*α) si (i) β(+1)α ó (ii) hay un cardinal γ tal que β(+1)γ y γ(+1)*α. El cardinal α
es inductivo si y sólo si α(+1)* 0. Así pues la aseveración ambigua en cuanto al tipo
que bautizamos Inf ax, referida a objetos del tipo más bajo posible, dice que si α es
hay una clase no vacía de individuos cuyo cardinal es α. Obviamente, esto equivale a
cualquier cardinal obtenido por adiciones sucesivas de un individuo a la clase vacía
decir que existe una provisión inagotable de individuos para ir generando clases de
diferente numerosidad mediante adiciones sucesivas de un individuo a la clase vacía.
2.4 La teoría de los tipos lógicos 203
una cota superior del conjunto de reales K si σΚ es mayor o igual que todo
k ∈ K. El supremo de K, denotado por sup K, es la menor de las cotas su-
periores de K. En otras palabras, si ∅ ≠ K ⊂ Â, sup K es un número real tal
que (i) ∀x(x ∈ K ⊂ Â → x ≤ sup K) y (ii) ∀y(∀x(x ∈ K ⊂ Â → x ≤ y) →
sup K ≤ y). La cláusula (ii) de la definición de sup K envuelve, pues, una
referencia a la totalidad de los objetos y tales que ∀x(x ∈ K ⊂ Â → x ≤ y),
uno de los cuales se pretende que sea el propio sup K, conforme a la cláu-
sula (i). Con todo, la doctrina de Whitehead y Russell se apreciará mejor si
consideramos este ejemplo en el contexto de una de las interpretaciones clá-
sicas de los números reales como conjuntos de racionales. Siguiendo a
para todo u, v ∈ Â, u ⴙ v = {ξ + ζ: ξ ∈ u ∧ ζ ∈ v} y u ⴛ v = {ξ × ζ: ξ
∈ u ∧ ζ ∈ v}. Sea K ⊂ Â un conjunto no vacío tal que existe una cota
ne que ser en todo caso de otro orden, de modo que UK ∉ Â. Resulta, en-
ciones de cierto orden, pero la función empleada para caracterizar a UK tie-
φ!Ω con el mismo ámbito de significación que ψΩ, tal que, para todo argu-
función proposicional de cualquier orden hay siempre una función predicativa
(Las variables escritas como subíndices a la derecha del símbolo de equivalencia ‘∫’
deben leerse como cuantificadores universales, a la manera de Peano explicada en la p.
149 después de la fórmula 50.)
2.4 La teoría de los tipos lógicos 205
“x pertenece a la clase α”. Ahora bien, suponiendo que exista un ente tal
esto equivale, para todos los valores de x, a una aseveración de la forma
Dicen en otro lugar que la razón para aceptar un axioma, “lo mismo que
otra proposición cualquiera” sólo puede ser “inductiva”, a saber, “que mu-
chas proposiciones que son casi indudables se deducen de él, que no se conoce
otra vía igualmente plausible por la cual esas proposiciones podrían ser ver-
daderas aunque el axioma fuera falso, y que de él no se puede deducir nada
que sea probablemente falso” (PM, I, p. 59). En el caso del Axioma de
Reducibilidad, las consecuencias que alegadamente lo hacen verosímil son,
ante todo, los teoremas del análisis. Cuando Whitehead y Russell publican
estas palabras en 1910, el cuestionamiento intuicionista del análisis clásico
—“la amenaza bolchevique de Brouwer y Weyl” contra las matemáticas
(Ramsey 1931, p. 56)— había recién comenzado y estaba confinada aún a la
tesis doctoral, en holandés, y otros trabajos juveniles de Brouwer (vide Apén-
dice XIX). Pero el mismo año 1908 en que Russell publicó el Axioma de
Reducibilidad, Zermelo había trazado otra vía “por la cual esas proposiciones
podrían ser verdaderas aunque el axioma fuera falso”, una que la gran ma-
yoría de los matemáticos considera mucho más transitable que la teoría
(ramificada) de los tipos combinada con el Axioma de Reducibilidad. Es
interesante comparar las dos alternativas. Zermelo viene de la escuela de
Cantor quien, como sabemos, nunca enseñó que cada predicado determinara
un conjunto (ni que cada conjunto fuera caracterizable por un predicado).
Desde este punto de vista, las paradojas no ocasionan una revolución del
pensamiento, pero hacen muy aconsejable proceder con cuidado en la carac-
terización de conjuntos mediante condiciones necesarias y suficientes. Los
axiomas de Zermelo (1908a), concebidos ante todo para hacer perspicua su
demostración del Teorema del Buen Orden, regulan tales caracterizaciones
en una forma que —una vez revisada por Skolem y Fraenkel (Secciones 1.8.2
y 1.8.3)— ha resultado generalmente adecuada a las necesidades de los
matemáticos. La estrategia de Zermelo consiste en admitir como existentes
sólo aquellos conjuntos que la experiencia matemática revela imprescindi-
bles. Sigue, pues, lo que puede llamarse una vía minimalista y, por ende,
genuinamente “inductiva”, en el sentido de Whitehead y Russell. Maximalista,
en cambio, es la seguida por éstos al adoptar el Axioma de Reducibilidad,
que postula la existencia de una función predicativa generalmente descono-
cida y probablemente inefable para cada función proposicional que con-
cibamos (y también para las que no concebimos). Tales entes son presumible-
mente más tenues que los conjuntos que postula Zermelo, pero existencia es
2.4 La teoría de los tipos lógicos 208
41 Criticando el primer enunciado del principio del círculo vicioso —‘Lo que envuelve el
todo de una colección no puede ser un miembro de esa colección’— dice Gödel que
esto vale “sólo si las entidades en cuestión han sido construidas por nosotros”:
En este caso es claro que tiene que haber una definición (a saber, la descripción
de la construcción) que no se refiere a una totalidad a la que pertenece el objeto
definido, pues la construcción de una cosa ciertamente no puede basarse en una
totalidad de cosas a la que pertenezca la cosa misma que ha de ser construida. Sin
embargo, si se trata de objetos que existen independientemente de nuestras cons-
trucciones, entonces no hay nada absurdo en la existencia de totalidades que con-
tengan miembros que sólo puedan ser descritos (esto es, caracterizados
unívocamente) por referencia a esa totalidad.
(Gödel 1944, p. 136s.)
Conviene leer toda la crítica al principio del círculo vicioso en Gödel 1944, pp. 133–
37 (trad. castellana en Gödel, OC, pp. 322–26).
42 La función palote (stroke function) de Sheffer, llamada así porque se la representa me-
diante el signo |, es la función veritativa binaria definida por las condiciones (i) p|q es
lización existencial ∃xφx a la disyunción φx1 ∨ φx2 ∨…), donde las xi recorren todo
2.4 La teoría de los tipos lógicos 209
el universo del discurso. Como señala Gödel (1944, p. 144), esta concepción sólo está
exenta de dificultades si el número de los individuos y de los predicados primitivos es
finito.
43
que haber una falla en nuestra lógica o en nuestra matemática”; pero las del
segundo grupo —al cual también pertenece la paradoja de Grelling citada en
la nota 19— “no pueden formularse empleando sólo términos lógicos, pues-
to que todas contienen alguna referencia al pensamiento, el lenguaje o el
simbolismo, que no son términos formales, sino empíricos” (Ramsey 1931,
p. 20). Para resolver las paradojas del primer grupo basta la jerarquía simple
de los tipos. La jerarquía ramificada se necesita en Principia Mathematica
sólo para evitar las del segundo grupo, pero Ramsey muestra que este méto-
do de solución no es imprescindible. La clasificación de Ramsey ha sido
generalmente aceptada, y es corriente llamar paradojas sintácticas a las del
primer grupo y paradojas semánticas a las del segundo. Explicaré esta no-
menclatura en el Capítulo 3.1, cuando hable de la solución de las paradojas
semánticas propuesta por Tarski.44
44 El distingo entre los dos grupos de paradojas está implícito ya en la observación que
hizo Peano (1906) a propósito de la paradoja de Richard: ella no pertenece a la mate-
mática sino a la lingüística.
2.5 ARITMÉTICA FINITISTA
1 Sobre el distingo entre matemática sustantiva y formal, véanse las citas de Hilbert y
von Neumann en las pp. 123 y 124, notas 13 y 14.
2 A continuación traduzco el pasaje de Principia Mathematica de donde Skolem toma
esta idea:
Cuando aseveramos algo que contiene una variable libre (a real variable), en ri-
gor no cabe decir que estemos aseverando una proposición, pues sólo obtenemos
una proposición determinada al asignar un valor a la variable, y entonces nuestra
aseveración sólo se aplica a un caso determinado y no tiene de ningún modo la
misma fuerza que antes. Cuando lo que aseveramos contiene una variable libre
211
2.5 Aritmética finitista 212
aseveración funcional, este modo de pensar no deja lugar a dudas. Sea ϕ(x)
ceptos y la demostración de teoremas. Combinado con la susodicha idea de
primos gemelos —esto es, de la forma 〈x, x+2〉— mediante una fórmula que
no contenga variables ligadas de recorrido ilimitado.
El trabajo de Skolem es a la vez largo y conciso y no puedo resumirlo
aquí. Pero dado el carácter paradigmático que tiene para Hilbert y los suyos,
es importante que el lector se forme una idea clara de sus métodos, que ilus-
traré con varios ejemplos. Antes de entrar en materia, Skolem hace algunas
advertencias que conviene repetir. Ante todo, nos dice que concibe todas las
funciones como “propiamente descriptivas”. Las funciones proposicionales
se distinguen sólo porque no admiten más valores que verdadero y falso.
Específicamente concibe tales funciones descriptivas “como nombres propios
propio de un número, pero de tal suerte que el número así designado varía
según como se elija el número n.3 Advierte además que el signo de igualdad
(=) entre dos expresiones indica siempre que ambas designan lo mismo; por
lo tanto, cuando figura entre dos funciones proposicionales expresa —como
en Frege— la equivalencia de éstas. Por último, anuncia que dará por su-
puestos los conceptos de número natural y de el siguiente de un número, así
como el modo recursivo de pensar.
‘x + 1’ por ‘el siguiente de x’ (en vez de σx, una notación que Skolem no
requisito de su viabilidad). La estipulación [i+] autoriza a Skolem a escribir
mediante dos estipulaciones: [i<] ¬(a < 1);4 y [ii<] (a < b + 1) ↔ ((a < b)
Luego Skolem define la relación ‘a < b’ (‘a es menor que b’), también
4 Uso el simbolismo de nuestro cálculo predicativo (Apéndice IX), en vez de los símbo-
los lógicos tomados de Schröder que Skolem emplea.
2.5 Aritmética finitista 215
Pero esta fórmula con variables ligadas de recorrido ilimitado se puede aho-
ra reemplazar con esta otra
x) para ese z y ese x. Por lo tanto, para definir U(x) bastará definir U(z) ∧ (z
≤ x). El valor de U(z) ∧ (z ≤ x) puede definirse por inducción ordinaria.
Estipulamos primero el valor de U(1). Esto nos da el valor de U(z) ∧ (z ≤ 1)
para cualquier z, ya que, si z ≠ 1, U(z) ∧ (z ≤ 1) es falso. Luego suponemos
establecido el valor de U(z) ∧ (z ≤ n) para cualquier número z, y estipula-
mos sobre esa base el valor de U(z) ∧ (z ≤ n + 1) para cualquier z. Ahora
bien, si n + 1 < z, entonces ¬(z ≤ n + 1), de modo que U(z) ∧ (z ≤ n + 1)
es falso; si z < n + 1, entonces z ≤ n y el valor de U(z) ∧ (z ≤ n) está ya
determinado por hipótesis; por lo tanto, sólo hace falta estipular el valor de
U(z) para el caso en que z = n + 1. En otras palabras, “determinar del valor
ción transfinita: De las premisas [α] U(1) y [β] (∀z<x)U(z) → U(x), inferir
Skolem también recurre a veces al modo de razonar propio de la induc-
primo’— Skolem define una función proposicional binaria que designaré Π(x,y) (Skolem
múltiplo de a y b. Para definir la función proposicional P(x) —léase ‘x es un número
da, por cuanto la premisa [β] implica siempre una aseveración que, combi-
nada con [α], lleva a la conclusión [γ] por inducción matemática ordinaria.
que U(z) bastará decir que µxU(x) es igual a cualquier z ≤ µxU(x) tal que
más, para informar que µxU(x) es menor que cualquier otro número z tal
U(z). El contenido del teorema se deja, pues, formular mediante las dos ase-
veraciones siguientes:
[i] dice que U(n) implica la existencia de un número que obedece a la descrip-
ción de µxU(x) y [ii] dice que tal número es único. La aseveración [i] es
obvia si n = 1. Supongamos, pues, que el teorema es verdad para cualquier
2.5 Aritmética finitista 218
219
2.6 Pruebas de consistencia 220
tura los reemplazaré, pues, por éstos. Hay variables individuales a, b, c,…;
variables funcionales n-arias (para cada entero positivo n) f, m,…; varia-
bles proposicionales A, B, C; variables predicativas A(a), B(a,b),…, Aa f(a)
(donde el subíndice a indica que A depende de la variable funcional f y no
las griegas ϕ, ψ,… que simbolizan funciones n-arias (para diversos valores
cación, que se escriben entre los signos de los argumentos, y letras minúscu-
tanto, Σ es consistente.
Los axiomas para la matemática clásica propuestos por Ackermann for-
man dos grupos: axiomas para la matemática finita y “axiomas transfinitos”.
Ackermann da una demostración breve pero completa de la consistencia del
primer grupo y luego bosqueja larga y tortuosamente una demostración aná-
loga aplicable a todo el sistema. No puedo dar aquí más que algunas indica-
ciones incompletas sobre esta última. En cambio, presentaré la primera en
detalle, para que el lector se forme una idea precisa de las intenciones y
recursos de la metamatemática hilbertiana. (También Ackermann ofrece esa
demostración sobre todo a título ilustrativo).
Los axiomas de la matemática finita son 16. Los Axiomas 1–12 bastan
para deducir por sustitución y modus ponens todas las tautologías; los Axio-
mas 13 y 14 gobiernan el signo de identidad, y los Axiomas 15 y 16 son
propiamente aritméticos. Los doy aquí en nuestra notación:
2.6 Pruebas de consistencia 222
1. A → (B → A)
2. (A → (A → B)) → (A → B)
3. (A → (B → C)) → (B → (A → C))
4. (B → C) → ((A → B) → (A → C))
5. (A ∧ B) → A
6. (A ∧ B) → B
7. A → (B → (A ∧ B))
8. A → (A ∨ B)
9. B → (A ∨ B)
10. (A → C) → ((B → C) → ((A ∨ B) → C))
11. A → (¬A → B)
12.1 (A → B) → ((¬A → B) → B)
13. a=a
14. a = b → (A(a) → A(b))
15. ¬(a + 1 = 0)
16. ¬(a = 0) → (a = δ(a) + 1)
ϕ(0,b1,…,bn–1) = ᑾ(b1,…,bn–1)
dicho sistema de axiomas. Esto supone que, para cada entero positivo k ≤ n,
mulas que constituye una deducción de la fórmula numérica ᑛn a partir de
de los axiomas 1–16. En virtud del mismo, cada fórmula ᑛk ∈ L que no sea
ma por él requerida a cualquier deducción de la fórmula numérica ᑛn a partir
Queremos demostrar que ᑛn no puede ser la fórmula ¬(0 = 0). Para ello,
como se explicó arriba, vamos a convertir a L en una lista de fórmulas
numéricas. Empecemos eliminando las variables. Sea ᑛp la última fórmula
de L que contiene variables. Como ᑛn es una fórmula numérica, es claro
que p < n y que ᑛp tiene una sucesora sin variables. Si la sucesora de ᑛp se
deduce de ésta por sustitución, efectúo la misma sustitución en ᑛp (en otras
palabras, pongo en lugar de ᑛp una copia de su sucesora). Si la sucesora de
esquema antedicho, toda subfórmula sin variables ϕ(…) que comience con
ϕ se puede traducir mediante un número finito de transformaciones en una
fórmula numérica ᒐ, tal que ϕ(…) = ᒐ es una fórmula correcta. Sustitui-
mos ϕ(…) por ᒐ. Como L es una lista finita de fórmulas finitas, este pro-
cedimiento se completa en un número finito de pasos, al cabo de los cuales
habremos obtenido una lista L* de fórmulas numéricas la última de las cua-
les es ᑛn. Cada fórmula de L* o bien (i) es una copia de una fórmula pre-
cedente, o bien (ii) se deduce de dos fórmulas precedentes por modus ponens,
o bien (iii) se obtiene directamente por sustitución de variables en alguno de
los axiomas 1–16. En el caso (i), la fórmula en cuestión será correcta, a menos
que la precedente que copia sea incorrecta. Es claro asímismo que la con-
clusión deducida por modus ponens de dos premisas correctas es siempre
correcta.4 Por lo tanto, sólo puede haber fórmulas incorrectas en L* si algu-
na de las correspondientes al caso (iii) es incorrecta. Pero eso no es posible:
las fórmulas del tipo (iii) obtenidas a partir de uno de los axiomas 1–12 son
siempre correctas, no importa que las fórmulas numéricas que reemplacen a
cada una de las variables A, B y C sean correctas o no;5 y la sustitución de
variables según las reglas arriba descritas en los axiomas 13–16 sólo puede
4 Por definición, las fórmulas ᑛ y ᑛ → ᑜ no pueden ser ambas correctas, a menos que
la fórmula ᑜ lo sea.
5 El lector para quien esto no sea inmediatamente obvio debe comprobarlo construyendo
tablas de verdad para esos doce axiomas.
6 Ackermann asigna a los axiomas transfinitos los números 1 al 4; sin embargo, me ha
parecido más razonable numerarlos del 17 al 20, ya que los axiomas 1–16 del sistema
antes descrito pertenecen también al sistema ahora considerado. Para facilitar la refe-
rencia he distinguido con subíndices las diversas formas de los axiomas 17–19. Otros
y sólo empleo paréntesis redondos, aunque Ackermann también utiliza llaves y corche-
tes, esto es, los pares { } y [ ]. Por otra parte, respeto todos los pares de paréntesis
2.6 Pruebas de consistencia 226
Los operadores ε y π que figuran en los axiomas transfinitos son una inge-
correlativos colocados por él, aunque me parece superfluo el tercer par en el Axioma
171, así como el segundo en los Axiomas 181 y 191.
7 Las siguientes definiciones resumen las ofrecidas por Ackermann (1925, p. 32):
∃uA(u) ↔ A(εuA(u))
∀uA(u) ↔ A(εu¬A(u))
(aquí, u es una variable individual o funcional). Basándose en ellas, no es difícil dedu-
cir de los axiomas 1–20 los siguientes teoremas (1925, pp. 32–36):
∀uA(u) → A(u)
A(u) → ∃uA(u)
¬∀uA(u) ↔ ∃u¬A(u)
∀u¬A(u) ↔ ¬∃uA(u)
2.6 Pruebas de consistencia 227
con los cuales se opera conforme a ciertas reglas” (1925, p. 8). Hay que
considerarlos, pues, como caracterizados a cabalidad por los axiomas mis-
mos. Por otra parte, la pretensión de que los Axiomas 1–20 —cuando se los
suplementa con el procedimiento para la definición de funciones que descri-
biré luego— bastan para deducir por sustitución y modus ponens toda la
matemática clásica resulta injustificable e incluso ridícula mientras no se
mero designado por εaA(a) sea uno de ellos. Como dice Ackermann, “εaA(a)
170 requiere que, si hay números a los que se aplica el predicado A, el nú-
es que hay algo que la satisfaga” (p. 8). De otro modo, εaA(a) puede ser
designa un número del cual es seguro que satisface la aseveración A(a), si
narle un valor determinado de una vez por todas, por ejemplo, εa A(a) = 0).
cualquier número (aunque es recomendable, a diferencia de Ackermann, asig-
za una función que asigna a cada predicado el valor 0 si hay algún número
(o una función) a que dicho predicado se aplique, y el valor 1 si no lo hay.8
La presencia de ε y π amplia decisivamente el repertorio de funcionales
con los que se puede reemplazar una variable de acuerdo con la regla de
sustitución. Inicialmente Ackermann parece haber contemplado su utilización
irrestricta, pues en el texto de su trabajo dice simplemente que “en lugar de
8 Si hay un número a tal que A(a), entonces A se aplica al número εaA(a) (Ax. 170) y
por lo tanto, πaA(a) = 0 (Ax. 180). Si no hay ningún número a tal que A(a), tenemos
que ¬A(εaA(a)), cualquiera que sea el número εaA(a), de suerte que πaA(a) = 1 (Ax.
todas las variables libres. Una fórmula de L derivada del Axioma 17 por
sustitución podría entonces ajustarse al patrón siguiente:
ᑛ(ᑿ) → ᑛ(εaᑛ(a))
εfᑜei(f(e),εcᑝ(c),εdᑞ(f(i),d)))(0)
εb(εfᑜei(f(e),εcᑝ(c),εdᑞ(f(i),d)))(0) = b) = 0 → εb(εa(εc(a = c) = 0) = b) = 0
fórmula resultante ᑛ(ᒗ) → ᑛ(0) es correcta a menos que ᑛ(ᒗ) sea correcto
y ᑛ(0) incorrecto, y entonces el propio ᒗ es un sustituto adecuado para εaᑛ(a).
Pero el caso general es muchísimo más complicado. Como subraya Acker-
can del todo. Consíderese, por ejemplo, una expresión como ésta:
εaᑛ(ϕb(εdᑜ(d),εcᑥ(c,b)),a))
El número de símbolos ε que hay que sustituir en esta nueva expresión de-
pende obviamente del número de unos en el numeral ᒗ. Esta dificultad es,
por cierto, una consecuencia de la inclusión de variables funcionales como
más simple en que éste no contiene los signos ε y π).9 Como ya señalé, su
nota siguiente explico como se construye el índice de un funcional en el caso
recursivamente las funciones que figuran en ᒐ. Obsérvese que este orden no depende
alcance está severamente limitado por la restricción que Ackermann tuvo que
imponer a su regla de sustitución.
cierta función ϕ depende de lo que llamaré el nivel relativo a ϕ de las funciones ma-
yores o iguales que ϕ que figuran en ᒐ. Sea Φ el conjunto de estas funciones. Si ψ ∈
Φ y ninguna función de Φ está subordinada a ψ en ᒐ, el nivel de ψ relativo a ϕ es 1.
Si ψ ∈ Φ y n ≥ 1 es el más alto nivel relativo a ϕ que alcanza una función de Φ
subordinada a ψ (en ᒐ), el nivel de ψ relativo a ϕ es n + 1. El rango de ᒐ con respecto
a ϕ es el más alto nivel relativo a ϕ que tiene en ᒐ una función mayor o igual que ϕ.
Si ϕ no figura en ᒐ diré que el rango de ᒐ respecto de ϕ es 0 (Ackermann no mencio-
na esta posibilidad, pero hay que tenerla en cuenta para que sea verdad, como él dice,
que cada funcional tiene un rango con respecto a cada función recursiva). Cada funcio-
ak < bk pero aj = bj si j < k (nótese que en virtud de las convenciones adoptadas cada
combinación de rangos contiene el mismo número de enteros no negativos, a saber, el
número de las funciones que se han definido recursivamente en el sistema). A cada
combinación presente en la lista le asignamos el número total de veces que figuran en
ᒐ funcionales que posean esa combinación. Además, asignamos el 0 a cada posible
combinación de rangos ausente de la lista que sea menor que la mayor de las presen-
tes. La lista de números así generada, dispuesta en el orden de las correspondientes
combinaciones de rangos, es el indice del funcional ᒐ. Los índices de distintos funcio-
nales se ordenan de mayor a menor según la misma convención que aplicamos a las
combinaciones de rango. Si el funcional ᒐ forma parte de una fórmula numérica tiene
que ser un numeral, esto es, un 0, o un 0 seguido de una o más copias de la configu-
ración ‘+ 1’. Según nuestras estipulaciones, si ᒐ es un numeral, él mismo es su solo
más copias de ε y π.
trabajo, Ackermann extiende estos procedimientos a funcionales que contengan una o
2.6 Pruebas de consistencia 232
rre, pues, que los mismos conceptos tienen dos modos de manifestarse, (i)
dentro del formalismo que se investiga y (ii) en la reflexión “metateórica”
acerca de él. Además de los enteros positivos, “todas las relaciones lógicas”
aparecen bajo esta doble faz (p. 258). Von Neumann reconoce que esto pue-
de causar confusión (p. 258).
Von Neumann distingue cinco clases de símbolos simples: variables (consti-
tuidas por la letra x seguida de un subíndice numérico), constantes (C con
subíndice), operaciones (O con subíndice y exponente), abstracciones (A con
subíndice), y signos de puntuación (coma, paréntesis). Operaciones son los
conectivos lógicos, la identidad, la función ‘el siguiente de…’, la suma, la
multiplicación, etc.; el exponente indica “el número de conceptos a los que
se aplica una dada operación” (p. 259), mientras el subíndice sirve para dis-
von Neumann las representa con los signos habituales, por ejemplo, → en
tinguir diversas operaciones con el mismo exponente (aunque en la práctica
vez de O12, = en vez de O22, etc.). Abstracciones son los operadores que
que contenga variables libres ligadas por abstracciones que preceden a ψ en ϕ).
En la presentación de von Neumann, la pieza clave de una teoría forma-
lizada es una regla ᑬ para construir cierto género de fórmulas normales que
llamaremos axiomas. ᑬ tiene que concebirse de modo que permita decidir,
en presencia de cualquier fórmula normal, si ésta es o no un axioma. ᑬ se
expresa mediante una serie de esquemas. Un axioma es cualquier fórmula
2.6 Pruebas de consistencia 234
obtenida reemplazando por fórmulas normales (o, en algunos casos, por va-
ble.
una cierta fórmula normal ψ que no sea un axioma es demostrable, hay que
ningún objeto que no esté dado con ella. En cambio, para determinar que
Parece, pues, que no hay ninguna vía para descubrir el criterio universal
de decisión (allgemeine Entscheidungskriterium) sobre si una dada fórmula
normal a es demostrable. Por cierto, actualmente no podemos probar nada
2.6 Pruebas de consistencia 235
cribiré ¬α en vez de O11α (von Neumann escribe ~α). Una regla de cons-
sistencia de una dada regla ᑬ quedará establecida sin lugar a dudas si pode-
mos definir una partición de todas las fórmulas normales en dos clases con
las propiedades siguientes:
Una partición que cumpla estos cuatro requisitos es una valuación (Wertung)
de ᑬ. Como es evidente, en una valuación todas las fórmulas demostrables
pertenecen a la misma clase que los axiomas. Von Neumann llama a esa clase,
la clase R (por richtig, ‘correcto’), pero yo la llamaré V. A la otra clase la
llamo, con von Neumann, F (falsch, en alemán, significa a la vez ‘incorrec-
to’ y ‘falso’).
Von Neumann enuncia una regla ᑧᑬ que según él es capaz de generar
todos los axiomas que hacen falta para deducir toda la matemática clásica
2.6 Pruebas de consistencia 236
O11 y O12) y basta para generar o deducir por modus ponens a todas las tau-
tologías. El Grupo II caracteriza la identidad = (formalmente, O22). El Gru-
po III es una versión sin cuantificadores de los cuatro primeros axiomas de
Peano: caracteriza la constante 0 (formalmente, C1; léase cero) y los opera-
dores Z y +1 (formalmente, O21 y O31; Z precede y +1 sigue a su argumen-
to; léase …es un número y el siguiente de…). Los tres primeros grupos
equivalen, pues, a los Axiomas 1–16 de Ackermann. El Grupo VI y último
es el grupo de las definiciones (para cuya representación formal von Neumann
ofrece esquemas). Concentraremos nuestra atención en los Grupos IV y V.
mal, ξ por una variable y α por una fórmula sin otra variable libre que la
elegida para reemplazar a ξ, o —trivialmente— por una fórmula normal.
(Conforme a la convención de nuestro Apéndice IX, αβ/ξ sería entonces la
expresión obtenida al sustituir uniformemente la variable que reemplace a ξ
por la formula normal que reemplace a β en la fórmula que reemplace a α):
∀ξα → αβ/ξ
αβ/ξ → ∃ξα
IV1.
α τξα/ξ → ∀ξα
IV2.
∃ξα → α τξ¬α/ξ
IV3.
IV4.
Von Neumann explica esto así: ∀η(Zη → (Φ(ƒ,η) = α)) implica que, cual-
quiera que sea el objeto c, Zc → (Φ(ƒ,c) = αc/ξ); en otras palabras, la fun-
ción ƒ representa la expresión αc/ξ en el dominio de los números. Por lo tanto,
lo que el esquema dice es sencillamente que toda expresión está representa-
da por una cierta función en el dominio de los números.
2.6 Pruebas de consistencia 238
10 Formalmente, esta cláusula se puede expresar con más claridad: [ii4] si φ es O21α1, φ
es V si y sólo si α1 es la constante C1, o consta de C1 precedida de una o varias copias
de O31.
11 Las estipulaciones [ii5] y [iii] tienen el efecto de asegurar —trivialmente— la clasifica-
ción de fórmulas que carecen de toda importancia en la teoría determinada por la regla
ᑧᑬ(I–III) cuya consistencia se trata de probar. La necesidad de clasificar tales fórmu-
las desaparece si restringimos el lenguaje de la teoría en cuestión, estipulando que no
2.6 Pruebas de consistencia 239
consiste en establecer que cualquier axioma de los grupos I–III, esto es, cual-
quier fórmula obtenida por reemplazo a partir de los esquemas característi-
cos de esos grupos, pertenece a la clase V. Una vez que esto ha sido asegu-
rado, la cláusula [ii2] garantiza que cada fórmula demostrable es V y la cláu-
sula [ii1] garantiza que la negación de una fórmula demostrable es F y por
ende no puede ser demostrable.
Von Neumann señala enfáticamente que no sabríamos dar una valuación
de ᑧᑬ, ni siquiera de ᑧᑬ(I–IV). Toda valuación contiene un procedimien-
contiene abstracciones, ni más operaciones que las mencionadas en las cláusulas [ii1]–
[ii4].
12 Von Neumann 1927, p. 276, n. 8 atribuye a Julius König la idea de probar la consis-
tencia de la matemática mediante una valuación y a Hilbert las ideas en que se basa el
concepto de valuación parcial.
2.6 Pruebas de consistencia 240
[W3′]
tenece a la clase Fᑭ.
Como puede verse, toda valuación es a la vez una valuación parcial13 con la
notable propiedad de que la partición {Vᑭ, Fᑭ} que ella asocia a cada lista
finita de axiomas ᑭ no depende de la índole de ᑭ. Una valuación parcial
corriente no sería tan neutra. Sin embargo, basta dar una valuación parcial
de ᑬ para estar seguro de que ᑬ es consistente. Para demostrarlo, suponga-
[I] a = a, a = b → b = a, a = b ∧ b = c → a = c,
a+1=b+1↔a=b ¬(a + 1 = 0)
[III] Todas las fórmulas que se obtengan reemplazando una letra dada
por una expresión cualquiera (formada con los medios descritos)
en los axiomas anteriores o también —como debemos suponer,
aunque Herbrand no lo diga expresamente— en una tautología14
formada con letras y los cinco conectivos ¬, ∨, ∧, → y ↔.
14 Esto es, en palabras de Herbrand, una “proposición cuyo valor veritativo (valeur logique)
es la verdad, cualquiera que sea el valor veritativo de las letras que figuran en ella”
(Herbrand, EL, p. 21).
2.6 Pruebas de consistencia 242
15
reglas y sus inversas. Enuncia también otras, que envuelven los conectivos ∧ y →. El
“Règles de passage” es como Herbrand llama (en otros escritos) a las próximas cuatro
la Russell), además de ¬ y ∨.
2.6 Pruebas de consistencia 243
16 Cf. la definición de esta expresión por Herbrand citada en la p. 125, nota 15. Designa
precisamente los métodos sustantivos (inhaltlich), finitistas, de la metamatemática
hilbertiana.
17
[D] Si Φ(x) representa una fórmula sin variables ligadas, tal que, cuan-
do se la considera sustantivamente (esto es, como enunciando una
〈1〉
las fórmulas Φ(x) a que se refiere el Grupo B no contienen varia-
La teoría determinada por los Grupos A, B, C y D es consistente si
〈2〉
bles ligadas.
18 Entiéndase, con los métodos que él llama intuicionistas (veáse arriba, nota 16, y Capi-
tulo 2.1, nota 14). La siguiente observación con que termina Herbrand (1931) se enten-
derá mejor una vez que hayamos estudiado el descubrimiento de Gödel en el Capítulo
2.10:
No es imposible que todo razonamiento intuicionista pueda representarse (se faire)
en una aritmética con los axiomas A y B, sin admitir en C más que la adición y
la multiplicación ordinarias. De ser así, aun la consistencia de la aritmética ordi-
naria sería indemostrable.
(Herbrand, EL, p. 232)
2.6 Pruebas de consistencia 245
mula Φ(x) a que se refiere el Grupo B (sin restricciones) una función con
la siguiente propiedad: si a es el número más pequeño tal que Φ(a) es falsa,
(x) = 0 cuando x < a y (x) = a cuando x ≥ a. La definición rigurosa de
está dada por el siguiente Grupo E de esquemas (el lector debe verificar que
la función aquí definida tiene en efecto la propiedad indicada):
[E1] (0) = 0
gamos, en efecto, que cierta fórmula Φ(x) satisface las condiciones E1–E4,
que el esquema de inducción total B es una consecuencia de E1–E4. Supon-
Φ(0) y ∀x(Φ(x) → Φ(x + 1)) son verdaderas, pero que hay un número x tal
pero que el respectivo esquema B es falso. Esto último significa suponer que
ese teorema.
2.7 EL ENTSCHEIDUNGSPROBLEM
Y EL TEOREMA DE HERBRAND
ción 2.6.3) es una prueba de αn a partir de los axiomas [I], [II] y [III] de T1
basta determinar, con respecto a cada fórmula αk (1 ≤ k ≤ n) de la lista, que
αk es un axioma o es idéntica a la subfórmula γ de una fórmula αh = (β →
γ), donde h < k y β = αj para algún índice j < k. La índole intuitiva y ruti-
naria de tales métodos de decisión recuerda los familiares algoritmos para
calcular la suma, el producto, el mínimo común múltiplo, etc., de una lista
de enteros. Como veremos en el Capítulo 2.11, aquí no hay sólo un pareci-
do, sino una afinidad esencial. Usaré por eso el término genérico ‘algoritmo’
para referirme a cualquier procedimiento como esos. La noción es algo ne-
bulosa, pero en el Capítulo 2.11 veremos que hay varios modos (equivalen-
tes) de hacerla precisa. Diré que un cálculo lógico K es efectivo si hay un
algoritmo para decidir si una lista de objetos es una prueba en K (lo cual
supone, claro está, que haya algoritmos para decidir si un objeto cualquiera
es un signo, una fórmula o un axioma de K).
1 Sobre el uso hilbertiano del adjetivo ‘intuicionista’, vide supra, p. 125, nota 15.
247
2.7 El Entscheidungsproblem 248
signo de negación que representaré con ¬. Sea R una relación n-ádica entre números
cipia Mathematica y sistemas afines” (1931). Sea K un cálculo lógico efectivo con un
hecho de que tanto Post como Herbrand, que ponen sus miras resueltamente
en la d-decisión, la abordan, como veremos, con lo que en el fondo son
métodos de v-decisión, que sirven al interés declaradamente sintáctico de estos
autores porque ocurre que se ocupan con cálculos en los que toda fórmula
válida es a la vez deducible.
El concepto semántico de fórmula válida definido en el Apendice IX (para
el CP1= y el CP2=) es, por cierto, posterior a estos trabajos: lo introdujo
Tarski en un escrito que apareció en polaco en 1933, en alemán sólo en 1935
(Capítulo 3.1). Pero un concepto análogo está implícito ya en los argumen-
tos con que Frege justifica los axiomas y reglas de inferencia de su cálculo
BS (1879) y figura destacadamente en la obra de Schröder (VAL, 1890ss.),
quien, inspirándose en Boole y sobre todo en Peirce, fundó en Alemania otra
tradición de lógica matemática.6 Esa tradición culmina en el articulo de
Leopold Löwenheim, “Sobre posibilidades en el cálculo de relativos” (1915).
Dicho artículo, que por su simbolismo obsoleto nos resulta hoy casi ilegible,
fue estudiado acuciosamente por Skolem, Herbrand y Gödel. Contiene la
primera versión del célebre Teorema de Löwenheim y Skolem. Rompiendo
el orden cronológico, dejo su estudio para el Capítulo 3.2, porque la obra de
Tarski a que se refiere el Capítulo 3.1 nos ayudará a entender mejor el punto
de vista semántico presupuesto en la concepción misma del teorema. Pero
debo dar aquí algunas indicaciones sobre dicho punto de vista, pues Gödel
lo adopta en las investigaciones que estudiaremos en los Capítulos 2.8 y 2.10,
y el propio Herbrand, cuya ortodoxia hilbertiana le impedía adoptarlo, lo
explota como un recurso metódico.
evitaré citar sus fórmulas.7 Éstas son ecuaciones, casi siempre de la forma Φ
Para no fatigar al lector con el aprendizaje del simbolismo de Löwenheim,
voy a referirme aquí— las variables son de un solo tipo y recorren un mis-
mo dominio de objetos (Denkbereich, “universo del discurso”), no vacío pero
CP1= y toda fórmula del CP1= puede representarse mediante una ecuación numérica
en el sentido de Löwenheim.
9 La idea que inspira esta curiosa terminología me parece ser la siguiente. Podemos tra-
tar de refutar la validez universal de una ecuación examinando si se cumple en domi-
nios de 1, 2, 3,… objetos. Si ella es una Haltgleichung este proceso se detiene con
algún entero positivo n; pero en el caso de una Fluchtgleichung el proceso continúa
indefinidamente a pesar de que la ecuación no es universalmente válida. Así, la ecua-
ción huidiza es una que logra escapar a la refutación que sin embargo merece.
10 La formulación habitual del Teorema “ascendente” de Löwenheim-Skolem generaliza
el siguiente corolario, derivado por contraposición del enunciado anterior: si una ecua-
ción de primer orden está satisfecha —como quiera que se fijen los valores de sus
variables— en un dominio enumerable y en cada dominio finito, esa ecuación es una
ecuación idéntica.
2.7 El Entscheidungsproblem 253
habría operado, quizás, en la otra dirección si entre los profesores de filosofía de habla
castellana fuese mayor el número de ex-penados y no tan grande el de ex-seminaristas).
13 Para “una formulación general de este punto de vista”, Post remite al capítulo VI de la
obra de C. I. Lewis, Survey of Symbolic Logic (1918), desgraciadamente omitido en la
reimpresión de 1960. Leemos allí que “un sistema matemático es cualquier conjunto
de filas de signos reconocibles (strings of recognizable marks) en el cual algunas filas
se adoptan inicialmente y las demás se derivan de ellas mediante operaciones ejecuta-
das conforme a reglas que son independientes de cualquier significado asignado a las
signos” (p. 355; en el original, este pasaje está destacado en cursiva).
14 Como veremos en el Capítulo 2.8, Gödel 1930 adoptará una postura metódica similar.
2.7 El Entscheidungsproblem 255
∂(¬(p ∨ q) ∨ (q ∨ p)).17
15
expresión ‘(p ∨ q)’ representa la fila de signos formada por el paréntesis izquierdo,
Por ejemplo, cualesquiera que sean las fórmulas representadas por las letras p y q, la
mejor si reemplaza cada fila de la forma (¬α ∨ β) por una de la forma (α → β).
IV de Post (p. 267). El lector poco familiarizado con la lógica moderna lo entenderá
2.7 El Entscheidungsproblem 256
una fórmula.18 Diremos con Post que una tal aplicación es positiva si su valor
es idénticamente 0 en todos sus argumentos (recuérdese que Post escribe ‘+’
en vez de ‘0’), negativa si su valor es idénticamente 1 (‘-’), y mixta si ad-
mite ambos valores. Esta partición de las operaciones algebraicas sobre {0,1}
se extiende naturalmente a las fórmulas que las representan. Digamos con
que ƒ(p1,…, pk+1) = ((pk+1 ∧ ƒ1(p1,…, pk)) ∨ (¬pk+1 ∧ ƒ2(p1,…, pk)), donde ƒ1
Supongamos que el teorema vale si n = k y que ƒ aplica {0,1}k+1 en {0,1}. Es fácil ver
y ƒ2 son aplicaciones de {0,1}k en {0,1} y por ende están representadas por fórmulas,
conforme a la hipótesis inductiva.
2.7 El Entscheidungsproblem 257
19 Post mismo nos lo hace presente cuando introduce su interpretación algebraica del
cálculo proposicional con estas palabras: “Denotaremos el valor veritativo de cualquier
proposición p con + si es verdadera y con – si es falsa. Conviene tener en vista este
significado de + y – como una guía del pensamiento, pero en la exposición siguiente
deben considerarse meramente como símbolos que manipulamos de cierta manera”
(1921, p. 267).
2.7 El Entscheidungsproblem 258
todas las aplicaciones de {V,F}n en {V,F} para cualquier n ≥ 1 (p. 273; véase arriba, la
has a representation”, esto es, uno cuyos conectivos primitivos bastan para representar
tas de sistemas (cf. Post 1941); luego establece las condiciones que debe reunir los
postulados de un sistema capaz de representar todas las operaciones sobre {0,1} para
que dicho sistema sea completo en el sentido de Post. A propósito del segundo tipo de
generalización, Post estipula que llamará “inconsistente” a cualquier sistema en que
sea deducible la variable proposicional p. El tercer tipo de generalización concierne a
las llamadas “lógicas polivalentes”; Post ve una analogía entre el dominio de la inter-
pretación algebraica de un cálculo proposicional y el espacio de una geometría,
específicamente, entre la numerosidad de aquél y el número de dimensiones de éste;
ella motiva la aguda observación siguiente:
2.7 El Entscheidungsproblem 259
“oficiales”). Forma este cálculo como una extensión del anterior, agregándo-
le los signos de cuantificación y de igualdad y secuencias infinitas de (i)
25
~ y ∨ conforme a las reglas precedentes y a las que se verán en 1.4 se llama una
“Una colección (assemblage) de letras, signos y puntos formada a partir de los signos
las fórmulas sin variables individuales que este cálculo hereda del anterior
como “predicados con 0 términos” (fonctions propositionelles à 0 argument—
EL, pp. 59f.; el lector reconocerá aquí la fuente de nuestra expresión ‘predi-
cado 0-ádico’). Una proposition élément consta de un predicado seguido del
número apropiado de variables. Me permitiré llamarla fórmula elemental,
como en el Apéndice IX. Por su parte, Herbrand llama propositions
élémentaires a las fórmulas compuestas de propositions éléments y que no
contienen cuantificadores; pero a estas fórmulas —que Herbrand también
describe como fonctions propositionelles de première espèce— yo las llama-
ré matrices. Los componentes elementales de una matriz son las distintas
fórmulas elementales que figuran en ella. Llamaré valuación de una matriz a
la asignación arbitraria de un “valor lógico” V o F a cada uno de sus com-
ponentes elementales; cada valuación confiere obviamente un “valor lógico”
determinado a la matriz misma, computable por el procedimiento de las ta-
blas de verdad.
Si admitimos como axiomas a todas las fórmulas construidas sustituyen-
do letras por fórmulas elementales en los esquemas del Postulado IV de Post,
el teorema relativo a las identidades de la primera especie se extiende natu-
ralmente a las matrices: una matriz se deduce de dichos axiomas por susti-
tución y modus ponens si y sólo si su valor es V en todas sus valuaciones.
En tal caso, decimos con Herbrand que la matriz es una identidad de la pri-
estipulación citada.
2.7 El Entscheidungsproblem 262
27 “Se sobreentiende que la letra que designa una variable puede ser reemplazada sin incon-
veniente por otra (y, en particular, se puede utilizar cualquier letra como variable liga-
da), a condición eso sí de que dos variables [dentro de una misma fórmula] no pueden
designarse con la misma letra más que en el caso en que ambas estén ligadas y que sus
alcances [en nuestra jerga: el alcance de los cuantificadores que las ligan—R.T.] no
tengan ningún signo en común” (Herbrand, EL, p. 62). A la luz de la equivalencia (7)
nuestro CP1=. Sin ella no es posible deducir la tautología (∀xPx ∨ ¬∀xPx) en el sis-
del Apéndice XIII es claro que esta convención está semánticamente justificada en
tema de Herbrand. En efecto, partiendo del axioma (Px ∨ ¬Px) tenemos la deducción
siguiente (donde simbolizo con ⇒ cada aplicación de una de las reglas de generaliza-
ción o transición): (Px ∨ ¬Px) ⇒ ∃y(Px ∨ ¬Py) ⇒ (Px ∨ ∃y¬Py) ⇒ (Px ∨ ¬∀yPy)
⇒ ∀x(Px ∨ ¬∀yPy) ⇒ (∀xPx ∨ ¬∀yPy). Conforme a la convención citada, la conclu-
sión puede reescribirse (∀xPx ∨ ¬∀xPx).
2.7 El Entscheidungsproblem 263
(3) Asignamos a cada fórmula ψ una altura, determinada por los functores
que contiene, de acuerdo con las reglas siguientes: (i) Si ψ no contiene
functores su altura es 0; de otro modo, la altura de ψ es igual a la máxima
altura que tenga un functor en ψ. (ii) La altura de un functor ᒃ en una deter-
minada posición dentro de la fórmula ψ depende de su alcance en esa posi-
ción: si éste no contiene functores, ᒃ tiene altura 1; pero si el alcance de ᒃ
28 De hecho, en ese caso ᑥ comprende todas las constantes del CP1=, a, a|, a||,…; así
que la estipulación antedicha significa que C1 = {a}.
2.7 El Entscheidungsproblem 265
Esto quiere decir que si λ = 〈λ1,…,λm〉, hay al menos un entero positivo j ≤ m tal
que λj ∈ Ck. La estipulación sirve para asegurar que ᒃt no tenga en Ck+1 nuevos valores
29
q-ésima etapa (1 < q ≤ h), cada functor m-ario ᒃ que ocupa en φR una posi-
que 1 pueden ahora eliminarse en h – 1 etapas sucesivas. Al comienzo de la
de los axiomas, sin invocar la regla modus ponens, cualquier fórmula φ tal
nentes elementales. La demostración del Teorema enseña, de paso, a deducir
mas del sistema) si y sólo si para cada entero positivo p hay una valuación
Πd(φ,p) y Πc(φ,p) tiene una explicación muy sencilla. φ es consistente con los axiomas
32 Esta correspondencia en apariencia mágica entre los procedimientos para construir
del sistema si y sólo si su negación ¬φ no se deduce de ellos. Así, la matriz para con-
trolar la deducibilidad de ¬φ servirá también para controlar la consistencia de φ:
Πd(¬φ,p) = ¬Πc(φ,p). Ahora bien, la forma antiprenexa (¬φ)† = ¬(φ†), de suerte que
las relaciones de dominio entre variables son las mismas en φ y ¬φ; pero la forma
prenexa (¬φ)* difiere ¬(φ*) precisamente en cuanto las variables ligadas en ¬(φ*) por
un cuantificador universal están ligadas en (¬φ)* por un cuantificador existencial y
33 Por lo tanto, el famoso Teorema del Corte de Gentzen (1936), que enseña a deducir
cualquier fórmula prenexa sin aducir el equivalente gentzeniano de modus ponens, es
un caso especial del Teorema de Herbrand. La expresión ‘(Πd(φ,p)’ es mía; Herbrand
to, en tal caso las variables generales de φ no están dominadas por ninguna
variable restringida, de modo que, para todo entero positivo p, Cp+1 = ∅ y
∆(φ,p) = ∆(φ,1) = C1. Por lo tanto, φ es deducible si y sólo si Πd(φ,1) es una
nito” si cada matriz de control de validez Πd(φ,p) admite una valuación que
valuación que le asigna el valor lógico V, y que es “falsa en un campo infi-
0 tal que Πd (¬φ,p) es una tautología. Πd (¬φ,p) = ¬Πc(φ,p). Ahora bien, si no hay un
p > 0 tal que ¬Πc(φ,p) sea una tautología, tenemos que, para cada p > 0 hay una
valuación de ¬Πc(φ,p) y Πc(φ,p) que asigna a ¬Πc(φ,p) el valor F y, por ende, el valor
V a Πc(φ,p).
2.7 El Entscheidungsproblem 269
expresarse con gran concisión: φ es consistente (con los axiomas del siste-
vocabulario, nuestro segundo enunciado del Teorema de Herbrand puede
36 Para que el Teorema 2 arriba enunciado sea un corolario del Teorema 2 de Löwenheim
1915 no sólo hay que entender ‘identidad’ en su acepción semántica, sino además ‘campo
infinito’ en su sentido literal y no, como Herbrand, sólo como una façon de parler.
Como se vio en la p. 252, el Teorema 2 de Löwenheim 1915 dice que toda ecuación
huidiza de primer orden falla para alguna asignación de valores a sus variables en un
en nuestro CP1= a una fórmula φ tal que (i) φ no es válida, pero (ii) ¬φ es falsa en
dominio enumerable. Una ecuación huidiza en el sentido de Löwenheim corresponde
es una ecuación algebraica cuyos coeficientes son números enteros y cuyas soluciones
se buscan entre los enteros. La observación de Herbrand implica que una solución del
Entscheidungsproblem resolvería de paso el 10º problema de Hilbert: Dada una ecua-
ción con cualesquiera incógnitas y coeficientes enteros, indicar un procedimiento que
permita decidir mediante un número finito de operaciones si esa ecuación admite nú-
meros enteros como soluciones (Hilbert 1900a en GA, III, p. 310). Matijasevic (1970)
se apoyará en la solución negativa del Entscheidungsproblem por Church y Turing (vide
infra, Capítulo 2.11) para demostrar que el 10º problema de Hilbert es asimismo inso-
luble. Y. I. Manin, en su Curso de lógica matemática (1977), ofrece una excelente ex-
plicación del descubrimiento de Matijasevic (cap. VI), que precede a su exposición de
los teoremas de incompletud de Gödel (cap. VII) y de la solución negativa del Ent-
scheidungsproblem (cap. VIII).
2.8 EL CÁLCULO PREDICATIVO
DE PRIMER ORDEN ES COMPLETO
1 Piénsese que Herbrand llama propositions vraies justamente a las fórmulas deducibles.
2 La excelente versión castellana de las Obras completas de Gödel, editada por Jesús
Mosterín, contiene el artículo (pp. 23–37), mas no la tesis. Ésta aparece, acompañada
de traducción inglesa, en Gödel CW, vol. I, pp. 60–101.
273
2.8 El cálculo predicativo de primer orden es completo 274
3 Gödel 1929 declara, de entrada, que su propósito es probar que el “sistema axiomático
del llamado cálculo funcional restringido” es completo, y explica que esta propiedad
significa “que cada fórmula válida (allgemein giltige) expresable en [este cálculo] se
puede deducir de los axiomas mediante una serie finita de inferencias formales” (CW,
I, 60). En suma, un cálculo lógico premunido de axiomas y reglas de inferencia es
completo en el sentido de Gödel 1929, 1930, si es suficiente para deducir todas las
deducirse de ellos su negación ¬φ. Tras observar que un sistema deductivo consistente
es una fórmula del cálculo que no se puede deducir de los axiomas, entonces puede
les —o sea, en nuestra jerga, con predicados n-ádicos, para cualquier n ≥ 0— mediante
él todas las “expresiones lógicas” formadas con variables proposicionales y funciona-
existencial, “en las cuales los prefijos ∀x y ∃x se refieren sólo a individuos, no a pre-
las “operaciones” de disyunción, negación, cuantificación universal y cuantificación
1 X∨X→X 2 X→X ∨Y
3 X ∨Y → Y∨ X 4 (X → Y) → (Z ∨ X → Z ∨ Y)
5 ∀xF(x) → F(y) 6 ∀x(X ∨ F(x)) → X ∨ ∀xF(x)
7 x=x 8 x = y → (F(x) → F(y))
Las reglas de inferencia son: (I) Modus ponens. (II) “La regla de sustitución
5 Gödel escribe & en vez de ∧, (x) en vez de ∀x y (Ex) en vez de ∃x. Para facilitar la
lectura, utiliza paréntesis de diversas formas. Simboliza la negación, a la manera de
Hilbert y Ackermann, mediante una línea recta trazada encima de todo su alcance. Así,
por ejemplo, su fórmula (x)(Ey)P(x,y) corresponde a nuestra ¬∀x∃yPxy.
6 Este simbolismo puede también interpretarse como una expresión del hecho siguiente:
dada una formula con n variables libres, cabe siempre introducir un predicado n-ario
mula que contiene las variables proposicionales X1,…, Xm, los predicados
monádicos o poliádicos F1,…, Fk, las variables individuales libres x1,…,
xl, “y fuera de eso sólo variables ligadas” (CW, I, 66). Consideremos ahora
ciertos “individuos” a1,…, al pertenecientes a un cierto dominio (Denk-
bereich) no vacío D, ciertas “funciones (definidas en el mismo dominio)”
ƒ1,…, ƒk y aseveraciones (Aussagen) A1,…, Am. “Diremos que este siste-
ma S = (ƒ1,…, ƒk, a1,…, al, A1,…, Am) realiza (erfülle) la fórmula si,
insertado (eingesetzt) en ella, genera una oración verdadera (en el dominio
en cuestión).” Mediante esta definición, Gödel define los términos realizable
(erfüllbar) en un dominio determinado, realizable absolutamente (“hay un
dominio en el que la fórmula es realizable”), válido (allgemein giltig) en un
dominio determinado (“su negación no es realizable”) y válido absolutamente.
7 Gödel no explica esta regla, pero entiendo que ella autoriza a reemplazar uniforme-
mente (i) una variable proposicional por una fórmula cualquiera (siempre que ésta no
contenga en posiciones libres una variable ligada por un cuantificador en cuyo alcance
se hallaba alguna de las posiciones de la variable proposicional reemplazada) y (ii)
cualquier subfórmula formada por un predicado n-ádico seguido de n variables libres
por una fórmula cualquiera cuyas variables libres sean precisamente las mismas.
8 Gödel no detalla estas cautelas, sino que remite a Hilbert y Ackermann 1928, III, § 5.
2.8 El cálculo predicativo de primer orden es completo 277
Las fórmulas absolutamente válidas son las verdades lógicas. Las definicio-
nes semánticas de Gödel no son impecables, pero apuntan sin duda a las
que, siguiendo a Tarski, doy en el Apéndice IX.9
Es fácil comprobar que los axiomas 1–8 son válidos en el sentido indicado
y que las reglas de inferencia I–IV preservan la validez. Gödel lo acepta sin
discusión. Por lo tanto, toda fórmula deducible es válida. Lo que va a pro-
bar es la proposición recíproca: Toda fórmula válida del CP1= es deducible
en el sistema deductivo descrito (Teorema I del artículo). Ella equivale a esta
válida y por ende deducible, de suerte que φ es refutable, como dice el Teo-
rema II; mientras que si vale el Teorema II y φ es válida, ¬φ no es rea-
lizable y por ende es refutable, de suerte que ¬¬φ es deducible y, con ella,
también φ, como dice el Teorema I. En vista de ello, Gödel acomete
directamente la prueba del Teorema II.10 Lo prueba primero para las fórmu-
9 Traduje lo más literalmente que pude el pasaje clave para criticar aquí sus defectos.
Ante todo, ¿en qué consiste la operación de insertar (einsetzen) el sistema S en la fór-
mula A? S consta de elementos lingüísticos —las aseveraciones A1,…, Am— que
podrían, tal vez, insertarse literalmente en A, pero también incluye elementos no
lingüísticos, que no sería posible acomodar dentro de una fórmula. Es razonable supo-
ner que cuando habla de ‘insertar’ ciertos individuos en la fórmula Gödel quiere refe-
rirse al reemplazo uniforme de cada variable individual por una expresión que designe
exclusivamente a uno de esos individuos. Otro tanto habría que decir de la inserción
de las funciones ƒ1,…, ƒk. Hay que advertir, además, que cada una de éstas tendrá
que ser lo que solía llamarse una “función proposicional”, esto es, un aplicación de Dn
de la lista 〈F1,…, Fk〉 en cuyo lugar la función se “inserta”. En Gödel 1929 y 1930
en {0,1} o en {“lo verdadero”, “lo falso”}, con n igual a la n-adicidad del predicado
falta toda indicación sobre el empleo de functores (signos que se combinan con térmi-
nos para formar nuevos términos; vide Apéndice IX.E). Por otra parte, en vista del papel
que desempeñan las variables proposicionales en el cálculo lógico, no hace falta, para
juzgar la realizabilidad de una fórmula que contenga tales variables, que éstas se sus-
tituyan con aseveraciones bien determinadas, como propone Gödel; basta asignarle a
cada variable proposicional un valor veritativo fijo cualquiera. Finalmente, Gödel nos
deja en la total oscuridad en lo que respecta a verdad o falsedad de la oración obtenida
“insertando” el sistema S en la fórmula A cuando ésta contiene cuantificadores. Será
sión las condiciones en que una fórmula precedida por ∀ ο ∃ es o no verdadera en una
Tarski quien, junto con elucidar la “inserción” como interpretación, enuncie con preci-
contienen también otros signos. Sea pues φ una fórmula cualquiera de este
a ᑮ. La discusión puede, entonces confinarse a las fórmulas del CP1 que
tipo. Gödel prueba primero que φ ∈ ᑮ si y sólo cierta fórmula de una clase
especial ᑥ ⊆ ᑠ pertenece a ᑮ. La etapa decisiva de la prueba consiste en-
tonces en establecer que ᑥ ⊆ ᑮ. La reducción del problema general a este
otro más particular comprende varios pasos que describo enseguida (en las
Teorema II es estrictamente más fuerte que el Teorema I y contiene (una forma de) el
Teorema de Löwenheim-Skolem. La prueba gödeliana nos rinde pues este importante
teorema como suplemento. (La cláusula mencionada se aplica a las fórmulas del CP1;
como se verá en la nota 27, en el caso del CP1= vale la condición más débil: Si una
Piénsese que la fórmula ∀x∀y(x = y), aunque irrefutable en el sistema descrito, única-
fórmula no es refutable, es realizable en un dominio enumerable, que puede ser finito.
la fórmula prenexa φ1 contiene las variables libres ξ1, ξ2,…, ξk es claro que φ1 es
Recuérdese que llamamos cerrada a una fórmula que no contiene variables libres. Si
si y sólo si hay una fórmula prenexa cerrada φ2 ∈ ᑮ.12 Por otra parte, la
fórmula prenexa cerrada φ2 ∈ ᑮ si y sólo si hay una fórmula prenexa cerra-
da φ3, cuyo prefijo comienza con un cuantificador universal y termina con
un cuantificador existencial, tal que φ3 ∈ ᑮ.13 Las fórmulas prenexas cerra-
das cuyo prefijo comienza con un cuantificador universal y termina con un
cuantificador existencial constituyen la clase especial ᑥ. Llamémoslas ᑥ-
fórmulas. El grado de una ᑥ-fórmula es el número de cuantificadores uni-
versales en su prefijo cuyos respectivos sucesores inmediatos son cuantifica-
dores existenciales. Sea ᑥn la clase de las ᑥ-fórmulas de grado n. Gödel
variables individuales que no figuran en ψ (como hemos visto en otras ocasiones, esta
matriz en que figuran las variables listadas (y sólo ellas). Con una maniobra
Θ1 = Θ(x1,x1,x2,…,xs)
Θ2 = Θ1 ∧ Θ(x2,xs+1,xs+2,…,x2s)
Θn = Θn–1 ∧ Θ(xn,x(n–1)s+1,x(n–1)s+2,…,xns)
…………………………………………………
…………………………………………………
tuplo xn+1. Llamo (Pn′) al prefijo que se obtiene al eliminar de (Pn) a todos
vemos que el prefijo (Pn) inevitablemente incluirá todas las variables del r-
15 Como los r elementos de x1 son la misma variable x0, sólo el último cuantificador de
Θ(x1,x1,x2,…,xs); los r-1 restantes podrían borrarse. Pero evidentemente es más cómo-
la fila "x1 liga en efecto a esa variable en todas sus posiciones libres en la matriz
∂"xn+1&yn+1Θ(xn+1,yn+1) ∧ &xn+1(Pn′)Θn
→ &xn+1((Pn′)Θn ∧ &yn+1Θ(xn+1,yn+1)) (6)
Ahora bien, las apódosis de (4) y (5) —esto es, las subfórmulas que siguen
a la flecha en dichas fórmulas— son los dos miembros de la conjunción que
forma la prótasis —la subfórmula que precede a la flecha— en (6). Pode-
mos, pues, reemplazar ésta por la conjunción de las prótasis de (4) y (5),18
para obtener:
19 En otras palabras, la prueba de Gödel está confinada a lo que suele llamarse cálculo
predicativo puro (sin constantes individuales). Pero el argumento sintáctico arriba de-
adaptarse sin dificultad al caso en que la fórmula ψ bajo consideración contiene cons-
sarrollado no supone esta restricción y el argumento semántico que ahora veremos puede
tantes individuales (es cosa de darles también a éstas una interpretación numérica como
la que se les da a las variables).
2.8 El cálculo predicativo de primer orden es completo 285
ción ƒjn ∈ Sn y los valores veritativos wim y win son, respectivamente, iguales
para cada índice i (1 ≤ j ≤ k, 1 ≤ i ≤ h).
Es claro que, si la fórmula verifuncional ϑn asociada a la matriz Θn es
mental de Θn por una variable proposicional. Supongamos, para mayor comodidad, que
cada variable proposicional Xi está representada en ϑn por ella misma. Las demás
subfórmulas elementales de Θn pueden numerarse en el orden en que aparecen por pri-
ϑn es realizable, hay una asignación V de valores veritativos a las Xi y las Yq tal que
mera vez. Sea Yq la variable proposicional que reemplaza a la q-ésima subfórmula. Si
23 En el original, la última oración dice así : “So weiter schließend zeigt man in bekannter
rusa: Sn ⊃ Sn-1 ⊃ Sn-2 ⊃…⊃ S2 ⊃ S1; pero eso no prueba que dicha serie
coincida con la parte final de la serie obtenida a partir de otro sistema Sm,
con m > n. Por hipótesis, tenemos una galería infinita de “muñecas rusas”
como la descrita, una para cada entero positivo n, pero no cabe combinarlas,
por inducción, en una sola supermuñeca infinita. Por otra parte, hay una pro-
posición —que Dénes König (1926) dedujo del Axioma de Selección, pero
que es estrictamente más débil que éste— que viene como anillo al dedo a
la situación descrita por Gödel. Dice así:
Σn tal que bRa, entonces hay una secuencia a1, a2,… tal que, para
cada n > 0, an ∈ Σn y anRan+1.24
a un punto de Gn, entonces existe un camino infinito p1, p2,…, tal que pi ∈ Gi.
ninguno de ellos tiene un punto en común con otro, pero cada punto de Gn+1 está unido
mulas elementales que figuran en cada matriz Θn. Sea qn el número de fórmulas ele-
modos como se pueden distribuir los valores veritativos (1 y 0) entre las diversas fór-
mentales diferentes que figuran en Θn. Entonces hay 2qn distribuciones posibles de va-
de sus primeras posiciones (de izquierda a derecha) en Θn, cada distribución Wn queda
lores veritativos entre las mismas. Si tomamos dichas fórmulas elementales en el orden
tarla (Dreben y van Heijenoort, en Gödel, CW, I, 53).25 En todo caso, Gödel
nunca ha cuestionado el Axioma de Selección y en la introducción a la tesis
previene expresamente que no se inhibirá de utilizar ningún medio matemá-
tico de prueba, una advertencia que sólo resulta pertinente en el punto que
las fórmulas elementales de Θm aparecen en Θn antes que todas las fórmulas elemen-
tales que no figuran en Θm. Diremos que la distribución Wn asociada a Θn contiene a
la distribución Wm asociada a Θm (Wm ⊂ Wn) si las fórmulas elementales comunes a
ambas matrices reciben, respectivamente, los mismos valores en Wm y Wn. Nótese que
asociadas a las matrices indicadas por los subíndices y Wm ⊂ Wn y W′m ⊂ W′n, en-
si #Wm, #W′m, #Wn y #W′n son los números representativos de cuatro distribuciones
tonces #Wm ≤ #W′m implica que #Wn ≤ #W′n. Diremos con Hilbert y Bernays que una
distribución de valores veritativos entre las fórmulas elementales de una matriz es una
(“lo verdadero”). Por hipótesis, hay por lo menos una distribución realizadora de Θn,
distribución realizadora (erfüllende Verteilung) de la misma, si le confiere el valor 1
para cada n > 0. Si m < n, Θn es una conjunción de Θm con otras fórmulas. Por lo
tanto, cada distribución Wn realizadora de Θn, contiene una distribución Wm realizado-
ra de Θm. Diremos que Wm es el m-componente de Wn. Nótese que, si m < k < n y Wk
es el k-componente de Wn, entonces el m-componente de Wn es también el m-compo-
realizadoras de Θm tiene que haber por lo menos una que, para todo n > m, sea el m-
nente de Wk. “Según esto, resulta (demnach ergibt sich) que entre las distribuciones
componente de una distribución realizadora de Θn” (Hilbert y Bernays, GG, II, 194;
cursiva mía). Entre las distribuciones que tienen esta propiedad, para un dado m > 0,
hay una cuyo número representativo es menor que el de las demás; llamémosla W*m.
Hilbert y Bernays prueban que, si m y n son dos enteros positivos cualesquiera tales
que m < n, entonces W*m es el m-componente de W*n. Para ello, aprovechan lindamente
ces, por la misma definición de W*m y W*n tenemos que #W*m ≤ #Wm y #W*n ≤
W*m ⊂ Wn, Wn ⊂ W*n y #W*m ≤ #Wm implica que #Wn ≤ #W*n, de modo que #Wn
#Wn; por otra parte, como hice notar arriba, la aseveración conjunta de las condiciones
determina inequívocamente una secuencia W*1 ⊂ W*2 ⊂…, que sirve de base a
= #W*n; por lo tanto, Wn = W*n y W*m es el m-componente de W*n. Este resultado
estamos considerando.26
≤ k); (ii) wi = wim para algún m > 0 (y, por ende, para todos); (iii) hay un m
> 0 tal que la restricción de ƒj a Zm es igual a ƒjm (y, por lo tanto, la restric-
27 La argumentación es algo más ágil en el artículo que en la tesis, pero la idea central es
en ambos textos la misma: tratar el signo = como un predicado diádico que cumple las
a continuación el razonamiento del artículo. Sea φ una fórmula del CP1= que conten-
condiciones estipuladas en los axiomas 7 y 8 e invocar la suficiencia del CP1. Esbozo
ga precisamente las variables individuales ξ1,…, ξh y los predicados Π1,…, Πk. Cons-
truimos la fórmula φ′ = φ ∧ ∀x(x = x) ∧ ψ, donde ψ es una conjunción formada como
sigue: si Π es un predicado n-ádico (n ≥ 1) contenido en la lista 〈Π1,…,Πk〉 y
〈ζ1,…,ζn〉 es cualquier n-tuplo formado con variables de la lista 〈ξ1,…,ξh〉, la fór-
mula ∀ξr∀ζ1…∀ζs…∀ζn(ζs = ξr → (Πζ1…ζs…ζn → Πζ1…ξr…ζn)) es una de las
subfórmulas unidas en ψ por el signo ∧ (1 ≤ r ≤ h; 1 ≤ s ≤ n). Si tratamos el signo =
como un predicado binario cualquiera, φ′ es una fórmula del CP1 y, por lo tanto, es
realizable o refutable. Supongamos que φ′ es refutable, o sea, que ¬φ′ es deducible de
los axiomas 1–6. Entonces, como ∀x(x = x) ∧ ψ es obviamente deducible de los axio-
2.8 El cálculo predicativo de primer orden es completo 290
Σ = {"1&1Φ1(1;1),"2&2Φ2(2;2),…,"n&nΦn(n;n),…}
la secuencia x0, x1,… Como se hizo arriba con las matrices Θn, definimos
secuencia infinita resultante, y11, y12, y21, y13, y22, y31, y14,… coincide con
una secuencia de matrices Ξ1, Ξ2,…, mediante las dos estipulaciones si-
guientes:
Ξ1 = Φ1(x11;y11)
Ξn = Ξn–1 ∧ Ξ1(x1n;y1n) ∧ Ξ2(x2(n–1);y2(n–1)) ∧…∧ Ξn(xn1;yn1)
tiene que ser reflexiva, simétrica y transitiva (para que satisfaga a ∀x(x = x) ∧ ψ); por
realización M en ˆ. La relación aritmética diádica que modela al predicado = en M
cada predicado Πj (1 ≤ j ≤ k) es modelado por la relación que subsiste entre las clases
de equivalencia cuyos miembros satisfacen la relación que modela a Πj en M, y el
predicado = es modelado por la genuina identidad. Obviamente, la fórmula φ tiene que
estar realizada en toda realización de φ′. En particular, M* constituye una realización
de φ entendida como fórmula del CP1=.
2.8 El cálculo predicativo de primer orden es completo 291
bles libres en Ξn. Es claro que (Pn)Ξn se deduce del conjunto finito de
Sea (Pn) una fila de cuantificadores existenciales que ligan a todas las varia-
junto Σ es realizable.
Del Teorema X se sigue inmediatamente el siguiente corolario: Si Σ es un
conjunto numerable de fórmulas del CP1=, o bien Σ es realizable, o bien Σ
incluye un subconjunto finito de fórmulas {α1,…,αn} tal que α1 ∧…∧
αn es refutable (Teorema IX; Gödel 1930, p. 357; también en la tesis, § 8,
CW, I, 96ss.). Como Gödel expresamente señala, esto significa que, si Σ es
el conjunto finito o numerablemente infinito de los axiomas de una teoría
matemática expresable en el CP1=, se cumple una de estas alternativas: o
bien (ii) hay un modelo —una realización— de la teoría. En una nota, Gödel
cita como ejemplo la teoría de los Grundlagen der Geometrie de Hilbert,
“sin los axiomas de continuidad” (que no se pueden expresar en un cálculo
de primer orden).28 De este modo, el corolario citado resuelve, al menos para
este fragmento de la teoría geométrica, la disputa entre Hilbert y Frege a
que me referí en el Capítulo 2.1. Hilbert había escrito a Frege, algo liviana-
mente, que “si los axiomas arbitrariamente estipulados, junto con todas sus
consecuencias, no se contradicen entre sí, entonces son verdaderos y existen
las cosas definidas por ellos: ése es para mí el criterio de la existencia y de
la verdad” (Frege, KS, p. 411; vide p. 118). En este pasaje, Hilbert posible-
mente decía ‘existencia’ sólo como una manera de hablar, pero la prueba de
Gödel le devuelve a la palabra su sentido literal: si la teoría es sintácticamente
1928, quien probó que las fórmulas de la clase ∃…∃∀∃…∃ son decidibles. Gödel 1932
tres cuantificadores universales seguidos de una fila de existenciales). Esto podía verse
Pero esta definición —con sólo que uno exija, como es obvio, que el
concepto de existencia así introducido obedezca a las mismas reglas de
operación que el elemental— presupone evidentemente el axioma de la
solubilidad de todo problema matemático. Pues si se demostrara la insolubi-
lidad de algún problema (relativo, digamos, al dominio de los números
naturales), de esto se desprendería conforme a dicha definición que exis-
ten dos realizaciones no isomórficas del sistema axiomático de los núme-
ros reales, mientras que, por otra parte, se puede demostrar el isomorfis-
mo que cualquier par de realizaciones. Pero la demostración de la
insolubilidad de un problema no se puede excluir de antemano, si se piensa
que hablamos sólo de insolubilidad con ciertos modos de inferencia for-
mal precisamente señalados. Pues todos los conceptos que vienen a cuen-
to aquí (demostrable, consistente, etc.) sólo tienen un sentido exacto si se
deslindan con precisión los modos de inferencia permitidos.
(Gödel, CW, I, 60–62; cursiva mía)32
31 De paso señalo que el pronombre posesivo ‘ihre’ (‘de ellos’ o ‘de ella’) que precede a
‘Widerspruchslosigkeit’ (‘ausencia de contradicción’, arriba traducido ‘consistencia’) sólo
puede referirse al sustantivo plural ‘Begriffe’ (‘conceptos’) o al femenino singular
‘Existenz’ (‘existencia’), y no al neutro singular ‘Axiomensystem’ (‘sistema de axio-
mas’) como cree el traductor inglés (Gödel, CW, I, 61). Por lo demás, en el texto ale-
mán ‘Begriffe’ está más cerca de ‘ihre’ que los otros dos sustantivos. Habría que expli-
car, claro está, qué significa la ‘ausencia de contradicción’ de un grupo de conceptos.
Por esto, he preferido dar una traducción ambigua.
32 En el original sólo van en cursiva las palabras correspondientes a ‘formal precisamente
señalados’.
2.8 El cálculo predicativo de primer orden es completo 294
∀x∀y(x = y), lo que hace falso a 8 en cualquier dominio con dos o más
de éstos). Por ejemplo, para mostrar que 8 no se deduce de 1–7 postula que
295
2.9 El programa de Hilbert visto más de cerca 296
1 Más tarde, Hilbert describirá a Kronecker como su precursor más directo: éste “formu-
ló claramente y dilucidó con numerosos ejemplos una concepción que hoy coincide en
lo esencial con nuestra postura finita” (Hilbert 1931, p. 487). Como bien señala Bernays,
el acuerdo que Hilbert percibe entre su propio modo de pensar y el de Kronecker es-
triba “especialmente en el concepto intuitivo de numeral y en el reconocimiento de
que la forma intuitiva de la inducción completa, esto es, el modo de inferencia que se
basa en la representación intuitiva de la ‘construcción’ de los numerales, es evidente y
no requiere ulterior fundamentación” (1935, p. 203). Sobre la diferencia entre dicha
“forma intuitiva de la inducción completa” y la inducción matemática irrestricta, véase
más adelante la nota 15.
2 El párrafo dedicado a Frege figura en Hilbert, GG7, pp. 248s. Sorprende que Hilbert
creyera que Frege concebía la lógica “en sentido tradicional” (in hergebrachtem Sinne).
Merece atención la sugerencia de que las paradojas vienen de la aceptación indebida
2.9 El programa de Hilbert visto más de cerca 299
signos 1, =, ᒒ, ᒃ, y ᒃ′. Estas cosas —que luego (p. 255) llama “simples”—
Hilbert propone la consideración de cinco cosas, nombradas mediante los
tal vez evitar ese supuesto5 y se limita por eso a ilustrar tales combinaciones
de cosas mediante concatenaciones de los signos que las nombran, sin la más
mínima indicación de cómo hay que entenderlas. He aquí sus ejemplos:
1 = 1, (11) = (1)(1)
gino, sólo para facilitar la lectura. Pero los paréntesis ) y ( obviamente for-
man parte de la combinación de signos que nombra una dada combinación
de cosas, aunque Hilbert no dice como se usan, ni siquiera los introduce
formalmente. Hilbert nos invita enseguida a “pensar que las combinaciones
de esas dos cosas simples se reparten en dos clases, la clase de los existen-
tes (der Seienden) y la de los no-existentes (der Nichtseienden)” (GG7, p.
251). Si a es una concatenación de signos que nombra una combinación, a
significa también el enunciado de que la combinación nombrada por a per-
tenece a la clase de los existentes y a ‹ significa el enunciado de que dicha
combinación pertenece a la clase de los no-existentes. El enunciado a es
correcto (richtig) si la combinación a efectivamente pertenece a la clase de
los existentes, pero si ella pertenece a la clase de los no-existentes es co-
rrecto el enunciado a .‹ Los enunciados a y a ‹ constituyen —dice Hilbert—
una contradicción.
Hilbert enseña luego a formar un enunciado nuevo a partir de dos enun-
5 Más adelante Hilbert reconoce, sin embargo, que para demostrar la consistencia del
sistema formal esbozado necesitará el concepto de número ordinal finito (GG7, p. 255).
2.9 El programa de Hilbert visto más de cerca 301
sólo en las combinaciones w(x) y w(y)). El uso de estas letras se explica así:
x e y representan a uno de los signos 1 y =, o una combinación cualquiera
de estos signos; w(x) representa una combinación arbitraria de los cinco sig-
nos que contiene la combinación de los signos 1 y = representada por la
letra x. He aquí los axiomas, tal como Hilbert los escribe:
1 x = x
2 {x = y u. w(x)} | w(y)
3 ᒃ(ᒒx) = ᒒ(ᒃ′x)
4 ᒃ(ᒒx) = ᒃ(ᒒy) | ᒒx = ᒒy
5 ᒃ(ᒒx) = ᒒ1
Para mayor claridad, doy las dos reglas en nuestro simbolismo: (i) de ((a → b) ∧ (¬a
→ b)) inferir b; (ii) de ((a ∨ b) ∧ (a ∨ c)) inferir (a ∨ (b ∧ c). Adviértase que ninguna
7
de las dos envuelve expresiones con cuantificadores. Tampoco hay una regla de susti-
tución, pero esto es natural si todos los axiomas se dan en la forma de esquemas.
8 Hilbert dice que “los enunciados que forman con 5 una contradicción tienen que ser
[…] de la forma: 6 ᒃ(ᒒx(o)) = ᒒ1” (GG7, p. 254). Si el cuantificador existencial con-
2.9 El programa de Hilbert visto más de cerca 303
que Hilbert llama una ecuación homogénea, esto es, una combinación de la
forma a = b, en que a y b son n-tuplos de objetos simples (para un mismo
n). En virtud de esto, para completar la prueba de consistencia basta demos-
trar que de los axiomas 1–4 no puede inferirse ninguna ecuación que no sea
homogénea. Para efectuar dicha demostración hacen falta, según Hilbert, el
concepto de número ordinal finito y ciertos teoremas sobre el concepto de
equinumerosidad que —nos dice— pueden formularse y derivarse sin esfuerzo
(ohne Mühe). Seguramente tiene razón. En los años 20 —como ya hemos
visto— varios discípulos de Hilbert probarán rigurosamente y sin dificultad
la consistencia del muñón de aritmética basado en los axiomas P1–P4 de
Peano.9
El signo 1 es un número.
Un signo que empieza con 1 y termina con 1 y en el cual cada 1 va se-
guido por [el signo] + y cada + va seguido por 1 también es un número;
vgr. los signos
1+1
1+1+1
(Hilbert 1922, en GA III, 163)
13 Cf. 1922, en GA III, 162s.; 1926, p. 170; 1928 en GG7, pp. 289s.
2.9 El programa de Hilbert visto más de cerca 308
seguido de una o más copias del signo ‘+1’. Tras esta concisa explicación,
Hilbert propone usar letras góticas como numerales (Zahlzeichen), esto es
como variables que representan números indeterminados. Demuestra luego
el teorema siguiente: cualesquiera que sean los números ᑾ y ᑿ, ᑾ + ᑿ = ᑿ +
ᑾ. En efecto, si ᑾ = ᑿ, es claro que ᑾ + ᑿ = ᑾ + ᑾ = ᑿ + ᑾ. De otro modo,
podemos suponer que ᑿ > ᑾ. En tal caso, hay un número ᒀ tal que ᑿ = ᑾ +
ᒀ. Hay que demostrar, entonces, que ᑾ + ᑾ + ᒀ = ᑾ + ᒀ + ᑾ. Pero esto es
queda demostrado para cualquier par de números 〈ᑾ, b〉 con sólo que sea
obvio si ᑾ + ᒀ = ᒀ + ᑾ. Por lo tanto, como ᑾ + ᑿ > ᑿ = ᑾ + ᒀ, el teorema
+…+ 1. El “paso inductivo” se reduce a ver que, dada una fila φ de este tipo, la fila
discurrimos sobre la construcción de dos filas de signos de la forma general 1 + 1
que sea ᒕ, ¬P(ᒕ) ∨ P(ᒕ + 1). La diferencia entre este caso y el anterior estriba en la
quiera que sea el número ᒕ, de las dos premisas siguientes: (i) P(1) y (ii) cualquiera
16 “Todos los héroes del espíritu antes de Gauß, y también los que siguen a Gauß, Hermite
y Jacobi hasta Poincaré, han empleado la inferencia transfinita en las formas más va-
riadas y audaces, sin que nunca se haya manifestado ni la más leve discordancia. Por
último, cuando pensamos en las aplicaciones y nos hacemos cargo de la riqueza en
inferencias transfinitas del tipo más difícil y laborioso que albergan, por ejemplo, la
teoría de la relatividad y la teoría cuántica y cómo, sin embargo, la naturaleza se ajusta
precisamente a sus resultados —el rayo de luz de la estrella [curvado cuando pasa cerca
del sol], Mercurio y los espectros más complicados aquí en la tierra y a una distancia
de cientos de miles de años luz— ¿será posible en tales circunstancias que, a causa de
los lindos ojos de Kronecker y unos cuantos filósofos disfrazados de matemáticos, por
razones que además son completamente arbitrarias y ni siquiera se dejan formular con
precisión, dudemos siquiera un instante de que la aplicación del Tertium non datur se
justifica?” (Hilbert 1931, pp. 487s.).
17 El término ‘epsilóntica’ alude a la práctica habitual en los cursos de análisis de utilizar
la minúscula griega epsilon (ε) para referirse a una cantidad arbitrariamente pequeña.
cualquier ε > 0, hay un δ > 0 tal que |ƒ(x) – ƒ(a)| < ε si |x – a| < δ.
Por ejemplo, decimos que la función ƒ: Â Æ Â es continua en el argumento a si, para
2.9 El programa de Hilbert visto más de cerca 311
queño e infinitamente grande no era más que una manera de hablar, así
también lo infinito en el sentido de la colección infinita, como aún ahora
se nos presenta en los modos de inferencia, tiene que reconocerse como
algo meramente aparente. Y así como el operar con lo infinitamente pe-
queño fue reemplazado con procesos en el dominio finito que efectúan lo
mismo y llevan a las mismas elegantes relaciones formales, así también
en general hay que reemplazar los modos de inferencia que envuelven lo
infinito con procesos finitos que efectúan lo mismo, es decir, que hacen
posibles las mismas demostraciones y los mismos métodos para obtener
fórmulas y teoremas.
(Hilbert 1926, p. 162; cursiva mía)18
nen uno real—; así también tenemos que adjuntar (adjungieren) los enun-
ciados ideales a los enunciados finitos, para preservar las reglas formales
simples de la logica aristotélica usual.
(Hilbert 1926, p. 174; cf. 1928 en GG7, pp. 298s.)
18 A este mismo contexto pertenece la frase de Hilbert en que se inspira el título de este
libro: “Del paraíso que Cantor creó para nosotros, nadie podrá expulsarnos” (1926, p.
170). Las expresiones que destaqué en el pasaje arriba citado indican que Hilbert con-
cibe este paraíso como un set cinematográfico: el Jardín de las Delicias pintado sobre
papel.
2.9 El programa de Hilbert visto más de cerca 312
Hilbert. Por eso Hilbert puede decir (1926, p. 175) que la fórmula algebraica
a+b=b+a
3+2=2+3
5+7=7+5
Como los enunciados ideales —esto es, las fórmulas que no expresan
aseveraciones finitas— no significan nada, las operaciones lógicas no
pueden aplicárseles de un modo sustantivo como a los enunciados finitos.
Es necesario entonces formalizar también las operaciones lógicas y las
demostraciones matemáticas mismas.
(Hilbert 1926, p. 176)20
19 Como expliqué en la p. 123, nota 13, uso ‘sustantivo’ para traducir el término hilbertiano
‘inhaltlich’.
20 Hilbert prosigue diciendo que, gracias a esa “armonía preestablecida que tan a menudo
se observa en la historia evolutiva de la ciencia”, dicha formalización está ya muy ade-
lantada por obra de los creadores del cálculo lógico.
Los símbolos del cálculo lógico se introdujeron originalmente sólo para la comu-
nicación; pero es consecuente que ahora neguemos todo significado a los signos
lógicos, igual que a los matemáticos, y declaremos que también las fórmulas del
cálculo lógico no significan nada de por sí, sino que son enunciados ideales. En el
cálculo lógico poseemos un lenguaje de signos que es capaz de abarcar en fórmu-
las los teoremas matemáticos y de expresar la inferencia lógica mediante procesos
formales. Igual que en el tránsito de la aritmética sustantiva (inhaltliche
Zahlenlehre) al álgebra formal, contemplamos los signos y símbolos de operacio-
nes del cálculo lógico prescindiendo de su significado sustantivo. Así obtenemos
finalmente, en lugar de la ciencia matemática sustantiva que se trasmite mediante
el lenguaje ordinario, una provisión de fórmulas con signos matemáticos y lógi-
2.9 El programa de Hilbert visto más de cerca 313
cos, enfiladas unas tras otras según ciertas reglas. A los axiomas matemáticos
corresponden algunas de las fórmulas, y a la inferencia sustantiva corresponden
las reglas de acuerdo con las cuales se suceden las fórmulas. De este modo, la
inferencia sustantiva es reemplazada por un operar extrínseco (ein äußeres Handeln)
conforme a reglas y se consuma rigurosamente el tránsito del tratamiento ingenuo
al tratamiento formal con respecto a los axiomas mismos —que en un principio
se propusieron ingenuamente como verdades fundamentales, pero que la axiomática
moderna considera hace tiempo como meras combinaciones de conceptos— y tam-
bién con respecto al cálculo lógico, que originalmente no pretendía ser sino un
lenguaje más.
(1926, pp. 176s.; cf. GA III, 165, 179; GG7, pp. 298s.).
2.9 El programa de Hilbert visto más de cerca 314
21
que no puede haber una prueba constituida de cierto modo. Pero una prueba
formalizada, lo mismo que un numeral, es un objeto concreto y abarcable
titución de la fórmula final, a saber, que lea ‘1 ≠ 1’, es una propiedad con-
con la mirada. Es comunicable de principio a fin. También la requerida cons-
entre sí, tales que ᑾ/ᑿ = √2. En tal caso, ᑾ2 = 2ᑿ2. Por lo tanto, ᑾ2 es un número par.
Pero un número par no puede ser el cuadrado de un número impar (si ᒕ = 2ᒋ + 1,
entonces ᒕ2 = 4ᒋ2 + 2ᒋ + 1, que es impar). Por lo tanto, ᑾ es par: ᑾ = 2ᒀ. Por lo tanto,
mula “1 ≠ 1”. Bastaría construir una prueba formal que desemboque en esta fórmula.
finitos. Para eso sí que nos ayudaría la índole “concretamente constatable” de la fór-
prueba de la matemática formalizada; y no veo bien por qué Hilbert daba tan fácilmen-
te por descontado que esta aseveración referente a todas las infinitas pruebas en prin-
cipio enunciables podría demostrarse con medios finitos.
2.9 El programa de Hilbert visto más de cerca 317
∀xᑛ(x).23
mula numérica correcta, puede usarse como premisa la fórmula
23 Hilbert 1931, p. 491. La regla citada suele llamarse “la regla ω” (cf. Isaacson 1992).
Hilbert comenta que la “oración (Aussage)” ∀xᑛ(x) va mucho más lejos que la “fór-
mula (Formel)” ᑛ(ᒗ), con ᒗ un numeral cualquiera, puesto que aquélla autoriza a infe-
rir toda oración que se obtenga reemplazando en ᑛ(x) la variable libre x por cualquier
término que denote un número (no sólo por cualquier numeral).
2.9 El programa de Hilbert visto más de cerca 318
Cantor llamó ε0 (el primer ordinal ξ, tal que ωξ = ξ.). Hilbert y Bernays
do por Gödel empleando inducción transfinita hasta el ordinal numerable que
reconocieron que los métodos de Gentzen tenían cabida dentro del programa
de Hilbert y eran compatibles con su punto de vista finitista. Para ello tuvie-
ron que “ampliar el marco de los modos de inferencia sustantivos admitidos
en la teoría de la prueba” (1939, p. vii; cito el original en la p. 421, nota 1),
pero esto no les causó, al parecer, ningún escrúpulo. Resta, sin embargo, una
duda: si el programa de Hilbert acaba recurriendo al transfinito, ¿por qué
tantos melindres y reservas ante el paraíso heredado de Cantor? ¿por qué no
instalarse en él, alegremente, de una vez por todas?
duda menos probatorio que en el caso de los que satisfacen a las exigencias ini-
ciales de Hilbert y es esencialmente cosa de la psicología personal de cada mate-
mático.
(Bourbaki 1970, E.IV.75-76)
Últimamente algunos filósofos han alegado que el citado descubrimiento de Gödel no
constituye un obstáculo para el programa de Hilbert (Webb 1980, Detlefsen 1986, 1990).
Pero hasta la fecha no han establecido que la consistencia de la aritmética se pueda
demostrar con recursos más débiles que los utilizados por Gentzen. Me referiré nueva-
mente a Detlefsen una vez que hayamos estudiado los resultados de Gödel (p. 358,
nota 48).
2.10 LOS TEOREMAS DE INCOMPLETUD DE GÖDEL
2.10.1 Preliminares
1 Como bien señala Post, “si la función recursiva general [una de esas nociones precisas
de función computable—R.T.] es el equivalente formal de la calculabilidad efectiva, su
formulación podría tener en la historia de la matemática combinatoria una importancia
superada sólo por la formulación del concepto de número natural” (1944, p. 315).
321
2.10 Los Teoremas de Incompletud de Gödel 322
de identidad de una prueba (esto es, de una lista de fórmulas del cálculo,
cada una de las cuales es un axioma del cálculo o se deduce, conforme a las
reglas de inferencia del cálculo, de una o más fórmulas que la preceden en
la lista) y, en caso afirmativo, (c) que sea posible reconstruir las fórmulas de
que consta la prueba correspondiente. Gracias a esta doble representación —
de la aritmética en el cálculo y del cálculo en la aritmética— Gödel puede
cerrar el círculo de espejos en que descansa su Teorema VI, el “primer teo-
rema de incompletud”. En la Sección 2.10.2 describiré, paso a paso, la com-
pleja argumentación que culmina en ese teorema. Pero antes conviene deli-
nearla a grandes rasgos, para saber adónde lleva, y sobre todo para captar
con un sólo golpe de vista la función que desempeñan en ella las caracterís-
ticas (i) y (ii). El bosquejo siguiente es una paráfrasis del ofrecido por el
mismo Gödel (1931, § 1).
Gödel supone que toda oración deducible de los axiomas del cálculo con-
siderado —esto es, toda oración que ocupa el último lugar de una lista que
constituye una prueba— expresa una aseveración verdadera. Este supuesto
es muy razonable, pues mal podría pretenderse formalizar la aritmética en
un cálculo que genera teoremas falsos. Con todo, Gödel lo adopta sólo para
facilitar la presentación del bosquejo preliminar: la demostración rigurosa del
Teorema VI en el § 2 depende de supuestos puramente sintácticos, y no in-
voca el concepto de verdad. Para decir en castellano que φ es una oración
deducible de los axiomas del cálculo, escribiremos ∂φ;5 asimismo, la abre-
viatura Îφ expresará que φ no es una oración deducible de los axiomas del
cálculo. Supondremos que el cálculo contiene categorías sintácticas homólogas
a las constantes y variables de nuestros cálculos predicativos (Apéndice IX).6
Para que pueda representar formalmente la aritmética, el cálculo debe conte-
ner un conectivo —primitivo o introducido por definición— que prefijado a
una oración verdadera genere una oración falsa y prefijado a una falsa gene-
re una verdadera. Simbolizaré este conectivo del cálculo con el signo
5 Gödel usa la abreviatura Bew, del alemán ‘beweisbar’ (‘demostrable’). Sus traductores
al inglés y al castellano han preservado esta abreviatura, aunque en estos idiomas, a
diferencia del original, ella obstaculiza la lectura: no sólo no evoca ninguna palabra
pertinente, sino que ni siquiera se la puede pronunciar con facilidad.
6 Este requisito afecta, sin duda, la generalidad del argumento. Como puede verse en el
Apéndice XVI, de hecho no se lo necesita para demostrar la “forma abstracta” del pri-
mer teorema de Gödel presentada allí.
2.10 Los Teoremas de Incompletud de Gödel 324
7 Adopto esta convención porque en toda este capítulo utilizaré nuestros símbolos logicos
como abreviaturas del discurso metalógico que conducimos en castellano. Imito así la
práctica de Gödel, que destinó a tal propósito los símbolos de Hilbert y Ackermann
1928.
8 En otras palabras, el número n pertenece al conjunto K si y sólo si la oración obtenida
al sustituir la variable libre en la fórmula Rn por el nombre de n no es deducible de los
axiomas de P.
2.10 Los Teoremas de Incompletud de Gödel 325
10 Le doy al signo de disyunción ⁄ del cálculo P más peso que Gödel para distinguirlo
de nuestro signo ∨, que, como dije en la nota 7, reservo para el discurso metalógico.
11 Gödel dice ‘Zahlzeichen’, literalmente ‘signo de número’.
2.10 Los Teoremas de Incompletud de Gödel 327
I.1 ~(ƒx1 = 0)
I.2 ƒx1 = ƒx2 ⊃ x1 = x2
I.3 x2(0)⋅x1Π(x2(x1) ⊃ x2(ƒx1)) ⊃ x1Π(x2(x1))
IV.1 (Eu)(vΠ(u(v) ≡ a)
14 La denominación estándar de #[ϕ] es ‘el número de Gödel de ϕ’. Esta expresión tradu-
ce literalmente las que se usan en alemán y en inglés, idiomas en que el genitivo ‘de
Gödel’ se expresa anteponiendo ‘Gödel’ a ‘Zahl’ o ‘number’ (‘número’); pero suena
torpe en castellano. En cambio, no me caería mal escribir, casi fonéticamente, ‘guédel’
(plural, ‘guédeles’); pero no me he atrevido a tanto. Por cierto, la denominación ‘el
gödel de ϕ’ y el símbolo #[ϕ] se aplican también a los números de identidad asignados
a los objetos de cualquier cálculo lógico mediante un procedimiento análogo al que se
explicará arriba. En el Apéndice XVII, explico el método mucho más simple propuesto
por Smullyan (1992) para un cálculo similar a P.
2.10 Los Teoremas de Incompletud de Gödel 330
primo mayor que 13; además, al averiguarlo, se establece a qué signo co-
rresponde. Supongamos ahora que Φ = α1α2…αk es una fila de k signos
de P. Estipulamos que #[Φ] = 2#[α1] × 3#[α2] ×… × pk#[αk]. Por último, si L
= 〈Φ1,Φ2,…, Φr〉 es una lista de filas de signos de P, estipulamos que #[L]
= 2#[Φ1] × 3#[Φ2] × … × pr#[Φr]. Nuestras estipulaciones garantizan la unici-
dad del gödel correspondiente a cada fila de signos y a cada lista de filas,
así como la posibilidad de recuperar el objeto correspondiente a un número
dado con sólo analizarlo en sus factores primos.15 Por lo tanto, si n es el
gödel de un objeto del cálculo, el objeto con gödel n es un ente perfecta-
mente determinado, que llamaré †[n]. Por otra parte, es claro que, bajo las
condiciones prescritas, hay números que no son el gödel de ningún objeto
del cálculo P.
Sea K una propiedad atribuible a ciertos objetos del cálculo; por ejemplo,
la propiedad de ser una variable de tipo 5, o de ser una prueba, o de ser una
fórmula no demostrable. Entonces, la clase de números K# = {x:x es el gödel
de un objeto que tiene la propiedad K} provee una representación numérica
de la propiedad K. Es natural referirse a los elementos de K# con un predi-
cado que recuerde al utilizado para designar la propiedad K. Gödel (1931)
usa con este fin el mismo predicado, impreso en cursivas. Pero aquí, siguiendo
la práctica de sus editores (CW, OC), usaré las versalitas. Así, si α es un
axioma de P, digo que el número #[α] es un AXIOMA. En otras palabras, el
número x es un AXIOMA si y sólo si el objeto †[x] existe y es un axioma de
P. Lo mismo vale, mutatis mutandis, para las relaciones. Por ejemplo si la
fórmula α es una consecuencia inmediata por modus ponens de las fórmulas
β y γ, digo que #[α] es una CONSECUENCIA INMEDIATA POR MODUS PONENS de
#[β] y #[γ].
15 Obsérvese, por ejemplo, que un número dado es el gödel de una fila de k signos sólo
si es divisible por potencias impares de cada uno de los primeros k primos, y es el
gödel de una lista de h filas de signos sólo si es divisible por potencias pares de cada
uno de los primeros h primos.
2.10 Los Teoremas de Incompletud de Gödel 331
que Gödel llama aquí “funciones recursivas” es sólo una parte de la familia
que hoy conocemos por ese nombre.16 Pero —como veremos en el Capítulo
2.11— la familia completa se forma con sólo añadir dos sencillas operacio-
nes generadoras a las admitidas por Gödel.17 Como dije al comienzo, es jus-
tificado pensar que esta familia comprende todas las funciones numéricas que
es posible computar mediante un algoritmo. Gödel mismo no creyó en un
principio que la clase de las funciones computables mediante un algoritmo
se pudiera caracterizar así —sólo se convenció después de leer a Turing
(1937)— y, por cierto, nunca pretendió que toda función computable fuera
recursiva en el sentido restringido definido por él en 1931. Pero cada fun-
ción recursiva en este sentido restringido es computable mediante un algorit-
mo que se especifica en su misma definición.
Una función recursiva es una función numérica, esto es, una función cuyo
dominio y alcance están contenidos en el conjunto ˆ de los números natu-
rales. En particular, las funciones recursivas en el sentido restringido de Gödel
están definidas en todo ˆ. Esta clase de funciones se distingue sólo por un
pequeño detalle de lo que hoy se llama la clase de las funciones recursivas
primitivas, que definimos así:
Kleene (1936) demostró que cualquier función recursiva (en el sentido actual) puede
expresarse como una función compuesta de no más de dos funciones recursivas primi-
tivas y una aplicación de la función µ.
2.10 Los Teoremas de Incompletud de Gödel 332
χK(x1,…,xn) = 0 si 〈x1,…,xn〉 ∈ K
χK(x1,…,xn) = 1 si 〈x1,…,xn〉 ∉ K
En la próxima nota muestro que estas dos relaciones diádicas son pr-
donde µzΦ(z) denota el más pequeño número z que cumple la condición Φ(z),
o el número 0 si ningún número cumple dicha condición. Obsérvese que la
condición impuesta al número x en la definición de Ψ incluye una cota su-
perior o tope bajo el cual ese número tiene que encontrarse. Esto es indis-
pensable para que la función Ψ sea pr-recursiva (cf. la nota 17). Omitiré las
demostraciones de estos teoremas, que no presentan mayor dificultad (véase
Gödel 1931, pp. 180-181; OC, pp. 63-65).23
0 Pr x = 0
p0 = 0
pn+1 = µy(y ≤ 1 + pn! ∧ Prim(y) ∧ y > pn)
y es un número primo mayor que el n-ésimo primo. Para fijar el tope bajo el
cual ha de buscarse el (n+1)-ésimo primo Gödel aprovecha elegantemente la
clásica prueba de que tal número existe, para todo n (Euclides, IX.20).
6. La función binaria 〈n,x〉 Å n Gl x asigna al par 〈n,x〉 el exponente del
n-ésimo factor primo de x en la factorización prima de este número (siem-
pre, claro está, que n sea mayor que 0 y menor o igual que el número de
factores primos de x). Se define así:
Según esto, l(x) es el más pequeño número y tal que existe un y-ésimo mas
no un (y+1)-ésimo factor primo de x (claro está que si x no tiene ningún
factor primo —esto es, si x = 0 ó x = 1— l(x) = 0, de acuerdo con la defi-
nición del operador µ). Así, l(x) asigna a cada número x el número total de
sus factores primos. Por lo tanto, si x es el gödel de una fila de signos o de
una lista de filas de signos, l(x) es el número total de signos en esa fila o de
filas en esa lista; en otras palabras, su “longitud”.
8. La función binaria 〈x,y〉 Å x * y está dada por:
Esta definición27 está pensada para asegurar (i) que si x = #[ξ] y y = #[η],
donde ξ y η son filas de signos de P, x * y = #[ξÁη], donde ξÁη es la fila
que se forma prefijando ξ a η, y (ii) que si x = #[X] y y = #[Y], donde X
y Y son listas de filas de signos de P, x * y es el gödel de la lista que se
forma añadiendo la lista Y a continuación de la lista X. Consideraré el caso
(i), dejando el (ii) como ejercicio al lector. Sean pues ξ y η dos filas de
signos, tales que x = #[ξ] y y = #[η]. Entonces, la fila ξÁη contiene preci-
samente l(x) + l(y) signos y el factor primo más grande de #[ξÁη] es pl(x)+l(y).
Verifiquemos que #[ξÁη] es el más pequeño número z que cumple las tres
condiciones enunciadas en el alcance de µz. Tenemos que
nes. Supongamos ahora que hay otro número u que también las cumple. En
tal caso, obviamente, l(u) = l(x) + l(y), y para todo n, n Gl u = n Gl #[ξÁη].
Si #[ξÁη] ≠ u, por lo menos uno de los factores primos de #[ξÁη] no es un
divisor de u. Por lo tanto, hay un q ≥ 1 tal que para todo r mayor o igual
que q y menor o igual que l(x) + l(y), pr < r Pr u (el r-ésimo factor primo
de u). Como pr es el r-ésimo factor primo de #[ξÁη] y su exponente en la
factorización prima de #[ξÁη] es idéntico al exponente de r Pr u en la
factorización prima de u, es claro que #[ξÁη] ≠ u implica que #[ξÁη] < u.
Por lo tanto, #[ξÁη] es el número más pequeño que cumple las condiciones
en cuestión.
Después de esta justificación detallada de la definición 8, el lector podrá,
espero, entender el empleo de la función x * y en las definiciones siguientes.
Componiéndola con la función pr-recursiva R:x Å 2x, es posible definir cla-
ses pr-recursivas que representan numéricamente distintas categorías de ex-
presiones del cálculo. Obviamente, si x es el gödel de un signo del cálculo,
R(x) = 2x es el gödel de la fila que consta solamente de ese signo. Por lo
tanto, si α es una fila de signos y x = #[α], R(11) * x * R(13) —abreviado
E(x)— es el gödel de la fila (α); R(5) * E(x) —abreviado Neg(x)— es el
gödel de la fila ~(α); si ζ es una variable y z = #[ζ], R(z) * R(9) * E(x) —
abreviado z Gen x— es el gödel de la fila ζΠ(α), y así sucesivamente. Com-
binando varias de estas definiciones, Gödel logra definir, entre otras, la pro-
piedad pr-recursiva Form(x) —x es una FÓRMULA— que caracteriza a los gödel
de las fórmulas de P (Def. 23).
Me detendré un momento a considerar la definición de NUMERAL, el atri-
buto distintivo de los gödel de las expresiones 0, ƒ0, ƒƒ0, ƒƒƒ0,…, ƒn0,…
que representan en el cálculo P a los números naturales 0, 1, 2, 3,…, n,…
Primero se define la función pr-recursiva binaria 〈x,y〉 Å y N x:
16. 0 N x = x; (n+1) N x = R(3) * n N x.
Obviamente, si x es el gödel de la fila de signos α, n N x es el gödel de
la fila formada por α precedida de n copias del signo ƒ. Como 1 = #[0], n
N R(1) es el gödel del numeral que representa el número n en P. Por lo tan-
to, n N R(1) es el NUMERAL de n. En vez de n N R(1), escribimos con Gödel
Z(n) (Z por Zahl, ‘número’). Por ejemplo,
29 El predicado Bew(x), definido por generalización existencial sobre una de las variables
libres del predicado binario recursivo yBx, es lo que hoy se llama un predicado recur-
sivamente enumerable. Esta designación se basa en lo siguiente: puede demostrarse que
si un predicado definido de este modo es satisfecho por una clase no vacía de núme-
ros, dicha clase es el alcance de una función recursiva (general) con dominio ˆ; ésta
puede entonces utilizarse para enumerar la clase de números en cuestión (y también,
por cierto, cualquier clase de objetos identificados mediante esos números).
30 Recuérdese que llamo así —con el adjetivo entre comillas— a las relaciones recursivas
en el sentido restringido de Gödel (1931), o sea, las relaciones cuya función caracterís-
tica es pr-recursiva conforme a las reglas PR1, PR2, PR4, o PR5.
2.10 Los Teoremas de Incompletud de Gödel 342
ción (1) con una función ϕ de grado r; aunque una demostración rigurosa
sería larga y tediosa. Puesto que el Teorema V vale, como vimos, si la fun-
ción ϕ es de grado 1, vale, con toda generalidad, para cualquier grado.
6º Nos falta todavía un breve paso antes de abordar por fin el primer teore-
ma de incompletud (Teorema VI). Es claro que si P fuese inconsistente, toda
oración sería deducible de los axiomas. Tendríamos entonces que, cualquiera
que fuese la oración α, ∂α y ∂~α. Por lo tanto, la consistencia de P cons-
tituye una condición sintáctica necesaria para que P sea incompleto (en el
sentido de Post). Rosser (1936) demostrará que esta condición también es
suficiente. Pero Gödel (1931) estableció originalmente la incompletud de P
bajo una condición sintáctica más fuerte, que llama “ω-consistencia”. Podría
pensarse que, en vista del resultado de Rosser, no vale la pena molestarse en
estudiarla. Pero —como indico al final del próximo párrafo— la noción de
ω-consistencia tiene cierto interés en relación con el programa de Hilbert.
Gödel la define de un modo preciso pero un tanto esotérico. Nuestro penúl-
timo paso consistirá, pues, en explicar esa definición.
Sea K una clase de fórmulas de P. La clase D(K) de las fórmulas deducibles
de K es la clase de fórmulas que contiene (i) todas las fórmulas de K, (ii)
todos los axiomas de P y (iii) toda fórmula de P que se deduzca de dos
fórmulas de D(K) por modus ponens o de una fórmula de D(K) por genera-
lización. (D(K) es, pues, el conjunto de teoremas de la teoría deductiva que
se obtiene añadiendo las fórmulas de K a los axiomas de P, o sea, lo que
comúnmente se llama la extensión de P determinada por K). Obsérvese que,
según esta definición, la clase de las fórmulas deducibles de los axiomas de
P es D(∅). Diré que K es ω-inconsistente si y sólo si hay una fórmula Φ(u),
con una sola variable libre u, tal que D(K) contiene a la vez la fórmula
~uΠ(Φ(u)) y todas las fórmulas que pueden obtenerse reemplazando la va-
riable libre u en Φ(u) por el nombre de un número natural.35 Si D(∅) cum-
ple la condición antedicha, todo conjunto de fórmulas de P será ω-inconsis-
tente; en tal caso, digo que el propio sistema P es ω-inconsistente. Si la cla-
se de fórmulas K no es ω-inconsistente, diremos que es ω-consistente. Dire-
mos, por otra parte, que K es (simplemente) consistente si D(K) no contiene
7º Con los recursos que hemos acumulado en los pasos anteriores, podemos
demostrar el Teorema VI, llamado comunmente el primer Teorema de
Incompletud de Gôdel. En la parte introductoria de su artículo Gödel da una
36 Decimos que κ está cerrada respecto de la relación triádica CONSECUENCIA INMEDIATA si,
para cualquier trío de números x,y,z tales que y,z ∈ κ y Fl(x,y,z), también x ∈ κ.
2.10 Los Teoremas de Incompletud de Gödel 346
19 )) → Bew (Sb(q 17 19 ) )
¬xBκ(Sb(y Z(y) κ Z(x) Z(p)
(3)
19 )) → Bew (Neg(Sb(q 17 19 ) ))
xBκ(Sb(y Z(y) κ Z(x) Z(p)
¬xBκ(#Ψ) → Bewκ(#Θ)
(3*)
xBκ(#Ψ) → Bewκ(Neg(#Θ))
17 19 ) = Sb(r 17 )
Sb(q Z(x) (5)
Z(p) Z(x)
19 )) → Bew (Sb(q 17 19 ) )
¬xBκ(Sb(p Z(p) (6)
κ Z(x) Z(p)
19 )) → Bew (Neg(Sb(q 17 19 ) ))
xBk(Sb(p Z(p) (7)
k Z(x) Z(p)
19 ) por 17
Invocando (4) y (5), reformulamos (6) y (7), reemplazando Sb(p Z(p)
17 19 ) por Sb(r 17 ) , respectivamente:
Gen r y Sb(q Z(x) Z(p) Z(x)
17 )
¬xBκ(17 Gen r) → Bewκ(Sb(r Z(x) ) (6*)
17 )
xBκ(17 Gen r) → Bewκ(Neg(Sb(r Z(x) ) (7*)
2.10 Los Teoremas de Incompletud de Gödel 350
De este resultado inferiremos con Gödel que, si κ es, como hemos su-
puesto, una clase “recursiva” ω-consistente, ninguno de los números 17 Gen
r y Neg(17 Gen r) pertenece a Flg(κ). Así se completa la demostración del
Teorema VI. Ahora bien, 17 Gen r es el gödel de la fórmula que, según la
nomenclatura adoptada, hay que llamar u1Π(G(u1,ƒp0)). Así pues, el argu-
mento presentado a continuación demostrará que, si la clase K de fórmulas
es ω-consistente, ni u1Π(G(u1,ƒp0)) ni ~u1Π(G(u1,ƒp0)) son deducibles de
K. Si K = ∅, la fórmula llamada u1Π(G(u1,ƒp0)) no es demostrable ni refu-
table en P.
Si 17 Gen r perteneciera a Flg(κ) tendríamos que hay un número n tal
17 )
que n Bκ (17 Gen r). Por lo tanto, en virtud de (7*), Bewκ(Neg(Sb(r Z(n) ).
Por otra parte, 17 Gen r ∈ Flg(κ) significa que hay una prueba desde K de
17 )
la fórmula u1Π(G(u1,ƒp0)) y, por ende, también de la fórmula †[Sb(r Z(n) ]
obtenida reemplazando en G(u1,ƒp0) la variable libre u1 por ƒn0. Pero enton-
17 )
ces tendríamos que Bewκ(Sb(r Z(n) ), y κ sería inconsistente y, por ende, ω-
inconsistente. Por lo tanto, bajo las hipótesis del Teorema VI, 17 Gen r ∉
Flg(κ).
Supongamos, entonces, que Neg(17 Gen r) ∈ Flg(κ). Como 17 Gen r ∉
Flg(κ), es claro que ∀n¬(n Bκ (17 Gen r)). En virtud de (6*), esto implica
17 )
que ∀nBewκ(Sb(r Z(n) ). Flg(κ) contendría a la vez el número Neg(17 Gen r)
= #[~u1Π(G(u1,ƒp0))] y el gödel de cada una de las fórmulas que se obtie-
nen insertando en G(u1,ƒp0) —esto es †[r]— los numerales 0, ƒ0, ƒƒ0,…
en lugar de la variable libre u1. Pero entonces κ sería ω-inconsistente. Por lo
tanto, bajo las hipótesis del Teorema VI, Neg(17 Gen r) ∉ Flg(κ).
Obsérvese que, si la clase κ cumple las condiciones requeridas y le aña-
dimos el número Neg(17 Gen r), la clase κ′ así formada es a la vez consis-
tente y ω-inconsistente. κ′ es consistente, puesto que (17 Gen r) ∉ Flg(κ) y,
por cierto, si κ y por ende ∅ son consistentes,
39 Tomados de Wittgenstein 1956, pp. 50-54 y 176. No viene a cuento examinar aquí
estos textos. Baste señalar que las dudas de Wittgenstein responden, en buena parte, al
aserto de que la fórmula cuya indemostrabilidad e irrefutabilidad ha sido establecida
por Gödel “habla” de sí misma y “dice” que es indemostrable. Este aserto, corriente en
las exposiciones de la obra de Gödel, vale, obviamente, para la fórmula [Rq;q] mencio-
nada en el argumento informal presentado en la Sección 2.10.1 (y en el §1 de Gödel
1931), pero no vale para la fórmula †[17 Gen r] a que se refiere el Teorema VI. Esta
fórmula “hablaría” de sí misma si contuviera el numeral correspondiente a 17 Gen r.
Pero el único numeral cuya presencia se requiere en †[17 Gen r] es ƒp0, correspon-
diente al número p = 17 Gen q ≠ 17 Gen r. Con todo, importando ideas que no perte-
necen ni contribuyen en nada al austero argumento combinatorio de Gödel, se puede
justificar la “traducción” de la fórmula †[17 Gen r] mediante la oración castellana ‘la
fórmula †[17 Gen r] no es demostrable’.
40 En la acepción explicada en la p. 250, nota 4. Véase lo dicho en la p. 342.
2.10 Los Teoremas de Incompletud de Gödel 352
41 El Apéndice XVI contiene una caracterización general de los sistemas deductivos a los
que se aplica una “forma abstracta” del Teorema VI.
2.10 Los Teoremas de Incompletud de Gödel 353
lo tanto, según el Teorema V (extendido), habría en P una fórmula con una variable
libre φ(u), tal que ∂φ(n) si n es el gödel de cualquier oración de primer orden cuya
negación es realizable. La prueba de φ(n) sería una prueba en P de que la negación de
la oración †[n] es realizable. Pero el Teorema IX enseña justamente que hay oraciones
de esta clase que no admiten tal prueba. La extensión del Teorema V a las funciones
recursivas se sigue inmediatamente de una observación expresada al final de Gödel
1934 (p. 27). Pero durante la visita a Princeton en que dictó las lecciones que forman
la base de este trabajo, Gödel no se avino a aceptar la Tesis de Church. Como indica
en la “posdata” de 1964 (impresa a continuación de la observación citada), sólo llegó
a convencerse a la luz de la obra de Turing (1936). El Teorema de Church sobre la
insolubilidad del Entscheidungsproblem del cálculo de primer orden —publicado en
Church 1936a— es un corolario de otro teorema más general, incluido en Church 1936
(véase el Capítulo 2.11).
2.10 Los Teoremas de Incompletud de Gödel 355
45 Gödel (1931, p. 197) escribe: “Sei w die SATZFORMEL, durch welche in P Wid(κ)
ausgedrückt wird”; traducido: “Sea w la ORACIÓN mediante la cual Wid(κ) se expresa
en P”. Conforme a la convención sobre el uso de versalitas, esto quiere decir: “Sea w
el gödel de la oración mediante la cual Wid(κ) se expresa en P”.
2.10 Los Teoremas de Incompletud de Gödel 356
46 Únase la prueba de (11) —que es una prueba desde ∅ y por ende, a fortiori, desde
K— con la supuesta prueba de †[w] desde K y úsense estas dos fórmulas como premisas
de una inferencia final por modus ponens.
47 Como ya he indicado, a los Teoremas VI y XI suele dárseles el nombre de primer y
segundo “teorema de incompletud” de Gödel, designándoselos también mediante las
abreviaturas G1 y G2, respectivamente. La opinión mayoritaria estima que G2 asestó
un golpe de muerte al programa de Hilbert (sección 2.9.4). Ahora bien, G2 depende
visiblemente de G1 y no presupone ninguna premisa adicional no admitida por Gödel
2.10 Los Teoremas de Incompletud de Gödel 358
359
2.11 Funciones computables 360
otra parte, la Tesis de Church afirma que toda función calculable es compu-
table. Trataremos de esclarecer la naturaleza de este aserto: ¿se trata, como
sugiere su nombre, de una conjetura matemática que aún no ha sido demos-
trada (ni refutada)? ¿o de una convención sobre el uso del lenguaje? ¿o de
un enunciado de otra índole?
En las primeras tres secciones de este capítulo consideraré sucesivamen-
te: el concepto general de función recursiva que Gödel propuso en 1934 si-
guiendo una sugerencia de Herbrand, y su notable simplificación por Kleene
(Sección 2.11.1); el concepto de función λ-definible propuesto por Church
en 1935 (Church 1936), la Tesis de Church según la cual este concepto co-
incide con el concepto intuitivo ordinario de función calculable, y el Teore-
ma de Church, que da —bajo este supuesto— una solución negativa al Ent-
scheidungsproblem del cálculo predicativo de primer orden (Sección 2.11.2);
y la concepción de Turing (1936) de un tipo de “máquinas” que incorporan
todos los ingredientes del calcular humano y la definición de computabilidad
basada en ella (Sección 2.11.3.). Luego, daré ejemplos y diagramas de má-
quinas de Turing (Sección 2.11.4), que utilizaré enseguida para demostrar
algunos resultados importantes al respecto y, basándome en ellos, el Teore-
ma de Church (Sección 2.11.5).
Los finitistas han verificado [que toda función computable es calculable] en casos
sencillos. En otros casos pueden darse por vencidos, pero saben que el cálculo se
completaría con sólo persistir lo suficiente. Si les preguntan cuánto es suficiente,
su respuesta sería: aproximadamente un número de operaciones igual al numeral
que estoy calculando.
Los niños malcriados tienen berrinches. Han comprobado en casos sencillos
que esto les procura lo que quieren. En otros casos, pueden darse por vencidos,
pero saben que conseguirían lo que quieren con sólo persistir lo suficiente. Si les
preguntan cuánto es suficiente, su respuesta sería: hasta que consiga lo que quie-
ro.
Con esto no busco desacreditar a quienes sustentan opiniones diferentes de la
mía; simplemente expreso mi opinión de que el finitismo es un sistema autovali-
dante de creencias que no tiene ninguna base y podría muy bien ser incorrecto.
(Nelson 1993, p. 10)
Nelson no pone en duda la Tesis de Church tal como la enuncio en el texto: toda fun-
ción efectivamente calculable es computable (recursiva).
2.11 Funciones computables 361
φ(x,0) = ψ(y)
φ(x+1,0) = χ(x)
φ(x+1,y+1) = φ(x,φ(x+1,y))
2 El texto impreso en Davis 1965 figura ahora también en Gödel, CW, I, 346-371, y en
traducción castellana en OC, pp. 167-98. Las notas y correcciones con que Gödel su-
plementó los apuntes en 1934 están incorporadas al texto; las observaciones añadidas
en 1964 van entre corchetes.
3 Ackermann (1928) introduce una jerarquía de funciones con valores en ˆ. Una fun-
2.11 Funciones computables 362
ción es de tipo 1 si sus argumentos son k-tuplos de números naturales (k ≥ 1); de tipo
2, si sus argumentos incluyen funciones de tipo 1; de tipo n+1, si sus argumentos in-
cluyen funciones de tipo n. Propone el siguiente ejemplo de una función de tipo 2, que
utiliza luego para definir la llamada función de Ackermann:
ρc(ƒ(c),x,0) = x
ρc(ƒ(c),x,σn) = ƒ(ρc(ƒ(c),x,n))
donde ƒ es cualquier función de tipo 1 y σn designa el siguiente de n. Ackermann
advierte que el subíndice c indica que ρc(ƒ(c),x,y) depende de ƒ, x e y, pero no depen-
de de c. Como fácilmente se comprueba, ρc(ƒ(c),a,n) es igual al valor de ƒ aplicada
iterativamente n veces al argumento a. Ackermann introduce además la función auxi-
liar binaria α, definida por α(x,0) = 0, α(x,1) = 1, α(x,n+2) = x. Con estos recursos
define la función ternaria ϕ mediante las ecuaciones:
ϕ(x,y,0) = x + y
ϕ(x,y,σn) = ρ c(ϕ(x,c,n),α(x,n),y)
ψ(x) = ϕ(x,x,x)
Ackermann demostró que ψ(n) crece con n más rápidamente que cualquier función de
tipo 1. Como todas las funciones pr-recursivas son de tipo 1, ψ no puede ser pr-recursiva.
Por otra parte, obviamente, ψ es una función calculable.
2.11 Funciones computables 363
φ(x,0) = ψ 1(x)
φ(0,y+1) = ψ 2(y)
φ(1,y+1) = ψ 3(y)
φ(x+2,y+1) = ψ 4(φ(x,y+2),φ(x,φ(x,y+2)))
Aunque Gödel no lo diga, debemos dar por supuesto que las funciones pr-
recursivas básicas —sucesor (PR1), cero (PR2) y las proyecciones (PR3)—
cuentan en todo caso como funciones conocidas (en el ejemplo se utiliza
visiblemente la función sucesor, además de las ψk). Gödel adopta la defini-
ción anterior con dos importantes restricciones.4 Requiere (i) que el lado
izquierdo de cada ecuación funcional del sistema que determina la función
r-aria φ tenga la forma
φ(ψi1(x1,…,xn),ψi2(x1,…,xn),…,ψir(x1,…,xn))
4 Kalmár (1955) construyó una función que satisface la definición atribuida por Gödel a
Herbrand, mas no las restricciones añadidas por Gödel. Véase Hermes 1961, §21.7.
No hay un algoritmo que permita calcular efectivamente la función de Kalmár. En re-
lación con esto, conviene recordar que, como señalé en la Sección 2.6.3, Herbrand (1931)
imponía el requisito siguiente a todas las funciones admisibles en su aritmética formal:
“consideradas intuicionistamente” —esto es, “traducidas al lenguaje ordinario, como
propiedades de enteros, y no como puros símbolos”— “permiten hacer efectivamente
el cálculo” del valor que asignan a cada “sistema particular de números” (esto es, a
cada n-tuplo, cuando la función considerada es n-aria). En vista de esto, me parece que
el hallazgo de Kalmár indica que Gödel impuso, con certero instinto, a la definición de
función recursiva que Herbrand le había propuesto precisamente las restricciones in-
dispensables para ajustarla al propósito —y a las convicciones— del propio Herbrand.
2.11 Funciones computables 364
respuesta positiva a esta pregunta (cf. Church 1936, p. 356, n. 18). Años
más tarde, en la “Posdata” de 1964 a las lecciones de 1934, Gödel declara
que Turing (1936) fue el primero que dio un análisis satisfactorio de ‘proce-
dimiento mecánico’ (“alias ‘algoritmo’ o ‘procedimiento de cómputo’ o ‘pro-
cedimiento combinatorio finito’”—Gödel, CW, I, 369; OC, p. 196). Basán-
dose en ese análisis, Turing construyó su definición precisa de función com-
putable que tiene, demostrablemente, la misma extensión que el concepto de
función recursiva general. En vista de esto, Gödel acabó aceptando que to-
das las funciones calculables son recursivas en el sentido definido por él en
1934.
Gracias a un hallazgo de Stephen C. Kleene (1936) se puede dar una carac-
terización de las funciones recursivas generales mucho más perspicua y ele-
gante que la original de Gödel. Kleene demostró que basta suplementar las
operaciones PR4 y PR5 con una sencilla operación adicional para generar
todas las funciones recursivas generales a partir de las funciones pr-recursivas
básicas (PR1-PR3). Se trata de la operación de buscar, partiendo de 0, el
número natural más pequeño que cumple una condición pr-recursiva dada
(esto es, que posee una propiedad dada cuya función característica sea pr-
recursiva). En la p. 334 (✥), vimos que Gödel (1931) utilizó esta operación
restringida a un segmento de ˆ acotado por arriba para definir un tipo de
funciones pr-recursivas que luego figuran en la construcción del predicado
pr-recursivo Bw(x) (‘x es el gödel de una prueba’). Gödel demostró que si φ
es una función pr-recursiva n-aria y R es una relación pr-recursiva (m+1)-
aria, también es pr-recursiva la función que asigna a cada (n+m)-tuplo
〈x1,…,xn,y1,…,ym〉 el más pequeño número x ≤ φ(x1,…,xn) que cumple
la condición R(y1,…,ym,x), o el número 0 si no hay un x ≤ φ(x1,…,xn)
que la cumpla. Con el simbolismo utilizado en la p. 334, el valor de esta
función en el argumento 〈x1,…,xn,y1,…,ym〉 se llama µx(x ≤ φ(x1,…,xn)
∧ R(y1,…,ym,x)). Kleene se interesa por la operación de búsqueda simboli-
zada con µ, cuando no está restringida por una cota superior o tope. Su-
pongamos, pues, que hay por lo menos un número que cumple la condición
R(y1,…,ym,x) y sea µx(R(y1,…,ym,x)) el número más pequeño que la cum-
ple. Si χR es la función característica de la relación R, este número se desig-
na asimismo con la expresión µx(χR(y1,…,ym,x) = 0). Kleene (1943, p. 45)
muestra que si χR es una función recursiva general, la función 〈y1,…,ym〉
Å µx(χR(y1,…,ym,x) = 0) también es recursiva general. Para ello, introdu-
2.11 Funciones computables 366
ψ(0,y1,…,ym,x) = x (1)
ψ(z+1,y1,…,ym,x) = ψ(χR(y1,…,ym,x+1),y1,…,ym,x+1) (2)
En virtud del mismo, toda función recursiva general puede expresarse como
una función compuesta —en el orden indicado— de dos funciones pr-
recursivas y una aplicación del operador µ. Como toda función pr-recursiva
es evidentemente recursiva general, este hallazgo de Kleene nos permite re-
emplazar la definición gödeliana de función recursiva general por las seis
estipulaciones siguientes:
〈x1,…,xn〉 Å h(g1(x1,…,xn),…,gm(x1,…,xn))
f(0,x2,…,xn) = g(x2,…,xn)
f(x1+1,x2,…,xn) = h(x1,f(x1,x2,…,xn),…,xn)
g(x1,…,xr,) = µy(h(x1,…,xr,y) = 0)
6 Como indiqué en la p. 332, nota 18, una notación rigurosa debería incluir el valor de
r en el símbolo de la proyección. En la práctica, este dato se omite porque normalmen-
te está implícito en el contexto.
2.11 Funciones computables 368
7 Construí la definición arriba transcrita haciendo los reemplazos indicados por Kleene
(1943, p. 50s.) en su definición gödeliana de función recursiva general (1943, pp. 44s.).
En vez de “las reglas [de derivación]”, Kleene dice “las reglas R1 y R2”, con lo cual
alude, no por cierto a nuestras reglas R1 y R2, sino a su propia versión (p. 43) de las
reglas de derivación de Gödel.
2.11 Funciones computables 369
0 abrevia a λab⋅a(b)
1 abrevia a λab⋅a(a(b))
2 abrevia a λab⋅a(a(a(b)))
Llegado a este punto, Church está listo para dar la definición de calculabili-
dad efectiva anunciada al comienzo.
Junto con anunciar esta definición, Church anotó que ella está respaldada
por el hecho de que los conceptos de función recursiva y de función λ-defi-
nible, de construcción tan diversa, tienen la misma extensión;14 pero aquí
aduce otras razones. Por una parte, recuerda que (como señaló en el pasaje
que cité en la p. 371) cada función λ-definible tiene un algoritmo para cal-
cular sus valores. Por otra parte, arguye que toda función calculable median-
te un algoritmo tiene que ser λ-definible. Por ejemplo, si una función unaria
F es calculable mediante un algoritmo, tiene que haber en alguna notación,
para cada n ∈ ˆ, una serie finita de expresiones en0, en1,…, enr(n), tal que:
14 “El hecho de que dos definiciones de calculabilidad efectiva tan distantes entre sí (so
widely different) y, sin embargo, igualmente naturales (en opinión del autor) resulten
equivalentes refuerza las razones aducidas más abajo para creer que ellas caracterizan
dicha noción del modo más general que es compatible con nuestra habitual compren-
sión intuitiva de la misma” (Church 1936, p. 346, n. 3).
2.11 Funciones computables 374
15 ”En el sentido de que existe una función recursiva Φ tal que Φ(n,x) es [el gödel] del
resultado de aplicar la n-ésima regla procesal al conjunto ordenado finito de fórmulas
[cuyo gödel] es x” (Church 1936, p. 357).
2.11 Funciones computables 375
16 Como dice Church con toda razón, la ampliación de este concepto a funciones n-arias
“es inmediata”.
17 No cabe alegar que como la extensión de ese significado corriente es “vaga”, el mate-
mático puede libremente deslindarla como le parezca oportuno. Si antes de 1928 al-
guien hubiera pretendido definir la expresión ‘efectivamente calculable’ identificándola
con ‘pr-recursiva’, el descubrimiento de la función de Ackermann habría puesto en
evidencia que esa definición no sirve. La ausencia de criterios precisos, enunciables de
una vez por todas, para aplicar un concepto corriente (“intuitivo”) no significa que no
sepamos reconocer cuando se lo usa bien o mal.
2.11 Funciones computables 376
TEOREMA XIX. No existe una función recursiva binaria ƒ tal que (i) ƒ(x,y)
= 0 si x = #[X], y = #[Y] y X e Y son fbfs tales que X
conv Y, y (ii) ƒ(x,y) = 1 en cualquier otro caso.
TEOREMA XVIII. No existe una función recursiva unaria g tal que (i) g(x)
= 0 si x = #[X] y X es una fbf que tiene una forma nor-
mal, y (ii) ƒ(x) = 1 en cualquier otro caso.
19 Con certero sentido de la jerarquía, Kleene (1967, pp. 242, 246, 282) usa la expresión
‘Church’s Theorem’ —‘el Teorema de Church’— para referirse al Teorema XVIII. Pero
esa no es la nomenclatura habitual.
2.11 Funciones computables 379
el caso del referido cálculo de Hilbert y Ackermann, los dos problemas co-
inciden puesto que —en virtud del Teorema de Completud de Gödel (Capí-
tulo 2.8)— una fórmula de ese cálculo es válida si y sólo si es deducible. A
este respecto, Church hace una observación importante. Él ha demostrado
constructivamente que no hay un algoritmo de d-decisión para dicho cálcu-
lo: no puede existir una función recursiva que asigne el valor 0 al gödel de
cada fórmula deducible y el valor 1 al gödel de cada fórmula no deducible.
Por lo tanto, en virtud del Teorema de Completud, tampoco hay un algorit-
mo de v-decisión. Pero la demostración del Teorema de Completud no es
constructiva, de modo que la insolubilidad del problema de la v-decisión no
se ha establecido constructivamente. Por esta razón, Church concluye que
“la insolubilidad de esta segunda forma del Entscheidungsproblem del [cál-
culo predicativo de primer orden de Hilbert y Ackermann] no puede consi-
derarse incuestionablemente establecida” (1936a, en Davis 1965, p. 115).
22 El artículo —muy conciso— de Post apareció un poco antes que el de Turing, con una
nota que reconoce la prioridad temporal de éste y aclara que los autores trabajaron con
total independencia. Ambos, por cierto, conocían la labor de Gödel y Church. En el
trabajo de Post falta completamente la idea de una máquina computadora. Lo que Turing
(1936) llama la configuración interna de la máquina —“el programa”, como decimos
hoy— Post (1936) lo presenta como instrucciones que ha de seguir un calculista (hu-
mano).
2.11 Funciones computables 382
ingeniería. Turing busca una definición precisa del término ‘calculable con
medios finitos’. Para eso, describe una clase de máquinas ideales concebidas
—según él— de modo que simulen perfectamente las operaciones de un
calculista. Llamaré máquina de Turing a cualquier objeto de esta clase. Un
número real es “computable” si hay una máquina de Turing que lo computa.
Después de explicar como operan sus máquinas, Turing introduce la idea que
inspirará la invención de la computadora moderna: la máquina de Turing
universal U, que computa el número computado por cualquier máquina de
Turing M cuando el número de identidad de M se registra como dato inicial
en la memoria de U. Siguiendo a Turing, daré primero la descripción gene-
ral de una MT, luego ciertos resultados importantes de su trabajo, y por úl-
timo repetiré el argumento en que basa su afirmación de que todo lo que
pueda calcular un calculista es computable por una máquina de Turing.
Una máquina de Turing M se caracteriza, ante todo, por una lista finita
q0,…, qm de estados (Turing dice “M-configurations”) en que M puede
encontrarse y un alfabeto finito S0,…, Sn de signos (“symbols”) que M
puede reconocer e imprimir. Uno de éstos, digamos S0, es sólo un espacio
en blanco. M lee y escribe en una cinta de papel cuadriculado
. Entendemos que la cinta tiene una orientación; evocando nuestros propios
hábitos de lectura y escritura, diré que M ‘avanza’ hacia la ‘derecha’ y ‘re-
trocede’ hacia la ‘izquierda’. En un dado momento, cada cuadrado de la cin-
ta contiene un solo signo (posiblemente, el blanco S0). Suponemos que la
cinta es infinita o, al menos, que le “crece” un cuadrado adicional en blanco
apenas M llega a leer uno de sus extremos (éste es el único rasgo ideal de
las máquinas de Turing, inimitable por calculistas y computadoras). Supone-
mos además que en el momento inicial hay a lo sumo un número finito de
cuadrados que “no están en blanco”, esto es, que contienen un signo dife-
rente de S0, (este supuesto mitiga lo irrealista del anterior). En cada momento,
M está en uno de sus estados, leyendo un cuadrado de la cinta. Ese estado
y el signo que hay en ese cuadrado determinan la próxima acción de M, la
cual consiste en ejecutar una de cada una de las tres alternativas siguientes:
(i) escribir uno de los signos S0,…, Sn en sustitución del signo que lee, (ii)
avanzar un cuadrado (llamemos a esto, A), retroceder un cuadrado (R) o
permanecer detenida leyendo el mismo cuadrado (D) y (iii) pasar a uno de
2.11 Funciones computables 384
25 Obsérvese que la alternativa (i) incluye la posibilidad de dejar intacto el signo leído,
puesto que es uno de los signos permitidos como sustituto. La alternativa (iii) incluye
la posibilidad de seguir en el mismo estado.
26 En otras palabras, el programa de M es el grafo de una aplicación cuyo dominio está
incluido en {0,…, m} × {0,…, n} y cuyo alcance está incluido en
{0,…, n} × {A, R, Q} × {0,…, m}.
27 La máquina M descrita es lo que Turing (1936, p. 232) llama una máquina automática
o a-máquina, porque su funcionamiento está completamente determinado por el pro-
grama. Menciona además lo que llama una “máquina a elección” (choice machine) y
que hoy llamamos una máquina de Turing con oráculo (MTO), cuyo funcionamiento
no está completamente determinado por el programa. Éste indica que cuando la máqui-
na está en ciertos estados leyendo ciertos signos hay que consultar una fuente externa
u “oráculo”—un operador humano, una tabla de números aleatorios, una ruleta, etc.—
para determinar lo que la máquina ha de hacer en esa situación. Así, si M0 es una
MTO, el programa de M0 consta en parte de quíntuplos como los arriba descritos, en
parte de triples de la forma 〈qh,Sv,?〉 donde el signo de interrogación indica que hay
que consultar el oráculo. La respuesta de éste tiene que ser un triple de la forma
〈Sw,C,qk〉, pero no está predeterminado cuál será ese triple en cada caso. (Evidentemen-
te, el programa de M0 puede fijar distintas listas finitas de respuestas posibles en las
diversas situaciones en que prevé una consulta al oráculo; también puede contemplar
varios oráculos, de modo que la respuesta de uno remita a veces a otro).
2.11 Funciones computables 385
de la circularidad. Como las MTRs nos interesan aquí muchísimo menos que
las máquinas de Turing que computan funciones numéricas, es preferible
estudiar la idea de la máquina de Turing universal en relación con éstas, así
como el problema homólogo al de la circularidad que se plantea con respec-
to a ellas: determinar mediante un algoritmo si una máquina de Turing cuyo
programa se conoce computa o no una función numérica. Este problema se
llama habitualmente “el problema de la detención” (the halting problem)
porque se lo puede formular asi: si x es un número ¿es x el gödel de una
máquina de Turing que, aplicada a cualquier dato numérico de cierto tipo
(que represente un r-tuplo para algún r fijo), acaba deteniéndose ante un
resultado numérico en la posición prescrita para recibirlo? En caso afirmativo,
la máquina de Turing †[x] computa la función que asigna ese resultado al
dato en cuestión. En caso negativo, esto es, si †[x] no se detiene nunca o se
detiene en una posición distinta de la prescrita para recibir un resultado, obvia-
mente †[x] no computa una función numérica. (Doy una explicación más
exacta del “problema de la detención” en la Sección 2.11.5).
A continuación doy una descripción canónica de las máquinas de Turing
que computan funciones numéricas. Usaré la abreviatura MT para designar
a las máquinas de Turing que obedecen a esta descripción. En primer lugar,
estipularemos que todas las MT tienen un mismo alfabeto y siguen un pro-
cedimiento convencional uniforme para la recepción de datos y entrega de
resultados. El alfabeto consta solamente de dos signos: S0, el blanco, que
llamaré B, y S1, el palote |. (Para un trabajo práctico de programación sería
cómodo disponer además de unos pocos signos auxiliares, pero su adopción
no expande el reino de las funciones computables). Una fila de palotes,
impresos en cuadrados consecutivos de la cinta, precedida y seguida de un
blanco, representa un número natural determinado. Como, según la con-
vención seguida generalmente en este libro, el primer número natural es 0,
representamos el número n con una fila de n + 1 palotes. Representamos el
r-tuplo 〈n1,…,nr〉 mediante r filas de n1+1,…, nr+1 palotes, respectiva-
mente, con un solo blanco entre cada dos filas consecutivas. Para mayor
brevedad, llamaré *número a la representación de un número mediante una
fila de palotes, *r-tuplo a la representación de un r-tuplo de números me-
diante una fila de r filas de palotes. Digo que una MT se aplica a un *nú-
mero cuando lee su primer palote, y que se aplica a un *r-tuplo cuando se
aplica a su primer *número. Digo que un blanco cierra un *número o un *r-
2.11 Funciones computables 388
31 Nota sobre la notación. Hablando de máquinas de Turing, uso en adelante varias for-
mas de las letras a y r (mayúscula, minúscula, cursiva, recta, helvética, griega, gótica)
para referirme a objetos u operaciones relacionados, respectivamente, con las dos di-
recciones de la cinta: avance (hacia la derecha) y retroceso (hacia la izquierda). En
inglés y alemán, usan la r (de right, Rechte = derecha) en lugar de nuestra a, la l (de
left, Linke = izquierda) en vez de nuestra r. No quise usar el par de letras d e i, porque
la i minúscula tradicionalmente denota un índice y la mayúscula se parece demasiado
al 1 y al palote |.
32 Al asignar un gödel a uno de estos programas, hay que distinguir el palote que es un
signo del alfabeto, del palote que utilizamos como subíndice numérico para identificar
a cada estado. Escribiendo los cuádruplos como antes, separados por punto y comas,
podemos asignar el dígito 1 al palote subíndice (como antes), el 2 al palote signo, el 0
al blanco, el 3 a q, el 4 a A, el 5 a R y el 6 al punto y coma.
2.11 Funciones computables 389
33 Aplicada a una cinta que contiene el gödel de la MT que computa la función ƒ seguido
del *número x, la MT universal produce el valor de ƒ correspondiente al argumento x.
2.11 Funciones computables 390
plos de “vastas clases de números que son computables”. Como las defini-
ciones de computabilidad conceptualmente diversas pero extensionalmente
equivalentes se han multiplicado desde 1936, si (ii) ya poseía alguna fuerza
persuasiva entonces, ahora ella tiene que ser arrolladora. En la Sección 2.11.5
probaré que una función numérica es T-computable si y sólo si es recursiva.
Omitiré, por eso, la parte (ii) del argumento de Turing. También la parte (iii)
se ha vuelto prescindible, puesto que en medio siglo nadie ha podido señalar
una clase de números —o una función numérica— que sea calculable pero
no computable (en particular, en virtud del diseño mismo de las computadoras
electrónicas, todo número o función calculable por una de ellas tiene que ser
T-computable). En cambio, la parte (i) merece nuestra atención por su gran
originalidad y sencillez, porque pone de manifiesto las consideraciones que
inspiraron el diseño de las máquinas de Turing y porque convenció a Gödel
de que los nuevos conceptos precisos de computabilidad capturaban la no-
ción ordinaria de algoritmo.34
Turing recuerda que los calculistas normalmente trabajan escribiendo sig-
nos en un papel. “Podemos suponer que ese papel está cuadriculado como el
cuaderno de aritmética de un niño. En la aritmética elemental suele aprove-
charse el carácter bidimensional del papel. Pero ello es prescindible y pienso
que todos estarán de acuerdo en que la bidimensionalidad del papel no es un
requisito esencial para calcular. Supongo, pues, que el cálculo se lleva a cabo
en papel unidimensional, esto es, en una cinta dividida en cuadrados” (1936,
p. 249).35 Cada cuadrado y los signos que pueden escribirse en él son, por
cierto, finitos. Por eso hay que suponer que el calculista sólo tiene un núme-
ro finito de signos diferentes a su disposición. En efecto, un alfabeto infinito
de signos legibles tendría que incluir figuras tan poco diferenciadas que nin-
gún calculista sería capaz de distinguirlas. Turing se apresura a señalar que
la restricción del número de signos no es grave, puesto que siempre se pue-
de usar una fila de signos como si fuera un signo más (así, en nuestro CP1
generamos infinitas variables con los dos signos x y |, etc.). La conducta de
un calculista está determinada en cada momento por los signos a que presta
36 Hay que suponer, claro, que se trata de la situación pertinente, esto es, del estado de la
cinta y de la mente del calculista en cuanto es significativa para el procedimiento de
cálculo. Si, al tiempo que escribe el próximo símbolo, el calculista derrama una taza
de café sobre el papel, la nueva situación del papel y de su mente no depende exclu-
sivamente de la operación de cálculo ejecutada. Aunque parece idiota, esta observación
es importante, pues indica que para deslindar en el acontecer real lo que es o no es
pertinente a un procedimiento de cálculo hay que tener más o menos en claro qué en-
tendemos por ‘procedimiento de cálculo’.
37 Aunque identifiquemos, como ahora está de moda, la mente con el encéfalo o una parte
de él, siempre podría asumir infinitos estados diferentes en el trascurso de una vida,
puesto que el espacio y el tiempo son infinitamente divisibles. En cuanto a la aptitud
de la conciencia humana para distinguirlos, sabemos demasiado poco para aventurar
una conclusión al respecto. Distinto es el caso de los símbolos que son marcas de tinta
en un papel, puesto que podemos señalar umbrales bajo los cuales dos marcas son
indiscernibles a simple vista o bajo un microscopio.
2.11 Funciones computables 392
1:A 1:R
(1)
0 1 2
0:1 0:A
Los tres círculos representan los tres estados posibles de la MT, identifica-
dos por su respectivo índice numérico (en negrita). Para mayor claridad, lla-
mo 0 al signo S0 (el blanco) y 1 al signo S1 (el palote). A y R denotan las
operaciones de avanzar y retroceder un cuadrado. Como puede observarse,
cada flecha se origina en un estado, va acompañada de dos caracteres (sepa-
rados por dos puntos), y apunta a un estado. Estos cuatro elementos consti-
tuyen obviamente un cuádruplo del programa. Cada flecha debe entonces
entenderse así: cuando la MT está en el estado donde la flecha se origina,
leyendo el signo anotado a la izquierda de los dos puntos, hace la operación
mencionada a la derecha de los dos puntos y pasa al estado adonde apunta
la flecha. El diagrama indica que cuando la MT en cuestión empieza a fun-
cionar en el estado 0 leyendo el primer palote de una fila de n, avanza y se
mantiene en el mismo estado. Sigue avanzando en el estado 0 hasta que lle-
ga a un blanco. Entonces reemplaza ese blanco con un palote y pasa al es-
tado 1. En ese momento la MT está leyendo el último palote de una fila de
n+1. La cinta contiene, pues, el resultado buscado. Con todo, según nuestras
convenciones, para “recibir” el resultado la MT tiene que estacionarse en el
primer cuadrado de la fila que lo representa. Por eso, el programa dispone
que la MT retroceda, en el estado 1, hasta encontrar el blanco que abre la
fila de palotes que representa el resultado. En cuanto da con él, avanza un
cuadrado, con lo cual se coloca ante el primer palote de la fila, y pasa al
estado 2. Como el círculo que representa al estado 2 no es el origen de nin-
guna flecha, se trata de un estado final, y la MT se detiene cuando lo alcan-
za.
El diagrama (2) representa —como el lector fácilmente comprobará— una
2.11 Funciones computables 394
0:1
0 1 2
1:0 (2)
0:A
(v) de cada círculo sale a lo sumo una flecha marcada 0:C y a lo sumo
una flecha marcada 1:C (donde C es uno de los caracteres 0, 1, A,
R).
1:A
(3)
0:1
0 1 2 3 4
1:0 0:1 0:1
0:1
(4)
0:A 1:A 0:A
6 5
1:R
0:A 0:A
0:R
0 1 2 3 4 5
1:0 0:A 1:0
Sea F el DP 0⋅1 (esto es, el DP que forman los estados 0 y 1). Es fácil ver
que el DP 3⋅4 es una copia de F. Advertimos (i) que F borra el *número a
que se aplica y se detiene ante el primer palote del *número siguiente; (ii)
que el DP 2 recorre de comienzo a fin, sin alterarlo, todo *número al que se
2.11 Funciones computables 397
aplica y se detiene en el primer cuadrado después del blanco que cierra ese
*número; (iii) que el DP 5 busca el primer palote que haya delante suyo o a
su izquierda y se detiene a la izquierda del mismo cuando lo encuentra, y
(iv) que el DP 6⋅7 es igual al DP 5⋅6 del diagrama (4), cuya tarea es buscar
el primer blanco delante suyo o a su derecha y detenerse ante el primer palote
a la derecha de ese blanco. Es claro, entonces que el DP Fk-1⋅2⋅Fr-k⋅5⋅6⋅7
representa el programa de la MT que computa la k-ésima proyección de ˆr.
A continuación, enseñaré a construir diversos DP que ejecutan varias ta-
reas básicas de cómputo. Los uso luego (en la Sección 2.11.5) para describir
las MT capaces de computar cualquier función recursiva general definida a
partir de funciones de esa clase conforme a los esquemas R4, R5 y R6 de la
Sección 2.11.1 (o sea, por composición, recursión y búsqueda del número
mínimo que cumple cierta condición recursiva). Para facilitar las referencias
designaré a cada uno de estos DP con una abreviatura mnemotécnica apro-
piada.
Los primeros cuatro DP ejecutan las cuatro operaciones elementales de
que es capaz una MT: a avanza un cuadrado y r retrocede un cuadrado, haya
lo que haya en el cuadrado inicial; l escribe un palote en el cuadrado inicial
o lo preserva si ya lo hay, y Ø produce un blanco o lo preserva.
0:A 0:R
1:A 1:R
(a) (r)
0:1 0:0
1:1 0:1
(l) (Ø)
Los dos DP siguientes salen del cuadrado inicial buscando el primer blanco
a la derecha (A0) o a la izquierda (R0) y se detienen ante él cuando lo en-
cuentran.
2.11 Funciones computables 398
(A0 )
1:A
0:A
0:0
1:A
(R0 )
1:R
0:R
0:0
1:R
1:A (A00)
0:A 0:R
1:A
1:R (R00)
0:R 0:A
1:R
1 2 3 4 (C)
0:1 0:R 0:0
1:0
0:A
0 0:1 0:A 5
0:R 0:1
1:A 1:A 0:A
1:A 8 7 6 9
1:A
0:1
1:A 1:0
13 12 11 10
0:0 0:A 1:R
Para verificar que C hace lo que dije, el lector debe escribir tres o cuatro
palotes consecutivos en una línea de un papel cuadriculado, situarse en el
cuadrado a la derecha del último palote y seguir las instrucciones del diagra-
ma. Si, después de escribir o borrar varios palotes, la línea en que está ope-
rando se torna confusa, copie en limpio su última configuración en una línea
nueva y siga operando sobre ésta.
Consideremos ahora una variante de la tarea que ejecuta C. Supongamos
que la cinta contiene un *n-tuplo seguido de blancos. Se trata de copiar al
final del *n-tuplo (inmediatamente después del blanco que lo cierra), el
(n-k)-ésimo *número del mismo y detenerse en el blanco que cierra la co-
pia. Llamaré Ck al DP que ejecuta esta tarea. (Con esta nueva nomenclatura,
C = C0). Supondremos que Ck parte del blanco ø que cierra el *n-tuplo.
2.11 Funciones computables 400
1:A 0:A
0:1
8 (A0) k ⋅a 7
(Ck)
1:A
(A0) k +1 9⋅⋅10⋅11
r = l⋅A0⋅Ø⋅R00
0:0
r2 a⋅l⋅A0⋅r⋅Ø⋅R0
1:1
(Tr)
a
1 :0
1 :0
1 :1 0 :R 0 :R
0 :R 0 :R
0 :R 1 :0 1 :0
1 :0
0 :0
(B3)
A1
2.11 Funciones computables 403
M+ = A0⋅l⋅A0⋅(r⋅Ø)2⋅R0⋅a.
Dada una fila de x+1 palotes seguida de un blanco seguido de una fila de
y+1 palotes, si M+ empieza a operar, conforme a la descripción canónica, en
el primer cuadrado de la primera fila, busca el primer blanco a la derecha,
esto es, el que separa las dos filas de palotes; lo llena con un palote; busca
nuevamente el primer blanco a la derecha; retrocede dos veces, borrando al
paso dos palotes; busca el primer blanco a la izquierda y avanza un cuadra-
do, con lo cual acaba situada ante el primer palote de una fila de x + y + 1
palotes consecutivos, que es justamente el *número que representa a x + y.
M× computa la función 〈x,y〉 Å xy, esto es, el producto de cualquier par
de números naturales, El programa de M× es, por cierto, bastante más com-
plejo que el de M+. Lo representaré mediante un diagrama como el que usé
para Ck.
0:A
a2 0:0 Rl
1:0
0:0
A0 a⋅A l
r ⋅ R 0 ⋅ Rl ⋅ Ø⋅ A l a r⋅l⋅R0 ⋅a⋅Ø⋅a⋅Ø
0:0 1:1
(M×)
2.11 Funciones computables 404
Mƒ = r00⋅Dƒ⋅R0⋅B1
Dƒ = a⋅l⋅a⋅(Cn)n⋅(R0)n⋅r⋅Ø⋅Rl⋅R00⋅((r)q⋅A0⋅Al⋅r)n⋅a⋅Mƒ⋅r⋅Tr⋅A00
Analicemos las tareas que Dƒ cumple antes de ejecutar la tarea de Mƒ. Em-
pieza a operar en el blanco a la derecha del *n-tuplo que representa el argu-
mento. Avanza un cuadrado, escribe un palote y avanza otro cuadrado, si-
tuándose en un blanco que llamaré ø. La tarea siguiente, ejecutada por el
DP (Cn)n, consiste en copiar el argumento a la derecha de ø. (Recuérdese
que Cn copia a la derecha del blanco inicial el *número que está separado
por n *números de ese blanco y se detiene en el blanco que cierra la copia;
en su primera aplicación, pues, Cn copia el primer *número del argumento,
que está separado de ø por los n-1 *números restantes y el palote recién
escrito; en la segunda aplicación, Cn copia el segundo *número del argu-
mento,…, en la n-ésima, el n-ésimo). Luego, el DP retorna a ø (que ahora
es el n-ésimo blanco a la derecha del blanco donde se concluye la última
aplicación de Cn), retrocede un cuadrado, borra el palote que escribió al
38 En verdad, Dƒ no es sino una máquina de Turing que computa ƒ de acuerdo con una
descripción canónica diferente, que pude muy bien adoptar —como hace Hermes
(1961)— en vez de la que dí en la Sección 2.11.3; pero esta última tiene ventajas
didácticas.
2.11 Funciones computables 406
39 Para poner al *n-tuplo original fuera del alcance de los “borradores” de Mƒ basta en
rigor con una separación de q+1 blancos, de modo que sería suficiente utilizar (r)q-2
en vez de (r)q.
2.11 Funciones computables 407
Mƒ = A00⋅a⋅l⋅a⋅(Cn)n⋅Rn⋅r⋅Ø⋅A00⋅D1⋅(Cn)n⋅D2⋅…⋅(Cn)n⋅Dm⋅
C(m-1)+n(m-1)⋅C(m-1)+n(m-2)⋅…⋅Cm-1⋅Dh⋅R0⋅B3
ƒ(x1,…,xn,0) = g1(x1,…,xn)
ƒ(x1,…,xn,y+1) = g2(x1,…,xn,y,f(x1,…,xn,y))
también es T-computable.
2.11 Funciones computables 409
A00⋅ a⋅⋅ l⋅⋅a ⋅C 1⋅ (Cn+2) n⋅R0n+1 ⋅ r⋅⋅ Ø⋅⋅A00 ⋅ D1 ⋅ C n+1 ⋅ r⋅⋅ Ø⋅⋅ r
0:0 1:1
a⋅⋅ (Cn+1 ) n⋅ a
1:1
R0⋅ B3 a⋅⋅ (Cn+3 ) n+1 l⋅⋅ a⋅⋅ C n+2 ⋅ D 2⋅ C n+ 3⋅ r⋅⋅ Ø⋅⋅ r
0:0
0:0
A00⋅ a l⋅⋅ a⋅⋅ D⋅⋅r ⋅Ø ⋅ r R0⋅ B 3
1:1
0:0
1:1 Ø ⋅r
II. Toda función T-computable es recursiva. Sea ƒ una función r-aria T-com-
putable por la MT Mƒ. Ya sabemos identificar a Mƒ mediante un gödel.
Mientras Mƒ computa el valor de ƒ para un dado argumento x ∈ ˆr, la cinta
presenta sucesivamente distintas configuraciones; cada momento o etapa de
la computación queda exhaustivamente descrito por la indicación de (i) la
configuración de la cinta en esa etapa; (ii) el estado momentáneo de Mƒ y
(iii) el cuadrado que Mƒ está leyendo. Se puede definir un gödel que repre-
sente toda esta información. Como el tránsito de cada etapa a la próxima
está determinado por el programa finito de Mƒ, se pueden definir funciones
recursivas que asignen al gödel de cada etapa, el gödel de la etapa siguiente.
Sobre esta base, es posible definir una función recursiva que asigna el valor
ƒ(x) al par formado por el gödel de Mƒ y el gödel de la etapa inicial de la
computación de ƒ(x). Tal es el método estándar para demostrar este resulta-
do,43 que produce al mismo tiempo pruebas de los resultados III-VI. Pero
aquí seguiré otro método más simple, debido a Boolos y Jeffrey (1980, Cap.
8); luego completaré esquemáticamente la demostración estándar a propósi-
to del resultado IV.
Para llevar a cabo la demostración propuesta necesitaré algunos concep-
tos auxiliares, que explico a continuación en párrafos numerados del 1 al 6.
1. Definición de una función mediante una lista finita de condiciones. Sea
ϕ una función numérica definida en D ⊆ ˆr mediante n condiciones de la
forma
43 Ideado por Kleene; véase su tratado didáctico (1952), o la exposición muy clara y pre-
cisa de Davis (1958, Capítulo 4).
2.11 Funciones computables 411
Decimos que ϕ es una función definida mediante una lista finita de condi-
ciones. Si ψ1,…, ψn, χ1,…, χn son funciones pr-recursivas, ϕ también es
pr-recursiva.
2. Maximización acotada. El lector conoce la función r-aria definida por
“minimización acotada” x Å µy(y ≤ φ(x) ∧ R(y,x)), cuyo valor, para cada r-
tuplo x, es el mínimo número y ≤ φ(x) que cumple la condición R(y,x). Como
indiqué en el paso 3º de la prueba del primer teorema de incompletud de
Gödel (p. 334, (✥)), esta función es pr-recursiva si la función φ y la relación
R lo son. Ahora definiré por maximización acotada la función x Å Μy(y ≤
φ(x) ∧ R(y,x)), cuyo valor es el máximo número y ≤ φ(x) que cumple la
condición R(y,x). Sea P la condición definida por P(y,x) ↔ (R(y,x) ∧ ∀z(z ≤
φ(x) → (z > y → ¬R(z,x)). Obviamente, Μy(y ≤ φ(x) ∧ R(y,x)) = µy(y ≤ φ(x)
∧ P(y,x)). Por lo tanto, nuestra función de maximización acotada es pr-
recursiva si la función φ y la condición R lo son. En particular, defino por
maximización acotada la función θ que asigna a cada x ∈ ˆ el máximo
número w ≤ x tal que 2w ≤ x; en el acto advertimos que θ(2z+1-1) = z.
3. Codificación de r-tuplos. Sea pk el k-ésimo número primo. La función
r-aria
Γr:〈x1,x2,…,xr〉 Å 2x1⋅3x1⋅…⋅prxr
es pr-recursiva (cf. pp. 336 y ss.) y puede utilizarse para identificar inequí-
vocamente un r-tuplo numérico mediante un solo número (un gödel). En vez
de Γr(x1,x2,…,xr) escribimos [x1,x2,…,xr]. Si x designa el r-tuplo
〈x1,x2,…,xr〉, escribo [x] por Γr(x). Consideremos ahora la función Πk que
asigna a cada número x el máximo número z ≤ x tal que x es divisible por
(pk)z. Según lo explicado en el párrafo 2, Πk es pr-recursiva. Obsérvese que,
si x es el gödel de un r-tuplo y 1 ≤ k ≤ r, Πk(x) es el k-ésimo número del r-
tuplo en cuestión. En otras palabras Πk([x]) = πk(x).
4. Codificación de computaciones. Sea Mƒ una MT que computa una fun-
ción r-aria ƒ. Las etapas de la computación de ƒ(x) pueden numerarse, diga-
2.11 Funciones computables 412
r
α 0 = (2 x 1+1ⱷ1) + Σ (2 x +1ⱷ1)(2 Σ
j =1
j k< j x k +2
) = ζ r(x 1,…,x r)
es divisible por y; Sea ε:ˆ Æ {0,1} tal que ε(x) = 0 si x es par, e(x) = 1 si
x es impar. (Ambas funciones son pr-recursivas). Como vamos a definir Bƒ
de tal modo que Bƒ(t,x) —para un dado r-tuplo x— sea el gödel de un triple,
adoptaré tres abreviaturas para designar los tres números codificados en di-
cho gödel, para un dado t; llamaré ᒏt al primero, ᒎt al segundo y ᑾt al terce-
ro.45 Llamaré Qt al número Q(ᒎt,ε(ᑾt)).46 Obsérvese que (a) si ᒎt = q(t) y ᑾt
= αt, Qt es el número que representa el estado alcanzado por Mƒ en el trán-
sito de la etapa t a la t+1, y (b) si Mƒ se detiene en o antes de la etapa t, Qt
= 0. Completamos la definición de Bƒ con la siguiente estipulación:
III. Forma normal de una función recursiva. Sea ƒ una función recursiva r-
aria. Entonces, ƒ es T-computable (I). Por lo tanto, ƒ es idéntica a la función
compuesta al lado derecho de la ecuación (*). Dicha función se forma por
composición de la función pr-recursiva θ ∑ Π3 ∑ Bƒ con la función φ defini-
da por minimización (según el esquema R6) a partir de una función pr-
recursiva. Por lo tanto, toda función recursiva puede definirse por una serie
finita de aplicaciones de los esquemas de recursión primitiva R1-R5, con a
lo sumo una aplicación del esquema R6.48
421
2.12 La prueba de Gentzen 422
inducción sobre el nivel de las derivaciones, que ninguna derivación del sis-
tema puede desembocar en una contradicción. Pero la inducción de que aquí
se trata rebasa los límites del “modo recursivo de pensar” patrocinado por
Skolem (1923) y aceptado sin reservas en la escuela de Hilbert. Aunque el
conjunto de las derivaciones admisibles es, por cierto, numerable,2 el orden
que hay que darle para los efectos del argumento de Gentzen no es isomórfico
a ω, sino a un ordinal mucho mayor.3 Por lo tanto, la inducción requerida se
extiende sobre todos los ordinales menores que ése. Se razona así: (i) Nin-
guna derivación del nivel ínfimo lleva a una contradicción. (ii) Si una deri-
vación de nivel ζ lleva a una contradicción, hay una derivación de un nivel
η < ζ que también lleva a una contradicción. (iii) Por lo tanto, si ninguna
derivación de nivel η < ζ lleva a una contradicción, las derivaciones de ni-
vel ζ tampoco llevan a una contradicción. Esta forma de razonar no me
merece ninguna duda, pero me cuesta trabajo llamarla finita o finitista.
La argumentación de Gentzen es tortuosa —tanto, que juzgó necesario
reescribirla— pero, exceptuando la inducción descrita, es enteramente ele-
mental; en particular, la construcción, para cada derivación con conclusión
contradictoria, de otra derivación equivalente de menor nivel es una simple
transformación de un objeto finito en otro objeto finito, y la complicación
viene sólo de la variedad de los casos posibles. Examinaré en detalle la ver-
sión de 1938. Presento el cálculo en la Sección 2.12.1. Este cálculo es in-
consistente si y sólo si hay derivaciones de la clase que llamaré “fatales”.
En la Sección 2.12.2 demuestro que toda derivación fatal se deja reducir a
otra de la misma clase, construida de tal modo que preceda a la primera en
el orden definido por Gentzen. En la Sección 2.12.3 doy la definición de
este orden, lo uso para fundamentar la inducción arriba esbozada y hago
algunas observaciones sobre la índole de ésta y su utilidad dentro y fuera
del programa de Hilbert.
2 Como cada derivación es una colección finita de signos es posible asignarle un gödel
a cada una, ordenarlos de menor a mayor y contarlos.
3 Concretamente, el primer ordinal ξ, tal que ωξ = ξ. Este es el número que Cantor lla-
mó ε0 (1895/97, §20). Es, por cierto, un número de la Clase II: el conjunto de sus
predecesores es infinito pero numerable (véase el capítulo 1.5).
2.12 La prueba de Gentzen 423
4 La elección del signo indica, sin duda, que Gentzen prefería contar desde uno: eins,
zwei, drei… Dadas nuestras preferencias, habría que entender que ‘1’ designa el nú-
mero cero (como en las representaciones gráficas de máquinas de Turing en la Sección
2.11.4), o reemplazarlo por el signo ‘0’. Pero el lector ya se habrá acostumbrado a
pensar que todo esto da lo mismo; el significado de la constante ‘1’ queda fijado tan
precisamente como es posible si estipulamos que ésta designa el único número que no
es el siguiente de otro.
2.12 La prueba de Gentzen 424
5 Para ajustarnos estrictamente al CP1 tendríamos que elegir dos predicados binarios, diga-
mos P2 y P21 y estipular que (τ1 = τ2) abrevia a P2τ1τ2 y (τ1 > τ2) abrevia a P21τ1τ2.
6 Fuera de = y >, veo un predicado más, el predicado ternario ‘x es congruente con y
módulo z’, que se utiliza una sola vez, en la fórmula ‘1′′′ ≡ 1 (mod 1′′)’, presentada
como ejemplo ilustrativo (Gentzen 1938, p. 23, al final del §1.4).
7 En vez de ∧, Gentzen usa & como signo de conjunción.
8 Conviene, sí, tener presente la siguiente advertencia de Gentzen (1935, p. 526): si ∀ᒕᑠ(ᒕ)
es una fórmula con un solo cuantificador y sin otra variable que ᒕ, “no tenemos que
asociar a ese ∀ la representación de una cantidad infinita cerrada de aseveraciones
2.12 La prueba de Gentzen 425
particulares, sino que podemos concebir su sentido ‘finitamente’ (‘finit’) así: ‘Si la ᒕ se
reemplaza sucesivamente por números, empezando con el 1, entonces, por mucho que
se avance en la formación de números, se obtiene en cada caso una aseveración verda-
dera’.”
9 Si esta caracterización no parece suficientemente precisa, se puede reemplazar el espa-
cio entre premisas por un signo impreso, por ejemplo, el punto y coma.
2.12 La prueba de Gentzen 426
ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑞ
Contracción ᑞ, ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑞ, ᑞ
ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑞ
Permutación ∆, ᑞ, ᑟ, Γ ➛ Θ Γ ➛ Θ, ᑞ, ᑟ, ∆
∆, ᑟ, ᑞ, Γ ➛ Θ Γ ➛ Θ, ᑟ, ᑞ, ∆
Corte Γ ➛ Θ, ᑞ ᑞ, ∆ ➛ Λ
Γ, ∆ ➛ Θ, Λ
∧ ∨
Γ ➛ Θ, ᑛ Γ ➛ Θ, ᑜ ᑛ, Γ ➛ Θ ᑜ, Γ ➛ Θ
Γ ➛ Θ, ᑛ ∧ ᑜ ᑛ ∨ ᑜ, Γ ➛ Θ
ᑛ, Γ ➛ Θ ᑜ, Γ ➛ Θ Γ ➛ Θ, ᑛ Γ ➛ Θ, ᑜ
ᑛ ∧ ᑜ, Γ ➛ Θ ᑛ ∧ ᑜ, Γ ➛ Θ Γ ➛ Θ, ᑛ ∨ ᑜ Γ ➛ Θ, ᑛ ∨ ᑜ
∀ ∃
Γ ➛ Θ, ᑠ(ᑾ/ᒕ) ᑠ(ᑾ/ᒕ), Γ ➛ Θ
Γ ➛ Θ, ∀ᒕᑠ ∃ᒕᑠ, Γ ➛ Θ
si la variable ᑾ no figura en la conclusión si la variable ᑾ no figura en la conclusión
ᑠ(ᒑ/ᒕ), Γ ➛ Θ Γ ➛ Θ, ᑠ(ᒑ/ᒕ)
∀ᒕᑠ, Γ ➛ Θ Γ ➛ Θ, ∃ᒕᑠ
¬
ᑛ, Γ ➛ Θ Γ ➛ Θ, ᑛ
Γ ➛ Θ, ¬ᑛ ¬ᑛ, Γ ➛ Θ
2.12 La prueba de Gentzen 428
IM ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ)
ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒑ/ᒕ)
2.12.2 Reducciones
➛ ᑛ ∧ ¬ᑛ
➛ᑛ
➛ ¬ᑛ ¬ᑛ ➛ (¬)
➛ (corte)
Llamaré, por eso, fatal (entiéndase: para la consistencia del cálculo) a cual-
quier derivación cuyo secuente final es ‘ ➛ ’.11 Probaremos que no puede
haber una derivación fatal. En la prueba se usarán algunos términos que defino
a continuación.
Si una fórmula empieza con un conectivo, éste es el conectivo principal
de esa fórmula; si empieza con un paréntesis, su conectivo principal es el
conectivo cuyo alcance incluye el signo que sigue inmediatamente a este
paréntesis.12
El grado de una fórmula es el número de conectivos que contiene. El grado
de un corte es el grado de las fórmulas cortadas en él (representadas por ᑞ
en el esquema). El grado de una inferencia inductiva es el grado de la fór-
mula a que se refiere la inducción (representada por ᑠ en el esquema).
Sea una derivación cualquiera. Decimos que el secuente σ precede inme-
diatamente en al secuente σ′ (y que σ′ sigue inmediatamente a σ) si σ es
una premisa de una inferencia en cuya conclusión es σ′. Si σ < σ′ (en el
sentido definido en 2.12.1), decimos que σ precede a σ′ o que está sobre σ′
y que σ′ sigue a σ o está bajo σ.
Asignaremos una altura a cada secuente σ en la derivación . Para ello,
atendemos al grado de cada corte e inferencia inductiva cuya conclusión está
bajo σ en . El mayor de esos grados es la altura de σ en . Este número
se utiliza luego de un modo decisivo al ordenar las derivaciones.
13 Gentzen (1938, p. 24) define ‘hilo’ (Faden) en los términos que he utilizado para de-
finir un ‘hilo completo’, pero luego emplea el término ‘hilo’ como si lo estuviera en-
tendiendo de acuerdo con mi definición.
2.12 La prueba de Gentzen 432
ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ)
ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ)
Γ ➛ Θ, ᑞ ∆, ᑞ ➛ Λ Γ➛Θ
Γ,∆ ➛ Θ, Λ Γ,∆ ➛ Θ, Λ
CUADRO 1
[h] . . [g]
. .
. .
Γ1 ➛ Θ1, ᑠ(ᑾ/ᒕ) ᑠ(ᒋ/ᒕ), Γ2 ➛ Θ2
Γ1 ➛ Θ1, ∀ᒕᑠ ∀ᒕᑠ, Γ2 ➛ Θ2 [a1]
.. ..
.. ..
.
.
..
..
.
.
..
..
..
..
.. ..
..
..
..
..
.. ..
Γ ➛ Θ, ∀ᒕᑠ ∀ᒕᑠ, ∆ ➛ Λ
Γ, ∆ ➛ Θ, Λ [b1]
..
..
.
..
.
..
..
..
..
..
..
Γ3 ➛ Θ3 [c1]
..
..
.
..
.
..
..
..
..
..
..
➛
2.12 La prueba de Gentzen 438
Las líneas punteadas sobre los primeros secuentes anotados representan las
ramas de ✫ que confluyen en los hilos h y g, respectivamente. Cualquier
otra línea punteada vertical representa la continuación de h y g entre los
dos secuentes que enmarcan esa línea. Las líneas punteadas inclinadas que
salen de una misma vertical representan los hilos —0, 1, 2 o más— que
desembocan en el representado por ésta, entre los dos secuentes que la
enmarcan. El término ᒋ en la premisa de la inferencia con conectivos al lado
derecho tiene que ser un término numérico, ya que esa no es una inferencia
con variable propia y no hay otras inferencias con variable propia bajo ella.20
He escrito [a1] frente a las dos conclusiones de inferencias con conectivo
con que empiezan los hilos h y g; [b1] frente al corte propio de la alianza
de la fórmula ∀ᒕᑠ, y [c1] frente al primer secuente bajo dicho corte cuya
altura es menor que la altura de las premisas de ese corte (tiene que haber
un secuente así, puesto que el secuente final tiene altura 0).21 Este secuente
puede ser la conclusión de ese corte, en cuyo caso las líneas marcadas con
[b1] y [c1] coinciden. También puede ocurrir que las premisas del corte sean
las conclusiones marcadas con [a1] y que su conclusión sea el secuente final
‘ ➛ ’. Estas situaciones especiales simplifican la reducción del conectivo
sin afectarla.
La reducción del conectivo ∀ en la posición indicada transforma la deri-
vación ✫ en la derivación † presentada esquemáticamente en el Cuadro 2
(p. 456). Las líneas punteadas marcadas con [h] y [g] representan sendas
copias de los árboles marcados del mismo modo en el Cuadro 1. Se ha in-
vertido el orden para acomodar dos árboles nuevos marcados [h′] y [g′] que
se combinan en cortes con la continuación de [h] y [g], como se indica en
la línea [c2]. Hasta la línea [a2], [g′] es simplemente una copia de [g] y [h′]
es el resultado de reemplazar en [h] la variable ᑾ, en todas sus posiciones
libres, por el término numérico ᒋ. Bajo la línea [a2], [h′] y [g′] se continúan
con permutaciones y un debilitamiento para obtener las conclusiones que
ocupan la línea [b2]. La línea [d2] contiene los primeros secuentes cuya altu-
20 Según acordamos arriba, la derivación entera no contiene variables libres que no sean
variables propias de una inferencia. En virtud de la eliminación de las inferencias
inductivas en el trozo final, éste no contiene ninguna inferencia con variable propia.
21 Recuérdese que la altura de un secuente en una derivación es el más alto grado poseí-
do por un corte o inferencia inductiva cuya conclusión está bajo ese secuente.
2.12 La prueba de Gentzen 439
Γ1 ➛ Θ1, ᑛ Γ1 ➛ Θ1, ᑜ
Γ1 ➛ Θ1, ᑛ ∧ ᑜ [a]
ᑛ, Γ2 ➛ Θ2 ᑜ, Γ2 ➛ Θ2
ᑛ ∧ ᑜ, Γ2 ➛ Θ2 ᑛ ∧ ᑜ, Γ2 ➛ Θ2 [a]
22 Puede ocurrir que el secuente que precede inmediatamente a un par de rayas tenga ya
la forma del secuente que inmediatamente las sigue; en tales casos, se sobreentiende
que la derivación no contiene dichas inferencias y que hay un solo secuente donde el
esquema presenta dos.
2.12 La prueba de Gentzen 440
ᑛ, Γ1 ➛ Θ1 Γ2 ➛ Θ2, ᑛ
Γ1 ➛ Θ1, ¬ᑛ ¬ᑛ, Γ2 ➛ Θ2 [a]
[g′] . . [h′]
. .
. .
Γ2 ➛ Θ2, ᑛ ᑛ, Γ1 ➛ Θ1 [a]
23 Gentzen escribe: “Die Zahlen des Systems ᑭρ (ρ sei eine natürliche Zahl oder 0) seien
bereits definiert, ebenso = und <-Beziehung zwischen diesen” (1938, p. 38). Tendré
ocasión de referirme a este pasaje al final de esta sección.
2.12 La prueba de Gentzen 442
ᑭ0 = {0}
ᑭ1 = ᑭ0 ∪ {1, 2,…} = {x: x < ω}
ᑭ2 = ᑭ1 ∪ {ω, ω+1, ω+2,…} = {x: x < ωω}
ω
ᑭ3 = {x: x < ωω }
ωω
ᑭ4 = {x: x < ωω }
.....................
2.12 La prueba de Gentzen 443
24 Me confieso incapaz de entender cómo un concepto que para nosotros no está definido
de ninguna manera (gar nicht definiert) puede contribuir a la clarificación (zur Er-
läuterung dienen).
25 Como el lector habrá advertido, la suma natural así definida se aplica sólo a los ordinales
mayores que 0. Pero no cuesta nada incluir al 0 en el dominio de la operación estipu-
lando que α + 0 = 0, cualquiera que se α. Entonces, la condición α ⱅ β > α se cum-
ple sólo si β ≠ 0.
2.12 La prueba de Gentzen 444
conectivo con una sola premisa σ, O(λ) = O(σ); (iv) si λ pertenece a una
inferencia con conectivo con dos premisas σ1 y σ2, O(λ) = max(O(σ1), O(σ2));
(v) si λ pertenece a una inferencia inductiva cuya premisa tiene el ordinal α
= ωα1 + ωα2 +…+ ωαp, O(λ) = ωα1+1 (naturalmente, si α1 = 0, O(λ) = ω1 =
ω). Sea ς la conclusión bajo la raya λ. El ordinal O(ς) se determina compa-
rando la altura h de ς con la altura h* de las premisas sobre λ. Si h = h*,
O(λ)
O(ς) = O(λ). Si h = h*– 1, O(ς) = ωO(λ). Si h = h*– 2, O(ς) = ωω . Si h
ωO(λ)
= h*– 3, O(ς) = ωω , etc. La utilidad de estas reglas, al parecer capricho-
sas, se verá en la próxima etapa del razonamiento. Por ahora, basta que el
lector se convenza, analizando ejemplos, de que ellas asignan unívocamente
un genuino ordinal a cada secuente de la derivación . El ordinal O() asig-
nado a la derivación misma es el ordinal de su secuente final.
En la Sección 2.12.2 se demostró que, si existe una derivación fatal ,
también existe una derivación fatal †, construida a partir de mediante la
serie de transformaciones que allí se explica. Ahora demostraré que O(†) <
O(), examinando dichas transformaciones una a una. Al leer los próximos
párrafos conviene tener presentes los párrafos de igual título en la Sección
2.12.2.
Eliminación de variables libres ociosas. Dimos por supuesto que no con-
tenía ninguna variable libre que no fuera la variable propia de una inferen-
cia, ni dos variables iguales que fueran variables propias de dos inferencias
distintas. Esta suposición no afecta el ordinal O(). En efecto, si no cum-
ple esta doble condición y ✠ es la derivación fatal obtenida mediante las
sustituciones de variables descritas bajo este mismo título en la Sección 2.12.2,
es claro que O() = O(✠).
Eliminación de las inferencias inductivas en el trozo final. Supongamos que
contiene inferencias inductivas en su trozo final y que 1 es la derivación
obtenida al eliminar la última de esas inferencias inductivas del modo des-
crito bajo este mismo título en la Sección 2.12.2. Supongamos que, igual
que allí,
ᑠ(ᑾ/ᒕ), Γ ➛ Θ, ᑠ(ᑾ′/ᒕ)
ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ)
2.12 La prueba de Gentzen 445
es la forma de esa inferencia (con término numérico ᒋ ≠ 1). Sea ωα1 + ωα2
+…+ ωαn el ordinal de la premisa. Entonces, el ordinal de la raya horizon-
tal es ωα1+1. Ahora bien, la conclusión tiene la misma altura que la premisa,
ya que los cortes propios de las alianzas de ᑠ(1/ᒕ) y ᑠ(ᒋ/ᒕ) figuran bajo
ambas y tienen por lo menos el mismo grado que la inferencia inductiva
considerada. Por lo tanto, ωα1+1 es también el ordinal de la conclusión. En la
derivación 1, los “secuentes iniciales” del segmento de derivación que sus-
tituye a la inferencia inductiva eliminada se obtienen reemplazando la varia-
ble libre ᑾ por términos numéricos. Como tales reemplazos no afectan el
ordinal, esos “secuentes iniciales” tienen todos el mismo ordinal ωα1 + ωα2
+…+ ωαn. Los nuevos cortes que aparecen en 1 tienen todos el mismo
grado que la inferencia inductiva eliminada. Por lo tanto, el ordinal del
secuente ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ) al final del segmento sustituto es la suma
natural de los ordinales de dichos “secuentes iniciales” y su primer término
es ωα1, de tal modo que ese ordinal es menor que ωα1+1, el ordinal de la
conclusión de la inferencia inductiva eliminada. Como ahora se verá, esto
implica que O(1) < O(). En efecto, encontraremos bajo el referido secuente
ᑠ(1/ᒕ), Γ ➛ Θ, ᑠ(ᒋ/ᒕ) solamente inferencias estructurales que la transfor-
mación de en 1 no altera en nada. Los debilitamientos, permutaciones y
contracciones trasmiten a la conclusión el ordinal de la premisa. Por lo tan-
to, si no hay cortes bajo dicho secuente, es claro que O(1) < O(). Por otra
parte, un corte cuyas dos premisas tienen ordinales α y β trasmite a la con-
clusión el ordinal α ⱅ β. Si α1 < α, (α1 ⱅ β) < (α ⱅ β). Por lo tanto,
aunque haya cortes bajo el referido secuente, O(1) < O(). En la Sección
2.12.2 llamé 0 a la derivación fatal sin inferencias inductivas en su trozo
final obtenida eliminando una a una las inferencias de esa clase en el trozo
final de una derivación fatal cualquiera . Es posible que misma no con-
tenga tales inferencias —en cuyo caso = 0— pero, si las contiene, su
ordinal disminuye con la eliminación de cada una. Por lo tanto, O(0) ≤ O().
Eliminación de los debilitamientos y los secuentes básicos lógicos en el tro-
zo final. Nos toca ahora mostrar que O(✫) ≤ O(0), donde ✫ es la deriva-
ción fatal sin debilitamientos o secuentes básicos lógicos obtenida por trans-
formación de 0. Esta fase del razonamiento, aunque elemental, es engorro-
sa y Gentzen sugiere omitirla si uno se interesa sólo en “lo más esencial”
(das Wesentlichste—1938, p. 41). Pero en una demostración cualquier fase
2.12 La prueba de Gentzen 446
es igualmente esencial, a menos que sea superflua (en cuyo caso, se la pue-
de suprimir del todo). La transformación de 0 en ✫ consta de cero o más
etapas, en cada una de las cuales se elimina un debilitamiento o un SBL.
Una etapa dada puede envolver la eliminación de un corte o afectar única-
mente inferencias estructurales que no sean cortes. En este último caso, el
ordinal de la derivación transformada es igual al de la derivación obtenida.
Consideremos, pues, sólo el caso especial en que la transformación de 0 en
✫ consta de una sola etapa que elimina un corte en el trozo final. Entonces
puede ocurrir que disminuya la altura de los secuentes situados sobre ese
corte, no sólo en el trozo final, sino en la derivación entera.26 ¿Qué efecto
tiene tal reducción de alturas sobre el ordinal de la derivación? Para apre-
ciarlo mejor, y siguiendo el ejemplo de Gentzen, encaramos el asunto así:
sea σ la premisa del corte eliminado que sobrevive a la transformación; su-
pongamos que la altura de σ cae de h a h–1 y que esta reducción se propa-
ga, inferencia por inferencia, de conclusiones a premisas, a lo largo de todas
las ramas de la derivación que quedan sobre σ;27 si la altura de σ cae de h
a h–n, entendemos que el proceso se repite n veces; en todo caso, el efecto
global será el resultado de los efectos locales de la propagación (repetida o
no). Supongamos, entonces, que el “contagio” ha llegado a la conclusión ς
de cierta inferencia y pasa ahora a sus premisas π1 y π2 (a π1, si tiene sólo
una). Sean α y β, respectivamente, los ordinales de π1 y π2 antes de que
esto ocurra. Si π1 y π2 son secuentes iniciales, α = β = 1 y no cambian con
la reducción de altura. Por lo tanto, sólo nos interesa el caso en que π1 o π2
o ambas son conclusiones de inferencias. En tal caso, cuando el “contagio”
las alcanza, sus ordinales se transforman de α en ωα y de β en ωβ. El ordinal
de la raya horizontal, que, según el tipo de la inferencia en cuestión, era α,
o α ⱅ β, o max(α+1,β+1), o ωα1+1 (si se trata de una inferencia inductiva y
α = ωα1 + ωα1 +…+ ωαn), se convierte, respectivamente, en ωα, o en ωα ⱅ
ωβ, o en max(ωα+1,ωβ +1), o sigue siendo igual a ωα1+1. ¿Qué pasa con el
ordinal de la conclusión ς? Si antes del “contagio” la diferencia de altura
entre ς y sus premisas era 1, y se ha reducido, por ende, a 0, el ordinal de
cada caso, pues, el ordinal de ς es igual o menor que lo que era antes. Otro
tanto cabe decir si la diferencia entre ς y sus premisas era n > 1 y pasa a ser
n–1 (verifíquelo el lector). Este análisis demuestra que, cuando ocurre re-
ducción de alturas en el curso de la transformación de 0 en ✫, nunca au-
menta el ordinal de un secuente situado bajo otro cuya altura disminuye. En
particular, no puede aumentar el ordinal del secuente final, que es el ordinal
de la derivación. Si la transformación de 0 en ✫ tiene más de una etapa,
este resultado se aplica a cada una. Por lo tanto, O(✫) ≤ O(0).
La reducción del conectivo. Hemos logrado establecer que, si es una de-
rivación fatal, hay derivaciones fatales 0 y ✫, con las propiedades señala-
das, cuyo ordinal es igual o menor que el ordinal de . Mas para demostrar
inductivamente que no hay ninguna derivación fatal es preciso comprobar
que, si hubiera una, existiría también otra cuyo ordinal es estrictamente menor
que el de la primera. La artificiosa operación que llamamos “reducción del
conectivo” garantiza justamente este resultado. Como sabemos, esta opera-
ción tiene que ser aplicable a una derivación fatal con las propiedades de
✫, si tal derivación existe, porque una derivación así tendría que incluir
por lo menos una inferencia con conectivo. Atendamos, pues, a la reducción
del conectivo aplicada al signo de cuantificación ∀, ilustrada en los Cuadros
1 y 2 de la Sección 2.12.2. Para facilitar las referencias, marqué allí ciertas
líneas con letras acompañadas del número del cuadro respectivo. Llamamos
✫ y † las derivaciones representadas en los Cuadros 1 y 2, respectiva-
mente. La líneas [c1] y [d2] son las primeras en que aparecen secuentes cuya
altura es menor que la altura de las premisas de los cortes en [b1] y [c2]. Sea
α el ordinal de la raya horizontal sobre [c1] y sean β y γ los ordinales de las
rayas horizontales sobre [d2]. Suponemos que β ≥ γ (β puede corresponder a
la raya de la derecha). Entonces α > β ≥ γ. Esta desigualdad se basa en lo
siguiente: (i) las alturas de los secuentes que preceden inmediatamente a
dichas rayas horizontales tienen el mismo valor —llamémoslo ρ— en ✫ y
†;28 (ii) sobre la raya en ✫ hay una inferencia con conectivo más que sobre
28 En efecto, dicha altura es el grado más alto de un corte bajo esas rayas (como se recor-
dará, no hay ninguna inferencia inductiva bajo ellas). Ahora bien, salvo por el nuevo corte
con grado 0 entre [d2] y [e2], todos los cortes bajo [c2] reproducen cortes bajo [b1].
2.12 La prueba de Gentzen 448
cada una de las rayas en †; (iii) si el ordinal de la premisa de esa inferen-
cia con conectivo es µ, el de su raya horizontal es µ+1 y ese 1 adicional se
trasmite a través de las inferencias —todas estructurales— que llevan de las
conclusiones anotadas en [a1] a las anotadas en [b1]; (iv) dicha inferencia
con conectivo ha sido reemplazada en † con inferencias estructurales cuyas
rayas horizontales tienen el mismo ordinal que las respectivas premisas. Como
ahora veremos, la desigualdad α > β ≥ γ implica que el secuente Γ3 ➛ Θ3
en la línea [g2] tiene un ordinal menor que el secuente Γ3 ➛ Θ3 en la línea
[c1]. Este último es el primer secuente bajo el corte propio de la alianza de
la fórmula ∀ᒕᑠ cuya altura —llamémosla u— es menor que la altura r de
las premisas de ese corte. Como ✫ y † son iguales bajo dicho secuente Γ3
➛ Θ3 es claro que la altura de éste en [g2] también es u. Asimismo, u es la
altura del secuente Γ3, Γ3 ➛ Θ3, Θ3 en la línea [f2], puesto que entre [f2] y
[g2] no hay ningún corte o inferencia inductiva. Entre las líneas [e2] y [f2]
ocurre el nuevo corte. Sea t la altura de sus premisas. Es claro que u ≤ t.
Comprobemos que t < r. En efecto, o bien t = u < r, o bien t es igual al
grado de la formula ᑠ(ᒋ/ᒕ) cortada en el nuevo corte; ahora bien, r es ma-
yor o igual que el grado de ∀ᒕᑠ, el cual, por cierto, es mayor que el grado
de ᑠ(ᒋ/ᒕ). Supongamos por el momento que las diferencias entre las alturas
r, t y u son mínimas, esto es, que r = t + 1 y t = u. Como el ordinal de la
raya horizontal sobre la línea [c1] es α, el ordinal de Γ3 ➛ Θ3 en ✫ es ωα.
Como los ordinales de las rayas horizontales sobre [d2] son β y γ (β ≥ γ),
los ordinales de los secuentes en [d2] son ωβ y ωγ. Estos ordinales se trasmi-
ten inalterados a través de las permutaciones entre [d2] y [e2]. Por lo tanto,
una de las premisas del nuevo corte tiene el ordinal ωβ y la otra el ordinal
ωγ, de modo que el ordinal de la conclusión del nuevo corte es ωβ ⱅ ωγ,
igual al ordinal de Γ3 ➛ Θ3 en †. Ahora bien, α > β ≥ γ implica que ωα
> ωβ + ωγ = ωβ ⱅ ωγ.29 Si las diferencias entre las alturas r, t y u exceden
. . . ωα . . . ω β+ ω . . . ω γ
ω..ω > ω..ω
31 Se usa el 3 por la razón indicada en la nota 29: 3 es el más pequeño número natural
n tal que si a, b, c ∈ ˆ y a > b ≥ c, na ≥ n⋅nb > 2nb ≥ nb + nc. Como vimos, esta
desigualdad se invoca en una etapa del razonamiento.
32 Gentzen aparentemente alude a este resultado cuando observa que la inducción trans-
finita hasta un ordinal menor que ε0 se puede demostrar en su cálculo (1938, p. 43).
33 El resultado de Gentzen 1943 puede verse como una confirmación independiente de
2.12 La prueba de Gentzen 451
Gödel 1931, que ilustra “de un modo directo la incompletud del formalismo aritméti-
co” (Szabo 1969, p. 17). Después de Gentzen, Ackermann (1940) y Schütte (1951) han
publicado nuevas pruebas de la consistencia de la aritmética elemental que, por cierto,
también se valen de la inducción transfinita hasta ε0.
34 Hablando de la tesis intuicionista de que las proposiciones sobre el infinito actual ca-
recen de sentido y deben, por ende, rechazarse aunque sean consistentes, Gentzen de-
clara: “Creo, por ejemplo, que en la teoría general de conjuntos una investigación
2.12 La prueba de Gentzen 452
Por eso mismo, como luego veremos, pone gran empeño en convencernos
de que su prueba de consistencia sólo emplea razonamientos finitistas, con-
forme a las exigencias de Hilbert. Pero esa prueba debe juzgarse valiosa
también aparte de todo melindre metafísico, especialmente ahora que tantos
resultados matemáticos son el producto de computaciones electrónicas que
sólo pueden verificarse cotejándolas con otras computaciones. Tal cotejo sólo
certifica —o, mejor dicho, hace sumamente probable— que las computacio-
nes son correctas, que las máquinas que las ejecutaron no han cometido
errores en la ejecución de las instrucciones del programa. Pero el resultado
de una computación correcta puede ser incorrecto si el programa mismo es
la versión electrónica de un cálculo inconsistente. De ahí que sea importante
probar la consistencia del cálculo incorporado en el programa, con métodos
evidentes para nosotros, aunque no sean formalizables en ese cálculo.
Aunque las alegaciones de Gentzen no acaben de persuadirnos de que su
inducción transfinita merece llamarse ‘finita’ o siquiera ‘finitista’ (finit), ex-
plican con gran claridad por qué tiene que resultarnos —y de hecho nos
resulta— evidente. Gentzen admite que, a diferencia de todos los otros pa-
sos de su prueba, la inducción transfinita no es propiamente elemental. Por
eso “encaramos aquí una tarea de índole completamente distinta: lo esencial
no es demostrar la inducción transfinita —lo cual no es difícil y se puede
hacer de varias maneras— sino más bien demostrarla sobre una base
finitista,35 esto es, poner en claro que es un modo de inferencia acorde con
el principio de la concepción constructiva del infinito” (1938, p. 44). Para
que no quepa duda de esto, Gentzen subraya reiteradamente que sus ordinales
no son lo mismo que los ordinales de Cantor, sino unos objetos “formales”
—esto es, símbolos, figuras que pueden escribirse en un papel o en una pi-
zarra— definidos por él. Gentzen estima que su definición es estrictamente
constructiva: cada ordinal es una figura formada según reglas precisas con
los dos signos primarios 0 y ω. Dado un ordinal cualquiera α, sabemos cons-
truir su sucesor inmediato α + ω0. Pero ¿es justo llamar “constructivo” el
paso de cada sistema de ordinales ᑭn al sistema siguiente ᑭn+1? Dicho paso
presupone que los ordinales del sistema ᑭn ya estén definidos, y el número
de éstos es obviamente infinito (cf. p. 441, nota 23). Parecería que, contra-
riando el citado precepto de Gentzen, el sistema infinito ᑭn se tiene que con-
siderar aquí como cerrado, y no sólo como algo en devenir. Si este modo de
introducir sistema ᑭn+1 (para cada n ∈ ˆ) se ajusta a la “concepción construc-
tiva del infinito”, ¿en qué se aparta de ella la definición cantoriana de los
ordinales? Para responder a esta pregunta, conviene recordar los tres “prin-
cipios generadores” aducidos por Cantor (GA, pp. 195ss; vide supra, Capí-
tulo 2.5). El más aventurado de ellos, el principio “de inhibición o limita-
ción”, produce los ordinales cantorianos de las clases tercera y superior, y
por lo tanto no desempeña ningún papel en la definición de los ordinales de
Gentzen. Los otros dos presiden la generación (i) del ordinal siguiente a cada
ordinal dado y (ii) del ordinal límite de cada serie numerable infinita de
ordinales sucesivos. En virtud del isomorfismo entre los ordinales de Cantor
(< ε0) y los de Gentzen, es claro que éstos satisfacen tanto el principio (i)
como el principio (ii). Pero los ordinales de Gentzen no se generan según el
principio (ii) —que un finitista debiera cuestionar—, sino según una regla
que autoriza a escribir expresiones de la forma ωα1 + ωα2 +…+ ωαm con
cualquier número de exponentes αk seleccionados arbitrariamente en un sis-
tema de expresiones dado. Una regla como ésta, puramente sintáctica, es sin
duda constructiva. Para el finitista no hay pues ninguna dificultad en el trán-
sito de un sistema gentzeniano dado ᑭn al sistema siguiente ᑭn+1. Pero a la
luz de esta explicación resalta aún más la dificultad señalada arriba: si ex-
ceptuamos el sistema ᑭ0 cuyo único elemento es el objeto 0, ¿qué sistemas
de Gentzen están dados? El Axioma del Infinito de los conjuntistas nos da,
2.12 La prueba de Gentzen 454
por cierto, el sistema ᑭ1, y una vez que disponemos de él, no cuesta mucho
asegurarse los siguientes. Pero el Axioma del Infinito postula justamente un
agregado infinito actual, “cerrado y existente en sí”. ¿Puede uno aceptarlo y
seguir llamándose finitista? Y si uno acepta ese agregado y, como es habi-
tual, lo llama ω (en vez de concebir a este signo “de un modo enteramente
formal”, como pide Gentzen), ¿por qué inhibirse de aceptar Pω, P2ω,…,
Pωω,…? ¿Dónde se tira la raya?36
Después de Gentzen, la teoría de la prueba se consolida como una disci-
plina matemática que produce resultados interesantes mediante el análisis
combinatorio de la deducibilidad en los cálculos lógicos y las teorías mate-
máticas formalizadas en ellos (cf. los manuales de Schütte 1960 y Takeuti
1975); pero ya nadie la presenta a la manera de Hilbert como una fuente de
certeza filosóficamente incontrovertible, garantía de las ciencias y pilar de la
civilización (cf. p. 120, nota 10). En un artículo de enciclopedia publicado
en 1980,37 Schütte describe la teoría de la prueba (Beweistheorie) como una
de las divisiones de la “metamatemática” o investigación matemáticamente
exacta de teorías matemáticas formalizadas (se recordará que Hilbert usaba
Beweistheorie y Metamathematik como sinónimos). Schütte asigna a otra
división las cuestiones de computabilidad y decidibilidad que hemos visto
surgir de la problemática hilbertiana pero que ahora se estudian independien-
temente, en la teoría de las funciones recursivas y de los conjuntos recursi-
vamente enumerables (cf. los manuales de Rogers 1967 y Soare 1987), orien-
tada sobre todo hacia las “ciencias de la computación”. Por último, Schütte
incluye en la metamatemática una tercera división: “la teoría de modelos,
que se ocupa con las interpretaciones y las cuestiones de realizabilidad de
los sistemas de axiomas de la lógica y la matemática”. Como veremos en la
Parte 3, el enfoque y los métodos de la teoría de modelos han producido
desde los años 30 algunos hallazgos sumamente significativos para la filoso-
fía matemática conjuntista. Veremos allí que esta forma de “metamatemática”,
tal como la cultivan Tarski y Gödel, descarta el prejuicio finitista de Hibert
y aprovecha sin remilgos las facilidades de la teoría de conjuntos. En esta
38 Como ha dicho Boolos, “es apenas concebible que ZF sea inconsistente” (1987, en
Demopoulos, 1995, p. 219).
CUADRO 2
Γ1 ➛ (/), Θ1, ∀ (/), Γ2 ➛ Θ2 Γ1 ➛ Θ1, ∀ ∀, Γ2, (/) ➛ Θ2 [b2]
. . . .
.. .. .. ..
. . . .
..
..
..
..
..
..
..
.
..
..
..
..
..
..
..
..
.. .. .. ..
..
..
..
..
..
..
..
..
.. .. .. ..
..
..
..
..
..
..
..
.. ..
..
..
..
..
.. ..
Γ3 ➛ Θ3
.
..
.
..
..
..
..
..
..
..
..
➛
APÉNDICES
APÉNDICES
Demostraré aquí que las dos definiciones de conjunto bien ordenado que dio
Cantor son equivalentes (v. Capítulo 1.5). Recordemos que un conjunto M
es un conjunto linealmente ordenado si y sólo si hay una relación binaria <
definida sobre M, tal que si a, b y c son distintos elementos de M (i) o bien
a < b o bien b < a, pero nunca las dos cosas a la vez; (ii) si a < b y b < c,
a < c; y (iii) nunca ocurre que a < a.
Formularé las condiciones características de un conjunto bien ordenado
según ambas definiciones en un cálculo predicativo de primer orden con
identidad =, predicados binarios ∈, ⊆, <, y una constante individual M que
designa el conjunto de referencia.1 Para simplificar la escritura empleo
cuantificadores restringidos. Esto quiere decir que la expresión ‘(∀x⊆M)Φ(x)’
debe leerse ‘todo objeto x que sea parte de M satisface la condición Φ’ y la
expresión ‘(∃y∈x)Φ(y)’ debe leerse ‘hay un elemento y del conjunto x, tal
que Φ(y)’. (En suma, (∀x⊆M)Φ(x) y (∃y∈x)Φ(y) abrevian, respectivamen-
te, a ∀x(x ⊆ M → Φ(x)) y ∃y(y ∈ x ∧ Φ(y))).
459
Apéndices 460
II
(1) Sea u el primer elemento de K2 tal que, para todo z <1 x, u ≠ ƒz(z).
ƒx(x) = u.
(2) Para todo z <1x, ƒx(z) = ƒz(z).
(su alcance no puede ser igual a K2 ya que, por hipótesis, 〈K1,<1〉 y 〈K2,<2〉
no son isomórficos). En cambio, si ƒx no está definida para algún x ∈ K1 y
t es el primer elemento de K1 tal que ƒt no está definida, la aplicación ƒ: [t]
Æ K2; x Å ƒx(x) es un isomorfismo de un segmento de 〈K1,<1〉 en 〈K2,<2〉.
III
figurar en ella en un orden distinto del fijado por la relación <.2 Sea k0 el
índice más bajo asignado en esta lista a un sucesor de α0 (esto es: α0 < αk0,
y αk0 < αk sólo si k0 ≤ k). Sea kn +1 el índice más bajo asignado en la lista a
un sucesor de αkn (n ≥ 0). Entonces, la lista α0, αk0, αk1,… es una secuen-
cia infinita, ordenada por la relación <, de números de la Clase (II) ninguno
de los cuales sucede a todos los otros. Por lo tanto, existe un ordinal α, de
la Clase (II), que es el sucesor próximo de los ordinales contenidos en la
lista α0, αk0, αk1,… En otras palabras, existe un α tal que αkn < α para
todo n ≥ 0 y α es menor que cualquier otro ordinal —si lo hubiere— que
sea mayor que todos los ordinales en la lista α0, αk0, αk1,… Si α figurara
en la lista α0, α1, α2,… tendríamos que α = αk ≤ αkn para algún k y n ≥ 0.
Por lo tanto, α no pertenece al alcance de la aplicación n Å αn. En conse-
cuencia, dicha aplicación no es biyectiva. Este razonamiento vale para cual-
quier inyección de [ω] en la Clase (II). Por lo tanto, la Clase (II) es más
numerosa que [ω].
(ii) Sea K un conjunto infinito de ordinales de la Clase (II). Sea K′ = K ∪
[ω]. Entonces, por la Proposición 6 del Apéndice III, 〈K′,<〉 es un conjunto
bien ordenado isomórfico a 〈[ω1],<〉 o a un segmento [α] de 〈[ω1],<〉, donde
α es un ordinal de la Clase (II). En el primer caso, |K′| = |[ω1]| y |K| =
|[ω1]\[ω]|. En el segundo caso, |K| ≤ |K′| = |[α]| = ℵ0. Por lo tanto, no hay
un conjunto de ordinales de la Clase (II) que sea menos numeroso que la
Clase (II) pero más numeroso que la Clase (I).
2 En el orden fijado por la relación < hay muchos ordinales de la Clase II que no tienen
sucesor inmediato; pero en el orden de la lista α1, α2,…, cada ordinal αn tiene un
sucesor inmediato αn+1.
Apéndices 465
IV
EL ARGUMENTO DE BURALI-FORTI
4 〈O,<〉 cumple las condiciones BO1 y BO2, puesto que hay un primer ordinal y cada
ordinal tiene un sucesor inmediato (por P1). Para ver que 〈O,<〉 cumple además la con-
dición BF recuérdese que si α es un ordinal, α es el tipo de orden de una clase perfec-
tamente ordenada 〈M,P〉. Como 〈M,P〉 cumple la condición BF, si α tiene un predece-
sor inmediato en 〈O,<〉, hay un u ∈ M tal que el predecesor inmediato de α es el tipo
de orden de la clase perfectamente ordenada 〈M\{u},P〉. u tiene un predecesor inme-
diato en 〈M,P〉 y en virtud de la condición BF, M contiene una subclase finita {u0,
u1,…,un = u}, tal que u0 no tiene predecesor inmediato y, para cada entero k (0 ≤ k
≤ n), uk es el predecesor inmediato de uk+1. 〈M\{uk,uk+1,…,un},P〉 es una clase per-
fectamente ordenada. Sea βk su tipo de orden. Vemos entonces que O contiene una
subclase finita {β0, β1,…, βn = α}, tal que β0 no tiene predecesor inmediato y para
cada entero k (0 ≤ k ≤ n), βk es el predecesor inmediato de βk+1. Por lo tanto, 〈O,<〉
cumple la condición BF.
Apéndices 467
En vista del modo como se ha construido α′, es claro que no puede haber
un ordinal ξ mayor que α y menor que α′. Esta demostración de P1 no sería
aplicable a un ordinal α si α fuera el tipo de orden de la clase perfectamente
ordenada de todo lo que hay (si hubiera tal clase), pues entonces no habría
un objeto z que pudiera agregarse a dicha clase para construir otra con tipo
de orden α′ > α. Pero en la demostración del teorema se considera sólo el
tipo de orden de 〈O,<〉, y hay por cierto muchos objetos que no son ordinales
de Burali-Forti. Si q ∉ O, es posible extender de una manera obvia el orden
< a la clase O ∪ {q}. Entonces 〈O ∪ {q},<〉 tiene un tipo de orden κ tal que
κ ∈ O y κ > Ω.
La proposición P2 se establece así: Sea α el tipo de orden de la clase
perfectamente ordenada 〈A,R〉 y sea Ax = {z : z ∈ A ∧ ¬xRz}, para cualquier
x ∈ A. Entonces, la clase W = {Ax: x ∈ A} es una clase de clases per-
fectamente ordenadas, cada uno de cuyos elementos es una subclase de A.
Digamos que AxSAy si y sólo si xRy. W está ordenada por la relación S y las
clases ordenadas 〈W,S〉 y 〈A,R〉 son isomórficas. Por lo tanto, 〈W,S〉 es una
clase perfectamente ordenada con tipo de orden α. Sea [α] la clase de
ordinales {αx: x ∈ A y αx es el tipo de orden de 〈Ax,S〉}. [α] reune todos los
ordinales menores que α. Evidentemente, 〈[α],<〉 es una clase ordenada
isomórfica a 〈W,S〉. Por lo tanto, el tipo de orden de 〈[α],<〉 es α. Como 〈[α],<〉
es isomórfica a una parte de 〈O,<〉, es claro que α ≤ Ω.
Como ya habrá advertido el lector, la contradicción generada por Burali-
Forti para probar su teorema no tiene nada de paradójica. Como en cual-
quier reductio ad absurdum, la contradicción sirve eficazmente para refutar
la negación de la tesis que el autor se ha propuesto demostrar. El teorema
puede probarse también sin mencionar el tipo de orden Ω de la clase de los
ordinales de Burali-Forti. Basta tener presente que hay ordinales de Burali-
Forti que no son ordinales de Cantor. Sea 〈A,R〉 un conjunto bien ordenado
con tipo de orden α y sea 〈B,S〉 un conjunto perfectamente ordenado pero no
bien ordenado, con tipo de orden β. Supongamos que |B| < |A|. En tal caso,
〈A,R〉 no puede ser isomórfico a una parte de 〈B,S〉, de modo que α ≠ β y α
no es menor que β. Sea H ⊆ A tal que |H| = |B| y sea ƒ:H → B biyectiva. ƒ
no puede ser un isomorfismo entre 〈H,R〉 y 〈B,S〉, por cuanto 〈H,R〉 es un
conjunto bien ordenado (por la Proposición 6 del Apéndice II).5
5 Como 〈B,S〉, por hipótesis, no es un conjunto bien ordenado, hay un subconjunto no
vacío K ⊂ B que no tiene un primer elemento (en el orden S). El conjunto ƒ-1K de los
Apéndices 468
C1. M ∈ K.
C2. Si A ∈ K, A\ƒ ∈ K.
C3. Si H ⊆ K, πH ∈ K.
elementos de H que ƒ envía a K es una parte del conjunto bien ordenado 〈H,R〉 y por
lo tanto tiene un primer elemento u (en el orden S). Pero ƒ(u) no puede ser el primer
elemento de ƒ-1K y por lo tanto hay un v ∈ K tal que vSƒ(u). ƒ-1(v) ∈ ƒ-1K y si ƒ
fuera un isomorfismo, tendríamos que ƒ-1(v)Ru, contraviniendo el supuesto de que u es
el primer elemento de ƒ-1K.
Apéndices 469
6 Esta nomenclatura no está exenta de peligro. En la p. 109, línea 10 del texto original,
el tipógrafo de Mathematische Annalen escribió ‘M’ en lugar de ‘M’. El mismo error
se repite, triplicado, en la traducción inglesa de van Heijenoort. Espero que el invento
de la computadora de mesa, que me permite componer yo mismo este libro para la
imprenta a medida que lo voy redactando, protegerá al lector contra este riesgo.
Apéndices 470
∆ cumple, pues, todos los requisitos para ser una ƒ-cadena de M. Así queda
demostrado que ∆ = M. Escribo ‘Y ⊃ X’ para decir que Y incluye a X como
una parte propia (X ⊆ Y ∧ X ≠ Y). En virtud de la misma definición de ∆, es
claro que, si A y B son dos elementos distintos de ∆ = M, o bien A ⊃ B, o
bien A ⊃ B. M está, pues, ordenado linealmente por la relación ⊃. 〈M,⊃〉 es
un conjunto bien ordenado, puesto que cumple las condiciones BO1, BO2 y
BO3 del Apéndice I. En efecto, 〈M,⊃〉 tiene un primer elemento, a saber, M;
cada H ∈ M tiene un sucesor inmediato, a saber H\ƒ; por último, si F ⊂ M
tiene sucesores en 〈M,⊃〉 (vale decir, si ∅ ∉ F ), πF ∈ M es el sucesor
próximo de F.
Para demostrar que ƒ aplica M biyectivamente sobre M, Zermelo usa un
argumento muy ingenioso. Muestra primero que si ∅ ≠ P ⊆ M, hay un y
sólo un conjunto P0 ∈ M tal que ƒ(P0) ∈ P ⊆ P0. Reemplazando P por {k}
en este resultado preliminar, se sigue que, para cada k ∈ M hay un único K0
∈ M tal que ƒ(K0) ∈ {k} ⊆ K0, esto es, tal que ƒ(K0) = k. El resultado pre-
liminar se establece así: Sea ∅ ≠ P ⊆ M y P0 = π{X ∈ M : P ⊆ X}. P0 ∈
M (por C3) y ƒ(P0) ∈ P, ya que, si ƒ(P0) ∉ P, P ⊆ P0\{ƒ(P0)} y P0 no es
la intersección de todos los elementos de M que incluyen a P. Por otra parte,
si P ⊆ P1 ∈ M y P1 ≠ P0, P1 ⊃ P0, de modo que ƒ(P1) ∉ P0. Como P ⊆ P0,
ƒ(P1) ∉ P. Así, P0 resulta ser el único X ∈ M tal que ƒ(X) ∈ P ⊆ X.
Como el selector ƒ restringido a M es biyectivo, induce en M el buen
orden de 〈M,⊃〉, según expliqué en el Capitulo 1.7. Zermelo prueba además
que el buen orden determinado de este modo en un dado conjunto M por un
dado selector ƒ: PM → M es único. Supongamos, en efecto, que 〈M,<〉 es
un conjunto bien ordenado de tal modo que, para cada A ⊆ M, ƒ(A) es el
primer elemento de 〈A,<〉. Entonces, cada k ∈ M determina una parte de M
formada por k y sus sucesores. Sea Hk = {x ∈ M: k ≤ x}. Es claro que k =
ƒ(Hk). Sea H = {Hk: k ∈ M}. Para cada P ⊆ M hay un y sólo un HP ∈ H tal
que ƒ(P) = ƒ(HP). HP contiene el primer elemento de P y todos sus suceso-
res y, por ende, cumple la condición ƒ(HP) ∈ P ⊆ HP. No es difícil compro-
bar que H cumple las condiciones C1, C2 y C3. En otras palabras, H es una
ƒ-cadena de M. Sea M, como antes, la intersección de todas las ƒ-cadenas
de M. Sabemos que, si Z ∈ H, hay un y sólo un U ∈ M tal que ƒ(U) ∈ Z ⊆
U. Como M ⊆ H y Z mismo es el único X ∈ H tal que ƒ(X) ∈ Z ⊆ X,
tenemos que U = Z. Por lo tanto, H = M y el orden < es precisamente el
buen orden inducido en M por el selector ƒ restringido a M.
Apéndices 471
VI
Doy enseguida una traducción de los siete axiomas para la teoría de conjun-
tos formulados por Ernst Zermelo (1908b). En el artículo original el enun-
ciado de los axiomas está enmarcado en explicaciones que en lo esencial he
reproducido en la Sección 1.8.1. Allí traduje la definición del término definit
utilizado en el Axioma III. Es oportuno advertir que Zermelo escribe © en
vez de ⊆, 0 en vez de ∅, T en vez de PT, y T en vez de UT.
VII
pero enumerable de objetos distintos, a1, a 1‹ , a2, a‹2,…, ninguno de los cua-
les es un conjunto; (iii) el conjunto Z0 = {∅, {∅}, {{∅}},…} postulado
por el Axioma VII; (iv) el conjunto A = {{a1, a 1‹ }, {a2, a‹2},…}; y (v) to-
dos los conjuntos que existen en virtud de los Axiomas I–V si existen los
objetos descritos en las cuatro cláusulas anteriores. Todos los objetos de D,
excepto los mencionados en la cláusula (ii), son conjuntos y pueden cons-
truirse a partir de los “objetos primitivos” mencionados en las cláusulas (i),
(ii) y (iii) mediante un número finito de aplicaciones de los Axiomas I–V.
Para facilitar la exposición, Fraenkel introduce algunos términos. El con-
junto {ak, a k‹ } se llama la celda Ak, con elementos conjugados ak y ak‹ (k ≥ 1).
Un conjunto principal es un conjunto que difiere de A a lo sumo por la
ausencia de un número finito de celdas. Si M es un conjunto cualquiera, el
conjunto M‹ k conjugado con M respecto de la celda Ak es el conjunto que
difiere de M solamente en cuanto cada elemento de Ak que entra en la cons-
trucción de M ha sido sustituido por su elemento conjugado. Si M = M‹ k,
decimos que M es simétrico respecto de Ak. Si el conjunto M es simétrico
respecto de todas las celdas de un conjunto principal diré que M es idóneo
(Fraenkel no se vale de este término). Es fácil ver que todos los objetos
primitivos postulados en las cláusulas (i)–(iii) son idóneos: en efecto, cual-
quiera que sea el entero positivo k, un intercambio entre ak y ak‹ en nada
afecta a los conjuntos ∅, Z0 y A; por su parte, ak y ak‹ son obviamente simé-
tricos respecto de todas las celdas del conjunto principal A\{ak, a k‹ }. Diré
asimismo que una función ϕ (en el sentido de Fraenkel 1922a explicado en
la Sección 1.8.2) es idónea si existe un conjunto principal Bϕ tal que, para
todo k ≥ 1, si Ak ∈ Bϕ, entonces, para todo x, ϕ(x k‹ ) es el conjunto conjugado
con ϕ(x) respecto de Ak.
La falsedad del Axioma de Selección en el modelo propuesto es una con-
secuencia inmediata de la siguiente “proposición fundamental”, verdadera en
dicho modelo:
No es difícil probar que los cinco lemas son verdaderos en el modelo con-
siderado (de hecho, Fraenkel sólo estima necesario dar pruebas del II y el
IV). PF se deriva luego por inducción sobre la “clase” de cada objeto o fun-
ción de D. Este concepto de “clase” se define recursivamente así:
VIII
9 Acabamos de ver una definición recursiva (de ‘clase’) en el Apéndice VII. Hay otras
dos en las pp. 78 y 81. El Apéndice IX contiene definiciones recursivas de ‘término’,
‘predicado’, ‘fórmula’, ‘verdad/falsedad’ de una fórmula en una interpretación, etc. Con-
viene examinar dichos ejemplos a la luz de la explicación que doy aquí.
10 Una relación diádica R se dice funcional si la conjunción Rxy ∧ Rxz implica que y = z;
en otras palabras, si la relación R admite un solo terminus ad quem para cada terminus
a quo.
Apéndices 477
12 Por cierto, podría representársela también, más sencillamente, mediante una aplicación
ψ: → tal que ψ(0) = C0 y, para cada ordinal ξ > 0, Cξ = ψ(Cζ: ζ ∈ ξ). La
representación arriba descrita fue elegida por von Neumann con vistas a la demostra-
ción del TDIT.
13 Recuérdese que F(ƒξ,ξ) = {〈ζ,ƒξ(ζ)〉: ζ ∈ ξ}, de suerte que esta expresión está bien
definida si ƒξ es una aplicación definida en ξ.
Apéndices 479
14 Von Neumann dedica una larga nota a demostrar, en términos adaptables a la teoría
axiomática ZF, que la aplicación ξ → B definida por ζ Å ƒξ(ζ) = ϕ(F(ƒζ,ζ),ζ) efecti-
vamente existe si todo ζ < ξ es normal (1928a, pp. 389s., n. 28). Pero a la luz de lo
que llevamos dicho su existencia debiera resultar obvia desde un punto de vista “inge-
nuo”.
Apéndices 480
IX
EL CÁLCULO PREDICATIVO
A. SINTAXIS
Las expresiones del CP1 están formadas por secuencias finitas o filas de sig-
nos tomados de una lista finita o alfabeto de ideogramas y letras.15 Si la fila
η es una secuencia de n signos (n ≥ 0), decimos que n es la longitud de η;
simbólicamente, Λ(η) = n. Decimos que la fila η es más breve que la fila ζ,
si Λ(η) < Λ(ζ). Si Λ(η) = m y Λ(ζ) = n, η¥ζ es la fila de longitud m + n
cuyo h-ésimo signo es el h-ésimo signo de η (1 ≤ h ≤ m) y cuyo (m+k)-ésimo
signo es el k-ésimo signo de ζ (1 ≤ k ≤ n). En vez de η¥ζ escribiré simple-
mente ηζ.
15 Algunos autores dicen ‘cuerda’ de signos en vez de ‘fila’, pero me parece esa una tra-
ducción demasiado literal y poco expresiva del término inglés ‘string’.
Apéndices 482
cálculo representa una colección infinita de filas de signos del cálculo, espe-
cificada por la estructura de Φ. Por ejemplo, la fila (α → ∀β) representa
todas las filas de signos del cálculo que empiezan con (, terminan con ) y
contienen la fila →∀ entre dos filas cualesquiera (de longitud ≥ 0). Cuando
atribuyo propiedades sintácticas o semánticas a una tal fila Φ, debe enten-
derse que la aseveración se refiere a cada fila representada por Φ.]
Una versión del CP1 incluye siempre todas las variables y todos los predi-
cados 0-ádicos.16 Incluye además una parte de las constantes y una parte de
los predicados n-ádicos para uno o más valores de n > 0. (Las partes en
cuestión pueden ser propias o impropias y aun vacías). El conjunto de las
constantes y predicados n-ádicos (n > 0) de una dada versión del CP1 cons-
tituye lo que llamaré el léxico de esa versión. Obsérvese que cada versión se
16 Como se verá en la sección C. Tautologías, los predicados 0-ádicos sirven para repre-
sentar fórmulas indeterminadas y, por ende, las proposiciones expresables con ellas.
De ahí el nombre de variables proposicionales que, como dije, suele dárseles (con cierta
impropiedad). Por eso también se llama Cálculo proposicional al fragmento del cálcu-
lo predicativo que puede construirse utilizando solamente predicados 0-ádicos, conectivos
y paréntesis (estos son los únicos ingredientes de las fórmulas del CP1 que llamaré
verifuncionales; véase su definición en la sección C).
Apéndices 483
distingue de las demás únicamente por su léxico.17 Una versión del CP1 con
léxico L1 es una extensión de otra con léxico L2 si y sólo si L2 ⊆ L1. La
versión cuyo léxico contiene todas las constantes y todos los predicados n-
ádicos (n > 0) del CP1 es la máxima extensión posible de cualquier otra
versión. La llamo la versión máxima del CP1. Su léxico, Lmax, es el léxico
máximo.
Sean η y ζ dos filas de signos (posiblemente de longitud 0) y sea θ la fila
η¥α¥ζ, donde α es una variable, una constante o un predicado. Suponga-
mos que ζ no comienza con un palote ni con un asterisco. Diremos entonces
que la fila ζ determina una posición en θ y que α figura en θ en la posición
determinada por ζ, o que α ocupa en θ la posición que precede a ζ.18 Una
misma variable, constante o predicado puede figurar en varias posiciones en
una fila dada; estas posiciones se numeran —primera, segunda, tercera,…—
según decrece la longitud de la fila que las determina.
[F¬] ¬α
[F→] (α → β)
[F∀] ∀ξα
17 Chang y Keisler, en su espléndida Model Theory (tercera edición, 1990), llaman ‘len-
guaje’ (language) a lo que yo llamo ‘léxico’. Ambas denominaciones se salen del uso
común del respectivo vocablo, pero la adoptada por ellos me parece menos afortunada:
si aprendo una palabra castellana que antes desconocía y al mismo tiempo me olvido
de otra, no diríamos que he cambiado de lenguaje sino que ha variado mi léxico.
18 Exigimos que ζ no comience con palote ni asterisco para que no se pueda decir que la
variable (constante, predicado) α figura en una cierta posición en θ cuando aparece allí
formando parte de otra variable (constante, predicado). Conforme a nuestra estipula-
ción, el predicado P** no figura en ninguna posición en la fórmula P***xııxıxııı y la
variable xı figura en una sola, a saber, la determinada por la fila xııı.
Apéndices 484
das de la regla [F∀], puede obviamente ocurrir que una fórmula dada con-
tenga más de un cuantificador que ligue a la misma variable. Sea β una fór-
mula en que figura una variable ξ. Ésta puede ocupar tres tipos de posicio-
nes en β: (A) inmediatamente a la derecha de un signo de cuantificación;
(B) dentro del alcance de uno o más cuantificadores que ligan a ξ; (C) fuera
de todo cuantificador y también fuera del alcance de todo cuantificador que
ligue a ξ. Diremos que ξ está libre en β en cada posición del tipo C y que
tal posición es una posición libre de ξ en β. Diremos que ξ está ligada por
un determinado cuantificador que liga a ξ (i) en la posición que ocupa den-
tro de él y (ii) en cada una de sus posiciones libres dentro del alcance de ese
cuantificador.19 Una fórmula que contiene una o más variables libres se dice
abierta. Una fórmula que no contiene ninguna variable en una posición libre
se dice cerrada. La clausura universal de una fórmula α que contiene las
variables libres ξ1,…,ξn (numeradas según el orden de su primera apari-
ción en α) es la fórmula cerrada ∀ξ1…∀ξnα.
Si α y β son fórmulas, decimos que β es una subfórmula de α si α =
η¥β¥ζ, donde η y ζ son filas de signos (posiblemente de longitud 0) y ζ no
empieza con un palote o un asterisco.20 En tal caso, decimos también que β
ocupa en α la posición determinada por ζ, o que precede a ζ.
A veces hay que reemplazar en una fórmula dada una cierta variable libre
por otro término (variable o constante). Nos conviene tener una expresión
simbólica concisa que denote en nuestro idioma el producto de esta opera-
ción. Para evitar repeticiones, definiré tal expresión de modo que nos sirva
no sólo mientras hablamos del CP1, en que todo término es idéntico a una
constante o a una variable, sino también más tarde, al hablar de cálculos
(como el CP1=) en que los términos pueden ser expresiones más complejas.
Sea ϕ una fórmula, ξ una variable y τ un término del cálculo estudiado.
Consideremos primero un caso sencillo: ninguna posición libre de ξ en ϕ
está situada dentro del alcance de un cuantificador que ligue alguna de las
B. SEMÁNTICA
C. TAUTOLOGÍAS
D. ACLARACIONES Y ABREVIATURAS
a0, a1, a2, a3; y cualquier mayúscula cursiva, sin subíndice ni exponente, en
vez de P seguida de astericos y palotes.
Otras abreviaturas, combinadas con las reglas semánticas antedichas, englo-
ban ciertas ideas lógicas corrientes. Por ejemplo, es claro que la fórmula
¬∀x¬P**xa es verdadera en la interpretación 〈D,ƒ〉 si y sólo si hay por lo
menos un objeto en D que tiene con el objeto llamado a la relación desig-
nada por P**. Como esta condición es fácilmente comprensible por sí mis-
ma, se adopta la fila ‘∃ξ’ como abreviatura para representar a la fila ‘¬∀ξ¬’,
que forman el signo de negación ¬, seguido por el signo de cuantificación
universal ∀, seguido por una variable ξ, seguida por el signo de negación ¬.
Se estipula asímismo que, si α y β son fórmulas, la fórmula (¬α → β) se
abrevia (α ∨ β), la fórmula ¬(α → ¬β) se abrevia (α ∧ β) y la fórmula
¬((α → β) → ¬(α → β)) se abrevia (α ↔ β). Si el lector no está familia-
rizado con el tema, debe armarse ahora de papel y lápiz y verificar que las
reglas semánticas del CP1 implican que:
Una escritura conceptual sirve para expresar las matemáticas sólo si en ella
se puede decir, llegado el caso, que tal objeto es el (único) valor de una
cierta función para un dado argumento; por ejemplo, que 12 es la suma de 7
y 5. En el CP1 esto es posible si reservamos un predicado diádico para re-
presentar la relación de identidad, representamos mediante predicados (n+1)-
ádicos las funciones —o, más generalmente, las aplicaciones— cuyos argu-
mentos son n-tuplos, y acompañamos cada uso de estos predicados de una o
más aseveraciones que los caractericen como tales. Pero este procedimiento
no es cómodo. Así, por ejemplo, si abreviamos con I el predicado diádico
con que representaremos la identidad, tenemos que postular, para cada fór-
mula α, la aseveración ∀x∀y(Ixy → (α ↔ αx/y)). Si F es un predicado triádico
elegido para representar una aplicación cuyo dominio es un conjunto de pares,
hay que incluir la condición ∀x∀y∀z(Fxyz → ∀w(Fxyw → Izw)). Más prác-
tico y, en cierto modo, más natural, es agregar al alfabeto del CP1 un ideo-
grama que signifique la identidad y un método para construir términos que
denoten el valor de aplicaciones en cada argumento dado y postular nuevas
reglas sintácticas y semánticas que gobiernen el uso de estos signos. Llama-
ré cálculo predicativo con identidad o CP1= a la escritura conceptual así
ampliada. He aquí la gramática del CP1=:
Apéndices 492
Vocabulario.
(i) Functores: Distinguimos, para cada entero positivo n ≥ 1, la clase de
los functores n-arios. f* —la letra f seguida de un asterisco— es un
functor 1-ario. Si ϕ es un functor n-ario (n ≥ 1), ϕı es un functor n-
ario. Si ϕ es un functor n-ario que no contiene palotes, ϕ* es un functor
(n+1)-ario.
(ii) Términos: Las variables y constantes del CP1= se definen como las
del CP1. Además, cualquier functor n-ario seguido de n términos es un
término.
(iii) Predicados: Se definen como en el CP1.
Fórmulas. A las reglas de formación de fórmulas propias del CP1 hay que
agregar la siguiente: Si τ y σ son términos, la fila de signos descrita a conti-
nuación es una fórmula simple:
[F=] (τ = σ)
Semántica. Sea CP1=† una versión del cálculo predicativo de primer orden
con identidad. Sea 〈D,ƒ〉 una interpretación de CP1=†. Sea V el conjunto
de los functores, variables, constantes y predicados de CP1=†. Se mantie-
nen todas las reglas semánticas que dimos para CP1†, excepto [Iτ] que se
reemplaza por la regla [I′τ] enunciada abajo. Además, se agregan las reglas
[I0] y [I=]. Las nuevas reglas determinan la interpretación de los términos
precedidos por functores y de las fórmulas construidas según la regla [F=].
[I0] Para todo functor n-ario ϕ ∈ V, ƒ(ϕ) es una aplicación cuyo domi-
nio es el producto cartesiano de n partes de D —no necesariamente
distintas— no vacías y bien definidas, y cuyo codominio es una parte
Apéndices 493
bien definida de D.
[I′τ] Si τ es una variable o una constante, ƒ(τ) ∈ D. Si τ es un término
formado por un functor n-ario ϕ seguido de n términos σ1,…,σn,
entonces (i) si 〈ƒ(σ1),…,ƒ(σn)〉 pertenece al dominio de ƒ(ϕ), ƒ(τ)
es el valor de la aplicación ƒ(ϕ) en el argumento 〈ƒ(σ1), …,ƒ(σn)〉;
y (ii) si 〈ƒ(σ1),…,ƒ(σn)〉 no pertenece al dominio de ƒ(ϕ), ƒ(τ) no
está definida.
[I=] Si α es la fórmula (τ = σ), ƒ(α) = 0 si ƒ(τ) = ƒ(σ) y ƒ(α) = 1 si
ƒ(τ) ≠ ƒ(σ).23
F. DECISIÓN Y DEDUCCIÓN
23 El lector alerta advertirá que en el enunciado de la regla [I=] el signo ‘=’ que figura
entre τ y σ no es igual al signo ‘=’ que figura tres veces después de la coma. El signo
más largo es el signo de igualdad del CP1=; el signo más breve es el familiar signo
de igualdad común al castellano y los demás idiomas modernos. Este distingo no se
observa en la mayor parte de este libro, en que el signo corriente ‘=’ se emplea como
signo de igualdad en cualquier contexto, sea formal o informal. Con todo, uso el signo
de igualdad largo cuando me refiero a la versión final de la escritura conceptual BS de
Frege (Capitulo 2.2, Sección 2.3.3 y Apéndice XII), en la cual dicho signo representa
a la vez la identidad entre objetos y la equivalencia entre oraciones (la cual presupone
la identidad de sus valores veritativos).
Apéndices 494
o infinito, pero en todo caso tiene que haber un procedimiento que permita
decidir, por la sola inspección visual de una fórmula, si ella es o no es un
axioma. Por ejemplo, podemos estipular que cualquier fórmula obtenida re-
emplazando α por una fórmula del cálculo en la fila de signos (α ∨ ¬α) es
un axioma. Una regla de inferencia n–aria (n ≥ 1) es una receta para asociar
una fórmula llamada conclusión a un n-tuplo de fórmulas llamadas premisas,
atendiendo exclusivamente al aspecto visual de éstas y aquélla. Esto quiere
decir que cada regla n–aria R provee un algoritmo para decidir si una fór-
mula dada es o no una conclusión, según R, de un cierto n-tuplo de premisas.
Por ejemplo, la regla de inferencia por modus ponens prescribe que, si α y
β son dos fórmulas cualesquiera, β se puede asociar como conclusión al par
de premisas 〈α, (α → β)〉;26 y obviamente, basta deletrear un trío cualquiera
de fórmulas para constatar si una de ellas es o no la conclusión por modus
ponens de las otras dos.
Una vez que el cálculo se ha organizado como sistema deductivo, se pue-
de definir lo que llamaremos una deducción o prueba. Sea H un conjunto de
fórmulas. Una lista finita de fórmulas α1,…, αn constituye una prueba de
la fórmula αn a partir de las hipótesis H si, para cada k (1 ≤ k ≤ n), o bien
αk ∈ H, o bien αk es un axioma, o bien hay una regla de inferencia r-aria (r
< k) que asocia αk como conclusión a un r-tuplo de premisas contenidas en
la lista α1,…, αk-1. Si H = ∅, decimos simplemente que α1,…, αn es
una prueba de αn. A la luz de esta definición es claro que, dada la índole de
los axiomas y las reglas de inferencia, hay un algoritmo para decidir si la
lista α1,…, αn constituye o no una prueba de αn a partir de determinadas
hipótesis. Si hay una prueba de la fórmula α a partir de las hipótesis H
decimos que, en el sistema deductivo adoptado, α se deduce de H o es de-
ducible de H; simbólicamente: H ∂α. Si los axiomas se eligen entre las fór-
mulas de validez conocida, y las reglas de inferencia se diseñan de modo
que la conclusión sea siempre una consecuencia lógica de las premisas, di-
remos que el sistema deductivo es correcto. En tal caso, como es obvio, α
se deduce de H sólo si α es una consecuencia lógica de H (H ∂α sólo si
26 Recuérdese que según la convención adoptada ‘(α → β)’ designa la fila de signos que
forman el paréntesis izquierdo, seguido por la fila α, seguida por la flecha, seguida por
la fila β, seguida por el paréntesis derecho.
Apéndices 496
27 Como bien observa Gentzen, “una prueba matemática no está, en general, construida
de un modo tan simple, que en ella se avance, mediante inferencias, de aseveraciones
válidas a nuevas aseveraciones válidas. Ocurre también que una aseveración se supone
válida y de ella se infieren nuevas aseveraciones cuya validez depende entonces de la
validez de esa suposición” (1935, p. 511).
Apéndices 497
CP1 separadas por comas, seguida del signo ➛, seguida de una fórmula del
CP1.28 Las fórmulas que preceden al signo ➛ son las prefórmulas del
secuente; la fórmula precedida por el signo ➛ es la posfórmula. La semán-
tica de los secuentes es muy simple. Consideremos una determinada versión
del CP1. Sea ϕ una fórmula de esa versión y Γ una fila de fórmulas separa-
das por comas. El secuente Γ ➛ ϕ es válido si y sólo si ϕ es verdadero en
cada interpretación (de la versión considerada) en que ninguna de las fórmu-
las de Γ sea falsa. En virtud de esto, las prefórmulas de un secuente válido
representan hipótesis cuya verdad en una interpretación dada asegura la ver-
dad —en esa misma interpretación— de la aseveración representada por la
posfórmula.
Llamo secuente básico a cualquier secuente de la forma ϕ ➛ ϕ, donde ϕ
es una fórmula cualquiera. Cada secuente básico es válido de un modo tri-
vial y puede usarse como axioma en las deducciones. No se admiten otros
axiomas lógicos. El poder deductivo del sistema radica, pues, enteramente
en sus reglas de inferencia. Cada regla de inferencia determina una relación
entre una, dos o tres premisas y una conclusión. Llamo inferencia al conjun-
to ordenado que forman premisa(s) y conclusión. Distinguimos (i) reglas
estructurales (que llevan de una premisa con cierta estructura secuencial a
una conclusión de estructura diferente), (ii) reglas de eliminación e intro-
ducción de los conectivos binarios y los signos de cuantificación y (iii) dos
reglas peculiares a la negación. En la siguiente formulación esquemática de
las reglas de inferencia, las letras griegas mayúsculas Γ y ∆ representan filas
—posiblemente vacías— de fórmulas separadas por comas, las minúsculas
ϕ, χ, ψ representan fórmulas, la minúscula τ representa un término, las mi-
núsculas ξ y η representan variables, y los signos lógicos y de puntuación
están, como de costumbre, representados por ellos mismos. Cada regla se
presenta mediante una figura con una raya horizontal en el centro; el esque-
ma de la o las premisas va sobre la raya, el esquema de la conclusión bajo
la raya. Las inferencias por eliminación de ∧ e introducción de ∨ tienen dos
figuras cada una.
28 Gentzen dice ‘Sequenz’, que es la forma alemana de la misma palabra latina que en
nuestro idioma se ha convertido en ‘secuencia’. Pero lo que nosotros llamamos ‘se-
cuencia’ se llama ‘Folge’ en alemán. Por eso digo ‘secuente’ por ‘Sequenz’, siguiendo
el ejemplo de los escritores de habla inglesa, que dicen ‘sequent’ (no ‘sequence’).
Apéndices 498
Reglas estructurales:
DEBILITAMIENTO CONTRACCIÓN PERMUTACIÓN
Γ➛χ ϕ, ϕ, Γ ➛ χ Γ, ϕ, ψ, ∆ ➛ χ
ϕ, Γ ➛ χ ϕ, Γ ➛ χ Γ, ψ, ϕ, ∆ ➛ χ
→ ϕ, Γ ➛ ψ Γ➛ϕ ∆ ➛ (ϕ → ψ)
Γ ➛ (ϕ → ψ) Γ, ∆ ➛ ψ
∀ Γ ➛ ϕη/ξ Γ ➛ ∀ξϕ
Γ ➛ ∀ξϕ Γ ➛ ϕτ/ξ
siempre que η no figure en Γ ni en ∀ξϕ donde τ es un término cualquiera
Reglas de la negación:
REFUTACIÓN ELIMINACIÓN DE ¬¬
ϕ, Γ ➛ ψ ϕ, ∆ ➛ ¬ψ Γ ➛ ¬¬ϕ
Γ, ∆ ➛ ¬ϕ Γ➛ψ
Apéndices 499
(1) P➛P SB
(2) P1,P ➛ P Debilit., (1)
(3) P ➛ (P1 → P) Int. →, (2)
(4) ➛ (P → (P1 → P)) Int. →, (3)
I. ALCANCES
¬∀x1(P3x1x2x3 ∨ ∃x2¬P2x2f2x1x3).29
29 Solución en la p. 540.
Apéndices 502
J. OMISIÓN DE PARÉNTESIS
AXIOMAS DE LA LÓGICA
(FREGE 1879)
!$$ a
%^ b
^@ a (1 (1.
14™$2$2¤ a
º 5º%ºº^2¤ c
º 5º^$™¤2¤ b
º5ººººº^2¤™¤ c
º6™$$@ a
ºººº %^@ b
^@™™™™ c (2 (2.
1$$2$2 a
%% ^2 d
%^@™2™ b
^$$@ aº
º ºº %^@ b
6@™™™™™ d (8 (8.
!$$# b
%^# a
^$™¤2 a
ºººº º^2¤™ b (28 (28.
!2$@™ a
^33™ a (31 (31.
!2$33™ a
^@™ a (41 (41.
!$$ ƒ(d)
%^ ƒ(c)
^@ c ∫ d (52 (52.
XI
30 Obsérvese que Dedekind usa aquí ya en 1888 el método de diagonalización que Can-
tor hará famoso con su segunda —y más conocida— prueba de la indenumerabilidad
del continuo de 1890/91. Por lo demás, ese método había sido empleado antes por du
Bois- Reymond (1875); vide supra p. 43, nota 11.
31 Como ψσ(n) concuerda con ψn en Zn, para cada n ∈ ˆ, resulta que ψn es precisamente
la restricción de ψ a Zn.
Apéndices 506
Adición. En virtud del TDI existe, para cada n ∈ ˆ, una y sólo una aplica-
ción σn: ˆ Æ ˆ, tal que σn(0) = n y σnσ = σσn. En particular, σ0 es la
identidad en ˆ, Iˆ: x Å x, pues ésta es la única aplicación de ˆ Æ ˆ que
conmuta con σ y asigna el valor 0 al argumento 0. La adición queda enton-
ces definida inequívocamente por la condición: n + m = σm(n). Probaremos
por inducción que, para todo m, n ∈ ˆ, σ(n + m) = n + σ(m).
[T] σσm(n) = σσ(m)(n).
[B] Es claro que σσ(m)(0) = σ(m) = σσm(0).
[P] Si σ(n + m) = σσm(n) = σσ(m)(n) = n + σ(m), entonces σ(σ(n) + m)
= σσmσ(n) = σσσm(n) = σσσ(m)(n) = σσ(m)σ(n) = (σ(n) + σ(m)).
Por lo tanto, σ(n + m) = n + σ(m), para todo n, cualquiera que sea m. Si
ponemos m = 0, comprobamos que σσ(0) = σσ0 = σ.
La adición es asociativa.
[T] Si a, b y n son cualesquiera elementos de ˆ, entonces
(a + b) + n = a + (b + n).
[B] (a + b) + 0 = a + b = a + (b + 0)
[P] Si (a + b) + n = a + (b + n), entonces (a + b) + σ(n) =
σ((a + b) + n ) = σ(a + (b + n)) = a + σ(b + n) = a + (b + σ(n)).
Por lo tanto, la adición es asociativa.
La adición es conmutativa.
[T] Si a y n son cualesquiera elementos de ˆ, a + n = n + a.
[B] a + 0 = σ0(a) = a = σa(0) = 0 + a.
[P] Si a + n = n + a, esto es, si σnσa(0) = σaσn(0), tenemos que
a + σ(n) = σσnσa(0) = σσaσn(0) = σaσσn(0) = σ(n) + a.
Por lo tanto, la adición es conmutativa.33
33 Como Dedekind cuenta “uno, dos, tres,…”, tiene que definir la adición de modo que
el elemento básico sumado a cualquier n no dé n sino el siguiente de n. Sea pues el
sistema simplemente infinito ˆ ordenado por la aplicación σ la serie numérica repre-
sentativa elegida por Dedekind, y designemos con 1 su elemento básico. Dedekind
considera para cada n ∈ ˆ la única aplicación ϕn: ˆ Æ ˆ, tal que ϕn(1) = σ(n) y ϕnσ
= σϕn. Obviamente, ϕ1 = σ. La adición se define por la condición m + n = ϕn(m), la
cual implica que (i) m + 1 = σ(m) y (ii) σ(m + n) = m + σ(n). La conmutatividad y
asociatividad de la adición pueden establecerse entonces como arriba.
Apéndices 508
La multiplicación es distributiva.
[T] n × (a + b) = (n × a) + (n × b).
[B] 0 × (a + b) = 0 = (0 × a) + (0 × b).
[P] Si n × (a + b) = (n × a) + (n × b), σ(n) × (a + b) = χa+bσ(n) =
σa+bχa+b(n) = (n × (a + b)) + a + b = (n × a) + (n × b) + a + b =
(n × a) + a + (n × b) + b =, σaχa(n) + σbχb(n) = χaσ(n) + χbσ(n) =
(σ(n) × a) +(σ(n) × b).
Por lo tanto, la multiplicación es distributiva (con respecto a la adición).
La multiplicación es conmutativa.
[T] n × a = a × n.
[B] 0 × a = 0 = a × 0.
[P] Si n × a = a × n, σ(n) × a = χaσ(n) = σaχa(n) = (n × a) + a =
(a × n) + (a × σ(0)) = a × (n + σ(0)) = a × σ(n).
Por lo tanto, la multiplicación es conmutativa.
La multiplicación es asociativa.
[T] n × (a × b) = (n × a) × b.
[B] 0 × (a × b) = 0 = (0 × a) × b
[P] Si n × (a × b) = (n × a) × b, σn × (a × b) = χa×bσ(n) = σa×bχa×b(n) =
(n × (a × b)) + (a × b) = ((n × a) × b) + (a × b) = (b × (n × a)) + (b ×
a) = b × ((n × a) + a) = b × ((a × n) + (a × σ(0)) =
b × (a × (n + σ(0))) = b × (a × σ(n)) = ((σ(n) × a) × b.
Por lo tanto, la multiplicación es asociativa.
34 Por una parte, χ0σ(n) = σ0χ0(n) = χ0(n) + 0 = χ0(n) = 0, puesto que χ0(0) = 0. Por
otra parte, χσ(0)(σ(0)) = σ(0) y si χσ(0)(n) = n, entonces χσ(0)σ(n) = σσ(0)χσ(0)(n) =
σσ0χσ(0)(n) = σχσ(0)(n) = σ(n).
Apéndices 509
XII
EXTENSIÓN Y RECORRIDO
(FREGE 1891, 1893)
en el sentido de Frege— del concepto expresado por la letra F.35 Con todo,
las explicaciones que rodean la introducción del nuevo recurso expresivo
parecen indicar que, en su obra madura, Frege no entiende el término ‘ex-
tensión de un concepto’ en la acepción tradicional arriba señalada.
Como indiqué en el Capítulo 2.2, desde 1891 Frege entiende que los
conceptos constituyen una especie del género función. Un concepto es una
función que asigna a cada objeto del universo uno de los dos valores v (“lo
verdadero”) o f (“lo falso”). Frege supone que cada función esta asociada a
un objeto característico, que llamaré su recorrido (Frege dice Wertverlauf,
literalmente, “recorrido del valor”). Frege no explica en qué consiste el re-
corrido de una función. Se limita a decir que “emplea universalmente las
palabras ‘la función Φ(ξ) tiene el mismo recorrido que la función Ψ(ξ)’ como
sinónimas de las palabras ‘las funciones Φ(ξ) y Ψ(ξ) tienen siempre valores
iguales para argumentos iguales’” (1893, p. 7). La notación §Φ(e) se intro-
duce precisamente para designar el recorrido de la función Φ (1891, p. 10).36
Frege adopta la siguiente convención léxica: “Podemos designar como
extensión de un concepto (Begriffsumfang) al recorrido de una función cuyo
valor para cada argumento es un valor veritativo (Wahrheitswert)”, esto es,
uno de los objetos v o f (1891, p. 16). En virtud de ella, si la función Φ es
un concepto, la expresión ‘§Φ(e)’ denota su extensión —en el nuevo sentido
fregeano— mas no parece que ésta pueda identificarse con la colección de
todas las cosas que caen bajo ese concepto.
Las funciones fregeanas son, como sabemos, aplicaciones del universo de
objetos en sí mismo. La equivalencia §Φ(e) = §Ψ(e) ↔ ∀x(Φ(x) ↔ Ψ(x))
sugiere, pues, que el recorrido de la función Φ es lo que hoy llamaríamos su
grafo, esto es, el conjunto de todos los pares 〈x, Φ(x)〉 que se forman toman-
Ella incorpora formalmente al sistema la notación ‘\ξ’ que Frege 1893, p. 19, explica
informalmente en estos términos:
Distinguimos dos casos:
1) Si, para el argumento [de la función \ξ] existe un objeto ∆ tal que \§(∆ = ε)
sea el argumento, entonces ∆ mismo es el valor de la función \ξ.
2) Si para el argumento [de la función \ξ] no existe ningún objeto ∆ tal que \§(∆
= ε) sea el argumento, entonces el argumento mismo es el valor de la función \ξ.
Apéndices 512
Invocando los análogos de segundo orden de los esquemas (12) y (7) del
Apéndice XIII, derivamos de (6) la proposición (7), que Frege deriva directa-
mente de (5):
Por otra parte, mediante una simple aplicación del Axioma IIb de Frege 1893
(que es la versión de segundo orden del Axioma 58 de Frege 1879, reprodu-
cido arriba en la p. 503), obtenemos:
∀G(§Ge = k → Gk) →
(§(¬∀G(§Ge = e → Ge)) = k → ¬∀G(§Ge = k → Gk)) (9)
Por lo tanto,
Años más tarde, Leßniewski (en 1938; vide Sobociñski 1949), Quine (1955)
y Geach (1956) demostraron que el sistema así modificado implica una con-
tradicción si suponemos que existen por lo menos dos objetos.40 Pero Frege
40 Resnik 1980, pp. 214ss., explica bien este asunto. Al comienzo de su exposición Resnik
observa que (Vb) es manifiestamente incompatible con el Teorema de Cantor (cuya
demostración —como vimos en la p. 50— sugirió a Russell su paradoja). En efecto,
podemos entender que el Axioma V postula la existencia de una aplicación del reino
de los conceptos en el universo de los objetos, y, en tal caso, (Vb) dice que dicha
aplicación es inyectiva. Según Resnik, ello contradice el Teorema de Cantor, conforme
al cual “hay más conjuntos de objetos que objetos” (1980, p. 214). Esta observación
me parece muy confusa. Los conjuntos de objetos, en el sentido de Cantor, también
son objetos, no conceptos, y lo que el Teorema de Cantor dice es que si S es un con-
junto cualquiera de objetos —sean ellos objetos individuales o conjuntos— no puede
haber una aplicación inyectiva de PS en S, donde PS es el conjunto de objetos cons-
Apéndices 516
debe haber sabido que su remedio no servía, puesto que después de 1903
dejó de interesarse en la derivación de las verdades aritméticas de leyes ló-
gicas.
XIII
FÓRMULAS PRENEXAS
(1) α ↔. ¬¬α
(2) ∃ξα ↔. ¬∀ξ¬α
(3) ∀ξα ↔. ¬∃ξ¬α
(4) ∀ξ¬α ↔. ¬∃ξα
(5) ∃ξ¬α ↔. ¬∀ξα
tituido por las partes (subconjuntos) de S. Sólo si presuponemos que cada concepto
determina un objeto que le corresponde en forma exclusiva —sea éste su extensión
clásica, su recorrido fregeano, o lo que se quiera— podemos relacionar las correspon-
dencias entre objetos a que se refiere el Teorema de Cantor con la correspondencia
entre conceptos y objetos postulada por el Axioma V de Frege.
Apéndices 517
(6) Qξα ↔ α
41 Por ejemplo, se puede adoptar el método siguiente. Sea 〈Q1,…,Qr〉 la lista de los
cuantificadores no ociosos de ψ, en el orden de sus posiciones respectivas, y ζ1, ζ2,…
las secuencia de las variables que no figuran en ψ, ordenadas según el número de palotes.
Sea ψ* la fórmula resultante cuando ψ es sometida a las operaciones siguientes: (i)
eliminar todos los cuantificadores ociosos; (ii) reemplazar por ζi la variable ligada por
Apéndices 518
42 Observemos de paso que dos fórmulas prenexas son equivalentes si difieren sólo en el
orden de los cuantificadores consecutivos de la misma clase. Pues es claro que (φ ↔
ψ) es válida, si φ es la fila α∀ξ∀ζβ y ψ es α∀ζ∀ξβ o si φ es α∃ξ∃ζβ y ψ es α∃ζ∃ξβ,
donde α es una fila de cuantificadores de longitud ≥ 0 y β es una fórmula prenexa o
una matriz.
43 Muchos libros de texto —desde Hilbert y Ackermann 1928— definen, a la inversa,
una fórmula prenexa de Skolem (o “fórmula en la forma normal prenexa de Skolem”)
como una fórmula prenexa en que cada cuantificador existencial precede a todos los
cuantificadores universales. Como ésta no es la definición de Skolem, llamo a las fór-
mulas que la satisfacen fórmulas prenexas de seudo-Skolem.
Apéndices 520
FPS Si φ es una fórmula, hay una fórmula prenexa de Skolem φ∀∃ tal
que φ es realizable si y sólo si φ∀∃ es realizable.44
(17) "m&h"kΠmhkr
44 Como la negación de una fórmula prenexa de Skolem equivale lógicamente —en vir-
tud de (4) y (5)— a una fórmula prenexa de seudo-Skolem, el resultado enunciado
equivale a este otro: Si φ es una fórmula, hay una fórmula prenexa de seudo-Skolem
φ∃∀ tal que φ es válida si y sólo si φ∃∀ es válida.
45 La aplicación de un arreglo como éste a cada fórmula con variables libres —sugerida
por la misma notación en el cálculo de relativos de Schröder empleado por Skolem—
es legítima también en la versión del CP1= con un repertorio ilimitado de predicados
que consideramos en este apéndice. En el caso de una fórmula φ perteneciente a una
versión del CP1= sin tal repertorio ilimitado de predicados, se puede probar que hay
una extensión de esta versión que se distingue de ella sólo en cuanto contiene cierto
número adicional de predicados y en la cual puede construirse una fórmula prenexa de
Skolem que es realizable en una interpretación de la versión extendida si y sólo si φ es
realizable en una interpretación de la versión original.
Apéndices 521
y por ende a
Por otra parte, en virtud de (18) y (7), tenemos que φ′ equivale lógicamente a
(21) "m&hΩmh
(22) "m"m"h"r"k&r&k&h(Ωmh ∧
((¬Ωmh ∨ Πmhkr) ∧ (Ωmh ∨ ¬Πmhkr)))
Es claro que (22) es realizable sólo si lo son (21) y su equivalente φ′. Por
otra parte, si φ′ es realizable, esto es, si hay una interpretación 〈D,ƒ〉 tal que
ƒ(φ′) = 0, hay también una interpretación 〈D,ƒ1〉 tal que ƒ1 concuerda con ƒ
en todas las subfórmulas de φ′ y ƒ1(Ω) es precisamente la clase de (m+h)-
tuplos de elementos de D que, antepuestos a cualquier (k+r)-tuplo de tales
elementos, integran la clase de (m+h+k+r)-tuplos ƒ1(Π).46 De esto se sigue
que ƒ1(φ′) = ƒ1((18)) = ƒ1((22)) = 0 —ya que (22) equivale lógicamente a la
XIV
XV
Como dije en el Capítulo 2.7, Post (1921) demostró que toda fórmula del
cálculo proposicional que sea “positiva” en su interpretación algebraica —y
por ende válida en la interpretación lógica habitual— es deducible por sus-
titución y modus ponens de los axiomas de su Postulado IV. La demostra-
ción es constructiva, en cuanto enseña a construir una deducción apropiada
para cada fórmula positiva dada. Imitando a Post, la divido en cuatro etapas.
Aunque la definición de fórmula que Post da en su Postulado I supone que
los únicos conectivos son los signos de negación y disyunción, la demostra-
ción discurre como si los signos de conjunción, implicación y equivalencia
también pertenecieran al cálculo.
[A] Digamos que una fórmula α tiene rango 0 —abreviado: (α) = 0—
si consta únicamente de una variable proposicional sin conectivos; que (¬α)
= 1 + (α), y que (α ∨ β) = 1 + max( (α), (β)). Designemos con ϕ(p)
y ϕ(q) a dos fórmulas cualesquiera tales que la segunda se deriva de la pri-
mera reemplazando uniformemente cierta variable proposicional p por una
variable proposicional q. Post prueba, por inducción sobre el rango de ϕ(p),
que toda aseveración de la forma ∂(p ↔ q) → (ϕ(p) ↔ ϕ(q)) es deducible
de los postulados. Si (ϕ) = 0, la tesis se reduce a una de las dos siguien-
tes: (i) a ∂(p ↔ q) → (p ↔ q), que se deriva por sustitución del familiar
teorema ∂(p → p);(ii) a ∂(p ↔ q) → (r ↔ r), que se deriva por modus
ponens y sustitución de ∂p → (q → p) y ∂r ↔ r. Si la tesis se supone vá-
lida para fórmulas de rango menor que m, vale también si (ϕ) = m + 1. En
efecto, en tal caso ϕ(p) puede escribirse en una de las formas (ϕ1(p) ∨ ϕ2(p))
o ¬ϕ1(p), donde max( (ϕ1), (ϕ2)) = m; y la tesis se deriva por modus ponens
y sustitución de los teoremas ∂(p ↔ q) → (p ↔ q), ∂(p ↔ q) → (p ↔ q)
y ∂(p ↔ q) → (p ↔ q). Como Post señala en una nota, todos los asertos
que aquí se invocan han sido deducidos en Principia Mathematica.
[B] Si ϕ(p1,…,pk) es una fórmula que contiene k variables proposicionales
diferentes, se puede probar que hay una fórmula ϕ′(p1,…,pk) tal que
∂ϕ(p1,…,pk) ↔ ϕ′(p1,…,pk), en la cual no hay otros conectivos binarios
que ∨ y ∧, y el signo ¬ sólo figura —si acaso— inmediatamente a la iz-
Apéndices 526
(i) ∂ψ′ ↔ ψ
XVI
XVII
En las pp. 329-30 se explica el método adoptado por Gödel (1931) para asig-
narle un número de identidad —lo que he llamado un ‘gödel’— a cada ob-
jeto de un cálculo lógico. El método de Gödel es muy elegante pero no
permite determinar con facilidad cuál es el número asignado a cierto objeto,
o el objeto que corresponde a cierto número. (De hecho, hay números a los
que no corresponde ningún objeto). Desde 1931 se han introducido varios
otros métodos. En las pp. 384-85 expliqué el adoptado por Turing para asig-
narle un gödel a sus programas de cómputo. Siguiendo a Smullyan (1992),
aplicaré aquí una variante del método de Turing a los objetos de un cálculo
lógico. Para fijar ideas, me refiero al cálculo predicativo de segundo orden,
CP2=, descrito en el Apéndice IX.H, pero el método se puede adaptar fácil-
Apéndices 530
XVIII
51 Cada secuente ➛ A, en que A es uno de los seis axiomas en cuestión, puede insertarse
como secuente inicial en cualquier derivación, sobreentendiéndose que sobre él va una
derivación como las dadas aquí. Obsérvese que los axiomas 7 y 8 de Gödel no pueden
justificarse así, porque contienen el signo =, el cual no es un símbolo lógico del cálcu-
lo de Gentzen. Pero el axioma 7 (x = x) es evidentemente la posfórmula única de un
secuente básico matemático sin prefórmulas. También lo es el axioma 8, si exigimos
que las fórmulas F(x) y F(y) que figuran en él sean elementales.
Apéndices 532
Γ, ➛ ∆,
Γ ➛ ∆, , ¬ (¬)
Γ ➛ ∆, , ¬ ∨ (∨)
Γ ➛ ∆, ¬ ∨ , (Permutación)
Γ ➛ ∆, ¬ ∨ , ¬ ∨ (∨)
Γ ➛ ∆, ¬ ∨ (Contracción)
Omitiendo las líneas 2-5 (y las rayas horizontales que las preceden), el es-
quema precedente puede condensarse en el siguiente esquema de inferencia
auxiliar que, siguiendo el ejemplo de los manuales de lógica, llamo teorema
de la deducción (TD).
TD Γ, ➛ ∆,
Γ ➛ ∆, ¬ ∨
Ahora derivo los axiomas 1-6. Para ahorrar espacio, no anoto las permu-
taciones efectuadas.
1 ➛ ➛ (SB | SB)
∨ ➛ (∨)
➛ ¬( ∨ )∨ (TD)
Apéndices 533
2 ➛ (SB)
➛ ∨ (∨)
➛¬ ∨( ∨ ) (TD)
∨➛∨ (∨)
➛ ¬( ∨ ) ∨ ( ∨ ) (TD)
4 ➛ (SB)
➛ ➛ , (SB|deb.)
¬ , ∨ ➛ ➛ ∨ (∨ |∨)
¬ , ∨ ➛ ∨ ∨ ,➛ ∨ (∨|deb.)
¬ ∨ , ∨ ➛ ∨ (∨)
¬ ∨ , ➛ ¬( ∨ )∨( ∨ ) (TD)
5 ( /) ➛ ( /)
∀ ➛ ( /) (∀)
∨ ( /) ➛ , ∀ , ∀ (∀)
∨ ( /) ➛ , ∀ (contr.)
∨ ( /) ➛ ∨ ∀ , ∀ (∨)
∨ ( /) ➛ ∨ ∀ , ∨ ∀ (∨)
∨ ( /) ➛ ∨ ∀ (contr.)
➛ ¬( ∨ ( /)) ∨ ( ∨ ∀ ) (TD)
XIX
Luitzen Egbertus Jan Brouwer (1881-1966) alcanzó muy joven una concep-
ción de la matemática radicalmente opuesta a la de los autores que estudia-
mos en este libro. Ella se perfila claramente en su tesis doctoral (1907), sobre
todo en la primera versión, cuyos pasajes más audaces suprimió por reco-
mendación de su consejero, D. J. Korteweg (van Stigt, 1979). Korteweg le
sugirió a su joven y extraordinariamente brillante discípulo que se aplicara
primero a resolver problemas de la matemática tradicional, para asegurar su
autoridad y prestigio. En cumplimiento de este plan, Brouwer sentó las ba-
ses de la teoría topológica de la dimensión, demostrando que el número de
dimensiones de un espacio es invariante bajo biyecciones bicontinuas (1911,
1913). Tras este importante logro, con el cual rescató una intuición que
muchos creían destruida por Cantor (vide p. 26), Brouwer empezó a publi-
car artículos de carácter filosófico en las Actas de la Academia Neerlandesa
de Ciencias y en revistas internacionales de matemáticas.
Brouwer solía decir que sus ideas sobre la matemática emanaban de su
personal concepción del mundo y de la vida. Esta tiene sólo un tenue víncu-
lo —a través de Schopenhauer— con la tradición filosófica europea, y me
confieso incapaz de comprenderla y explicarla.52 Por suerte, aquí busco sólo
marcar el contraste entre Brouwer y el conjuntismo, y para ello no es preci-
so calar muy hondo. Me limitaré a citar algunas palabras de Brouwer sobre
la intuición fundamental que según él es la raíz de las matemáticas, para
luego, a partir de ahí, resumir sus ideas sobre el infinito matemático y el
principio del tercero excluido.
Según Brouwer, el “fenómeno fundamental del intelecto humano” es “la
disociación de los momentos de la vida en partes cualitativamente diversas,
que sólo pueden reunirse en cuanto permanezcan separadas por el tiempo”;
53 Recuérdese que Cantor llamó ‘potencia’ (Mächtigkeit) a lo que en este libro llamamos
‘numerosidad’; cf. p. 21.
Apéndices 537
Según esto, no puede haber más que una numerosidad infinita, a saber, la
denumerable. Con todo, Brouwer admite que se hable de una numerosidad
superior en cualquiera de los dos sentidos siguientes:
(a) Cada conjunto denumerable dado perteneciente a un sistema matemá-
tico genera un nuevo elemento que también pertenece al sistema. Por esta
vía sólo pueden construirse conjuntos denumerables, no el sistema comple-
to, porque este no puede ser denumerable. “Es incorrecto considerar a este
sistema entero como un conjunto matemático, pues no es posible terminar
de edificarlo desde la intuición matemática originaria” (1908a; CW I, 103).
Brouwer propone estos ejemplos: la totalidad de los números de la segunda
clase (vide pp. 37-38), la totalidad de los puntos definibles del continuo, la
totalidad de los sistemas matemáticos.
(b) Al continuo entre lo primero y lo segundo se lo puede considerar como
una matriz generadora de unidades o puntos, y postularse que dos puntos
deben considerarse distintos si y sólo si es posible distinguir sus respectivas
posiciones en una cierta escala de tipo de orden η. ‘Se observa entonces que
el continuo definido de este modo no puede agotarse nunca como matriz de
puntos” (1908a; CW I, 103).
Brouwer concluye que existe sólo una “potencia” o numerosidad para
conjuntos matemáticos infinitos, “a saber, la denumerable”. A ella cabe agregar
(a) la denumerablemente inconclusa, “pero ello denota un método, no un
conjunto”; y (b) la continua, la cual, sí, “denota algo terminado (etwas
Fertiges), pero sólo como matriz, no como conjunto“ (1908a; CW I, 104).
A Brouwer se lo conoce en los círculos filosóficos sobre todo porque negó
la validez universal del principio lógico del tercero excluido. El alcance y la
justificación de su rechazo sólo se puede apreciar contra el trasfondo de las
ideas precedentes. Brouwer no estaba en el negocio de crear una lógica al-
ternativa, como la que, revestida de una parafernalia formal muy semejante
a la que detestaba en sus adversarios, circula con el nombre de “lógica
intuicionista”. Para él, la actividad matemática, alimentada de la intuición
originaria, es extralingüística. El lenguaje matemático no es más que un re-
curso defectuoso de los hombres para comunicarse las matemáticas unos a
otros y para reforzar su memoria de las matemáticas (Brouwer 1907; CW I,
92). La verdad sólo se encuentra “en la realidad, esto es, en las experiencias
presentes y pasadas de la conciencia”, las cuales incluyen cosas y sus cuali-
dades, emociones, reglas (jurídicas, de cooperación, de juego), actos mate-
Apéndices 538
55 Largeault 1992 y Mancosu 1998 son libros introductorios que recomiendo calurosa-
mente a quien desee saber más sobre el intuicionismo.
541
Glosario 542
Cuerpo (alemán, Körper; francés, corps; inglés, field). Sea 〈K,⊕〉 un †grupo
abeliano, con elemento neutro 0 ∈ K. Suponemos que K contiene por lo
menos un elemento distinto de 0. Sea ⊗:K × K Æ K una †aplicación tal
que (i) 〈K\{0},⊗〉 es un grupo abeliano con elemento neutro 1,1 (ii) para
cualquier k ∈ K, k ⊗ 0 = 0 ⊗ k = 0, y (iii) cualesquiera que sean a,b,c ∈
K, a ⊗ (b ⊕ c) = (a ⊗ b) ⊕ (a ⊗ c) = (b ⊕ c) ⊗ a. Entonces, 〈K,0,1,⊕,⊗〉
es un cuerpo. Sea a ∈ K. Si a ≠ 0, a tiene dos inversos: uno por ⊕, que
denotamos con -a, y uno por ⊗ que denotamos con a-1. Si a = 0, obvia-
mente, es su propio inverso por ⊕ y no tiene un inverso por ⊗.
El lector comprobará fácilmente que, si K es el conjunto de todas las frac-
ciones (propias e impropias), 0 y 1 son el cero y el uno, y ⊕ y ⊗ son, res-
pectivamente, la adición y la multiplicación de fracciones, 〈K,0,1,⊕,⊗〉 es
un cuerpo: el cuerpo de los racionales, habitualmente llamado Œ.
(i) E ∈ T;
(ii) ∅ ∈ T;
(iii) si X e Y pertenecen a T, la intersección X ∩ Y también pertenece a
T;
(iv) si X1, X2,… es una lista (posiblemente infinita) de elementos de
T, la unión ¨k∈ˆXk de todos los elementos de la lista también es
un elemento de T.
En vez de ‘orden total’ suele decirse ‘orden simple’ u ‘orden lineal’. Dado
un orden total definido por la relación ≤, la relación diádica < está definida
por la condición: a < b si y sólo si a ≤ b y a ≠ b. La relación < es asimétrica:
a < b implica que es falso que b < a. El concepto de orden total puede
definirse también en términos de una relación transitiva y asimétrica < que
satisfaga el requisito de tricotomía: si a, b ∈ C, siempre ocurrirá que a < b,
o que b < a, o que a = b. En tal caso, la relación ≤ definida por la condición
‘a ≤ b si y sólo si a < b o a = b’ define en C un orden total de acuerdo con
nuestra primera definición.
Sea C un conjunto parcialmente ordenado por la relación ≤. Sea U ⊆ C.
Decimos que u es un elemento maximal de U si u ∈ U y no existe un v ∈
U tal que u < v. Decimos que u es un elemento minimal de U si u ∈ U y no
existe un v ∈ U tal que v < u. Un elemento a ∈ C es una cota superior de
U si todo x ∈ U cumple la condición x ≤ a. a es una cota inferior de U si
todo x ∈ U cumple la condición a ≤ x. Si U tiene una cota superior, deci-
mos que está acotado por arriba; si tiene una cota inferior, decimos que
está acotado por abajo; si tiene una cota superior y una cota inferior, deci-
mos simplemente que U es un conjunto acotado. Obsérvese que a lo sumo
una cota superior de U puede pertenecer a U. Si tal cota superior existe la
llamamos el máximo de U (abreviado: max U). Obviamente, si max U exis-
te, es un elemento maximal de U (en efecto, el único). Por otra parte, no
más de una cota inferior de U puede pertenecer a U. Si tal cota inferior existe,
la llamamos el mínimo de U (abreviado: min U). Si min U existe, es un
548
elemento minimal de U (en efecto, el único). Supongamos ahora que U tie-
ne una cota superior p tal que, si q es una cota superior de U, p ≤ q. Obvia-
mente, no puede haber más de un objeto p con esta propiedad. Si tal objeto
existe, lo llamamos la cota superior mínima o el supremo de U (abreviado:
sup U). Del mismo modo, la cota inferior máxima o infimo de U (abrevia-
do: inf U) es el objeto r tal que r es una cota inferior de U y si r es cual-
quier cota inferior de U, s ≤ r; obviamente, si inf U existe, es único.
549
OBRAS CITADAS
Ackermann, W. (1924). “Begründung des Tertium non datur mittels der Hilbertschen
Theorie der Widerspruchsfreiheit”. Mathematische Annalen. 92: 1–35.
Ackermann, W. (1928). “Zum Hilbertschen Aufbau der reellen Zahlen”. Mathe-
matische Annalen. 99: 118–133.
Ackermann, W. (1940). “Zur Widerspruchsfreiheit der Zahlentheorie”. Mathematische
Annalen. 117: 162–194.
Ash, J. M. (1989). “Uniqueness of representation by trigonometric series”. American
Mathematical Monthly. 96: 873–885.
Baker, G. P. y P. M. S. Hacker (1984). Frege: Logical Excavations. Oxford:
Blackwell.
Baldwin, J. M., ed. (1901-1905). Dictionary of Philosophy and Psychology. New
York: Macmillan. 3 vols. in 4.
Becker, O. (1954). Grundlagen der Mathematik in ihrer geschichtlichen Entwicklung.
Freiburg i. Br.: Karl Alber.
Behmann, H. (1922). “Beiträge zur Algebra der Logik, insbesondere zum Ent-
scheidungsproblem”. Mathematische Annalen. 86: 163–229.
Benacerraf, P. y H. Putnam, eds. (1983). Philosophy of Mathematics: Selected
Readings. Second Edition. Cambridge: Cambridge University Press.
Bernays, P. (1926). “Axiomatische Untersuchungen des Aussagenkalküls der Princi-
pia Mathematica”. Mathematische Zeitschrift. 25: 305–320.
Bernays, P. (1935). “Hilberts Untersuchungen über die Grundlagen der Arithmetik”.
En Hilbert GA, vol. III, pp. 196–216.
Bernays, P. y M. Schönfinkel (1928). “Zum Entscheidungsproblem der mathe-
matischen Logik”. Mathematische Annalen. 99: 342–372.
Birkhoff, G. y J. v. Neumann (1936). “The logic of quantum mechanics”. Annals of
Mathematics. 37: 823–843.
Bishop, E. (1967). Foundations of Constructive Analysis. New York: McGraw-Hill.
Bolzano, B. (1964). Paradoxien des Unendlichen. Hamburg: Felix Meiner. (primera
edición: 1851).
Boole, G. (1847). The Mathematical Analysis of Logic. Cambridge: Macmillan.
551
Obras citadas 552
Cantor, G. (1870). “Beweis, daß eine für jeden reellen Wert von x durch eine
trigonometrische Reihe gegebene Funktion ƒ(x) sich nur auf eine einzige Weise
in dieser Form darstellen läßt”. Journal für die reine und angewandte Mathe-
matik. 72: 139–142. (Reproducido en Cantor GA, pp. 80-83.
Cantor, G. (1871). “Notiz zu dem Aufsatze: Beweis, daß eine für jeden reellen Wert
von x durch eine trigonometrische Reihe gegebene Funktion ƒ(x) sich nur auf
eine einzige Weise in dieser Form darstellen läßt”. Journal für die reine und
angewandte Mathematik. 73: 294–296. (Reproducido en Cantor GA, pp. 84-
86).
Cantor, G. (1872). “Über die Ausdehnung eines Satzes aus der Theorie der trigono-
metrischen Reihen”. Mathematische Annalen. 5: 123–132. (Reproducido en
Cantor GA, pp. 92-102).
Cantor, G. (1874). “Über eine Eigenschaft des Inbegriffes aller reellen algebraischen
Zahlen”. Journal für die reine und angewandte Mathematik. 77: 258–262.
(Reproducido en Cantor GA, pp. 115-118).
Cantor, G. (1878). “Ein Beitrag zur Mannigfaltigkeitslehre”. Journal für die reine
und angewandte Mathematik. 84: 242–258. (Reproducido en Cantor GA, pp.
119-133).
Cantor, G. (1883). “Über unendliche, lineare Punktmannichfaltigkeiten, Nr. 5”.
Mathematische Annalen. 21: 545–591. (Reproducido en Cantor GA, pp. 165-
209).
Cantor, G. (1886). “Über die verschiedenen Standpunkte in Bezug auf das aktuelle
Unendliche”. Zeitschrift für Philosophie und philosophische Kritik. 88: 224–
233. (Reproducido en Cantor GA, pp. 370-377).
Cantor, G. (1887/88). “Mitteilungen zur Lehre vom Transfiniten”. Zeitschrift für
Philosophie und philosophische Kritik. 91: 81–125; 92: 240–265. (Reproduci-
do en Cantor GA, pp. 378-439).
Cantor, G. (1890/91). “Über eine elementare Frage der Mannigfaltigkeitslehre”.
Jahresbericht der Deutschen Mathematiker-Vereinigung. 1: 75–78. (Reprodu-
cido en Cantor GA, pp. 278-281).
Cantor, G. (1895/97). “Beiträge zur Begründung der transfiniten Mengenlehre”.
Mathematische Annalen. 45: 581–512; 49: 207–246. ((Reproducido en Cantor
GA, pp. 282-351).
Cantor, G. (1899). “Carta a Richard Dedekind del 3 de agosto de 1899”. En Cantor
GA, pp. 443–447. (Nótese que esta carta se imprimió fundida con otra, del 28
de julio de 1899, a la cual pertenecen sólo los cuatro primeros párrafos de la
p. 443; cf. Grattan-Guinness 1974).
Cartan, H. (1937). “Théorie des filtres”. Comptes rendus de l'Académie des Sciences.
205: 595-598.
Obras citadas 555
Fraenkel, A. A. (1922a). “Der Begriff “definit” und die Unabhängigkeit des Auswahls-
axioms”. Preußische Akademie der Wissenschaften. Physikalisch-mathematische
Kl. Sitzungsberichte. Pp. 253–257. (Traducción inglesa en J. van Heijenoort
1967).
Fraenkel, A. A. (1925). “Untersuchungen über die Grundlagen der Mengenlehre”.
Mathematische Zeitschrift. 22: 250–273.
Frege, G. (BSA). Begriffschrift und andere Aufsätze. Zweite Auflage mit E. Husserls
und H. Scholz’s Anmerkungen. Herausgegeben von I. Angelelli. Darmstadt:
Wissenschaftliche Buchgesellschaft, 1971.
Frege, G. (KS). Kleine Schriften. Herausgegeben von I. Angelelli. Darmstadt:
Wissenschaftliche Buchgesellschaft.
Frege, G. (LS). Siete escritos sobre lógica y semántica. Introducción, traducción y
selección bibliográfica de Gómez-Lobo, A. Valparaíso: Universidad Católica
de Valparaíso, 1972.
Frege, G. (WB). Wissenschaftlicher Briefwechsel. Herausgegeben, bearbeitet,
eingeleitet und mit Anmerkungen versehen von G. Gabriel, H. Hermes, F.
Kambartel, C. Thiel y A. Veraart. Hamburg: Felix Meiner.
Frege, G. (1879). Begriffschrift, eine der arithmetischen nachgebildete Formelsprache.
Halle a.S.: Louis Nebert.
Frege, G. (1884). Die Grundlagen der Arithmetik. Eine logisch mathematische
Untersuchung über den Begriff der Zahl. Breslau: Wilhelm Koebner.
Frege, G. (1891). Funktion und Begriff. Vortrag, gehalten in der Sitzung vom 9. Januar
1891 der Jenaischen Gesellschaft der Medizin und Naturwissenschaft. Jena:
H. Pohle. (Reproducido en G. Frege, KS, pp. 125–142).
Frege, G. (1892). “Über Sinn und Bedeutung”. Zeitschrift für Philosophie und
philosophische Kritik. 100: 25–50 (1892). (Reproducido en G. Frege, KS, pp.
143–162).
Frege, G. (1892a). “Über Begriff und Gegenstand”. Vierteljahrschrift für wissen-
schaftliche Philosophie. 16: 192–205 (1892). (Reproducido en G. Frege, KS,
pp. 167–178).
Frege, G. (1893). Grundgesetze der Arithmetik, begriffschriftlich abgeleitet. I. Band.
Hildesheim: Georg Olms, 1962. (Reimpresión repográfica de la edición origi-
nal, publicada en Jena en 1893; encuadernada en un volumen con el tomo II).
Frege, G. (1895). “Kritische Beleuchtung einiger Punkte in E. Schröders Vorlesungen
über die Algebra der Logik”. Archiv für systematische Philosophie. 1: 433–
456. (Reproducido en Frege, KS, pp. 193–210).
Obras citadas 558
Hilbert, D. (1931a). “Beweis des Tertium non datur”. Göttinger Nachrichten (Math.-
phys. Klasse). Pp. 120–125.
Hilbert, D. y W. Ackermann (1928). Grundzüge der theoretischen Logik. Berlin:
Springer.
Hilbert, D. y P. Bernays (GM). Grundlagen der Mathematik. Zweite Auflage. Berlin:
Springer, 1968/1970. 2 vols.
Hilbert, D. y P. Bernays (1934). Grundlagen der Mathematik. Band I. Berlin: Springer.
Hilbert, D. y P. Bernays (1939). Grundlagen der Mathematik. Band II. Berlin:
Springer.
Hintikka, J., ed. (1969). The Philosophy of Mathematics. Oxford: Oxford University
Press. (Oxford Readings in Philosophy).
Isaacson, D. (1992). “Some considerations on arithmetical truth and the ω-rule”. En
M. Detlefsen 1992a, pp. 94-138.
Jaßkowski, S. “On the rules of suppositions in formal logic”. Studia Logica. 1: 5–32
(1934). (Reproducido en McCall 1967, pp. 231-258).
Jeffrey, R. (1981). Formal Logic: Its Scope and Limits. Second edition. New York:
McGraw-Hill.
Johnson, D. M. (1979/81). “The problem of the invariance of dimension in the growth
of modern topology”. Archive for History of Exact Sciences. 20: 97–188; 25:
85–267.
Kalmár, L. (1955). “Über ein Problem, betreffend die Definition des Begriffes der
allgemein-rekursiven Funktionen”. Zeitschrift für mathematische Logik und
Grundlagenforschung. 1: 93-96.
Kleene, S. C. (1936). “General recursive functions of natural numbers”. Mathe-
matische Annalen. 112: 727-742. (Reproducido en Davis 1965, pp. 237-252,
con importantes rectificaciones en la p. 253. Mis citas remiten a esta edición.).
Kleene, S. C. (1938). “On notation for ordinal numbers”. Journal of Symbolic Logic.
3: 150–155.
Kleene, S. C. (1943). “Recursive predicates and quantifiers”. American Mathematical
Society Transactions. 53: 41-73 (1943). (Reproducido en Davis 1965, pp. 255-
287. Mis citas remiten a esta edición.).
Kleene, S. C. (1952). Introduction to Metamathematics. Amsterdam: North-Holland.
Kleene, S. C. (1967). Mathematical Logic. New York: Wiley.
König, D. (1926). “Sur les correspondances multivoques des ensembles”. Funda-
menta Mathematicae. 8: 114-134.
König, J. (1905). “Zum Kontinuum-Problem”. Mathematische Annalen. 60: 177–180,
462.
Obras citadas 563
König, J. (1905a). “Über die Grundlagen der Mengenlehre und das Kontinuums-
problem”. Mathematische Annalen. 61: 156-160. (Traducción inglesa en van
Heijenoort 1967, pp. 145-149).
König, J. (1914). Neue Grundlagen der Logik, Arithmetik und Mengenlehre. Leipzig.
Kreisel, G. (1976). “What have we learnt from Hilbert’s Second Problem”. En F. E.
Browder 1976, pp. 93–130.
Kronecker, L. (1887). “Über den Zahlbegriff”. Journal für die reine und angewandte
Mathematik. 101: 337–355.
Largeault, J. (1992). L’intuitionisme. Paris: Presses Universitaires de France.
Leibniz, G. W. (EF). Escritos filosóficos. Edición de E. de Olaso. Buenos Aires:
Charcas, 1982.
Leibniz, G. W. (GP). Die philosophischen Schriften. Herausgegeben von C. J.
Gerhardt. Hildesheim: Olms, 1965. 7 vols.
Leibniz, G. W. (LP). Logical Papers. A Selection Translated and Edited with an
Introduction by G. H. R. Parkinson. Oxford: Clarendon Press.
Levy, A. (1979). Basic Set Theory. Berlin: Springer.
Lewis, C. I. (1918). A Survey of Symbolic Logic. Berkeley: University of California
Press.
Lewis, D. (1991). Parts of Classes. With an appendix by J. P. Burgess, A. P. Hazen
and D. Lewis. Oxford: Basil Blackwell.
Lorenzen, P. (1965). Differential und Integral. Frankfurt a. M.
Löwenheim, L. (1915). “Über Möglichkeiten im Relativkalkül”. Mathematische
Annalen. 76: 447-470.
Maddy, P. (1990). Realism in Mathematics. Oxford: Clarendon Press.
Mancosu, P. (1998). From Brouwer to Hilbert: The Debate on the Foundations of
Mathematics in the 1920s. New York: Oxford University Press.
Manin, Y. I. (1977). A Course in Mathematical Logic. Translated from the Russian
by N. Koblitz. New York: Springer.
Mannheim, J. H. (1964). The Genesis of Point Set Topology. Oxford: Pergamon.
Mates, B. (1970). Elementary Logic. New York: Oxford University Press.
Matijasévic, Y. V. (1970). “Diofantovost pereçislimyh mnozestv”. Doklady Akad. Nauk
SSSR. 191: 279-282.
Matijasévic, Y. V. (1970a). “Enumerable sets are Diophantine”. Soviet Math. Doklady.
11: 354-357. (Versión inglesa corregida de Matijasévic 1970).
Obras citadas 564
McCall, S., ed. (1967). Polish Logic 1920–1939. Papers by Adjukiewicz, Chwistek,
Jaßkowski, Jordan, Leßniewski, Lukasiewicz, Slupecki, Sobociñski, and
Wajsberg. With an Introduction by T. Kotarbinski. Translated by B. Gruchman
et al. Oxford: Clarendon Press.
Mendelson, E. (1958). “The Axiom of Fundierung and the Axiom of Choice”. Archiv
für mathematische Logik und Grundlagenforschung. 4: 65–70.
Mendelson, E. (1990) “Second thoughts about Church’s Thesis and mathematical
proofs”. Journal of Philosophy. 87: 225–233.
Meschkowski, H. (1967). Probleme des Unendlichen: Werk und Leben Georg Cantors.
Braunschweig: Vieweg.
Mirimanoff, D. (1917). “Les antinomies de Russell et de Burali-Forti et le problème
fondamentale de la théorie des ensembles”. L’Enseignement Mathématique. 19:
37–52.
Mirimanoff, D. (1917a). “Remarques sur la théorie des ensembles et les antinomies
cantoriennes – I”. L’Enseignement Mathématique. 19: 209–217.
Mirimanoff, D. (1920). “Remarques sur la théorie des ensembles et les antinomies
cantoriennes – II”. L’Enseignement Mathématique. 21: 29–52.
Mittelstraß, J., ed. (EPW). Enzyklopädie Philosophie und Wissenschaftstheorie.
Mannheim: Bibliographisches Institut / Stuttgart: J.B. Metzler. 1980–1996. 4
vols.
Moore, E. H. y H. L. Smith (1922). “A general theory of limits”. American Journal
of Mathematics. 44: 102-121.
Moore, G. H. (1982). Zermelo’s Axiom of Choice: Its origins, development, and
influence. New York: Springer.
Nagel, E. (1939). “The formation of modern conceptions of formal logic in the
development of geometry”. Osiris. 7: 142-224.
Nelson, E. (1986). Predicative Arithmetic. Princeton: Princeton University Press.
Nelson, E. (1993). “Taking formalism seriously”. The Mathematical Intelligencer.
15 3: 8-11.
Neumann, J. von (CW). Collected Works. Volume I. New York: Pergamon, 1961.
Neumann, J. von (1922/23). “Zur Einführung der transfiniten Zahlen”. Acta Litterarum
ac Scientiarum Regiae Universitatis Hungaricae, Sectio Sc. Math. : 199–208.
(Reproducido en von Neumann, CW, vol. I, pp. 24–33 y en Felgner 1979, pp.
92–101; traducción inglesa en Heijenoort 1967, pp. 346–354).
Neumann, J. von (1925). “Eine Axiomatisierung der Mengenlehre”. Journal für die
reine und angewandte Mathematik. 154: 219-240 (1925). (Reproducido en von
Neumann, CW, vol. I, pp. 35–56).
Obras citadas 565
Post, E. L. (1944). “Recursively enumerable sets of positive integers and their decision
problems”. Bulletin of the American Mathematical Society. 50: 284-316 (1944).
(Reproducido en Davis 1965, pp. 305-337. Mis citas remiten a esta edición).
Post, E. L. (1965). “Absolutely unsolvable problems and relatively undecidable
propositions: Account of an anticipation”. En Davis 1965, pp. 340–433.
Quine, W. V. O. (1941). “Whitehead and the rise of modern logic”. En Quine 1966,
pp. 3–36. (Publicado originalmente en P. A. Schilpp, ed. The Philosophy of
Alfred North Whitehead, Evanston: Northwestern University Press).
Quine, W. V. O. (1955). “On Frege’s way out”. En Quine 1966, pp. 146-158. (Pu-
blicado originalmente en Mind, 64: 145-159).
Quine, W. V. O. (1966). Selected Logic Papers. New York: Random House.
Ramsey, F. P. (1925). “The foundations of mathematics”. En Ramsey 1931, pp. 1–
61. (Publicado originalmente en Proceedings of the London Mathematical
Society (2) 25: 338–384).
Ramsey, F. P. (1931). The Foundations of Mathematics and other Logical Essays.
London: Routledge & Kegan Paul.
Rang, B. y W. Thomas (1980). “Zermelo’s discovery of the ‘Russell paradox’”.
Historia Mathematica. 8: 15–22.
Resnik, M. D. (1980). Frege and the Philosophy of Mathematics. Ithaca: Cornell
University Press.
Richard, J. (1905). “Les principes des mathématiques et le problème des ensembles”.
Revue générale des sciences pures et appliquées. 16: 541 (1905). (Traducción
inglesa en van Heijenoort 1967, pp. 142–144).
Ritter, J. y K. Gründer, eds. (HWB). Historisches Wörterbuch der Philosophie.
Darmstadt: Wissenschaftliche Buchgesellschaft, 1971– .
Robinson, A. (1961). “Non-standard analysis”. K. Nederlandse Akademie van
Wetenschappen. Proceedings. 64: 432-440.
Robinson, A. (1966). Non-standard Analysis. Amsterdam: North-Holland Publishing
Co.
Rodríguez-Consuegra, F. A. (1989). “Russell’s Theory of Types, 1901-1910: Its
complex origins in the unpublished manuscripts”. History and Philosophy of
Logic. 10: 131-164.
Rodríguez-Consuegra, F. A. (1991). The Mathematical Philosophy of Bertrand
Russell: Origins and Development. Basel: Birkhäuser.
Rogers Jr., H. (1967). Theory of Recursive Functions and Effective Computability.
New York: McGraw-Hill.
Obras citadas 568
573
Símbolos asociados a determinados autores
ε 226-27 © 471
a‹ 300
A|B 300
574
ÍNDICE DE PERSONAS Y CONCEPTOS
575
Índice de personas y conceptos 576
Burali-Forti, Cesare, 53, 465-68; véase categórica (teoría), 76, 98, 101
también paradoja de Burali-Forti Cauchy, Augustin-Louis, 61, 62, 69,
310; véase también secuencia de
cadena (Kette), 154 Cauchy
calculable, 321n., 375-76, 382; efecti- cerrado lógicamente, 84
vamente, 373, 375, 382n.; “en César, Cayo Julio, 166
principio”, 359n.; véase también Chang, C. C., 483
computable Christoffel, Elwin Bruno, 297, 298
calculista (computer), 382, 389-92 Church, Alonzo, 196n., 199, 259, 271,
cálculo lógico, 312n., 376, 527-28; 317, 354, 359, 360, 365, 369-81,
compacto, 290; completo, 257-58, 382, 417, 418, 421, 494; véase
273, 496; correcto, 258, 495, 528; también Teorema de Church, Tesis
efectivo, 243n., 247, 429; véase de Church
también cálculo predicativo; cálculo Chwistek, Leon, 205
proposicional; sistema formal Cicerón, Marco Tulio, 191
cálculo predicativo, 480-502 círculo vicioso, principio del, 187, 190,
cálculo predicativo de primer orden, 192, 194, 196, 205, 208n., 209
481-91; con identidad, 491-93; clase, 2, 5, 41, 49, 50, 71, 95, 179,
definición, 274n.; es completo, 273- 182, 186, 200, 206; nula, 200;
94; es indecidible, 418-19 perfectamente ordenada, 465;
cálculo predicativo de segundo orden, Principia Mathematica neutral ante
500-501 la existencia de clases, 187, 200n.,
cálculo predicativo monádico, 522; es 208; propia, 95, 183, 184n.
decidible, 522-24 clase-como-muchos/clase-como-uno,
cálculo proposicional, 253, 255-58, 179, 179n.-181n.
482n.; es completo, 525-27; es clases, teoría sin, 183, 184, 185-87,
decidible, 256-57, 494 200n.; relación con “teoría susti-
Calímaco, 191 tucional de las clases”, 184n.
Cantor, Georg, xi, xii, 7-70, 75, 79, 90, clausura (topología), 546; universal (de
96, 102, 115, 117, 118, 119, 151, una fórmula), 484
296, 297, 299, 422, 441, 442, 443, Cocchiarella, Nino, 179
459-64, 465, 467, 468, 477, 505, codominio, 153n., 541
535; véase también paradoja de Coffa, J. Alberto, 177
Cantor; paraíso de Cantor; principios Cohen, Paul J., xi, 455, 475
generadores de Cantor; Teorema de compacto, 290
Cantor complemento, 2
cardinal, 33, 39; definición de von completo en el sentido de Post, 258, 344
Neumann, 92; de la clase K, 200; completud (Vollständigkeit), xiii, 99n.,
inaccesible, 105, 106, 110 126n., 296; véase también cálculo
cardinalidad, véase numerosidad completo
Carnap, Rudolf, 125 componente (de una formula), 488
Cartan, Henri, 377 computable, 321, 359, 375-76, 382
Índice de personas y conceptos 578
382; numérica, 359, 387; parcial, Goldfarb, Warren, 130, 249, 259, 270
215, 359, 368; predicativa, 190n., grado: de una fórmula (Gentzen), 430;
198; proposicional, 49, 50, 86, 180, de una K-fórmula (Gödel), 279
181, 192, 196, 197, 200, 211, 212n.; grafo, 510-11, 542
total, 359, 364; veritativa, 208 Grattan-Guinness, I., 51
funcional, 220 Grelling, Kurt, 189n.
funciones computables, 359-419 Gründer, Karlfried, 454
funciones recursivas, 321, 330-34, 361- grupo, 546; abeliano, 546
68, 371, 376, 377, 377n.; cursiva guédel, 329n.
usada para nombrarlas, 336n.; “en el
sentido de Herbrand-Gödel”, 364, Hacker P. M. S., 138
415n.; en el sentido restringido de Hall, A. Rupert, 159
Gödel (1931), 331, 333; generales, Hall, Mary Boas, 159
362, 364, 382; parciales, 368; Hallett, Michael, 62
primitivas, 331-33, 331n., 361; todas Hartogs, F., 40
son T-computables, 407-10; Hausdorff, Felix, 105, 477
funciones T-computables, 365, 377n., Heijenoort, Jean van, 83, 212, 251,
382, 407; todas son recursivas, 410- 259, 287, 299
15 Helmholtz, Hermann, 297
functor, 85-86, 492, 500 Henkin, Leon, 273
Henkin, Leon, 501
Gauß, Carl G., 61, 62, 310 Herbrand, Jacques, 125, 241-46, 247,
Geach, Peter, 515 249, 250, 251, 259-71, 273, 292,
generalización irrestricta es prescindible 306, 317, 322, 360, 362, 363, 415
(Skolem), 212; véase también hereditaria, propiedad, 161, 162
cuantificación acotada Hermes, Hans, 363, 366, 405
generalización universal, 140, 276, 327 Hermite, Charles, 310
Gentzen, Gerhard, xi, 318, 319, 421- Hessenberg, G., 42
55, 496, 487, 499, 531-34 heterológico/autológico, 189n.
geometría euclidiana: véase espacio Heyting, Arendt, 125
euclidiano Hilbert, David, xi, xii, 54, 63, 71, 73,
geometría proyectiva, 313-14 74, 75, 76, 84, 99, 115-27, 129,
Gergonne, Joseph-Diez, 73 130, 145, 160, 167, 197, 211, 213,
Gillies, Donald A., 145 219, 220, 225, 226, 239, 248, 249,
Gödel, Kurt, xi, xii, 43, 80, 87, 95, 250, 273, 276, 283, 287, 288, 292,
126, 127, 142, 143, 178, 209, 211, 295-319, 322, 324, 325, 335, 354,
243, 244, 250, 251, 254, 259, 270, 380, 381, 421, 450, 451, 494, 544;
273-94, 295, 316-19, 321-58, 360, véase también problemas de Hilbert
361-68, 381, 385, 390, 415, 417, para el siglo XX; programa de
421, 423, 450, 451, 454, 455, 496, Hilbert
527, 529, 531 hilo (en derivación), 431; completo,
gödel, 329-30, 384-85, 529-30 431
Índice de personas y conceptos 582
segmento (Abschnitt) de un conjunto Skolem, Thoralf, xii, 76, 78, 86-87, 89-
bien ordenado, 46-47 90, 98, 207, 211-18, 232, 251, 422,
semántica, 276-77, 484-87, 492-93, 475, 519, 520, 522; véase también
501; véase también sintáctico/ fórmula prenexa de Skolem; Teore-
semántico ma de Löwenheim-Skolem
sentencial, cálculo, 253n.; véase Smith, H. L., 377
también cálculo proposicional Smorynski, C., 315, 358
sentido (Sinn), 135, 166 Smullyan, Raymond M., 322, 329, 354,
serie determinada por un procedimien- 527-29, 529-30
to, 161 Soare, Robert I., 454
serie natural de los números (Frege), Sobociñski, Boleslaw, 515
170 software, 90, 416
serie numérica, la: véase números solubilidad de todos los problemas
naturales matemáticos, 249n., 293, 306, 539
series trigonométricas, 14-20 Spinoza, 60, 61
Sheffer, H. M., 208n. subconjunto, 2
Shoenfield, Joseph R., 174 subfórmula, 484
signo individual, 500 subtracción, 215
signos como objeto de la aritmética, sujeto y predicado, 134, 136
307 suma mereológica, 181n.
similar (ähnlich); véase conjuntos supremo (cota superior mínima), 69,
similares 202-204, 205, 544, 549
Simplicio, 487 sustantivo (inhaltlich), 123-24, 124n.,
sintáctico/semántico, 210, 275, 278; 125n., 243n., 254, 306, 312n.
véase también deducibilidad; validez sustitución de variables, 370; regla de,
sintaxis, aritmetización: véase aritme- 220, 276n., 302n.; signo de, 234
tización de sintaxis Szabo, M. E., 426, 451
sintético; véase analítico/sintético
sistema (System): sinónimo de ‘conjun- T-computable: véase funciones T-
to’, 10, 74, 121, 152 computables
sistema deductivo, 494-95; para el tablas de verdad, 494
cálculo predicativo de primer orden, Takeuti, Gaisi, 454
496-99; completo: véase cálculo Tarski, Alfred, xi, xii, 98, 210, 251,
completo; correcto: véase cálculo 277, 377, 451, 454
correcto tautología, 241, 261n., 328, 487-88
sistema formal afín a Principia Mathe- Teorema de Cantor, 30, 42, 43, 49, 50,
matica, 315, 322 179, 325, 515n., 516n.
sistema simplemente infinito ordenado Teorema de Church, 353, 354n., 360,
por una aplicación (Dedekind), 156, 369-81, 418-19; uso peculiar del
504; cualquiera sirve de “serie nombre por Kleene, 378n.
numérica”, 506; son todos isomór- Teorema de Completud de Gödel, 273-
ficos, 505 94, 381, 418
Índice de personas y conceptos 588
Teorema de Herbrand, 242, 246, 267-70 228, 322n.; teoría simple, 192-94,
Teorema de la Deducción (TD), 532 322n.; véase también elevación de
Teorema de la Definición por Induc- tipo
ción (TDI), 158, 166, 504-505 topología, 545
Teorema de la Forma Normal de Torretti, Roberto, 71
Kleene, 366, 415n. transfinito, véase aritmética transfinita;
Teorema de la Inducción Completa cardinal; infinito actual; ordinales;
(TIC), 155-56, 161n., 163 principios generadores de Cantor
Teorema de Löwenheim-Skolem, 87, tricotomía, 546, 548
98, 251, 278n., 289; ascendente, trozo final (Endstück) en derivación,
252n. 431
Teorema de Pitágoras, 73 Turing, Alan, 259, 271, 317, 331, 354,
Teorema del Buen Orden, 35, 40, 54, 359, 360, 365, 376, 381-419, 421,
55, 63, 64-65, 66-67, 68, 181, 207, 529
468-70 Ulam, Stanislas, 93
Teorema del Corte de Gentzen, 267n.
Teorema Fundamental del Álgebra, 69 universo del discurso, 56, 252
Teorema fundamental de Post para el Urelemente, 75, 102, 104, 106, 107,
cálculo proposicional, 256-57 109, 475
Teoremas de incompletud de Gödel,
126, 127, 295, 321-58; primer validez, 250, 251n., 377n., 487; véase
teorema: enunciado, 347; demostra- también fórmula válida; sintáctico/
ción, 347-50; discusión general, semántico
326-53; forma abstracta, 527-30; tres valor (de una aplicación en un argu-
corolarios, 352-53; segundo teorema, mento), 541
354-57 valor lógico (Herbrand), 260
teoría de la prueba (Beweistheorie), valor veritativo (Wahrheitswert, truth-
124, 125, 304-16, 340n., 454 value), 136, 241n., 488, 510; véase
Tercero excluido, 9, 117, 118 n., 119, también verdadero/falso
124, 219, 221, 222n., 309-10, 538- valuación parcial, 239
39 valuación, 235, 261
término, 180, 482, 492, 500 van Dalen, Dirk, 119
Tertium non datur, véase Tercero van Stigt, Walter P., 1979
excluido variable, 481, 482, 500; aparente, 241
Tesis de Church, 331, 353, 354n., 360, (véase también variable ligada);
369-81, 386, 417, 418, 494 funcional, 500; general, 263;
Tesis de Turing, 386 individual, 500; libre, 369, 484;
Thiel, Christian, 69-70 ligada, 369, 484; predicativa, 500;
Thomas, W., 51 propia de una inferencia, 425;
Tiles, Mary, 177 proposicional, 482; restringida, 263;
tipo lógico, 180, 192-204; teoría rami- véase también ligar una variable,
ficada, 195-98, 203, 207, 209-10, sustitución de variables
Índice de personas y conceptos 589