El juego de los principios
Alejandro Cassini
El juego de los principios Una introducción al método axiomático
Prólogo de Gregorio Klimovsky
La reproducción total o parcial de este libro –en forma textual o modificada, por fotocopiado, medios informáticos o cualquier otro procedimiento– sin el permiso previo por escrito de la editorial viola derechos reservados, es ilegal y constituye delito.
1.ª edición: julio de 2007 2.ª edición: junio de 2013
© A -Z editora S.A. Paraguay 2351 (C1121ABK) Ciudad Autónoma de Buenos Aires, Argentina Teléfono: (011) 4961-4036 Fax: (011) 4961-0089 Correo electrónico:
[email protected] www.az.com.ar
Cassini, Alejandro El juego de los principios : una introducción al método axiomático. - 2a ed. - Buenos Aires : AZ, 2012. 220 p. ; 24x17 cm. ISBN 978-987-35-0042 978-987-35-0042-8 -8 A-Z, la editoria editoriall argentina orgullosa de ser Marca País.
Libro de edición argentina Hecho el depósito de la ley 11.723 Derechos reservados
1. Enseñanza Universitaria. I. Título CDD 378
Fecha de catalogación: 13/08/2012
Índice general Lista de símbolos - 7. Prólogo - 9. Introducción a la primera edición - 13. Introducción a la segunda edición - 17. Capítulo 1. Breve historia del método axiomático - 19. 1.1 Introducción - 19. 1.2 La axiomática antigua - 19. 1.3 La axiomática moderna - 29. Capítulo 2. La estructura de un sistema axiomático - 55. 2.1 ¿Qué es un sistema axiomático? - 55. 2.2 Elementos de un sistema axiomático - 57. 2.3 Ejemplo de un sistema axiomático - 62. 2.4 Sistemas equivalentes - 69. 2.5 Lógica de primer orden - 70. 2.6 Teorías de primer orden - 73. Capítulo 3. La interpretación de un sistema axiomático - 81. 3.1 Introducción - 81. 3.2 Los conceptos de interpretación y modelo - 82. 3.3 Interpretaciones y modelos de la teoría de grupos - 85. 3.4 Interpretaciones y modelos de la teoría de los anillos - 89. 3.5 Estructuras y modelos - 91. Capítulo 4. Las propiedades de un sistema axiomático - 95. 4.1 Propiedades de los sistemas axiomáticos en general - 95. 4.2 Propiedades de las teorías formales de primer orden - 112. Capítulo 5. Teorías axiomatizadas - 117. 5.1 Introducción - 117. 5.2 La teoría de conjuntos - 118. 5.3 La topología general - 127.
5
EL
JUEGO DE LOS PRINCIPIOS
5.4 La teoría de la probabilidad - 134. 5.5 La teoría de la medición - 143.
Capítulo 6. Ventajas y dificultades del método axiomático - 153. 6.1 Introducción - 153. 6.2 Ventajas generales de la axiomática - 154. 6.3 Dificultades generales de la axiomática - 160. 6.4 El método axiomático en las ciencias formales - 162. 6.5 El método axiomático en las ciencias naturales y sociales - 165. 6.6 Pensamiento axiomático, intuición y certeza - 170. Apéndice 1. Las pruebas de consistencia - 175. Apéndice 2. Axiomas y sistemas axiomáticos: de Aristóteles a Kolmogorov - 183. 2.1 Los tres axiomas de Aristóteles - 183. 2.2 El sistema de Euclides - 184. 2.3 Los axiomas de Arquímedes para la estática - 186. 2.4 La astronomía axiomática de Aristarco - 186. 2.5 La estática de Jordano de Nemora - 187. 2.6 La aritmética axiomática de Jordano de Nemora - 188. 2.7 Los axiomas de la mecánica en Galileo - 189. 2.8 Las leyes del movimiento en Newton - 190. 2.9 La óptica de Newton - 191. 2.10 Los axiomas de Frege para la lógica de primer orden - 193. 2.11 Los axiomas de Peano para la aritmética - 193. 2.12 La axiomática de Hilbert para la geometría euclídea - 194. 2.13 Los axiomas de Huntington para la teoría de las magnitudes continuas - 197. 2.14 Los axiomas de Zermelo para la teoría de conjuntos - 198. 2.15 La topología general de Hausdorff - 199. 2.16 La lógica intuicionista - 199. 2.17 La lógica modal - 201. 2.18 Los axiomas de Kolmogorov para la teoría de la probabilidad - 203. Apéndice 3. El concepto de función - 205. Bibliografía - 209.
6
Lista de símbolos
Lógica
¬ & v
→ ↔ ∀ ∃ = ≠ l–
=
|
⁄
Negación Conjunción Disyunción Condicional Bicondicional Cuantificador universal Cuantificador existencial Identidad Diferencia Deducibilidad Consecuencia lógica Conclusión
Conjuntos
{x : ϕ(x )} ∈ ∉ ∅ U ⊆ ⊂ ∪ ∩ ~ ℘A 〈x, y 〉
Abstracción de conjuntos Pertenencia No pertenencia Conjunto vacío Clase universal Inclusión Inclusión propia Unión Intersección Complemento Conjunto potencia Par ordenado
Las definiciones van precedidas por el símbolo ◊, y los metateoremas por el símbolo . El final de una demostración se indica con el símbolo . Cuando se yuxtaponen varios cuantificadores del mismo tipo escribo de manera abre viada ∀( xyz ...) en vez de ∀ x ∀ y ∀ z ..., y ∃( xyz ...) en vez de ∃ x ∃ y ∃ z ... Otras variantes de la notación y definiciones de los principales conceptos de la lógica y la teoría de con juntos pueden encontrarse en el bre ve diccionario de Detlefsen, McCarty y Bacon (1999). La obra de Mosterín y Torretti (2010) es más amplia y también inclu ye conceptos matemáticos. Todos los términos matemáticos o lógicos empleados en este libro también se hallan definidos, de manera bre ve pero precisa, en el diccionario de matemáticas de Borowski y Bor wein (2006).
7
Prólogo
os antiguos filósofos y matemáticos griegos advirtieron que en la matemática había algo especial que la diferenciaba de las demás ciencias. En tanto estas últimas se fundamentaban en la experiencia y brindaban un conocimiento aproximado y cambiante, la matemática ofrecía información nítida, eterna y absoluta. Uno de los primeros resultados de la investigación matemática (obtenido por Tales de Mileto a comienzos del siglo VI A.C.) establecía que un diámetro divide a un círculo en dos partes iguales. Si el método matemático fuera igual al de las demás ciencias, lo que en realidad se habría establecido es que “tomando un objeto lo más circular posible y un trazo lo más aproximado que se pudiera a un diámetro, el objeto quedaría dividido en dos partes casi iguales”. Pero eso no era lo que afirmaba el matemático, que mencionaba círculos perfectos, diámetros exactos y partes nítidamente iguales, con la idea de que sobre eso no podría haber cambios y su validez sería eterna. ¿Cuál era la razón por la que el matemático poseía esa perfección? ¿Qué método permitía obtener conocimiento con tales características óptimas? Las respuestas fueron muchas y muy diversas, dependiendo de las convicciones filosóficas de cada pensador que reflexionara sobre esta cuestión. Para Aristóteles (siglo IV A.C.) existían dos fuentes para la obtención de este tipo de conocimiento. La primera era de naturaleza lógica y relacionada con la idea de deducción. Como se sabe, un razonamiento es un salto que va de ciertas premisas a una conclusión. Si el razonamiento es correcto, su estructura es tal que garantiza la transmisión de la verdad de las premisas a la conclusión. Dicho de otro modo, debe quedar garantizado que si todas los premisas son verdaderas, la conclusión es verdadera. Adviértase que no se afirma que las premisas sean verdaderas, sino que si lo son, la conclusión debe serlo también. Un razonamiento correcto suele denominarse una deducción (de las premisas a la conclusión). De acuerdo con esto, una manera de obtener una verdad matemática es deduciéndola de verdades ya obtenidas. Esta es una metodología típica de la matemática, y es por ello que se dice que ésta es una ciencia deductiva. Sin embargo, esto no basta para obtener todas las verdades matemáticas. Aristóteles percibió claramente que si dispusiéramos únicamente de la deducción, se produciría un regreso al infinito. Pues tendríamos el problema de saber que las premisas son verdaderas, para lo cual deberíamos haberlas deducido de otras premisas ya conocidadas como verdaderas, y así repetidamente. Para que
L
9
EL JUEGO DE LOS PRINCIPIOS
no se produzca este regreso al infinito, deberían existir premisas cuya verdad se conociera de manera no deductiva. Y esta es la segunda fuente del conocimiento matemático. Se trataría de encontrar afirmaciones que por su simplicidad y obviedad pudieran considerarse evidentes. Estas son las que tomaríamos al comienzo. A partir de ellas, por medio de diferentes etapas deductivas, obtendríamos las restantes verdades matemáticas. La metodología pertinente, según Aristóteles, consiste, entonces, en partir de los principios (las afirmaciones evidentes) y luego deducir las demás afirmaciones, que serían los teoremas. El razonamiento complejo que lleva de los principios a los teoremas se llama una demostración. Aristóteles cree, además, que esta metodología es válida para cualquier ciencia, la que estructurada de este modo se llama “ciencia demostrativa”. Actualmente, diríamos que estamos ante un “sistema axiomático clásico” y el método en cuestión sería el “método axiomático clásico”. Cuando se habla de este modo es porque la costumbre nos ha habituado a llamar axiomas a los principios (Aristóteles no usa “axioma” en este sentido general). El método aristotélico se consideró paradigmático durante más de dos milenios. Pero ya durante el siglo XIX se hizo claro que este procedimiento no garantizaba la obtención de conocimiento científico. La dificultad estaba en la condición de “evidencia” para aceptar los principios. La evidencia es un fenómeno psicológico que no asegura la verdad y puede con frecuencia llevar al error. Un cambio prudente fue que para los principios se exigiera únicamente que fueran buenas hipótesis. De este modo, al menos para las ciencias fácticas o empíricas, el método se transformó en “hipotético-deductivo”, y los “sistemas axiomáticos clásicos” cedieron su lugar a los “sistemas hipotético-deductivos”. Pero si bien esta estrategia fue muy oportuna para la física, la química y, en general, para las ciencias naturales, era claro que no podía utilizarse en el campo de la matemática, donde las afirmaciones (principios y teoremas) no pueden ser hipótesis. En la primera mitad del siglo XIX, cuando se descubrieron las geometrías no euclídeas, la aparición de la noción de “sistema axiomático formal” proporcionó una nueva visión de la naturaleza del lenguaje matemático y de la metodología correspondiente. Se trata de entidades pertenecientes a la lógica aplicada cuyas aplicaciones a las investigaciones contemporáneas son tan importantes que justifican el esfuerzo de examinar con detalle su compleja estructura y sus múltiples usos. No abundan en lengua española los libros dedicados al análisis y discusión del método axiomático formal. Alejandro Cassini ha querido proporcionarnos un libro de texto sistemático que sirva, a la vez, como introducción a la historia de esta metodología. Nos ofrece numerosos ejemplos de sistemas de este tipo, pa-
10
PRÓ´LOGO
ra que se pueda apreciar su utilidad en la matemática moderna, y, además, la discusión de diversas cuestiones lógicas y epistemológicas planteadas por este método. Tenemos que agradecer a Cassini haber logrado una exposición de muy alta calidad y de alto valor informativo acerca de la estructura y de las propiedades de los sistemas axiomáticos formales. Su lectura ubicará al lector de un modo claro y completo en el espíritu del estado actual de la ciencia. No cabe duda de que este libro se transformará en poco tiempo en un clásico sobre el tema.
Gregorio Klimovsky Profesor Emérito de la Universidad de Buenos Aires
11
Introducción a la primera edición
ste libro es el producto de una necesidad pedagógica. Hay muy pocos libros específicos dedicados al método axiomático, no sólo en español, sino en cualquier otra lengua, que traten el tema a un nivel relativamente introductorio, pero de manera completa y detallada. Resulta difícil, por consiguiente, encontrar un texto adecuado para un curso dirigido a estudiantes universitarios que se encuentran en los primeros años de su carrera. He escrito este trabajo pensando especialmente en estudiantes de filosofía y de humanidades que asisten a cursos o seminarios de lógica, de epistemología o de filosofía de la ciencia. He presupuesto por parte del potencial lector un conocimiento elemental del lenguaje de la lógica de primer orden y de la teoría intuitiva de conjuntos. No obstante, todos los temas tratados se explican desde el principio, por lo que cualquier persona interesada con alguna aptitud para el pensamiento formal podrá seguir el núcleo de la exposición sin mayores obstáculos. He mantenido de manera deliberada algunas repeticiones con el fin de facilitar la asimilación de ciertas ideas claves. Esta obra no se propone reemplazar a ningún tratado o manual de lógica, sino complementar los libros de texto usuales, que generalmente dedican poco espacio al método axiomático. También puede utilizarse como texto principal o secundario en un curso de filosofía de la matemática. Espero, además, que resulte interesante para todos aquellos que gustan de la matemática y de las ciencias en general. En la presentación de los temas he tratado de lograr un balance entre los elementos históricos, la formulación de sistemas formales lógico-matemáticos y las reflexiones filosóficas o epistemológicas sobre el método axiomático. También he procurado equilibrar el rigor formal con la exposición informal, pero no me propuse alcanzar el grado de precisión propio del lógico o el matemático profesional. He comentado con cierta extensión las propiedades metateóricas de los sistemas formales axiomatizados, pero no he brindado las correspondientes demostraciones, que en general son extensas o difíciles y caen fuera de los ob jetivos de un libro introductorio como éste. En cambio, he ofrecido numerosos ejemplos de sistemas axiomáticos, casi siempre, aunque no exclusivamente, de primer orden; entre otros, de lógica proposicional y cuantificacional, teoría de grupos y anillos, álgebra de Boole, aritmética de los números naturales, geometría euclídea, teoría de la probabilidad, teoría de conjuntos y muchos otros. También he dado varios ejemplos de demostraciones de teoremas en algunos de estos sistemas. Por último, he traducido numerosos sistemas axiomáticos
E
13
EL JUEGO DE LOS PRINCIPIOS
que tienen interés histórico como representativos de las diversas etapas en el desarrollo del método axiomático. Al final de cada capítulo he incluido breves comentarios sobre lecturas ulteriores que remiten a la bibliografía final. En dicha bibliografía, que ya es bastante extensa, sólo presento obras generales y colecciones de artículos, pero, salvo excepciones, no incluyo artículos especializados ni fuentes históricas anteriores al siglo XX. Muchos de los libros allí citados tienen un carácter más avanzado que el de esta obra. En ellos pueden encontrarse otras referencias bibliográficas más especializadas. He tratado de tomar en cuenta la bibliografía sobre el tema escrita originalmente en lengua española. Sólo he incluido referencias a traducciones en los casos en los que las he utilizado. Las citas de las fuentes traducidas en el Capítulo 1 y en el Apéndice 2 se indican de manera completa en el lugar correspondiente. Los contenidos del libro son los siguientes. En el Capítulo 1 hago una bre ve síntesis de la historia del método axiomático, necesariamente esquemática y simplificada, que se complementa con los textos presentados en el Apéndice 2. En el Capítulo 2 analizo la estructura sintáctica de los sistemas axiomáticos formales y presento varios ejemplos de sistemas de primer orden y de demostraciones de teoremas dentro de estos sistemas. En el Capítulo 3 introduzco los elementos esenciales de la semántica de los sistemas formales y los ejemplifico con sistemas axiomáticos de álgebra elemental. El parágrafo final de este capítulo contiene algunas nociones más precisas de teoría de modelos, pero esta exposición dista mucho de ser exhaustiva y no pretende reemplazar a un texto de esta disciplina. En el Capítulo 4 analizo las propiedades metateóricas de los sistemas axiomáticos y enuncio las principales relaciones que existen entre estas propiedades. La presentación de este tema es fundamentalmente informal y no desarrolla cada una de las pruebas metateóricas. En el Capítulo 5 presento cuatro teorías matemáticas axiomatizadas y las analizo con mayor detalle que los ejemplos de los capítulos anteriores. Estas son la teoría de conjuntos, la topología general, la teoría de la probabilidad y la teoría de la medición. Este capítulo tiene un carácter un poco más técnico que los restantes del libro y, en una primera lectura, puede omitirse sin pérdida de continuidad. Finalmente, en el Capítulo 6 ofrezco algunas reflexiones epistemológicas sobre las ventajas y desventajas del método axiomático en las ciencias formales, sobre sus posibles aplicaciones al campo de las ciencias empíricas y sobre los límites del pensamiento axiomático en general. En el Apéndice 1 analizo con algún detalle el tema de las pruebas de consistencia, aunque no brindo ejemplos completos de esta clase de pruebas, que deben buscarse en obras más especializadas. En el Apéndice 2 traduzco las bases axiomáticas de varios sistemas antiguos y modernos que tienen interés histórico. En el Apéndice 3 caracterizo el concepto de función, que es el único concepto matemático presupuesto en el texto. En su 14
INTRODUCCIÓN A LA PRIMERA EDICIÓN
conjunto, estos capítulos y apéndices ofrecen una síntesis histórica y sistemática sobre el método axiomático. El lector que sólo esté interesado en los aspectos históricos puede leer el Capítulo 1 y el Apéndice 2. El que desee entrar directamente en la axiomática formal moderna puede empezar por el Capítulo 2 y continuar hasta el Apéndice 1. Al escribir este texto he contraído numerosas deudas intelectuales. La ma yor es con Gregorio Klimovsky, de quien aprendí mucho sobre el método axiomático, aunque probablemente él no suscribiría todas mis afirmaciones. Estoy especialmente agradecido a Roberto Torretti, que leyó una versión anterior de este libro y me envió por escrito extensos comentarios críticos. Sus observaciones me permitieron no sólo corregir varios errores o imprecisiones conceptuales, sino también mejorar la presentación de diversos temas. Por su parte, el propio Klimovsky leyó la versión final del manuscrito y me ayudó a corregir detalles técnicos y eliminar imprecisiones en algunas definiciones. Por ello también le estoy muy agradecido. El profesor Edward Grant, de la Universidad de Indiana, respondió amablemente a mi pedido de informaciones sobre los textos de Jordano de Nemora que traduzco en el Apéndice 2. Newton C. A. Da Costa y Jesús Mosterín colaboraron involuntariamente con esta obra enviándome, a lo largo de los años, muchos de sus trabajos. También me he beneficiado de con versaciones sostenidas en diferentes momentos de la preparación de este libro con mis colegas de la Universidad de Buenos Aires Javier Legris y Alberto Moretti. Varias estadías en la Universidad de Columbia en Nueva York, entre los años 1999 y 2001, me permitieron el acceso a gran parte de la bibliografía aquí empleada y me proporcionaron el tiempo libre y la tranquilidad necesaria para redactar una buena porción de este trabajo. Desde entonces lo he revisado varias veces agregándole nuevos ejemplos y referencias actualizadas. Durante todo ese tiempo tuve el respaldo decisivo del Consejo Nacional de Investigaciones Científicas y Técnicas de la Argentina, sin el cual difícilmente podría haber concluido este libro. A Eleonora Cresto le debo no sólo la discusión de muchos detalles técnicos, sino también el apoyo necesario para llevar a cabo toda la tarea que demandó esta obra desde sus modestos orígenes como borrador. Finalmente, quiero agradecer a Eduardo Barrio que me alentó a publicarlo. Por supuesto, yo soy el único responsable de los errores que haya en el texto. En todo momento tuve presente que quería escribir el tipo de libro sobre el método axiomático que me hubiera gustado leer y nunca pude encontrar. Espero que los lectores disfruten al leerlo. Alejandro Cassini Buenos Aires, julio de 2007
15
Introducción a la segunda edición
a primera edición de este libro se agotó en poco menos de tres años. Me complace saber que se lo ha utilizado en diversos cursos universitarios para filósofos y humanistas, ya que esa era su finalidad principal. Desde el momento mismo de su aparición fui consciente de que necesitaba revisiones y correcciones, en algunos casos importantes. Tuve, además, la suerte de recibir extensos comentarios, críticas y sugerencias de filósofos, lógicos y matemáticos que me estimularon y me hicieron reflexionar sobre muchos temas. No he podido incorporarlas todas en esta nueva edición, ya que en algunos casos exceden el nivel técnico de la obra o el espacio asignado a cada tema, pero las agradezco sinceramente. La lista de personas que contribuyeron con sus observaciones y discusiones orales o escritas es demasiado larga como para exponerla aquí y, si lo hiciera, seguramente, cometería alguna omisión involuntaria. Quiero, sin embargo, agradecer explícitamente la ayuda que me brindaron Eleonora Cresto, Hernán González, Javier Legris y Diego López Rosende en la revisión del manuscrito y la preparación de las correcciones incorporadas. En esta segunda edición revisada he mantenido la estructura original del libro, sin agregar capítulos nuevos. He corregido todas las erratas detectadas y he reescrito numerosos párrafos de todos los capítulos con el fin tanto de eliminar errores e imprecisiones como de expresar más claramente algunas ideas y conceptos. He actualizado la bibliografía y he agregado al Apéndice 2 un parágrafo nuevo, dedicado a la lógica modal, y he ampliado el parágrafo dedicado a la lógica intuicionista. También he suprimido algunos pasajes que me parecían redundantes o inadecuados a lo largo de toda la obra. Entre los cambios más importantes que presenta esta edición se cuentan los siguientes: he revisado y reescrito, y en algunos casos ampliado considerablemente, los párrafos dedicados a las paradojas de Russell y de Cantor, a los teoremas de Gödel y de Löwenheim y Skolem, a la lógica intuicionista, al axioma de elección de la teoría de conjuntos, a la teoría de la probabilidad y a la extensión y revisión de teorías. Finalmente, he agregado una explicación de los conceptos de consecuencia demostrativa, de decidibilidad formal y de κ-categoricidad, que no aparecían en la primera edición. La obra conserva su carácter introductorio y su enfoque clásico, esto es, pri vilegia a las teorías de primer orden formuladas en el marco de la lógica cuantificacional clásica. Creo que el conocimiento de este terreno tradicional y ya
L
17
EL
JUEGO DE LOS PRINCIPIOS
bien explorado es una condición indispensable para aventurarse en regiones menos conocidas, como las teorías de segundo orden o las lógicas no clásicas. No se sigue de ello, sin embargo, que considere que la lógica clásica de primer orden sea la única posible, ni tampoco que sea suficiente para la formulación axiomática de todas las teorías matemáticas o empíricas. Seguramente, el conocimiento científico es demasiado amplio y complejo como para expresarlo mediante una sola lógica. Al volver a leer el propio trabajo luego de algún tiempo se siente la tentación de reescribirlo completamente, pero no siempre resulta factible o conveniente hacerlo, pues el resultado no sería una edición revisada, sino un nuevo libro. Por otra parte, la experiencia indica que no es posible satisfacer simultáneamente las expectativas de todos los posibles lectores interesados en un mismo tema general, ya que ellas resultan frecuentemente incompatibles entre sí. En cualquier caso, es seguro que esta edición contiene algunos errores menos que la primera. Los que subsisten son, por supuesto, de mi entera responsabilidad. En abril de 2009, precisamente cuando comenzaba a preparar las primeras revisiones y correcciones para esta edición, se produjo el fallecimiento de Gregorio Klimovsky, quien me hizo el honor de escribir el prólogo para la primera edición de mi libro. A él dedico, entonces, esta segunda edición.
Alejandro Cassini Buenos Aires, junio de 2013
18
1
Breve historia del método axiomático
1.1 Introducción
a historia del método axiomático se extiende desde la antigua Grecia del siglo IV A.C. hasta nuestros días. El relato de este largo proceso, que presenta rupturas significativas pero también continuidades sorprendentes, constituye el tema de todo un libro. Aquí sólo ofreceremos una introducción histórica con el fin de señalar las principales etapas que llevaron a la construcción del método axiomático formal tal como se practica en la actualidad. La exposición es deliberadamente retrospectiva y nos servirá para introducir de manera informal los componentes de un sistema axiomático, que luego se estudian con más detalle en los capítulos posteriores.
L
1.2 La axiomática antigua Aristóteles
Las ideas esenciales del método axiomático surgieron en el seno de la civilización griega, asociadas a los problemas suscitados por el concepto de demostración, especialmente en las ciencias matemáticas. Desde los tiempos de los antiguos griegos se consideró que el conocimiento demostrado era el saber más seguro. Pero, ¿qué es una demostración? Esta es una pregunta para la cual todavía no tenemos una respuesta unánime y definitiva. Los griegos tuvieron el mérito de planteársela por primera vez y de sugerir una respuesta que reinó en el pensamiento occidental por más de dos milenios. La demostración de un enunciado o proposición consiste en deducirlo de otros enunciados cuya verdad se conoce previamente. Dado que las inferencias deductivas preservan la verdad de las premisas y la transmiten a la conclusión, las proposiciones deducidas de proposiciones verdaderas, si han sido correctamente deducidas, necesariamente resultarán también verdaderas. Esta idea de demostración tuvo su origen en la matemática griega, especialmente en la práctica de las pruebas geométricas, pero fue Aristóteles, en el siglo IV A.C., el primero en expresarla claramente y presentarla de un modo sistemático. Aristóteles descubrió, además, el hecho fundamental de que las inferencias deductivas correctas preservan la verdad de las 19
TICO BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
premisas en razón de la mera forma o estructura de la inferencia. Con ello inició el estudio de la lógica formal. El primer problema que plantea la idea griega de demostración es, sin duda, el de distinguir entre las inferencias deductivas correctas e incorrectas. Platón y su escuela se ocuparon de analizar diferentes tipos de argumentos y clasificarlos según su corrección o incorrección. Pero sólo Aristóteles construyó la Pri- primera teoría general de las inferencias formalmente válidas. En su obra Pri- meros analíticos (aproximadamente 340 A.C.) estudió detenidamente una clase de inferencias deductivas, que hoy llamamos silogismos, y consiguió determinar claramente la forma de las inferencias que preservaban la verdad de las premisas. Además, mostró cuáles eran las formas inválidas de silogismos mediante el método de los contraejemplos. Este consistía en probar que una forma de silogismo era inválida construyendo un ejemplo de esa forma que tuviera premisas verdaderas y conclusión falsa. De esta manera, se descartan una a una las formas de silogismo que no garantizan la transmisión de la verdad de las premisas a la conclusión. Las formas aceptadas son aquellas que no tienen contrae jemplos, es decir, aquellas para las cuales no es posible construir un razonamiento que tenga premisas verdaderas y conclusión falsa. ¿Pero cómo podemos saber que esas reglas de inferencia realmente no tienen contraejemplos o no los tendrán en el futuro? Aristóteles nada dice al respecto. Y, en sentido estricto, todavía no lo sabemos, ya que el problema de la justificación de las reglas de inferencia es una cuestión abierta en nuestros días. La segunda dificultad de la idea griega de demostración aparece cuando se pretende que todo conocimiento sea demostrado. En su obra Segundos analíti- cos (aproximadamente 330 A.C.) Aristóteles se ocupó con todo detalle de este problema, que perturbaba a sus antecesores y contemporáneos. Como vimos, la demostración de un enunciado consiste en deducirlo de otros enunciados pre viamente conocidos como verdaderos, que operan como premisas de la demostración. Sin embargo, también se puede pedir una demostración de esas premisas, para lo cual será necesario deducirlas de otros enunciados. Es evidente, pensaba Aristóteles, que este procedimiento no puede seguir indefinidamente, pues nos conduce a una regresión al infinito en las demostraciones, formándose una cadena deductiva que no tiene comienzo. Esta situación le pareció inaceptable porque dejaba a toda la secuencia de demostraciones sin un fundamento último y seguro. Pero hay otras posibilidades. Una de ellas consiste en demostrar todos los enunciados deduciéndolos de sí mismos. Aristóteles la llama demostración recíproca y la descarta rápidamente porque la considera trivial. Por cierto, no es objetable desde un punto de vista puramente lógico (por el contrario, actualmente consideramos que el hecho de que todo enunciado se deduce de sí mismo es una propiedad esencial de la relación de consecuencia lógica). Pero sí es epistemológicamente trivial, porque una demostración exige 20
L A
AXIOMÁ ´ TICA TICA ANTIGUA :
A RISTÓ RISTÓ´ TELES
partir de premisas conocidas como verdaderas, de modo que para probar deductivamente la verdad de cada enunciado ya deberíamos conocerla de antemano. La tercera posibilidad consiste en aceptar demostraciones circulares (pero no recíprocas), donde las premisas de ciertas demostraciones aparecen como conclusiones de otras y viceversa. Se forman así cadenas deductivas finitas pero cerradas. Aristóteles considera que esto implica un círculo vicioso inadmisible, que nuevamente dejaría sin fundamento, y por tanto sin una razón, a toda la secuencia de demostraciones. La última posibilidad que Aristóteles analiza es la que dará origen a la idea de pensamiento axiomático. Aristóteles pensó que era posible evitar el escepticismo respecto de la demostración aceptando que no todo conocimiento es demostrativo. Toda secuencia de demostraciones debe ser finita y terminar en algún momento en un conjunto de enunciados fundamentales que no se conocen por medio de demostración. Aristóteles los llamó principios, o mejor primeros principios principios, y los consideró no meramente como enunciados no demostrados, sino en sí mismos indemostrables. Los concibió como verdades necesarias que no pueden ser demostradas. Nunca afirmó explícitamente que fueran verdades evidentes, pero ya los comentadores griegos tardíos lo interpretaron de esa manera, y la idea de que los principios son evidentes se convirtió en un lugar común del aristotelismo medieval y así pasó a la Modernidad. Aristóteles no resolvió claramente el problema de cómo se conocen los principios indemostrables, pero dejó indicaciones muy escuetas de que se trata de un proceso en el que intervienen tanto la generalización inductiva a partir de casos de percepción como la intuición intelectual de los conceptos universales. Los principios son verdades que naturalmente se conocen por sí mismas y, como tales, son el objeto de una forma de conocimiento superior a la ciencia, que Aristóteles llamó nous o intuición intelectual. A partir de estas ideas se forjó la concepción tradicional según la cual los principios de un sistema axiomático son verdades autoevidentes. Se puede considerar a Aristóteles como el padre fundador del método axiomático porque fue él quien presentó por primera vez la idea de sistematización deductiva de una teoría tomando como punto de partida un conjunto reducido de principios, de los cuales se infieren los restantes enunciados de la teoría. Los Segundos analíticos contienen un análisis verdaderamente detallado, aunque no siempre claro, del concepto aristotélico de demostración científica y de las condiciones requeridas para la organización deductiva de una teoría. Aristóteles no llamó axiomas a todos los principios de una teoría, sino únicamente a aquellos que son comunes a todas las ciencias, como los principios lógicos de no contradicción y de tercero excluido, o el principio que afirma que “si de iguales se sustraen iguales, los restos son iguales” (Véase el Apéndice 2.1). A los principios específicos de cada ciencia particular los denominó principios propios , y los concibió como definiciones reales o esenciales acerca de las entidades que 21
TICO BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
cada ciencia toma como objeto de estudio. Cada ciencia particular se refiere, en efecto, a un determinado género de entidades reales. Actualmente no hacemos esta distinción y llamamos genéricamente axiomas a todos los enunciados que se aceptan sin demostración y constituyen el punto de partida de las demostraciones en una teoría determinada. Una teoría científica, según Aristóteles, es una estructura ordenada deducti vamente formada por los principios o verdades indemostrables y por todos los enunciados deducidos válidamente de tales principios. Esto último supone que se han codificado las reglas de inferencia que permiten realizar deducciones válidas a partir de los principios. Aristóteles creó para ello su teoría del silogismo, que constituye un fragmento pequeño, pero perfectamente válido, de la parte de la lógica formal básica que hoy denominamos lógica cuantificacional. Consecuentemente, exigió que todas las demostraciones científicas tuvieran la forma lógica de un silogismo, más precisamente de uno de la primera figura, el llamado Barbara, al que consideraba el silogismo más perfecto. Desde el punto de vista actual, esta idea constituye una seria limitación, ya que la teoría silogística resulta insuficiente como herramienta lógica para construir un sistema axiomático. Dejando de lado este defecto, podemos advertir que el modelo ideal de ciencia que Aristóteles propone contiene tres elementos esenciales del método reglas axiomático, que hoy denominamos, respectivamente, axiomas, teoremas , y reglas de transformación . Los axiomas corresponden a los primeros principios aristotélicos, que él concibió como enunciados necesariamente verdaderos y en sí mismos indemostrables. Los teoremas, por su parte, corresponden a los enunciados demostrados mediante deducciones que toman a los principios como premisas. Finalmente, la teoría del silogismo proporciona las reglas de transformación, es decir, las reglas de inferencia que permiten deducir los teoremas de los axiomas. Como veremos más adelante, hay otros elementos esenciales de un sistema axiomático que no aparecen en el modelo aristotélico de ciencia, por lo que no puede decirse que Aristóteles haya presentado de modo completo una teoría del método axiomático. No obstante, Aristóteles también tuvo la intuición, aunque no la formuló precisamente, de otra idea fundamental del pensamiento axiomático. Este es el concepto de clausura deductiva de una teoría, según el cual, en una teoría axiomática todos los enunciados deducibles de los axiomas pertenecen a la teoría. Adviértase, sin embargo, que si definimos a una teoría axiomática como el conjunto de todos los enunciados deducibles de los axiomas, esto excluye a los propios axiomas de la teoría dentro del modelo aristotélico. La razón de ello se encuentra en la teoría del silogismo, ya que silogísticamente no es posible deducir un enunciado de sí mismo (en un silogismo ningún enunciado puede aparecer a la vez como premisa y como conclusión). Por consiguiente, ningún axioma se deduce de sí mismo. Esta es una de las limitaciones del 22
L A
AXIOMÁ ´ TICA TICA ANTIGUA :
EUCLIDES
silogismo como herramienta lógica para un sistema deductivo. Para ser más precisos, debemos caracterizar a una ciencia aristotélica como la unión de dos conjuntos de enunciados: el de los principios y el de todas las consecuencias lógicas que mediante un silogismo en Barbara se obtienen de los principios. Euclides
Aristóteles representa el comienzo del pensamiento axiomático porque proporciona una teoría de la ciencia que contiene algunos de los elementos esenciales del método axiomático. Con todo, él mismo no construyó ningún sistema axiomático, ni aplicó consecuentemente su teoría de la ciencia en sus investigaciones científicas concretas, por ejemplo, en sus lecciones de física o en sus tratados biológicos. La primera realización del método axiomático corresponde a Elementos (aproximadamente 300 A.C.) axiomatizó la Euclides, quien en su obra Elementos geometría de manera más o menos completa y acabada. Esta fue la primera teoría axiomatizada y durante muchos siglos el único ejemplo de una axiomatización verdaderamente satisfactoria. La relación entre los modelos deductivos de Aristóteles y Euclides ha sido muy discutida. Existen al respecto dos hipótesis interpretativas tradicionales que ya no tienen consenso entre los especialistas. La primera es la que afirma que la obra de Euclides es una aplicación de la teoría aristotélica de la ciencia. La segunda sostiene que, a la inversa, la teoría aristotélica está inspirada por la práctica de los geómetras, de la cual la obra de Euclides sería una síntesis. Ambas hipótesis presuponen que las teorías del método axiomático de Aristóteles y Euclides son esencialmente semejantes, pero los estudiosos del tema han revelado diferencias importantes, que aquí sólo podemos indicar someramente. En suma, ninguna de estas dos hipótesis resulta actualmente sostenible y sólo pueden aceptarse ambas como parcialmente verdaderas. Es muy probable que no exista una relación simple y directa entre la teoría aristotélica y la realización euclídea, pero carecemos de las fuentes históricas necesarias como para precisarla. En la obra de Euclides encontramos otro componente esencial de un sistema axiomático, las definiciones nominales de los términos técnicos del sistema, que no estaba explícito en el modelo aristotélico. Euclides comienza sus Ele- mentos introduciendo numerosas definiciones de diversos términos técnicos de la geometría, tales como los de “punto”, “superficie”, “recta”, “figura”, “diámetro” y muchos otros. Reconoce de esta manera que toda teoría científica, y en particular un sistema axiomático, tiene un vocabulario específico que debe ser cuidadosamente explicitado. Nuevamente se presenta aquí una dificultad, ya que si intentamos definir todos los términos del lenguaje de una teoría nos veríamos envueltos, como en el caso de la demostración, en un círculo lógico, o bien en la necesidad de introducir cada vez más términos llegando así a una regresión 23
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
al infinito en las definiciones. La solución de este problema consiste en distinguir dos clases de términos específicos del vocabulario de una teoría axiomática: los términos primitivos o no definidos, que se aceptan sin definición ni explicación aclaratoria alguna, y los términos definidos , que se definen explícitamente por medio de los términos primitivos (empleando además ciertos signos lógicos y de puntuación). Es fácil advertir la analogía que existe entre axiomas y teoremas por un lado, y términos primitivos y definidos por el otro. Aristóteles y Euclides tuvieron clara conciencia de la primera de estas distinciones entre dos tipos de enunciados de la teoría, pero respecto de los términos se expresaron de manera más confusa. En particular, no reconocieron la necesidad de brindar una lista exhaustiva de términos primitivos de cada teoría, algo que es una exigencia indispensable del método axiomático. En los Elementos, Euclides ofrece 132 definiciones de términos geométricos, pero no proporciona una enumeración siquiera parcial de los términos primitivos. Probablemente tomara como no definidos a ciertos términos de su propio lenguaje natural, el griego, cu yo significado considerara suficientemente claro para todo lector de su obra. Ejemplos de sus definiciones son las siguientes: 1. “Punto es lo que no tiene partes”; 2. “Línea es una longitud sin anchura”; y 5. “Superficie es lo que sólo tiene longitud y anchura” (véase el Apéndice 2.2 para una lista completa). Para construir el lenguaje de un sistema axiomático formalizado no basta con especificar los términos que componen el vocabulario, sino que es necesario precisar cómo se han de formar los enunciados que se considerarán bien construidos en el sistema. Este papel lo desempeñan las reglas de formación , que nos indican la manera correcta de construir enunciados con los términos del vocabulario del sistema. Ni Aristóteles ni Euclides incluyeron en sus obras este componente de los sistemas axiomáticos. La razón de esta ausencia es fácilmente explicable. Las teorías axiomáticas de los griegos no eran sistemas formalizados, es decir, no se expresaban en un lenguaje artificial desprovisto de significado y estrictamente regimentado. Empleaban, en cambio, el lenguaje natural que hablaban sus autores, complementado con algunos términos técnicos definidos. El papel de las reglas de formación lo desempeñaban, de manera implícita, las reglas gramaticales de la lengua griega, más precisamente, las reglas sintácticas que indicaban cómo formar oraciones combinando las palabras correctamente. Las reglas de formación de un sistema axiomático formalizado son, en efecto, semejantes a las reglas sintácticas de una lengua natural. La formalización no es un requisito esencial de un sistema axiomático en general. Aunque a veces sea conveniente, no es siempre necesario formular el sistema en un lenguaje artificial regimentado. La geometría de Euclides es a la vez un ejemplo de un sistema axiomático no formalizado y no abstracto o formal, sino concreto o material. Más adelante, cuando estudiemos el surgimiento de la axiomática formal contemporánea, aclararemos estas distinciones. 24
L A
AXIOMÁ ´ TICA ANTIGUA :
EUCLIDES
Euclides, a diferencia de Aristóteles, no hizo explícitas las reglas de transformación o de inferencia que podían emplearse en su sistema para realizar las demostraciones geométricas. No utilizó el silogismo aristotélico, pero sus demostraciones muestran una variedad muy amplia de procedimientos inferenciales que presuponen reglas de tipo proposicional. El método de prueba más famoso de Euclides, quien seguramente lo tomó de la práctica de los geómetras de varias generaciones anteriores, es la demostración por el absurdo , que consiste en partir de la negación del enunciado que se quiere probar, deducir de allí una contradicción, y concluir, entonces, con la afirmación del enunciado originalmente negado. La regla de reducción al absurdo es la que permite esta clase de razonamiento: ¬ χ → ( ψ & ¬ ψ ) / χ (donde χ y ψ son dos proposiciones cualesquiera y el símbolo / indica la conclusión). Aquí encontramos una diferencia importante con las reglas de inferencia aceptadas por Aristóteles, quien sostuvo enfáticamente que toda demostración debía ser afirmativa y directa, y rechazó las pruebas indirectas y negativas como las que emplean la reducción al absurdo. Euclides incluyó en su sistema tres clases de principios: las definiciones, los postulados y los axiomas. La distinción entre postulado y axioma se corresponde, de manera bastante imperfecta, con la distinción aristotélica entre principios propios y principios comunes o axiomas. El criterio de la distinción euclídea es poco claro y ha sido muy discutido. Los postulados son enunciados que se refieren a la construcción de rectas y círculos mediante regla y compás con el ob jetivo aparente de garantizar la existencia de los correspondientes objetos geométricos. Euclides enuncia cinco postulados, de los cuales citaremos el primero: “Trazar una línea recta desde cualquier punto hasta cualquier punto”, y el célebre quinto, o postulado de las paralelas: “Si una recta que cae sobre otras dos rectas hace a los ángulos interiores de un mismo lado menores que dos rectos, entonces, si las dos rectas se prolongan indefinidamente, se encuentran del lado en el que los ángulos son menores que dos rectos”. El cuarto postulado es diferente de los restantes porque no se refiere a construcciones (véase el Apéndice 2.2). Los axiomas, por su parte, son enunciados muy generales aplicables a diversas disciplinas matemáticas, no sólo a la geometría. Euclides no lista todos sus axiomas al comienzo de su obra, por lo que el número total de ellos ha sido discutido. Hoy se acepta generalmente que dichos axiomas son seis, de los cuales citaremos los cinco primeros, que aparecen en la lista con que empiezan los Elementos: 1. “Las cosas que son iguales a una misma cosa son iguales entre sí”; 2. “Si iguales se añaden a iguales, los totales son iguales”; 3. “Si iguales se sustraen de iguales, los restos son iguales”; 4. “Las cosas que coinciden entre sí son iguales entre sí”; 5. “El todo es mayor que la parte”. Los Elementos contienen 465 demostraciones. Euclides divide a las proposiciones demostradas en dos clases: problemas y teoremas. Ambos se demuestran a partir de los primeros principios, pero los problemas se refieren a la construcción 25
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
de figuras geométricas, mientras que los teoremas establecen las propiedades esenciales de dichas figuras. Por esta razón, los problemas se deducen fundamentalmente de los postulados, mientras que los teoremas se deducen de las definiciones y los axiomas. En la axiomática contemporánea, no se ha mantenido la distinción euclídea entre postulados y axiomas, ni entre problemas y teoremas. Actualmente llamamos simplemente axiomas a los enunciados que se aceptan sin demostración y teoremas a los enunciados demostrados tomando a los axiomas como premisas. Euclides pensó, al igual que Aristóteles, que los axiomas y postulados eran enunciados verdaderos que no necesitaban demostración. La tradición matemática griega también atribuyó el carácter de evidentes a los principios de la geometría euclídea, e inició un largo debate acerca del quinto postulado, cuestionado precisamente por su falta de evidencia. Los restantes principios euclídeos se consideraron como enunciados necesarios que proporcionaban verdades evidentes acerca del espacio físico real. Los teoremas, por su parte, representaban una descripción de las propiedades necesarias del espacio físico. La geometría euclídea fue durante más de dos milenios un ejemplo de conocimiento necesario acerca del mundo real. La creencia de que tal conocimiento era posible se apoyó en la obra de Euclides e influyó decisivamente en los filósofos racionalistas de la Modernidad. El tratado de Euclides fue de hecho la más importante realización concreta del método axiomático legada por la Antigüedad. A la vez, fue la teoría científica más exacta y rigurosa hasta el siglo XIX, constituyendo un canon pedagógico empleado hasta principios del siglo XX. La axiomática euclídea tiene, sin embargo, algunos defectos importantes cuando se la analiza desde el punto de vista actual. En muchos aspectos es incompleta y sus demostraciones no son suficientemente rigurosas. Euclides no ofrece términos primitivos en sentido estricto, sino que intenta definir todos los términos geométricos fundamentales, como “punto”, “recta” y “plano”. Los comentadores de los Elementos han advertido que no se las puede tomar como definiciones precisas, porque como tales serían defectuosas, sino como elucidaciones parciales del significado de estos términos. Por otra parte, hay definiciones explícitas que se enuncian al comienzo de la obra, pero luego no se usan en ninguna demostración. A la inversa, hay demostraciones que emplean como premisas ciertos enunciados no demostrados que no se encuentran en la lista de principios, lo cual constituye un defecto más grave. Finalmente, no hay una caracterización de qué es una demostración ni de cómo reconocerla. Si se suma a ello el hecho de que Euclides no hace explícitas las reglas de inferencia de su sistema, se obtiene la consecuencia de que las pruebas euclídeas resultan casi siempre bastante informales, mucho más que lo admisible en la matemática actual. Cualesquiera sean los defectos de la axiomática antigua, no cabe duda de que Aristóteles y Euclides deben considerarse como los fundadores del método 26
L A
´ TICA ANTIGUA : DE AXIOMÁ
A RISTARCO A PROCLO
axiomático. Ambos reconocieron la característica esencial de este método que consiste en postular ciertos enunciados que se aceptan sin demostración y deducir de ellos los restantes enunciados que componen una teoría. Será necesario que pasen muchos siglos para que las realizaciones de los griegos sean perfeccionadas y extendidas a otros dominios. De Aristarco a Proclo
El método axiomático tuvo su mayor logro en el campo de la geometría griega, y la identificación entre ambos llegó hasta tal punto que desde la época helenística se llamó estilo o modo geométrico a la presentación axiomática de cualquier teoría. El método axiomático surgió entre los griegos como una forma de obtener certeza en el conocimiento. Esencialmente fue el resultado de un esfuerzo por encontrar una forma de argumentación rigurosa que pudiera oponerse al discurso meramente persuasivo de la retórica y de la sofística. Visto de esta manera, el método axiomático resulta característico del conocimiento científico en general y lo distingue de otras formas de conocimiento. Que los griegos lo entendieron de esta manera lo prueba el hecho de que intentaron extender la aplicación de este método más allá del campo de la geometría. Ya Aristóteles, por cierto, lo había considerado como el método apropiado para toda ciencia empírica, aunque de hecho no construyera ningún sistema axiomático concreto en ninguna ciencia en particular. Euclides, en cambio, es autor de un bre ve tratado de óptica escrito al modo axiomático. La Óptica de Euclides emplea 7 postulados y prueba 58 proposiciones. Los postulados aparecen bajo el título de “definiciones”, pero es evidente que no son definiciones. No aparecen listados axiomas ni auténticas definiciones. Se trata, en suma, de una obra mucho menos lograda que los Elementos, pero notable por el hecho de aplicar el método axiomático a cuestiones de óptica que exceden el campo de la pura geometría. Aristarco de Samos nos es conocido principalmente por haber concebido un sistema planetario heliocéntrico precursor del de Copérnico. Sin embargo, la única obra de Aristarco que se ha conservado, el breve tratado Sobre los tama- ños y las distancias del Sol y la Luna (escrito probablemente en el primer tercio del siglo III A.C.), consiste en una aplicación del método axiomático a la astronomía. Ello no es inesperado dado que en la antigüedad la astronomía se concebía como una parte de la matemática. Aristarco se propuso demostrar rigurosamente algunas proposiciones acerca de las distancias relativas del Sol, la Luna y la Tierra, tales como, por ejemplo, la siguiente: “La distancia del Sol a la Tierra es mayor que 18 veces, pero menor que 20 veces, la distancia de la Luna
”. Para ello apeló al estilo geométrico enunciando 6 axiomas, a los que llama hipótesis, y demostrando 18 teoremas a partir de tales axiomas 27
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
(véase el Apéndice 2.3). Los resultados de Aristarco son groseramente erróneos desde nuestra perspectiva actual (por ejemplo, la distancia entre la Tierra y el Sol es, según nuestras mediciones, aproximadamente 390 veces mayor que la distancia entre la Tierra y la Luna). Sin embargo, todavía nos resulta sorprendente la audacia de su intención de emplear el método axiomático en un dominio en el que todavía hoy no hemos conseguido aplicarlo. Después de Euclides los mayores aportes al método axiomático los realizó Arquímedes. Arquímedes nació y murió en Siracusa en el siglo II A.C., pero estudió matemáticas en Alejandría, donde evidentemente se formó en la tradición euclídea. En la Antigüedad, y hasta los tiempos modernos, las ciencias matemáticas incluían a la física y a la astronomía, y estos temas se estudiaban conjuntamente. Exceptuando la astronomía, Arquímedes realizó contribuciones importantes en todas las ramas de la matemática de su tiempo. En una serie de tratados, como Sobre la esfera y el cilindro, Sobre la medida del círculo, o Sobre co- noides y esferoides, demostró una amplia variedad de teoremas acerca de las superficies y volúmenes de figuras y cuerpos limitados por líneas y superficies curvas. Entre otros, el teorema según el cual “La superficie de una esfera es igual a cuatro veces la del círculo máximo en ella” (que es equivalente a la formulación actual como S = 4 π r 2 ). Hasta donde sabemos, Arquímedes fue el primero en aplicar el método axiomático, incluyendo los métodos geométricos de demostración, a la estática y a la hidrostática. Con todo, es posible que haya tenido anónimos predecesores en el estudio de la mecánica, cuyas obras no nos han llegado. Las obras de Arquímedes Sobre el equilibrio de los planos y Sobre los cuerpos flotantes intentan una presentación axiomática de estas partes de la mecánica general (véase el Apéndice 2.4). El rigor alcanzado en las demostraciones es todavía imperfecto y los axiomas enunciados no resultan suficientes para probar todos los pretendidos teoremas. No obstante, el simple hecho de aplicar la demostración geométrica a problemas de mecánica hace de Arquímedes un precursor de la física matemática moderna. La extensión del método axiomático fuera del dominio de las ciencias matemáticas fue siempre un ideal regulativo del pensamiento griego. En el siglo II D.C., el médico Galeno, que también fue un lógico consumado, recomendó reiteradamente la aplicación del método axiomático (al que llama simplemente “pruebas de estilo geométrico”) a la anatomía y a la medicina. En un opúsculo autobiográfico llamado Mis propios libros, expresó esta idea de una manera que revela cuál era en ese momento el campo de aplicación usual de la axiomática: “He observado la verdad indiscutible que se manifiesta (y no sólo a mí mismo) en las predicciones de los eclipses, en la construcción de relojes de agua y en toda clase de cálculos realizados en el contexto de la arquitectura, y he decidido que este tipo geométrico de prueba es el mejor que ha de emplearse”. 28
L A
´ TICA MODERNA : APORTES MEDIEVALES AXIOMÁ
Galeno se explayó largamente en su obra Las afecciones y errores del alma acerca de cómo aplicar el método axiomático a cuestiones empíricas, pero, hasta donde sabemos, nadie consiguió axiomatizar una teoría médica. El prestigio del método axiomático y su carácter de modelo para la exposición rigurosa de todo conocimiento científico se mantuvieron hasta el final de la Antigüedad. Todavía Proclo, en el siglo V D.C., insiste en su comentario al Ti- meo de Platón sobre la necesidad de emplear pruebas de estilo geométrico en el dominio de la cosmología, aunque, nuevamente, no sabemos que se haya axiomatizado nunca una teoría cosmológica. 1.3 La axiomática moderna Aportes medievales
Durante la Edad Media, a partir del siglo XII, se inicia el proceso de traducción y asimilación en Occidente de las grandes obras de la ciencia griega. Pero el papel desempeñado por los medievales no se limita al comentario de los textos de Aristóteles, Euclides y Arquímedes, sino que incluye desarrollos originales, entre ellos, nuevas aplicaciones del método axiomático a la aritmética y la mecánica. Las obras de Aristóteles, Euclides y Arquímedes fueron bien conocidas y comentadas por los árabes, que aportaron, entre otras cosas, nuevos intentos de demostración del quinto postulado euclídeo. En Occidente su difusión fue más tardía y dependió de un lento proceso de traducción al latín, que se inicia en el siglo XII con las obras de Aristóteles. No podemos dar aquí un relato detallado del complejo itinerario de los textos griegos en el mundo medieval. Señalemos simplemente algunos hitos en la transmisión de los tratados lógicos de Aristóteles, los Elementos de Euclides y las obras de Arquímedes. La primera traducción latina completa de las obras lógicas de Aristóteles la realizó Boecio a principios del siglo VI D.C., pero no se conservó en el Occidente medieval. A comienzos del siglo XII comienzan a traducirse nuevamente. Entre 1130 y 1140 un grupo anónimo de traductores italianos vierte del griego los Segundos analíticos; y alrededor de 1150 se traducen los Primeros analíticos . Unos años después, Gerardo de Cremona traduce del árabe numerosas obras, entre ellas los Segundos analíticos. Pero la traducción de mayor importancia es la Guillermo de Moerbecke, quien, desde la década de 1240 aproximadamente, virtió del griego casi toda la obra de Aristóteles, incluyendo todos los tratados lógicos. Esta traducción fue la que utilizaron Tomás de Aquino y muchos otros escolásticos como base para sus detallados comentarios. Hacia fines del siglo XIII todas las obras de Aristóteles estaban disponibles en latín, junto con numerosas copias, glosas y comentarios. Cuando se publicó en Venecia la primera 29
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
edición impresa del texto griego, la célebre edición Aldina de 1495-1498, el pensamiento de Aristóteles había sido asimilado desde mucho tiempo atrás, y el aristotelismo medieval ya estaba en decadencia. La primera traducción latina de los Elementos se atribuye a Boecio. Era una traducción parcial realizada probablemente a comienzos del siglo VI D.C., pero no se ha conservado. Las primeras traducciones medievales de los Elementos proceden del árabe y no son del todo precisas. Tales son la de Adelardo de Bath en 1142, que tuvo escasa difusión, la más conocida de Gerardo de Cremona hacia 1160 y la más cuidada de Campano de Novara, de alrededor de 1290. Esta última tuvo buena difusión y fue también la primera versión impresa en 1482. En 1505 B. Zamberti publicó una nueva traducción latina hecha sobre el texto griego. La primera edición impresa del texto griego la publicó S. Grynaceus en Basilea en el año 1533. En 1572 F. Commandino realizó la mejor traducción directa del griego de los Elementos. En 1574 el matemático alemán C. Clavius publicó una nueva y autorizada traducción (más bien una paráfrasis del texto) que resultó sumamente exitosa y contribuyó a difundir los estudios de la geometría axiomática. Hacia esa época, los Elementos ya formaban parte de la cultura europea. El texto griego de las obras de Arquímedes se conservó en la cultura bizantina, mientras que parte de su obra se tradujo al árabe. Las primeras traducciones latinas del siglo XII también proceden del árabe. La primera se atribuye a Platón de Tívoli y se considera poco acertada. Mucho más importante fue la traducción de Gerardo de Cremona, después de 1150, de algunas obras matemáticas, que tuvo amplia difusión. En 1269 Guillermo de Moerbecke, tal vez el ma yor traductor de la Edad Media, tradujo del griego, utilizando los manuscritos bizantinos, todas las obras conservadas de Arquímedes. La traducción latina de Gerardo alcanzó una sorprendente difusión, pese a la crónica escasez de manuscritos. La primera versión impresa de esta traducción apareció recién en 1503, y luego siguieron otras ediciones, entre ellas, la de N. Tartaglia en 1543. El aporte medieval al método axiomático no se reduce, sin embargo, al mero comentario de los clásicos de la ciencia griega. Podemos mencionar al menos tres desarrollos originales de los matemáticos de la Edad Media. L. Fibonacci (o Leonardo de Pisa) es bien conocido por sus contribuciones a la teoría de los números, entre ellas, el descubrimiento de la famosa secuencia de Fibonacci. En 1220 Leonardo escribió un tratado axiomático titulado La práctica de la geometría, en el que expone muchos de los resultados ya alcanzados por Euclides. Ofrece, no obstante, algunas demostraciones novedosas de teoremas ya conocidos. Además, extiende la clasificación euclídea de los números irracionales, mostrando que era incompleta. También prueba resultados de Arquímedes, como la determinación del número π. En todas sus demostraciones exhibe un notable rigor deductivo y elegancia. 30
L A
´ TICA MODERNA : LA REVOLUCIÓ´N CIENTÍ´FICA AXIOMÁ
Hacia mediados del siglo XIII, Jordano de Nemora ( Jordanus Nemorarius ), de quien tenemos pocos datos biográficos, realiza el mayor aporte medieval a la axiomática. En su obra Sobre la teoría del peso utiliza 7 postulados para demostrar 45 teoremas (véase el Apéndice 2.5). Por ejemplo, su primer teorema afirma que “Entre cuerpos pesados cualesquiera, las fuerzas son proporcionales a los pesos”; mientras que el quinto sostiene que “Si los brazos de una balanza son desiguales, entonces, si pesos iguales se colocan en sus extremos, la balanza descenderá del lado del brazo más largo”. Esta obra representa un indudable avance sobre la estática de Arquímedes, y entre otras cosas, introduce nue vos dispositivos experimentales para el estudio del equilibrio de los cuerpos. Pero su obra más importante es la Aritmética, escrita alrededor de 1250. Es esta la primera obra en formato axiomático dedicada íntegramente a la aritmética, y sin duda, la obra cumbre de la matemática medieval (véase el Apéndice 2.6). El modelo de sus demostraciones, que frecuentemente usan figuras geométricas, lo proporcionan los libros aritméticos de los Elementos. Jordano utiliza 14 definiciones, 3 postulados y 8 axiomas, y mediante ellos demuestra más de 400 teoremas. Ejemplo de las proposiciones demostradas son el sexto teorema, que dice: “Si la unidad se multiplica por cualquier número, o el mismo número se multiplica por la unidad, se produce a sí mismo” (es decir, a x 1 = 1 x a = a ); y el octavo teorema, que dice: “Si se hace una multiplicación alternada de dos números, el mismo número resulta en cada caso” (o sea, a x b = b x a = c ). Este tratado axiomático fue sumamente exitoso y se lo adoptó durante mucho tiempo como texto para la enseñanza de la aritmética. Su lenguaje, sin embargo, es bastante oscuro y no se ha conservado en la matemática moderna. Por último, mencionemos la obra de T. Bradwardine, que utilizó el método axiomático no sólo en la matemática y la física, sino también en la teología. En su Tratado sobre las proporciones de las velocidades en los movimientos , publicado en 1328, el método axiomático se aplica por primera vez a la cinemática, el estudio de los cuerpos en movimiento, cosa que, hasta donde sabemos, no había sido realizada en la antigüedad. Este tratado tendrá profunda influencia sobre los mecánicos italianos, influencia que puede detectarse hasta en Galileo. En el Tratado sobre el continuo , escrito hacia 1335, Bradwardine utilizó 24 definiciones y 10 postulados para demostrar 151 teoremas acerca de las magnitudes continuas en matemática y física. Y en su obra teológica, Sobre la causa de Dios , hacia 1340, intentó incluso dar un formato axiomático a las pruebas de la existencia y propiedades de Dios, camino que después seguirían Descartes y Spinoza. La revolución científica
Durante la llamada “revolución científica” el método axiomático se extendió de manera exitosa mucho más allá de las ciencias matemáticas, concretamente, 31
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
a la física en su conjunto y a la filosofía. En todos los casos, como hemos visto, había importantes antecedentes antiguos y medievales, pero en esta época el formato axiomático pasó a ser un ideal para todas las ciencias. Incluso se concibió por primera vez el sueño de un único sistema axiomático unificado que abarcara todo el conocimiento, una idea que nunca se había presentado en el pensamiento griego. La aplicación del método axiomático a las teorías físicas resurge con los mecánicos italianos del siglo XVI, que estudiaron y comentaron las obras de Arquímedes y de Jordano de Nemora. De esta manera se establece una tradición más o menos discontinua, pero nunca extinta, que conecta a autores antiguos medievales y modernos. A los problemas tradicionales de la estática, los mecánicos italianos agregaron otros derivados de la ingeniería y las artes militares. N. Tartaglia presentó en su Ciencia nueva, publicada en Venecia en 1537, un tratamiento axiomático de la mecánica que empleaba una amplia variedad de definiciones, postulados y axiomas. Por ejemplo, sólo en el primer libro de su obra, Tartaglia usó 15 definiciones, 5 postulados y 4 axiomas para demostrar solamente 6 proposiciones o teoremas. Sus demostraciones no sólo apelan a esta base axiomática, sino que frecuentemente recurren a resultados ya establecidos por Euclides. Consecuentemente, el sistema de Tartaglia no resulta demasiado económico. Guidobaldo dal Monte en su Libro de las mecánicas, publicado en Pesaro en 1577, intentó una axiomatización mucho más simple, basada en 1 definición, 3 postulados y 3 axiomas. A partir de ese reducido conjunto de principios, Guidobaldo consiguió demostrar un elevado número de teoremas (algunos de los cuales son problemas) acerca de balanzas, palancas, poleas, ruedas y engranajes. El número de proposiciones demostradas alcanza un total de 53. Esta obra se consideró por mucho tiempo como el mejor tratado de estática. Guidobaldo sostu vo la tesis de que la estática y la dinámica son ciencias que no admiten un tratamiento unificado mediante el mismo conjunto de principios. La obra de Galileo, que fue su discípulo, puede verse como un intento por superar esa posición y construir una mecánica unificada y completa. Ese proyecto de unificación es el que culmina en la obra de Newton. En 1638 aparece la obra cumbre de Galileo, sus Discursos y demostraciones matemáticas en torno a dos ciencias nuevas . La tercera parte de este libro (la “Tercera Jornada”) contiene el tratado denominado Sobre el movimiento local , que es en realidad una obra independiente del resto del libro. En ella Galileo establece los fundamentos de aquella parte de la mecánica que hoy conocemos como cinemática. Por cierto, Galileo tuvo numerosos precursores medievales que escribieron extensamente sobre el movimiento de los cuerpos terrestres y anticiparon algunos de sus resultados. Como hemos visto, no faltaron en la Edad Media escritos sobre mecánica presentados al modo axiomático. Casi con 32
L A
´ TICA MODERNA : LA REVOLUCIÓ´N CIENTÍ´FICA AXIOMÁ
seguridad Galileo conoció algunos de ellos. Todas estas obras reflejan la influencia de Euclides y Arquímedes, ya ampliamente conocidos y comentados en el siglo XVI. Con todo, la influencia más importante es la obra de su maestro Guidobaldo dal Monte. Galileo comienza su obra con definiciones como la siguiente: “Por movimiento igual o uniforme entiendo aquel en el que los espacios recorridos por un móvil en tiempos iguales cualesquiera son iguales entre sí.” Y luego enuncia axiomas como el primero: “En el mismo movimiento uniforme, el espacio recorrido en un tiempo más largo es mayor que el espacio recorrido en un tiempo más breve” (véase el Apéndice 2.7). Finalmente procede a demostrar un total de 44 proposiciones, entre las que diferencia, igual que Euclides, entre teoremas y problemas. Esta obra de Galileo, que influyó decisivamente sobre Newton, tiene los mismos defectos que la de Euclides (carencia de términos primitivos y de reglas de transformación) y resulta mucho menos acabada y completa que los Elemen- tos. Sin embargo, representa un logro considerable, porque avanza en la aplicación del método axiomático a una ciencia empírica como la mecánica. Galileo suponía, siguiendo la concepción tradicional, que los axiomas eran enunciados verdaderos, pero no los considera necesariamente evidentes. Trata incluso de ofrecer ejemplos experimentales que confirmen la verdad de sus axiomas. Afirma explícitamente que las consecuencias que se deducen de los axiomas deben ser verificadas por medio de la experiencia, lo cual aportará una confirmación ulterior de los axiomas. Mediante esta concepción Galileo llega a vislumbrar la idea esencial del método hipotético-deductivo, según el cual los axiomas de una teoría empírica son hipótesis que pueden confirmarse experimentalmente mediante las proposiciones deducidas de ellos. La justificación de los axiomas de un sistema físico ya no se encuentra en su pura evidencia, sino en la verificación de sus consecuencias por medio de la experiencia. La otra novedad importante del siglo XVII es el ensayo de presentar axiomáticamente las teorías metafísicas, en una suerte de intento de hacer de la filosofía una ciencia tan exacta como la geometría. El racionalismo filosófico, desde Descartes hasta Leibniz, pensó que el método axiomático constituía un ideal de rigor y precisión que era deseable, y posible, extender a todo el conocimiento humano. La aplicación de este método a la filosofía primera, la ontología y la teología, representaba también la esperanza de terminar con las permanentes disputas filosóficas sobre los problemas fundamentales. Descartes hizo el primer ensayo de axiomatización de la metafísica. En sus Respuestas a las segundas objeciones a las Meditaciones Metafísicas , publicadas en 1641, presentó en forma axiomática su demostración de la existencia de Dios, que en las Meditaciones Metafísicas había dado de manera bastante informal. La sección axiomática llevaba por título “Razones que prueban la existencia de Dios y la distinción que existe entre el espíritu y el cuerpo humano 33
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
dispuestas de un modo geométrico”. La expresión “modo geométrico” es en esta época, y desde hace siglos, sinónima de “método axiomático”, y la encontramos repetida por muchos autores. Descartes empleó 10 definiciones y 10 axiomas para demostrar sólo 4 proposiciones. Por ejemplo, su primera proposición demostrada afirma que “La existencia de Dios se conoce a partir de la sola consideración de su naturaleza”, mientras que la última es que “La mente y el cuerpo se distinguen realmente”. Un ejemplo característico de sus axiomas es el cuarto: “Toda la realidad o perfección que existe en una cosa se encuentra formalmente, o eminentemente, en su causa primera y total”. Descartes intenta atenerse al estilo euclídeo de demostración, pero el rigor deductivo logrado es evidentemente menor. Por otra parte, sus axiomas no parecen en modo alguno verdades evidentes. Inspirado por el ejemplo cartesiano, Spinoza se propuso reconstruir de manera axiomática toda la filosofía de Descartes. Lo hizo en 1663 en su obra Prin- cipios de la filosofía de Descartes, demostrados al modo geométrico , que dejó inconclusa. Evidentemente este fue un ensayo previo a la axiomatización de su propia filosofía, que expuso de manera completa en la Etica, demostrada según el orden geométrico , de 1677. Allí se ofrece un sistema completo de metafísica, deducido de una multitud de axiomas y definiciones. Spinoza enuncia 26 definiciones y 17 axiomas como principios, pero además emplea otros lemas, axiomas y definiciones auxiliares. El resultado es el más importante de los sistemas metafísicos de la historia escrito en forma axiomática. Sin embargo, sus demostraciones no suscitaron el consenso unánime de la geometría euclídea. La razón de ello no se encuentra tanto en la imperfección de sus demostraciones, sino en la naturaleza de sus principios. Spinoza postuló como axiomas enunciados metafísicos como los siguientes: I. IV “El conocimiento del efecto depende del conocimiento de la causa y lo implica”; y I. VI “La idea verdadera debe concordar con lo ideado por ella”. Sus axiomas están lejos de ser claros y precisos, y es verdaderamente difícil sostener que son verdades evidentes. No resultaron claros ni evidentes para los propios contemporáneos de Spinoza. Por otra parte, tampoco son enunciados que tengan consecuencias empíricas, como los axiomas de la física, y que puedan confirmarse por medio de la experiencia. La Etica de Spinoza representa la cumbre y a la vez el último de los grandes intentos de hacer metafísica al modo axiomático. En lo sucesivo, todos los supuestos axiomas metafísicos resultan cuestionados por su falta de precisión y de evidencia. Con toda seguridad, hay un obstáculo en la naturaleza misma del tema que impide aplicar satisfactoriamente el método axiomático a las cuestiones filosóficas. Parece claro que no se puede exigir la misma precisión y rigor demostrativo en todos los temas. Después de Spinoza el método axiomático producirá éxitos significativos en las ciencias físicas y matemáticas, pero nada verdaderamente importante en el campo de la filosofía. 34
L A
´ TICA MODERNA : LA REVOLUCIÓ´N CIENTÍ´FICA AXIOMÁ
Esto es algo que sólo nos resulta claro retrospectivamente. Durante el siglo XVII los racionalistas mantuvieron una confianza total en la universalidad del método axiomático, es decir, en su aplicabilidad a todas las ciencias y a todo conocimiento en general. En su opúsculo Sobre el espíritu geométrico , escrito alrededor de 1656, Pascal elogiaba sin reservas la perfección del método demostrativo de los geómetras considerándolo infalible. En esta obra Pascal advierte que no es posible definir todos los términos del vocabulario de un sistema axiomático, y consiguientemente reconoce la necesidad de introducir términos primiti- vos. Aquí aparece por primera vez una distinción clara y explícita entre términos definidos y no definidos de un sistema. Pascal concibe a los términos primitivos, en analogía con los axiomas, como incapaces des ser definidos en razón de su extrema evidencia. Así como la verdad de los axiomas se capta inmediatamente, el significado de los términos primitivos se comprende por sí mismo, sin necesidad de ulterior aclaración. En ambos casos sólo se requiere el ejercicio de la luz natural de la razón. Con base en estos supuestos, enunció una serie de reglas metodológicas que resumió de la siguiente manera: Reglas necesarias para las definiciones: No admitir ninguno de los términos un poco oscuros o equívocos sin definición. No emplear en las definiciones más que términos perfectamente conocidos o ya explicados. Reglas necesarias para los axiomas: No pedir en los axiomas más que cosas perfectamente evidentes. Reglas necesarias para las demostraciones: Probar todas las proposiciones, sin emplear en sus pruebas más que axiomas muy evidentes por sí mismos o proposiciones ya demostradas o aceptadas. ( De l’esprit géometrique, Paris, Flammarion, 1985, p. 91)
En 1662, A. Arnauld y P. Nicole, en el muy difundido tratado La lógica o el arte de pensar (la llamada Lógica de Port-Royal ), repitieron estas reglas casi al pie de la letra. Desde entonces, esta concepción racionalista del método axiomático gozó de amplia aceptación. En la década de 1670, Leibniz alumbra la idea de una lengua universal, a la que llamó característica universal , y realiza una serie de intentos nunca concluidos de precisar la estructura de ese lenguaje. Su objetivo es disponer de una herramienta simple y exacta para emplear en la formulación de cualquier sistema deductivo de modo tal que las demostraciones resulten claras y fáciles. La meta última del sueño racionalista, bien expresada por Leibniz, es la construcción, jamás intentada siquiera, de un saber universal o mathesis universalis. Este consistiría en un único y gigantesco sistema axiomático, en el cual a partir 35
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
de unos pocos principios evidentes se demostraran todos los conocimientos humanos. En otras palabras, puede decirse que se trataba de un proyecto de unificación de todas las ciencias en un solo sistema deductivo completo y acabado. El ideal de la mathesis universalis excedía lo que Aristóteles y Euclides habían pensado y, además, contenía un aspecto antiaristotélico. Para Aristóteles, en efecto, cada ciencia poseía sus principios propios e indispensables, de modo que no era posible unificar ciencias diferentes. La diversidad de las ciencias es para Aristóteles irreductible porque refleja la multiplicidad de los géneros en que se dividen las entidades del mundo real. Para los racionalistas, en cambio, la fragmentación del saber en diferentes ciencias y disciplinas es meramente transitoria y simple reflejo de la imperfección de nuestro conocimiento. Leibniz, siguiendo ideas ya bastante antiguas de R. Lulio y T. Hobbes, desarrolla también la idea de un método general para mecanizar cualquier razonamiento. Mediante esta ars combinatoria, sería posible realizar automáticamente todas las demostraciones de un sistema axiomático, sin apelar a la intuición o a algún proceso creativo. El proyecto de Leibniz incluía la representación de los términos del lenguaje del sistema mediante números y la realización de operaciones entre números para producir demostraciones. Mediante estas ideas visionarias, nunca concretadas, Leibniz anticipa ideas contemporáneas como la de aritmetización de los lenguajes y la posibilidad de un algoritmo general capaz de resolver cualquier problema matemático. La investigación de los sistemas axiomáticos contemporáneos mostrará, como veremos más adelante, que hay límites insuperables para la realización de ese proyecto. En 1687 se publica la obra cumbre de la ciencia moderna, los Principios ma- temáticos de la filosofía natural , de I. Newton, que para muchos intérpretes constituye el verdadero final de la imagen antiguo-medieval del cosmos y el comienzo de la imagen moderna. Newton produce por primera vez la unificación de la física terrestre y la física celeste en una teoría simple y poderosa, que transformó profundamente nuestra imagen del universo. Esta obra monumental esta organizada al modo axiomático, siguiendo de cerca el modelo de Euclides. Es evidente, además, que Newton recibió la influencia de los ensayos axiomáticos de Galileo y Descartes. Comienza con 8 definiciones y 3 axiomas, que son seguramente los más conocidos en toda la historia de la ciencia (véase el Apéndice 2.8). También distingue, entre las proposiciones demostradas, entre problemas y teoremas. Las demostraciones ascienden a un total de 193. Newton emplea, además de sus axiomas, un conjunto muy amplio de lemas, hipótesis y datos auxiliares para la realización de sus demostraciones. En conjunto la obra impresiona a primera vista como menos rigurosa que los Elementos euclídeos. Sin embargo, los mejores especialistas contemporáneos han señalado que todas las pruebas de los Principia son concluyentes y difícilmente mejorables con las herramientas matemáticas que Newton tenía a su disposición. 36
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
Newton llama leyes a sus axiomas (“axiomas o leyes del movimiento”), y este nombre es síntoma de un cambio en la concepción de los axiomas de una teoría física, cambio ya insinuado en la obra de Galileo. El primero de los axiomas es la ley de inercia, ya vislumbrada por Galileo y enunciada precisamente por Descartes a mediados de la década de 1630. La versión newtoniana dice: “Todo cuerpo persevera en su estado de reposo o de movimiento uniforme en línea recta, a menos que sea compelido a cambiar ese estado por fuerzas impresas”. Difícilmente se podría tomar a este principio como una verdad evidente. Por otra parte, tampoco se lo puede verificar directamente por la experiencia, porque ello supondría observar el movimiento uniforme de todos los cuerpos en todo momento y lugar, cosa manifiestamente imposible. Newton se oponía a llamar “hipótesis” a sus principios, pero desde nuestro punto de vista éstos deben considerarse como hipótesis empíricas que son confirmables o refutables por medio de sus consecuencias observacionales (o, más bien, de las consecuencias observacionales de todo el sistema). Aparece así la idea, todavía implícita, de que la naturaleza de los axiomas de un sistema físico es diferente de la de un sistema puramente matemático. En la Óptica, publicada en 1704, Newton también adoptó el formato axiomático. Presentó 8 definiciones, que explicaban términos tales como “rayo de luz”, “reflexión”, “refracción”, “ángulo de incidencia”, “ángulo de reflexión”, y otros. El concepto fundamental de su teoría era el de rayo de luz, al que definió de la siguiente manera: “Por rayos de luz entiendo sus partes mínimas, tanto las sucesi vas en la misma línea como las contemporáneas en diversas líneas”. Luego enunció 8 axiomas, de los cuales transcribiremos aquí solamente los dos primeros: “Los ángulos de reflexión y refracción están en uno y el mismo plano que el ángulo de incidencia.”; “El ángulo de reflexión es igual al ángulo de incidencia” (véase el Apéndice 2.9 para una presentación completa). Newton mantiene la di visión euclídea de las proposiciones demostradas en teoremas y problemas. Procede, entonces, a demostrar 39 proposiciones, pero en tales demostraciones no emplea generalmente sus axiomas y definiciones. Muchas de las demostraciones son de tipo experimental y se fundan en observaciones y experimentos detalladamente descriptos por Newton, pero no deducibles de sus axiomas. La axiomática abstracta o formal
Desde Aristóteles hasta Newton los sistemas axiomáticos fueron concebidos como teorías verdaderas acerca del mundo real. La geometría euclídea, por ejemplo, se consideraba como una descripción verdadera de las propiedades del espacio físico, mientras que la teoría de Newton, por su parte, se tenía por una descripción igualmente verdadera del movimiento de los cuerpos celestes y terrestres. A veces se denomina axiomática material a esta concepción tradicional 37
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
de los sistemas axiomáticos. Durante el siglo XIX surge y se desarrolla una concepción diferente de la naturaleza de los sistemas axiomáticos. Según esta idea, que denominamos axiomática abstracta o formal , un sistema axiomático es una teoría puramente formal que no se refiere a ningún objeto o entidad real y, por consiguiente, no es por sí misma verdadera ni falsa. En un sistema axiomático formal los términos primitivos no tienen referencia, es decir no nombran o denotan objetos o propiedades determinadas. Por consiguiente, los axiomas de un sistema formal no son verdaderos o falsos hasta que no se asigne un significado o referencia a sus términos primitivos. Lo que hace abstracto a un sistema de esta clase es el hecho de que es posible asignar diferentes significados a los primitivos del sistema. Esto tiene la consecuencia de que el mismo sistema de axiomas puede ser verdadero respecto de determinados conjuntos de objetos y falso respecto de otros. Un sistema axiomático formal o abstracto se diferencia de un sistema axiomático material por el hecho de que no se refiere a un conjunto determinado de objetos, de los cuales se asume que el sistema es verdadero. Un sistema formal no necesita estar formalizado. Un sistema axiomático formalizado es aquel que se formula en un lenguaje artificial (como, por ejemplo, el de la lógica de primer orden) en el cual la formación de expresiones está estrictamente regimentada. Un sistema formalizado es un sistema puramente sintáctico, en el que todos sus términos y expresiones carecen de significado. Todo sistema formalizado es obviamente formal, pero no a la inversa. Un sistema formal no formalizado se formula en una lengua natural enriquecida con algunos términos técnicos primitivos y definidos. La geometría de Hilbert y la teoría de conjuntos de Zermelo son ejemplos de sistemas axiomáticos formales pero no formalizados (véanse los Apéndices 2.12 y 2.14). La lógica de primer orden, tal como se presenta en los textos usuales, es un ejemplo de sistema formalizado (véase el Capítulo 2.5). Todos los sistemas axiomáticos tradicionales, desde Euclides hasta Newton, son sistemas materiales, que, por supuesto, no son formales ni formalizados (véanse los Apéndices 2.2 a 2.9). Más adelante estudiaremos con detalle los componentes de un sistema axiomático formal y la manera en que tales sistemas se interpretan o adquieren significado. Ahora veremos cómo se llegó a concebir a los sistemas axiomáticos de esta manera. La axiomática formal alcanza su realización en la segunda mitad del siglo XIX. Influyen decisivamente en este hecho el surgimiento de las geometrías no euclídeas, de la lógica matemática y de la teoría de conjuntos. Este es un proceso histórico rico y complejo, que aquí ni siquiera podemos esbozar, y del que apenas mencionaremos algunas etapas significativas. La primera de estas etapas es la invención de sistemas geométricos diferentes del de Euclides, que por muchos siglos se tuvo por la única geometría posi38
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
ble. Algunas de estas nuevas geometrías no rechazan los principios del sistema de Euclides presentado en los Elementos, pero sus teoremas tienen consecuencias antiintuitivas, ya que no son visualizables y no admiten representación gráfica por medio de diagramas y figuras. Un ejemplo importante es el de la geome- tría proyectiva, que tiene antecedentes desde el Renacimiento, pero que J. Poncelet expuso por primera vez en su Tratado sobre las propiedades proyectivas de las figuras, de 1822. La geometría proyectiva no implica la negación de ninguno de los postulados de Euclides, y por ello se consideró compatible con la geometría euclídea. Sin embargo, los axiomas y postulados de Euclides no son suficientes para axiomatizar a la totalidad de la geometría euclídea, como se verá más adelante. Cuando se considera una axiomatización más satisfactoria, como la de Hilbert, resulta que la geometría proyectiva es incompatible con la euclídea. Las llamadas geometrías no euclídeas, en cambio, son manifiestamente incompatibles con la de Euclides porque toman como punto de partida la negación de alguno de sus cinco postulados. El primer postulado que se rechazó fue, como era de esperar, el quinto, ya cuestionado desde la Antigüedad. Una versión equivalente a este postulado, formulada por J. Playfair en 1795, dice que por un punto exterior a una recta pasa una y sólo una paralela a dicha recta. Muchos matemáticos destacados de todas las épocas intentaron demostrar este postulado deduciéndolo de los otros cuatro. El intento más notable fue el del italiano G. Saccheri en su obra Euclides vindicado de toda mancha , escrita en 1733. Saccheri se propuso probar que el quinto postulado se deducía de los restantes mostrando que si la negación del quinto postulado se agregaba como axioma a los otros cuatro, se obtenía como resultado una contradicción. El método de Saccheri era correcto porque es evidente que si en un sistema axiomático un enunciado χ se deduce de un conjunto de axiomas β, y a β se le agrega como axioma el enunciado ¬ χ, se producirá una contradicción porque ese sistema contendrá a la vez los enunciados χ y ¬ χ. Saccheri dedujo rigurosamente una serie de teoremas no euclídeos, hasta que creyó, erróneamente, encontrar una contradicción. Concluyó, entonces, que el quinto postulado de Euclides era deducible de los otros cuatro, cuando podría haber sospechado que dicho postulado era lógicamente independiente de los restantes. Saccheri construyó la primera geometría no euclídea, pero no logró reconocer que lo había hecho. Un siglo después, N. Lobachevsky en 1829 y J. Bolyai en 1832 construyeron de manera independiente el sistema de geometría que Saccheri había anticipado y que C. F. Gauss ya había desarrollado antes de 1824. Esta es la llamada geometría hiperbólica, que tomaba como axiomas a los cuatro primeros postulados euclídeos más el axioma según el cual por un punto exterior a una recta pasa más de una paralela a dicha recta (una manera de negar el quinto postulado euclídeo). Los teoremas que se deducen de este conjunto de axiomas son claramente inconsistentes con la geometría de Euclides. Entre otras cosas, 39
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
se deduce que la suma de los ángulos interiores de un triángulo es siempre menor que 180 grados; que dicha suma no es invariable sino que decrece cuando el área del triángulo aumenta y que se aproxima a 180 grados cuando el área del triángulo tiende a cero. En la geometría hiperbólica, a diferencia de la euclídea, no existen figuras semejantes, es decir, figuras que tengan la misma forma pero diferente tamaño. Ni Lobachevsky ni Bolyai encontraron contradicción alguna entre los enunciados de este nuevo sistema geométrico. Incluso Lobachevsky consiguió mostrar que su sistema era consistente, dando una prueba relativa de la consistencia de su geometría respecto de la trigonometría esférica euclídea (véase el Apéndice 1). Demostró que si la geometría euclídea es consistente (esto es, está libre de contradicciones), también la geometría hiperbólica es consistente; o, lo que es equivalente, que si la geometría hiperbólica es contradictoria, también la geometría euclídea necesariamente debe serlo. Mediante esta prueba notable, Lobachevsky puso a ambas geometrías en un mismo nivel de legitimidad desde el punto de vista lógico. Poco tiempo después se produjo la extensión del campo de la geometría a espacios de más de tres dimensiones. En 1844 H. Grassmann publicó su obra Teoría de la extensión lineal , en la cual introducía la idea de espacios vectoriales de n número de dimensiones. En 1854 B. Riemann pronunció su conferencia de habilitación en la universidad de Gotinga, “Sobre las hipótesis que yacen en los fundamentos de la geometría”, donde realizó una extensión notable del dominio de la geometría. Riemann generalizó la teoría de las superficies curvas de Gauss extendiéndola a espacios de n dimensiones. Mostró cómo definir la curvatura intrínseca de un espacio de n dimensiones y cómo medir la distancia entre puntos de cualquiera de estos espacios. El resultado de ello fue una generalización de la geometría a una teoría de muy amplio alcance, conocida como de los espacios de Riemann, que contiene como casos especiales a la geometría euclídea y a diversas geometrías no euclídeas. En general, los espacios de Riemann son espacios n-dimensionales de curvatura variable, donde la curvatura K del espacio es diferente de un punto a otro. La geometría euclídea y la hiperbólica de Lobachevsky, entre otras geometrías no euclídeas, son casos especiales de espacios de Riemann en los cuales la curvatura es constante, es decir, la misma en todo punto. La geometría hiperbólica constituye el caso en el que la curvatura es constante y negativa ( K < 0). Otras geometrías no euclídeas, como la elíptica, son casos de un espacio de Riemann con curvatura constante y positiva ( K > 0). Finalmente, la geometría euclídea es el caso más especial en el que la curvatura del espacio es nula en todo punto ( K = 0). El alcance de la teoría de Riemann sólo se comprendió después de la publicación póstuma de su trabajo en 1867. En 1868 E. Beltrami descubrió un modelo euclídeo de una parte de la geometría hiperbólica de Lobachevsky. El modelo permitía representar en el espa40
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
cio euclídeo diversos teoremas de esta geometría no euclídea. Posteriormente, F. Klein en 1871 y H. Poincaré en 1881 encontraron otros modelos euclídeos para la totalidad de la geometría hiperbólica. La existencia de estos modelos proporcionó otra prueba de consistencia relativa de la geometría hiperbólica respecto de la geometría euclídea (véase el Apéndice 1). Además, demostró que la geometría hiperbólica era traducible a la geometría euclídea, en el sentido de que a todo teorema de la geometría hiperbólica le corresponde un teorema de la geometría euclídea, que representa la traducción de ese teorema en términos euclídeos. La creación de las geometrías no euclídeas y su generalización a espacios ndimensionales tuvo muchas consecuencias importantes. En primer lugar, surgió la idea de que los diferentes espacios caracterizados por las diferentes geometrías eran entidades puramente abstractas sin relación directa con el espacio físico real. Además, se tuvo conciencia de que la evidencia de los axiomas no era un criterio adecuado para la elección de un sistema axiomático. Los hechos mostraban que era perfectamente posible elaborar una geometría consistente partiendo de axiomas que no son evidentes. Había ahora múltiples sistemas de geometría incompatibles entre sí, pero todos ellos aparentemente libres de contradicciones internas. Esta situación sugirió que la determinación de la estructura geométrica del espacio físico no era una cuestión puramente matemática que pudiera decidirse a priori, sino un problema empírico que en principio podría resolverse experimentalmente. La tradición atribuye a C. F. Gauss el origen de esta idea, que luego se encuentra explícita en Bolyai, Lobachevsky y Riemann. Lobachevsky señaló correctamente que la estructura geométrica del espacio físico debería determinarse mediante mediciones astronómicas, e incluso realizó él mismo tal clase de mediciones. Por otra parte, la existencia de geometrías de cualquier número de dimensiones introdujo un concepto abstracto de espacio, desligado del espacio físico real. Con ello estaban dadas las bases para la distinción entre geometría matemática y geometría física, que llevará a concebir a la primera como un sistema puramente formal que no describe la estructura del mundo real. Ya en 1844 H. Grassmann, en su obra Teoría de la extensión lineal , señalaba que la geometría no es una descripción del espacio físico, sino una teoría de la matemática pura, una “doctrina de las formas”. En 1870 H. Von Helmholtz escribió un breve trabajo titulado Sobre el origen y significado de los axiomas geométricos, que puede considerarse como el primer manifiesto de la geometría como ciencia formal. Helmholtz concluía su trabajo señalando que los axiomas de la geometría no representan relaciones entre cosas reales, sino que son como un molde vacío en el que se puede encajar cualquier contenido empírico. Esto vale tanto para los axiomas euclídeos como para los de todas las geometrías no euclídeas. La geometría matemática o formal no es, entonces, un sistema de enunciados o proposiciones capaces de ser verdade41
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
ros o falsos respecto del mundo real. Únicamente cuando se hace corresponder a los axiomas ciertos principios físicos (por ejemplo, relativos al comportamiento de los cuerpos rígidos) se obtiene un sistema de proposiciones significativas, una geometría física, cuyos enunciados tienen valor de verdad y se pueden verificar o refutar por la experiencia. Helmholtz anticipaba de este modo la noción de interpretación de un sistema formal, que más adelante estudiaremos con detalle. La situación planteada por la existencia de geometrías alternativas a la de Euclides tuvo también como efecto la revisión más rigurosa del propio sistema euclídeo. A la vez, se planteó la necesidad de axiomatizar las nuevas teorías geométricas. El primer sistema axiomático de una geometría diferente de la de Euclides lo elaboró M. Pasch en su obra Lecciones de geometría moderna , publicada en 1882, donde axiomatizó la geometría proyectiva. Allí ofreció una lista completa de los términos primitivos y de los axiomas que empleaba en su sistema. Pasch, sin embargo, no renunciaba todavía a la idea tradicional según la cual la fuente de la que se obtienen los axiomas de la geometría es la intuición, o incluso la experiencia. Siguiendo esta inclinación empirista, afirmó que los términos primitivos de un sistema geométrico se refieren a la forma, el tamaño y la posición recíproca de los cuerpos. El significado de estos términos no necesita ser definido porque se hace evidente mediante la simple ostensión de los objetos físicos apropiados. Los axiomas, por su parte, enuncian aquello que se ha observado en las figuras más simples. Una vez determinados los axiomas, la intuición no interviene en el proceso de prueba, según Pasch, porque todo el sistema geométrico debe desarrollarse mediante puras inferencias deductivas, independientemente del sentido de los conceptos geométricos del sistema. Algunos años después, en 1899, M. Pieri y D. Hilbert construyeron, de manera independiente uno del otro, dos axiomatizaciones diferentes de la geometría euclídea, en las que intentaban ofrecer una presentación más rigurosa que la de los Elementos de Euclides. Pieri adopta sólo 2 términos primitivos (“punto” y “movimiento”) y 20 axiomas. Hilbert, por su parte, en su gran obra Fun- damentos de la geometría , se vale de 8 términos primitivos (entre ellos, “punto”, “recta” y “plano”) y 20 axiomas separados en 5 grupos (axiomas de conexión, orden, congruencia, paralelismo y continuidad). En la segunda edición de su libro, en 1903, Hilbert agrega un nuevo axioma, que eleva el total a 21. Todos los expertos en el tema coinciden en afirmar que la axiomatización de Hilbert es superior a la de Euclides en tanto resulta suficiente para deducir la totalidad de la geometría euclídea sin recurrir a supuestos no explicitados. De hecho, se convirtió enseguida en el paradigma de axiomatización de una teoría matemática (véase el Apéndice 2.12). Pronto aparecieron otros sistemas axiomáticos de geometría euclídea, como el de O. Veblen en 1904 y el de E. V. Huntington en 1913, que utilizaban términos primitivos y axiomas muy diferentes de los de 42
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
Hilbert. Con ello quedó claro que el mismo sistema formal se puede presentar mediante distintos conjuntos de axiomas, independientemente del hecho de que éstos sean evidentes o no. Simultáneamente, se produjeron rápidos avances en la axiomatización de otras teorías matemáticas. E. V. Huntington y, de manera independiente, E. H. Moore axiomatizaron en 1902 la teoría de grupos, teoría ya ampliamente desarrollada y utilizada desde mediados del siglo XIX. También la geometría no euclídea se axiomatizó siguiendo el paradigma de Hilbert, cuando G. Halsted en 1904 y G. Hessenberg en 1905 crearon sistemas axiomáticos para la geometría elíptica. En 1914 F. Hausdorff axiomatizó la parte básica de la topología, conocida como topología de conjuntos de puntos (véase el Apéndice 2.15). Durante esta época el método axiomático formal produjo resultados verdaderamente alentadores, no sólo en geometría, sino en ramas muy diferentes de la matemática. El mismo Huntington, por ejemplo, axiomatizó en 1902 la teoría de las magnitudes continuas, base del análisis matemático, mediante 6 axiomas muy simples (véase el Apéndice 2.13). Hilbert no se limitó a presentar axiomáticamente la geometría euclídea construyendo un sistema formal, aunque no formalizado. Además, analizó detalladamente las propiedades de su sistema. Probó que es consistente, es decir libre de contradicciones, relativamente a la teoría de números reales; y demostró también que sus axiomas son independientes, o sea, que ninguno se deduce de los restantes (en el Capítulo 4 estas propiedades se definen con mayor precisión). De esta manera, inauguró la disciplina conocida como metamatemática, que se ocupa del estudio de las propiedades de los sistemas formales. La concepción que Hilbert tiene de los sistemas axiomáticos es esencialmente abstracta. Su idea principal es que los términos primitivos de una teoría axiomática no se refieren a ningún tipo determinado de entidad concreta o abstracta. Los términos “punto, “recta” o “plano” no denotan a algún objeto geométrico en particular, sino a una clase no determinada de objetos cualesquiera. Una consecuencia importante de esta concepción formalista de Hilbert es que un mismo sistema axiomático puede ser verdadero respecto de sistemas de objetos muy diferentes y de distinta naturaleza, sean concretos o abstractos, dependiendo del significado que se asigne a sus términos primitivos. La misma teoría matemática (o el mismo formalismo lógico) admite múltiples realizaciones o mode- los (en el Capítulo 3 estudiaremos este punto más de cerca y veremos varios ejemplos). P. Bernays, uno de los principales discípulos de Hilbert, en un artículo de 1922, “El significado de Hilbert para la filosofía de la matemática”, resumía la concepción formal del método axiomático con las siguientes palabras: De acuerdo con esta concepción, los axiomas no son en modo alguno juicios de los que se pueda decir que son verdaderos o falsos; sólo tienen sentido en el
43
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
contexto de todo el sistema de axiomas. E incluso el sistema de axiomas como un todo no constituye el enunciado de una verdad; más bien, la estructura lógica de la geometría axiomática en el sentido de Hilbert, análogamente a la de la teoría abstracta de grupos, es puramente hipotética. Si hay en alguna parte de la realidad tres sistemas de objetos, así como determinadas relaciones entre esos objetos, tales que los axiomas valen respecto de ellos (esto significa que mediante una adecuada asignación de nombres a los objetos y relaciones, los axiomas se convierten en enunciados verdaderos), entonces, todos los teoremas de la geometría también valen respecto de esos objetos y relaciones. Por tanto, el sistema de axiomas mismo no expresa algo fáctico; más bien, presenta solamente una forma posible de un sistema de conexiones que debe investigarse matemáticamente de acuerdo con sus propiedades internas. (Traducido en Mancosu 1998, p. 192.)
De acuerdo con la concepción tradicional, los axiomas de la geometría euclídea son proposiciones autoevidentes que expresan verdades acerca del espacio físico, y, en general, los axiomas de un sistema axiomático son proposiciones verdaderas acerca de alguna clase de objetos concretos o abstractos. Para Hilbert, en cambio, los axiomas de la geometría o de cualquier otro sistema axiomático no son verdades evidentes acerca de ninguna especie de objetos o entidades determinadas. Un sistema de axiomas, si es consistente, caracteriza a un cierto tipo de estructura abstracta que puede tener múltiples realizaciones o modelos, es decir, que puede ser verdadera respecto de diferentes sistemas de ob jetos o entidades determinadas. Los axiomas de la geometría euclídea, por ejemplo, caracterizan la estructura que llamamos espacio euclídeo. El espacio físico real puede ser uno de los modelos de esta estructura, pero los axiomas de la geometría formal no se refieren a este espacio concreto, ni a ningún otro objeto o entidad. En la concepción formalista de Hilbert, la totalidad de los axiomas de un sistema axiomático puede considerarse como una definición explícita del término que se refiere o nombra a una estructura abstracta. Así, por ejemplo, los axiomas de Hilbert para la geometría euclídea definen el término “espacio euclídeo”. Igualmente, los axiomas de la teoría de grupos definen el término “grupo”, el que a su vez se refiere a la estructura abstracta de grupo. Y lo mismo vale para otras estructuras matemáticas caracterizadas axiomáticamente, tales como las de como espacio vectorial, espacio topológico, y muchas otras. Una consecuencia fundamental de la concepción abstracta del método axiomático consistió en el abandono de la evidencia como criterio de elección y justificación de los axiomas de un sistema. Los axiomas de un sistema formal no son enunciados verdaderos y, por consiguiente, no puede decirse que sean verdades evidentes. Todavía en 1902, Huntington distinguía entre postulados y axiomas, considerando que estos últimos eran verdades autoevidentes. Sin embargo, en pocos años esta distinción fue definitivamente abandonada, y la concepción formalista de los axiomas se impuso de manera casi unánime. 44
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
El éxito que Hilbert obtuvo con su axiomatización de la geometría euclídea lo llevó a recomendar la aplicación del método axiomático mas allá del campo de la matemática. En el congreso internacional de matemáticos celebrado en París en 1900, Hilbert leyó una célebre comunicación, titulada “Problemas matemáticos”, en la cual presentó una lista de 22 problemas que ejercería una notable influencia en el desarrollo de la investigación matemática. El sexto de esos problemas consistía en ofrecer un “tratamiento matemático de los axiomas de la física”, en primer lugar, sostenía allí Hilbert, “de la teoría de la probabilidad y de la mecánica”. Significativamente, ambas teorías serían axiomatizadas en los años subsiguientes, aunque no de manera inmediata. En 1909 G. Hamel publicó un artículo notable llamado “Sobre los fundamentos de la mecánica”, en el que daba la primera axiomatización precisa de toda la mecánica clásica. Hamel siguió evidentemente el ejemplo de Hilbert y presentó sus axiomas divididos en grupos: axiomas sobre el espacio y el tiempo, los sistemas materiales, el movimiento, las fuerzas externas e internas y otros. En total empleó 16 axiomas di vididos en 7 grupos. Después de deducir de sus axiomas algunas de las leyes fundamentales de la mecánica, procedió a demostrar la consistencia de su sistema axiomático y la independencia de todos sus axiomas. Ese mismo año C. Carathéodory publicó su trabajo “Sobre los fundamentos de la termodinámica”, en el que axiomatizó la termodinámica clásica empleando solamente 2 axiomas. La teoría de la probabilidad, por su parte, recién fue axiomatizada por A. Kolmogorov en 1933 (véase el Apéndice 2.18) luego de varios intentos anteriores, no muy satisfactorios, por parte de otros matemáticos. Durante la segunda mitad del siglo XIX se produce otro desarrollo importante relacionado con el método axiomático: la creación de la lógica matemática. Este es un proceso que comienza con la obra de G. Boole El análisis matemá- tico de la lógica, de 1847, y alcanza un primer estadio axiomático en la Concep- tografía de G. Frege, publicada en 1879. Esta obra, subtitulada Un lenguaje for- mal del pensamiento puro copiado del aritmético , introducía el primer lenguaje formalizado para la lógica formal. Frege fue también el primero en presentar un sistema de lógica de manera axiomática. Su sistema era de lógica de segundo orden, pero incluía un conjunto de axiomas suficientes para deducir todas las verdades de la lógica de primer orden con identidad (véase el Apéndice 2.10). La lógica de primer orden de Frege se deducía de 9 axiomas sumamente simples, pero expresados en una notación simbólica difícil de leer, que pronto ca yó en desuso. Frege era ya bien consciente de que la elección de los axiomas involucraba aspectos convencionales y de que sería posible construir otro sistema de lógica equivalente al suyo empleando otros axiomas. En su propia selección se guió por el principio heurístico de que era más natural partir de enunciados simples como axiomas y deducir luego los más complicados como teoremas. No obstante, Frege seguía aferrado a la concepción tradicional de los 45
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
axiomas, y los concebía como enunciados verdaderos que no necesitan demostración porque son autoevidentes. Un sistema axiomático es para él un conjunto de enunciados verdaderos y no un mero formalismo sin interpretar. Por consiguiente, no es necesario probar la consistencia de un sistema axiomático, puesto que ésta ya se encuentra asegurada por la verdad de los axiomas. Frege polemizó sin éxito contra la concepción formalista de Hilbert, que en poco tiempo se iba a imponer sobre la suya, de carácter más tradicional. La obra de Frege contenía otro logro destacable, como ya indicamos, la formalización completa del lenguaje en el que se presentaba el sistema. Construía por primera vez un lenguaje completamente formalizado, que él llamó “escritura conceptual”, y que estaba dirigido a reemplazar a los lenguajes naturales en la formulación precisa de las teorías científicas. Frege se propuso caracterizar cuidadosamente todos los símbolos y reglas de este lenguaje: términos primiti vos y definidos, reglas de formación y de transformación. Mediante este lengua je se podía también definir de manera precisa en qué consiste una prueba o demostración de un teorema del sistema. La propiedad esencial de este lenguaje artificial es que posee reglas explícitas que, en un número finito de pasos, permiten determinar lo siguiente: a) si un símbolo es o no un término primitivo de ese lenguaje; b) si un símbolo es o no un término definido; c) si un conjunto de símbolos es o no un enunciado o fórmula de ese lenguaje; y, por último, d) si una secuencia de enunciados o fórmulas es o no una prueba de una fórmula de ese lenguaje. Un lenguaje que tiene estas características es un lenguaje for- malizado, y una teoría axiomática expresada por medio de éste es un sistema axiomático formalizado. La Conceptografía de Frege es el primer sistema axiomático formalizado, y, aunque no tuvo influencia alguna hasta dos décadas después de su publicación, sirvió como modelo para otros sistemas posteriores, como la obra monumental de A. N. Whitehead y B. Russell, Principia mathematica, publicada en tres volúmenes entre 1910 y 1913. Mientras tanto, Frege concibió un ambicioso programa de fundamentación de la matemática, luego conocido como logicismo. La tesis fundamental del logicismo de Frege es, según sus propias palabras, que “la aritmética es una rama de la lógica”. De acuerdo con esta idea, todos los conceptos de la aritmética son definibles mediante conceptos puramente lógicos y todas las verdades de la aritmética, que son proposiciones analíticas, son deducibles exclusivamente de leyes lógicas. En su libro Los fundamentos de la aritmética , publicado en 1884, Frege expuso con todo detalle la justificación de su programa logicista (que no extendió a la geometría) y consiguió dar una definición satisfactoria del concepto de número natural en función de términos lógicos. La siguiente etapa del programa consistía en deducir los teoremas fundamentales de la aritmética de un conjunto de axiomas puramente lógicos. Frege dedicó veinte años de su vi46
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
da a esta empresa, que finalmente resultó un fracaso. En 1893 publicó el primer volumen de Las leyes fundamentales de la aritmética , donde construía un sistema axiomático de lógica de orden superior del cual deducía los principales teoremas de la aritmética de los números naturales. El segundo volumen, publicado en 1903, hacía lo propio con la teoría de los números reales. Sin embargo, para consternación de Frege, B. Russell había descubierto que el sistema era inconsistente. La célebre paradoja de Russell (que comentamos más adelante en este capítulo) mostró que la lógica de Frege implicaba contradicciones. Frege no consiguió encontrar una solución a esa paradoja y en los últimos años de su vida terminó por renunciar a la tesis logicista. Desde fines del siglo XIX hasta la primera mitad del siglo XX se produjeron los mayores progresos en la aplicación del método axiomático, así como en la investigación metateórica de las propiedades de los sistemas axiomáticos. En 1889 G. Peano, adaptando resultados ya obtenidos por R. Dedekind, publicó la primera axiomatización formal de la aritmética elemental, que perfeccionó en 1895, utilizando sólo 5 axiomas específicos (véase el Apéndice 2.11). El sistema resultante era notoriamente simple y brindaba una base axiomática clara y precisa para la aritmética de los números naturales, que durante siglos se había usado de manera puramente intuitiva. Peano introdujo, además, una notación simbólica para el lenguaje formal mucho más clara y sencilla que la de Frege. Con diversas variantes, la notación de Peano se impuso rápidamente y es la que todavía está en uso en la mayoría de los textos de lógica. El mayor logro del método axiomático contemporáneo ha sido, probablemente, la axiomatización de la teoría de conjuntos, que se consideró como la parte más básica y fundamental de la matemática. El desarrollo histórico de esta teoría es algo complicado, por lo que aquí mencionaremos someramente sus tres etapas fundamentales. La primera es la creación de la teoría intuitiva (o “ingenua”) de conjuntos por G. Cantor; la segunda es el descubrimiento de las llamadas antinomias, esto es, el hecho de que la teoría de Cantor implica contradicciones; y la tercera y última es la axiomatización de la teoría con el fin de eliminar las antinomias. Entre los años 1874 y 1897 G. Cantor publicó de manera progresiva todos los principales resultados de la teoría de conjuntos. La exposición de Cantor no seguía el modelo axiomático ni estaba expuesta en un lenguaje formalizado. Por estas razones se la conoce como teoría intuitiva o informal de los conjuntos. Su obra suscitó al comienzo notable oposición entre los matemáticos porque Cantor no sólo introducía los conjuntos infinitos (que contienen un número infinito de elementos) como actualmente existentes, sino que postulaba una jerarquía infinita de conjuntos infinitos de diferente tamaño. Era necesario aceptar que había infinitos mayores que otros infinitos. Esta idea resultó bastante extraña, pero nadie logró al principio probar que fuera contradictoria o implicara contra47
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
dicción. Sin embargo, poco antes de fines del siglo XIX, se descubrió que la teoría de Cantor conducía a auténticas contradicciones o antinomias. La primera paradoja se produjo con el conjunto de todos los números ordinales, llamado Ω, puesto que se demostró que Ω + 1 es mayor que Ω y, a la vez, que Ω + 1 no es mayor que Ω. Esta es la llamada paradoja de Burali-Forti, quien fue el primero en publicarla en 1897. Sin embargo, hoy sabemos que Cantor ya la había descubierto en 1895 y se la había comunicado a Hilbert en una carta del año 1896. El propio Cantor encontró en 1899 otra contradicción en su teoría, conocida como paradoja de Cantor, que afecta al conjunto de todos los conjuntos o clase universal U . Previamente, Cantor había demostrado un célebre teorema (luego conocido como teorema de Cantor) según el cual el conjunto de todos los subconjuntos de un conjunto dado A (llamado conjunto potencia de A y simbolizado como ℘ A ) es mayor que A mismo, es decir, es un conjunto que tiene más elementos que A (si A tiene n elementos, ℘ A tiene 2n elementos). El resultado puede expresarse como |℘ A| > | A| (esto es, el número cardinal de ℘ A es siempre mayor que el de A, por lo que para cualquier cardinal siempre existe uno mayor). En la teoría de conjuntos de Cantor se puede deducir, entonces, tanto que el cardinal de U es menor que el cardinal del conjunto de todos los subconjuntos de U y a la vez que no es menor que él (o sea, | ℘U| > |U| y |℘U| ≤ |U|), lo cual es obviamente contradictorio. En efecto, por el teorema de Cantor |℘U| > |U|. Pero, además, dado que U es el conjunto de todos los con juntos, ℘U debe estar incluido en U, y es evidente, que un subconjunto de un conjunto dado no puede contener más elementos que dicho conjunto (pues, si B ⊆ A, entonces, | B | ≤ | A|). Se sigue, entonces, que | ℘U| ≤ |U|, con lo cual queda probado que la teoría de Cantor implica una contradicción. Otra manera de arribar a la paradoja es advertir que todo subconjunto de U debe ser también elemento de U, por lo que la clase universal debe tener al menos tantos elementos como subconjuntos. Sin embargo, el teorema de Cantor implica que U, como cualquier otro conjunto, tiene más subconjuntos que elementos. Finalmente, en 1902 B. Russell halló una paradoja fundamental que involucraba a los conceptos de conjunto y pertenencia de un elemento a un conjunto (que simbolizamos como ∈ ). La paradoja de Russell afectaba tanto a la teoría de conjuntos de Cantor como a la lógica general de orden superior que Frege había elaborado en su obra Las leyes fundamentales de la aritmética . Russell le comunicó su descubrimiento a Frege en una carta, que éste hizo pública en un apéndice del segundo volumen de Las leyes fundamentales de la aritmética , publicado en 1903. E. Zermelo, por su parte, ya la había descubierto independientemente en 1901, pero no la había publicado. El contenido de la paradoja de Russell se puede resumir así: si designamos como y al conjunto de todos los conjuntos que no son elementos de sí mismos, podemos deducir la siguiente 48
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
equivalencia: y ∈ y ↔ y ∉ y . Es decir, el conjunto y pertenece a sí mismo si y sólo si no pertenece a sí mismo, lo cual es evidentemente contradictorio. La explicación de este resultado paradójico es simple, pero no siempre intuitiva. Se sigue simplemente de la definición de y , el llamado conjunto de Russell, como el conjunto de todos los conjuntos que no son elementos de sí mismos. Si y es elemento de sí mismo, por definición no debe serlo; si y no es elemento de sí mismo, por la misma definición debe serlo. El conjunto de Russell es contradictorio y, como tal, no puede existir. Veamos cómo la paradoja se produce en la teoría de conjuntos de Cantor. Cantor había considerado como conjunto a cualquier reunión en un todo de determinados objetos bien distinguidos de nuestra intuición o pensamiento. Podemos suponer, entonces, que dada una propiedad cualquiera ϕ, existe el con junto correspondiente formado por todas los objetos que tienen esa propiedad, es decir, por la extensión de ϕ. Esta afirmación se conoce como principio de comprensión, y puede formalizarse de la siguiente manera: ∃ y ∀ x ( x ∈ y ϕ x ). Este principio es la fuente de las paradojas, pues, si elegimos ϕ = x ∉ x , arribamos a la paradoja de Russell. La deducción se puede presentar así: sea ϕ = x ∉ x , y sea y = { x : ϕ x }. Ahora bien, si y ∈ y , entonces, por el principio de comprensión debe valer ϕ y , o sea, debe valer y ∉ y . Pero, por otra parte, si y ∉ y , entonces, por el principio de comprensión y la definición de y debe valer y ∈ y . Así llegamos a una contradicción patente. El principio de comprensión implica que el conjunto de Russell es también un conjunto. Y dicho conjunto es contradictorio porque tiene la propiedad de que es un elemento de sí mismo si y sólo si no es un elemento de sí mismo. Sobre este punto es necesario señalar que Cantor no suscribió el principio de comprensión de manera irrestricta, ya que no aceptó como conjuntos a las totalidades de objetos que no pudieran concebirse sin contradicción como existentes. Este es el caso del conjunto de Russell y de otros a los que Cantor llamó, en una carta a R. Dedekind de 1899, “pluralidades absolutamente infinitas o inconsistentes”. Cantor considera conjuntos sólo a las pluralidades consistentes, por consiguiente, el conjunto de Russell no es un conjunto en el sentido cantoriano del término. La propiedad ϕ = x ∉ x no determina un conjunto, contra lo que afirma el principio de comprensión en su formulación irrestricta. En cualquier caso, la paradoja de Russell alcanzaba a la teoría general de las clases y a la lógica de orden superior. Una vez conocida la paradoja de Russell la teoría intuitiva de conjuntos entró en crisis, y esta crisis afectó también a los fundamentos de la matemática en general, puesto que de la teoría de conjuntos se deducen todas las partes básicas de la matemática, como la teoría de los números cardinales y ordinales, los números reales e imaginarios, las funciones y muchas otras. En el año 1908 se propusieron de manera casi simultánea dos intentos de solución para las antinomias de la teoría de conjuntos: la teoría de ↔
49
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
los tipos de B. Russell y la teoría axiomática de conjuntos de E. Zermelo. Ese
mismo año, J. E. Brouwer presentó una nueva manera de concebir la matemática, el intuicionismo, que lo llevaría a formular una teoría de conjuntos alternati va a la de Zermelo. Aquí nos ocuparemos especialmente de la solución de Zermelo, que desde el punto de vista histórico fue la que tuvo mayor importancia, pero antes haremos algunas observaciones generales sobre la teoría de los tipos y sobre la matemática intuicionista. La solución propuesta por la teoría de los tipos consiste en estratificar el lenguaje en diferentes niveles. Las reglas de este lenguaje estratificado impiden afirmar proposiciones tales como x ∉ x , las cuales resultan simplemente fórmulas mal formadas. Russell empleó esta solución a las paradojas para proseguir el programa logicista de deducir la aritmética a partir de una lógica libre de contradicciones. En la inmensa Principia mathematica Whitehead y Russell consiguieron demostrar un enorme conjunto de teoremas matemáticos. Pero el costo de esta empresa fue alto porque el sistema lógico del cual se deducía la aritmética era bastante más complicado que el de Frege y las correspondientes demostraciones mucho más laboriosas. Además, fue necesario introducir dos axiomas especiales, el de infinitud y el de reducibilidad, que no parecían ser leyes puramente lógicas y que muchos matemáticos encontraron inaceptables. Debido a su complejidad y a sus dificultades de aplicación, los matemáticos profesionales nunca adoptaron la teoría de los tipos. Desde entonces, el programa logicista ha quedado inconcluso, aunque sus ideas esenciales todavía tienen adeptos. La teoría de los tipos tampoco ha perdido su interés filosófico, a pesar de haberse revelado como un instrumento matemático de escasa utilidad. En 1908, el mismo año en que Zermelo axiomatizó la teoría de conjuntos, J. E. Brouwer publicó su primer trabajo sobre la concepción intuicionista de la matemática, de la cual resultarían una teoría de conjuntos y una lógica alternativas a las clásicas. Para Brouwer las entidades matemáticas no existen por sí mismas, sino que son construcciones mentales del sujeto individual. La existencia de una entidad matemática sólo puede afirmarse cuando se posee una demostración constructiva de tal entidad, esto es, cuando es posible especificar un procedimiento para construirla en un número finito de pasos. Consecuentemente con esta posición, Brouwer rechazó la teoría de conjuntos de Cantor, donde se consideraba a los conjuntos infinitos como entidades completas y actualmente existentes, esto es, como individuos. En particular, rechazó el principio de comprensión, tanto en la versión generalizada atribuida a Cantor, que conducía a paradojas, como en la formulación restringida de Zermelo, que era aparentemente consistente. Sólo una concepción constructiva de los conjuntos, que no les asignara una existencia independiente de los matemáticos, era aceptable para Brouwer como fundamento de la matemática. Esta idea constituyó la base del programa de reconstrucción intuicionista de la matemática, que se pre50
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
sentó como una alternativa a la matemática clásica y, sobre todo, a la teoría de conjuntos de Zermelo. En la matemática intuicionista, las paradojas de la teoría clásica de conjuntos no podían siquiera formularse, de manera que no había necesidad de procedimientos para evitar las contradicciones, como los empleados por Russell en la teoría de los tipos o por Zermelo en la teoría axiomática de conjuntos. Brouwer desconfió muy tempranamente de la utilidad de los lenguajes formales y del método axiomático formal tal como lo practicaban Hilbert y sus seguidores. Rechazó, por consiguiente los programas formalista y logicista de fundamentación de la matemática. Consideró que la lógica no constituía el fundamento de la matemática, sino que, a la inversa, era una aplicación de ésta. Más precisamente, la lógica sólo surge como resultado de un proceso de abstracción y generalización de los procedimientos matemáticos constructivos. Estos muestran, según Brouwer, que algunos de los principios lógicos clásicos, como el de tercero excluido ( χ v ¬ χ ) y el de doble negación (¬ ¬χ χ ) no son válidos. Se sigue de ello que la matemática constructiva no debe emplear la demostración por el absurdo, que presupone estas leyes de la lógica clásica. El intuicionismo obliga a abandonar el uso generalizado de las demostraciones por el absurdo, que es práctica usual de los matemáticos desde los tiempos de Euclides. En el intuicionismo la regla del absurdo sólo puede usarse para probar conclusiones negativas, es decir, para refutar proposiciones (la regla adopta, entonces, la forma χ → ( ψ & ¬ ψ ) / ¬ χ ). No resulta aceptable, en cambio, para establecer conclusiones positivas, puesto que en ese caso hace uso de leyes clásicas rechazadas por los intuicionistas (en efecto, la regla ¬ χ → ( ψ & ¬ ψ ) / χ presupone la ley de doble negación). La lógica intuicionista resulta así un sistema más débil que la lógica clásica, puesto que no hay ningún teorema de la lógica intuicionista que no tenga su contrapartida en la lógica clásica, pero hay muchos teoremas clásicos (de hecho, infinitos) que no son válidos en la lógica intuicionista. En 1930 A. Heyting, discípulo de Brouwer, consiguió axiomatizar la lógica proposicional intuicionista mediante un sistema de axiomas simples y claros (véase el Apéndice 2.16). Desde entonces, la lógica intuicionista quedó constituida como una alternativa o rival de la lógica clásica, y el estudio de sus mutuas relaciones formó parte de las discusiones habituales de lógicos y filósofos. Por su parte, el programa de la matemática intuicionista, lo continuaron Heyting y otros matemáticos constructivistas hasta nuestros días. Sin embargo, su popularidad siempre fue escasa en la comunidad matemática. Los matemáticos profesionales, en su gran mayoría, no se han mostrado dispuestos a aceptar las mutilaciones de la matemática clásica que propone el intuicionismo, tales como el abandono de partes considerables de la teoría de conjuntos. Por otra parte, la matemática intuicionista incluye teoremas que son incompatibles con la matemática clásica. Finalmente, la deducción de las partes de la matemática →
51
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
clásica que se conservan en la matemática intuicionista es a menudo más complicada. Por todas estas razones, la matemática intuicionista ha permanecido como una corriente minoritaria dentro de la comunidad de los matemáticos. El intuicionismo ha mantenido, sin embargo, su interés filosófico y sus aplicaciones en el campo de la teoría de la demostración y la metateoría de los sistemas formales. La solución a las paradojas aportada por la teoría axiomática de conjuntos es la que goza de mayor aceptación porque es la que combina la mayor simplicidad con la mayor fertilidad y facilidad de aplicación. Zermelo se propuso reformular rigurosamente la teoría de conjuntos de modo tal que no se produjeran paradojas y a la vez se conservara la mayor parte posible de la teoría intuitiva de Cantor. Para ello presentó un sistema de 7 axiomas, que se reveló insuficiente para deducir ciertas partes de la aritmética de los números ordinales. En 1922 A. Fraenkel completó el sistema de Zermelo con un nuevo axioma, llamado axioma de reemplazo, que es un esquema de axioma (véanse los Capítulos 2.3 y 5.2). Ese mismo año, Th. Skolem propuso, de manera independiente, el mismo axioma. En 1930 Zermelo presentó una nueva versión de su sistema en la que modificaba uno de sus 7 axiomas originales, excluía otro, adoptaba el axioma de reemplazo de Fraenkel e introducía un nuevo axioma (el de fundamentación o regularidad). El sistema completo de 9 axiomas (Zermelo-Fraenkel o ZF) resultó adecuado y sin contradicciones aparentes. A partir de dicho sistema, todos los resultados fundamentales de la matemática clásica se pueden deducir con relativa facilidad (véase el Apéndice 2.14 para la formulación original de Zermelo y el Capítulo 5.2 para mayores detalles sobre el sistema ZF). Este sistema utilizaba sólo 2 términos primitivos: el predicado monádico “conjunto” y el predicado diádico “pertenece” ( ∈ ). Zermelo empleó como primer axioma un principio ya utilizado por Cantor, según el cual dos conjuntos son idénticos cuando tienen todos sus elementos en común. Este se conoce como axioma de extensionalidad y tiene la siguiente forma: ∀( xy ) ( ∀ z ( z ∈ x ↔ z ∈ y ) → x = y ). Luego, postuló como axioma (el tercero en su lista) a una versión modificada del principio de comprensión. Se lo denomina axioma de separación (o de subconjuntos) y se lo escribe así: ∀ z ∃ y ∀ x ( x ∈ y ↔ ( x ∈ z & ϕ x )). La idea fundamental de este axioma (en realidad, un esquema de axioma) es limitar la formación de conjuntos, de manera tal que no ocurra que para toda propiedad exista un conjunto que es su extensión. La restricción de Zermelo consiste en requerir que el nuevo conjunto determinado por la propiedad ϕ sea un subcon junto de un conjunto ya dado. Esto se expresa en el axioma mediante la condición de que todos los elementos del conjunto y , determinado por la propiedad ϕ, sean elementos de otro conjunto previamente existente z . Esta condición impide que puedan formarse conjuntos “demasiado grandes”, que son los que originan paradojas. Los restantes axiomas son, a su vez, modificaciones del axio52
L A
´ TICA ABSTRACTA O FORMAL AXIOMÁ
ma de comprensión que limitan la formación de conjuntos, pero permiten tratar con conjuntos infinitos. En el sistema de Zermelo-Fraenkel no existen, por ejemplo, ni la clase universal U, ni conjuntos que sean elementos de sí mismos. Por consiguiente, no se producen las paradojas de Cantor y de Russell. Posteriormente se construyeron diversos sistemas axiomáticos de la teoría de conjuntos diferentes del de Zermelo-Fraenkel. En 1925 J. Von Neumann presentó, bajo la forma de una teoría de las funciones, otra teoría axiomática de conjuntos, que luego fue perfeccionada por P. Bernays y por K. Gödel, y se conoce como Von Neumann-Bernays-Gödel (VNBG). En 1937, W. Quine propuso un sistema muy sencillo, conocido como NF ( New Foundations ), que empleaba sólo 2 axiomas. En 1955 A. Morse creó otra axiomatización diferente de las anteriores. Las relaciones entre estos diferentes sistemas axiomáticos han sido estudiadas con detalle, pero no pueden exponerse aquí. Digamos simplemente que no son sistemas equivalentes (en el sentido preciso que se define en el Capítulo 2.4). Además, el concepto de conjunto que se emplea en cada uno de ellos es en parte diferente, y los conjuntos construibles en cada sistema no son los mismos (por ejemplo, en los sistemas de Von Neumann-Bernays-Gödel, de Quine y de Morse existe la clase universal, pero no en el de Zermelo-Fraenkel). Por último todos los sistemas axiomáticos de teoría de conjuntos tienen en común el hecho de que no se ha demostrado la consistencia absoluta de ninguno de ellos. Hasta el momento no se han presentado contradicciones en estos sistemas, pero no hay garantía de que en el futuro no aparezcan antinomias (para más detalles véase el Capítulo 5.2). Los éxitos obtenidos por la axiomatización de teorías matemáticas a comienzos del siglo XX hicieron crecer el optimismo sobre la aplicabilidad del método axiomático. En su artículo “Pensamiento axiomático”, publicado en 1918, Hilbert consideraba que toda la matemática debía axiomatizarse y que el método axiomático podía extenderse también a las ciencias físicas, o al menos a todas las teorías de la física en las que la matemática desempeñara un papel importante. El llamado “programa de Hilbert” era el proyecto de axiomatizar todas las teorías de la matemática en un lenguaje completamente formalizado, y demostrar que los sistemas resultantes eran consistentes. Las pruebas de consistencia debían ser absolutas y realizadas por medios estrictamente finitarios (véase el Apéndice 1), esto es, que pudieran verificarse concluyentemente en un número finito de pasos. El ideal de Hilbert consistía en obtener para cada rama de la matemática un sistema axiomático formalizado que fuera a la vez consistente y completo. El célebre teorema de incompletitud, descubierto por K. Gödel en 1931, demostró que este ideal era irrealizable. Gödel probó que cualquier sistema axiomático formalizado que fuera lo suficientemente rico como para incluir a la aritmética elemental, es necesariamente incompleto (e incompletable), dado el su53
BREVE HISTORIA DEL MÉTODO AXIOMÁ ´ TICO
puesto de que es consistente. Como corolario de este resultado, demostró también que si un sistema axiomático de este tipo es consistente, su consistencia no puede ser probada dentro del propio sistema. Estos dos resultados afectaban severamente al programa de Hilbert, al menos en su formulación original, porque mostraban que los sistemas axiomáticos formales tienen limitaciones internas insuperables. No se sigue de ello, sin embargo, que el método axiomático sea inaplicable o carezca de utilidad. Por el contrario, el empleo de este método mismo fue el que hizo posible el descubrimiento de sus propias limitaciones (véase el Capítulo 4 y especialmente el Apéndice 1, para mayores detalles y una exposición más matizada del tema). Con los teoremas de Gödel comienza una nueva etapa del método axiomático, caracterizada por la investigación metateórica rigurosa de las propiedades de los sistemas formales, así como por el replanteo de los métodos de prueba admisibles en la metateoría de tales sistemas. Esta etapa llega hasta nuestros días, por lo que parece conveniente terminar en este punto nuestra breve historia del método axiomático.
Notas bibliográficas No se ha escrito todavía, hasta donde conozco, una obra dedicada exclusivamente a la historia del método axiomático. Se pueden encontrar informaciones en las obras generales de historia de la lógica, sobre todo la de Kneale (1984), y de la matemática: Collette (1973-1979); Rey Pastor y Babini (1985); DahanDalmedico y Peiffer (1986), Boyer y Merzbach (1989); Wussing (1989); Kline (1990), y Gratan-Guinness (1994) y (1997). Son obras con enfoques muy diferentes, que no siempre reservan el espacio merecido al método axiomático. También son útiles Bourbaki (1974), Kline (1980) y especialmente Eves (1990), que es la obra que más se aproxima a un esbozo de historia del método axiomático. La amplia obra filosófica de Suppes (2002) también contiene información histórica sobre la axiomática. Benacerraf y Putnam (1983) y Tymoczko (1998) son dos amplias antologías de trabajos originales sobre la filosofía de la matemática en el siglo XX. Shapiro (2000a) es una introducción histórica a la filosofía de la matemática que también incluye una exposición detallada de la situación actual. Mueller (1981) es el estudio moderno más completo sobre los Elementos de Euclides. Beaney (1997) contiene una traducción de casi todos los escritos importantes de Frege. Ferreirós (2006) es una traducción comentada de trabajos y correspondencia de Cantor. Hilbert (1930) es la realización clásica de la axiomática formal. Kolmogorov (1933) es otra obra clásica. Garciadiego (1992) es un estudio histórico detallado de la paradoja de Russell. La presentación original de la teoría de los tipos está contenida en Russell (1956). Los Principia de Whitehead 54
NOTAS
BIBLIOGRÁFICAS
y Russell (1910-1913) son posiblemente el tratado de lógica más extenso y difícil que se haya escrito, pero los primeros capítulos del primer volumen, que contienen la presentación axiomática de la lógica, todavía resultan muy legibles. Sobre la historia de la geometría no euclídea Gray (1989) presenta un esquema general y Torretti (1978) un tratamiento detallado del desarrollo axiomático. Bonola (1955) es una obra clásica, ya antigua, pero todavía útil (la edición inglesa, pero no la española, contiene como apéndices traducciones de las memorias originales de Bolyai y Lobachevsky). Torretti (1998), Mosterín (2000) y Grattan-Guinness (2000) ofrecen mucha información sobre el desarrollo de la lógica, la teoría de conjuntos y la fundamentación de la matemática en los siglos XIX y XX. Sobre ese tema también son útiles Tiles (1989) y (1991) y Gray (2000). Van Heijenoort (1967), Ewald (1996) y Mancosu (1998) contienen numerosas traducciones de textos fundamentales de la historia de la lógica y la matemática.
55
2
La estructura de un sistema axiomático
2.1 ¿Qué es un sistema axiomático? n sistema axiomático es una teoría organizada axiomáticamente. Las teorías, por su parte, están formadas por enunciados o proposiciones (aquí tomaremos enunciado y proposición como sinónimos). Una teoría es, como primera aproximación, un conjunto de proposiciones organizadas sistemáticamente. A veces se llama teoría, en un sentido un poco vago, a cualquier conjunto de proposiciones que tratan acerca de un tema o dominio determinado. Sin embargo, desde un punto de vista lógico, la característica esencial de una teoría consiste en que ésta es un conjunto de proposiciones cerradas respecto de la relación de consecuencia lógica, esto es, toda proposición que sea consecuencia lógica de una teoría también pertenece a esa teoría (en el parágrafo 2.6 de este capítulo trataremos con más detalle el concepto de teoría). Por cierto, no toda teoría es una teoría axiomática. Para obtener una teoría axiomática es necesario determinar un subconjunto A de las proposiciones de una teoría tal que todas las proposiciones de la teoría sean consecuencias lógicas de A. El conjunto A es el conjunto de los axiomas de la teoría. Con estos elementos ya podemos dar una definición de sistema axiomático: ◊ Un sistema axiomático S es un conjunto de proposiciones en el cual se distingue un subconjunto A (los axiomas), tal que toda proposición que pertenece a S es consecuencia lógica de A, y toda proposición que es consecuencia lógica de A pertenece a S . Esta definición vale para cualquier sistema axiomático, como los Elementos de Euclides, que esté compuesto por proposiciones o aseveraciones, es decir, oraciones significativas que tienen valor de verdad y, por consiguiente, son verdaderas o falsas. Sin embargo, aquí nos interesa tratar con sistemas axiomáticos formales, que no son conjuntos de proposiciones, sino de proposiciones formales. Una proposición formal es una expresión que contiene uno o más términos carentes de significado. Como consecuencia de ello, no tiene valor de verdad, no es verdadera ni falsa hasta que no se otorgue significado a dichos términos. Cuando se asigna un significado determinado a todos los términos de una proposición formal, ésta se convierte en una proposición. Así, por ejemplo, la expresión 1) “Hay al menos cuatro puntos que no están en un mismo plano”, es una
U
57
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
proposición (que además es verdadera respecto del espacio de Euclides). En cambio, la expresión 1’) “Hay al menos cuatro F que no están en un mismo G” es una proposición formal, porque contiene los términos F y G, cuyo significado no está determinado. Por consiguiente, no es verdadera ni falsa. Si convenimos en que el término F signifique “punto” y el término G signifique “recta”, la proposición formal 1’) se transforma en la proposición 1). Por otra parte, si asignamos otros significados a F y G, por ejemplo, “libro” y “biblioteca”, 1’) se con vierte en la proposición 2) “Hay al menos cuatro libros que no están en la misma biblioteca” (la cual es falsa respecto de la oficina de mi padre, que guarda todos sus libros en la misma biblioteca, pero verdadera respecto de mi departamento, que tiene varias bibliotecas, además de libros dispersos por todas partes). Un sistema axiomático formal es, entonces, una teoría axiomática compuesta por proposiciones formales conectadas entre sí por la relación de deducibilidad. ◊ Un sistema axiomático formal S es un conjunto de proposiciones formales
en el cual se distingue un subconjunto A (los axiomas), tal que todas las proposiciones formales que pertenecen a S son deducibles de A, y toda proposición formal deducible de A pertenece a S . Un sistema formal puede formularse en una lengua natural no formalizada, como el español o el inglés, siempre que todos sus axiomas sean proposiciones formales, es decir, contengan al menos un término carente de significado. Estos términos sin un significado determinado pueden ser tanto palabras del lenguaje corriente a las que se ha despojado de todo sentido usual (como, por ejemplo, “punto”, “recta” y “plano” en la axiomatización de Hilbert de la geometría euclídea expuesta en el Apéndice 2.12), como signos especiales introducidos en el lenguaje natural (por ejemplo, F , G y H en vez de “punto”, “recta” y “plano”). Este último procedimiento es preferible porque evita las connotaciones significativas que puedan conservar los términos de las lenguas naturales. En un sistema formal no formalizado la construcción de proposiciones formales se encuentra implícitamente regulada por la gramática de la lengua natural en la cual se expresa ese sistema. Por otra parte, la manera de transformar unas proposiciones formales en otras (la deducción correcta de unas a partir de otras) no está determinada por reglas explícitas, sino que se realiza de un modo intuitivo. Los sistemas formales formalizados se expresan en un lenguaje artificial, como el de la lógica, la matemática o la computación. En un sistema formalizado los signos que lo componen se relacionan entre sí mediante reglas de tipo sintáctico, pero no tienen significado alguno en el sentido preciso de que no se refieren a ningún objeto o entidad. En esta clase de sistemas la manera de combinar los signos para construir proposiciones formales, y la manera de transformar unas proposiciones formales en otras (la deducción correcta de unas a par58
ELEMENTOS DE UN SISTEMA AXIOMÁ ´ TICO
tir de otras) están especificadas explícitamente por reglas sintácticas (las reglas de formación y transformación, respectivamente). A veces se emplea la expresión “sistema axiomático material” para caracterizar a los sistemas no formales constituidos por proposiciones significativas y diferenciarlos de los sistemas axiomáticos formales compuestos de proposiciones formales sin significado. En este trabajo preferiremos evitar esta terminología. Llamaremos simplemente sistemas axiomáticos no formales a los que están compuestos por proposiciones, y sistemas axiomáticos formales a los que están compuestos por proposiciones formales. Los sistemas axiomáticos formales, a su vez, pueden ser formalizados o no formalizados, según se expresen en un lenguaje artificial regimentado o en una lengua natural enriquecida con algunos términos técnicos. De aquí en adelante nos ocuparemos de la estructura, interpretación y aplicación de los sistemas formales. En el Apéndice 2 incluimos la traducción de diversos sistemas axiomáticos no formales, desde Aristóteles hasta Newton, así como de algunos de los primeros sistemas axiomáticos formales, que tienen especial importancia histórica. Comenzaremos por analizar detenidamente cómo es la estructura de un sistema axiomático formal, esto es, cuáles son los elementos que lo componen y cómo se relacionan entre sí estos diferentes elementos.
2.2 Elementos de un sistema axiomático 0) Lógica subyacente. Todo sistema axiomático se formula en el marco de una determinada lógica, que en la mayoría de los casos es alguna porción de la lógica clásica. La lógica subyacente puede estar meramente supuesta y no hacerse explícita dentro del sistema. Esto es lo que sucede en la mayoría de los sistemas axiomáticos de matemática. Por su parte, la lógica subyacente también puede estar axiomatizada, aunque generalmente se prefiere, por razones de simplicidad y utilidad, emplear una lógica no axiomatizada. Si el sistema axiomático que se construye es un sistema de lógica elemental, usualmente no tendrá una lógica subyacente, pues, él mismo es un sistema de lógica. En los sistemas matemáticos, la lógica de primer orden constituye el requisito mínimo para una lógica subyacente. Hay, sin embargo, muchas teorías matemáticas que no se pueden axiomatizar mediante la lógica de primer orden porque requieren herramientas lógicas más potentes. En esos casos se emplea como lógica subyacente a la teoría de conjuntos o bien a una lógica de segundo orden o incluso de orden superior. Los matemáticos casi siempre prefieren a la teoría informal de con juntos como lógica subyacente por su mayor simplicidad y facilidad de aplicación. Sin embargo, cuando se trabaja en temas de fundamentación de las teorías matemáticas la teoría axiomática de conjuntos resulta preferible, ya que 59
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
minimiza los riesgos de que se produzcan paradojas, aunque no los elimina totalmente. Puede decirse que, en cierto sentido, la lógica de primer orden es la lógica subyacente fundamental de todo sistema axiomático. En efecto las lógicas más potentes, como la teoría de conjuntos y las lógicas de orden superior se pueden presentar a su vez como sistemas axiomáticos que tienen a la lógica de primer orden como lógica subyacente. Por su parte, la lógica de primer orden también se puede emplear de manera axiomatizada, pero un sistema axiomático de lógica de primer orden no tiene a su vez una lógica subyacente presupuesta. 1) Vocabulario. Es
el conjunto de todos los símbolos mediante los cuales se construyen las cadenas y fórmulas que componen el lenguaje del sistema. El vocabulario de un sistema axiomático contiene diferentes clases y categorías de símbolos. Daremos aquí un esquema básico de clasificación con la advertencia explícita de que la terminología varía mucho de un autor a otro, sin que haya un consenso unánime entre los lógicos y matemáticos sobre cómo llamar a cada clase de símbolo. 1a) Símbolos lógicos: son las conectivas lógicas, los cuantificadores y los signos de puntuación, como los paréntesis y corchetes. Se toman del lenguaje de la lógica subyacente al sistema. 1b) Símbolos no lógicos: genéricamente se los denomina términos o términos descriptivos. Son aquellos símbolos que pueden usarse para denotar individuos, propiedades o relaciones y funciones. Pertenecen a esta clase las variables proposicionales y predicativas, así como las constantes individuales y predicativas, los operadores y funtores. En un sistema axiomático formal ninguno de estos términos tiene significado. Pero cada uno de ellos pertenece a una categoría gramatical bien determinada. Por ejemplo, las constantes predicativas (y variables, si las hubiera) se distinguen por su grado: predicados monádicos, diádicos, triádicos, etc., según se apliquen a uno, dos o tres individuos. En general, el número de símbolos no lógicos de un sistema axiomático es infinito. Entre los términos descriptivos del sistema se eligen algunos que forman el vocabulario específico del sistema axiomático del que se trate. Estos son los términos técnicos del sistema, que se dividen en dos clases fundamentales: 1b1) Términos primitivos: son los términos no definidos que se introducen especificando únicamente la categoría gramatical a la que pertenecen. Por ejemplo, si las constantes predicativas P y Q son los primitivos de un sistema, es necesario indicar si son predicados monádicos, diádicos o del grado que fuere. La elección de los términos primitivos de un sistema axiomático es completamente convencional; se realiza sobre la
60
ELEMENTOS DE UN SISTEMA AXIOMÁ ´ TICO
base de criterios de simplicidad, utilidad, o elegancia estética. En principio, se procura introducir la menor cantidad posible de primitivos o de clases de ellos, pero este criterio no es absoluto. Frecuentemente, por razones de facilidad de uso, se prefiere introducir una mayor cantidad de primitivos que lo que sería estrictamente necesario. En el caso de un sistema axiomático de lógica, la totalidad de su vocabulario está constituido por símbolos lógicos (incluyendo entre estos a las variables), de modo que la distinción entre términos primitivos y definidos se establece entre los propios símbolos lógicos del sistema. 1b2) Términos definidos: son los términos que se definen mediante los primitivos (junto con los símbolos lógicos que sean necesarios). Las definiciones son estrictamente nominales y tienen la forma: t = def t i...t k, donde t es un término definido y t i...t k es una lista finita de términos primitivos (junto con símbolos lógicos). La presencia de términos definidos en un sistema axiomático no es imprescindible. Todas las expresiones del lenguaje del sistema pueden construirse empleando solamente términos primitivos y símbolos lógicos. Los términos definidos se introducen con el fin de simplificar el lenguaje del sistema y hacerlo más claro e inteligible. No obstante, siempre se los puede eliminar reemplazándoselos por su correspondiente definición en función de los términos primitivos. Las definiciones de un sistema formal deben satisfacer dos condiciones: i) eliminabilidad y ii) no creatividad . Las definiciones son eliminables cuando cualquier expresión de un sistema axiomático que contiene términos definidos se puede reemplazar por otra expresión equivalente que sólo contiene términos primitivos y símbolos lógicos, pero ningún término definido. Por otra parte, las definiciones son no creativas cuando no permiten probar como teoremas expresiones que no son demostrables exclusivamente a partir de los axiomas, cuando se han eliminado de ellas los términos definidos. Esto significa que si tenemos como teorema una expresión χ que emplea el término definido t , y en la prueba de χ se ha utilizado la definición de t , es posible demostrar sólo a partir de los axiomas una expresión equivalente χ’ que no contiene términos definidos. Estas dos condiciones establecen que las definiciones son meras estipulaciones o abreviaciones terminológicas, y por consiguiente, no dan lugar a la demostración de nuevos teoremas. En caso contrario, tendrían el carácter de axiomas. 2) Reglas de formación. Son
reglas de tipo sintáctico o gramatical que indican cómo combinar los símbolos del vocabulario de un sistema para obtener proposiciones formales bien construidas. Todo sistema axiomático requiere de un número finito de reglas de formación. Cualquier secuencia finita de símbo61
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
los de un sistema es una cadena. En un sistema axiomático generalmente hay infinitas cadenas. Pero no todo elemento de este conjunto será aceptable como una proposición formal, porque no cualquier cadena se considerará como una fórmula bien construida. Llamamos fórmula bien formada ( fbf ), o simplemente fórmula, a toda cadena obtenida mediante la aplicación de una o más reglas de formación del sistema a los símbolos del vocabulario. Las reglas de formación son las que permiten diferenciar dentro de un sistema las cadenas de símbolos que son fórmulas bien formadas de aquellas que no lo son. El conjunto de las fbf de un sistema generalmente también es infinito. Las fbf de un sistema axiomático formal son meras proposiciones formales que no tienen significado, y, por consiguiente, carecen de valor de verdad. No son verdaderas ni falsas hasta tanto no demos una interpretación de ese sistema. 3) Reglas de transformación. Son reglas lógicas que indican cómo obtener una fbf a partir de otra u otras fbf . Más precisamente, establecen que una fbf es inmediatamente deducible como conclusión a partir de un conjunto finito de fbf tomadas como premisas. Las reglas de transformación, son, en suma,
reglas lógicas de inferencia. Frecuentemente no se las enuncia de manera explícita, sino que están presupuestas como reglas completas de primer orden. En el caso de un sistema axiomático de lógica elemental, es necesario especificarlas explícitamente. La elección de las reglas de transformación también es convencional y se guía por criterios pragmáticos. Todo sistema axiomático necesita al menos una regla de transformación, pero no hay un límite superior para el número de reglas con tal de que éste sea finito. Una sola regla resulta suficiente (por ejemplo, la regla de separación o modus ponens, que se formula en el Capítulo 2.3), pero generalmente se emplea más de una con el fin de hacer que las demostraciones sean más simples y breves. Todas las reglas de transformación deben satisfacer el requisito de correc- ción, que consiste en la conservación de la verdad de las premisas a las que se aplican. Esto es, una regla de inferencia es correcta cuando a partir de proposiciones verdaderas sólo permite inferir proposiciones verdaderas. Una regla de inferencia correcta garantiza, en razón de la mera forma lógica de la inferencia, la transmisión de la verdad de las premisas a la conclusión. En general, un sistema axiomático es correcto cuando todas las fórmulas deducibles de los axiomas son también consecuencia lógica de los axiomas, es decir, si A es el con junto de los axiomas y χ es una fórmula cualquiera, entonces, si A χ, entonces, A χ. La corrección de las reglas de transformación de un sistema axiomático nos asegura que, cuando interpretemos ese sistema, si los axiomas resultan verdaderos, también los teoremas serán verdaderos. l−
l=
62
ELEMENTOS DE UN SISTEMA AXIOMÁ ´ TICO
4) Axiomas. Constituyen
un subconjunto de las fbf de un sistema axiomático. Son las proposiciones formales no demostradas que se adoptan sin prueba o justificación alguna. También se eligen convencionalmente, pero no sería adecuado decir que su elección es totalmente arbitraria. Los axiomas deben ser lo suficientemente fructíferos como para poder deducir de ellos todas las fórmulas que constituyen el sistema en cuestión. Por ejemplo, no cualquier conjunto de fbf de la lógica proposicional es adecuado como base axiomática para un sistema de lógica de este tipo, porque no cualquier conjunto de fbf permite deducir todas las tautologías de la lógica proposicional. Existe, con todo, una amplia libertad de elección para los axiomas de un sistema. Por esta razón es posible construir, como veremos más adelante, sistemas equivalentes a partir de diferentes conjuntos de axiomas. Por ejemplo, hay muchos sistemas equivalentes de lógica proposicional tales que ciertas fbf que aparecen como axiomas en un sistema, son teoremas en otro sistema y viceversa. Esto nos muestra la relatividad de la noción de axioma. Una determinada proposición formal es axioma respecto de un determinado sistema axiomático, pero puede no ser axioma, y generalmente no lo es, en otro sistema equivalente (o no) al primero. Los axiomas, como cualquier otra fbf de un sistema formal, no tienen significado ni valor de verdad. En particular, no son enunciados verdaderos y, por tanto, no se los elige por su evidencia, por el hecho de que sean verdades autoevidentes. Son meras proposiciones formales de las cuales se deducen otras proposiciones formales mediante la aplicación de las reglas de transformación del sistema. El conjunto de los axiomas de un sistema axiomático no necesariamente debe ser finito. Como veremos luego, hay teorías que no son axiomatizables mediante un número finito de axiomas y requieren un número infinito de ellos. Si el número de axiomas es finito se los puede presentar mediante una lista, una secuencia numerada de ellos. En cambio, si un sistema tiene infinitos axiomas, evidentemente no es posible dar una lista de ellos. En ese caso debe proporcionarse un medio efectivo para identificar si una fbf cualquiera del sistema es o no un axioma. Un sistema de este tipo se presenta mediante esquemas de axio- ma, formulados con metavariables, cada uno de los cuales comprende como casos a infinitos axiomas. Por ejemplo, si A → A se toma como axioma esquema, p → p; ( p v q ) → ( p v q ); y otras infinitas fbf serán casos de sustitución de ese esquema. Toda fbf que se obtenga sustituyendo de manera uniforme las metavariables de un axioma esquema por cualquier fbf será, entonces, un axioma del sistema. Por supuesto, el número de esquemas de axioma debe ser finito. Idealmente, en la construcción de un sistema axiomático se tiende a reducir el número de axiomas o de esquemas de axioma al mínimo posible. Pero éste tampoco es un requisito irrevocable. Con frecuencia se emplean más axiomas que los estrictamente necesarios con el fin de que éstos resulten más breves y 63
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
sencillos y las demostraciones a partir de ellos sean más fáciles. Más adelante nos encontraremos con ejemplos de esta situación. 5) Teoremas. Son
las fbf de un sistema que se deducen de los axiomas mediante la aplicación de alguna regla de transformación. Los axiomas se consideran fbf deducibles de sí mismas (pues la reflexividad es una propiedad esencial de la relación de deducibilidad: toda fórmula se deduce de sí misma). Luego, todo axioma es también teorema. Así, el conjunto de los axiomas de un sistema está incluido en el de los teoremas; y a su vez el conjunto de los teoremas está incluido en el conjunto de las fbf de ese sistema. Casi siempre el conjunto de los teoremas de un sistema axiomático es infinito. Por supuesto, en la práctica no podemos conocerlos a todos, sino que nos limitamos siempre a un conjunto finito de teoremas efectivamente demostrados. Una vez que hemos descripto todos los elementos que componen un sistema axiomático podemos caracterizar las nociones de demostración formal y de deducción en un sistema axiomático. ◊ Una demostración formal en un sistema axiomático S es una secuencia fi-
nita de fbf de S , tales que cada una de ellas o bien es un axioma, o bien es una fbf inmediatamente deducible de algunas de las fbf que la preceden en la secuencia. En una demostración formal toda fórmula deducida de los axiomas debe obtenerse por medio de la aplicación de alguna regla de transformación del sistema a los axiomas. La última fbf de la secuencia es la conclusión o teorema demostrado. ◊ Una deducción a partir del conjunto G de premisas en un sistema axiomá-
tico S es una secuencia finita de fbf , tales que cada una de ellas es un axioma, o un miembro de G, o es una fbf inmediatamente deducible de algunas de las fbf que la preceden en la secuencia. La última fbf de la secuencia se denomina teorema deducible del conjunto de premisas G. De estas dos definiciones la segunda es más general y abarca a la primera. En efecto, una demostración formal es un caso particular de deducción: es una deducción en la que el conjunto G de premisas es vacío.
2.3 Ejemplo de un sistema axiomático Veremos ahora cómo se construye un sistema axiomático simple y daremos algunos ejemplos de demostración de teoremas dentro de ese sistema. Con ello 64
E JEMPLO
´ TICO DE UN SISTEMA AXIOMÁ
se aclararán muchos de los conceptos que acabamos de caracterizar de una manera abstracta. Presentaremos, en una versión ligeramente modernizada, un sistema axiomático de lógica proposicional que fue creado por el lógico polaco J. Lukasiewicz en 1929 (traducido en Lukasiewicz 1963). Introduciremos uno por uno los diferentes elementos y los iremos comentando. Los sistemas axiomáticos de lógica fundamental representan un caso ligeramente atípico dentro de los sistemas axiomáticos formales. Ante todo, esta clase de sistemas no tiene una lógica subyacente presupuesta que sea diferente del sistema mismo. Dado que se trata sistemas de lógica básica, la lógica sub yacente está dada por el propio sistema, el cual puede usarse a su vez como lógica subyacente para otras teorías axiomáticas. Sin embargo, la mayoría de los sistemas axiomáticos formales tiene una lógica subyacente que no está axiomatizada. El ejemplo de la lógica proposicional es particularmente simple y, además, nos resulta útil para introducir la estructura de un lenguaje formalizado y para conocer la manera en que se demuestran teoremas dentro de un sistema formal. Más adelante (en el Capítulo 2.6) presentaremos otros ejemplos de sistemas axiomáticos formalizados, la aritmética de Peano y la geometría elemental de Tarski, que representan casos más típicos de empleo del método axiomático en las ciencias formales. Lógica proposicional (Łukasiewicz
1929)
1) Términos primitivos a) Símbolos lógicos
Constantes lógicas: ¬ , → Signos de puntuación: ( ) b) Símbolos no lógicos
Variables proposicionales: p,
q, r, ...p 1, q1, r 1 ...
2) Reglas de formación
Las letras mayúsculas A, B, C..., que emplearemos en las reglas de formación y transformación, son en realidad metavariables que representan a cualquier fórmula del sistema. Así, por ejemplo, A puede representar a un símbolo proposicional p, pero también a la fórmula p → q o a cualquier otra de cualquier extensión. RF1. Toda variable proposicional es una fórmula bien formada ( fbf ). RF2. Si A y B son fbfs, entonces, ¬ A y (A → B) son fbfs. 65
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
RF3. Sólo son fbfs las cadenas de símbolos que resultan de la aplicación (posiblemente reiterada) de RF1 y RF2. Estas son todas las reglas de formación del sistema. Todas las reglas se enuncian en un nivel metalingüístico. Estas reglas nos permiten construir un número infinito de fórmulas bien formadas de cualquier extensión finita. Por ejemplo, p, y q son fbf por RF1; ( p → q ) es una fbf por RF2; ¬ ( p → q ) es una fbf por RF2; (¬ ( p → q )) → (¬ ( p → q )) es una fbf por RF2, y así sucesivamente. La oración final es una cláusula de cierre, que se emplea para excluir la posibilidad de que se agreguen nuevas reglas de formación o se las suponga tácitamente. Para simplificar la notación y eliminar el uso de paréntesis adoptaremos la con vención de suprimir los paréntesis externos de cada fórmula. De este modo, escribiremos A → B en vez de (A → B); y (A → B) → C en vez de ((A → B) → C)). También escribiremos ¬ A en vez de ¬ (A) cuando la fórmula A no contenga otras constantes lógicas. 3) Términos definidos
Definición de “v”: A v B ↔def ¬ A → B. Definición de “&”: A & B ↔def ¬ (A → ¬ B). Definición de “↔”: A ↔ B ↔def ¬ ((A → B) → ( ¬ (B → A))). Los términos definidos no son necesarios dentro del sistema, ya que todas las fbf de la lógica proposicional pueden escribirse solamente con las conectivas de negación y condicional. Se los introduce por razones prácticas para simplificar la escritura y para traducir al lenguaje del sistema otras formulaciones de la lógica proposicional. 4) Reglas de transformación
RT1. Dadas las fbf A y A → B, la fbf B se deduce inmediatamente de ambas. RT2. Dado un teorema A, se deduce inmediatamente otro teorema B sustituyendo en A una cualquiera de sus variables, en todas sus apariciones, por una misma fbf cualquiera. Estas son todas las reglas de transformación del sistema.
66
E JEMPLO
´ TICO DE UN SISTEMA AXIOMÁ
La regla RT1 es la regla de separación o modus ponens: A, (A → B) / B, conocida ya por los antiguos griegos. La regla RT2 es la regla de sustitución uniforme de variables, que en este sistema se aplica sólo a los símbolos proposicionales. A veces, para simplificar las demostraciones, se introducen reglas derivadas de inferencia, pero aquí no lo haremos. 5) Axiomas
Ax1. ( p → q ) → (( q → r ) → ( p → r )). Ax2. ( ¬ Ax3.
p → p ) → p.
p → ( ¬ p → q ).
Ninguna otra fórmula es un axioma. Por razones de elegancia, casi siempre se prefiere utilizar sólo términos primitivos en la formulación de los axiomas, como ocurre en este caso, aunque ello no es indispensable. 6) Teoremas T1.
((( q → r ) → ( p → r )) → s ) → (( p → q ) → s ).
Demostración:
1. ( p → q ) → (( q → r ) → ( p → r ))
[Axioma 1]
2. (( p → q ) → (( q → r ) → ( p → r ))) → (((( q → r ) → ( p → r )) → s ) → (( p → q ) → s )) [De 1 por RT2, sustituyendo p por ( p → q ); q por ( q → r ) → ( p → r ); y r por s] 3. ((( q → r ) → ( p → r )) → s ) → (( p → q ) → s ) [De 1 y 2 por RT1]
Todo teorema demostrado se puede usar a su vez como axioma de las siguientes demostraciones. T2. ( p →
( q → r )) → (( s → q ) → ( p → ( s → r ))).
Demostración:
1. ((( q → r ) → ( p → r )) → s ) → (( p → q ) → s )
[Teorema 1]
67
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
2. (((( q → r ) → ( s → r )) → ( p → ( s → r ))) → (( s → q ) → ( p →( s → r )))) → (( p → ( q → r )) → (( s → q ) → ( p → ( s → r )))) [De 1 por RT2, sustituyendo q por ( q → r ); r por ( s → r ); y s por (( s → q ) → ( p → ( s → r )))] 3. ((( q → r ) → ( s → r )) → ( p → ( s → r ))) → (( s → q ) → ( p → ( s → r ))) [De 1 por RT2, sustituyendo
p
por s; y s por p → (s → r)]
4. ( p → ( q → r )) → (( s → q ) → ( p → ( s → r ))) [De 2 y 3 por RT1] • Estos dos teoremas se deducen del Axioma 1 exclusivamente. Veamos ahora una demostración que emplea los tres axiomas conjuntamente. T3. p → p Demostración:
1. ( p → q ) → (( q → r ) → ( p → r )) 2. ( p → ( ¬
p → q )) →
((( ¬
[Axioma 1]
p → q ) → r ) → ( p → r ))
[De 1 por RT2, sustituyendo q por ( ¬ 3.
p → ( ¬ p → q )
p → q )]
[Axioma 3]
4. (( ¬
p → q ) → r ) → ( p → r )
[De 2 y 3 por RT1]
5. (( ¬
p → p ) → p ) → ( p → p )
[De 4 por RT2, sustituyendo y r por p]
6. ( ¬ 7.
p → p ) → p
p → p
q
por p;
[Axioma 2] [De 5 y 6 por RT1]
Observemos que cada una de estas secuencias de fórmulas es una demostración porque satisface las condiciones enunciadas antes: cada línea es un axioma o una fórmula que se deduce de alguna línea precedente por medio de la aplicación de una regla de transformación. La clave para encontrar una prueba de un teorema cualquiera está en hallar la sustitución adecuada para cada uno de los símbolos proposicionales p, q y r , que aparecen en los axiomas. La única res68
E JEMPLO
´ TICO DE UN SISTEMA AXIOMÁ
tricción para este procedimiento es que la sustitución debe ser uniforme en cada línea, o sea, que si, por ejemplo, en el Axioma 2 el símbolo p se reemplaza por la fórmula r → q, todas las apariciones de p en ese axioma deben reemplazarse por r → q. Ello no impide que en otra línea de la demostración p sea remplazada uniformemente, en cualquier axioma, por otra fórmula cualquiera. Actualmente se prefiere formular los sistemas axiomáticos de lógica mediante esquemas de axiomas. El número de axiomas del sistema se vuelve, entonces, infinito, porque cada esquema representa a un número infinito de axiomas. Este hecho no constituye un problema porque comparando la forma lógica de los esquemas de axiomas con la forma lógica de cualquier fbf , podemos determinar si esa fbf es o no es un axioma. Por otra parte, este procedimiento tiene varias ventajas: se puede prescindir de la regla de sustitución, las demostraciones se vuelven más simples y los resultados obtenidos son más generales. La idea de emplear esquemas de axiomas la introdujo J. Von Neumann en 1927, pero el procedimiento sólo se generalizó años más tarde. Un ejemplo de esta clase de formulación es el sistema de lógica proposicional que A. Church presentó en 1956, inspirado en otro sistema de lógica proposicional de J. Łukasie wicz. El sistema emplea los mismos términos primitivos, reglas de formación y términos definidos; una sola regla de transformación, el modus ponens (RT1), y los siguientes axiomas: 5’) Axiomas
Ax1. A → (B → A). Ax2. (A → (B → C)) → ((A → B) → (A → C)). Ax3. ( ¬ A → ¬ B) → (B → A). Ninguna otra fórmula es un axioma. Estos axiomas son en realidad esquemas de axiomas formulados con metavariables. Las letras A, B, C,..., representan fórmulas cualesquiera, no necesariamente distintas entre sí. Cada esquema de axioma tiene un número infinito de casos de sustitución, por lo que cada uno de ellos representa a infinitos axiomas. Así, por ejemplo, las tres siguientes fórmulas: p → ( q → p ); ( p → q ) → ( q → ( p → q )); y ¬ p → ( ¬ p → ¬ p ), son todos axiomas obtenidos por sustitución del esquema de axioma Ax1. Veamos dos ejemplos de demostración en este sistema.
69
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
6’) Teoremas
T1.
A → A.
Demostración:
1. A → ((A → A) → A)
[Axioma 1]
2. A → ((A → A) → A)) → (((A → (A → A)) → (A → A)) [Axioma 2] 3. (A → (A → A)) → (A → A)
[De 1 y 2 por RT1]
4. A → (A → A)
[Axioma 1]
5. A → A
[De 3 y 4 por RT1]
Hemos probado un teorema de la lógica proposicional que puede identificarse con el clásico principio de identidad. Pero, puesto que hemos usado esquemas de axiomas, hemos demostrado en realidad un esquema de proposición formal que representa a infinitos teoremas de la misma forma, por ejemplo: p → p; q → q; ( p → q ) → ( p → q ); etc. T2. ¬
A → (A → B).
Demostración:
1. ( ¬ B → ¬ A) → (A → B)
[Axioma 3]
2. (( ¬ B → ¬ A) → (A → B)) → ( ¬ A → (( ¬ B → ¬ A) → (A → B)))
[Axioma 1]
3. ¬ A → (( ¬ B → ¬ A) → (A → B))
[De 1 y 2 por RT1]
4. ( ¬ A → (( ¬ B → ¬ A) → (A → B))) → (( ¬ A → ( ¬ B → ¬ A)) → ( ¬ A → (A → B)))
[Axioma 2]
5. ( ¬ A → ( ¬ B → ¬ A)) → ( ¬ A → (A → B)) [De 3 y 4 por RT1]
70
6. ¬ A → ( ¬ B → ¬ A)
[Axioma 1]
7. ¬ A → (A → B)
[De 5 y 6 por RT1]
SISTEMAS
EQUIVALENTES
2.4 Sistemas equivalentes Se dice que dos sistemas axiomáticos son equivalentes (o equipolentes) cuando permiten demostrar el mismo conjunto de teoremas. Por ejemplo, dos sistemas de lógica proposicional serán equivalentes si en ambos se prueban como teoremas todas las tautologías de la lógica proposicional. La equivalencia entre dos sistemas axiomáticos se determina definiendo los términos primitivos de uno mediante los del otro, y demostrando que los axiomas de cada uno son teoremas en el otro sistema. Más precisamente, los sistemas S 1 y S 2 son equiva- lentes si y sólo si, i) los términos primitivos de S 1 son términos definibles en S 2 y los primitivos de S 2 son definibles en S 1; y ii) los axiomas de S 1 son teoremas en S 2 y los axiomas de S 2 son teoremas en S 1. Cuando se cumplen estas dos condiciones decimos que S 1 y S 2 no son dos teorías diferentes, sino dos for- mulaciones diferentes de la misma teoría. Existen numerosos sistemas axiomáticos de lógica proposicional que son equivalentes entre sí. Por ejemplo, el sistema elaborado por D. Hilbert y W. Ackermann en 1928 emplea en los axiomas las conectivas lógicas de disyunción ( v ) y condicional ( → ), aunque esta última es un término definido, como regla de transformación al modus ponens, y como axiomas a las siguientes fórmulas: Ax1. (A v A) → A. Ax2. A → (B
v
A).
Ax3. (A v B) → (B
v
Ax4. (A → B) → ((C
A). v
A) → (C v B)).
Este sistema es equivalente al de J. Lukasiewicz de 1929, que expusimos antes. Para probarlo hay que proceder en dos pasos. Primero traducimos los axiomas de Hilbert y Ackermann al lenguaje del sistema de Lukasiewicz, reemplazando de manera uniforme el término lógico “ v” por su definición mediante “ →” y “¬”. El primer axioma se traduce, entonces, como: ( ¬ A → A) → A. Los restantes axiomas puede reescribirlos el lector. Luego se demuestra cada uno de los cuatro axiomas traducidos a partir de los tres axiomas del sistema de Lukasiewicz. Las pruebas correspondientes también quedan como ejercicio para el lector. Con ello se ha probado que el sistema de Lukasiewicz implica al de Hilbert y Ackermann, pero para probar la equivalencia entre ambos sistemas hay que demostrar que la implicación se da en sentido inverso. Ahora es necesario traducir los axiomas de Lukasiewicz al lenguaje del sistema de Hilbert y Ackermann y luego deducirlos de los cuatro axiomas de este sistema. Cuando dos sistemas axiomáticos emplean reglas de inferencia diferentes la deducción de los axiomas debe hacerse empleando las reglas propias de cada 71
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
uno. Por ejemplo, el sistema de lógica proposicional que H. Reichenbach construyó en 1953 emplea como términos primitivos a las conectivas de negación ( ¬ ) y disyunción ( v ); pero en vez del modus ponens usa como regla de inferencia la regla del silogismo disyuntivo: A v B, ¬ A / B. Los axiomas de ese sistema son los siguientes: Ax1. ¬ ¬ (A v ( ¬ A v B)). Ax2. ¬ ¬ ( ¬ (A v B)
v
( ¬ ( ¬ B
v
A) v A)).
Ax3. ¬ ¬ ( ¬ (A v B)
v
( ¬ ( ¬ B
v
C)
v
(A v C))).
Ax4. ¬ A v A. Ax5. ¬ (A v B)
v
(A v ¬ ¬ B).
Para probar la equivalencia de este sistema con cualquiera de los dos anteriores es necesario traducir los axiomas de éstos al lenguaje del sistema de Reichenbach y luego demostrarlos a partir de sus cinco axiomas empleando sólo la regla del silogismo disyuntivo. Después hay que traducir los axiomas de Reichenbach a los lenguajes de cada uno de los otros dos sistemas y demostrarlos a partir de los axiomas de cada uno de ellos usando sólo la regla del modus po- nens. Aquí tiene el lector un ejercicio más largo y complicado que le demandará, probablemente, más tiempo de trabajo.
2.5 Lógica de primer orden El sistema axiomático de lógica proposicional que presentamos antes se puede ampliar hasta obtener un sistema completo de lógica de primer orden con identidad. Para ello es necesario incorporar nuevos términos primitivos y definidos, reglas de formación y de transformación, y una serie de nuevos axiomas. El sistema que expondremos es, con variantes de detalle, el que A. Church construyó en 1956, uno de los más conocidos y utilizados en los subsiguientes tratados de lógica. Su estructura es la siguiente: Lógica de primer orden con identidad (Church
1) Términos primitivos a) Símbolos lógicos
Conectivas lógicas: ¬ ; → Cuantificador universal: ∀ Símbolo de identidad: = Signos de puntuación: ( ) 72
1956).
L Ó´GICA DEL
PRIMER ORDEN
b) Símbolos no lógicos
Variables proposicionales: p, q, r, ...p 1, Constantes predicativas:
P 1, Q1, R 1, ... P 2 , Q 2 , R 2 , ... P 3, Q3, R 3, (el …
Funtores:
q1, r 1 ...
f 11, f 1 2 , f 13, ... f 2 1, f 2 2 , f 2 3, … f n1, f n 2 , f n3, ... (el
Constantes individuales: a, Variables individuales: x,
superíndice indica el grado del predicado).
superíndice indica el grado del funtor).
b, c, ...
y, z, ...
El vocabulario incluye un número infinito contable de variables proposicionales, predicados, funtores, constantes individuales, variables individuales y signos de puntuación. 2) Reglas de formación Definición de término: i)
una constante individual es un término; ii) una variable individual es un término; iii) un funtor n-ádico seguido de n-términos es un término; iv) ninguna otra fórmula es un término. Variables libres y ligadas: una
variable individual se llama ligada cuando cae bajo el alcance de un cuantificador. Una variable no cuantificada se llama libre. Así, en la fórmula ∀ x ( Fxy ), x está ligada, pero y está libre. RF1: Toda variable proposicional es una fórmula bien formada ( fbf ). RF2: Si P n es una constante predicativa n -ádica y t 1… t n son términos, entonces, P n t 1…t n es una fbf . RF3: Si A es una fbf y u es una variable individual, entonces, ∀u A es una fbf . RF4: Si A y B son fbfs, entonces, ¬ A y (A → B) son fbfs. RF5: Si
t 1
y t 2 son términos, entonces,
t 1
=
t 2 es
una fbf .
RF6: Sólo son fbfs las cadenas de símbolos que resultan de la aplicación (posiblemente reiterada) de RF1-RF5. Estas son todas las reglas de formación del sistema.
73
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
3) Términos definidos
Definición de “v”: A v B
def ¬
↔
Definición de “&”: A & B
def ¬
↔
Definición de “↔”: A ↔ B Definición de “∃”: ∃u A
A → B. (A → ¬ B).
def ¬
↔
((A → B) → ( ¬ (B → A))).
def ¬ ∀u ¬
↔
A.
Un lenguaje L construido mediante el vocabulario y las reglas de formación que acabamos de enunciar es un lenguaje de primer orden. 4) Reglas de transformación
RT1. A, A → B / B [ Modus RT2. A →
Pu
/ A → ∀u
Pu
ponens].
( u no aparece libre en A.) [Generalización universal].
5) Axiomas
Ax1. A → (B → A). Ax2. (A → (B → C)) → ((A → B) → (A → C)). Ax3. ( ¬ A → ¬ B) → (B → A). Ax4. (A →
Pa ) →
Ax5: ∀u ( Pu →
(A → ( ∀u )
Pu ) [a no
aparece libre en A].
Pa ).
Ax6: ∀u ( u = u ). Ax7: ∀u ∀w (( u = w ) → ( Pu →
Pw )).
6) Teoremas
Entre otras, son teoremas las siguientes fórmulas: T1. ¬ (A & ¬ A). T2. (A & ¬ A) → B. T3. A v ¬ A. T4. A ↔ ¬ ¬ A. T5. (A → B) ↔ ( ¬ A v B). 74
T EORÍ´ AS
DE PRIMER ORDEN
T6. (A v B) ↔ ¬ ( ¬ A & ¬ B). T7. (A & B) ↔ ¬ ( ¬ A v ¬ B). T8. ( ¬ A → B) → ( ¬ B → A). T9. ((A → B) → A) → A. T10. ∀u A ↔ ¬ ∃u ¬ A. T11. ∃u A ↔ ¬ ∀u ¬ A. No daremos la demostración de estos teoremas, que el lector puede intentar por sí mismo. Todos estos teoremas son característicos de la lógica clásica. Los tres primeros son, respectivamente, el principio de no contradicción, el principio fuerte de Pseudo Escoto y el principio de tercero excluido. El hecho de que estas tres fórmulas sean demostrables nos asegura que el sistema no es una lógica no clásica de tipo paraconsistente o paracompleta, en las cuales algunas de estas fórmulas, o todas ellas, no son teoremas. El cuarto teorema es la ley fuerte de doble negación, cuya demostrabilidad asegura que el sistema en cuestión no es una lógica no clásica disminuida, como la lógica minimal o la intuicionista. Tampoco T3, el tercero excluido, es demostrable en ninguna de estas dos lógicas; mientras que T2, el principio fuerte de Pseudo Escoto, es demostrable en la lógica intuicionista, pero no en la minimal. Los restantes teoremas T5 - T11, expresan leyes clásicas de tipo fuerte que no son teoremas en la lógica minimal ni en la intuicionista.
2.6 Teorías de primer orden El sistema axiomático de lógica de primer orden que hemos expuesto, o cualquier otro equivalente, es apto para emplearse como lógica subyacente de una amplia variedad de teorías matemáticas. Toda teoría se formula en un determinado lenguaje L . Cualquier teoría formulada en el lenguaje de la lógica de primer orden con identidad se llama en general teoría de primer orden. Aquí nos interesa caracterizar en particular a las teorías axiomáticas de primer orden. Antes de poder hacerlo es necesario definir las nociones de teoría y de teoría axiomatizable. Ante todo, caracterizaremos la noción de procedimiento efectivo, que será empleada en las definiciones. Un procedimiento efectivo es una receta o conjunto de instrucciones que provee un método mecánico para obtener en un número finito de pasos la respuesta a una pregunta de tipo determinado. En ninguno de los pasos deben aparecer procedimientos aleatorios o azarosos de decisión, tales como arrojar una moneda o cualquier otro de este tipo. Las tablas de verdad en la lógica proposicional, por ejemplo, constituyen un método efectivo 75
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
para responder si una fórmula bien formada cualquiera del lenguaje proposicional es una tautología o no lo es. La respuesta concluyente, por sí o por no, se puede obtener siempre en un número finito de pasos, esto es, realizando un número finito de operaciones. En principio, una máquina adecuadamente programada siempre puede ejecutar las operaciones indicadas en un procedimiento efectivo. Al comienzo de este capítulo caracterizamos a una teoría como un conjunto de proposiciones cerrado respecto de la relación de consecuencia lógica. Ahora tenemos que precisar esta idea. En primer lugar, dado un lenguaje formal L , decimos que una teoría formulada en ese lenguaje es una L -teoría. Llamamos (Prop) L al conjunto de todas las proposiciones de L (es decir, fbf que no contienen variables libres). Luego definimos la clausura lógica de un conjunto de proposiciones de la siguiente manera: si G es un conjunto cualquiera de proposiciones de L (es decir, G ⊆ (Prop) L ), llamamos clausura lógica de G al conjunto de todas las proposiciones de L que son consecuencia lógica de G. Esto es: Cn( G ) =def {χ ∈ (Prop) L : G |= χ}. Ahora podemos dar la siguiente definición de teoría: ◊ Sea L un lenguaje formal. T es una L-teoría si y sólo si T ⊆ (Prop) L y para toda proposición χ ∈ (Prop) L , se cumple que χ ∈ T si y sólo si T |= χ.
Utilizando la noción de clausura lógica podemos dar otra definición equivalente: una L-teoría es un conjunto T ⊆ (Prop) L tal que T = Cn( T ). En ambas definiciones expresamos la idea de que una teoría es un conjunto de proposiciones cerrado respecto de la relación de consecuencia lógica. Nos interesa ahora definir una cierta clase de teorías, las teorías axiomatizables: ◊ Una teoría T es axiomatizable si y sólo si cumple con las siguientes con-
diciones:
1. Hay un subconjunto A de axiomas que está incluido en T ( A ⊆ T ). 2. El conjunto de las consecuencias lógicas de A es igual a T ( Cn( A ) = T ). 3. A es decidible. La teoría se dice finitamente axiomatizable, si el conjunto A es finito. De lo contrario, decimos que es infinitamente axiomatizable. En este caso, se debe garantizar independientemente que A sea decidible, es decir, que sea posible deter-
76
T EORÍ´ AS
DE PRIMER ORDEN
minar si una fbf cualquiera χ es o no es un axioma de la teoría T (véase el Capítulo 4.1 para una caracterización más precisa de la decidibilidad). Tal garantía no es necesaria en el primer caso, puesto que siempre se puede decidir en un número finito de pasos si una cierta fbf χ está incluida o no en una lista finita A. S. Kleene probó en 1952 que una clase importante de teorías de primer orden (aquellas que no tienen modelos finitos) siempre son finitamente axiomatizables, si se enriquece adecuadamente su vocabulario original. No obstante, por razones de simplicidad y utilidad, se prefiere con frecuencia presentar a los sistemas axiomáticos de primer orden mediante esquemas de axiomas, o sea, de una manera no finitamente axiomatizable. Ya lo hemos hecho al exponer la lógica de primer orden. En general, si el conjunto de esquemas de axiomas es reducido, no presenta ninguna desventaja respecto de una axiomatización finita de la misma teoría. Una teoría axiomática de primer orden se compone de un número infinito de fórmulas, cada una de las cuales es una secuencia finita de símbolos. Los símbolos y fórmulas de esta clase de teorías deben satisfacer cuatro condiciones de efectividad: a) La noción de símbolo es efectiva, o sea, hay un procedimiento efectivo para decidir si un símbolo cualquiera es o no es un símbolo del lengua je de la teoría. b) La noción de fórmula bien formada es efectiva, o sea, hay un procedimiento efectivo para decidir si una secuencia finita cualquiera de símbolos es o no una fórmula bien formada. c) La noción de axioma es efectiva, o sea, hay un procedimiento efectivo para decidir si una fórmula cualquiera es o no un axioma. d) La noción de inferencia es efectiva, o sea, hay un procedimiento efectivo para decidir, dada una secuencia finita cualquiera de fórmulas, si cada miembro de la secuencia se puede inferir o no de los precedentes. Para decidir si un símbolo pertenece al lenguaje de una teoría determinada, debemos recurrir a la lista de símbolos que especifica el vocabulario de la teoría y comprobar si ese símbolo pertenece o no a la lista. Para decidir si una secuencia finita de símbolos del lenguaje de la teoría es o no una fórmula bien formada de la teoría, debemos apelar a las reglas de transformación y verificar que esa secuencia de símbolos se puede construir aplicando exclusivamente dichas reglas. Para decidir si una fórmula bien formada de la teoría es un axioma de esa teoría debemos consultar la lista de los axiomas y comprobar si dicha fórmula tiene la misma forma lógica que alguno de los axiomas o esquemas de axiomas. Consultando esta lista podemos decidir siempre si una fórmula bien formada es o no un axioma del sistema. Finalmente, las reglas de transforma77
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
ción proporcionan un método efectivo para las inferencias (deducciones o demostraciones en el sistema). Dada cualquier secuencia de fórmulas bien formadas siempre es posible decidir si una fórmula se infiere de las precedentes, y, por tanto, si la secuencia constituye una deducción o una demostración de la última fórmula. Todos estos procedimientos se pueden realizar en un número finito de pasos no azarosos y, por tanto, proporcionan métodos efectivos para decidir acerca de los signos, fórmulas, axiomas y teoremas de la teoría. En la práctica usual de los matemáticos la formulación de un sistema axiomático formal en la mayoría de los casos no se hace en un lenguaje formalizado. Cuando el lenguaje es efectivamente formalizado, generalmente no se hace explícito todo su vocabulario y sus reglas de formación, sino que se las presupone conocidas. La parte explícita del sistema axiomático consiste fundamentalmente en una lista de términos primitivos descriptivos específicos del sistema, junto con una lista de axiomas o esquemas de axiomas. Como primer ejemplo de una teoría axiomática de primer orden presentaremos la aritmética de los números naturales de Peano en una versión ligeramente modificada (para la presentación del sistema original, que no incluye el número 0, véase el Apéndice 2.11). La aritmética elemental (Peano
1889).
El lenguaje en que se formaliza la teoría es el de la lógica de primer orden con identidad. La lógica subyacente del sistema es la teoría intuitiva de conjuntos. Los términos primitivos específicos son: la constante individual 0 (cero), el predicado monádico N (número natural), y el funtor unario Sx (sucesor de x ). Los axiomas del sistema son los siguientes: Ax1. N (0). [Cero es un número natural]. Ax2. ∀ x ( N ( x ) → N (S x )). [El sucesor de un número natural es un número natural]. Ax3. ¬ ∃ x ( N ( x ) & 0 = Sx ). [Cero no es el sucesor de un número natural]. Ax4. ∀( xy ) (( N ( x ) & N ( y ) & Sx = Sy ) → x = y ). [Si dos números naturales tienen el mismo sucesor, entonces, son el mismo número]. 78
T EORÍ´ AS
Ax5. ( ϕ(0) &
∀ x ( ϕ( x ) → ϕ( Sx ))) → ∀ x ϕ( x ).
DE PRIMER ORDEN
[Donde x es la única variable libre que aparece en la fórmula ϕ].
Adviértase que este último axioma es un esquema de axioma. Por consiguiente, la aritmética de Peano no es finitamente axiomatizable cuando se la formula como teoría de primer orden. Si se quiere obtener una axiomatización finita de esta teoría es necesario formularla en un lenguaje de segundo orden, donde se cuantifica el predicado ϕ. El último axioma debe, entonces, reemplazarse por el siguiente: Ax5’.
∀ P (( P ( 0)
&
) → P (S x ))) → ∀ x P ( x )). ∀ x ( P ( x
La aritmética de Peano es, así, finitamente axiomatizable cuando se la formula como una teoría de segundo orden (Ax1-Ax5’), pero no lo es cuando se la formula como teoría de primer orden (Ax1-Ax5). Tomaremos como segundo ejemplo de teoría axiomática de primer orden a la teoría de la geometría elemental axiomatizada por A. Tarski en 1959 y presentada en su artículo “¿Qué es la geometría elemental?” (en Henkin, Suppes y Tarski 1959). Se trata de un sistema axiomático simple y elegante que permite deducir un fragmento de la geometría euclídea tradicionalmente identificado como geometría elemental. Tarski considera elemental a aquella parte de la geometría euclídea que puede formalizarse y desarrollarse sin apelar a recursos de la teoría de conjuntos. La geometría elemental (Tarski
1959).
La lógica subyacente del sistema es la lógica de predicados de primer orden con identidad. Las variables individuales del sistema, x, y, z,… recorren elementos de un conjunto fijo, el espacio, que se denominan puntos. Los términos primitivos específicos de la teoría, las constantes descriptivas, son dos predicados relacionales: el predicado triádico β que denota la relación de ‘estar entre’, y el predicado tetrádico δ que denota la relación de equidistancia entre puntos. Empleando estos símbolos son fórmulas bien formadas del sistema β( xyz ), que se lee como ‘ y está entre x y z ’, y δ( xyuz ), que se lee como ‘ x es tan distante de y como u de z ’. Los axiomas del sistema son los siguientes:
79
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
Ax1. Axioma de identidad para estar entre: ∀( xy ) ( β( xyx ) → ( x = y )).
Ax2. Axioma de transitividad para estar entre: ∀( xyzu ) ( β( xyu ) & β( yzu ) → β( xyz )).
Ax3. Axioma de conectividad para estar entre: ∀( xyzu ) ( β( xyz ) & β( xyu ) & ( x ≠ y ) → β( xzu )
v
β( xuz )).
Ax4. Axioma de reflexividad para la equidistancia: ∀( xy ) (( δ( xyyx )).
Ax5. Axioma de identidad para la equidistancia: ∀( xyz ) ( δ( xyzz ) → ( x = y )).
Ax6. Axioma de transitividad para la equidistancia: ∀( xyzuvw ) ( δ( xyzu ) & δ( xyvw ) → δ( zuvw )).
Ax7. Axioma de Pasch: ∀( txyzu ) ∃( v ) ( β( xtu ) & β( yuz ) → β( xvy ) & β( ztv )).
Ax8. Axioma de Euclides: ∀( txyzu ) ∃( vw ) ( β( xut ) & β( yuz ) & ( x ≠ u ) → β( xzv ) & β( xyw ) & β( vtw )).
Ax9. Axioma de los cinco segmentos: ∀( xx’yy’zz’uu’ ) ( δ( xyx’y’ ) & δ( yzy’z’ ) & δ( xux’u’ ) & δ( yuy’u’ ) & β( xyz ) & β( x’y’z’ ) & ( x ≠ y ) → δ( zuz’u’ )).
Ax10. Axioma de construcción del segmento: ∀( xyuv ) ∃( z ) ( β( xyz ) & δ( yzuv )).
Ax11. Axioma de la dimensión inferior: ∃( xyz ) ( ¬β( xyz ) & ¬β( yzx ) & ¬β( zxy )).
80
T EORÍ´ AS
DE PRIMER ORDEN
Ax12. Axioma de la dimensión superior: ∀( xyzuv ) ( δ( xuxv ) & δ( yuyv ) & δ( zuzv ) & ( u ≠ v ) → β( xyz ) v β( yzx ) v β( zxy )).
Ax13. Axioma esquema de continuidad elemental: ∀( vw… ) ( ∃( z ) ∀( xy ) ( χ & ψ → β( zxy )) → ∃( u ) ∀( xy ) ( χ & ψ → β( xuy ))).
[Donde χ representa una fórmula cualquiera en la cual las variables x, v, w,… aparecen libres, pero y, z, u no aparecen libres; y lo mismo para ψ, con x e y intercambiadas.] En el trabajo donde expone estos axiomas, Tarski también demuestra que su sistema de geometría elemental es consistente, completo y decidible, pero no finitamente axiomatizable, puesto que emplea un esquema de axioma. Existen muchas teorías matemáticas importantes que se pueden axiomatizar en el lenguaje de la lógica de primer orden. Hay que tener en cuenta, sin embargo, dos limitaciones importantes del proceso de axiomatización: 1. No toda teoría matemática axiomatizable se puede axiomatizar mediante la lógica de primer orden, algunas requieren el uso de lógica de segundo orden o de órdenes superiores. 2. No toda teoría axiomatizable en primer orden es finitamente axiomatizable, algunas teorías de primer orden sólo se pueden axiomatizar mediante esquemas de axiomas, es decir, empleando un número infinito de axiomas. Toda teoría contiene un número infinito de proposiciones (en particular, toda teoría contiene a todas las tautologías de la lógica de primer orden, que son deducibles del conjunto vacío). La definición de teoría axiomatizable que hemos ofrecido admite el caso en el cual A = T , esto es, el conjunto de los axiomas de la teoría es idéntico al de sus teoremas. Esta clase de axiomatización no es necesariamente trivial, porque, en ese caso, la teoría debería ser decidible (dado que la base axiomática A debe ser decidible). De todos modos, una teoría así axiomatizada no es particularmente útil. Las axiomatizaciones razonablemente útiles de una teoría son aquellas en las que A ⊂ T . Entre ellas, son especialmente interesantes aquellas en las que A es finito, y más aun, aquellas en las que A consta de un número muy reducido de proposiciones. En el caso ideal, A contiene un único axioma que es simple y fácilmente intuible. Un con junto finito y reducido de axiomas simples y suficientes para axiomatizar una teoría proporciona la máxima economía de pensamiento en un sistema axiomático. Pero, como hemos de ver, sabemos que este ideal no siempre es realizable. 81
ESTRUCTURA DE UN SISTEMA AXIOMÁ ´ TICO
Por lo demás, a menudo no se sabe cómo axiomatizar una teoría previamente disponible de manera no axiomática. La axiomatización eficaz y simple de una teoría ya conocida es siempre un descubrimiento científico notable.
Notas bibliográficas Descripciones breves del método axiomático, con distinto grado de tecnicidad y a veces con terminologías diferentes, se pueden encontrar en: Carnap (1958); Church (1956); Mates (1972); Tarski (1994); Torretti (1993) y Wang (1962). Mayores detalles y ejemplos en: Beth (1965); Schoenfield (1967); Stoll (1979) y Wilder (1965). Klimovsky y Boido (2005) ofrecen una presentación no técnica muy clara y amplia. Blanché (1955) y De Lorenzo (1980) son dos obras dedicadas al método axiomático que incluyen diferentes reflexiones filosóficas. Cavaillès (1938) es más avanzado y todavía útil, pero ya desactualizado. Hilbert y Ackermann (1959) y Lukasiewicz (1963) son ejemplos clásicos del enfoque axiomático de la lógica de primer orden. Dopp (1965) incluye una colección enciclopédica de más de 50 sistemas axiomáticos de lógica proposicional formulados hasta 1965. Epstein (1995) hace lo propio con una amplia variedad de lógicas no clásicas: modales, intuicionistas, polivalentes, paraconsistentes y otras. Sobre lógicas no clásicas debe consultarse también la obra de Priest (2001).
82
3
La interpretación de un sistema axiomático
3.1 Introducción n sistema axiomático formal no es un conjunto de enunciados significativos, sino de proposiciones formales que carecen de significado. Cuando se da significado a los términos de un sistema axiomático formal se dice que se ofrece una interpretación de ese sistema. El sistema pasa a ser, entonces, un sistema semántico o interpretado. Un sistema formal no interpretado es puramente sintáctico. Establece meras relaciones entre símbolos que no tienen significado, sino que sólo pertenecen a ciertas categorías lógicas o gramaticales. Por consiguiente, no se refiere a ningún tipo de objetos ni hace afirmación alguna acerca de la realidad. Las proposiciones formales que lo componen no son verdaderas ni falsas, simplemente carecen de valor de verdad. Un sistema interpretado, en cambio, se compone de proposiciones significativas que se refieren a un determinado ámbito de objetos concretos o abstractos. Las proposiciones de dicho sistema hacen afirmaciones acerca de esos objetos y tales afirmaciones tienen un valor de verdad, son verdaderas o falsas respecto de esos mismos objetos. Las proposiciones formales de un sistema formal pueden resultar proposiciones verdaderas o falsas cuando se da una determinada interpretación de ese sistema. Un mismo sistema formal admite muchas interpretaciones. Sólo algunas de estas interpretaciones tendrán la característica de que todos los teoremas del sistema resulten verdaderos en esa interpretación. A esta clase de interpretaciones se las denomina modelos. En el caso de los sistemas axiomáticos, los modelos de un sistema son las interpretaciones bajo las cuales resultan verdaderos todos los axiomas del sistema (y, en consecuencia, también todos los teoremas). Un sistema formal interpretado que tiene un modelo se puede considerar como una teoría (provisoriamente) verdadera acerca de un ámbito de la realidad. Un sistema formal no interpretado, en cambio, no es por sí mismo una teoría fáctica que haga afirmaciones acerca de la realidad.
U
Consideremos con más detalle estas nociones.
83
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
3.2 Los conceptos de interpretación y modelo Comencemos por caracterizar de manera informal el concepto de interpretación.
◊ Una interpretación de un sistema axiomático S es una asignación de signi-
ficado a los términos primitivos de S .
Esta es una caracterización muy vaga hasta tanto no se precise el concepto de significado. Ante todo, por significado de un término entenderemos exclusi vamente la referencia o denotación de ese término. Así, el significado de un término dado será la entidad o conjunto de entidades a los cuales se aplica dicho término. Una interpretación, pues, fija la extensión de cada término primitivo de un sistema axiomático. La manera de asignar significado a los términos de un sistema formal consiste en introducir una función interpretación (a la que llamaremos I ). La interpretación es una función que asigna un solo significado a cada término primiti vo de un sistema S . No es posible asignar dos o más significados a un mismo término primitivo, ni tampoco, en el marco de la semántica clásica, dejar a alguno de ellos sin significado. Además, cada significado debe estar asignado de manera precisa, de modo que el significado de cada término primitivo se distinga claramente del significado de los restantes primitivos. Es posible, sin embargo, que una interpretación asigne el mismo significado a dos o más términos diferentes (o sea, la interpretación admite que haya términos que son sinónimos). Una vez que se ha dado significado a los términos primitivos de un sistema, automáticamente adquieren significado todos los restantes términos y fórmulas del sistema, que no son otra cosa que agrupaciones de términos primitivos conectados entre sí por símbolos lógicos y de puntuación. Cuando se interpreta un sistema axiomático formal sus axiomas y teoremas dejan de ser proposiciones formales y se convierten en proposiciones significativas, que como tales tienen valor de verdad. En un sistema interpretado cada proposición es verdadera o falsa. En cambio las proposiciones formales de un sistema formal carecen de significado y por consiguiente no tienen valor de verdad, esto es, no pueden ser verdaderas ni falsas. Un sistema interpretado deja de ser un sistema puramente sintáctico y se convierte en un sistema semántico o significativo. Para fijar la extensión de los términos de un sistema formal se delimita un dominio de objetos o entidades, el conjunto no vacío D, y se determina la referencia de cada término primitivo de S respecto de los objetos del dominio D. Esto es precisamente lo que hace la función interpretación I . La asignación de significado debe respetar la categoría lógica y gramatical de los términos primitivos de S . De este modo, la interpretación hace corresponder individuos u ob84
L OS
CONCEPTOS DE INTERPRETACIÓ´N Y MODELO
jetos singulares a los términos singulares, propiedades a los predicados monádicos, relaciones a los predicados poliádicos y funciones a los funtores. Una interpretación de un sistema formal puede verse como un diccionario que establece los significados para cada uno de los términos primitivos del sistema. Es importante insistir en el hecho de que toda interpretación es extensio- nal y, por tanto, determina solamente una de las dimensiones del significado, la referencia o extensión de los términos. La extensión de un término está constituida por todos los objetos a los que se aplica ese término. En el caso de los lenguajes formales la categoría lógico-gramatical de cada término determinará diferentes tipos de extensiones. Así, la extensión de cada término singular será un individuo u objeto; la extensión de cada predicado monádico será un conjuntos de objetos; la de cada predicado díadico será un conjunto de pares ordenados de objetos; y, en general, la de cada predicado n-ádico será un conjunto de n-tuplas (un conjunto ordenado) de objetos. Por último, la extensión de cada funtor de grado n será un conjunto de pares ordenados de n-tuplas de objetos y un objeto del dominio. Podemos, entonces, definir más precisamente a la interpretación de un sistema formal de la siguiente manera: ◊ Una interpretación de un sistema axiomático S es un conjunto ordenado 〈 D, I 〉, donde el dominio D es un conjunto no vacío de objetos cualesquiera, y
la función interpretación I es una función tal que: 1.
I asigna
a cada símbolo proposicional del lenguaje de vo (verdadero o falso, pero no ambos).
2.
I asigna a minio D.
3.
I asigna
cada constante individual del lenguaje de
S un S un
valor veritati-
objeto del do-
a cada predicado n-ádico del lenguaje de S una relación n-ádica definida sobre objetos del dominio D (un conjunto de n-tuplas de objetos del dominio D ).
4. I asigna a cada funtor del lenguaje de S una función que tenga argumentos y valores en el dominio D (pares ordenados de objetos 〈a,b〉, si es un funtor de grado 1; pares ordenados de pares ordenados de objetos y ob jetos 〈〈a,b〉, c〉, si es un funtor de grado 2; y, en general, pares ordenados de n-tuplas de objetos y objetos, si es un funtor de grado n ). Las conectivas lógicas reciben su significado habitual en la lógica clásica, y también los cuantificadores, que se consideran referidos exclusivamente al dominio de interpretación D. Aquí no consideraremos fórmulas con variables libres, cuyo procedimiento de interpretación es más complicado y se basa en la 85
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
noción de satisfacción de una fórmula por una secuencia contable de objetos. El procedimiento completo se puede encontrar en los textos corrientes de lógica y teoría de modelos, como los que se citan al final del capítulo. La interpretación de un sistema formal proporciona un conjunto de proposiciones significativas, cuyos términos carecen de toda ambigüedad y vaguedad, características de los lenguajes naturales. La función interpretación asigna a cada término primitivo del sistema un único significado, eliminando de este modo cualquier ambigüedad. Además, este significado está precisamente determinado, por lo que para cualquier objeto del dominio se puede decidir concluyentemente si tiene o no una cierta propiedad o relación con otros objetos, es decir, si se le aplica o no un cierto predicado del lenguaje del sistema. De esta manera, desaparece toda posible vaguedad del significado de los términos. Esta es la diferencia esencial que el lenguaje de un sistema formal interpretado tiene sobre los lenguajes naturales. Para los fines del conocimiento científico, esto constitu ye también una importante ventaja. Caractericemos ahora el concepto de modelo. ◊ Un modelo de un sistema axiomático S es una interpretación de S respec-
to de la cual todos los axiomas de
S son
verdaderos.
El hecho de que los axiomas sean verdaderos en un modelo garantiza que también todos los teoremas serán verdaderos en ese modelo, ya que éstos son proposiciones que se deducen de los axiomas, y la deducción asegura la transmisión de la verdad de las premisas a la conclusión. No toda interpretación de un sistema es un modelo de ese sistema. Algunas interpretaciones no hacen verdaderos a todos los axiomas. Basta que un solo axioma de S no sea verdadero bajo una interpretación I para establecer que I no es un modelo de S . La noción de modelo se emplea habitualmente para definir el concepto de consecuencia lógica entre oraciones. ◊ Una oración Φ es consecuencia lógica de un conjunto de oraciones Γ si y sólo si Φ es verdadera en todo modelo de Γ.
Este es el llamado concepto modelo-teórico de consecuencia lógica, que se aplica, en sentido estricto, a proposiciones. Otra manera usual de expresar la misma idea consiste en decir que Φ es consecuencia lógica de Γ si y sólo si todo modelo de Γ es también un modelo de Φ. En el caso de un sistema axio86
INTERPRETACIONES Y MODELOS DE LA TEORÍ´ A
DE GRUPOS
mático, la definición afirma que una proposición Φ, que pertenece a un sistema S , es consecuencia lógica de los axiomas de S si y sólo si Φ verdadera en todo modelo de S . Si las reglas de transformación empleadas en un sistema son correctas, todos los teoremas deducidos de los axiomas serán consecuencia lógica de ellos. Así, los teoremas de un sistema axiomático S resultan proposiciones verdaderas en todo modelo de S . Por consiguiente, si encontramos alguna proposición del lenguaje de S que no es verdadera en al menos algún modelo de S, sabemos, entonces, que esa proposición no es un teorema en S . Existe otro concepto de consecuencia lógica, llamado consecuencia demostra- tiva, que se aplica a las fórmulas de un sistema formal y que, por tanto, no emplea la noción de modelo. ◊ Si S es un sistema axiomático formal formulado en un lenguaje L , Γ es un conjunto de fórmulas bien formadas de L , y Φ es una fórmula bien formada de L , entonces, Φ es una consecuencia lógica de Γ si Φ es deducible de Γ en S, esto es, si es posible inferir Φ de Γ mediante las reglas de transformación del
sistema S .
En un sistema axiomático formal S las consecuencias lógicas del sistema son, pues, todas las fórmulas bien formadas que son deducibles de los axiomas de S , esto es, todos los teoremas demostrables en S . En principio, los conceptos demostrativo y modelo-teórico de consecuencia lógica son independientes entre sí. Para un sistema axiomático formal no interpretado, es necesario apelar al concepto de consecuencia demostrativa; para los sistemas interpretados, en cambio, podemos emplear también el concepto modelo-teórico, o semántico, de consecuencia.
3.3 Interpretaciones y modelos de la teoría de grupos La existencia de diferentes interpretaciones para un sistema axiomático formal se puede ejemplificar de manera muy adecuada mediante la teoría de grupos, una teoría de álgebra abstracta con numerosas aplicaciones tanto en la matemática como en la física. Un grupo está constituido por un conjunto C de ob jetos cualesquiera, en el que se ha distinguido un elemento neutro y se ha definido una operación binaria que a cada par ordenado 〈a, b〉 de elementos de C le asigna un elemento de C , llamado el producto de a y b (habitualmente, esto se escribe como: C x C → C ). El elemento neutro y la operación binaria deben cumplir las condiciones enunciadas en los axiomas. Todo esto se puede expresar en el lenguaje formalizado de la lógica de primer orden con identidad. Es
87
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
necesario elegir una constante individual (por ejemplo, e ) para designar al elemento neutro y un funtor de grado 2 (por ejemplo, ƒ1 ) para nombrar a la operación binaria. Para facilitar la lectura, designaré al elemento neutro con el símbolo “n” y escribiré “ x * y ”, en vez de “ ƒ1 xy ”. Podemos ahora definir el concepto de grupo de la siguiente manera: ◊ Dado un conjunto de elementos cualesquiera C , una operación binaria *
sobre los elementos de C , y un elemento distinguido de C (el elemento neutro n ), G = 〈C , *, n 〉 es un grupo si y sólo si satisface los siguientes axiomas: Ax1. ∀( xy ) ∃ z ( x *
y = z )
[Clausura de la operación *].
Ax2. ∀( xyz ) ((( x * y ) * z ) = ( x * ( y * z ))) [Asociatividad de la operación *]. Ax3. ∀ x (( x *
n
= x ) & ( n *
x = x ))
Ax4. ∀ x ∃ y (( x * y = n ) & ( y * x = n ))
[Existencia de un elemento neutro]. [Existencia de un elemento inverso para cada elemento de C ].
A partir de estos axiomas se puede demostrar un teorema que afirma que el inverso de cada elemento, cuya existencia se postula en el Ax4, es único. Un grupo se llama conmutativo o abeliano si además satisface el siguiente axioma: Ax5. ∀( xy ) (( x * y ) = ( y * x ))
[Conmutatividad de la operación *].
Una manera más económica de definir un grupo, usada habitualmente en los textos de lógica, permite emplear menos términos primitivos y axiomas. ◊ Dado un conjunto de elementos cualesquiera C y una operación binaria * sobre los elementos de C , G = 〈C , *〉 es un grupo si y sólo si, satisface los si-
guientes axiomas:
Ax1. ∀( xyz ) ((( x * y ) * z ) = ( x * ( y * z ))).
88
Ax2. ∀( xy ) ∃ z (( x *
z = y )).
Ax3. ∀( xy ) ∃ z (( z *
x = y )).
INTERPRETACIONES Y MODELOS DE LA TEORÍ´ A
DE GRUPOS
Si se adopta esta axiomatización, es necesario probar como teoremas la existencia del elemento neutro n y del elemento inverso único para cada elemento. Ambas axiomatizaciones son equivalentes, pero en nuestros ejemplos de interpretaciones de la teoría de grupos emplearemos la primera, que es la más común en los libros de texto de álgebra. Cualquier estructura que satisfaga los axiomas Ax1-Ax4 es un grupo. Es sencillo dar una interpretación de este sistema axiomático, pues solamente hay que dar significado a los términos primitivos C , *, y n, es decir, hay que designar un conjunto de elementos como referente de C , una operación binaria como referente de * y un elemento distinguido de C como referente del elemento neutro n. Ofreceremos tres interpretaciones diferentes de este sistema y verificaremos en cada caso si los axiomas resultan verdaderos bajo cada una de las interpretaciones. Interpretación 1: En
primer lugar, designamos como referente de C al con junto de los números naturales (los enteros positivos) incluyendo el cero, de modo que = {0, 1, 2, 3,...}. Luego establecemos como referente de * a la operación de suma (+) entre números naturales. Finalmente, designamos al número 0 como referente del elemento neutro. Nuestra primera interpretación es entonces I 1 = 〈, +, 0〉. Podemos verificar que I 1 no es un modelo de la teoría de grupos porque no hace verdaderos a todos los axiomas simultáneamente. Ax1, Ax2 y Ax3 resultan verdaderos: la suma entre dos números naturales siempre es otro número natural (Ax1); la suma entre números naturales es asociativa (Ax2); y existe un elemento neutro, el cero, tal que sumado a cualquier número el resultado es igual a ese número (Ax3). Sin embargo, Ax4, el último axioma, no es verdadero en esta interpretación, porque los números naturales no tienen inverso. No hay para cada número natural otro número natural tal que sumado a éste el resultado sea cero, el elemento neutro. Esta interpretación no es un modelo de la teoría de grupos y, por consiguiente los números naturales con la operación suma no forman un grupo. Interpretación 2: I 2 = 〈,
–, 0〉, o sea, el conjunto de los números naturales con la operación resta y el número cero. I 2 tampoco es un modelo de la teoría de grupos porque no hace verdadero a Ax1, el primer axioma. En efecto, la resta entre números naturales no cumple con la clausura o cierre, porque el resultado de restar dos números naturales no siempre es un número natural. Si restamos 3 – 5, el resultado es -2 que no es un número natural, sino un número negativo. Basta que un solo axioma de un sistema no sea verdadero bajo una interpretación para probar que dicha interpretación no es un modelo de ese sistema. El lector puede comprobar por su cuenta cuáles de los restantes axiomas
89
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
Ax2 - Ax4 resultan falsos dada la interpretación Interpretación 3: I 3 = 〈,
I 2 .
+, 0〉. C tiene ahora como referente al conjunto de los números enteros, es decir = {0, 1, -1, 2, -2,...}. Esta interpretación hace verdaderos a todos los axiomas de la teoría de grupos, y constituye por consiguiente un modelo de dicha teoría. La suma entre números enteros es cerrada (Ax1); es asociativa (Ax2); existe un elemento neutro, el cero, (Ax3); y, por último, también hay en el conjunto de los enteros un elemento inverso para cada número entero (Ax4). El inverso de cada entero es el correspondiente número entero con el signo opuesto, el de 4 es -4; el de -99 es 99, y así sucesivamente. Se puede comprobar fácilmente, por ejemplo, que 4 + (-4) = -4 + 4 = 0. Los números enteros con la operación suma forman un grupo que constituye un modelo de la teoría de grupos. Observemos que también forman un grupo abeliano, porque la operación suma es conmutativa (Ax5). La teoría de los grupos es una rama del álgebra abstracta que tiene amplias aplicaciones en el campo de la física. Constituye la estructura matemática subyacente del concepto de simetría, el cual es uno de los conceptos claves para comprender las leyes físicas. No debe pensarse que los axiomas de la teoría de grupos se pueden interpretar solamente en el ámbito de las teorías matemáticas. El conjunto C contiene elementos cualesquiera que no tienen por qué ser números u objetos matemáticos, ni la operación * una operación entre este tipo de objetos. La teoría de grupos admite diversas interpretaciones físicas, en las cuales el dominio de la interpretación es un conjunto de objetos físicos y la operación * se refiere a alguna transformación aplicada a esos objetos físicos. Esta clase de interpretación es especialmente importante en la física de partículas elementales, donde la teoría de grupos permitió el descubrimiento de muchas leyes físicas novedosas. La teoría de grupos también tiene muchos otros modelos físicos, como ocurre, por ejemplo, en los campos de la cristalografía y la espectroscopía. Todo esto nos muestra las múltiples posibilidades de interpretación de un sistema axiomático. Las interpretaciones pueden referirse a objetos de muy diferente naturaleza, abstractos o concretos, físicos o no físicos. Algunas interpretaciones que sean modelos de un sistema axiomático ya conocido pueden ser completamente inesperadas, como ocurrió en el caso de la aplicación de la teoría de grupos a la física de partículas. Un sistema formal que tiene un modelo tiene en general infinitos modelos, concretos y abstractos, pero ello no implica que podemos conocerlos (nada nos garantiza que podamos hallar siquiera uno de ellos), ni que sea fácil descubrir modelos interesantes de una teoría. Por esta razón, el hecho de encontrar un nuevo modelo de una teoría formal constituye por sí mismo un auténtico descubrimiento científico.
90
INTERPRETACIONES
Y MODELOS DE LA TEORÍ´ A DE LOS ANILLOS
3.4 Interpretaciones y modelos de la teoría de los anillos Otra teoría algebraica axiomatizada es la teoría de los anillos, que puede concebirse como una extensión de la teoría de grupos. En efecto, la teoría de los anillos se obtiene agregando nuevos axiomas a los de la teoría de grupos. Aquí tenemos como términos primitivos a un conjunto C de elementos cualesquiera, a dos funtores que denotan operaciones binarias * y # entre los elementos de C , y a dos elementos distinguidos de C , n y m, que son dos elementos neutros diferentes. La lógica subyacente será también la lógica de primer orden con identidad, y emplearemos las mismas convenciones de notación que utilizamos para la teoría de grupos. Una definición de anillo es la siguiente: ◊ Dado un conjunto de elementos cualesquiera C , dos operaciones binarias
* y # sobre los elementos de C y dos elementos distinguidos de C , n y m, A = 〈C, *, #, n, m〉 es un anillo si y sólo si satisface los siguientes axiomas: Ax1. ∀( xy ) ∃ z ( x *
y = z )
[Clausura de la operación *].
Ax2. ∀( xyz ) ((( x * y ) * z ) = ( x * ( y * z )))
[Asociatividad de la operación *].
Ax3. ∀ x (( x * n = x ) & ( n * x = x ))
[Existencia de un elemento neutro para la operación *].
Ax4. ∀ x ∃ y (( x *
[Existencia de un elemento
y = n )
& ( y *
x = n ))
Ax5. ∀( xy ) (( x * y ) = ( y * x ))
inverso para cada elemento de C ]. [Conmutatividad de la operación *].
Ax6. ∀( xy ) ∃ z ( x #
[Clausura de la operación #].
y = z )
Ax7. ∀( xyz ) ((( x # y ) # z ) = ( x # ( y # z )))
[Asociatividad de la operación #].
Ax8. ∀ x (( x #
[Existencia de un elemento neutro para la operación #].
m
= x ) & ( m #
x = x ))
Ax9. ∀( xyz ) ((( x # ( y * z )) = = (( x # y ) * ( x # z ))) & ((( y * z ) # x ) = = (( y # x ) * ( z # x ))))
[Distributividad de la operación # respecto de la operación *].
91
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
Los primeros cuatro axiomas son los de la teoría de grupos. Ax5 establece que la operación * es conmutativa, y por tanto, que se trata de una teoría de grupos abelianos. Los axiomas Ax6 y Ax7 introducen la nueva operación # determinando que es cerrada y asociativa. Ax8 afirma la existencia del elemento neutro. El axioma Ax9 enuncia la propiedad distributiva de la operación # respecto de la operación *. Este axioma tiene dos partes porque la teoría de los anillos no establece que la operación # sea conmutativa, por tanto, la operación # por la izquierda no es la misma que la operación # por la derecha. Un anillo se llama anillo conmutativo si además satisface el siguiente axioma: Ax10. ∀( xy ) (( x # y ) = ( y # x ))
[Conmutatividad de la operación #].
La interpretación de la teoría de los anillos también es simple. En este caso tenemos que asignar referentes al conjunto C , a las dos operaciones * y # y a los dos elementos distinguidos n y m. Daremos dos interpretaciones diferentes de esta teoría y comprobaremos si constituyen o no modelos. = 〈, +, x, 0, 1〉. Aquí C es el conjunto de los números naturales y las dos operaciones son la suma y la multiplicación, respectivamente. Los elementos distinguidos son el número cero y el número uno. Podemos comprobar fácilmente que esta interpretación no es un modelo del sistema axiomático de los anillos porque no hace verdaderos a todos los axiomas. El axioma Ax4 resulta falso. Todos los restantes son verdaderos bajo esta interpretación. Interpretación 1: I 1
Interpretación 2: I 2 = 〈,
+, x, 0, 1〉. C es ahora el conjunto de los números enteros, las dos operaciones la suma y la multiplicación, y los dos elementos distinguidos el número cero y el número uno. El lector podrá verificar que ba jo esta interpretación todos los axiomas de la teoría de los anillos son verdaderos. Tenemos por consiguiente un modelo de este sistema formal abstracto. Los números enteros con las operaciones de suma y multiplicación forman, pues, un modelo de la teoría de los anillos. También el axioma Ax10 resulta verdadero, por lo que el sistema es un anillo conmutativo. Si observamos los axiomas de las teorías de grupos, de grupos abelianos y de anillos, advertiremos que todo anillo es un grupo abeliano, y que todo grupo abeliano es un grupo. Las relaciones inversas no son válidas, pues no todo grupo es un grupo abeliano, ni todo grupo abeliano es un anillo. Teniendo en cuenta estas relaciones podemos deducir que si una interpretación no constitu ye un modelo de la teoría de grupos, tampoco lo será de la teoría de los ani92
ESTRUCTURAS
llos. Este es el caso de de grupos y de anillos.
I 1 en
Y MODELOS
nuestros ejemplos de interpretación de la teoría
3.5 Estructuras y modelos Definiremos ahora el concepto de isomorfismo entre modelos. Para ello es necesario definir primero el concepto de estructura. El término estructura tiene muchos significados diferentes, incluso dentro del ámbito de la lógica o la matemática. Aquí sólo nos interesa uno de esos sentidos, según el cual se llama estructura a un conjunto ordenado que consta de los siguientes elementos: i) un conjunto no vacío de elementos cualesquiera, al que denominaremos D; ii) una familia de relaciones definidas sobre los elementos de D; iii) una familia de funciones definidas sobre los elementos de D; y iv) algunos individuos distinguidos del conjunto D. El conjunto de objetos D es el dominio o universo de la estructura. Una estructura puede tener más de un dominio, pero aquí no consideraremos ese caso. Cualquier subconjunto de elementos de D es una propiedad o relación monádica en el dominio D. En general, cualquier subconjunto de D x D x D x...x D (o sea, cualquier conjunto de n-tuplas de elementos de D ) es una relación nádica en D. Además, cualquier aplicación de D en D ( D → D ) es una función en D. Finalmente, cualesquiera elementos de D que distingamos son individuos distinguidos en D. Una estructura E estará formada, entonces, por todas las relaciones, R 1... R n, distinguidas en el dominio D, todas las funciones ƒ1... ƒn distinguidas en D, y todos los individuos a1...al distinguidos en D. Por cierto, no todos estos elementos deben estar conjuntamente presentes en toda estructura. Una estructura requiere al menos un dominio y al menos una relación o función o individuo distinguido en ese dominio. Podemos ahora dar una definición formal de estructura: ◊ E = 〈 D, R 1... R n, ƒ1... ƒm , a1...al 〉 es una estructura si y sólo si:
1. D ≠ ∅. 2.
R i ⊆ Dr (donde de i ).
1 ≤ i ≤ n, y r es un número entero positivo que depende
3. ƒ j : Ds → D (donde 1 ≤ j ≤ pende de j ). 4.
ak ∈ D (donde
1≤
m,
y s es un número entero positivo que de-
k ≤ l ).
93
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
Caractericemos ahora el concepto de isomorfismo entre estructuras. El isomorfismo es una relación que se da entre estructuras que son simila- res entre sí. Decimos que dos estructuras son similares cuando tienen el mismo número de dominios, relaciones n-ádicas, funciones n-ádicas e individuos distinguidos. Por ejemplo, las estructuras E 1 = 〈 D1, R 2 〉 y E 2 = 〈 D2 , S 2 〉 son similares porque ambas tienen un solo dominio, una relación binaria (el grado de la relación lo indica el superíndice) y no tienen funciones ni individuos distinguidos. En cambio, las estructuras E 3 = 〈 D3 , R 2 , ƒ3 〉 y E 4 = 〈 D4 , S 2 h2 , b〉 no son similares porque una posee una función ternaria (el grado de la función lo indica el superíndice) y no tiene individuos distinguidos, mientras que la otra posee una función binaria y un elemento distinguido. Si dos estructuras no son similares, no pueden ser isomorfas. Pero no todo par de estructuras similares son isomorfas. Dos estructuras similares son isomorfas si además cumplen ciertas condiciones: ◊ Dos estructuras similares E 1 = 〈 D1, R 1... R n, ƒ1... ƒm , a1... al 〉 y E 2 = 〈 D2 , S 1...S n, h1... hm , b1...bl 〉 son isomorfas si y solo si hay una función f tal que:
1. f es una función biyectiva de
D1 en D2 ( f : D1 → D2 ).
2. Para todo x 1... x r ∈ D1: 〈 x 1... x r〉 ∈ R i si y sólo si 〈 f ( x 1 )... f ( x r ) 〉 ∈ de 1 ≤ i ≥ n, y r es el número ario de R i ). 3. Para todo x 1... x r ∈ D1: f ( ƒ j ( x 1... x r )) = y r es el número ario de ƒ j ). 4.
f ( ak )
=
bk (donde
1≤
h j ( f ( x 1 )... f ( x r ))
S i (don-
(donde 1 ≤ j ≤
m,
k ≤ l ).
La relación de isomorfismo entre estructuras es una relación de equivalen- cia, o sea, es reflexiva, simétrica y transitiva.
El concepto de isomorfismo entre estructuras, que hemos definido antes de manera general, se aplica igualmente a todas las interpretaciones y modelos de un sistema axiomático, ya que éstos no son más que cierta clase de estructuras. Un modelo M de un sistema axiomático S es una estructura respecto de la cual todos los axiomas de S son verdaderos. Dos modelos M 1 y M 2 de un sistema axiomático S son isomorfos cuando existe una aplicación biyectiva entre sus dominios y todo enunciado de S es verdadero en M 1 si y sólo si es verdadero en M 2 . Observemos que toda estructura, y por consiguiente todo modelo, es un conjunto, es decir, una entidad abstracta. El homomorfismo es una relación más débil entre estructuras o modelos. Satisface las mismas condiciones que el isomorfismo, con excepción de la primera, ya que la función f: D1 → D2 no necesita ser biyectiva. Así, todo isomorfismo es también un homomorfismo, pero no a la inversa. 94
ESTRUCTURAS
Y MODELOS
La teoría de los modelos constituye una de las ramas más desarrolladas y técnicas de la lógica contemporánea. Muchos de los resultados que se han obtenido en este campo tienen importantes aplicaciones en la metateoría de la lógica y de la matemática, así como interesantes consecuencias epistemológicas y filosóficas. Aquí no podemos exponer con detalle estos temas (el lector interesado puede consultar las obras citadas en la nota bibliográfica al final de este capítulo). Nos limitaremos a mencionar dos metateoremas especialmente importantes. El primer resultado fundamental es el llamado teorema de Löwenheim-Skolem, cuya demostración tiene una larga historia. L. Löwenheim en 1915 y Th. Skolem en 1919 demostraron versiones de este teorema para el cálculo de predicados de primer orden, sin emplear el concepto de modelo, que A. Tarski definió recién en 1928. Al propio Tarski se debe la versión corriente de este teorema: una teoría de primer orden tiene un modelo, entonces, también tiene un modelo contable.
Teorema de Löwenheim-Skolem: Si
Para aclarar el significado de este teorema debemos definir antes algunos términos matemáticos. Un conjunto es infinito si tiene n elementos (donde n es algún número natural) y es infinito si y sólo si no es finito. Un conjunto se llama contable si es biyectable con el conjunto de los números naturales o con algún subconjunto propio de éste. Todo conjunto finito es contable, pero no todo conjunto infinito lo es. Un conjunto infinito que no es contable se denomina incontable. Así, por ejemplo, como lo demostró G. Cantor, tanto el conjunto de los números enteros como el de los racionales son contables, pero el conjunto de los números reales es incontable. Un modelo se llama finito si su dominio es un conjunto finito y se llama infinito si dicho dominio es un conjunto infinito. El teorema de Löwenheim y Skolem afirma, entonces, que todo sistema axiomático formulado en un lenguaje de primer orden que tenga modelos tiene un modelo que es finito o infinito contable. Esto es, el sistema no tiene únicamente modelos infinitos que sean incontables. Puede tener sólo modelos finitos, pero si tiene modelos infinitos, entonces, tiene al menos uno que es contable, es decir, cuyos elementos no son más que los números naturales. Este último resultado se conoce como la versión descendente del teorema de Löwenheim y Skolem y se formula habitualmente de la siguiente manera: una teoría de primer orden tiene modelos infinitos, entonces, tiene un modelo infinito contable.
Versión descendente del teorema de Löwenheim-Skolem: Si
Este teorema origina la llamada paradoja de Skolem, la cual consiste en el hecho de que las teorías matemáticas que tratan, o pretenden tratar, acerca de dominios incontables de objetos, como la teoría de los números reales y com-
95
INTERPRETACIÓ´N DE UN SISTEMA AXIOMÁ ´ TICO
plejos o la teoría de conjuntos, si son satisfacibles, deben tener un modelo contable, por ejemplo, en el dominio de los números naturales. Otro resultado fundamental de la teoría de modelos es la llamada versión ascendente del teorema de Löwenheim y Skolem , que A. Tarski demostró en 1928 y constituye un teorema aparte: una teoría de primer orden tiene un modelo infinito, entonces, tiene modelos de cualquier cardinalidad infinita.
Versión ascendente del teorema de Löwenheim-Skolem: Si
Este teorema establece que toda teoría de primer orden que tenga algún modelo infinito, tiene modelos infinitos incontables de todas las cardinalidades. Intuitivamente, se trata de conjuntos más grandes que el de los números naturales. Los modelos contables e incontables, evidentemente, no pueden ser isomorfos entre sí, por lo que este teorema implica, entonces, que cualquier teoría de primer orden que tenga modelos infinitos, es polimórfica, es decir, tiene modelos no isomorfos. Se llama modelos no standard a los modelos de una teoría que no son isomorfos con el modelo que se pretende construir. Por ejemplo, la aritmética de Peano de primer orden pretende tener modelos contables, en el dominio de los números naturales, pero si los tiene, también debe tener modelos incontables. En síntesis, toda teoría de primer orden que tenga algún modelo infinito necesariamente tiene también modelos no standard . Esta es una consecuencia inevitable del teorema de Löwenheim y Skolem. Por consiguiente, ninguna teoría matemática de primer orden puede caracterizar de manera unívoca una determinada estructura matemática.
Notas bibliográficas L os conceptos de interpretación y modelo de una teoría formal se exponen en la mayoría de los textos de lógica matemática de nivel intermedio, entre ellos: Boolos, Burgess y Jeffrey (2007); Enderton (2001); Enderton (1972); Hamilton (1988); Kleene (1967); Margaris (1990); Mates (1972) y Zalabardo (2002). Para una introducción a la teoría de modelos véase Bridge (1977); y para un tratado más amplio Manzano (1989). Hodges (1997) es un texto avanzado de teoría de modelos con un enfoque matemático. Tarski (1956) recopila algunos de sus trabajos pioneros sobre teoría de modelos, que todavía pueden leerse con provecho. Stoll (1979) y Stewart y Tall (1979) tratan la teoría de grupos y anillos desde el punto de vista axiomático. Durbin (1992) contiene mayores detalles y ejemplos de estructuras algebraicas. Rosen (1995) muestra la aplicación de la teoría de grupos a diversos campos de las ciencias físicas.
96
4
Propiedades de un sistema axiomático
4.1 Propiedades de los sistemas axiomáticos en general os sistemas formales y los axiomáticos en particular se caracterizan por ciertas propiedades importantes que expresan atributos del sistema como un todo. En este capítulo analizaremos las seis propiedades fundamentales de todo sistema axiomático, que son las siguientes: la consistencia, la completitud , la decidibilidad , la satisfacibilidad , la categoricidad y la independencia de los términos primitivos y axiomas. Todo sistema axiomático formal necesariamente tiene o no tiene cada una de estas propiedades. Es consistente o no lo es (en cuyo caso se llama inconsistente ), es completo o no lo es (entonces es incompleto ), es decidible o no lo es (entonces se llama indecidible ), es satisfacible o no (en ese caso es insatisfacible ), y lo mismo con las restantes propiedades. No se sigue de este hecho que siempre podamos conocer cuáles de estas propiedades posee un sistema axiomático determinado y cuáles no. Como veremos enseguida, en muchos casos no podemos conocerlas y, por tanto, no estamos en condiciones de afirmar, por ejemplo, si un sistema dado es consistente o inconsistente. La demostración de que un determinado sistema axiomático posee o no posee cada una de estas propiedades corresponde al campo de una disciplina conocida como metamatemática. Esta toma a los sistemas formales como objeto de estudio y se desenvuelve entonces en un plano metateórico; es una teoría acerca de teorías. En el ámbito que nos interesa aquí es una teoría acerca de sistemas axiomáticos formales. En el caso de que el sistema estudiado sea un sistema lógico se adopta el nombre de metalógica, la cual constituye una rama de la metamatemática en general. La investigación metateórica de los sistemas formales ha descubierto que las seis propiedades que acabamos de enunciar no son todas independientes entre sí. Existen importantes relaciones de implicación y de incompatibilidad entre ellas para determinados tipos de sistemas formales. En el transcurso de nuestra exposición mencionaremos algunas de estas relaciones, pero no ofreceremos ninguna prueba de ellas. Por lo general, las demostraciones metamatemáticas no son sencillas y exceden el nivel de esta obra. Nos limitaremos, entonces, a señalar las propiedades de algunos sistemas formales y
L
97
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
a mencionar a modo de ejemplo ciertos resultados metamatemáticos. El lector que desee conocer la justificación de esas afirmaciones puede dirigirse a las obras citadas en la nota bibliográfica que cierra este capítulo. Definiremos ahora cada una de las propiedades de un sistema axiomático formal. 1. Consistencia
La propiedad de consistencia de un sistema se relaciona con el hecho de que no haya contradicciones dentro de ese sistema, y, por consiguiente, no se produzcan en él antinomias o paradojas de ningún tipo. Definiremos dos conceptos de consistencia, el de no contradictoriedad y el de consistencia generalizada. ◊ a) No contradictoriedad. Un sistema axiomático S es consistente si y sólo si no existe en S una fbf χ tal que χ y ¬ χ sean ambas teoremas en S . ◊ b) Consistencia generalizada. Un sistema axiomático S es consistente si
y sólo si al menos una fbf de S no es teorema en S .
Empleamos dos definiciones de consistencia porque un sistema formal podría no contener un símbolo para la negación en su lenguaje. Todo sistema formal cuyo lenguaje no contiene negación es (vacuamente) no contradictorio, por lo que la definición a) no permite, en estos casos, discriminar entre sistemas consistentes y no consistentes. Si un sistema no es consistente, en cualquiera de los dos sentidos, se dice que es inconsistente. Las definiciones de inconsistencia son, pues, la negación de las definiciones de consistencia. ◊ a) Contradictoriedad. Un sistema axiomático S es inconsistente si y sólo si, existe en S al menos una fbf χ tal que χ y ¬ χ sean ambas teoremas en S . ◊ b) Inconsistencia generalizada. Un sistema axiomático S es inconsisten-
te si
y sólo si, toda fbf de S es teorema en S .
Los sistemas que carecen de negación sólo pueden ser inconsistentes en el sentido b) de consistencia generalizada, ya que su lenguaje no admite la formación de contradicciones. Si un sistema dotado de negación es inconsistente en el sentido a) de consistencia, también lo es en el sentido b). La implicación inversa también es verdadera. Podemos expresar esta relación diciendo que un sistema formal S cuyo lenguaje incluye negación admite como teoremas una fórmula 98
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
χ y su negación ¬ χ si y sólo si, toda fórmula bien formada de S es teorema en S .
La implicación de (b) hacia (a) es evidente, pues si toda fórmula bien formada de un sistema con negación es teorema en el sistema, también serán teoremas una fórmula cualquiera χ y su negación ¬ χ, ya que ambas son fórmulas bien formadas del sistema. Probemos ahora la implicación en la dirección contraria, o sea, que si un sistema S es inconsistente en el sentido (a), también lo es en el (b). Esta relación está expresada en el principio de la lógica tradicional llamado ex contradictione sequitur quodlibet (literalmente “de una contradicción se sigue cualquier cosa”) o ley del Pseudo Escoto: ( χ & ¬ χ ) → ψ (donde χ y ψ son fórmulas cualesquiera), una ley de la lógica clásica cuya demostración, que sólo emplea lógica proposicional, es así: 1. χ & ¬ χ
[premisa]
2. χ
[de 1 por simplificación]
3. χ ∨ ψ 4. ¬ χ
[de 2 por adición]
5. ψ
[de 3 y 4 por silogismo disyuntivo]
6. ( χ & ¬ χ ) → ψ
[cancelación de la premisa 1]
[de 1 por simplificación]
Una demostración de esta ley, no formalizada pero exactamente igual a la que hemos dado, la realizó un lógico del siglo XIV conocido como Pseudo Escoto (llamado así por el hecho de habérselo confundido durante muchos siglos con el filósofo Juan Duns Scoto). La expresión “de una contradicción se sigue cualquier cosa” debe tomarse con cuidado porque se presta a confusión. En realidad, en un sistema inconsistente se pueden probar como teoremas todas las fórmulas bien formadas que admita el lenguaje de ese sistema, pero no se pueden probar cadenas de símbolos que no sean fórmulas de ese sistema. Por ejemplo en un sistema formal inconsistente de lógica proposicional no se puede demostrar la expresión “ x + y = y + x ”, porque ésta no es una fórmula bien formada de la lógica proposicional (puesto que emplea símbolos como “+” que no pertenecen al vocabulario de esta parte de la lógica). La consistencia o coherencia es la propiedad más importante que debe tener un sistema formal. Se dice que un sistema inconsistente es trivial porque en él todas las fórmulas del sistema son teoremas. Un sistema de este tipo carece de interés lógico porque no permite discriminar entre las fórmulas que son teoremas y aquellas que no lo son. En virtud de la ley del Pseudo Escoto, que acabamos de probar, cualquier sistema axiomático que admita una contradicción de
99
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
la forma χ y ¬ χ (donde χ es una fórmula cualquiera) resultará trivial porque toda fórmula bien formada de su lenguaje se podrá demostrar en ese sistema. La ley del Pseudo Escoto es válida en la lógica clásica y también en muchas lógicas no clásicas, como la intuicionista. Por consiguiente, cualquier sistema formal que emplee una lógica subyacente (lo usual es que se emplee la lógica clásica) en la que vale la ley del Pseudo Escoto se volverá trivial si se demuestra en él una sola contradicción. Dicha contradicción, por así decir, se propaga a la totalidad del sistema porque a partir de ella se pueden demostrar todas las contradicciones posibles en ese sistema ( χ y ¬ χ; ψ y ¬ ψ; etc.). Existen ciertos sistemas de lógica no clásica, denominados paraconsistentes, en los que la ley del Pseudo Escoto no es válida y, por tanto, no ocurre que a partir de una contradicción se pueda demostrar cualquier fórmula de una teoría. La lógica paraconsistente permite que un sistema formal sea contradictorio (es decir, inconsistente en el sentido a)) y sin embargo no sea trivial (inconsistente en el sentido b)). Una lógica de este tipo se puede emplear como lógica sub yacente de las teorías inconsistentes y no triviales, porque garantiza que a partir de una contradicción no es posible demostrar cualquier fórmula del lengua je de la teoría. Las lógicas paraconsistentes tienen, sin embargo, la dificultad de que para conseguir este resultado emplean un concepto de negación que no es el clásico. La correspondiente conectiva de negación no tiene las propiedades de la negación de la lógica clásica. Queda, entonces, abierto el problema de elegir entre dos conceptos diferentes de negación y de justificar esta elección con criterios adecuados y precisos. La situación de la lógica paraconsistente, como la de las otras lógicas rivales de la clásica, es un tema debatido que está muy lejos de su esclarecimiento o solución definitiva. En todas las consideraciones que siguen siempre hemos de suponer que la lógica subyacente de un sistema axiomático es la lógica clásica. Las pruebas de consistencia de un sistema formal constituyen la parte esencial de la metateoría de ese sistema. Ello es así porque todos los sistemas axiomáticos importantes utilizan a la lógica clásica como lógica subyacente, por lo cual si fueran inconsistentes serían igualmente triviales y por consiguiente inutilizables. En general, para probar la consistencia de un sistema formal es suficiente con mostrar que hay una fórmula bien formada que no es teorema en ese sistema. Con ello se ha mostrado que el sistema no es inconsistente en sentido b) y por tanto que no es trivial. Si el lenguaje del sistema tiene negación y su lógica subyacente es la clásica, la prueba anterior también implica que dicho sistema no contiene contradicciones, o sea, que no es inconsistente en el sentido a). Sin embargo, ésta no es la manera más práctica de proceder. Más adelante en este capítulo estudiaremos otra forma de probar la consistencia de un sistema formal, que consiste en encontrar un modelo de ese sistema (véase también el Apéndice 1).
100
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
La investigación metateórica acerca de la consistencia de los sistemas formales ha llegado a dos resultados fundamentales. El primero es que la lógica de primer orden (con o sin identidad) es consistente. La prueba definitiva de este metateorema la dieron D. Hilbert y W. Ackermann en 1928. El segundo resultado, de carácter negativo, es que no es posible demostrar, dentro del propio sistema, la consistencia de la mayoría de los sistemas matemáticos, como la teoría de conjuntos, que son más amplios que la lógica elemental. Esta es una consecuencia de uno de los célebres teoremas que K. Gödel demostró en 1931. Dada la importancia que tienen las pruebas de consistencia les dedicamos un tratamiento aparte en el Apéndice 1, donde se podrán encontrar más informaciones, así como una breve reseña histórica acerca de cómo se llegó a estos resultados. 2. Completitud
La completitud de una teoría se relaciona con el hecho de que dicha teoría sea suficiente para deducir todos los enunciados o formas de enunciados que se esperan de ella. En este sentido, un sistema axiomático es completo cuando permite demostrar todas las fórmulas que se quieren obtener como teoremas. Por ejemplo, en el caso de un sistema de lógica, deseamos obtener como teoremas todas las verdades lógicas o tautologías; y en el caso de un sistema aritmético, todas las fórmulas de la aritmética que consideramos intuitivamente verdaderas. Esta caracterización vaga será enseguida reemplazada por definiciones más precisas. Hay por lo menos tres conceptos diferentes de completitud que se han denominado de manera diferente: a) la completitud respecto de la negación; b) la completitud fuerte o saturación; y c) la completitud semántica. Definiremos cada uno de estos sentidos de completitud precisando la manera en que se relacionan entre sí. ◊ a) Completitud respecto de la negación. Un sistema axiomático S es completo respecto de la negación si y sólo si para cada fbf χ que sea cerrada (sin variables libres), o bien χ, o bien ¬ χ es un teorema en S .
La idea que se expresa en este concepto de completitud es que un sistema completo es siempre capaz de escoger una entre dos fórmulas contradictorias. Podemos imaginar una lista de todas las fórmulas bien formadas de un sistema S ordenadas de a pares ( χ y ¬ χ; ψ y ¬ ψ; etc.). Un sistema completo respecto de la negación permitirá demostrar, para todo par de fórmulas ordenadas de esta manera, una u otra de cada par.
101
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
◊ b) Completitud fuerte o saturación. Un sistema axiomático S es com- pleto si y sólo si para cada fbf χ, o bien χ es un teorema, o bien S se vuelve inconsistente si χ se le agrega como axioma.
La completitud fuerte significa que el sistema S no puede extenderse a uno más amplio por medio de la adición de nuevos axiomas, ya que si se le agrega una fórmula que no se deduce de los axiomas (o sea que no es teorema) el sistema pierde su consistencia. A veces se llama saturación a la propiedad de completitud fuerte, y se dice que un sistema axiomático que cumple esta condición es saturado o maximal . Este segundo concepto nos permite aplicar la idea de completitud a sistemas formales cuyo lenguaje no incluye negación. Observemos que de las definiciones de completitud que hemos dado se sigue que un sistema inconsistente es trivialmente completo respecto de la negación y vacuamente saturado o maximal. En efecto, en tal sistema no sólo ocurre que, para cualquier fórmula χ, se demuestre que χ es teorema o que ¬ χ es teorema, sino que ambas, χ y ¬ χ, son teoremas. Por consiguiente, tampoco es posible agregarles una fórmula que no sea teorema (porque no hay tal fórmula). Los sistemas inconsistentes son super-completos, y este hecho es el que los vuelve triviales. En ellos toda fórmula es demostrable, por lo que no es posible distinguir entre fórmulas que son teoremas y fórmulas que no lo son. Los sistemas completos útiles e interesantes son aquellos en los que toda fórmula es demostrable o refutable, pero además, hay fórmulas que no son teoremas. Esto último equivale a decir que son consistentes. Se advierte, entonces, que la consistencia de un sistema es una propiedad más fundamental e importante que la completitud. La relación entre estos dos sentidos de completitud es la siguiente. Si un sistema S es completo respecto de la negación (a) y, además, es consistente, es también maximal o saturado (b). La prueba de ello es claramente intuitiva, porque si S es consistente y completo respecto de la negación y se le agrega una fórmula cualquiera χ, que no es teorema en S , se producirá una contradicción. Precisamente por ser completo respecto de la negación, si χ no es teorema en S , entonces ¬ χ debe ser teorema en S . Luego, si le agregamos al sistema la fórmula χ como axioma, tendremos como consecuencia χ y ¬ χ entre las fórmulas demostradas de S . La relación conversa también es válida, porque si un sistema S es maximal y no es posible agregarle sin inconsistencia una fórmula cualquiera χ que no sea teorema, entonces ¬ χ es teorema en S . Luego, S es completo respecto de la negación. Podemos afirmar, la siguiente equivalencia: Un sistema axiomático S es completo respecto de la negación si y sólo si S es maximal o saturado.
102
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
Hay pocos sistemas formales que son completos respecto de la negación o maximales. Por ejemplo la lógica proposicional no es completa respecto de la negación, porque ningún símbolo proposicional p, ni su negación ¬ p, es teorema. Tampoco lo es la lógica de predicados, donde fórmulas como ∀ x Fx y ¬ ∀ x Fx no son teoremas. Sin embargo, existe un teorema, demostrado por A. Lindenbaum, que afirma que si un sistema axiomático es consistente, entonces hay una extensión de ese sistema que es maximal consistente. Se lo conoce como lema de Lindenbaum:
Lema de Lindenbaum. Todo
sistema axiomático consistente admite una ex-
tensión maximal consistente. El significado de este teorema es que cualquier sistema axiomático que sea consistente se puede enriquecer con nuevos axiomas, sin perder la consistencia, hasta transformarlo en maximal. En 1930 Gödel probó que la lógica de primer orden es completa, lo cual fue ciertamente un resultado alentador para la investigación metateórica de los sistemas formales. La lógica de primer orden no es completa respecto de la negación, y por ello no es maximal o saturada. Es completa en un sentido más restringido que los anteriores, que generalmente se llama completitud semántica. En este tercer sentido se dice que una lógica es completa cuando es capaz de deducir todas las fórmulas que son verdaderas en ella. En el caso de la lógica de primer orden tales verdades son las tautologías y todas las fórmulas lógicamente verdaderas (a veces se las llama también “válidas”, o “universalmente válidas”). En general esta forma de completitud significa que todas las consecuencias lógicas de un cálculo deductivo son deducibles en él mediante sus reglas de transformación. Podemos definir en general la completitud semántica de un cálculo deductivo de la siguiente manera: ◊ c) Completitud semántica. Un cálculo deductivo es semánticamente completo si y sólo si para cualesquiera fórmulas χ y ψ, si χ |= ψ, entonces, χ l− ψ.
El concepto de completitud semántica se aplica en sentido estricto a un cálculo deductivo. Una lógica se llama semánticamente completa si posee un cálculo deductivo semánticamente completo. En el caso de los sistemas axiomáticos, es la lógica subyacente del sistema la que puede o no ser semánticamente completa. Generalmente la lógica subyacente de un sistema axiomático no está a su vez axiomatizada. En el caso de que lo estuviera, diremos que esa lógica es semánticamente completa si todas las consecuencias lógicas de los axiomas 103
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
son demostrables como teoremas. A veces, por extensión de este sentido de completitud, se dice que un sistema axiomático es semánticamente completo si su lógica subyacente es semánticamente completa. Así, por ejemplo, toda teoría axiomatizada que tenga como lógica subyacente a la lógica de primer orden será semánticamente completa. La lógica de segundo orden o de orden superior no es completa en sentido semántico, por lo que toda teoría axiomática que tenga como lógica subyacente a una lógica de orden superior será semánticamente incompleta. La completitud semántica de una lógica no implica a ninguna de las otras dos formas de completitud. Por tanto, si se prueba que una lógica es completa en sentido semántico, no se sigue que sea completa respecto de la negación ni tampoco que sea saturada o maximal. Pero si se demuestra, en cambio, que una lógica es semánticamente incompleta, también se habrá probado que es incompleta respecto de la negación. La prueba de ello es la siguiente. Supongamos que el cálculo lógico CL es consistente, correcto y semánticamente incompleto. Supongamos también que la fórmula χ es consecuencia lógica de CL pero no es deducible en CL . Dado que CL es consistente, ¬ χ no es una consecuencia lógica de CL . Y dado que CL es correcto, ¬ χ no es deducible en CL . Por tanto, ni χ ni ¬ χ son fórmulas deducibles en CL . El cálculo CL , entonces, es también incompleto respecto de la negación. Hay muy pocas teorías que son completas respecto de la negación. Para probar que un sistema axiomático S es incompleto respecto de la negación resulta suficiente encontrar dos modelos de S, M 1 y M 2 , y una fórmula bien formada χ, tal que χ sea verdadera en M 1 y ¬ χ sea verdadera en M 2 . Con ello se ha probado que hay al menos una fórmula χ tal que ni χ ni ¬ χ son teoremas en S , y, por tanto, que S es incompleto. En efecto, los teoremas de S deben ser verdaderos en todo modelo de S (por definición misma de modelo), y es evidente que ni χ ni ¬ χ son teoremas en S , porque no son ambos verdaderos en los dos modelos M 1 y M 2 ( χ es falso en M 2 y ¬ χ es falso en M 1 ). En 1931 Gödel obtuvo una demostración de imposibilidad de extraordinaria importancia. Demostró que cualquier sistema axiomático formal suficientemente rico como para contener a la aritmética elemental, si es consistente debe ser incompleto respecto de la negación. En cualquier sistema axiomático que permita deducir la aritmética elemental hay, por tanto, alguna fórmula del lenguaje de la aritmética tal que ni ella ni su negación son teoremas. Un corolario de este metateorema de Gödel sostiene, además, que una fórmula que expresa la consistencia del sistema es precisamente una de esas fórmulas que no pueden demostrarse dentro del propio sistema. Resulta, entonces, que en ningún sistema axiomático con las características antes señaladas, por ejemplo, las teorías de conjuntos, es posible ofrecer una prueba de consistencia mediante los recursos formales del propio sistema (para más detalles véase el Apéndice 1). La 104
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
investigación metateórica posterior reveló que muy pocas teorías matemáticas interesantes son completas y que la mayoría de los sistemas axiomáticos, como los de las diferentes teorías de conjuntos, son incompletos. La incompletitud en sentido lógico-formal no debe entenderse como una falta de desarrollo, es decir, como si la teoría fuera puramente parcial y pudiera completarse enriqueciendo su lenguaje o incorporando nuevos axiomas. Se trata de una incompletitud por principio que no se puede superar mediante estos recursos; aunque se agregue cualquier número de axiomas que se quiera (y se pueda, mientras se preserve la consistencia) la teoría resultante siempre seguirá siendo incompleta. Podemos describir el resultado de este teorema de Gödel diciendo que establece la imposibilidad de construir un sistema axiomático, suficientemente rico como para formular la aritmética elemental, que sea a la vez consistente y completo. Si dicho sistema es consistente, será incompleto; y si es completo, será inconsistente. Obviamente, los sistemas inconsistentes son inútiles, por lo cual la única alternativa viable es sacrificar la completitud de los sistemas matemáticos axiomatizados. La completitud es una propiedad deseable pero no indispensable de los sistemas axiomáticos y de las teorías formales en general. Una teoría incompleta no es inútil ni trivial en ningún sentido. Se puede trabajar perfectamente con ella demostrando un número indefinidamente grande de teoremas. No obstante, si un sistema axiomático es incompleto, contendrá fórmulas tales que ni ellas ni sus negaciones podrán probarse como teoremas a partir de los axiomas del sistema. 3) Decidibilidad
La decidibilidad de un sistema formal se refiere al hecho de que exista en el sistema un procedimiento mecánico de decisión para establecer si una fórmula pertenece o no pertenece a ese sistema. Si tal procedimiento no existe, el sistema es indecidible. Para el caso de los sistemas axiomáticos definiremos estos conceptos de la siguiente manera: ◊ Un sistema axiomático S es decidible si y sólo si existe un procedimiento algorítmico tal que para toda fbf χ permite determinar si χ es o no es un teore-
ma en S . ◊ Un sistema axiomático S es indecidible si y sólo si S no es decidible.
Un algoritmo o procedimiento efectivo en general es un método mecánico para resolver un problema, llegando a la solución mediante un número finito de
105
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
operaciones. En ninguna de las operaciones de un algoritmo intervienen procesos aleatorios o azarosos, como elegir arrojando una moneda o un dado. En el caso de los sistemas axiomáticos el problema en cuestión será el de determinar si una fórmula del lenguaje de un sistema dado es o no es un teorema en dicho sistema. El sistema es decidible cuando existe un algoritmo de este tipo para toda fórmula bien formada del sistema. Las tablas de verdad para la lógica proposicional, por ejemplo, constituyen un procedimiento algorítmico para determinar si una forma proposicional es o no lógicamente verdadera, es decir, si es una tautología de la lógica proposicional o no lo es. Observemos que el método de las tablas de verdad nos permite decidir esto respecto de cualquier forma proposicional bien formada, por más extensa o complicada que sea. La tabla de verdad de una forma proposicional compleja podrá ser muy larga, pero siempre tendrá una extensión finita, y este hecho garantiza que será posible llegar a un resultado concluyente, por sí o por no, en un número finito de pasos. Otro ejemplo de algoritmo bien conocido son los procedimientos que aprendemos en la escuela elemental para sumar, restar, multiplicar y dividir números enteros o reales. Mediante ellos podemos resolver, en principio, cualquier problema que involucre estas operaciones con números. Por supuesto, en la práctica habrá operaciones que no podamos resolver por su extensión o complejidad, por ejemplo multiplicar dos números de 500 millones de dígitos cada uno. Sin embargo, la existencia de un algoritmo nos garantiza que la operación se puede resolver en un número finito de pasos, y, por tanto, en un tiempo finito. El resultado metateórico más importante acerca de la decidibilidad de los sistemas formales lo obtuvo A. Church en 1936, y es conocido como teorema de Church. En él se demuestra que la lógica de predicados de primer orden (con o sin identidad) es indecidible. La lógica proposicional es decidible. Hay un fragmento del cálculo de predicados que es decidible, el de predicados monádicos, pero cuando se emplean predicados poliádicos (de dos o más argumentos) no hay procedimiento de decisión. Ello significa que la lógica de primer orden como un todo es indecidible y que no hay, entonces, un algoritmo que permita determinar para cualquier fórmula de la lógica de predicados si es o no lógicamente verdadera. Todo el que haya empleado algún método de demostración, como las tablas semánticas o los árboles lógicos, recordará que estos métodos permiten decidir en un número finito de pasos si fórmulas con predicados monádicos (como ∀ x ( Fx → Gx )) son o no teoremas de la lógica de primer orden. Pero si la fórmula incluye predicados de dos o más argumentos (como, por ejemplo, ∀ x ∀ y ( Fxy → Gyx )) las tablas o los árboles lógicos pueden volverse infinitos y, entonces, la prueba no logra concluir en un número finito de pasos. Esto no significa que no sea posible hacer demostraciones en lógica de predicados poliádicos, cosa obviamente falsa, sino únicamente que no podemos resolver de una manera mecánica todos los problemas de esta rama de la lógica elemental.
106
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
El propio Church y J. B. Rosser extendieron este resultado y también consiguieron demostrar que la aritmética elemental de Peano es indecidible. Posteriormente, la investigación metateórica probó que existen muchas otras teorías matemáticas importantes, como la teoría de grupos y la teoría de conjuntos (suponiendo que es consistente), que no son decidibles. También se descubrió que son decidibles muchas teorías matemáticas, como la teoría de las álgebras de Boole y la geometría hiperbólica. La consecuencia más significativa de los resultados de indecidibilidad es que muestran que la lógica y la matemática no son completamente mecanizables. Si una teoría es decidible, en principio es posible construir una máquina computadora y programarla para que de manera automática pruebe si cualquier fórmula bien formada que se le suministre es o no deducible en esa teoría, es decir, si es o no un teorema. Esto se consigue desde hace tiempo con la lógica proposicional, por ejemplo. Pero si la teoría no es decidible no hay manera de computar sus teoremas de manera automática, y, por tanto, no es posible construir una máquina que demuestre si una fórmula de la teoría es o no un teorema de esa teoría. No se trata de una limitación técnica que pueda ser superada construyendo máquinas más potentes y veloces. Es una imposibilidad lógica intrínseca a las teorías indecidibles e insuperable por principio. La decidibilidad de una teoría formal se prueba ofreciendo un algoritmo o procedimiento de decisión para esa teoría. Así, por ejemplo, las tablas de verdad prueban que la lógica proposicional es decidible (hay, además, muchos otros métodos de decisión más simples). Para los sistemas axiomáticos existe una relación entre completitud y decidibilidad que nos permite obviar la construcción de algoritmos para probar que el sistema es decidible: Si un sistema axiomático S es completo respecto de la negación, entonces S es decidible.
Así pues, la completitud de un sistema axiomático implica su decidibilidad, por tanto, si ya hemos probado que es completo respecto de la negación, no es necesario probar que es decidible. Este metateorema, demostrado por A. Turing en 1936, sólo es válido para las teorías axiomatizables. Si una teoría formal no es axiomatizable no se puede inferir su decidibilidad a partir de la prueba de su completitud.
La conversa de esta relación es falsa: hay sistemas que son decidibles e incompletos, como lo muestra el ejemplo de la lógica proposicional. Es importante no confundir la completitud respecto de la negación con la decidibilidad de una teoría. La completitud respecto de la negación nos dice que para cualquier par de fórmulas bien formadas contradictorias χ y ¬ χ una de ellas es deducible en la teoría, pero esto nada nos dice acerca de la manera de encontrar la demostración de una de esas fórmulas. Puede ocurrir que de 107
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
hecho no encontremos una prueba de ninguna de las dos, aunque sepamos que tal prueba existe, y debamos permanecer en estado de incertidumbre al respecto. La decidibilidad de una teoría nos asegura que existe un procedimiento para determinar si una fórmula dada es o no es un teorema en una teoría determinada. Pero es perfectamente posible que la respuesta sea que ni esa fórmula ni su negación son teoremas, lo cual nos indica simplemente que tal teoría es incompleta respecto de la negación. Si una teoría o sistema axiomático es decidible las dificultades para arribar a la solución de un problema sólo pueden ser de tipo práctico, por ejemplo, cuando la prueba de un teorema sea tan larga que una máquina resulte incapaz de terminarla en un tiempo humanamente razonable; o bien cuando sea tan complicada que no seamos capaces de programar a una máquina para que la resuelva. Estas dificultades son meramente de hecho y pueden superarse progresivamente a medida que se desarrollan el conocimiento y la tecnología industrial de las computadoras. Por el contrario, si la teoría es completa pero indecidible (en cuyo caso no podrá ser una teoría axiomatizable) es imposible por principio construir una máquina que en un tiempo finito demuestre que para cualquier fórmula χ o bien χ o bien ¬ χ pertenece a la teoría (es teorema) y la otra no. Tal prueba depende exclusivamente de la creatividad humana y no se puede mecanizar de manera que se garantice su descubrimiento automático. Existe otro concepto de decidibilidad que se aplica a las fórmulas de un sistema axiomático y que debe distinguirse del anterior. Siguiendo la terminología de Gödel lo llamaremos decidibilidad formal y lo definiremos de la siguiente manera: ◊ Una fórmula bien formada χ, que pertenece al lenguaje de un sistema axiomático S , es formalmente decidible en S si y sólo si o bien χ o bien ¬ χ
son teoremas en S .
La indecidibilidad formal de una fórmula se define, entonces, como la negación de la decidibilidad: ◊ Una fórmula bien formada χ, que pertenece al lenguaje de un sistema axiomático S , es formalmente indecidible en S si y sólo si ni χ ni ¬ χ son teo-
remas en S .
La existencia de fórmulas formalmente indecidibles en un sistema axiomático es una consecuencia inmediata del hecho de que dicho sistema sea incompleto respecto de la negación. Podemos afirmar, entonces, la siguiente equivalencia:
108
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
Existen fórmulas formalmente indecidibles en el lenguaje de un sistema axiomático S si y sólo si S es incompleto respecto de la negación.
Por su parte, los dos conceptos de indecidibilidad que hemos definido se relacionan de la siguiente manera. Si un sistema axiomático es decidible puede contener o no fórmulas formalmente indecidibles, pero si es indecidible deben existir en su lenguaje fórmulas formalmente indecidibles, ya que si no existieran, el sistema sería completo respecto de la negación y, por consiguiente, también sería decidible. 4) Satisfacibilidad
◊ Un sistema axiomático S es satisfacible si y sólo si S tiene al menos un
modelo.
La satisfacibilidad es una propiedad importante porque está relacionada con la consistencia de un sistema. Un sistema inconsistente no puede tener un modelo; por tanto, si el sistema es satisfacible, entonces es consistente.
Si un sistema axiomático S es satisfacible, entonces S es consistente.
Esta relación general entre satisfacibilidad y consistencia vale para cualquier teoría o sistema axiomático. La relación conversa sólo es válida para los sistemas axiomáticos de primer orden. Para los sistemas de segundo orden o de orden superior en general, puede darse el caso de que un sistema axiomático sea consistente y, sin embargo, no tenga un modelo, es decir, no sea satisfacible. La equivalencia entre consistencia y satisfacibilidad vale en general para toda teoría de primer orden, por lo que podemos afirmar que:
Toda teoría consistente de primer orden tiene un modelo.
Este es un resultado extremadamente importante porque asegura la satisfacibilidad de cualquier teoría consistente de primer orden. Por ello, el hecho de no poder encontrar un modelo para una de estas teorías se debe siempre a una limitación de las capacidades humanas pero no de la teoría en sí misma. En 1930 K. Gödel probó este resultado como parte de su demostración de la completitud de la lógica de primer orden. Sin embargo, ya había sido encontrado por Th. Skolem en 1929, e independientemente por J. Herbrand en 1930. La satisfacibilidad de un sistema axiomático se prueba simplemente encontrando un modelo de ese sistema. Al hacerlo se habrá probado también que dicho sistema es consistente. 109
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
Resulta inevitable preguntarse por qué razón un sistema inconsistente no puede tener un modelo. En términos informales, la respuesta se encuentra en el presupuesto de que el principio clásico de no contradicción, ¬ ( χ & ¬ χ ), es una ley lógica válida sin restricciones ni excepciones. Supongamos que Sn sea un sistema axiomático inconsistente en el sentido de que permite deducir de sus axiomas dos teoremas de la forma χ y ¬ χ. Si Sn tuviera un modelo M , todos los teoremas de Sn deberían ser enunciados verdaderos en M . Consiguientemente, χ y ¬ χ serían verdaderos en M , pero por la ley de no contradicción esto no puede ocurrir en ningún caso. Por tanto, Sn no tiene modelos, ya que no existe ninguna interpretación posible en la que todos sus teoremas sean enunciados simultáneamente verdaderos. 5) Independencia
Hay dos conceptos de independencia para un sistema axiomático S : i) in- dependencia de los axiomas de S , y ii) independencia de los términos primitivos de S . i) Independencia de los axiomas ◊ Los axiomas de un sistema axiomático S son independientes si y sólo si
ninguno de ellos es deducible de los restantes. Si un axioma de un sistema axiomático S es deducible de los restantes axiomas de S se dice que no es independiente. Para probar que un determinado axioma no es independiente basta con demostrarlo como teorema a partir de los otros axiomas del sistema. En cambio, para probar que un axioma es independiente resulta necesario ofrecer una prueba de tipo semántico mediante la construcción de un modelo. La independencia de un determinado axioma Ax de un sistema axiomático se prueba encontrando un modelo en el cual sean verdaderos todos los axiomas del sistema excepto Ax, que, consiguientemente, será falso en dicho modelo. Por ejemplo, supongamos que en el sistema S = {Ax1, Ax2, Ax3} deseamos probar la independencia del axioma Ax 3. Para ello es necesario construir un modelo del sistema S’ = {Ax1, Ax2, ¬ Ax3}. Si encontramos dicho modelo, habremos probado que S’ es consistente, ya que la satisfacibilidad de un sistema implica su consistencia, como se indicó en el parágrafo anterior. Y el hecho de que S’ sea consistente prueba que Ax 3 no se deduce de los axiomas Ax1 y Ax2. En efecto, si Ax 3 fuera deducible de los otros dos axiomas, el sistema S’ sería inconsistente (ya que contendría como teoremas a Ax 3 y a ¬ Ax3 ) y, por tanto, no podría tener un modelo. Para probar la independencia de los otros axiomas del sistema se procede de la misma manera, esto es, encontrando modelos en los que resulten verdaderos todos los axiomas del sistema salvo aquél cuya independencia se quiere probar. 110
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
Existe otro sentido más fuerte de independencia según el cual una fórmula χ se dice independiente de un conjunto de fórmulas Γ si y sólo si ni χ ni ¬ χ son deducibles de Γ. Para probar la independencia, en este sentido del término, de un axioma de un sistema axiomático es necesario encontrar dos modelos. En nuestro ejemplo, un modelo del sistema S y otro modelo del sistema S’ . El modelo de S prueba que ¬ Ax3 no es deducible de los otros dos axiomas del sistema. En general, siempre que se hace referencia a la independencia de los axiomas de un sistema axiomático se la entiende en el sentido más débil que mencionamos al comienzo, por lo cual no se requiere una prueba de consistencia de todo el sistema. ii) Independencia de los términos primitivos ◊ Los términos primitivos de un sistema axiomático S son independientes si
y sólo si ninguno de ellos es definible mediante los demás primitivos de S .
La prueba de independencia de un término primitivo t de un sistema S se realiza por el llamado método de Padoa (creado por el matemático italiano A. Padoa). Este consiste en encontrar dos modelos de S , M 1 y M 2 , tales que ambos tengan el mismo dominio y la interpretación de cada primitivo de S , excepto t , sea la misma, pero la interpretación de t sea diferente en cada modelo. Esto muestra que t es definicionalmente independiente de los restantes términos primitivos de S , porque si no lo fuera debería tener forzosamente la misma interpretación en M 1 y en M 2 (es fácil construir algún ejemplo sencillo para comprobarlo). La independencia de los axiomas y de los términos primitivos de un sistema axiomático no es una propiedad indispensable. Por razones de simplicidad, economía de expresión y elegancia resulta deseable que el conjunto de los axiomas y términos primitivos de un sistema sea reducido al mínimo posible. Si algún axioma o término primitivo no es independiente se introduce información redundante en los puntos de partida del sistema, pero de ello no se sigue ningún per juicio para la capacidad demostrativa del sistema, ni se afecta a su consistencia o a otras propiedades metateóricas. Frecuentemente, por razones prácticas, es conveniente introducir términos o axiomas redundantes para mejorar la comprensibilidad de un sistema. La axiomática de la lógica proposicional brinda un buen ejemplo de esta situación. H. M. Sheffer probó en 1913 que todas las conectivas lógicas pueden definirse utilizando una sola como término primitivo, la barra “” o funtor de Sheffer, que es la incompatibilidad conjunta de dos proposiciones (“ pq” es verdadero si y sólo si p y q no son ambos verdaderos). Sin embargo, las definiciones y fórmulas construidas con esta conectiva no son claras ni fáciles de manejar a la hora de hacer deducciones. Por su parte, J. Nicod construyó en 1918 un sistema axiomático de lógica proposicional que empleaba 111
PROPIEDADES DE
´ TICO UN SISTEMA AXIOMÁ
un solo axioma y esta única conectiva. Pero el axioma era largo y poco intuitivo, como puede verse: ( p( qr ))(( s( s s ))(( t q )(( pt )( pt )))). Posteriormente se inventaron muchos sistemas equivalentes de un único axioma, con una o dos conectivas, pero ninguno resultó sencillo y fácil de utilizar. En general, la independencia de los axiomas se considera un requisito más importante que la independencia de los términos primitivos. Al construir un sistema axiomático se adoptan casi siempre términos primitivos redundantes (por ejemplo, dos o más conectivas proposicionales) para facilitar la claridad de expresión. También se prefiere emplear varios axiomas breves y claros en vez de pocos largos y complicados. Así, se han construido sistemas axiomáticos de lógica proposicional, como el de D. Hilbert y P. Bernays de 1934, o el de H. Hermes y H. Scholz de 1952, que emplean cada uno quince axiomas independientes. Cuando el sistema a construir no es elemental, la independencia de los axiomas puede ser difícil de probar e incluso se la puede sacrificar por razones pragmáticas sin que se afecte más que la elegancia del sistema. No obstante, cuando un determinado axioma de un sistema es cuestionado, la prueba de que es independiente de los restantes axiomas del sistema tiene importancia teórica. Esto ocurrió históricamente con el quinto postulado de Euclides, cuya independencia tardó muchos siglos en ser reconocida, o con el axioma de elección de la teoría de conjuntos de Zermelo-Fraenkel, que P. Cohen probó como independiente en 1963 (véase el Capítulo 5.2). 6) Categoricidad
◊ Un sistema axiomático S es categórico si y sólo si S es satisfacible y todos
sus modelos son isomorfos entre sí.
Ya hemos definido precisamente el concepto de isomorfismo entre estructuras en el Capítulo 3.4. El isomorfismo entre modelos se puede caracterizar de manera intuitiva diciendo simplemente que dos modelos son isomorfos cuando poseen la misma cantidad de elementos en sus respectivos dominios y estos elementos están relacionados entre sí de la misma manera en cada modelo. Un sistema axiomático formal que es satisfacible no tiene un único modelo, sino un número infinito de modelos (lo cual no significa que podamos conocer ni siquiera uno de ellos). Si el sistema es categórico y conocemos al menos un modelo del sistema, podemos saber además que todos los otros modelos tienen la misma forma que ése. Los modelos isomorfos difieren solamente en la naturaleza de sus elementos, pero en lo demás son idénticos ya que tienen la misma cantidad de elementos, y además, las propiedades y relaciones que existen entre los elementos de un modelo son las mismas que existen entre los elementos correspondientes del otro modelo (o semejantes a ellas). Por esta razón, los 112
PROPIEDADES DE
´ TICOS EN GENERAL LOS SISTEMAS AXIOMÁ
lógicos y matemáticos frecuentemente tratan a los sistemas o teorías categóricos como si tuvieran un único modelo. En realidad, tienen infinitos modelos, pero éstos sólo difieren en la naturaleza de sus elementos, algo que desde el punto de vista matemático es inesencial. La categoricidad de un sistema es una propiedad importante porque está relacionada con la completitud, pero ambas no son equivalentes, porque no ocurre que todo sistema categórico sea completo y a la vez que todo sistema completo sea categórico. La implicación entre categoricidad y completitud se da en un solo sentido: Si un sistema axiomático S es categórico, entonces S es completo respecto de la negación.
La relación inversa es falsa, ya que hay sistemas completos que no son categóricos. Un sistema completo es categórico sólo en el caso de que tenga algún modelo finito. Si un sistema axiomático S es completo y tiene un modelo finito, entonces S es categórico.
Ejemplos de sistemas axiomáticos categóricos son la aritmética elemental de Peano, la geometría euclídea de Hilbert y la teoría de los números reales de Tarski. Todas ellos requieren, sin embargo, que se los formule en el lenguaje de la lógica de segundo orden. Cuando se los formula como teorías de primer orden no son categóricos. El teorema de Löwenheim y Skolem (que formulamos en el Capítulo 3.4) tiene una consecuencia muy importante respecto de la categoricidad de las teorías. Esta consiste en el hecho de que ninguna teoría de primer orden que tenga algún modelo infinito es categórica . Como ya hemos visto, la isomorfía entre modelos requiere que todos ellos tengan dominios con el mismo número de elementos, esto es, dominios cuyos elementos se puedan poner en correspondencia uno a uno entre sí. Ahora bien, por la versión ascendente del teorema de Löwenheim y Skolem, toda teoría de primer orden que tiene un modelo infinito contable, tiene también modelos infinitos no contables. Los modelos infinitos contables y no contables no pueden ser isomorfos, porque los elementos de su dominio no son coordinables uno a uno. Dicho de manera informal, sus dominios no tienen el mismo número de elementos. Por consiguiente, tales modelos no son isomorfos. Esta es la razón por la cual sólo las teorías de primer orden que tienen únicamente modelos finitos son susceptibles de ser categóricas. Podemos afirmar, entonces la siguiente implicación entre estas dos propiedades: 113
PROPIEDADES DE
´ TICO UN SISTEMA AXIOMÁ
Si una teoría de primer orden es categórica, entonces, todos sus modelos son finitos.
La implicación conversa no es en general válida, ya que una teoría puede tener sólo modelos finitos y, sin embargo, no ser categórica porque tiene modelos de diferente cardinalidad finita. Las teorías de primer orden que tienen algún modelo infinito no pueden ser categóricas. Las teorías de segundo orden, en cambio, sí pueden serlo. Esto se debe a que en la lógica de segundo orden (aquella que permite cuantificar variables predicativas) no es válido el teorema de Löwenheim y Skolem. Las teorías formuladas en un lenguaje de segundo orden pueden así ser categóricas y, como, consecuencia de ello, también completas. Muchos lógicos y filósofos las consideran apropiadas para caracterizar de manera unívoca una determinada estructura matemática, como la aritmética de Peano, ya que no tienen modelos no standard . Una noción más débil, pero sumamente útil, de categoricidad es la llamada κ-categoricidad. Ante todo, decimos que un modelo tiene cardinalidad κ cuando su dominio tiene un número κ de elementos (donde κ es un cardinal cualquiera, finito o infinito). Mediante este concepto podemos definir, entonces, la κ-categoricidad de la siguiente manera: ◊ Un sistema axiomático S es κ-categórico si y sólo si: a) S tiene al menos un modelo de cardinalidad κ; y b) todos los modelos de S de cardinalidad κ son
isomorfos entre sí.
Existen muchas teorías de primer orden que no son categóricas, pero, sin embargo, son κ-categóricas, por lo cual pueden caracterizar de manera unívoca sus modelos hasta el cardinal κ. Suele decirse, entonces, que dichas teorías tienen un único modelo de cardinalidad κ, ya que todos los modelos de esa cardinalidad tienen la misma estructura y pueden considerarse, desde el punto de vista matemático, como si fueran el mismo.
4.2 Propiedades de las teorías formales de primer orden A lo largo de este capítulo hemos mencionado numerosos ejemplos de sistemas axiomatizados de lógica y matemática que ejemplificaban cada una de las propiedades metateóricas que definimos. No hemos ofrecido prueba alguna de estos resultados, ni podemos hacerlo aquí, pero es conveniente resumir de ma114
PROPIEDADES
DE LAS TEORÍAS FORMALES DE PRIMER ORDEN
nera sistemática cuáles son las propiedades conocidas de las teorías fundamentales de primer orden. Por tratarse de teorías de primer orden, sabemos que si son consistentes, también son satisfacibles. Igualmente, sabemos que ninguna teoría de primer orden que tenga algún modelo infinito es categórica, por lo que no mencionaremos esta propiedad en cada caso. La lógica proposicional , que es la parte básica de la lógica de primer orden, es consistente, completa en sentido semántico y decidible. No es maximal ni completa respecto de la negación. La demostración de todas estas propiedades metateóricas se debe a E. Post, quien lo hizo en su tesis doctoral escrita en 1920. La lógica de predicados monádicos, que es un fragmento de la lógica de primer orden es consistente, completa en sentido semántico y decidible, pero no es maximal ni completa respecto de la negación. Todas estas propiedades metateóricas las demostró L. Loewenheim en 1915. La lógica de primer orden en su totalidad es consistente, completa en sentido semántico e indecidible. No es maximal ni completa respecto de la negación. La consistencia de la lógica de primer orden la demostraron D. Hilbert y W. Ackermann en 1928; la completitud semántica la demostró K. Gödel en 1930; y la indecidibilidad la probó A. Church en 1936. La lógica de primer orden satisface la propiedad esencial de los sistemas formales, la consistencia, y tiene también la fortuna de ser semánticamente completa. Observemos, además, que la lógica de primer orden como un todo es indecidible, pero hay un fragmento de ella, la lógica de predicados monádicos, que es decidible. Por otra parte, ningún fragmento de esta lógica es completo respecto de la negación. La aritmética elemental (la teoría de los números naturales con las operaciones de suma y multiplicación y el concepto general de número natural) es consistente. La primera prueba de consistencia absoluta la dio G. Gentzen en 1935, pero se trata de una prueba que no es estrictamente finitaria (véase el Apéndice 1) y por esa razón muchos la consideran poco segura o menos rigurosa que una prueba finitaria. No existe ninguna prueba finitaria de su consistencia. K. Gödel demostró en 1931 que si la aritmética elemental es consistente, entonces es incompleta respecto de la negación. A. Church demostró en 1936 que si esta teoría es consistente, entonces también es indecidible. Los resultados metateóricos muestran, pues, que la aritmética elemental es una teoría menos segura que la lógica de primer orden, ya que no podemos estar completamente ciertos de haber probado su consistencia. No obstante, la mayoría de los matemáticos considera que la consistencia de la aritmética elemental, aunque no la podamos proclamar con certeza absoluta, está más allá de toda duda razonable. Finalmente, la teoría de conjuntos (en las versiones axiomáticas de ZermeloFraenkel y de Von Neumann-Bernays-Gödel) carece de prueba de consistencia 115
PROPIEDADES
´ TICO DE UN SISTEMA AXIOMÁ
absoluta. Se ha demostrado que si es consistente, entonces es incompleta y que es indecidible. El primer resultado lo dio K. Gödel en 1931, y el segundo A. Church en 1936. La teoría de conjuntos es, desde el punto de vista metateórico, la más insegura de las teorías matemáticas de primer orden porque no sabemos si es consistente o no. Existen pruebas relativas de la consistencia de una axiomática respecto de la otra, pero es perfectamente posible que ambas teorías sean inconsistentes (véanse el Capítulo 5.2 y el Apéndice 1). Por otra parte, no cabe duda de que ésta es la más importante de las teorías axiomáticas de primer orden en razón de su potencia deductiva. En efecto, la teoría de conjuntos es mucho más potente que la lógica de primer orden o que la aritmética elemental porque permite deducir muchas otras teorías matemáticas (teorías del álgebra, el análisis y la geometría) que las otras dos no implican. Por ello, es una herramienta de fundamental importancia para el trabajo matemático, que se ha empleado hasta nuestros días sin que aparezcan contradicciones, pero sin la seguridad de que no se presentarán en el futuro.
Notas bibliográficas Hunter (1996) es una introducción detallada a la metateoría de la lógica de primer orden. Las pruebas de consistencia y completitud de la lógica de primer orden están expuestas, con diferentes medios y grados de dificultad, en casi todos los tratados de lógica, por ejemplo, Church (1956); Enderton (2001); Kleene (1952) y (1967); Machover (1996); Margaris (1990); Schoenfield (1967); Smullyan (1995) y Zalabardo (2002). Priest (2001) es un texto detallado sobre lógicas no clásicas, incluyendo la lógica paraconsistente, que se menciona al discutir el principio del Pseudo Scoto. Epstein (1995) es una obra enciclopédica que contiene mucha información sobre la lógica proposicional clásica y sobre las más diversas lógicas no clásicas.
El teorema de incompletitud de Gödel, y su corolario acerca de la indemostrabilidad de la consistencia, son difíciles de probar de manera completa y minuciosa. Nagel y Newman (1986) es una presentación no técnica. Crossley (1972) incluye una demostración breve y más detallada, pero accesible. Hamilton (1988) y Machover (1996) son otras presentaciones simplificadas, pero más precisas. En la nota bibliográfica al final del Apéndice 1 se indican otras obras más avanzadas. La indecidibilidad de la lógica de primer orden la prueban, entre muchos otros textos, Enderton (2001); Hunter (1996); Kleene (1952) y (1967). Los trabajos pioneros sobre la indecidibilidad de la lógica y la matemática se recopilan en Davis (1965). El problema de la decidibilidad de los sistemas formales se trata hoy en términos de la teoría de las funciones recursivas, que 116
NOTAS
´FICAS BIBLIOGRÁ
es una parte de la teoría de la computabilidad en general. Para introducciones amplias a este tema, pero muy diferentes, véanse las obras de Boolos, Burgess y Jeffrey (2007), Kunen (2009), Hermes (1971) y Wang (1993). Cutland (1986) es un tratado sistemático de nivel más avanzado. Sobre la teoría de conjuntos véase la nota bibliográfica al final del Capítulo 5. Introducciones a la lógica de segundo orden (tema que no tratamos en esta obra) se hallan en Church (1956), Enderton (2001), Boolos, Burgess y Jeffrey (2007) y Alchourrón, Méndez y Orayen (1995). Shapiro (2000) es un texto avanzado sobre lógica de segundo orden y cuestiones filosóficas acerca de las teorías de segundo orden.
117
5
Teorías axiomatizadas
5.1 Introducción
n este capítulo presentaré cuatro teorías axiomatizadas, todas ellas pertenecientes al campo de la matemática, que ofrecen ejemplos acabados del empleo del método axiomático. No demostraré de manera sistemática un conjunto amplio de teoremas de cada una de estas teorías, como se hace habitualmente en los libros de texto, sino que sólo ofreceré algunas demostraciones selectas a modo de ejemplos. En cambio, caracterizaré a los axiomas de estas teorías de una manera más detallada que lo habitual, introduciendo formalizaciones precisas de cada axioma y comentarios de tipo histórico y epistemológico. No hay ninguna secuencia lógica entre estas teorías, por lo que pueden leerse en cualquier orden. La primera teoría que presentaré es la teoría de conjuntos de Zermelo-Fraenkel con el axioma de elección. A este axioma en particular, dada su importancia histórica, le dedicaré una sección aparte. Luego, mencionaré otras axiomatizaciones rivales de la teoría de conjuntos, como la de Von Neumann-Gödel-Bernays, la de Kelley-Morse y la de Quine. No formularé los axiomas de estas teorías, con excepción de la de Quine, que sólo contiene dos axiomas sencillos. La segunda teoría axiomatizada que presentaré es la topología general o topología de conjuntos de puntos. Esta es una de las aplicaciones más exitosas de la teoría de conjuntos y, aunque ya la inició el propio Cantor, recibió su primera formulación axiomática en la obra de Hausdorff en 1914. Definiré algunos de los conceptos principales de la topología general y formularé los axiomas que caracterizan a las estructuras de espacio topológico y espacio métrico. También formularé los axiomas que definen a determinados tipos de espacios topológicos, tales como espacio de Hausdorff, espacio regular y espacio normal. La tercera teoría axiomatizada que expondré es la teoría de la probabilidad. Incluiré la formulación conjuntista de Kolmogorov, tanto con aditividad finita como con aditividad contable. Luego, introduciré la noción abstracta de espacio de probabilidades. Finalmente, ofreceré una axiomatización equivalente de la teoría, pero formulada en el lenguaje de la lógica proposicional clásica en vez del lenguaje de la teoría intuitiva de conjuntos.
E
119
EORI´ AS AS T EORI
AXIOMATIZADAS
La cuarta y última teoría que presentaré es la teoría abstracta de la medición. La primera formulación axiomática de esta teoría la hizo H. Von Helmholtz hacia fines del siglo XIX, pero desde entonces se ha refinado y perfeccionado hasta alcanzar un alto grado ado de sofisticació ción. Aquí ofrecer ceré la axiomatización de una parte modesta, pero fundamental, de la teoría de la medición, las llam lamadas adas métri tricas cas com combina binattori orias exte xtensi nsivas vas posi posittivas ivas.. Exis Existten much muchos os otro otross titipos de métric ricas, pero no sería ría oportuno intentar exponerlas aquí. En su conjunto, las cuatro teorías rías que presentaré ofrec recen un ejemplo concreto y preciso de la manera en que el método axiomático se emplea en las ciencias cias matem matemáti áticas cas.. El contenido de este capítulo es algo más técnico y difícil que el de los precede cedent ntes es.. En una una prim primer eraa lect lectur uraa es posib osiblle omit omitir irlo lo sin sin pérdi érdida da de cont contin inui uida dad. d. Sin embargo, la formulación axiomática de la teoría de conjuntos, a la que se aludió muchas veces a lo largo de esta obra, me parece esencial para comprender der tant tantoo las apli aplica caci cion onees del del métod étodoo axio axiom mátic áticoo com como sus lim limitac itacio ione nes. s. 5.2 La teoría de conjuntos
Hemos emos dich dichoo reit reiteerada radam mente nte que la axio axiom matiz atizac ació iónn de la teo teoría ría de conj conjun unto toss representa uno de los mayores logros del método axiomático formal. Ya es hora, entonces, de que hagamos una presentación más detallada de este tema. Existen diversas axiomatizaci aciones de la teoría de conjuntos, pero la más exitosa ha sido la de Zermelo-Fraenkel, que es el producto de la teoría original propuesta por E. Zermelo en 1908 (tal como aparece en el Apéndice 2.14) junto con las adiciones y correcciones introducidas por A. Fraenkel en 1922 y por el propio Zermelo en 1930. El sistema axiomático completo consta de 9 axiomas. Se lo puede formalizar como una teoría de primer orden, que tiene como lógica subyacente a la lógica de primer orden con identidad, y un único término prim primititiv ivoo esp específ ecífic icoo, el pred prediicado cado diád diádic icoo “pe “perten rteneece” ce” ( ∈ ). Los axiomas Ax1-Ax8 forman la teoría ría de Zermelo-Fraenkel propiamente dicha, que se abrevia usualmente como ZF. Los axiomas Ax1-Ax9 constituyen la teoría de Zermelo-Fraenkel con el axioma de elección, que abreviamos como ZFE. El sistema contiene dos esquemas de axiomas, y por consiguiente, no es una axi axiomatización finita de la teoría ría de conjuntos. Como puede aprecia ciarse rse, los axiomas Ax1-Ax6 son prácticamente idénticos a los axiomas introducidos por Zermelo en 1908 (compárese con el Apéndice 2.14). El axioma de reemplazo (Ax7) lo propusieron, de manera independiente, A. Fraenkel en 1922 y Th. Skolem en 1923. Por esta razón, muchos autores afirman que la teoría debería llamarse de Zermelo, Fraenkel y Skolem, para hacer justicia al aporte del célebre matemático sueco. Sin embarg argo, ya en 1917 D. Mirim rimano anoff había formulado ese axioma, que en realidad fue red redescubierto por Fraen aenkel y Skolem. El axioma de 120
L A
TEORI´ A A DE CONJUNTOS
regu regula lari rida dadd (Ax8 (Ax8), ), tam tambié bién llam llamad adoo de fund fundam ameentac ntaciión, ón, es el más más tardí ardíoo, ya que que lo intro ntrodu dujo jo Zerm ermelo en 1930 1930,, cuan cuando do refo reform rmul ulóó su axio axiom matiz atizac ació iónn de 1908 1908,, aunaunque Von Neumann en 1925 lo había formulado al dar otra axiomatización de la teoría de conjuntos. Por último, el axioma de elección (Ax9) ya se hallaba en el sistema de Zermelo de 1908, pero hoy se lo considera separadamente del resto de la teoría. Por su importancia histórica, este axioma merece un comentario aparte. La estrategia general de ZF para la formación de conjuntos se conoce como limi limita taci ción ón de tama tamaño ño y, de manera intuitiva, se puede caracterizar diciendo que se admite la existencia de conjuntos que no sean demasiado grandes como para generar antinomias. as. Ya hemos vis visto que el principio de comprensión utilizado por Cantor: ∃ y ∀ x ( x ∈ y ↔ ϕ x ) permitía deducir enunciados contradictorios dentro de la teoría. La razón de ello es que era sumamente potente como para form formar ar conj conjun unto toss arbi arbitr trar aria iame ment ntee gran grande des. s. Zerm Zermel eloo se prop propus usoo limi limita tarr este este prin prin-cipio de modo que no se produjeran antinomias, pero a la vez trató de preser var la mayor parte posible de las instancias de este principio, es decir, de los resultados de la teoría de conjuntos de Cantor. Los axiomas que introdujo para reem reempl plaz azar ar al princ rincip ipio io de com compren prensi sión ón pue pueden den cons consid ider erar arse se com como inst instan anci cias as o c a s o s p a r t i c u l a r es d e e s t e p r i n c i p i o, c o n ex c ep c i ón d e l a x i o m a d e el e c c i ó n (Ax9), que tiene un carácter diferente. Zermelo y sus seguidores presentaron a la teoría de conjuntos como un sistema axiomático form formaal, pero escrito en un lenguaje no formalizado. Posteriormente se advirtió que el sistema ZF puede ser formalizado en un lenguaje de primer orden con identidad, que es la manera en que se lo presenta actualmente en los tratados de lógica, aunque los matemáticos prefieren a menudo la versión no formalizada. Aquí ofreceremos ambas formulaciones de cada axioma, prim rimero un enunciado inform formaal y luego su versi rsión formali alizada. Como res resultará evide vident nte, e, esta sta últi últim ma form formul ulac ació iónn es más com compli plicada cada y menos nos intu intuititiiva. va. Tam Tambié bién haremos un breve comentario informal de cada axioma y, dada su importancia, algunas observaci aciones adicionales acer cerca del axioma de elección. Los axiomas de ZF son los siguientes: Ax1. Axioma de extensionalidad. mos mos elem elemen ento tos, s, ento entonc nces es x = y .
Si dos conjuntos x e y tienen los mis-
∀( xy ) ( ∀ z ( z ∈ x ↔ z ∈ y ) → x = y ).
El primer axioma de la teoría afirma simplemente que si dos conjuntos tienen todos sus elementos en común, entonces son idénticos, es decir, uno y el mismo conjunt unto. Cada conjunt unto está determi rminado ado exclu clusivam vamente nte por sus elementos. Dos conjuntos son diferen rentes cuando hay al menos un elemento que no 121
EORI´ AS AS T EORI
AXIOMATIZADAS
es común a ambos. Este principio ya había sido empleado por Cantor en la c o n s t r u c c i ó n d e l a t e o r í a i n t u i t i v a d e c o n j u n t o s . Z e r me l o y s u s s u c e s o r e s l o adop adopta taro ronn sin sin camb cambio ios. s. Ax2. Axioma de los pares. Para Para cual cuales esqu quie iera ra obje objeto toss x y y existe junto { x, y } que contiene como elementos exact actamente a x x y y .
∀( xy ) ∃ z ∀u ( u ∈ z ↔ ( u = x )
v
un con-
( u = y )).
De acuerdo con con este axioma, dado ados dos objetos a y b (sean o no conjuntos), se puede asegurar la existencia del conjunto llama amado el par de a y b, escrito como {a, b}. Este es un par no ordenado, por lo que {a, b} = {b, a}. Dado el con junto {a, b}, el axioma de los pares autoriza la formación de otros conjuntos de dos elementos, como por ejemplo, {{a, b}, a}; {{a, b}, b}, etc. Ax3. Axioma esquema de separación. Si ϕ es una una para todo conjunto x exist xistee un conj conjun untto y que contiene a de x que tienen la prop ropiedad ϕ.
prop propie ieda dad, d, enton ntonce cess todos los elementos
riablle libre ∀ x ∃ ∃ y ∀ ∀ z ( z ∈ ∈ y ↔ ( z ∈ ∈ x & ϕ ( z )) [Suponiendo que y no es una variab en ϕ]. Este es seguramente el axioma más original y característico de la teoría ZF. Es evid videntemente una modificación del axioma de comprensión de Cantor. Zermelo lo llamó axioma de separación, pero también se lo conoce como axioma de subconjuntos. La idea intuitiva detrás de este principio es que garantiza la exis existe tenc ncia ia de los los subc subcon onjjunto untoss de un conj conjun unto to dado dado,, aque aquelllos los dete determ rmin inad ados os por la prop propie ieda dadd ϕ. Luego, si el conjunto previamente existente no es demasiado grande, tampoco lo será ninguno de sus subconjuntos. De acuerdo con este axio axioma ma,, toda toda prop propie ieda dadd ϕ determina un conjunto, a condición de que éste sea un subconjunto de un conjunto ya dado. Por tanto, en ZF ya no ocurre que para toda propiedad existe un conjunto que es su extensión. Zermelo, en su formulación original de 1908, había enunciado la condición de que ϕ debía ser una propiedad bien definida, esto es, que un enunciado de la forma ϕ( z ) fuera verdadero o falso respecto de cualquier objeto del dominio de la teoría. Esta noción un poco vaga fue clarificada por Th. Skolem en 1922, quie quienn prop propus usoo cons consid ideerar rar a ϕ( z ) como una condicion sobre z , o sea, como una fórmula bien formada del sistema en la cual la variable z está libre. Esta es desde entonces la manera usual de entender la expresión ϕ( z ) en el axioma de separación. 122
L A
TEORI´ A A DE CONJUNTOS
El axioma de separación resulta por consiguiente un esquema de axioma, que tiene tantas instancias como casos de sustitición posibles tiene ϕ( z ), esto es, infinitas. Se ha probado que este esquema de axioma no puede sustituirse por un número finito de axiomas, y, por consiguiente, que ZF no es finitamente axioma axiomatiz tizabl able. e. Para Para todo todo conj conjun unto to x exis existe te un conj conjun unto to y que contiene como elementos exactamente a todos los elementos de los elementos de x. Ax A x 4 . A x i o m a d e u n i ó n .
∀ x ∃ y ∀ z ( z ∈ y ↔ ∃u ( u ∈ x & z ∈ u )).
Este axioma afirma que, dado un conjunto de conjuntos a, existe otro con junto ∪a (el conjunto unión o conjunto suma) que tiene como elementos a todos los elementos de los conjuntos contenidos en a. Esto es, si el conjunto a tie tiene com como elem lement entos a los conj conjun unto toss b, c, d,... entonces todos los elementos de b, c, d,..., y sólo ellos, están contenidos en ∪a. Este axioma permite construir, a partir de dos conjuntos dados a y b, la unión a ∪ b, que también es un conjunto. En efecto, si a y b son son conj conjun unto tos, s, el axioma de los pares afirma que existe el conjunto c = {a, b}; y de acuerdo con el axioma de unión ∪c = a ∪ b. Ax5. Axioma del conjunto potencia. Para ara todo odo conj conjun unto to x existe un con junto y que tiene como elementos exactamente a todos los subconjuntos de x .
∀ x ∃ y ∀ z ( z ∈ y ↔ ∀u ( u ∈ z → u ∈ x )).
Este axioma afirma que dado un conjunto a exis existe te otro otro conj conjun unto to ℘a que contiene como elementos a todos los subconjuntos de a y sólo a ellos. ℘a es un conjunto de conjuntos, del cual también existe el conjunto potencia, y así así sucesivamente: b = ℘a, ℘b = ℘℘a, etc. De este modo, el axioma del conjunto potencia permite generar un número infinito de conjuntos a part artir de un conjunto dado a, form formán ándo dose se una una secu secueenci ncia infi infini nita ta:: a, ℘a, ℘℘a, ℘℘℘a ... . Ax6. Axioma de infinitud. Exis Existe te tes cond condic icio ione nes: s: i) ∅ ∈ x ; ii) para todo
un conj conjun unto to x que que sati satissface face las las sigu siguie iennconjunto y ∈ x también y ∪ { y y } ∈ x .
)). ∃ x ( ∅ ∈ x & ∀ y ( y ∈ x → y ∪ { y y } ∈ x
123
T EORI´ AS
AXIOMATIZADAS
Este axioma afirma la existencia de al menos un conjunto que contiene infinitos elementos. Sin este axioma resulta imposible probar que existen conjuntos infinitos en ZF. Además, todo conjunto que satisfaga las condiciones i) y ii) es infinito. Por ejemplo, un conjunto z que cumple con estas condiciones es el que contiene como elementos a: ∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, ... etc. Ax7. Axioma esquema de reemplazo. Si ƒ es una función, ra todo conjunto x existe un conjunto y tal que y = ƒ ( x ).
entonces, pa-
∀ x ∃ y ( ƒ( x , y ) & ∀ z ( ƒ( z , y ) → z = y )) → ∀ x ∃ y ∀t ( t ∈ y ↔ ∃ u ( u ∈ x & ƒ( u, t ))).
Esto quiere decir que si el dominio de una función es un conjunto, el codominio de esa función también constituye un conjunto. Dado que el codominio de la función debe ser un conjunto que no tiene más elementos que el dominio, si el dominio no es demasiado grande tampoco el codominio será un con junto demasiado grande. Este axioma lo propusieron de manera independiente A. Fraenkel y Th. Skolem en 1922. En una forma algo diferente ya había sido sugerido por D. Mirimanoff en 1917. Este axioma es necesario para asegurar la existencia de con juntos infinitos de cardinalidades grandes (como ℵω ), que ya se encuentran en la teoría de Cantor. También es indispensable para probar diversos teoremas de la aritmética de los números ordinales, que requieren el método general de inducción transfinita. Ax8. Axioma de fundamentación: Todo
conjunto no vacío x contiene al menos un elemento cuyos elementos no pertenecen a x . ∀ x ( ∃ y ( y ∈ x ) → ( ∃ y ( y ∈ x & ¬ ∃ z ( z ∈ y & z ∈ x )))).
Una forma más intuitiva de escribir este axioma, empleando términos definidos de la teoría de conjuntos, es la siguiente: ∀ x (( x ≠ ∅ ) → ( ∃ y ( y ∈ x ) & ( y ∩ x = ∅ ))). El significado de este axioma, también llamado axioma de regularidad, es que los conjuntos están bien fundados con respecto a la relación de pertenencia, de modo que pueden disponerse en capas o estratos: individuos, conjuntos de individuos, conjuntos de conjuntos de individuos, y así sucesivamente. Una consecuencia de este axioma es que no existen conjuntos que pertenecen a sí mismos, es decir, no hay ningún conjunto a tal que a ∈ a. Tampoco hay con juntos a y b tales que ( a ∈ b ) & ( b ∈ a ); ni secuencias (finitas o infinitas) de conjuntos tales que a ∈ b ∈ c ... ∈ a. 124
L A
TEORI´ A DE CONJUNTOS CONJUNTOS
Ax9. Axioma de elección. Todo Todo conjun conjunto to de conju conjunto ntoss no vací vacíos os tiene tiene una función de elección.
◊ Una Una funció función n de elecci elección ón sobre sobre un conjun conjunto to de conjun conjuntos tos no vacío vacíoss a es una función f cuyo dominio es a, tal que para todo x ∈ a, f ( x ) ∈ x . ∀t ( ∀ x ( x ∈ t → ∃ z ( → ¬ ∃ z ( z ∈ x & ( z ∈ x ) & ∀ y ( ( y ∈ t & y ≠ x → & z ∈ y ))) → ∃u ∀ x ( x ∈ t → ∃w ∀v ( v = w ↔ ( v ∈ u & v ∈ x )))). El significado intuitivo de este axioma es que dado un conjunto de conjuntos no vacíos, existe un conjunto selectivo que se obtiene eligiendo exactamente un elemento de cada elemento del conjunto de partida. Esto es, si a es un con junto de conjuntos tal que ∅ ∉ a, entonces, existe el conjunto c tal que, para cualquier x ∈ c, la intersección c ∩ x tiene exactamente un elemento.
El ax axio ioma ma de el elec ecció ción n y su sus s di difi ficu cult ltad ades es Este axioma tiene una larga y debatida historia y ha sido examinado con mucho detalle. Aquí sólo podemos limitarnos a algunas observaciones importantes. La primera formulación explícita del axioma de elección la hizo G. Peano en 1890, 1890, aun aunque que el axioma axioma ya lo había había usado usado Cantor Cantor,, sin recono reconocer cerlo lo como como un princi principio pio.. En 1904 1904 Zermel Zermelo o lo utiliz utilizó ó en su céleb célebre re demost demostra ració ción n del teorem teorema a del buen orden, según el cual todo conjunto puede ser bien ordenado (un con junto está bien ordenado cuando todo subconjunto no vacío tiene primer elemento). En 1908 Zermelo lo incluyó entre sus axiomas para la teoría de conjuntos. tos. Desde Desde ese moment momento o se lo recono reconoce ce como como un princi principio pio indisp indispens ensabl able e para para la matemática, porque es necesario para probar diversos teoremas básicos de la aritmética. Pronto se probó que el teorema del buen orden y el axioma de elección son lógicamente lógicamente equivalentes. equivalentes. Posteriorment Posteriormente, e, se descubrieron descubrieron muchos otros otros teore teorema mass de la teoría teoría de conjun conjuntos tos que son equiva equivalen lentes tes al axioma axioma de elecci elección, ón, por ejempl ejemplo, o, el princi principio pio maxim maximal al de Hausdo Hausdorff rff (1914) (1914),, el lema lema de Zorn (1935) y el lema de Tukey-Tei Tukey-Teichmü chmüller ller (1939-40) (1939-40) (para (para referenc referencias ias preciprecisas sobre este punto véase la bibliografía indicada al final de este capítulo). El axioma de elección no es, a diferencia de otros axiomas de ZF, una instancia del principio de comprensión. Es un postulado puramente existencial que afirma la existencia de un conjunto sin caracterizarlo como la extensión de una propieda propiedad d previame previamente nte especifica especificada. da. Esto lo hizo sospechos sospechoso o para muchos matemáticos temáticos,, especialm especialmente ente intuicionist intuicionistas as o constructi constructivista vistas. s. En efecto, efecto, el axioma axioma no indica cómo construir el conjunto selectivo. Dado un conjunto de conjuntos
125
EORI´ AS AS T EORI
AXIOMATIZADAS
hay muchas maneras de elegir un elemento de cada elemento para formar el conjunto selectivo. Por otra parte, pronto se advirtió que tenía consecuencias contrai raintuitivas. Una de ellas es la llamada parad radoja de Banach y Tarski (de (descubierta por estos autores en 1924), la cual, entre otras cosas, tiene como consecuencia que es posible descomponer una esfera en un número finito de partes congrue ruentes y luego reunirlas para ara formar otra esfer fera cuyo rad radio es el doble del radio de la esfera orig riginal. Durante mucho tiempo se pensó que el axioma de elección (y sus equivalentes) podía deducirse de los res restantes axiomas de ZF. Ahora sabemos que esto es posible cuando se trata de conjuntos finitos, pero no para el caso de con juntos infinitos. Hay dos hitos fundamentales en el análisis de este axioma. En 1938 K. Gödel demostró la consistencia relati ativa del axioma de elección res respecto de los restantes axiomas de ZF. Esto es, si ZF es consistente, entonces, ZFE también lo es, lo cual prueba que la negación del axioma de elección no se deduce de los restantes axiomas de ZF. Dicho axioma puede tener consecuencias extrañas pero no introduce contradicciones en la teoría de conjuntos. Por su parte, en 1963 P. Cohen probó que el axioma de elección no se deduce de los demás axiomas de ZF. Por con consiguiente, la negación del axioma de elección tampoco lleva a contradicciones, de modo que si ZF es consistente, también lo es ZF & ¬E. Así, Cohen demostró que el axioma de elección es independiente de los restantes axiomas de ZF. De allí se sigue que es posible construir teorías de conjuntos alternativas, con y sin el axioma de elección, las cuales serán ambas consi nsistentes, supo uponie niendo que ZF lo sea. Conjuntame amente nte, los resultado ados de Gödel y de Cohen implican que el axioma de elección no puede ser probado ni refutado mediante los recursos de la teoría de conjuntos ZF. Constituye una una prop propoosici sición ón form formal alm mente nte inde indeci cidi dibl blee para ara est esta teor teoría ía.. En este ste aspe aspect cto, o, la situación es comparable a la de la existencia de diferentes geometrías euclídeas y no euclídeas, que se obtienen negando el axioma de las paralelas (del cual también sabemos que es independiente de los otros axiomas euclídeos). Si nos preguntamos cuál de las teorías de conjuntos (ZFE o ZF ¬E) es la correcta o verdadera, la respuesta es que no sabemos cómo determinarlo, o incluso podemos dudar de si tal pregunta tiene sentido. Propiedades generales de la teoría de conjuntos
Para Para conc conclu luir ir,, pode podemo moss repa repasa sarr brev brevem emen ente te las las prop propie ieda dade dess meta metate teór óric icas as coconoci nocida dass de la teo teoría ría de Zerme rmelolo-Frae Fraenk nkeel. La consistencia absoluta de ZF no ha sido probada. Ya hemos dicho que, como consecuencia del segundo teorema de Gödel, no es posible demostrar la cons consis iste tenc ncia ia de este ste sis sistem tema median diante te recu recurs rsoos form formal aliz izab able less dent dentro ro del del mism ismo (véase el Apéndice 1). Toda prueba absoluta de consistencia de ZF (o de cual126
L A
TEORI´ A A DE CONJUNTOS
qui quier otro tro siste istema ma axio axiom mátic áticoo de conj conjun unto tos) s) debe deberá rá hace acerse rse emple mplean ando do otro otro sis sistema formal cuya consistencia será, por lo menos, igualmente dudosa. Un ejemplo de este tipo de prueba es el ofrecido por Quine, de acuerdo con el cual se puede probar en el sistema de su Mathematical Logic (Quine 1951) que ZF es consistente. El sistema de Quine es más potente que ZF, pero su consistencia no está asegurada. Hay muchas pruebas relativas de la consistencia de ZF, o de partes de él, respecto de otros sistemas formales. La más importante es la obtenida de manera independiente por I. Novak y por B. Rosser y H. Wang en 1950, quienes demostraron que si el sistema ZF es consistente, entonces también lo es el sistema VNBG (Von Neumann, Bernays y Gödel). Esto implica que no puede ocurrir que VNBG sea inconsistente y ZF no lo sea. ZF es incompleto, suponiendo que sea consistente. Esta es una consecuencia del prim rimer teorema de Gödel, que prue rueba que cual cualqquier sistema axiomático formal que contenga a la aritmética elemental (como es el caso de ZF), si es cons consis iste tent nte, e, ento entonc nces es es inco incomp mple leto to.. ZF es indecidible. Esta es una consecuencia del hecho de que ZF contiene a la aritmética elemental. Church demostró en 1936 que la arit ritmética elemental es indec decidible. Por consiguiente, también será indecidible todo sistema formal que que perm permititaa expr expres esar ar a la arit aritm mética tica ele elemental ntal.. ZF no es categórico. Los axiomas del sistema postulan la existencia de con juntos infinitos y aseguran la posibilidad de construir conjuntos infinitos de con juntos infinitos, y así sucesivamente. Por tanto, si ZF tuviera algún modelo, el dominio de ese modelo debería ser infinito, esto es, tener infinitos elementos. Ya hemos visto que ningún sistema de primer orden que tenga modelos infinitos puede ser categórico. Esta es una consecuencia de la versión ascendente del teorema de Löwenheim y Skolem (véase el Capítulo 4.1). Los axiomas de ZF no son todos independientes entre sí. El axioma de los pares res se deduce de los axiomas de reemplazo azo y del con conjunto potencia. Además, el axioma de separación se deduce del axioma de reemplazo. El propio Zermelo dem demostró stró estos stos resu resultltad ados os en 193 1930. Los Los rest restan ante tess axi axiomas omas son son todo todoss inde indepe penndientes. El sistema axiomático de Zermelo-Fraenkel ha sido siempre el preferido por la mayoría de los matemáticos profesionales hasta la actualidad. No obstante, como dijimos en el Capítulo 1, existen muchas otras ras axiomatizaciones de la teoría de conjuntos, las cuales no son equivalentes entre sí. La alternativa más imp o r t a n t e a l s i s t e ma Z F e s el s i s t em a d e V o n N e u ma n n , B er n a y s y G ö d e l (VNBG), cuyos axiomas no vamos a exponer aquí (véanse las referencias al final de este capítulo). La teoría VNBG parece en primera instancia muy diferente del sistema ZF porque admite la existencia de conjuntos muy grandes, tales como la clase universal, que no pueden construirse en el sistema ZF. A estos conjuntos se los denomina clas clases es últi última mass porque no pueden a su vez ser 127
EORI´ AS AS T EORI
AXIOMATIZADAS
elementos de otros conjuntos. Sin embargo, una vez que se estudiaron las propiedades metateóricas de este sistema y sus relaciones con el sistema ZF, se advirtió que las diferencias no son en realidad tan grandes. Ante todo, el sistema VNBG es finitamente axiomatizable, mientras que ZF no lo es porque no puede axiomatizarse sin emplear al menos un esquema de axioma. También se probó, como ya dijimos, la consistencia relativa de VNBG respecto de ZF, de modo tal que si ZF es consistente, VNGB también lo es. Finalmente, el resultado más importante fue la prueba de que el sistema VNBG es una exte extens nsió ión n con- con- servativa (véase el Capítulo 6.2) del sistema ZF, esto es, si χ es una fórmula de ZF, entonces, si χ es un teorema de VNBG, es también un teorema de ZF. Otro Ot ros s si sist stem emas as ax axio iomá máti tico cos s
Existen muchos otros sistemas axiomáticos para la teoría de conjuntos, de los cuales mencionaremos solamente los de W. Quine y A. Morse, formulados por primera vez en 1937 y 1955, respectivamente. El sistema de Quine, conocido como New Foundations o NF, se basa en la estra stratitififica caci ción ón del del lengu enguaj ajee en dife difere rent ntees nive nivele less jerá jerárq rqui uico cos. s. La idea dea de estr estrat atiificación de una fórmula es la siguiente. En una fórmula estratificada ϕ( y ) cada variable de ϕ( y ) lleva como rótulo un número entero, de tal manera que en toda fórmula atómica que sea parte de ϕ( y ) y tenga la forma x ∈ y , el número y es el sucesor del número que rotula a x x . En un lenguaje estratique rotula a y ficado de este tipo se evitan las paradojas como la de Russell, ya que una fórmula ula com como ϕ = x ∉ x no se puede construir porque no está estratificada. Con x : x ∉ x }. Los axiomas del sistema NF son siguientemente, no existe la clase { x variantes de los principios de extensionalidad y de comprensión empleados por Cantor: Ax1. ∀( xy ) ( ∀ z ( z ∈ x ↔ ↔ z ∈ ∈ y ) → ∀u ( x ∈ ∈ u ↔ y ∈ ∈ u ) [Axioma de extensionalidad]. Ax2. ∃ x ∀ y ( y ∈ x ↔ ϕ( y ))
(donde ϕ( y ) es una fórmula estratificada cua cualquiera en la que x no apar apareece libr libre) e) [Axi [Axiom omaa esqu esquem emaa de comp compre rens nsió ión] n]..
El sistema de Quine permite deducir una parte rte importa rtante de la matemáti ática. Sin embargo, E. Specker demostró en 1953 que dicho sistema admite la refutación del axioma de elección, lo cual lo hace muy poco interesante para los matemáticos, dada la importancia de este axioma en la matemática actual. La con-
128
L A
TOPOLOGI´ A GENERAL
sistencia del sistema de Quine no ha sido probada, como ocurre con todas las teorías de conjuntos. El sistema de Morse lo presentó inicialmente J. Kelley en un libro de texto sobre topología general (Kelley 1955). Se trata de una variante del sistema VNBG, variante que consiste en admitir que para toda fórmula ϕ( x ) es posible formar la clase { x : ϕ( x )}. Emplea ocho axiomas, entre los cuales se encuentra el axioma de elección, y un esquema de axioma. Es una teoría de conjuntos sumamente potente, acerca de la cual se ha demostrado que no es una extensión conservativa de ZF. En la teoría de Morse se puede demostrar la propia consistencia de ZF. Por supuesto, la consistencia del sistema de Morse no se ha probado, y, dado que se trata de una teoría más potente que ZF, su propia consistencia es aun más dudosa que la de ZF. 5.3 La topología general
La topología general o topología de conjuntos de puntos es una rama de la matemática que estudia las propiedades del espacio que se conservan cuando se realizan transformaciones continuas. Esta es una caracterización algo inexacta, que enseguida haremos más precisa. Por el momento, consideremos algunos ejemplos. Una esfera y un cubo son topológicamente equivalentes, es decir, tienen las mismas propiedades topológicas, porque es posible obtener uno de estos cuerpos deformando de manera continua el otro (esto es, sin cortar partes unidas ni unir partes separadas). En cambio, un toroide (un cuerpo con la forma de una dona o una cámara de neumático) no es topológicamente equivalente a una esfera o un cubo. Ninguna deformación continua de una esfera o un cubo puede producir un toroide, ni a la inversa. La esfera y el toroide tienen algunas propiedades topológicas muy diferentes. Por ejemplo, si se traza una circunferencia sobre la superficie de una esfera, siempre es posible trazar otra circunferencia dentro de ella, que tenga el mismo centro pero un radio menor. Sobre la superficie de la esfera no existen circunferencias de radio mínimo. Sobre la superficie de un toroide, en cambio, hay algunas circunferencias que no pueden contraerse más allá de un radio determinado, como ocurre con las que rodean al agujero central. Las transformaciones topológicas, llamadas homeomorfismos, son las que preservan la continuidad de los puntos del espacio o de cualquier conjunto de puntos en general. No siempre conservan la distancia entre puntos, ni los ángulos, ni el paralelismo entre rectas. Hay, sin embargo, muchas propiedades que permanecen invariantes cuando se deforma de manera continua un cuerpo o una figura. Por ejemplo, el número de dimensiones del respectivo cuerpo o figura. La topología general se ocupa de estudiar estas propiedades invariantes y la manera en que se relacionan entre sí. 129
T EORI´ AS
AXIOMATIZADAS
La topología general, o topología de conjuntos de puntos, es una de las aplicaciones más fructíferas de la teoría de conjuntos de G. Cantor. Muchos de los teoremas fundamentales de esta disciplina los descubrió el propio Cantor en las décadas de 1880 y 1890. La primera axiomatización de la topología general la realizó F. Hausdorff en su célebre libro Fundamentos de la teoría de conjuntos publicado en 1914 (véase el Apéndice 2.15), obra que contribuyó notablemente a la aceptación de la teoría de conjuntos por parte de la comunidad de los matemáticos. Después se propusieron muchas axiomatizaciones diferentes, todas equivalentes entre sí, que empleaban términos primitivos distintos de los de Hausdorff. Durante la primera mitad del siglo XX la topología de conjuntos de puntos se desarrolló vigorosamente, hasta convertirse en la base (esto es, en un presupuesto necesario) no sólo de la geometría, sino también del análisis y de otras ramas de la matemática. Una de las razones de tal desarrollo es que la topología general presupone una parte relativamente elemental y segura de la teoría intuitiva de conjuntos. Una parte que parece estar a salvo de la amenaza de las paradojas o contradicciones que acechan a la teoría de conjuntos tomada en su totalidad. Aquí sólo ofreceremos los axiomas más habituales que se emplean para definir la estructura de espacio topológico, junto con las definiciones de algunos términos importantes de la topología general. Definiremos, entonces, la noción de homeomorfismo, que acabamos de emplear de manera informal. Luego caracterizaremos mediante axiomas específicos otros espacios topológicos, como el espacio de Hausdorff, el espacio regular y el espacio normal. Para concluir, introduciremos la definición axiomática del concepto de espacio métrico. Los espacios topológicos
Los conceptos fundamentales de la topología general son los de conjunto abierto, conjunto cerrado y entorno de un punto. En la mayoría de las axiomatizaciones corrientes de la topología uno de estos términos se toma como primitivo y los otros dos se introducen como términos definidos. Aquí seguiremos la práctica más usual y tomaremos “conjunto abierto” como término primitivo. La lógica subyacente del sistema será (una parte de) la teoría intuitiva de conjuntos. Con estos elementos definiremos la noción de espacio topológico de la siguiente manera: ◊ Si E es un conjunto no vacío de elementos cualesquiera, y T es una familia de conjuntos abiertos tal que T ⊆ ℘ E , 〈 E , T 〉 es un espacio topológico si y
sólo si cumple con los siguientes axiomas:
130
L A
TOPOLOGI´ A GENERAL
Ax1. E ∈ T . Ax2. ∅ ∈ T . Ax3. Si A y B ∈ T , entonces, A ∩ B ∈ T . Ax4. Si A1, A2, ... Ak ∈ T , entonces A1 ∪ A2 ∪ … ∪ A k ∈ T . Estos axiomas afirman que el espacio E y el conjunto vacío ∅ son dos con juntos abiertos que pertenecen a la familia de conjuntos T . Que la intersección de dos conjuntos cualesquiera de T también pertenece a T. Y que la unión de cualquier número finito o infinito de conjuntos de T también pertenece a T . Los elementos de E se llaman, convencionalmente, puntos. La familia de con juntos abiertos T se llama una topología de E. Se dice, entonces, que T topolo- giza a E . Hay diversas maneras de topologizar un conjunto de puntos como E . Si la topología T contiene a todos los subconjuntos de E (esto es, si T = ℘ E ), la topología se llama discreta. Si, en cambio, T contiene solamente al conjunto vacío y a sí mismo (esto es, si T = {∅, T }), la topología se llama indiscreta o trivial . Las topologías discreta e indiscreta de E son, respectivamente, las topologías máxima y mínima de E . Toda topología de E está contenida en la topología discreta y, además, toda topología de E contiene a la topología indiscreta. Dadas dos topologías T 1 y T 2 de un mismo conjunto E tales que T 1 ⊆ T 2 , se dice que T 2 es más fina que T 1 y que T 1 es más gruesa que T 2 . Si T 1 T 2 y T 2 T 1, se dice que T 1 y T 2 no son comparables. Como puede advertirse por estas definiciones, la topología discreta es la más fina de todas las topologías posibles de un conjunto de puntos, mientras que la topología indiscreta es la más gruesa. Una topología más fina que otra contiene más conjuntos que aquélla y posee, por así decir, un mayor poder de resolución, tal como una fotografía de grano fino de un objeto respecto de otra de grano grueso del mismo ob jeto. La topología de un conjunto E se puede especificar describiendo la colección completa T de conjuntos abiertos. Dado que, en general, es bastante difícil hacer esta descripción completa, usualmente se especifica una colección más pequeña de subconjuntos de E que tiene la capacidad de definir a la topología T en su totalidad. Se la llama la base de T y se la define de esta manera: ◊ Dado un espacio topológico 〈 E, T 〉, una base para la topología T es una
familia B de subcon juntos de E (llamados elementos bá sicos ) tales que: (i) Para todo punto x ∈ E hay al menos un elemento básico B tal que x ∈ B ¸ (ii) para todo punto x ∈ E, si x ∈ B 1 ∩ B 2 entonces, existe un elemento básico B 3 tal que x ∈ B 3 y B 3 ⊆ B 1 ∩ B 2 .
131
T EORI´ AS
AXIOMATIZADAS
se llama una base para la topología T y se dice que T es generada por B . Una consecuencia de la definición anterior, que no probaremos ahora, es que B es una base para T si y sólo si todo elemento de T es una unión de elementos de B . Esta propiedad a veces se utiliza como definición de base. Hay también otras definiciones posibles, que pueden encontrarse en la bibliografía sobre el tema. Los términos con junto cerrado y entorno se introducen por definición de la siguiente manera: B
De finición 1.
A es un con junto cerrado si y sólo si E ~ A es un con junto abierto (para todo A ⊆ E ).
De finición 2. U x es un entorno i) U x ⊆ E .
del punto x si y sólo si,
ii) Hay un con junto abierto iii) x ∈ U’ x .
U’ x tal
que
U’ x ⊆ U x .
La primera definición afirma que un con junto cerrado es el complemento de un con junto abierto, de modo que si A es abierto en E , ~ A es cerrado, y vice versa. El con junto vacío ∅ y el espacio E son a la vez abiertos y cerrados. En efecto, según el axioma 1, E es abierto, y, según la definición 1, su complemento ∅ es cerrado. Pero, de acuerdo con el axioma 2, ∅ es abierto y, por la misma definición 1, su complemento E es cerrado. La segunda definición afirma que el entorno de un punto es un con junto que contiene un con junto abierto al cual pertenece ese punto. Según esta definición, un entorno puede ser tanto un con junto abierto como un con junto cerrado. Por otra parte, todo con junto abierto es entorno de cada uno de sus puntos. Más aun, puede probarse como teorema que un con junto es abierto si y sólo si es entorno de cada uno de sus puntos. La topología general habitualmente emplea muchos otros términos definidos, como “clausura”, “interior”, “frontera”, “punto de acumulación” y otros, cu yas definiciones no necesitamos dar aquí, pero pueden encontrarse en cualquier tra tado de topología (véase la nota bibliográfica al final de este capítulo). La transformación entre espacios topológicos que preser va la continuidad en tre los puntos de cada espacio se denomina homeomor fismo. Un homeomorfismo es una función bi yecti va y bicontinua (véase el Apéndice 3 para la caracterización de estos conceptos) entre dos espacios topológicos. Se la define de la siguiente manera:
132
L A
TOPOLOGI´ A GENERAL
◊ Un homeomor fismo es una función de un espacio topológico A en un espa cio topológico B ( ƒ: A → B ) tal que:
i) ƒ es bi yecti va. ii) ƒ es continua. iii) ƒ -1 es continua. La topología general puede caracterizarse como el estudio de las propiedades geométricas del espacio, o más en general, de con juntos de elementos cualesquiera, que son in variantes ba jo homeomorfismos. Definamos ahora la noción de
es pacio de Hausdorff .
◊ Un espacio topológico 〈 E , T 〉 es un es pacio de Hausdorff si y sólo si satis-
face el siguiente axioma:
Ax5. Si x e y son dos puntos cualesquiera de E tales que x ≠ y , existen dos entornos de x e y , U x , U y , tales que U x ∩ U y = ∅. Este axioma, introducido por F. Hausdorff, es uno de los llamados axiomas de separación. Por esta razón, el espacio de Hausdorff se llama también es pacio se parado. El axioma afirma que para dos puntos diferentes cualesquiera existen dos entornos dis juntos de esos puntos. Como es ob vio por la propia definición, todo espacio de Hausdorff es un espacio topológico, pero no a la in versa. Otros espacios topológicos separados son el es pacio re gular y el es pacio nor - mal , a los que definiremos de la siguiente manera: ◊ Un espacio topológico 〈 E, T 〉 es un es pacio re gular si y sólo si satisface el
siguiente axioma:
Ax6. Para todo punto x ∈ E y todo con junto cerrado A ⊆ E tal que x ∉ A, existen dos con juntos abiertos, U x y O, tales que x ∈ U x , A ⊆ O y U x ∩ O = ∅. ◊ Un espacio topológico 〈 E, T 〉 es un es pacio normal si y sólo si satisface el
siguiente axioma:
Ax7. Para todo par de con juntos cerrados A, B ⊆ E tales que A ∩ B = ∅, exis ten dos con juntos abiertos, O1 y O 2 , tales que A ⊆ O1, B ⊆ O 2 y O1 ∩ O 2 = ∅.
133
T EORI´ AS
AXIOMATIZADAS
Los axiomas Ax6 y Ax7 son axiomas de separación más fuertes que el axioma de Hausdorff Ax5, en el sentido de que ambos lo implican, pero no son implicados por éste. Como es evidente por las definiciones, todo espacio regular es un espacio de Hausdorff y todo espacio normal es un espacio regular. Los tres axiomas de separación expresan de manera precisa las nociones intuiti vas de pro ximidad y separación entre puntos del espacio. Los espacios métricos
La noción de espacio métrico la introdu jo M. Fréchet en 1906 como parte de su estudio de los “espacios abstractos”, como se los llamaba en ese momento. El nombre “espacio métrico” se debe a F. Hausdorff (Hausdorff 1914, p. 211). Intuiti vamente, un espacio métrico es un con junto de ob jetos donde está determinada la distancia entre dos elementos cualesquiera de ese con junto. Un espacio métrico es un con junto de ob jetos cualesquiera E , entre los cua les se define una función binaria que a cada par ordenado 〈a, b〉 de elementos de E le asigna un número real. La distancia δ es esta función que asigna un número real a cada par de puntos pró ximos del con junto E ( δ: E x E → ). Co mo lógica sub yacente se emplea, como es habitual en casi todas las teorías matemáticas axiomatizadas, la teoría intuiti va de con juntos. En el lengua je formal, la función distancia está representada por un funtor de segundo grado ƒ 2 ( xy ), pero aquí lo escribiremos simplemente como δ( x, y ). Las condiciones que debe cumplir la función distancia están dadas por los axiomas. Tomando como primiti vo al término “distancia” se puede definir el concepto de es pacio métrico de la siguiente manera: ◊ Si E es un con junto no vacío de elementos cualesquiera, y δ es una función binaria que asigna un número real a cada par de elementos de E ( δ: E x E → ), 〈 E , δ〉 es un es pacio métrico si y sólo si satisface estos axiomas:
Ax1. δ( x, y ) = 0 ↔ x = y. Ax2. ( δ( x, y ) + δ( y, z ) ≥ δ( z, x )). Los elementos de E se llaman, con vencionalmente, puntos. El número real δ( x, y ) se denomina la distancia entre los puntos x e y . La función δ se llama la métrica o función distancia de E . El primer axioma afirma que la distancia entre dos puntos sólo es igual a cero cuando esos dos puntos son idénticos, de modo que siempre ocurre que δ( x, x ) = 0. El segundo axioma, llamado axioma de de si gualdad trian gular , dice que la distancia sobre uno de los lados de un triángulo es siempre menor o igual que la suma de las distancias sobre los otros dos lados. O, de manera más ge-
134
L A
TOPOLOGI´ A GENERAL
neral, que la distancia entre dos puntos cualesquiera nunca es ma yor que la suma de las distancias de cada uno de ellos respecto de un tercer punto. Generalmente, δ( z, x ) es menor que δ( x, y ) + δ( y, z ). En ambos axiomas, todas las variables deben considerarse cuantificadas uni versalmente (es decir, para todo x, y, z ∈ E ), aunque en la práctica matemática usualmente se omiten estos cuantificadores. A menudo se inclu yen en la definición de espacio métrico otros dos axiomas: el de simetría ( δ( x, y ) = δ( y, x )), que afirma que la distancia entre dos puntos es simétrica; y el de po sitividad ( δ( x, y ) ≥ 0), que afirma que la distancia entre dos puntos nunca es negati va. Sin embargo, estos axiomas no son independientes de los dos anteriores, por lo que su inclusión es redundante. Probaremos ahora que estos axiomas se deducen de Ax1 y Ax2. Teorema 1 δ( x, y ) Demostración:
1. 2. 3. 4. 5. 6. 7. 8. 9.
= δ( y, x ).
δ( x, y ) ≤ δ( y, z ) + δ( z, x ) δ( x, y ) ≤ δ( y, x ) + δ( x, x ) δ( x, x ) = 0 δ( x, y ) ≤ δ( y, x ) δ( y, x ) ≤ δ( x, w ) + δ( w, y ) δ( y, x ) ≤ δ( x, y ) + δ( y, y ) δ( y, y ) = 0 δ( y, x ) ≤ δ( x, y ) δ( x, y ) = δ( y, x )
Teorema 2 δ( ) ≥ x, y Demostración:
1. 2. 3. 4. 5. 6.
[De [De [De [De [De [De [De [De [De
Ax2] 1, sustitu yendo z por x ] Ax1] 2 y 3] Ax2] 5, sustitu yendo w por y ] Ax1] 6 y 7] 4 y 8]
0.
δ( z, x ) ≤ δ( x, y ) + δ( y, z ) δ( x, x ) ≤ δ( x, y ) + δ( y, x )
0 ≤ δ( x, y ) + δ( y, x ) δ( x, y ) = δ( y, x ) 0 ≤ 2δ( x, y ) δ( x, y ) ≥ 0)
[De Ax2] [De 1, sustitu yendo z por x ] [De 2 y Ax1] [Teorema 1] [De 3 y 4] [De 5]
135
T EORI´ AS
AXIOMATIZADAS
El espacio euclídeo es el ejemplo más conocido de un espacio métrico. En dos dimensiones, es decir, en el plano euclídeo la distancia entre dos puntos se define como: δ( x, y ) = ( x 1 - y 1 )2 + ( x 2 - y 2 )2. En un número n de dimensiones la función distancia tiene la siguiente forma general: δ( x, y ) = ∑ni =1 ( x i - y )i 2. Hay muchos otros espacios métricos, como, por ejemplo, el con junto de los números reales , donde la función distancia se define como: δ( x, y ) = x - y . Todo espacio métrico es un espacio de Hausdorff. Este teorema fundamental puede probarse cuando se admite como entorno de cada punto x de un espacio métrico a una es fera abierta que contiene a x . Una esfera abierta es el subcon junto de todos los puntos de E tales que δ( x, y ) < r , donde r es un nú mero real positi vo. Los entornos de E constituidos por las esferas abiertas de E satisfacen los cuatro axiomas que definen un espacio de Hausdorff. La relación entre espacios topológicos y espacios métricos constitu ye uno de los capítulos principales de la topología general, pero ese es un tema que excede los alcances de este libro. 5.4 La teoría de la probabilidad
Consideremos ahora un ejemplo de un sistema axiomático formulado en un lengua je no formalizado, tal como la teoría matemática de la probabilidad, axiomatizada por primera vez en 1933 por el gran matemático ruso A. Kolmogorov. Nos detendremos con más detalle en esta teoría con el fin de obser var en acción el desarrollo de una teoría axiomática formal expuesta en un lengua je no formalizado. Además de exponer los axiomas del sistema, presentaremos varios teoremas importantes, de los cuales sólo daremos la demostración de uno. Comencemos, ante todo, presentando de manera intuiti va los conceptos fundamentales del lengua je de esta teoría. “Evento” y “probabilidad” son términos primiti vos de la teoría. Denotamos los tipos de eventos con letras ma yúsculas, como A, B y C . La probabilidad de que ocurra un evento A la escribiremos como P( A ). Introducimos también un evento especial Ω , al que llamamos espacio de muestra. El espacio de muestra Ω se puede caracterizar como el con junto de todas las posibilidades o de todos los eventos elementales. Por ejemplo, si el evento en cuestión consiste en arro jar un dado, puede ocurrir que el resultado sea E 1 = un uno, o bien E 2 = un dos, y así hasta seis. Ω contendrá, entonces, las seis posibilidades o posibles resultados de una tirada, Ω = { E 1, E 2 , E 3, E 4, E 5 , E 6 }. Por su parte, los eventos, A, B, C, etc., son subcon juntos del espacio de muestra Ω . Es fácil ad vertir que Ω es un evento cierto o necesario, ya que al tirar un dado siempre ocurrirá algún evento que está incluido en Ω , o sea, siempre saldrá un número comprendido entre uno y seis. Por su parte, denotamos como ∅ al evento que es imposible que ocurra, al cual lo definimos como el complemento del evento necesario Ω ( ∅ = ~Ω ). En nuestro ejemplo, ocurriría 136
L A
TEORI´ A DE LA PROBABILIDAD
∅ si al tirar un dado no saliera un número entre uno y seis, lo cual es ob via-
mente imposible. Ω puede tener un número finito o infinito de elementos, pero comenzaremos por el caso en que Ω es finito. Los eventos son con juntos. El evento elemental A que consiste, por ejemplo en obtener un as en una tirada será A = {1}; mientras que el evento compuesto B consistente en obtener un número impar en una tirada será B = {1, 3, 5}. Finalmente, Ω ha de ser Ω = {1, 2, 3, 4, 5, 6}. El espacio de muestra Ω es el con junto de todos los resultados posibles en un determinado contexto o uni verso de discurso. Un evento, en general, es un con junto de resultados posibles que es un subcon junto del espacio de muestra. Dado que los eventos son con juntos, podemos introducir entre ellos las operaciones de intersección ( ∩ ), unión ( ∪ ) y complemento (~). A ∩ B afirma que los eventos A y B ocurren simultáneamente. A ∪ B afirma que ocurre el evento A o el evento B (o bien ambos a la vez). Por último, ~ A afirma que no ocurre el evento A. Los eventos A y ~ A son eventos opuestos, ya que son exclu yentes entre sí y no pueden ocurrir ambos a la vez. Cumplen, por tanto, las siguientes le yes: i) A ∩ ~ A = ∅; y ii) A ∪ ~ A = Ω ; le yes en las que el lector reconocerá a los tradicionales principios lógicos de no contradicción y de tercero excluido. Dos eventos A y B se llaman dis yuntos cuando no pueden ocurrir si multáneamente, es decir, cuando A ∩ B = ∅. La probabilidad es una función que asigna a cada evento un único número real r comprendido entre cero y uno. La expresión P( A ) = r afirma que la probabilidad de que ocurra el evento A es igual al número r . La teoría matemática de la probabilidad se hallaba ya ampliamente desarrollada cuando Kolmogorov consiguió axiomatizarla después de varios intentos fallidos de otros matemáticos (véase el Apéndice 2.18 para la formulación original). Aquí presentaremos una versión simplificada de ese sistema, que se debe al propio Kolmogorov, y emplea sólo tres axiomas. La lógica sub yacente del sistema es la teoría intuiti va de con juntos y el lengua je en el que se lo formula no está formalizado. El espacio de muestra Ω es un con junto no vacío que contiene un número finito de eventos elementales. La teoría aquí axiomatizada es la teoría de la probabilidad con aditi vidad finita. Axiomas
Ax1. Para todo evento A, 0 ≤ P( A ) ≤ 1. Este axioma, llamado axioma de normalización, establece que la probabilidad es una magnitud normalizada, esto es, que sólo puede tomar como valores a los números reales positivos comprendidos entre 1 y 0. La elección de este particular
137
T EORI´ AS
AXIOMATIZADAS
intervalo es puramente convencional y se funda en razones de simplicidad. Es un axioma que contiene información redundante, ya que puede reemplazarse, como hacen muchos autores, por otro axioma más débil, el de positividad , según el cual, para todo evento A, P ( A ) ≥ 0, esto es, que la probabilidad de cualquier evento es siempre un número positivo. De este axioma, junto con los otros dos que siguen, puede deducirse como teorema que para todo evento A, P ( A ) ≤ 1, y de las dos últimas fórmulas se sigue evidentemente el axioma A x 1. Ax2. Para todo espacio de muestra Ω , P( Ω ) = 1. Este axioma nos dice que la probabilidad del evento necesario mero que es la cota superior de toda probabilidad.
Ω
es 1, nú-
Ax3. Para todo par de eventos dis yuntos A y B, P( ) = P( A ) + P( B ). A ∪ B Este axioma se puede generalizar a cualquier número finito de eventos A1... An, dis yuntos, de modo que, en general, P( A1 ∪ ... ∪ An ) = P( A1 ) + ... + P( An ). En él se afirma el carácter aditi vo de las probabilidades, es decir, el hecho de que las probabilidades se pueden sumar cuando los eventos son exclu yentes entre sí. Es el axioma de aditi vidad finita. Se lo conoce también como regla especial de adición. Teoremas básicos
Los tres axiomas de Kolmogorov permiten demostrar una gran cantidad de teoremas sobre probabilidad inicial o ab soluta. Se denomina de esta manera a la probabilidad de un evento respecto de un espacio de muestra cuando dicha probabilidad no depende de ningún otro evento de ese espacio de muestra. Se escribe como P( A/Ω ), pero si el espacio de muestra es el mismo para todos los eventos que estamos considerando podemos escribirla simplemente como P( A ). Algunos teoremas importantes sobre probabilidad absoluta son los siguientes: T1. P( ∅ ) = 0. La probabilidad del evento imposible es nula. T2. P( A ) + P(~ A ) = 1. La suma de las probabilidades de los eventos opuestos es igual a 1. T3. P(~ A ) = 1 - P( A ). 138
L A
TEORI´ A DE LA PROBABILIDAD
La probabilidad de un evento es igual a 1 menos la probabilidad del evento opuesto. Este teorema se conoce usualmente como la regla de negación y se sigue inmediatamente del teorema anterior por pasa je de términos. T4. Para cualquier par de eventos A y B , P( ) = P( A ) + P( B ) – P( A ∩ B ). A ∪ B Este es el teorema general de adición. A diferencia del Axioma 3, vale también para sumar las probabilidades de eventos no dis yuntos. Cuando A y B son dis yuntos, el teorema se reduce al Axioma 3, ya que en ese caso P( A ∩ B ) = 0. Es posible generalizar este teorema a cualquier número finito de eventos. T5. P( A ∩ B ) ≤ P( A ) + P( B ). La probabilidad de que dos eventos (dis yuntos o no) ocurran nunca es ma yor que la suma de las probabilidades de cada evento. Se sigue del teorema anterior y del Axioma 1. Dado que toda probabilidad es no negativa, P( A ∩ B ) ≥ 0. Introduciremos ahora la noción de probabilidad condicional . Se llama de esta manera a la probabilidad de un evento relati va a otro evento. La escribimos como P( A/ B ). En esta fórmula se expresa la probabilidad del evento A dado el hecho de que el evento B ha ocurrido (ocurre u ocurrirá), o, más simplemen te, la probabilidad condicional de A respecto de B . Se la define de la siguiente manera: P( A/ B ) = P( A ∩ B ) / P( B ), suponiendo que P( B ) ≠ 0. Esta es una definición lo suficientemente importante como para ocupar el lugar de cuarto axioma de la teoría de la probabilidad, como veremos más adelante. La probabilidad condicional de dos eventos que pertenecen a un espacio de muestra Ω se escribe de manera completa como P( A/Ω , B ), pero cuando presuponemos que el espacio de muestra es el mismo en todas nuestras fórmulas la escribimos simplemente como P( A/ B ). La probabilidad condicional nos permite definir la inde pendencia entre even tos. Decimos que dos eventos A y B son independientes cuando la ocurrencia o no ocurrencia de uno de ellos carece de efectos sobre el otro. Es decir, A y ) = P( A ). La independencia entre even B son independientes si y sólo si P( A/ B tos es recíproca: si A es independiente de B , éste también lo es de A. También vale para los eventos opuestos, es decir, si A es independiente de B , también lo es de ~ B . Estos conceptos se pueden ejemplificar considerando el evento que consiste en sacar cartas de un mazo. Si el mazo tiene 40 cartas la probabilidad inicial de sacar un as es de 4/40 = 1/10. Si vol vemos a colocar la carta extraída en el ma zo y mezclamos, la probabilidad de sacar otra vez un as seguirá siendo de 1/10.
139
T EORI´ AS
AXIOMATIZADAS
Ello es así, aunque a muchos jugadores les parezca extraño, porque la segunda extracción es independiente de que en la primera ha ya salido un as. En cambio, si retiramos el primer as del mazo, la probabilidad de obtener otra vez un as resulta ahora de 3/39. Este segundo evento ya no es independiente del primero. Prueba de ello es que si en la primera extracción no sale un as, las probabilidades cambian nue vamente. En ese caso, si retiramos la carta, la probabilidad de sacar un as en la segunda extracción es de 4/39. En la primera situación tenemos P( A/Ω ) = 1/10 como probabilidad inicial y una probabilidad condicional P( B /Ω , A ) = 1/10. En la segunda y tercera situación tenemos las mismas probabilidades iniciales, pero diferentes probabilidades condicionales P( B / Ω ' , A ) = 3/39, y P( B /Ω ' , C ) = 4/39, respecti vamente. En este ejemplo debemos especificar el espacio de muestra, ya que no es el mismo en todos los casos. Ahora podemos introducir en el sistema la definición de probabilidad condicional. De finición: P( A/ B )
= P( A ∩ B ) / P( B )
[Para P( B ) ≠ 0].
De esta definición, junto con los tres axiomas, se deducen di versos teoremas sobre la probabilidad condicional; entre ellos los siguientes: T6. Para todo par de eventos A y B , P( ) = P( B ) x P( A/ B ). [Para P( B ) ≠ 0]. A ∩ B Este es el teorema general de multiplicación, que nos da la probabilidad de que dos eventos cualesquiera, independientes o no, ocurran simultáneamente. Se sigue directamente de la definición de probabilidad condicional por pasa je de términos. Este resultado se puede extender a cualquier número finito de eventos. T7. Para todo par de eventos A y B , que sean independientes, P( A ∩ B ) = P( A ) x P( B ). Este es el teorema especial de multiplicación, que vale sólo para eventos in dependientes. Se sigue del teorema anterior y de la definición de independen cia entre eventos. T8. P( A ) = P( B ) x P( A/ B ) + P(~ B ) x P( A/~ B ). Este es el teorema de eliminación o de probabilidad total. Se puede genera lizar a cualquier número finito de eventos. T9. P( B / A ) = P( B ) x P(A/ B ) / P( A ). [Para P( A ) ≠ 0]. Este es el célebre Teorema de Ba yes, demostrado por el clérigo inglés Th. Ba yes y publicado póstumamente en 1763. 140
L A
TEORI´ A DE LA PROBABILIDAD
Otra forma equi valente de este teorema es la siguiente: P( B / A ) = P( B ) x P( A/ B ) / P( B ) x P( A/ B ) + P(~ B ) x P( A/~ B ). La equi valencia entre estas dos fórmulas se sigue del Teorema 8, reemplazando en el denominador del Teorema 9 la expresión P( A ) por su equi valente, que es la fórmula de probabilidad total. El teorema de Bayes es una consecuencia directa de la definición de probabilidad condicional y puede demostrarse de esta manera: 1. P( A/ B ) = P( A ∩ B ) / P( B )
[Por definición de P( A/ B )]
2. P( B / A ) = P(B ∩ A ) / P( A )
[Por definición de P( B / A )]
3. P( A ∩ B ) = P( A/ B )
x
P( ) B
[De 1, multiplicando por P( B )]
4. P( B ∩ A ) = P( B / A )
x
P( A )
[De 2, multiplicando por P( A )]
5. P( A ∩ B ) = P( B ∩ A ) 6. P( A/ B )
x
P( B )
= P( B / A )
7. P( B / A ) = P( A/ B )
x
P( B )
[Conmutati vidad de la operación ∩] x
P( A )
/ P( A )
[De 3 y 4, igualando los segundos miembros] [De 6, di vidiendo por P( A )]
El teorema de Ba yes es de especial importancia para el problema de la confirmacion de las hipótesis científicas. Toda una corriente epistemológica, llamada precisamente ba yesianismo, se apo ya en una aplicación de este teorema para calcular el grado de confirmación de una hipótesis respecto de una determinada evidencia. Para ello, se supone que los científicos asignan probabilidades a las hipótesis y teorías, y que esas probabilidades representan el grado de con firmación de tales hipótesis y teorías respecto de la evidencia disponible. El em pleo del teorema de Ba yes se hace reemplazando en la fórmula del teorema a la expresión B por el enunciado h, que representa una determinada hipótesis científica, y a la expresión A por el enunciado e, que representa una determinada evidencia empírica. El teorema toma, así, la siguiente forma: P( h/e ) = P( h ) x P( e/h ) / P( e ). Esta y otras formas equi valentes del teorema tienen numerosas aplicaciones epistemológicas, por ejemplo, para determinar el grado de confirma ción de dos o más hipótesis ri vales respecto de un mismo cuerpo de evidencia. 141
T EORI´ AS
AXIOMATIZADAS
En la axiomatización de Kolmogorov, que en lo esencial hemos seguido hasta aquí, sólo intervienen probabilidades absolutas, mientras que las probabilidades condicionales se introducen por definición. Algunos autores, sin embargo, prefieren tomar a la probabilidad condicional como un término primitivo del sistema, y luego introducir la probabilidad absoluta como término definido. Los axiomas de la teoría, entonces, se formulan de esta manera: Ax1: Para cualesquiera eventos A, E (suponiendo que 0 ≤ P(A | E ) ≤ 1. Ax2: Para todo espacio de muestra E ) ≠ 0) P( P( Ω | E ) = 1.
Ω,
P( E ) ≠
0)
y todo evento E (suponiendo que
Ax3: Para toda secuencia finita de eventos, disyuntos de dos en dos, A1, A 2 ... An y para todo evento E (suponiendo que P( E ) ≠ 0) A1 ∪ A 2 ∪ … ∪ An | E ) = P( A1 | E) + P( A 2 | E ) ... P( + P( An | E ). Ax4: Para cualesquiera eventos A, B , E (suponiendo que A ∩ B | E ) = P( B | E ) x P( A | B & E ). P(
P( E ) ≠
0)
Este último axioma, que se conoce como axioma de multiplicación, es equivalente a la definición de probabilidad condicional de Kolmogorov. Adviértase que aquí no se requiere la condición P( B | E ) ≠ 0, porque Si P( B | E ) = 0, entonces, P( A ∩ B | E ) = 0, pero P( A | B & E ) queda indeterminado, como ocurre también en la definición de probabilidad condicional de Kolmogorov. La probabilidad absoluta de un evento, por su parte, se introduce por definición del siguiente modo: Definición: para todo evento A, P( A )
=def P( A | Ω )
El sistema que se obtiene mediante estos axiomas es equivalente al de Kolmogorov, pero aquí todas las probabilidades resultan condicionales. La función probabilidad, entonces, asigna un número real a pares de eventos y no sólo a eventos individuales.
142
L A
TEORI´ A DE LA PROBABILIDAD
Es posible formular de una manera más abstracta y simple un sistema axiomático para la teoría de la probabilidad empleando el concepto de espacio de probabilidades (los párrafos que siguen, que son relativamente más técnicos que el resto de la sección, pueden saltarse sin pérdida de continuidad). Un espacio de probabilidades en general es una estructura X = 〈Ω , ℑ, P〉, donde Ω es un conjunto de elementos cualesquiera, ℑ es una sigma-álgebra de subconjuntos de Ω y P es una función, la función probabilidad, que asigna a cada elemento de ℑ un número real comprendido entre 0 y 1 (es decir, ( P: ℑ → [0, 1]). Definamos ahora el concepto de sigma-álgebra, presupuesto en la definición de espacio de probabilidades. Dado un conjunto no vacío de elementos cualesquiera C , una sigma-álgebra Σ sobre C es un conjunto no vacío de subcon juntos de C , tal que Σ ⊆ ℘C , que cumple las siguientes condiciones: 1. Para todo conjunto A, si A ∈ Σ, entonces, C ∼ A ∈ Σ. 2. Para toda secuencia contable de conjuntos A1... An ∈ Σ, ( A1 ∪ ... ∪ An ) ∈ Σ. De estas dos condiciones se deduce que C ∈ Σ; que ∅ ∈ Σ; y que si A1... An ∈ Σ, ( A1 ∩ ... ∩ An ) ∈ Σ. Una sigma-álgebra es, en resumen, un conjunto de subconjuntos de C que es cerrado respecto de las operaciones de complemento, unión (contable) e intersección (contable). Si el espacio de muestra Ω es un conjunto finito, el espacio de probabilidades es finito. En los casos típicos, la sigma-álgebra ℑ de subconjuntos de Ω será un álgebra de Boole (véase el Capítulo 6. 4) tal que ℑ = ℘Ω (aunque podría restringirse a un subconjunto propio de ℘Ω ). Si Ω es un conjunto contable, el espacio de probabilidades es contable. En este caso ℑ es una sigmaálgebra tal que ℑ ⊆ ℘Ω. Finalmente, si Ω es un conjunto no contable, el espacio de probabilidades es infinito no contable. Para esta clase de espacios la función probabilidad no puede asignar probabilidades a todo elemento de ℘Ω (esto es así por razones técnicas: si Ω no es contable y se acepta el axioma de elección, entonces, puede probarse que existen subconjuntos de ℘Ω que no son medibles). En ese caso, ℑ es una sigma-álgebra tal que ℑ ⊂ ℘Ω , es decir, es un subconjunto propio de ℘Ω . En un espacio de probabilidades finito la teoría de la probabilidad sólo puede formularse mediante el axioma Ax3, el de aditividad finita. En cambio, en un espacio de probabilidades infinito (contable o no contable) la teoría de la probabilidad puede formularse con aditividad finita o con aditividad contable. Esta última es la forma más general de la teoría, la cual se obtiene reemplazando el axioma Ax3 por el siguiente axioma de aditividad contable:
143
T EORI´ AS
AXIOMATIZADAS
Ax3’. Si A1... A 2 … es una secuencia infinita contable de eventos disyuntos, entonces, P( A1 ∪ ... ∪ An ∪ ...) = P( A1 ) + ... + P( An ) + ... La teoría de la probabilidad con aditividad contable debe formularse en un espacio de probabilidades infinito, que puede ser contable o no. Un espacio no contable permite la aplicación de la teoría a las magnitudes continuas, como las que típicamente se utilizan en la física teórica (de hecho, la formulación original de Kolmogorov es máximamente general, ya que es una teoría con aditividad contable en un espacio de probabilidades no contable. Véase el Apéndice 2.18). El sistema axiomático de Kolmogorov está formulado en el lenguaje de la teoría de conjuntos, pero la teoría de la probabilidad también se puede formular en el lenguaje de la lógica proposicional clásica. En ese caso, la función probabilidad P se aplica a proposiciones en lugar de a eventos. Ambas formulaciones son equivalentes y sus respectivos lenguajes son intertraducibles. Esta es la formulación que habitualmente prefieren los lógicos y filósofos que se ocupan de la teoría de la confirmación y de la lógica inductiva, quienes generalmente introducen la probabilidad condicional como término primitivo mediante el axioma de multiplicación. La formulación del sistema es la siguiente: Sea L un conjunto de proposiciones cerrado respecto de las combinaciones finitas veritativo-funcionales. La probabilidad P es una aplicación de L en el con junto de los números reales ( P: L → ) que satisface los siguientes axiomas: Ax1. Para toda proposición A 0 ≤ P( A ) ≤ 1.
∈ L ,
Ax2. Para toda proposición A P( A ) = 1.
∈ L
tal que |= A,
Ax3. Para cualesquiera proposiciones A, B ∈ P( A v B ) = P( A ) + P( B ).
L
tales que |= ¬ ( A & B ),
Ax4. Para cualesquiera proposiciones A, B ∈ L , P( A & B ) = P( B ) x P( A | B ). Los axiomas Ax3 y Ax4, de aditividad y multiplicación, respectivamente, se pueden escribir de una manera más general para cualquier secuencia finita o infinita contable de proposiciones. De esa manera se obtiene, respectivamente, la teoría de la probabilidad con aditividad finita o con aditividad contable.
144
L A
TEORI´ A DE LA MEDICIÓ´N
El mismo sistema se puede formular mediante la condicionalización de todos los axiomas, que no volveremos a escribir. En tal caso, la probabilidad absoluta de una proposición se introduce por definición como la probabilidad condicional de dicha proposición respecto de una tautología o verdad lógica. Esto es, para toda proposición B ∈ L tal que |= B , P( A ) =def P( A | B ). La teoría de la probabilidad, en cualquiera de las formulaciones que hemos presentado, ya sea con aditividad finita o contable, constituye un sistema puramente formal, una teoría perteneciente a la matemática pura. Como todo sistema axiomático formal, esta teoría admite infinitas interpretaciones y, posiblemente, muchos modelos diferentes. Es bien conocido el hecho de que existen diferentes concepciones de la probabilidad; algunas empiristas y objetivistas, como la frecuencial y la propensivista, y otras subjetivistas o epistémicas, como la personalista o bayesiana. En esta última interpretación, elaborada principalmente por B. de Finetti, la probabilidad se concibe como el grado de creencia de un individuo en la ocurrencia de un evento o en la verdad de una proposición. Esta interpretación, que no era la que Kolmogorov tenía en mente al construir su sistema, satisface, sin embargo, todos los axiomas de la teoría de la probabilidad con aditividad finita y es, por tanto, un modelo del cálculo de probabilidades. Ha habido un considerable debate de carácter filosófico acerca de cuáles son las interpretaciones correctas o admisibles de la teoría de la probabilidad. No obstante, si consideramos a la teoría matemática de la probabilidad como un sistema axiomático formal, no tiene por qué haber conflicto entre estas diferentes interpretaciones. Todas ellas pueden concebirse como diferentes modelos de la misma teoría formal, y, consiguientemente, como compatibles entre sí. No es necesario, por tanto, argumentar, como se ha hecho a menudo, que existe una única interpretación correcta de la probabilidad, ni tampoco una interpretación privilegiada o superior a las demás en algún respecto. Sin embargo, es indudable que algunas interpretaciones de la teoría pueden ser más adecuadas o útiles que otras para ciertos fines o para determinadas aplicaciones del cálculo de probabilidades.
5.5 La teoría de la medición
Un ámbito donde el método axiomático se ha mostrado especialmente fértil es en la llamada teoría de la medición, iniciada por H. Von Helmholtz en 1887. No se trata, como el nombre podría sugerir, de un análisis de la manera de medir cantidades físicas, sino de las condiciones necesarias y suficientes para introducir conceptos cuantitati vos en un determinado lengua je. En lengua españo la llamamos a esta operación metri zación de conceptos para distinguirla de la operación empírica de medición de cantidades. El resultado de la metrización es 145
T EORI´ AS
AXIOMATIZADAS
la creación de un nue vo concepto métrico o la transformación de un concepto no métrico ya existente. Otras lenguas, como el inglés, no distinguen entre metrización y medición. Los conceptos métricos son las llamadas cantidades o magnitudes cuantitati vas. Los lengua jes naturales no tienen conceptos métricos, en el sentido técnico de este término, que es el que analizaremos enseguida. Los conceptos métricos son creaciones del conocimiento científico y caracterizan a las ciencias más desarrolladas, como la física, o a las partes me jor establecidas de otras ciencias, como la química o la genética. Desde el punto de vista lógico, los conceptos métricos se expresan mediante funtores numéricos que asignan números reales a los ob jetos de un determinado dominio. La extensión de un concepto métrico es, por consiguiente, una función o una clase de funciones. Existen diferentes tipos de conceptos métricos. Se llama magnitudes escalares a los conceptos métricos que asignan un único valor numérico a los ob jetos de un dominio. Magnitudes vectoriales, en cambio, son los conceptos métricos que asignan un vector a los ob jetos de un dominio y, por consiguiente, requieren la asignación de tres o más valores numéricos. Ejemplos de conceptos métricos del primer tipo son los conceptos de masa, tiempo y longitud, mientras que ejemplos del segundo tipo son los conceptos de fuerza, velocidad y aceleración, entre otros. Aquí nos limitaremos a estudiar únicamente las magnitudes escalares rea - les, es decir, aquellas que asignan un único número real a cada ob jeto de un dominio dado. La introducción de conceptos métricos se realiza de la siguiente manera. Primero se especifica un dominio D, que es un con junto no vacío de ob jetos cualesquiera. Luego, se introducen dos predicados diádicos, C y P , que represen tan relaciones entre dos ob jetos cualesquiera del dominio. También es necesario introducir un funtor binario ⊕, que representa una operación binaria entre ob jetos del dominio. Estos términos primiti vos deben cumplir con las condiciones estipuladas en una lista de axiomas. Mediante ellos definiremos la estructura denominada sistema exten sivo. ◊ La estructura E = 〈 D, C, P , ⊕〉 es un sistema exten sivo si y sólo si para
cualesquiera indi viduos pertenecientes a D, se cumplen los siguientes axiomas: Ax1. ∀ x ( xCx )
[C es refle xi va].
Ax2. ∀ xy ( xCy → yCx )
[C es simétrica].
Ax3. ∀ xyz (( xCy & yCz ) → xCz )
[C es transiti va].
Ax4. ∀ xyz (( xPy & yPz ) → xPz )
[ P es transiti va].
146
L A
TEORI´ A DE LA MEDICIÓ´N
Ax5. ∀ xy ( xCy → ¬ xPy )
[ P es C -irrefle xi va].
Ax6. ∀ xy ( xCy v xPy v yPx )
[ P es C -cone xa].
Ax7. ∀ xy ( x ⊕ y
[⊕ es conmutati va].
C y ⊕ x )
Ax8. ∀ xyz ( x ⊕ ( y ⊕ z )
C ( x ⊕ y ) ⊕ z )
[⊕ es asociati va].
Ax9. ∀ xyz ( xPy ↔(( x ⊕ z P y ⊕ z ) ↔ ( z ⊕ x P z ⊕ y )))
[⊕ es P -monótona].
Ax10. ∀ xy ( xPx ⊕ y )
[⊕ es positi va].
Ax11. ∀ xy ( yPx → ∃n (( n ∈ ) & ( xPny )))
[⊕ es arquimediana].
Los primeros tres axiomas afirman que C es una relación de equi valencia (refle xi va, simétrica y transiti va). Los tres siguientes afirman que P es una relación de orden débil (transiti va, C -irrefle xi va y C -cone xa). Las relaciones C y P suelen interpretarse, respecti vamente, como la coincidencia y precedencia de dos ob jetos del dominio respecto de una determinada propiedad, por ejemplo, la longitud o el peso. Un sistema extensivo también se puede introducir utilizando una sola relación de orden R , que puede definirse de la siguiente manera xRy ↔def xCy v xPy . Si se lo hace de esa manera, se necesitan menos axiomas. Mediante los primeros seis axiomas podemos definir una subestructura de E llamada sistema com parativo. Decimos, entonces, que O = 〈 D, C, P 〉 es un sistema com parativo si y sólo si para cualesquiera indi viduos pertenencientes a D, se cumplen los axiomas Ax1 a Ax6. Estableciendo un sistema comparati vo para un concepto dado pueden introducirse conceptos comparati vos tales como “más duro que” en el dominio de los minerales, o “más pesado que” en el dominio de los cuerpos. Una vez que se ha introducido un concepto comparati vo, es posible establecer una escala ordinal para dicho concepto. Una escala en general es una función que asigna números a los ob jetos de un determinado dominio. Una escala ordinal asigna estos números de tal manera que si un ob jeto precede a otro res pecto de una determinada propiedad, asigna al primero un número menor que al segundo, y si los dos ob jetos coinciden respecto de dicha propiedad les asigna el mismo número. Podemos dar una definición más precisa del siguiente modo: ◊ Una escala ordinal es una aplicación del dominio D sobre el con junto de los números reales ( ƒ: D → ) tal que para cada x, y que pertenezcan a D,
Ax1. ∀ xy ( xCy → ƒ( x ) = ƒ( y )). 147
T EORI´ AS
AXIOMATIZADAS
Ax2. ∀ xy ( xPy → ƒ( x ) < ƒ( y )). Una escala ordinal se limita a dar un número al orden de un determinado ob jeto, pero no cuantifica las diferencias o proporciones entre los diferentes ob jetos. Un ejemplo de esta clase de escala es la tabla de Mohs para las durezas de los minerales. Esta escala asigna al talco el número 1, al yeso el número 2, y al diamante el número 10, pero estos números no proporcionan una medida de la dureza de esos minerales, sino simplemente un orden. No expresan el hecho de que la dureza del yeso sea el doble de la del talco, sino simplemente el hecho de que el yeso es más duro que el talco y ocupa el lugar siguiente en el orden de dureza de los minerales. Igualmente, la escala nos informa que el diamante es el más duro de los minerales, pero no nos dice cuánto más duro que los otros minerales que ocupan los lugares inferiores. Los números asignados a los ob jetos de un dominio por una escala ordinal no se pueden sumar y, en general, no se les pueden aplicar operaciones aritméticas. No expresan cantidades, sino que simplemente etiquetan el orden de los ob jetos del dominio. Los conceptos para los cuales existe un sistema extensi vo se denominan con- ceptos métricos, o más frecuentemente, magnitudes o cantidades (aquí usaremos estos dos términos de manera indistinta). Los conceptos métricos se introducen como funciones numéricas, que asignan números reales a los ob jetos de un determinado dominio. Para introducir un concepto métrico es necesario poseer primero un sistema comparati vo 〈 D, C, P 〉 para ese concepto. Luego, se debe enriquecer ese sistema agregándole el funtor binario ⊕. Este representa una operación que usualmente se interpreta como la combinación de dos ob jetos del dominio, la cual da como resultado otro ob jeto del dominio. Esta operación debe ser aditi va y, desde el punto de vista formal, tiene las propiedades de la suma o adición entre números reales. Por ejemplo, si agregamos dos cuerpos pesados al platillo de una balanza, el resultado es un cuerpo pesado, cu yo peso es igual a la suma de los dos cuerpos pesados. Si mezclamos dos volúmenes de líquidos no volátiles en un recipiente obtenemos un volumen de líquido que es igual a la suma de los dos volúmenes mezclados. Aquí no podemos definir más precisamente qué entendemos por una operación empírica de combinación que sea aditi va, pero los ejemplos de jan suficientemente en claro el significado intuiti vo de esta noción. Un sistema extensi vo es un sistema comparati vo que cumple con ciertos axiomas adicionales, como los axiomas Ax7-Ax11 de la lista anterior. Es una extensión (véase el Capítulo 6.2) de un sistema comparati vo. Los axiomas Ax7 y Ax8 son suficientemente claros e intuiti vos como para no necesitar explicación. El axioma Ax9 dice que si un ob jeto precede a otro, entonces la combinación de ese ob jeto con otro ob jeto z también precede a la combinación del otro ob jeto con ese mismo ob jeto z . Esto quiere decir que la operación ⊕ es monótona, 148
L A
TEORI´ A DE LA MEDICIÓ´N
tal como la suma entre números. El axioma Ax10 afirma que la operación ⊕ es siempre positi va (adiciona, pero nunca resta), de modo que un ob jeto siempre precede a la combinación de sí mismo con otro ob jeto diferente. El axioma Ax11 probablemente sea el menos intuiti vo de la lista. Afirma que por grande que sea la diferencia entre dos ob jetos x e y respecto de una propiedad, existe siempre un número natural n tal que la combinación de y consigo mismo un número finito de veces es superior a x respecto de tal propiedad. Por ejemplo, dado un cuerpo a que es mucho más pesado que otro cuerpo b, hay sin embar go un número n tal que b combinado n veces consigo mismo es más pesado que a. Esto implica que ningún ob jeto del dominio posee una propiedad en un grado infinitamente ma yor que otro, por ejemplo, ningún ob jeto es infinitamente más pesado que otro. Una vez que se ha introducido un sistema extensi vo para un concepto determinado, es posible definir una escala proporcional que asigna un único número real a cada ob jeto del dominio D. Una escala proporcional se diferencia de una escala ordinal por el hecho de que la función que asigna los números a los ob jetos no sólo conser va el orden entre esos ob jetos, sino que, además, represen ta a la operación de combinación empírica de ob jetos como una suma entre números reales, esto es, la representa como una operación aditi va. De esta manera, establece el orden y la proporción cuantitati va que existe entre los ob jetos del dominio. Podemos definir el concepto de escala pro porcional de la siguiente manera: ◊ Una escala pro porcional sobre un sistema extensi vo 〈 D, C, P , ⊕〉 es una función de D en ( ƒ: D → ) tal que para cada x, y pertenecientes a D,
Ax1. ∀ xy ( xCy → ƒ( x ) = ƒ( y )). Ax2. ∀ xy ( xPy → ƒ( x ) < ƒ( y )). Ax3. ∀ xy ( ƒ( x ⊕ y ) = ƒ( x ) + ƒ( y )). Las primeras dos de estas tres condiciones son las de una escala ordinal; mientras que la tercera, que es propia de las escalas proporcionales, afirma que el número que la función asigna a la combinación de dos ob jetos del dominio es igual a la suma de los números que asigna a cada uno de esos ob jetos. Esta condición expresa el carácter aditi vo de la operación empírica de combinación de ob jetos del dominio. Resulta ob vio que toda escala proporcional es también una escala ordinal, pero no a la in versa. Estos tres axiomas fi jan las condiciones para establecer una escala propor cional en general, pero no determinan ninguna escala en particular. Para obtener una escala determinada es necesario fi jar una unidad o patrón de la escala. 149
T EORI´ AS
AXIOMATIZADAS
Esto se hace con vencionalmente asignando a un ob jeto cualquiera del dominio (o me jor, a una clase de equi valencia de ob jetos) un número determinado, generalmente el 1, por razones de simplicidad. Ese ob jeto es la unidad o patrón de la escala, por ejemplo, el metro para la escala de longitudes. Cuando se ha fi jado la unidad, el sistema extensi vo determina de manera uní voca los valores que la función asigna a todos los restantes ob jetos del dominio, preser vando el orden y la proporción entre esos ob jetos. Por supuesto, dado que la elección de la unidad es con vencional, son posibles di versas escalas para una misma magnitud, como por ejemplo las que establecen el kilogramo y la libra como unidades de peso. Cada escala asigna un número real diferente al mismo ob jeto, por ejemplo, 3 kilogramos y 6.6 libras de peso. Sin embargo, todas estas escalas son equi valentes, en un sentido que ahora debemos precisar. Existen muchas escalas posibles para una misma magnitud, pero se las puede agrupar en clases de equivalencia. Todas las escalas de una misma clase son equivalentes si preservan determinados valores numéricos cuando se cambia de una escala a otra. El tipo de valor numérico preser vado es el que define la correspondiente clase de escala. Aquí nos limitaremos a considerar únicamente las escalas proporcionales, que son características de las magnitudes extensi vas. Las escalas proporcionales no preser van el valor absoluto asignado a un determinado ob jeto. Por ejemplo, la regla que está sobre mi escritorio mide 25 centímetros en una escala de longitud y 10 pulgadas en otra escala de longitud. Mi escritorio, por su parte, mide 100 centímetros y 40 pulgadas, respecti vamente. Las dos escalas en cuestión son escalas proporcionales porque conser van el cociente entre los valores absolutos asignados a cada ob jeto. En efecto, el cociente entre los valores asignados a la regla y al escritorio es el mismo en las dos escalas: 25/100 y 10/40. En ambos casos obtenemos el mismo número: 0.25. Lo mismo ocurrirá para las longitudes de todos los ob jetos del dominio D sobre el cual está definido el concepto métrico de longitud. Podemos, entonces, definir a una escala proporcional para cualquier magnitud de la siguiente manera: ◊ Si f y g son dos escalas diferentes para una misma magnitud, entonces son
escalas proporcionales si y sólo si para todo ob jeto del dominio D, se cumple que f ( x )/ f ( y ) = g ( x )/ g ( y ). Cada clase de escala se caracteriza por un determinado tipo de transformación, esto es, por una manera específica de realizar los cambios de una escala a otra. Una transformación es una función tal que al valor de cada ob jeto en una determinada escala le asigna otro valor para el mismo ob jeto en otra escala. La función transformación F(x) es la que nos permite con vertir los valores de una escala a los valores de la otra, es decir, pasar de una escala a otra. El tipo de transformación característico de las escalas proporcionales se denomina trans formación similar . En una transformación similar, la función transforma150
L A
TEORI´ A DE LA MEDICIÓ´N
ción, definida sobre el con junto de los números reales , adopta la siguiente forma: F(x) = ax (donde a es un número real positi vo). Una transformación similar de una función es otra función que resulta de multiplicar a la primera por una constante positi va. Podemos definirla de la siguiente manera: ◊ La función h es una trans formación similar de la función f si y sólo si existe un número real a ∈ +, tal que para todo ob jeto del dominio D se cumple
que h(x) = af ( x ). La manera de aplicar una transformación similar para pasar de una escala a otra consiste simplemente en multiplicar el valor numérico asignado a un ob jeto en una determinada escala por un número real positi vo, obteniéndose así el valor numérico correspondiente a ese ob jeto en la otra escala. Así, por ejemplo, para obtener el peso de un cuerpo en libras a partir de su peso dado en kilogramos se multiplica este último valor por 2.2. Para obtener el peso en kilogramos dado el peso en libras se multiplica dicho valor por 0.454. Se procede de un modo análogo para cualquier cambio de escalas para toda magnitud para la cual exista una escala proporcional. Todo sistema extensi vo posee al menos una escala proporcional. Una transformación similar aplicada a una escala proporcional para un sistema extensi vo da como resultado otra escala proporcional para ese sistema extensi vo. Como consecuencia de este hecho, es evidente que existe un número potencialmente infinito de escalas proporcionales para cada sistema extensi vo. La elección de una determinada escala es una cuestión puramente con vencional, basada fundamentalmente en razones de simplicidad y economía de cálculo. Las magnitudes dotadas de escalas proporcionales son aquellas que tradicionalmente se denominan magnitudes exten sivas, tales como, por ejemplo, la longitud, la duración temporal y la masa (que son los tres conceptos métricos fundamentales de la mecánica). Estas son las magnitudes para las cuales existe un sistema extensi vo. Lo característico de las magnitudes extensi vas es que sus valores se pueden sumar y, en general, se les pueden aplicar todas las operaciones aritméticas. Ello es así porque un sistema extensi vo para una determinada magnitud es seme jante a un sistema numérico en el dominio de los números reales. La seme janza en cuestión es una relación de homomor fismo (en el sentido definido en el Capítulo 3.5). Una escala proporcional para un sistema extensi vo establece, precisamente, un homomorfismo entre un sistema extensi vo 〈 D, C, P , ⊕〉 y el sistema numérico 〈, =, <, + 〉. Los sistemas extensi vos que hemos considerado hasta aquí reciben el nom bre técnico de métricas combinatorias exten sivas po sitivas. Este tipo de métrica es el característico de las magnitudes extensi vas, pero no puede utilizarse con las magnitudes llamadas inten sivas, tales como la temperatura, que no tienen carácter aditi vo. Para esta clase de magnitudes es necesario emplear otro tipo de 151
T EORI´ AS
AXIOMATIZADAS
métrica, llamado métrica de intervalos al gebraicos . Existen, además, muchos otros tipos de métricas que se definen axiomáticamente del mismo modo que lo hemos hecho, pero con diferentes axiomas. Para los fines de ejemplificar el uso del método axiomático en la teoría de la medición es suficiente con la única métrica que hemos estudiado aquí.
Notas bibliográ ficas
L a bibliografía sobre la teoría de con juntos es muy extensa. La teoría se expone de manera intuiti va pero muy completa en Fraenkel (1966). Halmos (1974), Johnstone (1987), Kunen (2009) y Macho ver (1996) contienen formulaciones sintéticas del enfoque axiomático. Mucho más detallados son Enderton (1977) y Hamilton (1982). Una presentación axiomática muy completa y clara de la teoría de Zermelo-Fraenkel es la de Suppes (1972). La teoría de Von Neumann-BernaysGödel la presenta Bernays (1958) y, con una variante debida a Quine, la expone Mosterín (1980). La axiomatización de Quine está contenida en Quine (1951) y (1953). La teoría de Morse se presentó por primera vez como apéndice a Kelley (1955) y de manera más detallada en Morse (1965). Comparaciones sistemáticas entre las diferentes axiomáticas con juntistas se encuentran en Quine (1969) y Fraenkel, Bar-Hillel y Levy (1973). Esta última obra inclu ye una discusión detallada de los axiomas de Zermelo. Moore (1982) está íntegramente dedicada a la historia del axioma de elección. Van Hei jenoort (1967) contiene una traducción de las principales fuentes históricas de la teoría de con juntos. Drake y Singh (1996), Jech (1997) y Levy (2002) son obras avanzadas que muestran cómo se desarrolla la matemática sobre la base de la teoría de con juntos. Tiles (1989), Pollard (1990) y Lavine (1994) ofrecen buenas introducciones a los problemas filosóficos de la teoría. La prueba de la independencia del axioma de elección se expone detalladamente en Cohen (1966). Hausdorff (1914) es la primera axiomatización de la topología de con juntos de puntos. Hausdorff (1927) ofrece una axiomatización diferente de la misma teoría. Kuratowski (1948) y Kelley (1955) son dos tratados clásicos de topología general. Kuratowski (1961) trata la teoría de con juntos y ofrece una axiomatización de la topología. Baum (1991) es una presentación bre ve y precisa de la topología de con juntos de puntos. Munkres (2000) es una obra amplia y actualizada que también proporciona información detallada sobre la topología algebraica. Aleksandrov, Kolmogorov y Lavrentev (1969) exponen de manera axiomática no formalizada las más di versas teorías matemáticas. Allí Kolmogorov presenta la versión simplificada de su axiomatización del cálculo de probabilidades, que es la que utilizamos en este capítulo. Von Plato (1994) es un estudio histórico mi nucioso de la axiomatización de la teoría de la probabilidad. Fine (1973) es un 152
NOTAS
´FICAS BIBLIOGRÁ
estudio técnico detallado de las interpretaciones del cálculo de probabilidades. Gillies (2000) y Mellor (2005) analizan estas interpretaciones desde un punto de vista filosófico. Earman (1992) y Howson y Urbach (2006) discuten con detalle la aplicación de la teoría de la probabilidad, en particular del teorema de Ba yes, a la confirmación de hipótesis científicas. Krantz, Luce, Suppes y Tversky (1971) contiene un tratamiento axiomático detallado de la teoría de la medición que inclu ye discusiones filosóficas de di versos aspectos del tema. Narens (1985) desarrolla el mismo enfoque, pero desde un punto de vista puramente matemático y de ni vel más avanzado.
153
6
Ventajas y dificultades del método axiomático
6.1 Introducción l método axiomático, desde los tiempos de Euclides, tuvo sus realizaciones más brillantes en el campo de la matemática. No cabe duda de que se trata de un método apropiado para las ciencias formales en general, incluyendo aquí a la lógica y a las teorías de los lenguajes artificiales. En principio, el procedimiento de axiomatización puede aplicarse también a cualquier teoría empírica, independientemente de que se la simbolice en algún lenguaje artificial de tipo lógico-matemático. Veremos, sin embargo, que el empleo del método axiomático encuentra dificultades de tipo práctico cuando se lo extiende a las teorías empíricas. Resulta promisorio en el ámbito de las ciencias exactas, sobre todo en la física teórica, donde predominan las formulaciones en lengua je matemático, pero su utilidad se vuelve dudosa en el caso de las ciencias sociales. Hay dos condiciones que debe satisfacer una teoría o conjunto de teorías para que sea susceptible de una axiomatización provechosa. La primera condición es que la teoría esté suficientemente desarrollada y razonablemente bien establecida. Esto quiere decir que la teoría dispone ya de un conjunto más o menos amplio de teoremas demostrados, si es una teoría formal, o de leyes e hipótesis bien confirmadas, si se trata de una teoría empírica. No se requiere que la teoría esté completa ni que sea definitiva, ya que esto es tal vez un ideal irrealizable, sino que haya alcanzado un cierto grado de madurez. La condición es ciertamente vaga y su cumplimiento será una cuestión de grado. Está claro, sin embargo, que dicha condición desaconseja el empleo del método axiomático cuando las teorías en cuestión se encuentran todavía en sus etapas exploratorias. En los contextos de descubrimiento y prosecución de una teoría las hipótesis fundamentales no están todavía precisamente formuladas ni mucho menos bien confirmadas. La axiomatización prematura de una teoría que recién comienza a desarrollarse puede ser contraproducente y resultar un obstáculo para el proceso de descubrimiento de aspectos aún no conocidos de esa teoría. La segunda condición es que el lenguaje de la teoría alcance un grado de precisión suficiente. También esta condición es vaga y su cumplimiento será cuestión de grado. Admitimos que el lenguaje de la teoría es preciso cuando se
E
155
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
lo puede cuantificar, por ejemplo, introduciendo conceptos métricos (como los de longitud, masa o temperatura), o bien cuando es posible reducir la ambigüedad y vaguedad introduciendo términos técnicos suficientemente claros o bien definidos. No obstante, mientras se emplee el lenguaje natural en la formulación de una teoría habrá una cuota ineliminable de ambigüedad y de vaguedad en los conceptos. Si el lenguaje de la teoría no es preciso, la axiomatización no resultará útil o directamente será irrealizable. Volveremos más adelante sobre este punto cuando consideremos la aplicación del método axiomático en las ciencias naturales y sociales.
6.2 Ventajas generales de la axiomática El método axiomático presenta muchas ventajas desde el punto de vista teórico. Sin pretensiones de hacer una lista exhaustiva podemos mencionar las siguientes: el orden, la claridad , la precisión, la utilidad metateórica y la facilidad de revisión. Ante todo, la presentación axiomática ofrece una exposición de la teoría más sistemática y ordenada que cualquier otra. Una teoría axiomatizada adquiere rigidez estructural y no se la puede modificar a gusto o arbitrariamente sin per judicar a la totalidad del sistema. La sistematicidad de un sistema axiomático hace que cualquier cambio tenga repercusiones muy amplias. Esto no quiere decir que una teoría axiomática sea definitiva e inmodificable. Por el contrario, los axiomas son revisables y expuestos a crítica. La base axiomática de una teoría admite expansiones, contracciones y enmiendas. El formato axiomático permite, precisamente, apreciar de manera más clara y exacta cuáles son las consecuencias de un cambio en los fundamentos de la teoría. En segundo lugar, la presentación axiomática de una teoría es la más clara posible porque muestra de manera exhaustiva cuáles son los fundamentos de dicha teoría y qué consecuencias se siguen de admitir esos fundamentos. Con ello se eliminan los supuestos ocultos de cualquier especie, sean formales o no formales. Además, la estructura de las pruebas se hace totalmente explícita, reduciendo al mínimo el uso de la intuición en la evaluación de las demostraciones aceptables. En tercer lugar, una teoría axiomatizada se vuelve más precisa. Se elimina, o al menos se reduce notablemente, la ambigüedad y vaguedad de los términos del lenguaje de la teoría. También las pruebas se hacen más precisas, disminu yendo el riesgo de aceptar demostraciones inválidas. En cuarto lugar, las teorías axiomatizadas admiten un estudio metateórico riguroso. Se hace más fácil determinar de una manera precisa y rigurosa si poseen o no las propiedades de consistencia, completitud y las demás que hemos caracterizado antes. En caso de que no sea posible probar la consistencia abso156
V ENTAJAS GENERALES DE LA AXIOMÁ ´ TICA
luta de una teoría (como de hecho sucede en la mayoría de los casos), el formato axiomático reduce las posibilidades de llegar a una contradicción en la teoría. Ello es así porque tanto los supuestos como las pruebas se mantienen bajo el máximo control posible. Por supuesto, como ya hemos observado, esto no garantiza que la teoría esté libre de contradicciones. En las teorías no axiomatizadas, en cambio, las pruebas metateóricas son mucho más difíciles y a veces poco precisas. Además, la probabilidad de incurrir en inconsistencias es mucho más alta. Desde el punto de vista metateórico, una ventaja importante del método axiomático, que merece una consideración aparte, es que permite determinar con claridad cuáles son las relaciones lógicas entre dos o más teorías. Si las teorías en cuestión están axiomatizadas resulta más fácil compararlas porque su estructura está definida con precisión. Podemos distinguir al menos cuatro relaciones interteóricas importantes: la equivalencia, la reducción, la unificación y la extensión de teorías. En un sentido intuitivo decimos que dos teorías son equi valentes cuando implican el mismo conjunto de enunciados. Igualmente, decimos que una teoría se reduce a otra cuando la primera resulta deducible de la segunda, pero no a la inversa. También decimos que dos o más teorías son unificadas por una tercera teoría más general cuando ésta permite deducir a las otras, pero no se da la inversa. Por último, decimos que una teoría es una extensión de otra si la segunda es una subteoría de la primera. La axiomatización nos permite caracterizar con más precisión y generalidad estos conceptos. Si dos teorías T 1 y T 2 están axiomatizadas es posible determinar de una manera en principio efectiva: i) Si T 1 y T 2 son lógicamente equivalentes, es decir, dos formulaciones diferentes de la misma teoría. ii) Si T 1 es reducible a T 2 , o a la inversa. iii) Si T 1 y T 2 resultan unificadas por otra teoría más general T 3. iv) Si T 1 es una extensión de T 2 , o a la inversa. Equivalencia entre teorías
◊ T 1 y T 2 son teorías equivalentes si y sólo si a) los términos primitivos de
T 1 son definibles mediante los primitivos de T 2 , y los primitivos de T 2 son definibles mediante los primitivos de T 1; b) los axiomas de T 1 son deducibles de los axiomas de T 2 , y los axiomas de T 2 son deducibles de los de T 1. 157
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
Las teorías que son lógicamente equivalentes no son en realidad teorías diferentes, sino formulaciones diferentes de la misma teoría. Podemos, entonces, definir a una teoría en general como la clase de equivalencia de todas sus formulaciones. Reducción entre teorías
◊ Una teoría T 1 se reduce a otra teoría T 2 si y sólo si los términos primiti-
vos de T 1 son definibles mediante los primitivos de T 2 , y los axiomas de T 1 son deducibles de los axiomas de T 2 . Las teorías equivalentes son reducibles una a la otra. Sin embargo, el caso más interesante de reducción entre teorías es aquél en que la teoría reducida no es equivalente a la teoría reductora. Unificación de teorías
◊ Una teoría T 3 unifica a otras dos teorías T 1 y T 2 si y sólo si T 1 y T 2 se
reducen ambas a T 3.
Si T 1, T 2 y T 3 son lógicamente equivalentes la unificación es trivial. El caso más interesante de unificación es aquél en el cual la teoría unificadora ( T3 ) no es equivalente a ninguna de las teorías unificadas, ni tampoco a la conjunción de éstas ( T1 y T 2 ). Extensión de teorías
◊ Dada una teoría T 1 formulada en un lenguaje L 1 y otra teoría T 2 formulada en un lenguaje L 2 , T 2 es una extensión de T 1 si y sólo si T 1 ⊆ T 2 .
Si T 2 es una extensión de T 1, se dice que T 1 es una subteoría de T 2 . Se sigue de la definición que acabamos de dar que toda teoría es una extensión de sí misma y que todas las teorías lógicamente equivalentes son extensiones unas de otras. Estos casos se conocen como extensiones impropias. Como es evidente, las extensiones interesantes son aquellas que se dan entre teorías que no son equivalentes, a las que se llama extensiones propias. En tal caso, una teoría T 2 que es una extensión propia de otra teoría T 1 contiene todos los teoremas de T 1 y, además, un número infinito de teoremas nuevos, es decir, de teoremas que no pueden probarse en T 1. La extensión propia de una teoría no garantiza la conservación de la consistencia, esto es, si T 1 es consistente, no se sigue que T 2 lo sea. 158
V ENTAJAS GENERALES DE LA AXIOMÁ ´ TICA
Una noción especial de extensión de teorías es la llamada extensión conser vativa, cuya definición es la siguiente: ◊ Dada una teoría T 1 formulada en un lenguaje L 1 y otra teoría T 2 formu-
lada en un lenguaje L 2 , T 2 es una extensión conservativa de T 1 si y sólo si a) T 1 ⊆ T 2 y b) para toda fórmula χ del lenguaje L 1, si T 2 χ, entonces, T 1 χ.
Una extensión conservativa de una teoría T 1 es otra teoría T 2 en la cual no se pueden demostrar teoremas nuevos formulados en el lenguaje de T 1. Así, cualquier fórmula bien formada del lenguaje de T 1 que sea teorema en T 2 ya es un teorema de T 1. Las extensiones conservativas de una teoría se obtienen enriqueciendo el vocabulario de dicha teoría con nuevos términos. Así, por ejemplo, la aritmética de primer orden con adición y multiplicación es una extensión conservativa de la aritmética de primer orden con adición. También se sigue de la definición dada que toda teoría es una extensión conservativa de sí misma y que todas las teorías lógicamente equivalentes son extensiones conservativas unas de otras. La extensión conservativa de una teoría garantiza la preservación de la consistencia. Es decir, si T 2 es una extensión conservativa de T 1 y T 1 es consistente, entonces, T 2 también es consistente. La razón de ello es que si T 2 fuera inconsistente, se podrían demostrar en ella todas las fórmulas bien formadas de su lenguaje, incluso aquellas expresadas exclusivamente en el lenguaje de T 1 pero que no son teoremas de T 1. Así, el hecho de probar que una teoría T 2 es una extensión conservativa de otra teoría T 1 implica ofrecer una prueba relativa de la consistencia de T 2 respecto de T 1, ya que se habrá probado que si T 1 es consistente, entonces, T 2 también lo es (véase el Apéndice 1). Dado un sistema axiomático S1, se obtiene una extensión interesante S 2 agregando a S1 nuevos axiomas, siempre que esos axiomas sean independientes y el sistema extendido S 2 no sea inconsistente. La condición de consistencia es obvia. Por su parte, la condición de independencia de los nuevos axiomas asegura que el sistema extendido S 2 no es lógicamente equivalente al sistema de partida S1. Así, por ejemplo, la teoría axiomática de los anillos es una extensión de la teoría axiomática de grupos, dado que se obtiene agregando nuevos axiomas a la teoría de grupos sin eliminar ninguno. Frecuentemente, las extensiones de esta clase requieren que el lenguaje sea enriquecido mediante la introducción de nuevos términos. El lenguaje de la teoría de los anillos es, en efecto, más rico que el de la teoría de grupos porque contiene nuevos términos primitivos (véase el Capítulo 3.3 y 3.4). El caso más interesante de una extensión se produce entre teorías axiomatizadas que, además de no ser equivalentes, no tienen axiomas en común, o bien, si tienen algunos, el conjunto de los axiomas que comparten no es igual al con junto de los axiomas de ninguna de las teorías en cuestión. En estas circunstan159
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
cias, no resulta evidente el hecho de que una sea la extensión de la otra. La prueba de que ello es así constituye un auténtico descubrimiento matemático. Un descubrimiento de esta clase se produjo, por ejemplo, en la teoría de con juntos cuando se probó que el sistema axiomático de Von Neumann, Bernays y Gödel es una extensión conservativa del sistema axiomático de Zermelo y Fraenkel (véase el Capítulo 5.2). Finalmente, una teoría axiomatizada es mucho más fácil de revisar o modificar, en el sentido general de agregarle o quitarle proposiciones, que una teoría no axiomatizada. Supongamos que una teoría T implica una fórmula χ que es lógicamente inconsistente. En tal caso, obviamente, desearemos eliminar χ de la teoría T . Eso, sin embargo, no es tarea sencilla. Dado que T , como toda teoría, es cerrada desde el punto de vista lógico, no podremos eliminar χ a menos que eliminemos también todas las fórmulas de T que implican a χ. Si T no es una teoría axiomatizada, no está claro cuáles son las fórmulas que deben eliminarse. En principio, será necesario examinar todas las fórmulas de T , o, al menos, un número muy grande de ellas. En cambio, si T está axiomatizada, sabemos con certeza que χ está implicada por los axiomas de esa teoría. Podemos, entonces, proceder directamente a revisar la base axiomática de la teoría, lo que, evidentemente, simplifica mucho las cosas. Por cierto, no podemos saber de antemano cuál o cuáles son los axiomas que implican a χ, pero, generalmente, no es muy difícil examinarlos a todos. No es muy probable que sea necesario eliminar o reemplazar a todos los axiomas de una teoría. La razón de ello es que siempre que un conjunto de fórmulas Γ implica a una fórmula χ, existe un subconjunto ∆ de fórmulas de Γ que también implica a χ. En algunos casos, ∆ será igual a Γ, pero a menudo será un subconjunto propio de Γ. En el caso de una teoría axiomatizada T , ello significa que, por lo general, una fórmula cualquiera χ de T no estará implicada conjuntamente por todos los axiomas de T , sino sólo por algunos. Si la teoría tiene pocos axiomas, puede suceder que la fórmula que deseamos eliminar esté implicada por todos ellos. Cuando se presenta esa situación, es necesario reexaminar toda la base axiomática de la teoría. Sin embargo, la probabilidad de que ello ocurra es tanto menor cuanto más axiomas tenga la teoría. En ese caso, hay que identificar a los axiomas que implican a la fórmula inconsistente y eliminar o reemplazar al menos uno de ellos. Con un poco de suerte, la revisión sólo afectará a uno o unos pocos axiomas. El resto de la base axiomática de la teoría, podrá, entonces, conservarse sin cambios. La división de los axiomas de una teoría en grupos, como hiciera Hilbert (véase el Apéndice 2.12), facilita mucho la revisión de la base axiomática. Frecuentemente, la fórmula que queremos eliminar estará implicada por un solo grupo de axiomas, por lo que los demás grupos podrán mantenerse intactos. 160
V ENTAJAS GENERALES DE LA AXIOMÁ ´ TICA
Una vez que se han identificado los axiomas que conjuntamente implican una fórmula inconsistente, es necesario eliminar al menos uno de ellos para desactivar dicha implicación y restaurar la consistencia de la teoría. Aquí se presentan muchos cursos de acción lógicamente posibles, ya que no hay una única manera de modificar un determinado conjunto de axiomas. En principio, cualquiera de esos axiomas puede reemplazarse por otro, o bien retirase sin reemplazo alguno. Por lo general, se trata de conservar la mayor parte de la teoría previamente disponible y de efectuar los cambios que den lugar a la teoría más simple posible. Sin embargo, estos criterios de conservadurismo y simplicidad no siempre son claros y precisos ni determinan el cambio de la teoría de una manera unívoca. Es importante hacer dos aclaraciones respecto de la revisión de teorías axiomatizadas. En primer lugar, toda modificación de una teoría T 1 que consista en agregar o quitar al menos algún axioma de dicha teoría, dará siempre como resultado otra teoría T 2 . Si se han eliminado axiomas de T 1, ocurrirá que T 2 ⊆ T 1, es decir, se producirá una contracción de T 1 y obtendremos una subteoría de T 1. Si en cambio, se agregan nuevos axiomas a T 1, ocurrirá que T 1 ⊆ T 2 , es decir, se habrá realizado una expansión de T 1 que nos dará como resultado una extensión de T 1, que puede ser propia o impropia, y conservativa o no. Cuando se reemplaza algún axioma de T 1, o sea, cuando se elimina algún axioma y se agrega otro diferente, se ha hecho una revisión de T 1. Si la teoría resultante es lógicamente equivalente a la inicial (con lo cual ocurrirá que T 1 ⊆ T 2 y T 2 ⊆ T 1 ) el resultado no será una nueva teoría, sino una mera reformulación de T 1, a la que se habrá dotado de otra base axiomática. En cambio, se produce una revisión de T 1 en sentido estricto, cuando la teoría resultante T 2 , no es una reformulación, ni una contracción, ni una extensión de T 1. Esta situación, típicamente, se presenta si se agregan axiomas que son lógicamente independientes de los que se eliminan. Las dos teorías T 1 y T 2 tendrán, no obstante, una subteoría T 3 en común (es decir, T 3 ⊆ T 1 y T 3 ⊆ T 2 ), esta es la teoría que consiste en el conjunto de las consecuencias lógicas de los axiomas que T 1 y T 2 comparten. En segundo lugar, suponiendo que T 1 sea consistente, la expansión o la revisión en sentido estricto de esa teoría generalmente no garantizan la consistencia de la nueva teoría T 2 , salvo en el caso de que ésta sea una extensión conservativa de la primera. Sólo la contracción de T 1 nos asegura que obtendremos otra teoría consistente, ya que se trata de una subteoría de ésta. Las expansiones y revisiones de la base axiomática de una teoría, en cambio, son siempre mucho más riesgosas porque acarrean el peligro de caer en inconsistencias. En verdad, nunca podemos conocer la totalidad de las proposiciones nuevas que introducimos en una teoría cuando expandimos o revisamos su base axiomática. Ello es así por el simple hecho de que cualquier axioma tiene 161
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
infinitas consecuencias lógicas por sí mismo y, además, da lugar a nuevas consecuencias lógicas cuando se lo pone en conjunción con otros axiomas. En este juego con el infinito siempre es posible encontrar contradicciones inesperadas. El juego es aun más interesante porque raramente sabemos que la teoría de la que partimos, T 1 en este caso, es consistente. Algunos autores, por ejemplo Bunge (1973) y Suppes (1993), sostienen que una de las ventajas del método axiomático es su valor heurístico, es decir, su aplicabilidad como instrumento para descubrir nuevos conocimientos. Creo que esta afirmación debe tomarse con cautela y exige algunas matizaciones. Es indudable que una vez que se dispone de una buena axiomatización de una teoría es posible que se descubran teoremas que no se conocían antes de que dicha teoría fuera axiomatizada. Esto ha ocurrido efectivamente en muchos dominios de la matemática y de la física. Sin embargo, la creación de una teoría no vedosa raramente se produce mediante el empleo del método axiomático. Si recorremos, por ejemplo, la historia de la matemática, encontramos que la mayor parte de las teorías más originales, tales como la geometría analítica o el cálculo infinitesimal, no surgieron como resultado de la aplicación del método axiomático. No parece, entonces, que la axiomática tenga demasiado valor heurístico para la creación o invención de teorías novedosas. Por otra parte, es evidente que se puede emplear exitosamente para descubrir las consecuencias lógicas de una teoría ya conocida y axiomatizada.
6.3 Dificultades generales de la axiomática Las dificultades del método axiomático, al menos en el ámbito de las ciencias formales y exactas en general, son principalmente de tipo práctico. Hemos dicho que la axiomática tiene ventajas incuestionables desde el punto de vista teórico, pero puede ocurrir que éstas impliquen desventajas prácticas en el uso y aplicación de una teoría. La axiomatización de una teoría puede en algunos casos ser desventajosa en la simplicidad, en la facilidad de trabajo o aplicación y en la enseñanza de dicha teoría. Suponiendo que una teoría ha alcanzado el grado de precisión y desarrollo suficientes como para que pueda axiomatizarse de manera adecuada, el resultado de la axiomatización no necesariamente será una versión más simple de la teoría. Hay teorías que no pueden axiomatizarse mediante un número reducido de axiomas, sino que requieren un conjunto de 20, 30 o más axiomas (o esquemas de axiomas) diferentes. Por otra parte, tampoco es posible en todos los casos que los axiomas sean breves y claramente comprensibles o intuitivos; a veces es necesario emplear axiomas largos y complicados. Cuando estas dos situaciones se combinan, la teoría axiomatizada se vuelve menos simple y fácil de comprender que la versión intuitiva y no axiomatizada de dicha teoría. Un buen 162
DIFICULTADES GENERALES DE LA AXIOMÁ ´ TICA
ejemplo de esta situación lo proporciona la teoría de conjuntos. La versión llamada intuitiva (o ingenua) que G. Cantor ofreció por primera vez tiene unos puntos de partida muy simples (los principios de comprensión y extensionalidad) y resulta muy fácil de entender y de desarrollar. La versión axiomática de la teoría de Cantor, creada por Zermelo y perfeccionada por Fraenkel, (como ya vimos en el Capítulo 5.2) requiere un mínimo de 9 axiomas y algunos de ellos, como el célebre axioma de elección, expresados en un lenguaje formalizado son complicados y no muy intuitivos. Las demostraciones de los principales teoremas de la teoría de conjuntos también resultan menos simples en la versión axiomática que en la versión intuitiva. Por estas razones casi siempre se prefiere esta última para iniciar al principiante. El desarrollo axiomático de una teoría es siempre mucho más riguroso y preciso que el que pueda proveer cualquier formulación no axiomatizada de esa misma teoría. Sin embargo, la versión axiomatizada puede no ser la más práctica para el trabajo o la aplicación de la teoría. Esto sucede casi siempre con las teorías físicas. Cuando el interés del físico es hacer cálculos concretos para aplicar la teoría al mundo físico, prefiere emplear de manera intuitiva las ecuaciones de la teoría y no desarrollar pruebas formalizadas. Trabajar con una teoría axiomatizada sería en este caso un obstáculo que haría todos los cálculos más lentos y trabajosos. En la práctica, todos los físicos trabajan con formulaciones no axiomáticas de las teorías, incluso cuando existan axiomatizaciones disponibles. Finalmente hay que mencionar las desventajas pedagógicas del método axiomático. El estudio de una teoría axiomatizada exige madurez intelectual y capacidad de pensamiento abstracto. También es recomendable, y a veces indispensable, un cierto conocimiento previo de la teoría en cuestión. Por estas razones, el estudiante que se inicia en el conocimiento de una teoría encuentra mucho más fácil y accesible una presentación intuitiva e informal que una axiomatizada. Cualquiera puede comprobarlo tomando un texto elemental de teoría axiomática de conjuntos y comparándolo con otro donde los mismos resultados se exponen de manera informal. Cuando una teoría admite una presentación axiomática simple, como ocurre con la teoría matemática de la probabilidad (que expusimos en el Capítulo 5.4), es posible pasar rápidamente de la versión intuiti va a la versión axiomatizada. En cambio, cuando la teoría axiomática es comple ja, como en el caso de las teorías físicas, se requerirá un largo entrenamiento previo con el enfoque intuitivo de la teoría. En general, la presentación prematura de una teoría axiomática resultará árida y pedagógicamente contraproducente para los estudiantes y bastante frustrante para los propios docentes. Todas estas desventajas prácticas del método axiomático deben evaluarse según el contexto. En todos aquellos ámbitos en los que se requiere máxima precisión, claridad conceptual y rigor deductivo, el empleo de teorías axiomatizadas 163
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
es preferible y compensa con creces cualquier desventaja práctica. Esta es la situación que se presenta en la investigación teórica avanzada de teorías bien desarrolladas. El método axiomático también es particularmente útil cuando surgen problemas conceptuales o inconsistencias en la teoría y se hace necesario revisar la fundamentación misma de todo el sistema teórico. Al respecto, el desarrollo de la teoría de conjuntos proporciona un caso histórico ejemplar. En cambio, hay contextos en los que no se requiere demasiada precisión, como en la enseñanza elemental, donde el exceso de detalles, de profundidad o de preciosismos es más bien un obstáculo para la comprensión. Algo similar ocurre con las aplicaciones de una teoría, para las cuales no es necesario más rigor que el que la práctica impone. También hay contextos donde la claridad y la precisión extremas no son posibles, como sucede en el contexto de descubrimiento de una teoría novedosa o que se halla en sus primeras etapas de desarrollo.
6.4 El método axiomático en las ciencias formales A partir de todo lo que se ha expuesto anteriormente es evidente que el método axiomático tiene más ventajas que dificultades en el campo de las ciencias formales. Sin embargo, existen algunas razones por las cuales el formato axiomático no es siempre el más empleado en la práctica cotidiana de los matemáticos. Uno de los empleos más extendidos de la axiomática es la definición de determinados conceptos matemáticos mediante la postulación de axiomas. Ya hemos visto los ejemplos de las estructuras algebraicas de grupo y anillo. Los respectivos conjuntos de axiomas pueden considerarse como una definición explícita de tales conceptos (véase el Capítulo 3.3 y 3.4). Otro ejemplo de definición axiomática de un concepto matemático es el de álgebra de Boole, en la cual se establecen las propiedades de las operaciones entre clases o conjuntos. Aquí tomamos como primitivos a los términos que designan a un conjunto no vacío de elementos cualesquiera X , a dos operaciones binarias ∪ y ∩ sobre elementos de X , a una operación unaria ∼ sobre elementos de X , y a dos elementos distinguidos (del conjunto X ) 1 y 0. Con estos elementos podemos definir un álgebra de Boole de la siguiente manera: ◊ Dado un conjunto no vacío X , dos operaciones binarias ∪ y ∩ sobre elementos de X , una operación unaria ∼ sobre elementos de X , y dos elementos distinguidos 1 y 0 del conjunto X ; Z = { X , ∪, ∩, ~, 1, 0} es un álgebra de Boo-
le si y sólo si cumple con los siguientes axiomas:
Ax1. A ∪ B = B ∪ A. Ax2. A ∩ B = B ∩ A.
164
EL MÉTODO AXIOMÁ ´ TICO
EN LAS CIENCIAS FORMALES
Ax3. A ∪ ( B ∪ C ) = ( A ∪ B ) ∪ C . Ax4. A ∩ ( B ∩ C ) = ( A ∩ B ) ∩ C . Ax5. A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ). Ax6. A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ). Ax7. A ∪ 0 = A. Ax8. A ∩ 1 = A. Ax9. A ∪ ~ A = 1. Ax10. A ∩ ~ A = 0. Los diez axiomas están reunidos en cinco grupos. Los primeros tres grupos de axiomas expresan, respectivamente, las propiedades conmutativa, asociativa y distributiva de las operaciones ∪ y ∩. El cuarto grupo afirma la existencia de 1 y 0 como elementos distinguidos del conjunto X (pero no dice que sean únicos; esto es algo que debe probarse como teorema). Finalmente, el quinto grupo establece las propiedades de la operación ~. Un modelo de este formalismo abstracto lo proporciona la teoría de conjuntos. Para obtenerlo, interpretamos al dominio X como el conjunto potencia ℘ Z de un conjunto dado Z . Los conjuntos A, B , C , ... son, entonces, los elementos de℘ Z . A los funtores ∪, ∩, y ~, los interpretamos como las operaciones de unión, intersección y complemento entre conjuntos; y a los elementos distinguidos 1 y 0 como la clase universal ( U ) y el conjunto vacío ( ∅ ), respectivamente. La clase universal no debe entenderse aquí en el sentido de Zermelo, sino como el mayor de los conjuntos considerados. De una manera semejante a esta se definen axiomáticamente muchos otros conceptos matemáticos importantes, como los de cuerpo y retículo en álgebra y los de espacio vectorial y espacio de Hilbert en geometría, entre muchos otros. Ello puede comprobarse consultando las correspondientes entradas en cualquier diccionario de matemática. Lo que así se ha definido es un predicado, como “grupo” o “álgebra de Boole”, que luego será aplicable a determinados objetos matemáticos. Se advierte en estos ejemplos que no se trata de teorías axiomáticas completamente formalizadas. Por lo general se presupone a la teoría intuitiva de con juntos como lógica subyacente y se aplica de manera informal un número muy amplio de reglas de inferencia. También se presupone en las pruebas una porción relativamente amplia de la matemática básica, como por ejemplo la aritmé-
165
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
tica elemental. Esta axiomatización informal de teorías es característica de la práctica de los matemáticos en su trabajo cotidiano. Resulta particularmente simple y útil cuando no se está interesado en la fundamentación rigurosa de las teorías y se trabaja en el ámbito de teorías bien establecidas y relativamente seguras, donde hay menos riesgo de encontrarse con inconsistencias. El empleo de teorías axiomáticas completamente formalizadas tiene desventajas prácticas en este contexto. Las teorías resultan más complicadas, los enunciados más extensos y difíciles de escribir y las demostraciones más largas y laboriosas. Cuando se trata de teorías que no se pueden formalizar en un lenguaje de primer orden la complejidad de la axiomática formalizada aumenta notablemente (aunque pueden obtenerse algunas ventajas metateóricas, tales como la categoricidad de la teoría). Aquí las ventajas de emplear una axiomatización informal mediante el lenguaje de la teoría intuitiva de conjuntos son más evidentes. Ahora consideremos brevemente el uso del método axiomático en la lógica matemática. Desde el punto de vista histórico, los primeros sistemas de lógica de primer orden, como los de Frege (1879; reproducido en el Apéndice 2.10), Whitehead y Russell (1910) o Hilbert y Ackermann (1928), se formularon de manera axiomática y en lenguaje formalizado. Este hecho facilitó sin duda el estudio metateórico de dichos sistemas, que tuvo amplios desarrollos en las décadas de 1920 y 1930. Sin embargo, estos sistemas axiomáticos presentan dificultades prácticas a la hora de aplicarlos a la demostración de teoremas. Generalmente, si se los formula con esquemas de axiomas, emplean una sola regla de transformación (el modus ponens o regla de separación), por lo cual las demostraciones se vuelven difíciles y extensas, requiriendo una buena cuota de ingenio para encontrar las sustituciones adecuadas en los axiomas. El sistema de lógica proposicional de Lukasiewicz, que presentamos en el Capítulo 2.3, es un buen ejemplo de estas dificultades. En 1934 G. Gentzen y S. Jáskowski descubrieron, de manera independiente, que es posible formular la lógica de primer orden prescindiendo de axiomas y empleando únicamente reglas de transformación. Todas las fórmulas lógicamente verdaderas del cálculo de primer orden se pueden probar como teoremas a partir del conjunto vacío de axiomas utilizando un conjunto suficientemente amplio de reglas de inferencia. Esta idea se desarrolló originando los métodos llamados de deducción natural, que tienen indudables ventajas prácticas y pedagógicas sobre los de deducción axiomática. De hecho, la mayoría de los libros elementales sobre lógica de primer orden adoptan algún sistema de deducción natural. Como tales sistemas contienen un número elevado de reglas de inferencia (diez, doce o más), la demostración de teoremas se facilita notoriamente. Podemos resumir nuestra discusión diciendo que el método axiomático formal se utiliza ampliamente en la matemática y las ciencias formales, pero no esencialmente en el contexto de descubrimiento de nuevas teorías, sino en el 166
EL MÉTODO AXIOMÁ ´ TICO
EN LAS CIENCIAS NATURALES Y SOCIALES
de justificación, presentación sistemática e investigación metateórica. Por cierto, ello no significa que la axiomatización de una teoría no sea también útil como método de descubrimiento de partes todavía desconocidas de la teoría. En algunos casos, la axiomatización se ha revelado como un instrumento de notable poder heurístico. Pero generalmente no es aplicable en los estadios exploratorios, cuando deben conjeturarse las hipótesis fundamentales La gran mayoría de las veces la axiomatización de las teorías es de tipo informal, en razón de la mayor simplicidad y facilidad de este procedimiento. Esto no significa que se abandone la concepción formal del método axiomático, sino simplemente que la teoría axiomática se introduce mediante un lenguaje no formalizado. La formulación de teorías en lenguaje completamente formalizado es más complicada y difícil, reservándose sobre todo para el estudio de teorías fundamentales, como la lógica y la teoría de conjuntos, o para los ámbitos de investigación metateórica.
6.5 El método axiomático en las ciencias naturales y sociales Para finalizar nuestro estudio, consideremos brevemente la aplicación del método axiomático fuera del ámbito de las ciencias matemáticas y formales, o sea, en el dominio de las ciencias empíricas. Nos limitaremos a algunos comentarios sin presentar el contenido de ningún sistema en particular. Aquí la situación es diferente según se trate de las ciencias naturales o de las ciencias sociales y la filosofía. En general, una teoría empírica axiomatizada tiene dos elementos diferentes: a) un formalismo puramente sintáctico, y b) una semántica para ese formalismo. En a) se encuentran todos los componentes de un sistema axiomático formal que ya hemos estudiado. Pero, obviamente, este sistema puramente sintáctico no es una teoría empírica. En b) se encuentran las reglas semánticas que dan significados a los términos de a), es decir, la interpretación del formalismo de la teoría. Si se trata de una teoría física, la interpretación especificará un dominio de objetos o eventos físicos, y asignará individuos de este dominio a las constantes individuales del formalismo, así como propiedades y relaciones físicas entre estos objetos a los predicados primitivos del formalismo y funciones a los funtores. Una teoría empírica axiomatizada no es un sistema formal carente de significado, sino un sistema interpretado. Los axiomas de esta clase de teorías no son fórmulas sin significado, sino enunciados significativos que tienen un valor de verdad. Por cierto, las interpretaciones que hacen falsos a los axiomas de una teoría no tienen especial interés científico o cognoscitivo, de modo que las reglas semánticas de b) deben especificar un modelo del formalismo a). Así, por ejemplo, una teoría física axiomatizada deberá ofrecer un formalismo y 167
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
un modelo físico de ese formalismo; una teoría biológica axiomatizada especificará, a su vez, un formalismo y un modelo biológico de ese formalismo. En esos modelos los axiomas son enunciados verdaderos. Ello no implica, sin embargo, que sean verdades evidentes al modo clásico, ni siquiera verdades conocidas como tales. Se los concibe más bien como hipótesis, cuya verdad no se afirma categóricamente ni se conoce con certeza, sino que se postula provisoriamente con el fin de deducir otros enunciados de ellas. En suma, una teoría empírica axiomatizada es un sistema hipotético-deductivo de proposiciones, en el cual las hipótesis fundamentales desempeñan el papel de axiomas. La extensión más razonable del método axiomático se encuentra indudablemente en el campo de la física teórica. Las teorías bien establecidas de la física fundamental, como la mecánica newtoniana de partículas o la teoría de la relatividad especial, han alcanzado un grado de desarrollo y precisión suficientes como para admitir un tratamiento axiomático. Como señalamos en el Capítulo 1, en 1909 G. Hamel y C. Carathéodoty axiomatizaron, respectivamente, la mecánica clásica y la termodinámica, dos teorías que en ese momento se encontraban ya bien establecidas. Más notable es el hecho de que en 1914 A. A. Robb consiguiera ofrecer en su libro A Theory of Time and Space una axiomatización precisa de la concepción del espacio-tiempo de la relatividad especial (el llamado espacio-tiempo de Minkowski). La teoría de la relatividad especial todavía no se consideraba bien confirmada empíricamente para esa fecha, pero el logro de Robb se comprende dada la precisión conceptual y la completitud con las que Einstein presentó su teoría en 1905, y, además, en razón de la existencia de una formulación geométrica de la teoría en términos de espacio-tiempo, que H. Minkowski descubrió en 1908. El enfoque axiomático formalizado de las teorías físicas es el más preciso, pero tiene indudables desventajas prácticas. La axiomatización de las teorías físicas generalmente es más difícil y complicada que la de las teorías matemáticas. Con frecuencia es necesario emplear un lenguaje formal de segundo orden, o de orden superior, ya que la lógica de primer orden resulta insuficiente. En tales casos, el uso de lógicas de segundo orden o de teorías axiomáticas de conjuntos hace que el sistema formal resultante sea complicado, con axiomas extensos y poco intuitivos, y difícil de aplicar a demostraciones concretas. La axiomatización informal mediante el lenguaje de la teoría intuitiva de conjuntos resulta mucho más sencilla y clara, aunque necesariamente menos precisa o rigurosa. Se llama axiomatización informal a aquella que emplea un lenguaje no formalizado y una lógica subyacente no axiomatizada. Obviamente no debe confundirse esta idea con la de un sistema axiomático no formal. Se trata, por el contrario, de obtener sistemas formales lo más simple posibles, aprovechando las ventajas del uso de la teoría intuitiva de conjuntos como lógica subyacente y del lenguaje no formalizado. La axiomatización informal de una teoría consiste en defi168
EL MÉTODO AXIOMÁ ´ TICO
EN LAS CIENCIAS NATURALES Y SOCIALES
nir explícitamente un predicado conjuntista mediante una lista de axiomas. Este es un procedimiento usual entre los matemáticos, que, obviamente, no puede aplicarse a la propia teoría de conjuntos, puesto que la presupone. Ya hemos visto ejemplos de aplicación de este método informal en las definiciones de los conceptos de espacio métrico, álgebra de Boole y espacio de probabilidades. Ahora tomaremos como ejemplo la definición completa del predicado conjuntista grupo: ◊ X es un grupo si y sólo si existen C y * tales que:
Ax1. X = 〈C , *〉. Ax2. C ≠ ∅. Ax3. * = f : C x C → C . Ax4. Para cada x, y, z ∈ C : (( x * y ) * z ) = ( x * ( y * z )). Ax5. Para cada x, y ∈ C hay un z ∈ C : ( x * z = y ). Ax6. Para cada x, y ∈ C hay un z ∈ C : ( z * x = y ). Los axiomas Ax1-Ax3 definen los modelos potenciales de la teoría de grupos, es decir, la clase de las estructuras que son susceptibles de ser grupos. Los axiomas Ax3-Ax6 (que constituyen el segundo grupo de axiomas para la teoría de grupos que dimos en el Capítulo 3.2) definen los modelos actuales de la teoría de grupos, es decir, la clase de las estructuras que son efectivamente grupos. Esta es obviamente una subclase de la clase de los modelos potenciales. La axiomática formalizada de las teorías físicas no ha tenido hasta el momento grandes realizaciones, al menos comparables a las de las teorías matemáticas. En cambio, la axiomatización informal mediante un predicado conjuntista se desarrolló mucho más a partir de los trabajos de P. Suppes (1957), dando lugar a la llamada concepción semántica de las teorías. Otra línea de axiomatización informal, directamente inspirada en la obra de Suppes, es el programa estructuralista de J. Sneed (1971) y W. Stegmüller (1973), desarrollado luego por W. Balzer, C. U. Moulines y J. Sneed (1987) y aplicado a diversas teorías empíricas, e incluso a las ciencias sociales (Balzer 1982). De acuerdo con la concepción estructural de las teorías, una teoría empírica se puede caracterizar como un predicado conjuntista, tal como el de “grupo”, que acabamos de definir. Mediante una lista de axiomas es posible, en principio, definir explícitamente predicados tales como “mecánica clásica de partículas” o “mecánica relativista de partículas”. Una teoría empírica es, entonces, un predicado definido explícitamente mediante una lista de axiomas. Este predicado define, a su vez, la clase de los modelos de la teoría, o sea, la clase de las estructuras respecto de las cuales todos
169
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
los axiomas de la lista son verdaderos. Los partidarios del programa estructuralista consideran que toda teoría empírica se puede reconstruir de esta manera, mediante la definición de un predicado conjuntista adecuado. No ejemplificaremos aquí la axiomatización de teorías empíricas concretas, que resulta algo más complicada que los ejemplos de teorías matemáticas que hemos dado. Es indudable que los resultados del programa estructural tienen un considerable interés filosófico y epistemológico, pero su utilidad para las propias ciencias todavía no es clara. El intento más ambicioso de axiomatización de una teoría física, no pro viene del campo de la filosofía de la ciencia, sino del trabajo monumental del físico G. Ludwig, que en su obra An Axiomatics Basis for Quantum Mechanics (publicada en dos volúmenes entre 1985 y 1987) trató de reconstruir toda la física cuántica de manera axiomática. El resultado es una obra extensa y muy compleja, que sólo los especialistas están en condiciones de evaluar. Es un hecho, sin embargo, que la mayor parte de las teorías físicas no se hallan axiomatizadas, y la comunidad científica de los físicos no parece sentir la necesidad de hacerlo. Los físicos en la práctica no emplean el método axiomático ni expresan sus teorías en lenguajes formalizados. Tampoco la enseñanza de las ciencias físicas sigue este modelo deductivo. Con todo, la axiomatización es deseable en aquellas teorías cuyo contenido no es completamente claro o cu yos fundamentos son debatidos, como es el caso de la mecánica cuántica. En el campo de las ciencias biológicas, la necesidad de aplicar el método axiomático no ha parecido urgente, a juzgar por los escasos resultados producidos. J. Woodger publicó en 1937 su libro The Axiomatic Method in Biology , donde intentó aplicar la axiomatización formal a diversas partes de la biología, como la genética clásica. Tiempo después perfeccionó su trabajo en otra obra, Biology and Language, publicada en 1952. Estos trabajos no tuvieron demasiada repercusión en la comunidad científica de los biólogos, tradicionalmente ajena al método axiomático. En 1970 M. Williams presentó una axiomatización de la teoría de la evolución, que tuvo probablemente mucha más influencia en la filosofía de la ciencia que en la biología teórica (Williams 1970). En años recientes los partidarios del programa estructuralista han buscado aplicar la axiomatización informal en diferentes ramas de la biología, pero el éxito de tales esfuerzos todavía no ha sido confirmado, al menos en lo que respecta a su utilidad para la comunidad de los biólogos. En las ciencias sociales ha habido sólo esporádicos intentos de aplicar el método axiomático, los más recientes promovidos también por el programa estructuralista. Sería prematuro decir que este método es inaplicable en el campo de la teoría social, pero en el estadio actual de desarrollo de las teorías de la sociedad no parece haber grandes perspectivas. Los conceptos de las ciencias sociales todavía carecen de la precisión necesaria como para permitir el pasaje de las teorías existentes al estadio axiomático. 170
EL MÉTODO AXIOMÁ ´ TICO
EN LAS CIENCIAS NATURALES Y SOCIALES
En el ámbito de la filosofía, la mereología o teoría de los todos y las partes constituye uno de los pocos ejemplos de aplicación exitosa del método axiomático. Existen sistemas muy diferentes de mereología, algunos más potentes que otros. Aquí presentaré solamente un sistema básico, denominado mereo- logía minimal , debido a P. Simons (1987). El sistema emplea un único término primitivo: el predicado diádico P , habitualmente interpretado como la relación “ser parte de” entre objetos cualesquiera. La lógica subyacente del sistema es la lógica de primer orden con identidad y sus axiomas son los siguientes: Ax1. ∀ x ( ¬ Pxx ). Ax2. ∀ xy ( Pxy → ¬ Pyx ). Ax3. ∀ xyz (( Pxy & Pyz ) → Pxz ). Estos tres axiomas establecen que la relación “ser parte de” entre dos objetos cualesquiera es irreflexiva, asimétrica y transitiva. Se trata de la relación de parte propia respecto de un todo. Los axiomas no son independientes, ya que el primero se deduce del segundo (en efecto, si una relación es asimétrica también debe ser irreflexiva). Ahora introduciremos por definición el predicado diádico S, que se interpreta usualmente como la relación de superposición entre objetos. Definición: Sxy =def. ∃ z ( Pzx & Pzy ).
Finalmente, formularemos el último axioma empleando este término definido. Ax4. ∀ xy ( Pxy → ∃ z ( Pzy & ¬ Szx )). Este axioma se conoce como principio de suplementación porque afirma que todo objeto tiene partes que no se superponen. Es posible obtener sistemas de mereología más potentes introduciendo nue vos términos definidos y agregando otros axiomas a los anteriores, pero aquí me conformaré con la presentación de este sistema minimal de mereología, cu yos axiomas son sumamente intuitivos. Para finalizar, podría decirse con seguridad que ya nadie parece pensar en la posibilidad de emprender proyectos como la Ética de Spinoza, es decir, en la construcción de un sistema filosófico al modo axiomático. La situación en muchos aspectos es similar a la de las ciencias sociales. Pero, además, cabe preguntarse si el método axiomático es apropiado para la naturaleza crítica de la 171
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
investigación filosófica, interesada siempre en elucidar los conceptos fundamentales y cuestionar los supuestos epistemológicos de toda construcción teórica.
6.6 Pensamiento axiomático, intuición y certeza El método axiomático tradicional, desde sus orígenes griegos hasta antes del surgimiento de la axiomática formal, siempre ha estado asociado a una concepción fundacionista del conocimiento. La idea tradicional del conocimiento, de raíces platónico-aristotélicas, es que éste se compone de proposiciones verdaderas conocidas como tales y dotadas de una justificación que las hace indudables. Según esta concepción, el conocimiento científico es conocimiento cierto, esto es, no puede ser falso. Los axiomas de una teoría científica son verdades de las cuales debemos tener una certeza absoluta. La tradición encontró en la evidencia de los axiomas el criterio de verdad que los garantizaba como ciertos. La evidencia de los axiomas se conoce directamente por una suerte de intuición intelectual que nos hace aprehender su verdad de manera inmediata e indudable. Este ideal fundacionista alcanzó su culminación con la filosofía racionalista de la modernidad y su sueño nunca realizado de una mathesis universalis. El surgimiento de las geometrías no euclídeas, que se construyeron a partir de axiomas nada evidentes, y el desarrollo de teorías matemáticas como la de los números transfinitos de Cantor, que contenía contradicciones ocultas en principios aparentemente evidentes, pusieron en crisis la idea de justificación de los axiomas mediante intuición intelectual y cuestionaron el concepto mismo de evidencia. De allí surgió el método axiomático formal, y la concepción de los sistemas axiomáticos como conjuntos de fórmulas sin significado. El método axiomático formal permite prescindir del requisito tradicional de evidencia de los axiomas. También dispensa del uso de la intuición en la justificación de los axiomas, ya que éstos no se justifican de modo alguno. Los axiomas de un sistema se eligen libremente y de manera enteramente convencional. Ello no significa, como ya hemos dicho, que la elección sea puramente arbitraria, como suele decirse a veces. La elección de los axiomas no es arbitraria en el sentido de que no cualquier conjunto de fórmulas del lenguaje de una teoría es adecuado para axiomatizar dicha teoría. Si elegimos los axiomas de una teoría mediante algún procedimiento azaroso, lo más probable es que obtengamos un conjunto de fórmulas completamente inadecuado para construir un sistema axiomático. Dicho conjunto, si no es directamente inconsistente, resultará insuficiente para deducir todas las proposiciones que se aceptan como verdaderas en dicha teoría, o siquiera una parte importante de ellas. Frecuentemente se afirma que la axiomática formal tampoco requiere el empleo de ninguna forma de intuición en la realización de demostraciones de teoremas dentro de un sistema formal. Esta afirmación general necesita varias aclaraciones y sólo resulta válida en un sentido limitado. 172
PENSAMIENTO
´ TICO, INTUICIÓ´N, CERTEZA AXIOMÁ
1. En un sistema formal no se requiere de ninguna forma de intuición para verificar si una secuencia de fórmulas constituye o no una demostración o una derivación dentro de ese sistema. Dado el vocabulario, las reglas de formación y transformación y los axiomas del sistema, la verificación de una prueba es un asunto puramente mecánico, que sólo depende de la forma de las fórmulas que componen la secuencia. En principio, siempre es posible programar una computadora para que realice esta tarea de modo automático. 2. En un sistema formal decidible, la construcción de demostraciones de cualquier teorema del sistema, o derivaciones de cualquier fórmula, es un procedimiento mecanizable. Igualmente mecanizable es el proceso de determinar si una fórmula cualquiera es o no un teorema del sistema. Los sistemas decidibles están dotados de algún algoritmo general para resolver esta clase de problemas. También es posible, al menos en principio, construir una máquina para realizar estas tareas de manera automática. Por esta razón, se puede prescindir de toda forma de intuición, no sólo para verificar una prueba ya construida, sino también para construir una prueba de cualquier teorema todavía no conocido. 3. En los sistemas indecidibles no existe ningún mecanismo de prueba para toda fórmula del sistema. Por consiguiente, la construcción de una prueba para un teorema todavía no conocido no se puede mecanizar, y es imposible por principio inventar una máquina para que pruebe de manera automática cualquier teorema del sistema. La construcción de pruebas requiere creatividad, ingenio y el uso de alguna forma de intuición que permita hallar la ruta hacia la conclusión deseada. Por cierto, existen procedimientos rutinarios, por ejemplo, para transformar una fórmula en otra equivalente, pero se necesita de la intuición para determinar cuándo es necesario aplicar alguno de tales procedimientos en el camino hacia una demostración. 4. Por último, el descubrimiento de los axiomas apropiados para una determinada teoría no es mecanizable, por el momento al menos, y requiere de altas dosis de intuición creativa. Al axiomatizar una teoría deben elegirse los axiomas adecuados para representar el conocimiento preexistente capturado por esa teoría. Por ejemplo, los axiomas seleccionados para axiomatizar la geometría elíptica deben ser suficientes como para poder deducir de ellos todos los teoremas de geometría elíptica ya demostrados de manera no axiomática. No parece haber reglas infalibles ni mecanismos automatizables para descubrir cuáles serán los axiomas adecuados. Por otra parte, no existe un único conjunto de tales axiomas. Es evidente que en este punto el científico, además de apoyarse en todos sus conocimientos previos sobre el tema, tiene que hacer uso de alguna forma de intuición característica del comienzo de todo proceso creativo. Todavía el estudio de los procesos de descubrimiento científico no ha avanzado lo suficiente como para describir o explicar esta clase de intuición creadora, por lo que por ahora sólo podemos constatar su existencia y su carácter opaco al conocimiento. 173
V ENTAJAS Y DIFICULTADES DEL MÉTODO AXIOMÁ ´ TICO
En el manejo de los sistemas axiomáticos formales, sobre todo en los formulados en lenguajes formalizados, se reduce ciertamente el uso de la intuición humana, pero no se lo elimina del todo. Por otra parte, no es posible algo así como la formulación de un sistema axiomático carente de todo supuesto metateórico o de todo supuesto proveniente del lenguaje natural. La metateoría de un sistema formal debe introducirse por medio de algún lenguaje natural, enriquecido a lo sumo con algunos tecnicismos, pues de otro modo puede producirse una regresión al infinito de sistemas formales. Este hecho limita las posibilidades de precisión de la metateoría. Desde las convenciones de escritura hasta un cierto grado de ambigüedad y vaguedad se incorporan inevitablemente a los enunciados metateóricos. ¿Proporciona el método axiomático algún tipo de certeza cognoscitiva? Un adepto al ideal fundacionista, que durante muy largo tiempo estuvo asociado al pensamiento axiomático, respondería afirmativamente. Axiomatizar una teoría de manera satisfactoria equivale, para esta tradición, a encontrar un fundamento cierto e indubitable para esa teoría. Algunos vestigios de esta concepción perduraban todavía en los fundadores de la axiomática formal, especialmente en la teoría de conjuntos. La propia expresión “fundamentos de la matemática” (toda vía en uso) lo revela. Zermelo y los fundadores de la axiomática conjuntista efectivamente pensaban que la teoría de conjuntos podía ofrecer un fundamento seguro para toda la matemática, especialmente para la aritmética y el análisis. Pronto se hizo común la creencia de que toda la matemática se fundaba en la teoría de conjuntos. Después de la publicación de los teoremas de Gödel se hizo claro que este ideal fundacionista era insostenible. La teoría de conjuntos no era capaz de demostrar su propia consistencia y, por consiguiente, no podía ofrecer un fundamento seguro para otras partes de la matemática. Actualmente debemos extender esta lección a todo el pensamiento axiomático. Una teoría axiomatizada tiene, como hemos visto, muchas ventajas, pero no proporciona ningún fundamento seguro o indubitable para el conocimiento. Tampoco es necesariamente más cierta o segura que una teoría no axiomatizada. Los axiomas de una teoría formal son revisables a la luz de los resultados que se obtengan de ellos, como lo es cualquier hipótesis en general. En principio, la axiomatización de una teoría siempre se puede mejorar, ya sea reformulando los axiomas de un modo más preciso, o bien reemplazando el conjunto de sus axiomas por otro conjunto de axiomas más simples o más profundos y deductivamente más fértiles, o sencillamente por un número menor de axiomas independientes. No hay manera de que podamos establecer la terminación de este proceso, lo cual quiere decir que nunca podemos tener la certeza de que hayamos encontrado la axiomatización final y acabada de una teoría. La matemática, como toda ciencia formal o empírica, es una creación humana y, como tal, es siempre provisoria e incierta. El método axiomático no nos libera de la incertidumbre que es propia de todo conocimiento humano. 174
NOTAS
BIBLIOGRÁFICAS
Notas bibliográficas Carnap (1958) y Suppes (2002) ejemplifican la aplicación de la axiomática formal a las ciencias formales y empíricas. Blumenthal (1980) axiomatiza la geometría plana proyectiva, euclídea y no euclídea. Curry (1977) contiene un estudio original y detallado de los sistemas de deducción natural del tipo de Gentzen. Smullyan (1995) y Quine (1982) son ejemplos de enfoques modernos no axiomáticos de la lógica. Kelly (1996) combina la presentación axiomática y la deducción natural. Hughes (1993) contiene diversas reflexiones filosóficas sobre ambos enfoques de la lógica. Hilbert (1918) es un manifiesto clásico a favor del método axiomático en la matemática. Bunge (1973) argumenta extensamente a favor de la aplicación del método axiomático en las ciencias empíricas. Bunge (1967) axiomatiza numerosas teorías físicas. Woodger (1937) y (1952) aplica la axiomatización formal a las teorías biológicas. Suppes (1957) ejemplifica la axiomatización informal de teorías mediante un predicado conjuntista con la mecánica clásica de partículas. Sneed (1971) es la formulación original del estructuralismo. Stegmuller (1973) presenta de manera más accesible los fundamentos del programa estructuralista de axiomatización de teorías. Balzer (1982) aplica este programa a diversas teorías empíricas, desde la relatividad especial hasta el psicoanálisis freudiano. La obra de Balzer, Moulines y Sneed (1987) contiene la versión más sistemática del estructuralismo. Suppes (1993) defiende el valor heurístico del método axiomático. La naturaleza del conocimiento matemático, incluyendo problemas como los de la intuición, la necesidad y la certeza, es uno de los temas fundamentales de la filosofía de la matemática. Shapiro (2000a) es una clara introducción histórica de carácter general. Benacerraf y Putnam (1983), Hart (1996), Resnik (1997), Shapiro (1997) y Tymoczko (1998) contienen mucha información adicional sobre el tema. Shapiro (2000) es un estudio detallado de la lógica de segundo orden y de diversos problemas de filosofía de la matemática relativos a las teorías de orden superior. Shapiro (2005) es un compendio enciclopédico de la filosofía de la matemática. Simons (1987) y Casati y Varzi (1999) son dos obras sobre mereología que adoptan un enfoque axiomático. Fraïssé (1982) es una reflexión interesante sobre los sistemas axiomáticos y sus diferencias con los juegos.
175
Apéndice 1 Las pruebas de consistencia abemos que si un sistema formal tiene un modelo, entonces, es consistente. La manera más natural de encontrar una prueba de consistencia de un sistema axiomático es, entonces, buscar una interpretación de los términos primitivos del sistema en la que resulten verdaderos todos sus axiomas. Con frecuencia, los sistemas formales no tienen modelos finitos. Las estructuras que constituyen modelos del sistema contienen un dominio de infinitos elementos. Consiguientemente, no es posible comprobar la verdad de los axiomas del sistema formal mediante una inspección directa y completa de la estructura, es decir, mediante un número finito de observaciones u operaciones. Por ejemplo, supongamos que I es una interpretación del sistema formal S y que el dominio D de dicha interpretación es un conjunto de infinitos elementos. Supongamos también que el sistema S contiene un axioma de la siguiente forma: Ax1. ∀ x ( Fx → Gx ). Este axioma afirma que todos los individuos del dominio D si tienen la propiedad F también tienen la propiedad G. Pero dado que D contiene infinitos elementos, el axioma Ax1 resulta inverificable en ese dominio. Como consecuencia de ello, no podemos determinar si dicho axioma es verdadero bajo la interpretación I , de manera que no sabremos si I es o no un modelo de S . Esta es una limitación importante de las pruebas de consistencia mediante la construcción de modelos. En efecto, la mayoría de las teorías matemáticas interesantes sólo pueden interpretarse con estructuras que tienen un dominio infinito. En esos casos, resulta indispensable apelar alguna forma de inducción matemática. Así, se deberá probar por inducción que Ax1 es verdadero en D. Esta clase de pruebas será tan confiable como lo sea el principio de inducción que se utilice. Hay dos maneras de evitar esta dificultad. La primera es emplear pruebas re- lativas de consistencia, en las que el modelo de un sistema formal es otro sistema formal previamente conocido, cuya consistencia ha sido probada o se considera segura. La otra manera es encontrar pruebas absolutas de consistencia que no procedan mediante la construcción de modelos. Consideremos cada una de estas estrategias. Las pruebas relativas de consistencia operan mediante la construcción de un modelo formal de otro sistema formal, o, más precisamente, una traducción de un sistema formal a otro. Supongamos que S es el sistema cuya consistencia se quiere probar, y T es otro sistema formal ya conocido. Para hallar un modelo de S en T es necesario asignar como significado a cada término primitivo de S un término
S
177
A PÉNDICE 1
del sistema T , de modo tal que a todo teorema de S le corresponda un teorema de T . Con ello se habrá probado que si el sistema T es consistente, entonces, también el sistema S es consistente ( Con (T) → Con ( S )). La prueba de consistencia de S es meramente relativa a la consistencia del sistema T . Si la consistencia absoluta del sistema T está demostrada, se puede concluir de allí que S también es consistente. Si la consistencia de T no se conoce, sólo es lícito afirmar que no puede ocurrir que T sea consistente y, a la vez, S sea inconsistente (pero pueden ocurrir cualesquiera de las demás posibilidades: que ambos sean inconsistentes, que ambos sean consistentes y también que T sea inconsistente y S consistente). Desde el punto de vista histórico las pruebas relativas de consistencia surgieron cuando se estudió la relación entre la geometría euclídea y las diferentes geometrías no euclídeas. Diversos matemáticos trataron de encontrar modelos euclídeos de las diferentes geometrías no euclídeas (en realidad no se trata de modelos en el sentido estricto que hemos definido en el Capítulo 3.1, que se aplica sólo a sistemas axiomáticos formales, porque las geometrías, euclídea y no euclídeas, no estaban en ese momento satisfactoriamente axiomatizadas). En 1868 E. Beltrami, en su “Ensayo de interpretación de la geometría no euclídea”, encontró un modelo euclídeo para la geometría hiperbólica de Lobachevsky, probando la consistencia de ésta relativamente a la geometría euclídea. Beltrami halló un modelo de la geometría plana hiperbólica en una superficie euclídea de curvatura constante negativa, que él llamó pseudoesfera. El modelo se obtiene si se identifican las líneas rectas de la geometría hiperbólica con las líneas geodésicas sobre una pseudoesfera (una línea geodésica puede cracterizarse como aquella que constituye la menor distancia, o mejor la distancia extrema, mínima o máxima, entre dos puntos). Beltrami tradujo, pues, el término “recta” de la geometría de Lobachevsky por el término “arco de geodésica sobre una pseudoesfera” de la geometría euclídea. Luego, demostró que todos los teoremas sobre figuras planas en el espacio hiperbólico resultan también verdaderos en el plano formado por la superficie de la pseudoesfera. F. Klein en 1871 descubrió, por su parte, un modelo del plano hiperbólico en el plano proyectivo, ofreciendo, en este caso, una prueba de la consistencia relativa de la geometría de Lobachevsky respecto de la geometría proyectiva. Más tarde, en 1895, H. Poincaré construyó otros dos modelos euclídeos para la geometría hiperbólica. Las pruebas relativas de consistencia sólo son concluyentes cuando la consistencia del sistema formal que sirve como modelo está a su vez demostrada. Si probamos la consistencia relativa de S respecto de T , y la de T respecto de otro sistema U , no podemos concluir nada acerca de la consistencia de ninguno de estos sistemas a menos que tengamos una prueba absoluta de la consistencia de U , y así sucesivamente. Las pruebas de la consistencia relativa de la geometría no euclídea respecto de la euclídea no son concluyentes porque no se ha probado la consistencia absoluta de la geometría de Euclides. Hilbert de178
L AS
PRUEBAS DE CONSISTENCIA
mostró, como hemos visto en el Capítulo 1, la consistencia relativa de la geometría euclídea respecto de la aritmética de los números reales, pero carecía de una prueba absoluta de la consistencia de la aritmética misma. Las pruebas absolutas de consistencia se proponen demostrar que un sistema formal no es contradictorio, en el sentido de que no implica teoremas de la forma χ y ¬ χ (donde χ es una fbf cualquiera), o, de manera equivalente, que no es inconsistente porque no toda fórmula del lenguaje del sistema se puede deducir como teorema. Hemos visto que si un sistema formal S es inconsistente, entonces, toda fbf de S es un teorema de S . Por tanto, una prueba absoluta de la consistencia de S consiste en hallar una fórmula ψ tal que ψ no es un teorema de S. En el caso de la aritmética, una prueba absoluta de consistencia sería probar, por ejemplo, que la fórmula “0 = 1” no es demostrable. Es decir, que ninguna demostración formal de la aritmética termina con una línea que sea la fórmula “0 = 1”. Esta clase de pruebas no apela a la construcción de modelos, ni a la consistencia de algún otro sistema formal. Un ejemplo muy simple es la prueba de consistencia de la lógica proposicional. Ésta consiste en exhibir una fórmula del cálculo proposicional que no sea deducible como teorema, por ejemplo, p & q. Con ello queda demostrado que el sistema no es inconsistente ni contiene contradicciones. ¿Cómo se prueba que p & q no es un teorema de la lógica proposicional? Comprobamos primero que todos los axiomas del sistema son tautologías o verdades lógicas (disponemos para ello de métodos algorítmicos, como las tablas de verdad). Luego, se debe probar la corrección de las reglas de transformación del sistema, es decir, que todo teorema deducido de axiomas tautológicos es también una tautología. Si el sistema es correcto, ninguna fórmula proposicional no tautológica es teorema. Sabemos que p & q no es una fórmula tautológica (como puede comprobarse mediante una tabla de verdad). Por tanto, p & q no es un teorema de la lógica proposicional. Con ello la prueba de consistencia queda terminada. Hilbert y la escuela formalista consideraron que las pruebas absolutas de consistencia eran las únicas aceptables en la metateoría de los sistemas formales, ya que eran las únicas verdaderamente seguras. La prueba que se requería con más urgencia era la de la consistencia de la aritmética elemental, porque muchas pruebas de consistencia relativa, como las de las geometrías euclídea y no euclídea, eran relativas a la aritmética elemental. El punto de partida debía ser la axiomatización de la aritmética de los números naturales. Peano había proporcionado esta axiomatización de la aritmética, que ya mencionamos en el Capítulo 1 (véase el Apéndice 2.11, para la formulación original y el Capítulo 2.6 para una presentación como teoría de primer orden). Hilbert y Ackermann consiguieron en 1928 hallar una prueba absoluta de la consistencia de la lógica de primer orden, pero no pudieron probar la consistencia 179
A PÉNDICE 1
de la aritmética de Peano. J. Herbrand, por su parte, probó en 1929 la consistencia absoluta de la aritmética de Peano sin el axioma de inducción, es decir, de un fragmento de la aritmética elemental. Este resultado alentó las esperanzas de encontrar una prueba absoluta de la consistencia de toda la aritmética. Los teoremas de Gödel de 1931 mostraron, sin embargo, que hay dos limitaciones fundamentales para los sistemas axiomáticos como el de Peano, y una de ellas afecta directamente a las pruebas de consistencia. El llamado primer teorema de Gödel prueba la incompletitud respecto de la negación de cualquier sistema axiomático efectivo (esto es, que cumpla con las cuatro condiciones de efectividad señaladas en el Capítulo 2.6) lo suficientemente rico como para incluir a la aritmética de Peano. sistema axiomático consistente incluya a la aritmética de Peano es incompleto respecto de la negación.
Primer teorema de Gödel. Todo
S
que
El primer teorema de Gödel nos dice que si el sistema es consistente, existe en el sistema formal alguna fórmula χ, tal que ni χ ni ¬ χ es demostrable, a menos que se pierda la consistencia, esto es, si χ es demostrable, también lo es ¬ χ. Consiguientemente, todo sistema axiomático consistente de aritmética contendrá fórmulas formalmente indecidibles. Este teorema muestra que no es posible construir un sistema axiomático efectivo que sea a la vez consistente y completo, y permita formalizar la aritmética elemental. De un modo más general, el teorema prueba que las propiedades de axiomatizabilidad, consistencia y completitud de una teoría matemática son conjuntamente incompatibles. Una teoría sólo puede tener dos de estas propiedades. Dado que la consistencia es indispensable, resulta necesario renunciar a alguna de las otras dos. Generalmente se sacrifica la completitud. En caso de que se quiera obtener una teoría matemática a la vez consistente y completa, ésta no podrá estar axiomatizada, por lo que se perderán todas las ventajas del método axiomático. El alcance de este resultado se extiende a todos los sistemas axiomáticos más ricos que la aritmética, como la teoría de conjuntos o las lógicas de orden superior. En cualquier sistema axiomático de estas características habrá fórmulas formalmente indecidibles, esto es, tales que ni una fórmula ni su negación son teoremas del sistema. Se sigue de ello que, cuando se interpreta de manera adecuada el lenguaje de un sistema axiomático formal de aritmética, existen proposiciones aritméticas que son verdaderas pero no son demostrables en el sistema. Supongamos, en efecto, que Φ y ¬ Φ son fbf del sistema S , tales que ninguna de las dos es teorema en S . Sin embargo, en cualquier interpretación del lenguaje de S una de las dos será verdadera y la otra falsa (por el principio de tercero excluido). Pero dado que ninguna de las dos es demostrable como teorema en S , resulta que hay verdades matemáticas que no son teoremas de 180
L AS
PRUEBAS DE CONSISTENCIA
S .
Por tanto, en dicho sistema, no son demostrables todas las verdades aritméticas. De esta manera, resulta que el conjunto de las proposiciones verdaderas de la aritmética no coincide con el conjunto de las proposiciones demostrables en un sistema axiomático consistente que contenga a la aritmética. La situación no puede evitarse extendiendo el sistema. Podríamos pensar en remediar la incompletitud de S agregando la fórmula Φ como axioma de un nuevo sistema extendido S’ , o bien agregando otros axiomas que nos permitan probar como teorema a Φ (o bien a su negación). Sin embargo, el sistema extendido resultante también será incompleto respecto de la negación, por lo que contendrá otras fórmulas que no son teoremas, pero, sin embargo, expresan una verdad matemática. La situación se repetirá indefinidamente para cualquier sistema axiomático consistente que contenga a la aritmética, no importa cuánto se extienda su base axiomática. En conclusión, el primer teorema de Gödel implica que no es posible construir un sistema axiomático en el cual puedan demostrarse todas las verdades matemáticas. El llamado segundo teorema de Gödel afirma que la consistencia de un sistema axiomático efectivo que incluya a la aritmética de Peano no se puede demostrar dentro del propio sistema: todo sistema axiomático consistente S que incluya a la aritmética de Peano, no es demostrable la fórmula Con.( S ) que expresa formalmente la consistencia del sistema.
Segundo teorema de Gödel. En
Este resultado tiene un amplio alcance porque vale para cualquier sistema axiomático, expresado en cualquier lenguaje formalizado, donde las nociones de símbolo, fórmula, axioma y prueba sean efectivas; sólo se requiere que la aritmética de Peano sea expresable en el sistema. Para cualquier sistema de esta clase, si el sistema es consistente, su propia consistencia no se puede probar por medio de argumentos que son totalmente formalizables dentro de ese sistema. Por ejemplo, si las teorías axiomáticas de conjuntos ZF y VNBG son consistentes, ninguna prueba de este hecho es realizable en ZF o en VNBG. Los teoremas de Gödel obligaron a reconsiderar el programa de Hilbert y su escuela y a debatir la difícil cuestión de cuáles son los tipos de pruebas aceptables en la investigación metateórica. Originalmente Hilbert sólo admitía pruebas finitarias de consistencia. La caracterización de este tipo de pruebas nunca ha sido completamente clara, pero en principio son aquellas que permiten establecer por inspección directa y en un número finito de pasos si un objeto posee o no una determinada propiedad. En el caso de las demostraciones en un sistema formal, éstas deben ser secuencias finitas de fórmulas de extensión finita. Además, toda prueba debe tener un número finito de premisas y no apelar nunca, de manera implícita o explícita, a conjuntos infinitos. Un pasaje bien conocido 181
A PÉNDICE 1
de Herbrand, en su artículo “Sur la non-contradiction de l’arithmétique” ( Journal für die reine und angewandte Mathematik, 166 (1932) pp. 1-8), resume las características principales de las pruebas finitarias, que, en ese momento, también fueron llamadas “intuicionistas”, porque se pensó que cumplían con los requisitos de una prueba constructiva efectuada mediante los recursos demostrativos de la lógica intuicionista. Entendemos por razonamiento intuicionista un razonamiento que satisface las siguientes condiciones: en él se considera sólo un número finito y determinado de objetos y de funciones; éstas están bien definidas, de manera que su definición permite calcular unívocamente su valor; nunca se afirma la existencia de un objeto sin dar el medio de construirlo; nunca se considera el con junto de todos los objetos x de una totalidad infinita; y cuando se dice que un razonamiento (o un teorema) es verdadero para todo x , esto significa que para cada x tomado en particular se puede repetir el razonamiento general en cuestión, el cual no debe considerarse sino como el prototipo de estos razonamientos particulares. (Herbrand 1932, p. 3, nota 3).
Las pruebas matemáticas tradicionales que emplean el razonamiento inducti vo, caen, en sentido amplio, bajo esta caracterización de prueba finitaria. En una prueba inductiva la base de la prueba consiste en la afirmación de que el primer número natural (cero o uno) tiene una determinada propiedad ϕ, y el paso inductivo consiste en la afirmación de que para cualquier número natural n, si n tiene la propiedad ϕ, entonces, n + 1 (o, lo que es lo mismo, el sucesor de n ) también la tiene. La conclusión es que todo número natural tiene la propiedad ϕ. El llamado principio de inducción aritmética simple o finita puede formalizarse de la siguiente manera: ( ϕ(0) & ∀ x ϕ( x ) → ϕ( x + 1))) → ∀ x ϕ( x ). Hilbert también acepta entre las pruebas finitarias a todas aquellas que indican un proceso de construcción que pueda inspeccionarse directamente. Una prueba inductiva finita se concibe, entonces, como un esquema de prueba que indica cómo construir pruebas para todas las instancias ϕ( n ) de la conclusión general ∀ x ϕ( x ). Con todo, ninguna prueba de consistencia de la aritmética elemental pudo encontrarse utilizando la inducción matemática simple o finita. En 1935, G. Gentzen ofreció la primera prueba de la consistencia absoluta de la aritmética elemental, pero ésta no era una prueba finitaria de acuerdo con los criterios de Hilbert. Gentzen demostró que no es posible deducir contradicciones en la aritmética formalizada. La prueba de Gentzen empleaba un principio de inducción transfinita, es decir, una forma de inducción matemática que generaliza sobre conjuntos bien ordenados de números transfinitos, conjuntos que no son contables. La inducción transfinita sobre un conjunto no contable y bien ordenado C consiste en demostrar que todo elemento de C tiene una determinada 182
L AS
PRUEBAS DE CONSISTENCIA
propiedad ϕ. Para ello, procede a demostrar que si todos los predecesores de un elemento x de C tienen la propiedad ϕ, entonces, también x tiene esa propiedad. El principio de inducción transfinita se puede formalizar de la siguiente manera: ∀ x ( ∀ y (( y < x ) → ( ϕ( y ) → ϕ( x )))) → ∀ x ϕ( x ). Este principio no pertenece a la lógica de primer orden ni a la aritmética elemental, sino a una teoría formal más potente, como la teoría de conjuntos (de hecho, es equivalente al axioma de elección). Por consiguiente, su consistencia es dudosa, porque no hay garantía alguna de que la inducción transfinita no lleve a contradicciones. Posteriormente, se construyeron muchas otras pruebas de consistencia absoluta de la aritmética, pero todas ellas emplean alguna forma de inducción transfinita. Hasta el momento, no se ha podido probar que la consistencia de la aritmética sea demostrable con medios más débiles que los utilizados por Gentzen, en cuya demostración la inducción transfinita se realiza hasta el número ordinal ε0, que es el primer ordinal infinito α tal que ωα = α ( ω es el menor número ordinal transfinito). El principio empleado por Gentzen tiene la siguiente forma: ∀ x ( x < ε0 → ∀ y (( y < x ) → ( ϕ( y ) → ϕ( x )))) → ∀ x ( x < ε0 → ϕ( x )). Respecto de teorías matemáticas más ricas que la aritmética elemental, como las teorías axiomáticas de conjuntos, no existen pruebas absolutas de consistencia, sino sólo pruebas relativas. Por ejemplo, la consistencia de ZF puede probarse en VNGB, pero, como consecuencia del segundo teorema de Gödel, la consistencia del propio sistema VNGB no es demostrable dentro del mismo sistema. Para obtener una prueba de consistencia se requerirá otro sistema axiomático diferente, el cual sólo proporcionará otra prueba relativa de consistencia, sin que sea accesible una prueba de consistencia absoluta de éste. En caso de que pudiera construirse un sistema axiomático que permitiera deducir toda la matemática, la consistencia de ese sistema no podría probarse mediante recursos formalizables en la propia matemática. Esta limitación es insuperable por principio y muestra que el programa de Hilbert, en su forma original, es irrealizable. Después de los teoremas de Gödel y de la prueba de Gentzen, Hilbert y su escuela aceptaron que era necesario ampliar la clase de los medios de prueba admisibles en la metateoría de los sistemas formales incluyendo a la inducción transfinita entre tales procedimientos. Una vez que se hace esto, puede considerarse que la consistencia de la aritmética, en el sentido de que ésta no permite deducir contradicciones, ha sido efectivamente demostrada. Muchos matemáticos, sin embargo, han expresado dudas acerca del valor demostrativo de las pruebas que emplean la inducción transfinita. Parece, en efecto, difícil que esta clase de pruebas pueda justificarse por su carácter evidente o intuitivo. N. Bourbaki, por ejemplo, sostuvo (o mejor dicho, sostuvieron, ya que se trata de un grupo de matemáticos) que la certeza que se les atribu-
183
A PÉNDICE 1
ya “es esencialmente una cuestión de psicología personal de cada matemático” (Bourbaki 1974). Esta observación, sin embargo, deja sin resolver el problema principal. Éste no consiste solamente en definir con precisión lo que se entiende por “prueba finitaria”, ni en determinar si las pruebas por inducción transfinita cumplen con todos o algunos de los requisitos de una prueba finitaria. La cuestión fundamental es la de si existen criterios objetivos (no sujetos a las variaciones de la psicología personal de cada matemático) para determinar si una prueba matemática en general es aceptable o no. Todavía no tenemos una respuesta a esta difícil pregunta, por lo cual, en buena medida al menos, debemos seguir confiando en consideraciones informales y puramente intuitivas. Pero ¿qué certeza puede darnos la intuición en el dominio de los números y conjuntos transfinitos?
Notas bibliográficas Los trabajos pioneros de Herbrand y Gentzen sobre las pruebas de consistencia de la aritmética se encuentran, respectivamente, en Herbrand (1968) y Gentzen (1969). La obra fundamental de la escuela de Hilbert es la de Hilbert y Bernays (1934-1939). Detlefsen (1986) es una interpretación del programa hilbertiano. Los trabajos originales de Gödel, con excepción de los inéditos, se hallan compilados en Gödel (1989). Una recopilación más completa es Gödel (19862003). Todas estas son obras avanzadas que requieren conocimientos superiores a los expuestos en este libro. Torretti (1998) contiene una exposición de conjunto de los resultados de Herbrand, Gentzen y Gödel que sigue muy de cerca a las fuentes originales. Smullyan (1992) es una exposición sofisticada del teorema de incompletitud de Gödel. Este célebre teorema ha sido objeto de intensa refle xión filosófica, algunos de cuyos resultados pueden encontrarse en Shanker (1989). Smith (2007) contiene una exposición amplia y muy detallada, pero accesible, de los teoremas de Gödel y de otros temas afines de metamatemática, junto con diversas reflexiones filosóficas.
184
Apéndice 2 Axiomas y sistemas axiomáticos: de Ari Aristó stótel teles es a Kol Kolmo mogor gorov ov oy aquí la traducción de diferentes sistemas axiomáticos que tienen interés histórico, desde los tres axiomas enunciados por Aristóteles en el siglo IV A.C., hasta la axiomatización de la teoría de la probabilidad por A. Kolmogorov en 1933. Por razones de espacio, no incluyo comentarios ni aclaraciones a cada una de las diferentes formulaciones de definiciones, postulados y axiomas.
D
2.1 2. 1 Lo Los s tre tres s ax axio ioma mas s de Ar Aris istót tótel eles es
Aristóteles Aristótele s no construyó ningún sistema axiomático, axiomático , pero en los Segundos analíticos (Libro I, Capítulos 10 y 11) enunció a modo de ejemplo tres axiomas diferentes que, según él, son comunes a toda ciencia ( Analytica priora et poste- riora, ed. W. D. Ross y L. Minio-Paluello, Oxford, Clarendon Press, 1982). 1. [Princ [Principi ipioo de sustra sustracci cción ón de los iguales iguales]: ]: Si de iguales iguales se sustra sustraen en iguaiguales, los restos son iguales (I, 10, 76 a 41-42). 2. [Princ [Principi ipioo de no contra contradic dicció ción]: n]: No es posible posible afirmar afirmar y negar negar al mismo tiempo (I, 11, 77 a 10). 3. [Princ [Principi ipioo de tercero tercero excluid excluido]: o]: Todo es afirmado afirmado o negado negado (I, 11, 77 a 30). En la Metafísica Metafísica ofreció formulaciones más completas de los axiomas de no contradicción y tercero excluido ( Metaphysica, ed. W. Jaeger, Oxford, Clarendon Press, 1957). 2a. Es imposible que lo mismo simultáneamente pertenezca y no pertenezca a lo mismo y según el mismo respecto (IV, 3, 1005 b 19-20). 3a. No es posible que haya algún intermediario entre enunciados contradictorios, sino que es necesario afirmar o negar una cosa respecto de una cosa (IV, 7, 1011 b 23-24).
185
PÉNDICE 2 A PÉNDICE
2.2 2. 2 El si sist stem ema a de Eu Eucl clid ides es
El libro I de los Elementos de Euclides comienza con la siguiente lista de definiciones, postulados y axiomas, los cuales, como sabemos hoy, son insuficientes para probar todos los teoremas que constituyen la geometría euclídea ( Ele- menta, ed. J. L. Heiberg y E. Stamatis, Leipzig, Teubner, 1969-73, 4 vols.). Definiciones
1. Punto es lo que no tiene partes. 2. Línea Línea es una longitu longitudd sin anchura. anchura. 3. Los extremos extremos de la línea línea son puntos. puntos. 4. Recta es una línea que yace igualmente respecto de los puntos de sí misma. 5. Superfi Superficie cie es lo que sólo sólo tiene tiene longitud longitud y anchur anchura. a. 6. Los extremos extremos de la superfici superficiee son líneas. líneas. 7. Superficie plana es la que yace igualmente respecto de las rectas de sí misma. 8. Ángulo Ángulo plano plano es la inclinac inclinación ión de una hacia hacia otra otra de dos líneas líneas en un plano, las cuales se tocan pero no están en línea recta. 9. Cuando las líneas que comprenden comprenden al ángulo son rectas, el ángulo se llama recto. 10. Cuando una recta trazada sobre otra recta hace a los ángulos adyacentes iguales entre sí, cada uno de los ángulos iguales es recto, y la recta que está sobre la otra se llama perpendicular a ella. 11. Ángulo obtuso es el que es mayor que un recto. 12. Ángulo agudo es el que es menor que un recto. 13. Límite es lo que es el extremo de algo. 14. Figura es lo que está comprendido por ciertos límites. 15. Círculo es la figura plana comprendida por una línea tal que todas las rectas que caen sobre ella desde un punto situado dentro de la figura son iguales entre sí. 16. El punto se llama centro del círculo. 17. Diámetro del círculo es cualquier recta trazada a través del centro que termina en ambas direcciones en la circunferencia del círculo y que también bisecta al círculo. 186
EL SISTEMA DE EUCLIDES
18. Semicírculo es la figura comprendida por el diámetro y la circunferencia cortada por él. El centro del semicírculo es el mismo que el del círculo. 19. Figuras rectilíneas son las que están comprendidas por rectas; son triláteras las figuras comprendidas por tres, cuadriláteras las comprendidas por cuatro, y multiláteras las comprendidas por más de cuatro rectas. 20. Entre las figuras triláteras, un triángulo equilátero es el que tiene sus tres lados iguales, isósceles el que tiene sólo dos de sus lados iguales, y escaleno el que tiene sus tres lados desiguales. 21. Además, entre las figuras triláteras, triángulo rectángulo es el que tiene un ángulo recto, obtusángulo el que tiene un ángulo obtuso, y acutángulo el que tiene sus tres ángulos agudos. 22. Entre las figuras cuadriláteras, cuadrado es el que es equilátero y rectángulo, oblongo el que es rectángulo pero no equilátero, rombo el que es equilátero pero no rectángulo, y romboide el que tiene sus tres lados y ángulos opuestos iguales entre sí, pero no es equilátero ni rectángulo. Llamamos trapecios a las cuadriláteras diferentes de éstas. 23. Paralelas son las rectas que, si están en el mismo plano y se prolongan indefinidamente, no se encuentran en ninguna dirección. Postulados
1. 2. 3. 4. 5.
Trazar Trazar una recta desde desde cualqui cualquier er punto punto hasta cualqu cualquier ier punto. punto. Produc Producir ir una recta finita finita contin continuam uament entee en línea línea recta. recta. Dibujar Dibujar un círcul círculoo con cualqui cualquier er centro centro y distanci distancia. a. Todos Todos los ángul ángulos os rectos rectos son son iguales iguales entre entre sí. Si una recta recta que que cae cae sobr sobree otra otrass dos dos rect rectas as hace a los los ángu ángulo loss inte interio rio-res de un mismo lado menores que dos rectos, entonces, si las dos rectas se prolongan indefinidamente, se encuentran del lado en el que los ángulos son menores que dos rectos.
Axiomas
1. 2. 3. 4. 5.
Las cosa cosass que que son son igua iguale less a una una mism mismaa cosa cosa son igual iguales es entre entre sí. sí. Si iguales iguales se agregan agregan a iguales iguales,, los totales totales son son iguales. iguales. Si iguales iguales se sustra sustraen en de iguales, iguales, los los restos restos son iguales iguales.. Las cosas cosas que que coincid coinciden en entre entre sí son iguales iguales entre entre sí. sí. El todo todo es may mayor or que que la part parte. e. 187
PÉNDICE 2 A PÉNDICE
2.3 2. 3 Lo Los s ax axio ioma mas s de Ar Arqu quím ímed edes es pa para ra la es está tátic tica a
En su tratado Sobre el equilibrio de los planos o los centros de gravedad de los planos, Arquímedes dio una formulación axiomática de la estática ( Archimè- de, ed. Ch. Mugler, Paris, Les Belles Lettres, 1971, 3 vols.). Postulados
1. Postul Postulamo amoss que los pesos iguale igualess a iguale igualess distan distancia ciass están están en equil equili-ibrio, y que los pesos iguales a distancias desiguales no están en equilibrio, sino que se inclinan hacia el peso que está a mayor distancia. 2. Que si, cuando cuando pesos pesos a cier cierta tass dist distan anci cias as están están en equili equilibri brio, o, y algo algo se agrega a uno de los pesos, entonces, no están más en equilibrio, sino que se inclinan hacia el peso al que se le agregó algo. 3. Igua Igualm lment entee que, que, si algo algo se quita quita a uno uno de los pesos pesos,, no están están más en equilibrio, sino que se inclinan hacia el peso del que no se ha quitado nada. 4. Cuando Cuando se superpone superponenn figuras figuras iguales iguales y semeja semejantes ntes,, sus centros centros de gragra vedad también se superponen. 5. En las figuras figuras desiguale desigualess pero pero semejantes semejantes,, los centro centross de graveda gravedadd estarán situados de manera semejante. Decimos que dos puntos están situados de manera semejante en figuras semejantes, si las rectas trazadas desde estos puntos hacia ángulos iguales forman ángulos iguales con los lados homólogos. homólogos. 6. Si magnitud magnitudes es a ciertas ciertas distan distancia ciass están están en equilib equilibrio rio,, otras otras magnitud magnitudes es iguales a éstas también estarán en equilibrio a las mismas distancias. 7. En toda figur figuraa cuyo cuyo perímet perímetro ro es cónc cóncavo avo hacia hacia el mism mismoo lado lado,, el centro de gravedad debe estar dentro de la figura. 2.4 La ast astron ronomí omía a axi axiomá omática tica de Ari Arista starco rco
En su breve tratado Sobre los tamaños y las distancias del Sol y la Luna , escrito probablemente hacia 270 A.C., Aristarco de Samos intentó axiomatizar una teoría astronómica, o al menos una parte de ella, con el fin de ofrecer pruebas rigurosas de las distancias astronómicas conocidas en su tiempo (Th. L. Heath, Aristarchus of Samos, the Ancient Copernicus: A History of Greek Astronomy to Aristarchus together with Aristarchus’ Treatise on the Sizes and Distances of the Sun and Moon, Oxford, Clarendon Press, 1913. Reimpreso en New York, Dover, 1981).
188
L A
´ TICA DE ASTRONOMÍ´ A AXIOMÁ
A RISTARCO
Hipótesis
1. La Luna recibe su luz del Sol. 2. La Tierra está en relación de punto y centro respecto de la esfera de la Luna. 3. Cuando la Luna se nos aparece dividida en dos [o sea, como media Luna], el círculo mayor que divide a las partes clara y oscura de la Luna se inclina hacia nuestro ojo. 4. Cuando la Luna se nos aparece dividida en dos [o sea, como media Luna], su distancia al Sol es menor que un cuadrante por 1/30 de cuadrante. 5. La anchura de la sombra es la de dos Lunas. 6. La Luna subtiende 1/15 parte de un signo de zodíaco. 2.5 La estática de Jordano de Nemora
Hacia mediados del siglo XIII, Sobre la teoría del peso de Jordano de Nemora presentó una axiomatización de la estática diferente de la de Arquímedes. (El texto ha sido editado en E. Moody y M. Clagett (eds.) The Medieval Science of Weights, Madison, University of Wisconsin Press, 1960). Postulados
1. El movimiento de todo peso es hacia el centro del mundo, y su fuerza es la potencia que tiende hacia abajo y resiste el movimiento en la dirección contraria. 2. Lo que es más pesado desciende más velozmente. 3. es más pesado descendiendo, en cuanto su movimiento hacia el centro del mundo es más recto. 4. es más pesado en posición cuando en esa posición su descenso es menos oblicuo. 5. Un descenso más oblicuo es aquel que, en la misma distancia, participa menos de la vertical. 6. Un peso menos pesado en posición que otro es aquél que asciende cuando el otro desciende. 7. La posición de igualdad es la igualdad de los ángulos cerca de la vertical, o la rectitud de los ángulos, o la equidistancia de la regla respecto de la superficie del horizonte.
189
A PÉNDICE 2
2.6 La aritmética axiomática de Jordano de Nemora
La Aritmética de Jordano de Nemora, escrita hacia 1250, es el primer tratado axiomático dedicado enteramente a la aritmética. (El texto latino de esta obra se editó recién en 1991: H. L. L. Busard (ed), Jordanus De Nemore, De ele- mentis arithmetice artis: A Medieval Treatise on Number Theory , Stuttgart, Franz Steiner Verlag, 1991, 2 vols.). Definiciones
1. Unidad es la existencia separada de una cosa por sí misma. 2. Número es una cantidad colectiva de cosas separadas. 3. Una secuencia de números se llama natural cuando su cálculo se basa en la adición de una unidad. 4. El número por el cual un número mayor excede a uno menor se llama la diferencia entre esos números. 5. Los números se llaman equidistantes de otros números cuando sus diferencias son iguales. 6. Un número es multiplicado por otro cuando se suma a sí mismo tantas veces como unidades hay en el multiplicador; y el resultado de la multiplicación se denomina producto. 7. Se dice que un número numera a otro cuando lo produce después de ser multiplicado por cierto número. 8. Un número menor es parte de uno mayor cuando el menor numera al mayor; el numerado se llama un múltiplo del número numerador. 9. Un número denomina cuando una parte de él se toma en su totalidad. 10. Las partes que son denominadas por el mismo número se llaman similares. 11. El número por el cual otro es dividido se denomina divisor. 12. Las cosas en las que el dividendo es dividido se llaman partes. 13. La parte primera y simple de un número es la unidad. 14. Cuando dos números tienen una parte en común, tantas veces como la misma parte está en el número menor, tantas veces el número menor es parte del número mayor.
190
L OS AXIOMAS DE LA MECÁ ´NICA EN G ALILEO
Postulados
1. Cualesquiera iguales pueden tomarse de cualquier número. 2. Puede haber un número mayor que cualquier número por la cantidad que se quiera. 3. La serie de los números puede extenderse al infinito. Axiomas
1. Toda parte es menor que su todo. 2. Toda parte que tiene mayor denominación es menor . 3. Cualesquiera equimúltiplos del mismo número o de números iguales serán iguales. 4. Esos números también serán iguales a aquél cuyo mismo número es equimúltiplo o cuyos múltiplos son iguales. 5. La unidad es parte de todo número que es denominado por sí mismo. 6. Todo número contiene a la unidad tantas veces como la unidad es parte de él. 7. Si la unidad se multiplica por cualquier número, o el mismo número se multiplica por la unidad, se produce a sí mismo. 8. La diferencia de los extremos se compone de diferencias de los mismos al término medio. 2.7 Los axiomas de la mecánica en Galileo
En sus Discursos y demostraciones matemáticas en torno a dos ciencias nue- vas de 1638 Galileo realizó un intento de axiomatización de la mecánica que fue el antecedente más directo de la obra de Newton ( Le Opere, ed. A. Favaro, Firenze, G. Barbèra, 1966, Vol. VIII). Sobre el movimiento uniforme
Definición
1. Por movimiento igual o uniforme entiendo aquel en el que los espacios recorridos por un móvil en tiempos iguales cualesquiera son iguales entre sí.
191
A PÉNDICE 2
Axiomas
1. En el mismo movimiento uniforme, el espacio recorrido en un tiempo más largo es mayor que el espacio recorrido en un tiempo más breve. 2. En el mismo movimiento uniforme, el tiempo en el que se recorre un espacio mayor es más largo que el tiempo en el que se recorre un espacio menor. 3. El espacio recorrido con mayor velocidad es mayor que el espacio recorrido en el mismo tiempo con menor velocidad. 4. La velocidad con la que se recorre un espacio mayor, es mayor que aquella con la que se recorre en el mismo tiempo un espacio menor. Sobre el movimiento naturalmente acelerado
Definición
1. Llamamos movimiento igualmente o uniformemente acelerado a aquel que, partiendo del reposo, adquiere iguales incrementos de rapidez en tiempos iguales. Postulado
1. Supongo que los grados de velocidad adquiridos por el mismo móvil, en planos diferentemente inclinados, son iguales cuando las alturas de esos planos son iguales. 2.8 Las leyes del movimiento en Newton
En los Principios matemáticos de la filosofía natural , publicado en 1687, Newton formuló los tres axiomas más conocidos de la historia de la ciencia. El lector advertirá que el enunciado original de estas leyes, especialmente la segunda, es bastante diferente del que se encuentra en los libros de texto actuales sobre mecánica clásica ( Philosophiae naturalis principia matemática, ed. A. Koyré, I. Bernard Cohen y A. Whitman. Cambridge (Mass.), Harvard University Press, 1972, 2 vols.). Axiomas o leyes del movimiento
Ley I
Todo cuerpo persevera en su estado de reposo o de movimiento uniforme en línea recta, a menos que sea compelido a cambiar su estado por fuerzas impresas. 192
L AS
LEYES DEL MOVIMIENTO EN
NEWTON
Ley II
El cambio de movimiento es proporcional a la fuerza motriz impresa, y se realiza según la línea recta en la cual se ha impreso. Ley III
Para toda acción existe siempre una reacción contraria e igual: o bien, las acciones mutuas de dos cuerpos siempre son iguales y dirigidas hacia partes contrarias. 2.9 La óptica de Newton
En la Óptica, la segunda de sus grandes obras científicas, publicada en 1704, Newton presentó una base axiomática para esta parte de la física ( Opticks or a Treatise of the Reflections, Refractions, Inflections & Colours of Light , New York, Dover, 1952). Definiciones
1. Por rayos de luz entiendo sus partes mínimas, tanto las sucesivas en la misma línea como las contemporáneas en diversas líneas. 2. La refrangibilidad de los rayos de luz es su disposición a refractarse o desviarse de su camino al pasar de un cuerpo o medio transparente a otro. La mayor o menor refrangibilidad de los rayos es su disposición a desviarse más o menos de su camino, en iguales incidencias sobre el mismo medio. 3. La reflexibilidad de los rayos es su disposición a reflejarse o retornar al mismo medio desde cualquier otro medio sobre cuya superficie caigan. Son más o menos reflexibles aquellos rayos que retornan más o menos fácilmente. 4. Ángulo de incidencia es aquel ángulo contenido entre la línea descrita por el rayo incidente y la perpendicular a la superficie reflectante o refractante en el punto de incidencia. 5. Ángulo de reflexión o refracción es aquel ángulo contenido entre la línea descrita por el rayo reflejado o refractado y la perpendicular a la superficie reflejante o refractante en el punto de incidencia. 6. Los senos de incidencia, reflexión y refracción son los senos de los ángulos de incidencia, reflexión y refracción.
193
A PÉNDICE 2
7. Llamo luz simple, homogénea y similar a aquella cuyos rayos son igualmente refrangibles; y llamo compuesta, heterogénea o disimilar a aquella luz algunos de cuyos rayos son más refrangibles que otros. 8. Llamo primarios, homogéneos y simples a los colores de las luces homogéneas; y a los de las heterogéneas los denomino heterogéneos o compuestos. Axiomas
1. Los ángulos de reflexión y refracción están en uno y el mismo plano que el ángulo de incidencia. 2. El ángulo de reflexión es igual al ángulo de incidencia. 3. Si al rayo refractado se le hace retornar directamente al punto de incidencia, se refractará siguiendo la línea descrita anteriormente por el ra yo incidente. 4. La refracción de un medio más raro a otro más denso se hace hacia la perpendicular; es decir, de modo que el ángulo de refracción sea menor que el ángulo de incidencia. 5. El seno de incidencia y el de refracción están entre sí en una razón exacta o casi exacta. 6. Los rayos homogéneos que parten de diversos puntos de un objeto cualquiera y que caen perpendicularmente o casi perpendicularmente sobre un plano cualquiera reflectante o refractante o sobre una superficie esférica, divergirán luego de otros tantos puntos, o serán paralelos a otras tantas líneas, o convergerán a otros tantos puntos, ya sea exactamente o sin ningún error sensible. Lo mismo ocurrirá si los rayos se reflejan o refractan sucesivamente en dos, tres o más planos o superficies esféricas. 7. Dondequiera que los rayos que provienen de todos los puntos de un ob jeto cualquiera se encuentren de nuevo en otros tantos puntos, después de haber sido forzados a converger por reflexión o refracción, formarán una imagen del objeto sobre cualquier cuerpo blanco sobre el que caigan. 8. Un objeto visto por reflexión o refracción aparece en aquel lugar desde donde divergen los rayos, después de su última reflexión o refracción, al caer sobre el ojo del espectador.
194
L OS AXIOMAS DE F REGE
2.10 Los axiomas de Frege para la lógica de primer orden
En su breve libro Conceptografía, publicado en 1879, Frege presentó la primera axiomatización de la lógica formal de primer orden, aunque su sistema total es de segundo orden (G. Frege, Begriffsschrift, eine der arithmetischen nach- gebildete Formelsprache des reinen Denkens, Halle, Louis Nebert. Reimpreso en Hildesheim, Georg Olms, 1964). El sistema de primer orden es consistente y completo, pero sus axiomas no son todos independientes. J. Łukasiewicz demostró en 1929 que el tercer axioma es deducible de los dos primeros. Frege emplea un lenguaje formalizado de primer orden con identidad como el que se describe en el Capítulo 2.5. El sistema emplea cuatro reglas de transformación ya que, además de las reglas de separación y de generalización universal, necesita dos reglas de sustitución uniforme para los signos proposicionales y las constantes individuales. Estas reglas especifican que en todo teorema del sistema cualquier signo proposicional y cualquier constante individual pueden ser reemplazadas en todas sus apariciones, respectivamente, por cualquier otra fórmula bien formada y por cualquier otra constante individual. La formulación del sistema mediante esquemas de axiomas, como se hace actualmente, permite prescindir de estas dos reglas. (La notación de Frege se ha modernizado.) Axiomas
1. 2. 3. 4. 5. 6. 7. 8. 9.
p → ( q → p ) ( p → ( q → r )) → (( p → q ) → ( p → r )) ( p → ( q → r )) → ( q → ( p → r )) ( p → q ) → ( ¬ q → ¬ p ) ¬¬ p → p
p → ¬¬ p ( a = b ) → ( ϕ( a ) → ϕ( b )) a=a ∀ x ϕ( x ) → ϕ( a ))
2.11 Los axiomas de Peano para la aritmética
En 1889 Peano publicó en latín un breve pero importante opúsculo titulado Principios de aritmética expuestos según un nuevo método , en el que aparece la presentación original de los cinco axiomas para la aritmética de los números na-
195
A PÉNDICE 2
turales. Allí utilizó como primitivos los siguientes términos: la constante individual 1 (uno), el predicado monádico N (número natural), y el funtor unario +1 (sucesor de). Aquí transcribo los axiomas modernizando la notación simbólica de Peano. También agrego una paráfrasis de cada axioma en lenguaje natural, que no se encuentra en el texto original ( Arithmetices principia nova metodo ex- posita, Torino, Bocca, 1889). 1. 1 ε N [1 es un número natural]. 2. ( a ε N ) → ( a + 1 ε N ) [Si a es un número natural, el sucesor de a es un número natural]. 3. ( a, b ε N ) → (( a = b ) ↔ ( a + 1 = b + 1)) [Si a y b son números naturales, a es igual a b si y sólo si el sucesor de a es igual al sucesor de b]. 4. ( a ε N ) → ( a + 1 ≠ 1) [Si a es un número natural, el sucesor de a no es igual a 1]. 5. (( k ε K ) & (1 ε k ) & ∀ x (( x ε N & x ε k ) → ( x + 1 ε k ))) → N ⊆ k [Si k es una clase y 1 pertenece a k, y para todo objeto x , si x es un número natural y x pertenece a k, también el sucesor de x pertenece a k, entonces la clase de los números naturales está incluida en k]. ( K es una constante que, según Peano, significa clase o agregado de entidades). 2.12 La axiomática de Hilbert para la geometría euclídea
En 1899 Hilbert publicó la primera edición de su obra Fundamentos de geo- metría, en la que axiomatizaba de manera rigurosa, entre otras cosas, la geometría de Euclides. En la segunda edición de 1903, Hilbert agregó un nuevo axioma. Luego, en sucesivas ediciones fue modificando y corrigiendo los diferentes axiomas. La versión definitiva de su axiomatización de la geometría euclídea, en la séptima edición de su libro, consta de 20 axiomas divididos en 5 grupos. ( Grundlagen der Geometrie , 7ª ed. Leipzig, Teubner, 1930).
196
L A
´ TICA DE AXIOMÁ
HILBERT
Grupo I: axiomas de conexión
I.1. Dados dos puntos A, B hay siempre una recta que contiene a ambos puntos A, B . I.2. Dados dos puntos A, B no hay más que una recta que contiene a ambos puntos A, B . I.3. Hay siempre al menos dos puntos sobre una recta. Hay al menos tres puntos que no están sobre una recta. I.4. Dados tres puntos cualesquiera A, B, C que no están sobre una y la misma recta, hay siempre un plano α que contiene a cada uno de los puntos A, B, C. Para cada plano hay un punto contenido en él. I.5. Dados tres puntos cualesquiera A, B, C que no están sobre una y la misma recta, no hay más que un plano que contiene a cada uno de los puntos A, B, C . I.6. Si dos puntos A, B de una recta a están en un plano α, entonces cada punto de a está en el plano α. I.7. Si dos planos α, β tienen un punto A en común, entonces tienen al menos otro punto B en común. I.8. Hay al menos cuatro puntos que no están en un mismo plano. Grupo II: axiomas de orden
II.1. Si un punto B está entre un punto A y un punto C , entonces A, B, C son tres puntos diferentes de una recta, y B también está entre C y A. II.2. Dados dos puntos A y C hay al menos un punto B sobre la recta AC , tal que C está entre A y B . II.3. Dados tres puntos cualesquiera de una recta no hay más de uno que está entre los otros dos. II.4. Sean A, B, C tres puntos que no están sobre una línea recta, y sea a una recta en el plano ABC que no toca a ninguno de los puntos A, B, C : si la recta a pasa a través de un punto del segmento AB , entonces también pasa a través de un punto del segmento AC o a través de un punto del segmento BC .
197
A PÉNDICE 2
Grupo III: axiomas de congruencia
III.1. Si A, B son dos puntos sobre una recta a, y, además, A’ es un punto sobre la misma o sobre otra recta a’ , entonces siempre se puede encontrar un punto B’ sobre un lado de la recta a’ de A’ tal que el segmento AB es congruente o igual al segmento A’B’ . En símbolos: AB ≡ A’B’ . III.2. Si un segmento A’B’ y un segmento A’’B’’ son congruentes con el mismo segmento AB , entonces también el segmento A’B’ es congruente con el segmento A’’B’’ ; o más brevemente: si dos segmentos son congruentes con un tercero, entonces son congruentes entre sí. III.3. Sean AB y BC dos segmentos sin otros puntos en común sobre una recta a, y, además, sean A’B’ y B’C’ dos segmentos que no tienen otros puntos en común sobre la misma u otra recta a’ ; entonces, si AB ≡ A’B’ y BC ≡ B’C’ , entonces también siempre AC ≡ A’C’ . III.4. Sea ∠ ( h, k ) un ángulo en un plano α y a’ una recta en un plano α’ tal que un lado determinado de a’ sea dado en α’. Esto significa que h’ es una semirrecta de la recta a’ que sale del punto O’: entonces, hay en el plano α’ una y sólo una semirrecta k’ tal que el ángulo ∠ ( h, k ) es congruente o igual al ángulo ∠ ( h’, k’ ) y a la vez todos los puntos interiores del ángulo ∠ ( h’, k’ ) están sobre el lado dado de a’ . En símbolos: ∠ ( h, k ) ≡ ( h’, k’ ). Todo ángulo es congruente con sí mismo, es decir, se da siempre ∠ ( h, k ) ≡ ( h, k ). III.5. Si para dos triángulos ABC y A’B’C’ valen las congruencias AB ≡ A’B’ , AC ≡ A’C’ , ∠ BAC ≡ ∠ B’A’C’ , entonces también se cumple siempre la congruencia ∠ ABC ≡ ∠ A’B’C’ . Grupo IV: axioma de las paralelas
IV.1. (Axioma de Euclides). Sea a una recta cualquiera y A un punto exterior a a: entonces, en el plano determinado por a y A, hay a lo sumo una recta que pasa a través de A y no corta a a. Grupo V: axiomas de continuidad
V.1. (Axioma de medida o axioma de Arquímedes). Si AB y CD son segmentos cualesquiera, entonces hay un número n tal que n segmentos CD construidos de manera contigua de A, a lo largo de la semirrecta de A a B , pasan más allá del punto B .
198
L OS AXIOMAS DE HUNTINGTON
V.2. (Axioma de completitud lineal) El conjunto de los puntos de una recta, con sus relaciones de orden y congruencia, no admite una extensión en la que se preserven las relaciones existentes entre los elementos originales, así como las propiedades fundamentales de orden y congruencia que se siguen de los axiomas I-III y V.1. 2.13 Los axiomas de Huntington para la teoría de las magnitudes continuas
En su artículo “Un conjunto completo de postulados para la teoría de las magnitudes continuas absolutas” (“A Complete Set of Postulates for the Theory of Absolute Continuous Magnitude”, American Mathematical Society Transac- tions, 3 (1902) pp. 264-279). E. V. Huntington axiomatizó el análisis empleando como primitivos un conjunto C de elementos cualesquiera y un funtor de grado dos, ©, que denota una operación binaria entre elementos de C , a la que llamó regla de combinación. Postulados de magnitud
1. Para cualesquiera elementos a y b ( a = b o a ≠ b ), a © b es también un elemento del conjunto. 2. a © b ≠ a. 3. ( a © b ) © c = a © ( b © c ), siempre que a © b, b © c, ( a © b ) © c y a © ( b © c ) pertenezcan al conjunto. 4. Cuando a ≠ b al menos una de las siguientes condiciones es satisfecha: o bien, 1) hay un elemento x tal que a = b © x , o 2) hay un elemento y tal que a © y = b. 5. (Indiquemos con la notación a < b que existe un elemento y tal que a © y = b; e indiquemos con a ≤ b : a < b o a = b ). Si S es una secuencia infinita de elementos ( ak ), tal que ak < ak + 1, ak < c ( k = 1, 2, 3,…) (donde c es algún elemento fijo), entonces, hay uno y sólo un elemento A que tiene las dos propiedades siguientes: 1) ak ≤ A siempre que ak pertenezca a S; 2) si y y A’ son tales que y © A’ = A, entonces hay al menos un elemento de S, digamos ar , para el cual A’ < ar . 6. Cualquiera sea el elemento a , hay dos elementos x e y tales que x © y = a ; esto es, en la notación explicada en 5, hay un elemento x tal que x < a.
199
A PÉNDICE 2
2.14 Los axiomas de Zermelo para la teoría de conjuntos
En 1908 Ernst Zermelo publicó el artículo “Investigaciones sobre los fundamentos de la teoría de conjuntos”, que contiene la primera presentación axiomática de la teoría de conjuntos (“Untersuchungen über die Grundlagen der Mengenlehre”, Mathematische Annalen, 65 (1908) pp. 261-281). La formulación original de sus axiomas, con leves modificaciones en la notación simbólica, es la siguiente: 1. Axioma de determinación: Si cada elemento de un conjunto M es a la vez elemento de un conjunto N y a la inversa, es decir, si M ⊆ N y N ⊆ M , entonces, siempre M = N . O más brevemente: cada conjunto está determinado por sus elementos. 2. Axioma de los conjuntos elementales: Hay un conjunto (impropio), el con junto vacío ∅, que no contiene ningún elemento. Si a es una cosa del dominio, existe un conjunto { a} que contiene a a y sólo a a como elemento. Si a y b son dos cosas del dominio, existe siempre un conjunto {a, b}, que contiene como elementos a a y b, pero no a otra cosa diferente x . 3. Axioma de separación: Si el enunciado universal ϕ x está bien definido para todos los elementos de un conjunto M , entonces, M posee siempre un subconjunto M ϕ que contiene como elementos a todos los elementos x de M para los cuales ϕ x es verdadero, y sólo a ellos. 4. Axioma del conjunto potencia: A cada conjunto T le corresponde un segundo conjunto ℘T (el conjunto potencia de T ) que contiene como elementos a todos los subconjuntos de T , y sólo a ellos. 5. Axioma de unión: A cada conjunto T le corresponde un conjunto ∪T (el conjunto unión de T ) que contiene como elementos a todos los elementos de los elementos de T , y sólo a ellos. 6. Axioma de elección: Si T es un conjunto, cuyos elementos son todos con juntos no vacíos que no tienen elementos en común, la unión ∪T contiene al menos un subconjunto S1, el cual tiene un y sólo un elemento en común con cada elemento de T . 7. Axioma del infinito: El dominio contiene al menos un conjunto Z , que contiene como elemento al conjunto vacío y está constituido de manera que, a cada elemento suyo a le corresponde otro elemento de la forma {a}, o que junto con cada elemento suyo a también contiene como elemento al conjunto correspondiente { a}.
200
L A
TOPOLOGÍ´ A GENERAL DE
H AUSDORFF
2.15 La topología general de Hausdorff
En 1914 Félix Hausdorff axiomatizó la topología de conjuntos de puntos o topología general en su célebre libro Fundamentos de la teoría de conjuntos. La lógica subyacente del sistema es la teoría intuitiva de conjuntos. Los predicados “punto” y “entorno” son términos primitivos. Hausdorff emplea cuatro axiomas. Estos axiomas caracterizan a un espacio que tiene una estructura algo más rica que un simple espacio topológico. Un espacio topológico queda explícitamente definido por los primeros tres axiomas. Un espacio de Hausdorff es un espacio topológico que también satisface el cuarto axioma. Los axiomas se formulan de la siguiente manera ( Grundzüge der Mengenlehre , Leipzig, Veit, 1914, p. 213): Entendemos por espacio topológico un conjunto E donde a los elementos (puntos) x se les asignan ciertos subconjuntos U x , a los que llamamos entornos de x , de acuerdo con los siguientes: Axiomas de entorno
1. A todo punto x le corresponde al menos un entorno U x ; todo entorno U x contiene al punto x . 2. Si U x y V x son dos entornos del mismo punto x , entonces hay un entorno W x que es un subconjunto de ambos ( W x ⊆ ( U x ∩ V x ). 3. Si el punto y se encuentra en U x , entonces hay un entorno U y que es un subconjunto de U x ( U y ⊆ U x ). 4. Para dos puntos diferentes x, y hay dos entornos U x , U y sin un punto en común ( U x ∩ U y = ∅ ). 2.16 La lógica intuicionista
En 1930 Arend Heyting, precedido por intentos de Kolmogorov y Glivenko, logró axiomatizar la lógica proposicional intuicionista, la principal lógica rival de la clásica (“Die formalen Regeln der intuitionistichen Logik”, Sitzungsberichte der Preussischen Akademie der Wissenschaften, Berlin 1930, pp. 42-56; traducido en Mancosu (1998), pp. 311-327). En ese mismo trabajo Heyting prueba la independencia de todos sus axiomas. Aquí los transcribo adaptando el simbolismo lógico al empleado en este libro. Los términos primitivos del sistema son los signos proposicionales, p, q, r , y las constantes lógicas, &, v, → y ¬. El sistema requiere dos reglas de transformación: la regla de separación y una regla de sustitución uniforme para signos proposicionales (véanse las observaciones al respecto en el Apéndice 2.10).
201
A PÉNDICE 2
Axiomas:
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
p → ( p & p ) ( p & q ) → ( q & p ) ( p → q ) → (( p & r ) → ( q & r )) (( p → q ) & ( q → r )) → ( p → r ) q → ( p → q ) ( p & ( p → q )) → q p → ( p v q ) ( p v q ) → ( q v p ) (( p → r ) & ( q → r )) → (( p v q ) → r ) ¬ p → ( p → q ) (( p → q ) & ( p → ¬ q )) → ¬ q
Si se suprime el axioma 10 de este sistema, se obtiene la lógica minimal elaborada por I. Johansson en 1936 y concebida como una contracción de la lógica intuicionista (“Der Minimalkalkül, ein reduzierter intuitionistischer Formalismus”, Compositio Mathematica, 4 (1936) pp. 119-136). En cambio, si al sistema de Heyting se le agrega como axioma el principio de tercero excluido ( p v ¬ p ), se obtiene una axiomatización de la lógica proposicional clásica. Esta manera de presentar ambas lógicas sugiere que, desde un punto de vista sintáctico, la lógica clásica es una simple extensión de la lógica intuicionista, ya que se obtiene agregando un solo axioma. Sin embargo, desde el punto de vista semántico (al menos, de la semántica clásica) es una lógica muy diferente. La lógica intuicionista no es veritativo-funcional y sus conectivas no tienen matrices finitas características. Todas las conectivas deben tomarse como primitivas, ya que no son interdefinibles como en la lógica clásica. La razón de ello es que en la lógica intuicionista no son válidas las equivalencias de la lógica clásica que permiten reducir el número de conectivas no definidas. Por ejemplo, las fórmulas ( p → q ) ↔ (¬ p v q ) y ( p → q ) ↔ ¬ ( p v ¬ q ) no son teoremas de la lógica intuicionista. El significado de las conectivas intuicionistas se determina especificando en qué consiste una prueba de una fórmula que contiene dicha conectiva como operador principal. En el caso de la negación, una prueba de la fórmula ¬ χ es una construcción que, aplicada a cualquier prueba de χ, da como resultado algo absurdo, tal como la ecuación 0 = 1. Al poco tiempo de que apareciera la axiomatización de Heyting de 1930, Kurt Gödel reexaminó la lógica intuicionista y obtuvo otro de sus sorprenden202
L A
LÓGICA MODAL
tes resultados metateóricos. En un trabajo que tiene menos de dos páginas de extensión Gödel mostró cómo traducir la lógica intuicionista a una expansión de la lógica proposicional clásica (“Eine Interpretation des intuitionistischen Aussagenkalküls”, Ergebnisse eines mathematischen Kolloquiums , 4 (1931-32) pp. 39-40; reimpreso en Gödel 1989, pp. 115-116 y en Gödel 1986-2003, Vol. 1, pp. 301-303). Gödel comenzó por construir un sistema axiomático, al que llamó Σ, que agrega al cálculo proposicional clásico los siguientes axiomas: 1. Bp → p 2. Bp → ( B ( p → q ) → Bq ) 3. Bp → BBp Este sistema es una extensión de la lógica proposicional clásica. La expresión Bp significa “ p es demostrable”. El sistema emplea las reglas de sustitución y separación clásicas y una nueva regla de inferencia: ϕ / Bϕ, la cual debe entenderse como afirmando que si ϕ es demostrable (o sea, es un teorema), entonces, B ϕ también lo es. Gödel probó, entonces, que cualquier teorema del sistema de Heyting es también un teorema del sistema Σ, y conjeturó que la relación inversa también era válida. La conjetura resultó verdadera, en tanto todo teorema modal de Σ es traducible a un teorema del sistema de Heyting, que resulta, así, equivalente a la parte modal de Σ. Además, probó que si la fórmula Bp se interpreta modalmente como p (es decir, si se traduce “ p es demostrable” como “ p es necesario”), el sistema Σ resulta equivalente al sistema de lógica modal S4 de Lewis y Langford (véase el Apéndice 2.17). Por consiguiente, todo teorema de la lógica proposicional intuicionista es traducible a un teorema modal del sistema S4. El trabajo de Gödel mostró que existe una relación inesperada entre las lógicas clásica, modal e intuicionista. Al mismo tiempo, inauguró el estudio de la traducibilidad entre diferentes lógicas, que en el futuro se reveló como una herramienta sumamente fértil en el campo metateórico (Heyting 1971 y Dummett 2000 presentan la lógica y la matemática intuicionista; Epstein 1995 trata con detalle el cálculo minimal y las traducciones entre lógica clásica e intuicionista). 2.17 La lógica modal
La lógica de las modalidades como “posible” y necesario” se inicia en los Primeros analíticos de Aristóteles (I, 8-22) y se desarrolla ampliamente en la Edad Media, especialmente durante los siglos XIII y XIV. Sin embargo, hasta
203
A PÉNDICE 2
bien avanzado el siglo XX la lógica modal no logró clarificar sus fundamentos. Una vez que se axiomatizó la lógica clásica de primer orden, se emprendió la axiomatización de la lógica de las modalidades. La obra pionera en este campo fue la del lógico norteamericano Clarence Irving Lewis A Survey of Symbolic Logic (Berkeley, University of California Press, 1918). Allí se introdujo el concepto de implicación estricta, diferente del condicional material, y se ofreció la primera axiomatización de la lógica modal empleando la implicación estricta en la formulación de todos los axiomas. Lewis tomó como términos primitivos a las conectivas lógicas de negación y conjunción y al operador modal de posibilidad (¬, &, ◊ ). La implicación estricta entre proposiciones se define en términos de estos primitivos de la siguiente manera: p ⇒ q =def. ¬ ◊ ( p & ¬ q ). Las restantes conectivas se definen de la manera habitual en cualquier sistema de lógica clásica. La intuición que Lewis se propuso formalizar mediante la implicación estricta es que si una proposición implica estrictamente a otra, entonces, ésta se deduce de la primera. En su libro, escrito en colaboración con Harold Cooper Langford, Symbolic Logic (New York, The Century Company, 1932) Lewis formuló una secuencia de cinco sistemas axiomáticos de lógica modal, conocidos como S1-S5. Todos los sistemas están formulados empleando el concepto de implicación estricta. Aquí presentaré S5, que es el sistema más rico. Los términos primitivos y definidos del sistema son, respectivamente, ¬, &, ◊ y ⇒. El sistema emplea, además de las reglas de sustitución y separación, la regla de conjunción ( p, q / p & q ). Los axiomas son los siguientes: 1. 2. 3. 4. 5. 6. 7. 8.
( p & q ) ⇒ (q & p) ( p & q ) ⇒ p p ⇒ ( p & p ) (( p & q ) & r ) ⇒ ( p & ( q & r )) p ⇒ ¬¬ p (( p ⇒ q ) & ( q ⇒ r )) ⇒ ( p ⇒ r ) ( p & ( p ⇒ q )) ⇒ q ◊ p ⇒ ¬ ◊ ¬ ◊ p
La noción de implicación estricta de Lewis, pese a tener propiedades interesantes en sí misma, dejó de utilizarse para formular la lógica modal. La investigación metateórica de esta lógica mostró que los sistemas S1-S5 podían formularse utilizando exclusivamente los operadores modales de necesidad y posibilidad. También se esclareció el hecho de que la lógica modal es una extensión de la lógica clásica y no una lógica rival.
204
L OS
AXIOMAS DE
K OLMOGOROV
En una formulación más moderna, S5 se obtienen agregando a los axiomas de la lógica proposicional clasica ciertos axiomas específicamente modales. Los términos primitivos del sistema son las conectivas de negación y condicional y el operador modal de necesidad (¬, →, ). El operador modal de posibilidad se define como: ◊ A ↔def ¬ ¬ A. La implicación estricta no es necesaria en esta formulación porque el contenido modal ya está dado en los axiomas por los operadores de necesidad y posibilidad. No obstante, si se la quiere emplear, puede definirse así: A ⇒ B ↔def (A → B). Las reglas de inferencia que se emplean son las de separación y la de necesitación (A / A). El sistema utiliza esquemas de axiomas, por lo que no requiere la regla de sustitución. S5 se obtiene agregando al cálculo proposicional clásico (por ejemplo, el de Lukasiewicz presentado en el Capítulo 2.3, o cualquier otro equivalente) los siguientes axiomas: 1. 2. 3. 4.
◊
(A → B) → ( A → B) A → A A → A A → ◊ A
Si al cálculo proposicional clásico se le agrega sólo el axioma 1, se obtiene el sistema llamado K , que es el sistema minimal de lógica modal. Si a K se le agrega el axioma 2, se obtiene el sistema T . A su vez, si a T se le agrega el axioma 3, se obtiene el sistema S4 y, finalmente, si a S4 se le agrega el axioma 4, se obtiene el sistema S5. Así, cada uno de estos sistemas es una extensión de los que lo preceden (Chellas 1980; Epstein 1995; y Hughes y Cresswell 1996 contienen información detallada sobre estos y otros sistemas axiomáticos de lógica modal).
2.18 Los axiomas de Kolmogorov para la teoría de la probabilidad En su libro Conceptos fundamentales de la teoría de la probabilidad , publicado en 1933, A. Kolmogorov ofreció la primera axiomatización satisfactoria de la teoría de la probabilidad y probó la consistencia del conjunto de sus axiomas ( Grundbegriffe der Wahrscheinlichkeitsrechnung , Berlin, Springer, 1933, p. 2). Hay un conjunto E de eventos elementales x, y, z, ... . Hay una familia de subconjuntos ℑ de E . Sus miembros se llaman eventos azarosos. I. ℑ es un cuerpo de conjuntos (esto es, cerrado respecto de las uniones, intersecciones y complementos).
205
A PÉNDICE 2
II. ℑ contiene al conjunto E . III. A cada conjunto A de ℑ se le asigna un número real no negativo P( A ). IV. P( E ) = 1. V. Si A y B son disyuntos, P( A ∪ B ) = P( A ) + P( B ). Kolmogorov formula su sistema en un espacio de probabilidades infinito y emplea, además de los axiomas arriba citados, un axioma de continuidad que es equivalente al de aditividad contable (véase el Capítulo 5.4).
206
Apéndice 3 El concepto de función l concepto de función es un concepto fundamental de la matemática, para muchos el más importante de esta ciencia. A lo largo de este texto lo hemos empleado reiteradamente sin definirlo. En este apéndice ofrecemos una caracterización general de la idea de función. Una función es un tipo especial de relación entre dos conjuntos cualesquiera A y B (no necesariamente diferentes entre sí). Es una relación que a todo elemento del conjunto A le asigna un único elemento del conjunto B . Si hay una función entre los conjuntos A y B , ello quiere decir que no hay en el con junto A ningún elemento que esté relacionado con dos o más elementos del conjunto B , pero es posible que dos o más elementos de A estén relacionados con el mismo elemento de B . Formalmente podemos definir una función de esta manera:
E
◊ f es una función si y sólo si f es una relación tal que ∀( xyz ) (( x f y ) & ( x f z ) → ( y = z )).
Usualmente se escribe de la siguiente forma: f : A → B , expresión que se lee como “ f es una función de A en B” . El conjunto A es el dominio de la función y el conjunto B es el codominio o rango. Los elementos a del conjunto A son los argumentos de la función, mientras que los elementos f ( a ) del conjunto B (producidos por la aplicación de la función f al elemento a ) son los valores de la función. Una función unaria asigna a cada elemento del dominio un único elemento del codominio. Una función binaria asigna a cada par ordenado 〈 x, y 〉 de elementos del dominio un único elemento del codominio. Usualmente se la escribe de esta manera: f : A x A → B , pero a veces también se usa la notación f : A2 → B . En general, una función n-aria asigna a cada n-tupla de elementos del dominio un único elemento del codominio. Así pues, una función n-aria f , en general, es una relación n + 1–aria tal que ∀( x 1... x n ) ∀( yz ) ((( x 1... x n ) f y ) & (( x 1... x n ) f z ) → ( y = z )). Existen tres clases de funciones que nos interesa definir: las inyectivas, sur- yectivas y biyectivas.
207
A PÉNDICE 3
◊ Una función f : A → B se llama inyectiva si a elementos diferentes de A les asigna elementos diferentes de B . En símbolos: ∀( xyz ) (( x f y ) & ( z f y ) →
( x = z )).
◊ Una función f : A → B se llama suryectiva si todo elemento de B es el valor de f para algún elemento de A. En símbolos: ∀ y ∈ B ∃ x ∈ A ( x f y ). ◊ Una función f : A → B se llama biyectiva si es a la vez una función inyec-
tiva y suryectiva.
En una función biyectiva cada objeto del dominio está relacionado con un único objeto del codominio y, a la vez, cada objeto del codominio está relacionado con un único objeto del dominio. Consiguientemente, si existe una función biyectiva entre dos conjuntos cualesquiera, finitos o infinitos, tales conjuntos tienen el mismo número de elementos. La distinción entre funciones inyectivas, suryectivas y biyectivas no constituye una clasificación de las funciones porque hay funciones, como las biyectivas, que pertenecen a más de una categoría. Otro concepto que nos interesa definir es el de inversa de una función: ◊ Dada una función inyectiva f : A → B , la función inversa f -1: B → A es una función tal que ∀ x ∈ A ∀ y ∈ B (( x f y ) → ( y f x )).
Si la función f no es inyectiva, la función inversa f -1 no se puede definir. Caracterizaremos, por último, el concepto de función en
continua:
◊ Una función y = f ( x ) es continua en un punto a si y sólo si está definida
x = a y
lím f ( x ) = f ( a ).
x → a
Esto significa, de acuerdo con la definición habitual de límite, que para todo ε > 0 existe un δ > 0 tal que f ( x ) - f ( a ) < ε para todo x tal que x - a < δ. ◊ Una función es continua por la izquierda en el punto a si la condición an-
terior se cumple sólo para todos los valores de x menores que a, y es continua por la derecha si tal condición se cumple sólo para todos los valores de x ma yores que a; la función es continua en el punto a si y sólo si es a la vez continua por la izquierda y por la derecha en ese punto.
208
EL CONCEPTO DE FUNCIÓ´N
◊ Una función es continua si es continua en todos los puntos. ◊ Una función continua se llama bicontinua si su inversa también es continua.
El término aplicación se usa frecuentemente como sinónimo del término función. A veces, en cambio, se reserva este último término para las aplicaciones que tienen como dominio y codominio conjuntos de números, y se usa aplicación cuando se trata de otros conjuntos cualesquiera. Aquí hemos empleado el concepto de función en un sentido general, sin distinguir entre aplicaciones y funciones. También los términos transformación y operación se suelen utilizar, aunque con menos frecuencia, como sinónimos del de función.
Notas bibliográficas Los conceptos de función, límite y continuidad se explican con mayor detalle en cualquier texto de análisis matemático. El de Spivak (1994) es amplio y accesible. Se pueden encontrar definiciones claras de estos y otros términos del análisis en Borowski y Borwein (2006).
209
Bibliografía
Alchourrón, C., Méndez, J. y Orayen, R. (eds.) (1995), Lógica, Madrid, Trotta. Aleksandrov, A. D., Kolmogorov, A. N. y Lavrentev, M. A. (1969), Mathematics: Its Content, Methods and Meaning , Cambridge (Mass.), The MIT Press, 3 vols. Balzer, W. (1982), Empirische Theorien: Modelle-Strukturen-Beispiele , Braunschweig Wiesbaden, F. Vieweg & Sohn. (Traducción española corregida: Teorías empíricas: modelos, estructuras y ejemplos , Madrid, Alianza, 1997). Balzer, W., Moulines, C. U. y Sneed, J. (1987), An Architectonic for Science: The Structuralist Program, Dordrecht, Reidel. Baum, J. (1991), Elements of Point Set Topology , New York, Dover. (1.ª ed. 1964). Beaney, M. (ed.) (1997), The Frege Reader , Oxford, Blackwell. Benacerraf, P. y Putnam, H. (eds.) (1983), Philosophy of Mathematics: Selected Readings, Second edition, Cambridge, Cambridge University Press. Bernays, P. (1958), Axiomatic Set Theory , Amsterdam, North Holland. Beth, E. W. (1965), The Foundations of Mathematics: A Study in the Philosophy of Science, Amsterdam, North Holland, 2.ª ed. (1.ª ed. 1959). Blanché, R. (1955), L’axiomatique, Paris, Presses Universitaires de France. Blumentahal, L. M. (1980), A Modern View of Geometry , New York, Dover (1.ª ed. 1961). Bonola, R. (1955), Non-Euclidean Geometry: A Critical and Historical Study of its Development, New York, Dover. (1a ed. en italiano 1908) [Traducción española: Geometrías no euclidianas, Buenos Aires, Espasa-Calpe, 1945]. Borowski, E. J. y Borwein, J. M. (2006), Collins Web-linked Dictionary of Mathematics, New York, Collins, 2.ª ed. (1.ª ed. 1991). Bridge, J. (1977), Beginning Model Theory: The Completeness Theorem and Some Consequences, Oxford, Clarendon Press. Boolos, G., Burgess, J. y Jeffrey, R. (2007) Computability and Logic, Cambridge, Cambridge University Press, 5.ª ed. (1.ª ed. 1974).
211
EL JUEGO DE LOS PRINCIPIOS
Bourbaki, N. (1974), Eléments d’histoire des mathématiques , París, Hermann, 2.ª ed. (1.ª ed. 1969). Boyer, C. B. y Merzbach, U. C. (1989), A History of Mathematics, Second edition, New York, J. Wiley & Sons. (1.ª ed. 1968). Bunge, M. (1967), Foundations of Physics, Berlin-New York, Springer Verlag. Bunge, M. (1973), Philosophy of Physics, Dordrecht, Reidel. (Traducción española: Filosofía de la física, Barcelona, Ariel, 1978). Carnap, R. (1958), Introduction to Symbolic Logic and its Applications, New York, Dover. (1ª ed. en alemán 1954). Casati, R. y Varzi, A. (1999), Parts and Places: The Structure of Spatial Representation, Cambridge (Mass.), The MIT Press. Cavaillès, J. (1938), Méthode axiomatique et formalisme , Paris, Hermann. (Traducción española: Método axiomático y formalismo, México, UNAM, 1992). Chellas, B. F. (1980) Modal Logic: An Introduction, Cambridge, Cambridge, University Press. Church, A. (1956), Introduction to Mathematical Logic, Vol. I, Princeton, Princeton University Press. Cohen, P. (1966), Set Theory and the Continuum Hypothesis, New York, Benjamin. Collette, J. P. (1973-1979), Histoire des mathématiques, Montréal, Éditions du Renouveau Pédagogique, 2 Vols. (Traducción española: Historia de las matemáticas, México, Siglo XXI, 1985). Crossley, J.N. y otros (1972), What is Mathematical Logic?, Oxford, Oxford University Press. Curry, H. B. (1977), Foundations of Mathematical Logic, New York, Dover (1.ª ed. 1963). Cutland, N. J. (1986), Computability: An Introduction to Recursive Function Theory, Cambridge, Cambridge University Press. Dahan-Dalmedico, A. y Peiffer, J. (1986), Une histoire des mathématiques: Routes et dédales, Paris, Éditions du Seuil. Davis, M. (ed.) (1965), The Undecidable: Basic Papers on Undecidable Propositions, Unsolvable Problems and Computable Functions, New York, Raven Press, De Lorenzo, J. (1980), El método axiomático y sus creencias , Madrid, Tecnos. 212
BIBLIOGRAFÍ´ A
Detlefsen, M. (1986), Hilbert’s Program: An Essay on Mathematical Instrumentalism , Dordrecht, Reidel. Detlefsen, M., McCarty, D. y Bacon, J. (1999), Logic from A to Z, London, Routledge. Dopp, J. (1965), Notions de logique formelle, Louvain, Nauwelaerts. Drake, F. y Singh, D. (1996), Intermediate Set Theory , Chichester, John Wiley & Sons. Dummett, M. (2000) Elements of Intuitionism, Oxford, Oxford University Press, 2.ª ed. (1.ª ed. 1977). Durbin, J. R. (1992), Modern Algebra: An Introduction, 3ª ed. New York, John Wiley & Sons. (1ª ed. 1979) Earman, J. (1992), Bayes or Bust? A Critical Examination of Bayesian Confirmation Theory , Cambridge (Mass.), The MIT Press. Enderton, H. (2001) A Mathematical Introduction to Logic, New York, Academic Press, 2a ed. (1.ª ed. 1972). Eves, H. (1990), Foundations and Fundamental Concepts of Mathematics, 3ª ed. New York, Dover, reimpresión, 1997. (1.ª ed. 1958). Ewald, E. (ed.), (1996), From Kant to Hilbert: Readings in the Foundations of Mathematics, Oxford, Oxford University Press, 2 Vols. Ferreirós, J. (ed.) (2006), Georg Cantor: Fundamentos para una teoría general de conjuntos. Escritos y correspondencia selecta, Barcelona, Crítica. Fine, T. (1973), Theories of Probability, New York, Academic Press. Fraenkel, A. (1966), Abstract Set Theory, Amsterdam, North Holland, 3.ª ed. (1.ª ed. 1953). Fraenkel, A., Bar-Hillel, Y. y Levy, A. (1973), Foundations of Set Theory , Amsterdam, North Holland, 2.ª ed. (1.ª ed. 1958). Fraïssé, R. (1982), “Les axiomatiques ne sont-elles qu’un jeu?”, en: Guénard, F. y Lelièvre, G. (eds.), Penser les mathématiques, Paris, Éditions du Seuil, 1982, pp. 39-57. Garciadiego, A. (1992), Bertrand Russell y los orígenes de las paradojas de la teoría de conjuntos, Madrid, Alianza. Gentzen, G. (1969), The Collected Papers of Gerhard Gentzen, ed. M. Szabo, Amsterdam, North Holland. 213
EL JUEGO DE LOS PRINCIPIOS
Gillies, D. (2000), Philosophical Theories of Probability , London-New York, Routledge. Gödel, K. (1989), Obras completas, ed. J. Mosterín, Madrid, Alianza, 2ª ed. Gödel, K. (1986-2003) Collected Works, ed. S. Feferman y otros, New York, Oxford University Press, 5 Vols. Grattan-Guinness, I. (ed.) (1994), Companion Enciclopedia of the History and Philosophy of Mathematical Sciences, London-New York, Routledge, 2 vols. Grattan-Guinness, I. (1997), The Fontana History of the Mathematical Sciences, London, Fontana. Grattan-Guinness, I. (2000), The Search for Mathematical Roots 1870-1940: Logic, Set Theories and the Foundations of Mathematics from Cantor Through Russell to Gödel, Princeton, Princeton University Press. Gray, J. (1989), Ideas of Space: Euclidean, Non-Euclidean, and Relativistic, Oxford, Clarendon Press, 2.ª ed. (1.ª ed. 1979). Gray, J. (2000), The Hilbert Challenge, New York, Oxford University Press. Halmos, P. R. (1974), Naive Set Theory , New York, Springer. (1.ª ed. 1960). Hamilton, A. G. (1982), Numbers, Sets and Axioms: The Apparatus of Mathematics, Cambridge, Cambridge University Press. Hamilton, A. G. (1988), Logic for Mathematicians, Cambridge, Cambridge University Press, 2.ª ed. (1.ª ed. 1978). Hart, W. D. (ed.) (1996), The Philosophy of Mathematics , Oxford, Oxford University Press. Hausdorff, F. (1914), Grundzüge der Mengenlehre, Leipzig, Veit. Hausdorff, F. (1927), Mengenlehre, Berlin, De Gruyter. Henkin, L., Suppes, P. y Tarski, A. (eds.), (1959), The Axiomatic Method, with Special Reference to Geometry and Physics , Amsterdam, North-Holland. Herbrand, J. (1968), Écrits logiques, Paris, Presses Universitaires de France. Hermes, H. (1971), Aufzählbarkeit, Entscheidbarkeit, Berechenbarkeit , Berlin, Springer (1.ª ed. 1961). (Traducción española parcial: Introducción a la teoría de la computabilidad , Madrid, Tecnos, 1984). Heyting, A. (1971) Intuitionism: An Introduction, Amsterdam, North Holland, 3.ª ed. (1.ª ed. 1956). 214
BIBLIOGRAFÍ´ A
Hilbert, D. (1918), “Axiomatisches Denken”, Mathematische Annalen, 78, pp. 405-415. Reimpreso en Gesammelte Abhandlungen, Berlin, Springer, Vol. 3, pp. 146-156. Hilbert, D. (1930), Grundlagen der Geometrie, Leipzig, Teubner. 7.ª ed. (1.ª ed. 1899). Hilbert, D. y Ackermann, W. (1959), Grundzüge der theoretischen Logik , Berlin, Springer, 4.ª ed. (1.ª ed. 1928). (Traducción española: Elementos de lógica teórica, Madrid, Tecnos, 1962). Hilbert, D. y Bernays, P. (1934-1939), Grundlagen der Mathematik, Berlin, Springer, 2 vols. Hodges, W. (1997), A Shorter Model Theory , Cambridge, Cambridge University Press. Howson, C. y Urbach, P. (2006) Scientific Reasoning: The Bayesian Approach , La Salle, Open Court, 3.ª ed. (1.ª ed. 1989). Hughes, R. I. G. (ed.) (1993), A Philosophical Companion to First-Order Logic , Indianapolis, Hackett. Hughes, G. E. y Cresswell, M. J. (1996) A New Introduction to Modal Logic, London, Routledge. Hunter, G. (1996), Metalogic: An Introduction to the Metatheory of Standard First Order Logic, Berkeley, University of California Press. (1.ª ed. 1971). Jech, Th. (1997), Set Theory , 2.ª ed. corregida, Berlin, New York, Springer. (1.ª ed. 1978). Johnstone, P. T. (1987), Notes on Logic and Set Theory , Cambridge, Cambridge University Press. Kelley, J. L. (1955), General Topology , New York, Van Nostrand. Kelly, J. (1997), The Essence of Logic , London, Prentice Hall. Kleene, S. C. (1952), Introduction to Metamathematics, New York, Van Nostrand. Kleene, S. C. (1967), Mathematical Logic, New York, J. Wiley. Klimovsky, G. y Boido, G. (2005), Las desventuras del conocimiento matemático. Filosofía de la matemática: una introducción, Buenos Aires, A-Z editora. Kline, M. (1980), Mathematics: The Loss of Certainty , New York, Oxford University Press.
215
EL JUEGO DE LOS PRINCIPIOS
Kline, M. (1990), Mathematical Thought from Ancient to Modern Times , New York, Oxford University Press, 3 Vols. (1.ª ed. 1972). Kneale, W. y M. (1984), The Development of Logic , Oxford, Clarendon Press. (1.ª ed. 1962). Kolmogorov, A. N. (1933), Grundbegriffe der Wahrscheinlichkeitsrechnung , Berlin, Springer. Krantz, D., Luce, D., Suppes, P. y Tversky, A. (1971), Foundations of Measurement Vol. I: Additive and Polinomial Representations, New York, Academic Press. Kunen, K. (2009) The Foundations of Mathematics, London, College Publications. Kuratowski, K. (1948), Topologie, Vol 1, Warsaw, Pantwowe Wydawnictwo Naukowe, 2.ª ed. (1.ª ed. 1933). Kuratowski, K. (1961), Introduction to Set Theory and Topology , New York, Pergamon Press. Lavine, S. (1994), Understanding the Infinite, Cambridge (Mass.), Harvard University Press. Levy, A. (2002), Basic Set Theory , Second edition, New York, Dover (1.ª ed. 1979). Ludwig, G. (1985-1987), An Axiomatic Basis for Quantum Mechanics, Berlin, Springer, 2 Vols. Łukasiewicz, J. (1963), Elements of Mathematical Logic, Oxford, Pergamon Press (1.ª ed. en polaco 1929). Machover, M. (1996), Set Theory, Logic and their Limitations, Cambridge, Cambridge University Press. Manzano, M. (1989), Teoría de modelos, Madrid, Alianza. Margaris, A. (1990), First Order Mathematical Logic , New York, Dover, 2.ª ed. (1.ª ed. 1967). Mancosu, P. (1998), From Brouwer to Hilbert: The Debate on the Foundations of Mathematics in the 1920s, New York, Oxford University Press. Mates, B. (1972), Elementary Logic, New York, Oxford University Press, 2.ª ed. (1.ª ed. 1965). Mellor, D. H. (2005), Probability: A Philosophical Introduction , London, Routledge. Moore, G. H. (1982), Zermelo’s Axiom of Choice: Its Origins, Development and Influence, Berlin, Springer. 216
BIBLIOGRAFÍ´ A
Morse, A. (1965), A Theory of Sets , New York, Academic Press. Mosterín, J. (1980), Teoría axiomática de conjuntos, Barcelona, Ariel, 2.ª ed. (1.ª ed. 1971). Mosterín, J. (2000), Los Lógicos, Madrid, Espasa Calpe. Mosterín, J. y Torretti, R. (2010), Diccionario de Lógica y Filosofía de la Ciencia , Madrid, Alianza, 2.ª ed. (1.ª ed. 2002). Mueller, I. (1981), Philosophy of Mathematics and Deductive Structure in Euclid’s Elements, Cambridge, Mass., The MIT Press. Munkres, J. (2000), Topology , Englewood Cliffs, NJ, Prentice-Hall. Nagel, E., y Newman, J. R. (1986), Gödel’s Proof , New York, New York University Press. (1.ª ed. 1958). Narens, L. (1985), Abstract Measurement Theory , Cambridge (Mass.), The MIT Press. Pollard, S. (1990), Philosophical Introduction to Set Theory , Notre Dame-London, University of Notre Dame Press. Priest, G. (2001), An Introduction to Non-Classical Logic, Cambridge, Cambridge University Press. Quine, W. V. O. (1951), Mathematical Logic, Revised edition, Cambridge (Mass.), Harvard University Press. (1.ª ed. 1940). Quine, W. V. O. (1953), From a Logical Point of View , Cambridge (Mass.), Harvard University Press. Quine, W. V. O. (1969), Set Theory and its Logic , Cambridge (Mass.), The Belknap Press of Harvard University Press, 2.ª ed. (1.ª ed. 1963). Quine, W. V. O. (1982), Methods of Logic, 4.ª ed., Cambridge (Mass.), Harvard University Press. (1.ª ed. 1950). Resnik, M. (1997), Mathematics as a Science of Patterns, Oxford, Clarendon Press. Rey Pastor, J. y Babini, J. (1985), Historia de la matemática, Barcelona, Gedisa, 2 vols. Robb, A. A. (1914), A Theory of Time and Space, Cambridge, Cambridge University Press. Rosen, J. (1995), Symmetry in Science: An Introduction to the General Theory , New York, Springer. 217
EL JUEGO DE LOS PRINCIPIOS
Russell, B. (1956), Logic and Knowledge: Essays 1901-1950, Edited by R. Marsh, London, Unwin. Schoenfield, J. (1967) Mathematical Logic, New York, Academic Press. Shanker, S. G. (ed.) (1989), Gödel’s Theorem in Focus, London, Routledge. Shapiro, S. (1997), Philosophy of Mathematics: Structure and Ontology , New York, Oxford University Press. Shapiro, S. (2000), Foundations Without Foundationalism: A Case For Second-Order Logic, Oxford, Clarendon Press, 2.ª ed. (1.ª ed. 1991). Shapiro, S. (2000a), Thinking About Mathematics: The Philosophy of Mathematics , New York, Oxford University Press. Shapiro, S. (ed.) (2005) The Oxford Handbook of Philosophy of Mathematics and Logic, New York, Oxford University Press. Simons, P. (1987), Parts: A Study in Ontology , Oxford, Clarendon Press. Smith, P. (2007) An Introduction to Gödel’s Theorems , Cambridge, Cambridge University Press. Smullyan, R. M. (1992), Gödel‘s Incompleteness Theorems , New York, Oxford University Press. Smullyan, R. M. (1995), First-Order Logic, New York, Dover, 2.ª ed. (1.ª ed. 1968). Sneed, J. (1971), The Logical Structure of Mathematical Physics , Dordrecht, Reidel. Spivak, M. (1994), Calculus, Third edition, Berkeley, Publish or Perish, (1.ª ed. 1967). Stegmüller, W. (1973), Theorienstrukturen und Theoriendynamik, Berlin, Springer. (Traducción española: Estructura y dinámica de teorías, Barcelona, Ariel, 1983). Stewart, I. y Tall, D. (1979), The Foundations of Mathematics, Oxford, Oxford University Press. Stoll, R. (1979), Set Theory and Logic , New York, Dover (1.ª ed. 1963). Suppes, P. (1957), Introduction to Logic, New York, Van Nostrand. Suppes, P. (1972), Axiomatic Set Theory , New York, Dover, 2.ª ed. (1.ª ed. 1960). Suppes, P. (1993), Models and Methods in the Philosophy of Science: Selected Essays , Dordrecht, Kluwer.
218
BIBLIOGRAFÍ´ A
Suppes, P. (2002), Representation and Invariance of Scientific Structures, Stanford, CSLI Publications. Tarski, A. (1956), Logic, Semantics, Metamathematics: Papers from 1923 to 1938, Oxford, Clarendon Press. Tarski, A. (1959), “What is Elementary Geometry?, en: Henkin, L, Suppes, P. y Tarski, A. (eds.), pp. 16-29 Tarski, A. (1994), Introduction to Logic and to the Methodology of Deductive Sciences, New York, Oxford University Press, 4.ª ed. (1.ª ed. en polaco 1936). Tiles, M. (1989), Philosophy of Set Theory: An Historical Introduction to Cantor’s Paradise, Oxford, Blackwell. Tiles, M. (1991), Mathematics and the Image of Reason, London-New York, Routledge. Torretti, R. (1978), Philosophy of Geometry from Riemann to Poincaré , Dordrecht, Reidel. Torretti, R. (1993), “El método axiomático”, en: Moulines, C. U. (ed.), La ciencia: estructura y desarrollo, Madrid, Trotta, pp. 89-110. Torretti, R. (1998), El paraíso de Cantor: La tradición conjuntista en la filosofía matemática, Santiago de Chile, Editorial Universitaria. Tymoczko, Th. (ed.) (1998), New Directions in the Philosophy of Mathematics , Princeton, Princeton University Press, 2.ª ed. (1.ª ed. 1986). Van Heijenoort, J. (1967), From Frege to Gödel: A Source Book in Mathematical Logic, 1879-1931, Cambridge (Mass.), Harvard University Press. Von Plato, J. (1994), Creating Modern Probability: Its Mathematics, Physics and Philosophy in Historical Perspective, Cambridge, Cambridge University Press. Wang, H. (1962), “The Axiomatic Method”, en: Logic, Computers and Sets , New York, Chelsea Publishing Company, 1970, pp. 1-33. Wang, H. (1993), Popular Lectures on Mathematical Logic, New York, Dover. 2.ª ed. (1.ª ed. 1981). Whitehead, A. y Russell, B. (1910-1913), Principia mathematica , Cambridge, Cambridge University Press, 3 vols. Wilder, R. (1965), Introduction to the Foundations of Mathematics, New York, J. Wiley. 2.ª ed. (1.ª ed. 1952).
219