Inducción Inducción y p r o b a b ili il id a d
Colección Teorema
Max Black
Inducción y probabilidad con
Historia y justificación de la inducción por Al f o n s o G a r c ía Su á r e z y
Los métodos de inducción de M ili por J. L. Ma c k i e
A R D E T A C U
E D IC IO N E S
C Á T E D R A , S. A .
M a d rid
© Me Millan Publishing Company Inc. Ediciones Cátedra, S. A., 1979 Don Ramón de la Cruz, 67. Madrid-1 Depósito legal: M. 21.715-1979 ISBN: 84-376-0188-6 Printed in Spain
Impreso en Hijos de E. Minuesa, S. L. Ronda de Toledo, 24. Madrid-5 Papel: Torras Hostench, S. A.
índice
HISTORIA Y JUSTIFICACION DE LA INDUCCIÓN 1
II III
........................................................................................... ..................................................................
........................................................................................
11
is 25
INDUCCIÓN Y PROBABILIDAD In
d u c c íó n
1. In ducció n ................................................................................ Tipos de argumentaciones ind uctiva s ......................... H istoria de los métodos indu ctivos ............................. 2. El problema de la inducción ................................................ Punto de vista de Hume sobre la causalidad ............. Argumentos Neo-Humeanos ........................................ Modelo deductivo de justificac ión ............................... 3. Tipos de solución ................................................................... Recusación de la in ducció n........................................... Apoyo inductivo a la ind uc ción ................................... Defensas a priori .............................................................. Reconstrucciones ded uc tivas ........................................ á) Búsqueda de principios inductivos suprem os .. ó) El recurso a la probabilidad ................................ c) La construcción de C a rn a p ............................... Defensas pragm áticas ..................................................... a) La «vindicación» de R eichen bach...................... b) La perspectiva de P eirce....................................... La justificación com o pse udoproblem a......................
33 34 35 37 38 42 44 48 49 51 52 53 53 57 58 61 61 64 67
a) Planteamiento lingüístico del pr ob lem a ........... 68 71 b) Defensa del planteam iento lingüístico ..................
Bib l io g r a f ía ..................................................................................
77
Estudios generales ....................................................................... T erm in olo gía .................................................................................. Historia de los métodos indu ctivos .......................................... Problema de la justificación ....................................................... Recusación de la in d u cció n ........................................................ Defensas a prior i ........................................................................... Apoyo indu ctivo a la in ducció n................................................. Reconstrucciones deductivas...................................................... Defensas pragmáticas .................................................................. La inducción como pseudoproblema ....................................... Bibliografías e h is to ria s...............................................................
77 77 78 80 80 81 81 81 82 83 8+
P r o b a b il id a d La pro babilidad .............................................................................. El sentido común de la probabilidad ........................................... «Probablemente», «Probable» y «Probabilidad» ........... ¿M últiples sentidos de la pro bab ilidad?........................... Estructura del punto de vista del sentido común ........... Teoría matemática de la probabilidad ...................................... La probabilidad como m edida de co nju nto s ..................... Probab ilidad inversa y fórmula de B ay es ........................ Ley de los grandes números ............................................... Los significados de « probabilidad » ............................................ D og m atism o m a te m ático ....................................................... La teoría clásica y el principio de indiferencia .................. Teo rías ló g ic as....................................................................... Teorías de frecuencias.......................................................... Teorías subjetivas ................................................................. M éritos de las diferentes te o ría s ........................................ Un rompecabezas pendiente de solución ...........................
87 89 89 103 104 107 107 114 120 124 125 125 129 132 134 139 141
Bib l io g r a f ía .................................................................................
143
O bras generale s............................................................................. La m ate m ática de la p ro babilid ad............................................ Teorías clá sic as............................................................................. Teorías ló g ic as.............................................................................. Teorías frecuencíales ...................................................................
143 144 145 145 146
Teorías subj etiv as...................................................................... Bibliografías................................................................................
146 148
Los MÉTODOS DE INDUCCIÓN DE MILL Ilustraciones de los m éto dos ..................................................... Métodos de las concordancias y de la diferencia .................. a) Causas posibles ................................................................ b) Clasificación de estos m éto dos .....................................
151 154 155 157 c) M étodo positivo de las con co rdanc ias ....................... 158 159 d) M étodo negativo de las con cordan cias ...................... 160 é) M étodo de la diferencia ................................................. 161 j ) Método conjun to ............... 161 g) Variantes simples de estos m éto do s ............................ h) Variantes más com plejas................................................ 163 168 i) Proliferación de métodos válid os ................................ 169 J) U na extensión de los m éto dos...................................... Métodos de los residuos y de las variaciones concomitantes. 169 169 a) M étodo de los resid uos.................................................. b) M étodo de las variaciones con com itantes ....................... 171 174 Usos y aplicaciones de los métodos de elim inación ........... 175 a) M étodos de eliminación e inducción .......................... 176 b) M étodos de eliminación y determ inismo ................... c) Em pleo de los m éto dos.................................................. 176 177 d) Uso del método de la diferencia .................................. 179 e) Aplicación al descubrimiento de efectos .................... 179 f ) Aplicación del método de las con co rda ncias ............ g) Aplicación del método de las variaciones concom itantes............................................................................. 180 181 h) Otras aplicaciones ........................................................... Crítica de los mé tod os ............................................................... 181 Bib l
io g r a f ía
..............................................................................
Obras sobre in ducció n................................................................ Críticas a los métodos de M ili................................................ Elaboraciones de los métodos de M ili ............................. Otros estudios............................................................................
185
185 185 186 186
9
HISTORIA Y JUSTIFICACIÓN DE LA INDUCCIÓN Alfonso García Suárez C.D. Broad finaliza su libro The Philosophy o f Francis Bacon 1con estas palabras: «Inductive Reasoning... the glory of Science... the scandal of Philosophy». En ellas se encierra toda una concepción de la filosofía de la inducción. Al razonamiento inductivo se lo juzga glorioso en cuanto que está a la base del conocimiento científico y de las opiniones ordinarias sobre asuntos empíricos —la inducción es la «guía de la vida», como decía el obispo Butler. Pero se pretende que el razonamiento inductivo es un escándalo en cuanto que plantea un pro blema de justificación que ha enredado a los filósofos desde que David Hume expusiera sus conclusiones escépticas. De este modo, nos encontramos con dos pro blemas: (1) el problema constructivo del examen de los cánones inductivos y (2) el problema crítico de la justificación de la inducción. A ellos atenderemos posteriormente. Pero antes examinemos qué se entiende por ‘inducción’ y qué tipos de inducción tenemos. I La palabra ‘inducción’ proviene del vocablo griego π α γ ή , usado por Aristóteles principalmente para referirse al establecimiento de proposiciones universales 1 Cambridge, 1926. 11
por consideración de casos particulares que caen bajo γ ι ellas. Esta palabra está asociada con el verbo que Aristóteles usa a veces sin complemento, signifi cando «hacer una inducción», y otras con το κ α , θ ο λ ο ν («lo universal») como complemento. El sentido de esta palabra es el de «llevar a», y Aristóteles la emplea para indicar el proceso de llevar a alguien, por la contempla ción de casos particulares, a ver una verdad general. En los estudios sobre el tema solemos encontrar dos clases de definiciones distintas de la inferencia inductiva. De acuerdo con las de la primera clase, la inducción es el proceso por el que pasamos de lo particular a lo gene ral, o de proposiciones menos generales a otras más generales. Así Aristóteles traza su distinción entre in ducción y demostración indicando que la demostración va de lo universal a lo particular mientras que la inducción va de lo particular a lo universal2. Frente a este tipo de definición se ha aducido el hecho, observado ya por Mili3* , de que no es necesario que una inferencia inductiva lleve a una generalización; podemos extender la conclu sión a un número limitado de miembros desconocidos de una clase, por ejemplo, al siguiente miembro que aparezca, pasando así de particulares a particulares. En nuestro tiempo, Carnap ha subrayado la importancia de este tipo de razonamiento inductivo al que W. E. Johnson denominó educción*. Debido al carácter restrictivo de este tipo de definición, y haciéndose eco de las críticas mencionadas, es usual encontrar en la mayoría de los estudios contemporá neos un segundo tipo de definición de acuerdo con la cual la inducción es un argumento no demostrativo, en 2 Analíticos primeros 81a, 40b 1. En Tópicos 105“13 se encuentra la definición clásica: π α γ ή δ σ τ iv ή α π ό ν κ α 9 κ α σ τ ο ν επί ά κ α θ ό λ ο υ έ φ ο δ ο ς . En el mismo sentido W. S. Jevons, Elementary Lesson in Logic,
Londres, 1870, pág. 211. J A System of Logic, Londres, 1843, III, ¡v, págs. 2 y 3. ' W. E. Johnson, Logic, Cambridge, 1921-1924, III, iv. 12
el que la verdad de las premisas, aunque no entraña la verdad de la conclusión, constituye una buena razón para aceptarla. Tal es la definición que el profesor Max Black propone al comienzo de su artículo aquí recogido. La desventaja que tiene este tipo de definición es que se trata de una definición meramente negativa, por con traste. Viene a decir que una inferencia inductiva es aqué lla que no es deductiva. La característica de una infe rencia deductiva es que preserva la verdad: si sus premi sas son verdaderas —y la inferencia es correcta—^en tonces la conclusión es verdadera. Por el contrario, en el caso de una inferencia inductiva de la verdad de las premisas no se sigue la verdad de la conclusión. Es ló gicamente posible que las premisas sean verdaderas y la conclusión falsa. No pecamos de inconsistencia lógica si afirmamos sus premisas y negamos su conclusión. Podemos, alternativamente, formular la definición ha ciendo que no verse sobre la relación lógica existente entre premisas y conclusión de los argumentos inducti vos, sino sobre la naturaleza epistémica de tales argu mentos. Obtenemos así una nueva definición según la cual la inducción es el razonamiento de lo conocido a lo desconocido —que incluye, como caso especial, el razo namiento del pasado al futuro56 . En los Analíticos primeros *, Aristóteles ofrece el si guiente ejemplo de razonamiento inductivo: «El hombre, el caballo y el mulo son longevos; pero el hombre, el caballo y el mulo son todos los animales sin hiel; por tanto, todos los animales sin íiiel son longevos.» Y dice que la inducción procede por enumeración de todos los casos particulares que caen bajo una generalización. A este tipo de inducción se la denomina inducción sumativa, com pleta, o más específicamente, inducción sumativa por enu5 Es el modo en que Aristóteles define la inducción en Tópicos, 156*5. También fue dada como definición por Mili en su System o f Logic, III, ii, 1. 6 68\ 19-24. 13
meración completa. Las proposiciones por ella estableci
das son de una universalidad restringida, como veremos. En los Analíticos posteriores, Aristóteles se ocupa del silogismo demostrativo —i.e. del razonamiento silo gístico que parte de premisas necesarias— y escribe: «Nuestra propia doctrina es que no todo conocimiento es demostrativo. Por el contrario, el conocimiento de las premisas inmediatas es independiente de la demostra ción. La necesidad de esto es obvia, pues, dado que de bemos conocer las premisas previas a partir de las cuales procede la demostración y dado que el regreso debe acabar en verdades inmediatas, estas verdades deben ser indemostrables.»7Tales premisas primeras deben ser captadas por. intuición (νοΰς). Esta intuición intelectual tual de los principios es un tipo de inducción que procede «exhibiendo lo universal en cuanto implícito en lo parti cular claramente conocido»8. Ello sería imposible sin experiencia, pues es esencial a la doctrina aristotélica el que el conocimiento de individuos sólo es posible a través de la percepción sensible. A este tipo de inducción se la denomina inducción intuitiva o abstractiva. Las pro posiciones por ella establecidas presentan el doble ca rácter de necesidad y universalidad irrestricta. Se suele afirmar que Aristóteles sólo distinguió dos tipos de inducción, la sumativa9 y la ampliativa101 1 ; así William Kneale en su excelente tratado Probability and Induction n . Sin embargo, A. Lalande y G.H. von Wright12 señalan que hay un tercer sentido aristotélico 7 72b, 18. * An. Post. 71“ 8. * En An. Pr. II, xxiii. 10 En An. Bost., I, i y xviii; II, xix. 11 Oxford, 1949. Parte II, págs. 24-37. J.M. Keynes en A Treatise on Probability, Londres, 1921, pág. 274, es de la misma opinión. 12 A. Lalande, Les théories de induction et de experimentation, Paris, 1929, págs. 3 y 6. (Hay traducción castellana de José Ferrater Mora. Buenos Aires, 1944.) G.H. von Wright, The Logical Problem oj Induction, Oxford, 1957, pág. 8.
que aparece en los Tópicos. Allí Aristóteles define la inducción como paso de lo particular a lo general y ofrece como ejemplo «el argumento de que si el piloto ducho es el más efectivo, y asimismo el cochero ducho, entonces en general el hombre ducho es el mejor en su oficio particular»13. Afirma el estagirita que este tipo de inducción procede «de lo conocido a lo desconocido»14. Se la conoce con los nombres de inducción incompleta, problemática (W.E. Johnson) o, preferiblemente, am pliativa (C.S. Peirce). La esfera de aplicación más importante de este tipo de inducción es la ciencia natural. Una de las características más notorias de la inducción usada en la ciencia natural es que va en algún sentido más allá de las premisas, que son los hechos singulares de experiencia. De ahí su carácter ampliativo. Posibilita la inferencia desde hechos observados a hechos inobservados y, en particular, la predicción del futuro. Las proposiciones que establece son de una universalidad irrestricta. Más recientemente el nombre ‘inducción’ se ha aplicado a un procedimiento por el cual se establecen en matemática verdades de universalidad esencial e irrestricta. Tal procedimiento fue formulado explícitamente en el siglo diecisiete por el matemático francés Fermat. Se trata de un argumento que establece que si el primer miembro de una serie posee una propiedad, y también la posee el sucesor de cualquier miembro que la posea, entonces todos los miembros de esa serie poseen la pro piedad en cuestión. A este procedimiento se lo denominó inducción recursiva o matemática. Fue empleado sistemáticamente por James Bernoulli y de ahí que reciba también el nombre de inducción bemoulliana. Aunque este tipo de inducción establece proposiciones generales considerando casos particulares que caen bajo ellas, 13 Top., 105a 12 14 165a5. 15
difiere de la inducción sumativa en que no depende de una enumeración completa, y de la intuitiva en que de pende de la ordenación de sus casos en una serie. Es el momento de considerar si los diversos tipos de inducción examinados se adecúan a las definiciones que hemos reseñado al comienzo. Ya hemos visto que la educción invalida la definición primera (paso de lo par ticular a lo general). Si tomamos la definición segunda (argumento no demostrativo), vemos que sólo la induc ción ampliativa la satisface. En efecto, la inducción in tuitiva no es argumentativa: el establecimiento de la proposición general no se realiza por argumentación sino por un acto de intuición único. En cuanto a la induc ción recursiva y a la sumativa por enumeración com pleta se trata de tipos de argumentación lógicamente conclusivos. Esto es obvio en el caso de la inducción matemática. Veámoslo en el caso de la inducción com pleta 15. Supongamos que en mi pitillera hay tres cigarrillos a los que vamos a denominar c,, c1 y cy Podemos cons truir el siguiente argumento, paralelo al establecido por Aristóteles en el pasaje de los Analíticos primeros antes citado: «c,, c y c3 son de tabaco cubano; pero cv c2 y c3 son todos los cigarrillos que hay en mi pitillera; por tanto, todos los cigarrillos que hay en mi pitillera son de tabaco cubano». La conclusión a la que llegamos en este razonamiento inductivo por enumeración viene expresada por una oración —«Todos los cigarrillos que hay en mi pitillera son de tabaco cubano»— de una universalidad restringida. La restricción viene señalada por la descripción restringida «cigarrillos que hay en mi pitillera». Se trata de una cláusula que delimita una región espacio-temporal finita y por tanto sólo puede ser satisfecha por un número finito de cosas. Y no sola mente es su universalidad restringida sino también acci15 Véase sobre este punto W. Kneale, op. cit., págs. 25-30. 16
dental, a diferencia de la oración «Todos los planetas del sistema solar giran en tomo al sol», cuya universa lidad se restringe a un número finito de individuos pero no tiene un carácter accidental sino nómico. Pues bien, aunque Aristóteles traza en ocasiones una distinción entre silogismo e inducción1*, este razonamiento puede fácilmente convertirse en un silogismo. Llamemos al c y c el conjunto C. Tenemos conjunto formado por el siguiente silogismo: «Toaos los miembros del conjun to C son de tabaco cubano; todos los cigarrillos que hay en mi pitillera son miembros del conjunto C; por tanto, todos los cigarrillos que hay en mi pitillera son de tabaco cubano.» Si bien Aristóteles llega a llamar silogismo a este argumento, cree que no se trata de un silogismo pro piamente dicho, ya que en un silogismo el término medio debe ser intermedio entre el sujeto y el predicado de la conclusión en el sentido de ser fundamento de la inhe rencia del predicado en el sujeto. Pero en este caso la pertenencia al conjunto C no es el fundamento de que esos cigarrillos sean de tabaco cubano. De modo que el argumento considerado ofrece sólo una ratio cognoscendi, no una ratio essendi. Con todo, sea o no un silo gismo en el sentido aristotélico, se trata de un argumento deductivo en el que la conclusión es entrañada por las premisas. No podemos afirmar sus premisas y negar su conclusión sin contradecimos. Así pues, si aceptamos la definición segunda, no debemos contar el argumento inicial como inductivo. ¿Qué solución adoptar? Algunos filósofos optan por no aplicar el término ‘inducción’ a los argumentos de mostrativos. De esta manera, en su uso ‘inducción’ y ‘deducción’ designan tipos de argumentación mutua mente exclusivos. Y es con este tipo de inducción con el que se plantea el problema filosófico de la justifica-1 6 16 Así en An. Pr. 68b13: άπαντα
πα
ή ς.
σ τ ύ ο μ ν η δ ιά σ υ λ λ ο γ ι
ν ή
17
ción. Por el contrario, otros filósofos171 8denuncian esta actitud como implicando un solecismo irreconciliable con la tradición filosófica y con el uso común —el uso de Sherlock Holmes, por ejemplo. Sea como fuere, siempre que seamos conscientes de la demostratividad de la inducción completa y de la inducción recursiva, y siempre que lo seamos de la no demostratividad de la inducción ampliativa, el asunto se reduce a un debate terminológico. Lo cual no quiere decir que no se trate de un debate importante. II
La filosofía inductiva adquiere su adolescencia con la obra de Francis Bacon, el cual hizo el primer intento moderno de desarrollar una metodología de la ciencia natural. Con Bacon se inicia el esfuerzo por codificar en cánones o patrones formales los procedimientos que seguimos en el razonamiento inductivo. Se propende así al desarrollo de una lógica inductiva paralela a la lógica deductiva. Bacon creía que el sistema de lógica aristotélica era inútil para el descubrimiento científico porque no nos capacita para hacer predicciones. Su pro pósito fue establecer una lógica del descubrimiento. Advierte que no podemos asentar la verdad de una generalización inductiva coleccionando una serie de instancias que la confirman. Para Bacon, la inducción por enumera< puerile quiddam est», ya que constantemente «pe ción < riculo ab instantia contradictoria exponitur»'*. Pues por grande que sea el número de casos que confirmen una hipótesis —casos favorables—, nunca podemos excluir la posibilidad de que se presente ulteriormente un caso 17 Así A. Lalande, op. cit., cap. I, y S.E. Toulmin, The Uses o f Argument, Cambridge, 1958, cap. IV. 18 Distributio Operis I, pág. 137. 18
desfavorable. La teoría de la inducción baconiana se basa en la idea de que hay una asimetría lógica entre la confirmación y la eliminación de hipótesis. Aunque una hipótesis general nunca puede ser validada por ningún número, por grande que sea, de casos favorables, basta un caso desfavorable para que quede invalidada: Maior est vis instantiae negativae19. En esta asimetría entre las posibilidades de verificar —confirmar— y falsificar —eli minar— hipótesis universales reside la fuerza del método de eliminación en cuanto opuesto al método de confir mación o enumerativo. La doctrina de la inducción eliminatoria de Bacon va unida a su obscura teoría de las formas. Concibe las leyes naturales como enunciados en los que se conectan naturalezas generantes con naturalezas generadas. No está claro lo que Bacon entendía por ‘naturaleza’. Lalande sugiere que se trata de las propiedades o cualidades sensibles,la suma de las cuales constituye un cuerpo. De entre ellas hay un número limitado de naturalezas gene rantes o causas de las diversas naturalezas generadas o efectos. La tarea de la inducción es encontrar la natura naturans o forma de una naturaleza dada. Así podemos preguntamos cuál es la forma (causa) del calor. Para ello Bacon ideó Tres Tablas de Investigación: las tablas de presencia, ausencia y grados. La primera es la Tabla de Afirmación (regla de presencia). En ella ponemos casos que concuerdan en ser ejemplos de calor pero que son muy diferentes entre sí —el sol, el fuego, la san gre humana, etc.— y eliminamos aquellas circunstancias en que difieren entre sí. En la Tabla de Negación (ausen cia) agrupamos instancias negativas de calor que sin embargo son similares en muchos respectos a los indivi duos de la primera: los rayos de la luna, la sangre de los animales muertos, etc. Podemos entonces eliminar aquello que está presente cuando el calor está ausente. 19 Novum Organum, i, 46. 19
Finalmente, la Tabla de Comparación (grados) colec ciona ejemplos en los cuales el calor se halla en mayor o menor cantidad y eliminamos las circunstancias que no varían concomitantemente con la variación cuanti tativa del calor. Con la aplicación de este método Bacon llega a la conclusión —reivindicada por la teoría cinética de los gases— de que el movimiento es la causa del calor. Bacon concibió a veces sus Tablas como una especie de máquina inductiva y creía que el procedimiento eliminatorio alcanzaba una absoluta certeza. Ahora bien, dada la naturaleza lógica del método eliminatorio, tan sólo puede aseguramos de la falsedad de ciertas hipó tesis, nunca de la verdad de una hipótesis no eliminada. La certeza en cuanto a la verdad de una hipótesis la alcanzaríamos si fuera lógicamente posible eliminar to das las hipótesis alternativas excepto una. Y ello sólo es posible si admitimos que el número de propiedades lógicamente independientes de cualquier individuo es finito. Este supuesto está a la base de la filosofía induc tiva de Bacon. Ha sido propuesto posteriormente por J.M. Keynes como Postulado de Variedad Independiente Limitada20. Por lo que respecta a Bacon él creía que todos los fenómenos de la naturaleza son reducibles a combina ciones de un número limitado de elementos. Habría así un limitado alfabeto de la naturaleza formado por cualidades elementales cuya combinación constituiría a las cosas en lo que son. A pesar de estos supuestos dog máticos, Bacon se ve forzado a reconocer que, dado que no poseemos una tabla perfecta y completa de todas las cualidades elementales, hay que emplear otro método que consiste en el ensayo y error. Es la doctrina del in tellectus sibi permissus: permitimos al intelecto que siga su movimiento natural y proponga de un modo afirma tivo, ya no sólo negativo y eliminatorio, hipótesis sobre la causa oculta de los fenómenos. i0 J.M. Keynes, op. cit., pág. 251. 20
Desde Bacon se han sucedido diversos intentos de formalizar el proceso de generalización a partir de los datos, de encontrar reglas de acuerdo con las cuales se pueden obtener proposiciones inductivas a partir de casos singulares. Históricamente, el intento que alcanzó mayor resonancia fue el de John Stuart Mill en su System of Logic. Al igual que Bacon, Mill rechaza la inducción por enumeración. Entiende la inducción como una búsqueda de causas, explicando la causalidad en el sentido humeano como conjunción constante. El método que utiliza para descubrir causas es una adaptación de la inducción por eliminación baconiana. Pero en vez de las tres tablas de Bacon propone un conjunto de cinco métodos: el Método de las Concordancias —correspondiente al requisito baconiano de copresencia—, el Método de la Diferencia —correspondiente al requisito de coausencia—, el Método Conjunto —que es una mezcla de los dos anteriores—, el Método de las Variaciones Concomitantes —correspondiente al requisito de covariación— y el Método de los Residuos —que es una variante del de la Diferencia. El lector encontrará una exhaustiva caracterización de estos métodos en el artículo del profesor J.L. Mackie aquí recogido. Mediante estos procedimientos afirmamos que un tipo de evento es la causa de otro porque es el único candidato que satisface los requisitos para ser su causa. Ahora bien, este procedimiento carecería por completo de valor si no diésemos ya por sentado que debe haber alguna causa del suceso en cuestión. El Principio de Causalidad Universal desempeña entonces un papel básico en la filosofía inductiva de Mili. ¿De dónde procede tal principio? Mili, empirista consecuente, se ve obligado a ofrecer la respuesta circular de que este principio procede a su vez de la experiencia, de que es establecido por inducción. El aspecto hipotético del método científico que hemos visto reconocido en la doctrina baconiana de la inte21
llectus permissio, fue enfatizado por William Whewell, contemporáneo de Mili cuya obra no alcanzó la audien cia que merecía. Para Whewell el conocimiento está integrado por dos tipos de material distintos: sensacio nes e ideas, hechos e ideas, cosas y pensamientos, ver dades de experiencia y verdades necesarias, etc. Podemos, por brevedad, llamarlos el elemento empírico y el ele mento a priori. Sin el elemento empírico no habría rea lidad, pero sin el elemento a priori no habría conexiones. Incluso la oposición entre inducción y deducción puede considerarse como un ejemplo más de esta antítesis. El espacio, el tiempo, la causalidad, pertenecen al elemento a priori, que se combina con la sensación para producir conocimientos. Así la inducción parte de los elementos empíricos —hechos, datos, sensaciones, cosas—, conecta estos elementos por medio de elementos a priori —ideas, teorías, concepciones— y conduce a proposiciones ge nerales de las cuales pueden inferirse nuevos elementos empíricos por deducción. Para Whewell la oposición entre el método inductivo y el deductivo es artificiosa y se basa en un malentendido de la naturaleza de la inves tigación científica. Para llegar a una teoría científica no basta con una mera colección de datos como las que Ba con y Mili proponen. Es necesaria la coligación de los hechos por medio de una concepción verdadera y ade cuada. Ahora bien, no hay reglas metodológicas para formular esas concepciones adecuadas. El alcanzarlas depende de la sagacidad de los descubridores. Este es el modo en que procedieron Galileo y Kepler. Galileo creía que sólo las matemáticas pueden proporcionar inteligibilidad a la naturaleza. Su procedimiento con sistió en formular una hipótesis expresada en forma ma temática, deducir las consecuencias de esa hipótesis y someterla finalmente a prueba experimental. La polé mica entablada entre Mili y Whewell acerca de la in terpretación del descubrimiento por parte de Kepler de la ley de las órbitas planetarias elípticas revela sus res22
pectivas posiciones metodológicas21. Según Mill, Kepler se limitó a ver que todas las posiciones observadas del planeta Marte estaban en una elipse. Se trataba del des cubrimiento de un hecho constituido por la suma de sus observaciones. El no añadió nada de su parte. Whewell replicó que no era sólo la suma de las observaciones, sino la suma de las observaciones desde un punto de vista suministrado por la mente de Kepler. Insistió en que el hombre es el intérprete de la naturaleza, no un mero espectador. La naturaleza es un libro escrito en latín; tendremos que estudiar latín a fin de descubrir sus leyes. El descubridor debe consultar el libro de la naturaleza, pero también aprender el lenguaje de la ciencia. En toda inducción de resultados fructíferos interviene una con cepción que procede del material aportado por el des cubridor. En el caso de Kepler esta concepción fue la elipse. Whewell afirma que esas concepciones no son im puestas por los hechos observados, sino constituidas por la actividad de nuestra mente. Advirtió también la innovación lingüística que acompaña a toda inducción novedosa. En un descubrimiento como el de Kepler que establece que Marte se mueve en torno al Sol des cribiendo una órbita elíptica, o en el descubrimiento de Newton de que los planetas gravitan hacia el sol, los términos ‘órbita elíptica’ y ‘gravitar’ se aplican en lo sucesivo a los hechos como no habían sido aplicados antes. Si la historia de las ciencias inductivas es la his toria de los descubrimientos de hechos nuevos, la filo sofía de las ciencias inductivas es la historia de las ideas y concepciones mediante las cuales estos hechos fueron conectados. La concepción de la lógica inductiva de Whewell es también distinta de la de Mili. Whewell centra su aten ción no en el anáüsis del proceso que lleva a la generali 21 Véase W. Whewell, O f Induction, with Special Reference to Mr. J.S. Mill's System o f Logic, Londres, 1849. 23
zación de los datos en las leyes, sino en la descripción del proceso inverso por el que los hechos pueden ser deducidos de las leyes. La· inducción es concebida en tonces como el proceso inverso de la deducción. En su Novum Organun Renovatum22 presenta la lógica induc tiva como «el anáüsis de las doctrinas obtenidas induc tivamente en sus hechos constituyentes, y su ordenación de forma tal que pueda verse distintamente la conclusividad de la inducción». Las Tablas Inductivas de Whewell dan una jerarquía de proposiciones que comienza con datos particulares y asciende hacia leyes de mayor y mayor generalidad. El proceso ascendente no es de ductivo —las proposiciones más generales no se siguen de las menos generales—, pero el descendente forma una cadena de deducciones. De manera que para él tales deducciones «son el criterio de verdad inductiva, en el mismo sentido en que la demostración silogística es el criterio de verdad necesaria»23. Así las proposiciones generales son descubiertas por inducción y probadas por deducción. Whewell creía incorrectamente que este hecho proporciona una justificación lógica para el procedi miento inductivo. La tarea constructiva del examen de los procedimien tos inductivos ha alcanzado, tras las obras de Bacon, Whewell y Mili, metas de extraordinaria sofisticación y finura. El enfoque probabilístico de la inducción, que tiene su primer gran precursor en W.S. Jevons, ha sido desarrollado en nuestros días por J.M. Keynes y R. Car nap. El enfoque pragmatista o practicalista iniciado por C.S. Peirce ha recibido un notable desarrollo en manos de H. Reichenbach. Aunque hemos descrito la tarea de la lógica inductiva como independiente del problema de la justificación, históricamente el desarrollo de la pri mera se ha llevado a cabo con la mirada puesta en los problemas planteados por el escepticismo de Hume 22 Págs. 105. 23 Ibid. pág. 115. 24
acerca de cuestiones de hecho y existencia. El magistral estudio que el profesor Black realiza en los dos artículos que siguen me excusa del examen de las diversas posi ciones. Nos limitaremos a hacer unas breves observa ciones sobre el problema de Hume. III La inducción está a la base de una gran cantidad de nuestras creencias y acciones cotidianas. En nuestro pensamiento y conducta diarios hacemos inferencias in ductivas, actuamos sobre la base de creencias inducti vamente fundadas, anticipamos, generalizamos. No obs tante, nos sentimos inclinados a pensar que el uso de la inducción no sería racional a no ser que pudiéramos justificarlo. Si tal justificación no puede darse, todo el edificio del conocimiento humano parece apoyado en fundamentos arenosos. Algunos filósofos han puesto en duda el que el razonamiento inductivo sea en realidad una forma de razonamiento. Creen que se basa última mente en fe, que toda inferencia inductiva presupone lo que no puede ser justificado por la razón. La confianza que ponemos en las conclusiones inductivas les parece tan ciega e irracional como lo que un hombre supersti cioso pone en sus extravagantes creencias. Así Bertrand Russell en The Problems of Philosophy 24 afirma que si el principio de inducción falla, no tenemos ninguna buena razón para esperar que el sol salga mañana o que el pan sea más nutritivo que una piedra. Para Hume todo razonamiento sobre cuestiones de hecho y experiencia se funda en la relación causa-efecto. En su análisis de la causalidad Hume argumentó que la conexión causal entre dos acontecimientos no involucra ningún poder o fuerza que haga del efecto una conseLondres, 1912. (Traducción española de J. Xirau en Barcelona, 1928, 1970.) 25
cuencia necesaria de la causa. La conexión causal no puede justificar la inducción. En la percepción de un caso de supuesta acción causal —por ejemplo, el típico caso de las bolas de billar— yo percibo el movimiento de la prime ra bola, el impacto sobre la segunda y el movimiento de la segunda. Pero no experimento ningún poder causal. No hay nada en la realidad que corresponda a la idea de una «conexión necesaria» entre los dos eventos. Hume se basa aquí en la tesis empirista de que a toda idea significativa debe corresponderle una correspondiente impresión. Y puesto que la impresión correspondiente falta, concluyó que la idea de una conexión necesaria debe tener un origen psicológico. La observación re petida de la asociación de dos eventos nos lleva al hábito de esperar que la asociación continúe repitiéndose en el futuro. Si prescindimos de las peculiaridades psicológicas del análisis de Hume, la esencia lógica de su argumentación queda recogida en el Treatise of Human Nature donde dice: «No hay ningún objeto que implique la existencia de cualquier otro si consideramos esos objetos en sí mismos25.» Podemos reformular este principio diciendo que de una proposición que afirma la existencia de un cierto evento nunca se sigue lógicamente otra proposi ción que afirme la existencia de otro evento, distinto del anterior. Podemos imaginar perfectamente que la causa ocurre sin que el efecto tenga lugar y, como dice Hume, «nada de lo que podamos formar una idea clara y distinta es absurdo o imposible» 26. 25 I, iii, 6. 26 Ibid., I, i, 7. Este resultado de Hume es el mismo que el que Witt genstein formulara en el Tractatus logico-philosophicus, 5.135-5.136,1: «De ningún modo es posible inferir de la existencia de una situación la existencia de otra situación enteramente distinta de aquella. No existe nexo causal que justifique tal inferencia. No podemos inferir los eventos futuros de los presentes. La creencia en el nexo causal es la supers tición.» (Londres, 1932.)
Hume obtuvo con su análisis de la causalidad un re sultado filosófico de primera magnitud. Pero malinter pretó este resultado extrayendo de él consecuencias es cépticas. Supuso que la consecuencia de su análisis es que todas las inferencias a partir de la experiencia son efecto de la costumbre y que por tanto no estamos jus tificados racionalmente al extraerlas. De manera similar Russell indicó aue cuando tenemos una creencia fundada en la evidencia anterior no estamos en mejor posición que la gallina que, ante la presencia del hombre que la ha ali mentado hasta hoy, cree que seguirá haciéndolo... hasta que un día el granjero le retuerce el pescuezo. Para Hume, esta inevitable consecuencia de la razón no puede, sin embargo, minar nuestras creencias comunes, dado que «la naturaleza siempre mantendrá sus derechos y preva lecerá al fin sobre cualquier razonamiento abstracto»27. De este modo, sólo los impulsos de la naturaleza humana, en cuanto opuestos a las conclusiones de la razón, pue den librarnos de la autodestrucción. En la sección 481 de las Philosophische Untersuchungen 28 Wittgenstein escribe: «Si alguien dijera que la información sobre el pasado no puede convencerle de que algo vaya a suceder en el futuro, yo no lo entendería. Se le podría preguntar: ¿Qué esperas entonces oír? ¿Qué información llamas tú un fundamento para tu creencia? ¿A qué llamas ‘convicción’? ¿Qué tipo de convicción esperas? —Si estos no son fundamentos, debes poder indicar qué debe ser el caso para que podamos decir con derecho que hay fundamentos para nuestro supuesto. Pero adviértase: aquí fundamentos no son proposiciones de las que siga lógicamente lo creído. No es como si pudiera decir: para la creencia basta con menos que para el conocimiento—. Pues no se trata aquí de una aproxi mación a la inferencia lógica.» Wittgenstein pone en 27 Inquiry concerning Human Understanding, Sec. V, pt. I. 21 Oxford, 1953. 27
este pasaje el dedo en la llaga del escepticismo sobre la inducción. La razón por la que el escéptico encuentra irrazonables las inferencias inductivas es que no satisfacen las exigencias del razonamiento deductivo que él toma como modelo. Las premisas o fundamentos de una proposición inductiva nunca la entrañan, ciertamente. El escéptico supone que a menos que les añadamos algo a estos fundamentos no tenemos ningún derecho a consideramos justificados en la aceptación de conclusiones inductivas. A menudo este deseo de un algo más que convierta en conclusivos a los razonamientos inductivos se ha plasmado en el intento de hallar una premisa suprema que los vuelva deductivos. El principio de que el futuro se conformará al pasado (Hume), la ley de la uniformidad de la naturaleza (Russell), el postulado de limitación de la variación independiente (Keynes) son, entre otros, obvios candidatos a este puesto. ¿Pero cuál sería el status de esa premisa suprema? ¿Cómo la estableceríamos? Si la suponemos una verdad necesaria establecida a priori y si poseyera, junto con los fundamentos inductivos, el poder lógico requerido para entrañar la conclusión, entonces los fundamentos inductivos entrañarían independientemente la conclusión y el problema no surgiría. Si la suponemos una proposición contingente, entonces el único modo de establecerla sería a posteriori, apelando a la experiencia. Pero apelar a la experiencia, al respaldo inductivo, nos lleva a circularidad29. Hume fue consciente de que el supuesto de que el futuro será conformable al pasado no puede ser justificado a pos teriori, ya que toda justificación a posteriori tendría que presuponerlo. En el Inquiry30 escribe: «La prueba de esta última suposición por argumentos demostrables o argumentos sobre existencia debe evidentemente llevar 19 Véase sobre este punto P.F. Strawson, Introduction to Logical Theory, Londres, 1952, cap. 9. s" Sec. IV, pt.I. 28
a un círculo y dar por sentado lo que es el propio punto en discusión.» Las confusiones involucradas en el uso filosófico del principio de la uniformidad de la naturaleza se enraízan en la consideración de este principio como una propo sición que formula una verdad general, bien que abstrac ta, sobre la constitución del universo. Pero este principio no es una verdad concerniente al mundo sino un rasgo de nuestra imagen del mundo que proporciona un ideal en nuestras investigaciones científicas. Trata, para de cirlo con el Tractatus, sobre la red y no sobre lo que la red describe. Como Wittgenstein lo expresa: «La natu raleza de la creencia en la uniformidad de los sucesos quizá se vuelva más clara en el caso en que sentimos miedo de lo que esperamos. Nada podría inducirme a poner mi mano en la llama, —por más que sólo en el pasado me he quemado. La creencia en que el fuego me quemará es del mismo tipo que el miedo a que me queme31.» La idea es que si hablamos de la creencia en la uniformidad de la naturaleza nos estamos refiriendo a un rasgo fundamental de la vida humana. La creencia se manifiesta en una multitud de reacciones y espectativas. Creer en la uniformidad de la naturaleza no es algo distinto de actuar y reaccionar de esos modos en una multitud de casos. Tener la creencia es actuar y reaccio nar así. La exigencia de una justificación de la inducción en general, en cuanto opuesta a la petición de que justifi quemos una particular inferencia inductiva, es una exi gencia espúrea. Como Strawson ha señalado32, si un hombre me preguntara qué razones hay para pensar que es razonable sostener una determinada creencia inductiva, podría contestarle dando los fundamentos en . los que se apoya. Fundamentar una creencia inductiva31 Philosophische Untersuchungen, págs 472-473. 32 Op. cit. 29
mente obtenida significa entonces apelar a ciertas normas de validez inductiva. Pero si él formulase su pregunta con respecto a la razonabilidad del procedimiento inductivo en general, entonces su pregunta carecería de sentido, porque considerar razonable una creencia significa apelar a normas o patrones inductivos. Al aplicar los títulos ‘justificada’, ‘bien fundada’, etc., a creencias inductivas específicas, apelamos a normas inductivas. «¿Pero a qué normas apelamos cuando preguntamos si la aplicación de las normas inductivas es justificada o bien fundada? Si no podemos contestar, entonces no se ha dado ningún sentido a la pregunta. Compáresela con la pregunta: ¿Es la ley legal?»33 Así pues, nuestra conclusión es que el resultado de Hume es de naturaleza gramatical y no justifica el escepticismo en cuestiones de hecho y existencia. Decir que es imposible justificar la inducción es tanto como decir que el razonamiento inductivo no es deductivo, lo cual es una tautología. La tarea de la justificación de la inducción, tal como la propone el escéptico, equivale a la pretensión autocontradictoria de garantizar el que dos sucesos que no se implican lógicamente se impliquen lógicamente. Decir que no hay ningún objeto que implique la existencia de otro objeto si consideramos esos objetos en sí mismos equivale a decir que la proposición que afirma la ocurrencia del segundo no es entrañada por la proposición que afirma la ocurrencia del primero. En este sentido podemos concluir con Wittgenstein: «El escepticismo no es irrefutable, sino claramente sin sentido si pretende dudar allí donde no se puede plantear una pregunta. Pues la duda sólo puede existir cuando hay una pregunta; una pregunta, sólo cuando hay una respuesta, y ésta sólo cuando se puede decir algo34». 33 Ibid., pág. 257. 34 Tractatus, 6.51. 30
INDUCCIÓN Max Black
Versión castellana de Pascual Casañ
1
Inducción El término «inducción» procede de la traducción latina del aristotélico epagoge y será usado aquí para designar todos los casos de argumentación no demostrativa, en las que la verdad de las premisas, aunque no entraña la verdad de la conclusión, pretende ser una buena razón para creer en ella. Tales argumentaciones pueden ser incluso llamadas «ampliativas» como C.S. Pierce las llamó, porque la conclusión puede presuponer la existencia de individuos cuya existencia no es presupuesta por las. premisas. Por tanto, la conclusión «Todos los A son B» de una inducción por simple enumeración puede concernir a los A todavía no mencionados en el número finito de premisas que tienen la forma «A¡ es £». Igualmente, en educción (o argumentaciones de particulares a particulares) la conclusión «Cualquier A es B» pretende aplicarse a algún A, del que todavía no se ha observado que sea B. Sería conveniente disponer de términos tales como «aducción» para referirse al sentido de inducción aquí adoptado, que es más amplio que la concepción clásica de la inducción como generalización de casos particulares. Muchos temas filosóficos referentes a la inducción en el sentido clásico surgen en conexión con el caso más general de argumentación no demostrativa.
En lo que sigue, será conveniente usar la expresión de Jean Nicod «inducciones primarias» para referimos a aquellas argumentaciones no demostrativas «cuyas premisas no obtienen su certeza o probabilidad a partir de ninguna inducción». Los problemas de justificación filosófica son más sutiles en conexión con tales induccio nes primarias. Se puede añadir que «inducción matemática» es un nombre erróneo porque los tipos adecuados de razona miento, clasificados bajo este rótulo, son rigurosamente demostrativos. Dado que el primer entero tiene una cierta propiedad y también que, si cualquier entero n tiene esa propiedad, entonces la tiene n 4- 1, su sucesor, de ello se sigue demostrativamente que todos los enteros poseen la propiedad en cuestión. Las argumentaciones inductivas, tal y como se han concebido aquí, no cons tituyen pruebas matemáticas o lógicas; por definición la inducción no es una especie de deducción. Tipos de argumentaciones inductivas
Además de los tipos de argumentaciones ya mencio nados, los que con más frecuencia se discuten son los siguientes: 1) La inducción elaborada (como se la podría deno minar) consiste en variantes, más o menos sofisticadas, de inducción por simple enumeración, que incluyen característicamente información suplementaria concer niente al modo de selección de los individuos nombrados en las premisas y quizá también referencia a los casos negativos. 2) La inducción proporcional es la inferencia que lleva desde la frecuencia de ocurrencia de algún carácter en una muestra, a la frecuencia de ocurrencia del mismo carácter en la población original —es decir, desde «el m j n l de los A seleccionados por un procedimiento esta34
blecido P son B» a «el m jn de los A son B». Aquí la razón establecida en la conclusión puede ser distinta de la establecida en la premisa; con frecuencia es conve niente situar la razón final dentro de un cierto margen fijado de antemano. 3) La educción proporcional es la argumentación que va de una muestra a otra muestra. De premisas del mismo tipo que las de la inducción proporcional, se ob tiene una conclusión concerniente a la frecuencia apro ximada de ocurrencia en una ulterior muestra obtenida por el mismo o cualquier otro procedimiento. 4) La deducción proporcional (habitualmente llama da «silogismo estadístico») es la inferencia que lleva desde «el m/n de los C son B» (donde m/n es mayor de 1/2) y de «A es un C» a «A es un B». En todos los casos anteriores, los escritores modernos normalmente insisten acerca de la posibilidad de insertar alguna indicación más o menos precisa de probabilidad o posibilidad, bien en la propia conclusión, o bien como un índice de fiabilidad adjunto al signo de inferencia («por lo tanto», «en consecuencia», o similar). La es pecial atención prestada a la probabilidad o posibilidad que se atribuye a una conclusión inductiva dada, es un mérito propio de los modernos tratamientos de la materia. No se puede afirmar que la lista anterior sea exhaustiva ni que sus puntos sean considerados como mutuamente irreducibles. No hay acuerdo general respecto a las for mas básicas de la argumentación inductiva, aunque muchos escritores consideran que la enumeración simple es en cierto sentido la más fundamental. Historia de los métodos inductivos
El interés por la filosofía y metodología de la inducción fue estimulado por los extraordinarios desarrollos de la ciencia natural, que tendían a desacreditar la concep-
ción racionalista del conocimiento acerca de las cuestiones de hecho. Los autores clásicos sobre el tema, Francis Bacon incluido, han lamentado la ineficacia de la deducción para hacer algo más que ofrecer explícitamente las consecuencias lógicas de las generalizaciones derivadas de alguna fuente externa. Si el recurso a la intuición intelectual o a la autoevidencia se rechaza como fuente de conocimiento fáctico, no parece quedar nada mejor que la confianza en el principio empírico de que todo conocimiento concerniente a las cuestiones de hecho proceda en última instancia de la experiencia. Sin embargo, la experiencia, tanto si se la concibe como una observación esporádica e indirecta como si se la concibe como búsqueda sistemática de respuestas específicas forzadas con experimentos proyectados, parece proporcionar conocimiento únicamente de verdades particulares. Los empiristas se ven enfrentados, por tanto, al problema de justificar el paso crucial desde el conocimiento de particulares de experiencia a la aceptación razonada de generalizaciones empíricas suficientemente potentes para valer como premisas mayores de la subsiguiente deducción lógica y matemática. La aspiración de los autores pioneros consistía principalmente en demostrar, como verdaderas, las conclusiones de las argumentaciones inductivas aceptables; hasta finales del siglo xix no empezó a prevalecer una concepción más modesta de la argumentación inductiva y del método científico, encaminada a la consecución de probabilidad más que de certeza.
2
El problema de la inducción El famoso problema de la inducción, que carece to davía de una solución universalmente aceptada, com prende bajo un único encabezamiento una variedad de problemas distintos, aunque relacionados. Es conve niente distinguir los siguientes: 1) El problema general de la justificación: ¿Por qué es razonable, si lo es, aceptar las conclusiones de ciertas argumentaciones inductivas como verdaderas —o al menos como probablemente verdaderas? ¿Por qué es razonable, si lo es, emplear ciertas reglas de inferencia inductiva? 2) El problema comparativo: ¿Por qué es preferible una conclusión inductiva, como mejor fundamentada, a otra? ¿Por qué es preferible una regla de inferencia in ductiva, como más fiable o más digna de confianza racional, a otra? 3) El problema analítico: ¿Qué es lo que hace ra cionalmente aceptables algunas argumentaciones induc tivas? ¿Cuáles son los criterios para decidir qué regla de inferencia inductiva es superior a otra? Estos problemas podrían ser llamados abreviadamente, «justificación», «valoración diferencial» y «análisis». Muchos escritores sobre inducción se han ocupado ellos mismos de la tarea de la codificación, es decir la formula37
ción de un conjunto de cánones coherente, consistente y extenso, para la conducción correcta de la inferencia inductiva. Importante como es, esta tarea no es caracrísticamente filosófica, excepto en que requiere previa mente una respuesta a las cuestiones enumeradas an teriormente. En la práctica, los tres problemas aquí destacados no pueden ser tratados por separado; una defensa global y general de los procedimientos inductivos supone la es pecificación, inter alia, de las formas legítimas de la argu mentación inductiva, y la elección entre reglas inductivas alternativas o métodos debe basarse, explícitamente o no, en la determinación de qué es lo que hace, si lo hay, que una argumentación inductiva sea «fundada». El por qué de una argumentación inductiva no puede ser útilmente aislado del cómo. Es característico de gran parte de la reciente investi gación en torno al tema, concentrarse en los dos últimos problemas señalados, con la esperanza frecuentemente de formular cánones precisos de inferencia inductiva (una lógica inductiva). Tales versiones, comparativa y analítica, del problema de la inducción son consideradas dignas de empeño, incluso por escritores que rechazan como insoluble el problema general de la justificación. Punto de vista de Hume sobre la causalidad
Para bien o para mal, toda discusión moderna en torno a la filosofía de la inducción recoge de Hume el famoso análisis de la causalidad, cuya conexión con los proble mas filosóficos de la inducción (palabra que Hume nunca utilizó) proviene de su punto de vista de que todo razo namiento respecto al tema, en realidad, está basado en la relación entre causa y efecto. Aunque puede decirse que Hume dio una preminencia indebida a la causalidad (sus conclusiones escépticas, de hecho, ponen en entre dicho todo tipo de argumentación no demostrativa, esté 38
o no fundamentada en la imputación causal) es fácil pasar por alto la forma especial en que concibió el pro blema de la justificación, y ser conducido por la misma a conclusiones erróneas. Hume, a diferencia de escritores ulteriores tales como J.S. Mili, no se conformó con analizar el concepto de causa y efecto en el marco de las nociones de contigüidad espacial, sucesión temporal, y ocurrencia contigua; sino que fatídicamente añadió a éstos el criterio de «conexión necesaria». El que los objetos de ciertos tipos hayan sido conjuntados o asociados en la experiencia pasada puede no ser otra cosa que una prolongada coincidencia. Es necesario algo más antes de que un suceso pueda ser reconocido como causa del otro; hemos de poder pasar del post hoc al propter hoc. Al predecir un supuesto efecto de un suceso dado podemos asegurar contigüidad y sucesión si optamos por buscar solamente un suceso espaciotemporalmente próximo, y la memoria (si puede tenerse en cuenta) nos proporcionará el conocimiento de la constante conjunción en el pasado. El que verdaderamente tengamos motivos para predecir la ocurrencia del supuesto efecto, dependerá, por tanto, completamente de que haya una buena razón para afirmar que está necesariamente ligado con su contiguo. En efecto, Hume desafía a su lector a encontrar algo en la observación de un simple caso de supuesta acción causal (así, en el ejemplo preferido de la colisión de dos bolas de billar), que «responda a la conexión necesaria» requerida entre dos sucesos. Ninguna observación, por detallada que sea, descubrirá otra cosa que contigüidad y un hábito interno de supuesta asociación. Ni tampoco el examen de una serie de casos, todos ellos exactamente iguales, nos sería útil en modo alguno: una suma de ceros siempre es cero. Pero, ¿qué entendía Hume por conexión necesaria? A pesar de que no habló mucho sobre ello, su principal prueba de que no podemos «nunca demostrar la necesidad 39
de una causa» se basa simplemente en el hecho de que sea concebible y, por tanto, lógicamente posible que un suceso sea separado de su causa supuesta. Por consiguiente, parece suponer que nuestra noción de causa y su efecto requiere que la existencia del uno esté entrañada por la existencia de la otra. Si ello es así, no necesitamos muchos argumentos para mostrar que no podemos tener ninguna impresión (experiencia sensorial directa) de dicho entrañamiento. Hume concluyó que la necesidad no puede residir en el mundo externo, sino que debe nacer, como idea, de una impresión interna de la mente, es decir, una «determinación de llevar nuestros pensamientos de un objeto a otro». La observación reiterada de la asociación de sucesos nos conduce al hábito de suponer que la asociación continúa «mediante una operación del espíritu... tan ineludible como el sentir la pasión del amor cuando recibimos sus efectos». (.Enquiry Concerning the Human Understanding. Sección 5, Parte 1). Nuestra idea de conexión necesaria no es otra cosa que una respuesta interna al hábito de esperar efectos: En general, la necesidad es algo en la mente, y no en los objetos». En este momento, el escepticismo se halla a la vuelta de la esquina; estamos al borde de conclusiones tan famosas como aquella de «todo razonamiento probable no es sino una especie de sensación» (Treatise, Libro 1, Parte 3, Sección 8). La referencia al hábito o costumbre no explica nada, por supuesto, y en el mejor de los casos solamente es una referencia concisa a la perogrullada, que según el punto de vista de Hume, ha de ser simplemente aceptada, de que los hombres esperan de hecho que los sucesos vayan acompañados por efectos. Sin éstos hábitos de ex pectación causal, los hombres difícilmente hubieran so brevivido —pero esta reflexión, basada ella misma en la inducción, no puede ser una razón para creer en la causalidad. Para ser un filósofo tan crítico de entidades 40
pretendidamente ocultas, tales como la fuerza y la ener gía, Hume resultaba sorprendentemente descuidado en su confianza en el hábito o costumbre como vera causa. Manteniendo sus propios principios, debería haberse vuelto tan escéptico respecto al hábito como respecto a la causa, y debería haber concluido que nuestra idea de hábito no se deriva sino del hábito de esperar que un hombre que actúa de cierto modo continuará hacién dolo así. Y ahora la explicación se ve circular. ¿Dispo nemos de alguna razón mejor para creer en la existencia de hábitos —incluso si se interpretan, en la línea más reduccionista posible, como meras conjunciones cons tantes— que las que tenemos para creer en las causas? Y todo lo que tiende a mostrar que no tenemos ningún fundamento suficiente en la experiencia externa para creer en la realidad objetiva de la conexión causal ¿no podría tender también a mostrar, por idénticas razones, que no tenemos fundamento alguno para creer en la existencia de aquellos hábitos a los que se recurre al menos para explicar, si no para justificar, nuestras creen cias causales ordinarias? Casi todos los lectores de Hume tienen la impresión de que su método debería conducir a un escepticismo más demoledor de lo que él mismo estaba, tal vez, dis puesto a reconocer o aceptar. Si Hume hubiera estado en lo cierto con respecto al origen de la idea de necesidad, se habría visto obligado a una respuesta enteramente escéptica en cuanto al problema general de la justifi cación. Podamos o no eludir la dependencia de la es pectación causal, estamos en todo caso libres de consi derar que un hábito tal no puede proporcionar razón alguna, en el sentido de Hume, para creer en la conexión causal. Y una vez se piense así, parece insoslayable el más alto grado de escepticismo en lo que concierne a la inferencia inductiva. Las conclusiones escépticas de Hume no pueden des cartarse sobre la base de que tuvieron su origen en una 41
psicología excesivamente simplificada de ideas e impre siones, ya que su argumentación puede, sin mucha difi cultad, hacerse independiente de cualquier suposición psicológica. La causa y el efecto son lógicamente inde pendientes, no porque la búsqueda continuada fracase en encontrar cualquier conexión lógica, tal como su giere equivocadamente la propia explicación de Hume, sino porque forma parte de lo que entendemos por causa y efecto el que ambos sean lógicamente separables. Es tentador decir, pues, que no hay razón alguna de por qué un consecuente separable haya de seguir a su ante cedente en cualquier instancia particular. Podemos per fectamente imaginar o concebir la ocurrencia de la causa sin su consecuente habitual y, en términos de Hume, «nada sobre lo que nos podamos formar una idea clara y distinta es absurdo o imposible». (A Treatise o f Human Nature, Libro 1, Parte 1, See. 7.) Argumentos Neo-Humeanos
Aun cuando Hume estuviera equivocado al incluir la necesidad lógica en la idea de conexión causal, un neohumeano podría corregir su argumentación sin debilitar la fuerza escéptica de la misma. Es razonable decir que lo que distingue una conexión causal de una asociación meramente accidental, es el que una necesidad empírica, más bien que lógica, media entre los dos sucesos. Ello, a su vez, puede ser reformulado diciendo que la con junción observada es un caso de asociación legal y no meramente accidental. Pero entonces el reto de Hume a descubrir tal legalidad en la experiencia sigue siendo tan imponente como antes; independientemente del nú mero de instancias de ocurrencia conjunta que encon tremos, nunca observaremos más que la asociación de facto y jamás tendremos fundamentos últimos, no-induc tivos, para creer en una conexión de jure. 42
Por consiguiente, el problema de Hume se puede plan tear con nuevos ropajes y sin restricción a las inferencias causales como sigue: una inferencia inductiva a partir de una asociación observada de atributos (An — Bn) puede justificar la inferencia de otro caso (An+¡ — Bn+i) o la inferencia de la correspondiente generalización («To dos los A son B»), sólo si se sabe de algún modo que la asociación es legal y no meramente accidental. Pero ¿cómo puede saberse esto en las inducciones primarias que no se apoyan en la supuesta verdad de otras leyes? Evidentemente, no por medio de la experiencia inmediata, ni a priori, ni, sin petición de principio mediante apela ción a la inducción. La forma más aguda de esta versión del problema (llamado por su autor «el nuevo enigma de la inducción») es la de Nelson Goodman. Supóngase que todas las es meraldas examinadas antes de un cierto tiempo í hayan sido verdes; usemos el nombre «verdul» para la pro piedad de ser verde hasta el tiempo t y azul después. Entonces toda evidencia apoya por igual las leyes ri vales «Todas las esmeraldas son verdes» y «Todas las esmeraldas son verdules». Aquí se plantea un ejemplo del problema comparativo de un modo particularmente preciso e instructivo. El reto de Goodman espera una respuesta. Algunos escritores han tenido la esperanza de poder defender los modos aceptados o standard de argumentación inducti va apelando a criterios de simplicidad relativa. Pero, aparte del problema todavía por resolver de esclarecer qué es lo que la simplicidad deba significar a este res pecto, no se ve razón alguna de por qué la naturaleza forzosamente haría correcta la inferencia simple; con bastante frecuencia la ley mejor confirmada es menos simple que otras acordes con la evidencia dada. La pro pia sugerencia de Goodman de restringir las inducciones justificables a predicados «firmemente establecidos» (ha blando llanamente, los que han sido empleados frecuente43
mente en juicios inductivos previos) no parece muy satisfactoria. Desde el punto de vista de la filosofía de la inducción, el principal significado de la memorable discusión de Hume (aparte de sus efectos tónicos de perturbar «sueños dogmáticos») consiste en que sacó a plena luz el problema de distinguir entre una serie meramente accidental de asociaciones y las leyes genuinas que buscamos por medio de inducciones. Modelo deductivo de justificación
La demanda de que se justifique la inducción surge, por supuesto, de alguna deficiencia o imperfección supuestas. Si no hubiera problemas con la argumentación inductiva, no existiría ninguna razón para requerir su defensa o su justificación. Por tanto, es de máxima importancia tener clara la supuesta debilidad o precariedad de la inducción y el correspondiente modelo de justificación al que se hace apelación ocultamente. Necesitamos saber cuál se supone que sea el punto insatisfactorio en la inducción, pues sólo cuando se comprenda el mal tendrá bastante probabilidad de éxito la búsqueda de remedio. La raíz de la insatisfacción está suficientemente clara en los escritos de un centenar de escritores que han seguido los pasos de Hume. Todos ellos han estado obsesionados por la certeza supuestamente superior del razonamiento demostrativo. Si la deducción válida a partir de premisas que se saben verdaderas transmite certeza a la conclusión, incluso la mejor inducción se verá que es en comparación inferior (Locke decía que la inducción a partir de la experiencia, «puede proporcionarnos conveniencia, no ciencia» —Essay Concer ning Human Understanding, Libro IV, Cap. 12, See. 10). La persistente convicción de que la inducción de algún modo no cumple el ideal de racionalidad perfectamente 44
ejemplificado en la argumentación deductiva válida, ha hecho el problema de la inducción innecesariamente es pinoso. Si Hume, por ejemplo, no hubiera exigido que se mostrase que la inducción de algún modo, satisfacía los criterios de la deducción válida, sería fácil hallar una respuesta a su pregunta de cómo «los niños y campe sinos» aprenden de la experiencia. El método empleado, como él mismo estableció, consiste en inferir desde la similitud de las causas la similitud de los efectos. Por supuesto, tal respuesta obviamente no le dejaría satis fecho, porque este método no garantiza la verdad de la conclusión establecida; es decir, éste no sería el tipo de método que sería aceptable como justificación de una deducción válida. Hume hubiera querido que una con clusión inductiva se siguiera de (fuera entrañada por) premisas que se saben verdaderas, pues cualquier otra cosa no habría sido considerada genuinamente razona ble. Habiendo mostrado, en efecto, que ninguna razón de este tipo puede producirse para las inducciones pri marias, se vio obligado a considerar que el problema de la justificación era demostrablemente insoluble. Dicha conclusión presenta el notable inconveniente de hacer también insoluble el problema comparativo (al tiempo que la empresa analítica se desvanece por carencia de objeto). La conclusión de Hume debe aceptarse si el suyo es el único sentido de «razón» a este respecto. Si jamás contamos con razón alguna para una conclusión induc tiva, salvo que sepamos que la conclusión se sigue es trictamente de premisas que se saben verdaderas, en tonces no tenemos razón alguna para creer en conclusio nes primarias inductivas: sería tan razonable esperar que los cardos produzcan higos, o algo igualmente absurdo, como lo es esperar que algo se extienda más allá de la experiencia pasada. (El que podamos de hecho ser con vencidos de algo tan absurdo está fuera de lugar). Úni-
camente en los tiempos actuales se han realizado serios esfuerzos con el fin de eludir el hechizo del modelo de ductivo, utilizado por Hume y sus innumerables segui dores, tratando de ver si pueden existir otros sentidos propios y relevantes de «razonable». Más tarde se ar gumentará que la creencia en la inducción es razonable en principio y que la creencia en un tipo de conclusión inductiva es más razonable que la creencia en otro. La atracción permanente del modelo deductivo no es difícil de entender. La raison d'etre de la argumentación deductiva parece tentadoramente clara: las deducciones válidas son transmisoras de verdad y preservadoras de verdad, —lo cual, dado el interés en la obtención de una nueva verdad, parece suficiente para mostrar la cuestión del razonamiento deductivo. (Que ello no puede ser toda la historia resulta obvio a partir de los usos del razonamiento deductivo para manifestar las consecuencias de proposiciones admitidas hipotéticamen te por no mencionar las argumentaciones de reductio y otros usos.) Por el contrario, la raison d’etre de la in ducción resulta oscura y misteriosa. Sería fácil, aunque no convincente para el que está realmente perplejo, decir que las argumentaciones inductivas fundadas son «trans misoras de verosimilitud», pues la verosimilitud es un concepto tan poco claro como la corrección inductiva. Por ello, es natural plantear, y esperar una detallada respuesta, al problema de «¿por qué un hombre razona ble habría de basarse en la verosimilitud a falta de la verdad?» Incluso si la fuerza de la inducción fundada para conferir verosimilitud a las conclusiones se consi dera suficiente para hacer razonables las argumenta ciones inductivas por encima de toda crítica, quedará aún el problema de cómo asignar esta verosimilitud. La atención, por tanto, se vuelve hacia la empresa analítica. Podría añadirse que la fuente permanente de inquietud concerniente a la argumentación inductiva radica en su forma desordenada y vaga, en contraste con la argumen-
tación deductiva. En la argumentación deductiva nos congratulamos de advertir rápidamente los principios subyacentes y sus conexiones necesarias con la forma lógica. En contraste con tal simplicidad y orden clásicos el dominio de la argumentación inductiva parece desconcertadamente complejo, confuso y discutible; una argumentación inductiva aceptada por un juez puede ser refutada, con razones suficientes, por otro juez igualmente competente; argumentaciones supuestamente fundamentadas a partir de diferentes conjuntos de premisas verdaderas pueden dar lugar a conclusiones opuestas; la misma solidez de la inducción no parece estar muy acotada, sino que admite grados de fuerza y fiabilidad relativas. Dado todo esto, no es sorprendente que aunque muchos estudiosos hayan insistido en poner orden en el campo, otros, abandonando toda esperanza de conseguirlo, hayan renunciado a la inducción como mar de confusiones.
47
3
Tipos de solución Las respuestas dadas en la literatura al problema de Hume pueden resumirse brevemente como sigue: 1) Al reto de Hume no se puede responder satisfactoriamente; por consiguiente, la inducción es insostenible y debería excluirse de cualquier razonamiento que pretenda ser racional. 2) A la luz de la crítica de Hume, las argumentaciones inductivas, tal como se presentan usualmente, necesitan perfeccionarse, bien (a) con la adición de nuevas premisas, o bien (b) mediante la sustitución de las conclusiones por afirmaciones de probabilidad. En ambos casos, la validez de la conclusión se supone que se sigue demostrativamente de las premisas, y la lógica inductiva se reconstruirá como una rama de la lógica deductiva aplicada. 3) A pesar de que la argumentación inductiva no pueda justificarse en tanto que ajustada a los modelos deductivos de corrección, puede probarse que las normas inductivas (mejor que reglas o principios) son razonables, en un nuevo sentido que explicaremos más adelante. La inducción puede ser justificada si no validada. 4) El problema de Hume se debe a confusiones conceptuales y lingüísticas; por tanto debe disolverse, en lugar de resolverse, exponiendo estas confusiones y sus orígenes. 48
Estos planteamientos no son mutuamente excluyentes. Así 3), el planteamiento pragmático, se combina normalmente con 1), el rechazo de la inducción como modo aceptable de razonamiento. A excepción de 4), todos los planteamientos aceptan o hacen concesiones sustanciales al supuesto principal de Hume, —a saber, que el único modo completamente aceptable de razonamiento es el decutivo. Esto es verdadero incluso para aquellos que mantienen 3), los «practicistas», de los que se podría suponer, a primera vista, que suavizan los criterios de racionalidad. Recusación de la inducción
La recusación de la inducción como modo propio de razonamiento científico, se basa a veces en la especie de alegato del denominado método hipotético deductivo. De acuerdo con tal punto de vista, la esencia del razonamiento genuinamente científico sobre cuestiones de hecho consiste en la elaboración de hipótesis no establecidas por los datos empíricos dados, sino meramente sugeridas por ellos. La inferencia toma parte solamente en el control de las hipótesis mediante la verificación de sus consecuencias observables: los casos negativos falsean estrictamente una hipótesis, mientras que los casos positivos permiten su uso, a la espera de pruebas experimentales ulteriores, como conjetura plausible, aunque sin demostrar. La Ciencia, como todo razonamiento sobre cuestiones de hecho que aspire a la fiabilidad del método científico, únicamente necesita la clase de razonamiento que se basa en la lógica deductiva y en las matemáticas. Una tesis similar se vislumbraba ya en los escritos de William Whewell. Ello tiene, al menos el mérito de prestar atención al papel de las hipótesis en el método científico, un correctivo oportuno a las pretensiones excesivas de los primeros paladines de la lógica inductiva. 49
El más influyente, y posiblemente el más extremado de los escritores contemporáneos que siguen esta línea es Karl Popper, quien con frecuencia ha mantenido que eso que se llama inducción es un mito, debido a que cuanto se expresa bajo ese título «es siempre inválido y por ello evidentemente injustificable». En su propia concepción del método científico, semejante rechazo de la inducción se halla vinculado a la tesis de que el objeto del quehacer teórico científico es la falsación (demostración de error) en lugar de la verificación o confirmación (apoyo provisional de una aproximación a la verdad). Quienes están de acuerdo, reconstruirían las inferencias supuestamente inductivas para presentarlas explícitamente como explicaciones hipotéticas de hechos dados. (Por consiguiente, en lugar de inferir «Todos los A son B» a partir de premisas de la forma «An es B», se presenta el primer enunciado como explicación más o menos plausible de por qué se habría encontrado que todos los A n son B). A pesar de su entusiasta alegato, es difícil ver en qué lugar esta propuesta se convierte en algo más que un cambio superficial de la forma en que se escriben las argumentaciones inductivas y en algo más que una correspondiente alteración del metalenguaje en que se valoran. Cualquier explicación hipotética de datos em píricos dados tiene la finalidad de extenderse más allá de los mismos, mediante la obtención de consecuencias empíricas susceptibles de pruebas subsiguientes. Si todas las explicaciones conformes con los hechos conocidos (siempre un conjunto infinito) se consideraran igualmente injustificadas por la evidencia, se marginaría, ciertamente, el problema de Hume, pero sólo al precio de ignorar lo que lo motivó, —a saber, la manifiesta existencia de argumentaciones no demostrativas racionalmente aceptables. Difícilmente puede negarse que existen argumentaciones no demostrativas que prestan apoyo razonable a sus conclusiones; en otro caso, sería tan razonable esperar maná del cielo como lluvia de una nube. Los 50
anti-inductivistas raramente han sido lo suficientemente reacios a calificar todas las argumentaciones inductivas como igualmente inválidas; pero tan pronto como dis tinguen entre hipótesis alternativas más o menos con firmadas, más o menos acordes con los hechos disponi bles, se plantean sustancialmente, en una nueva termino logía, los problemas originales de justificación y valora ción diferencial. Apoyo inductivo a la inducción
Para el profano, el modo más natural de defender la creencia en la inducción es el que haya sido eficaz en el pasado. Encubierto en esta respuesta, por descontado, se halla el supuesto de que aquello que ha sido eficaz continuará siéndolo, supuesto que ha parecido desagra dablemente circular a todos los primeros filósofos de la inducción. Una minoría tenaz (en la que se incluyen R.B. Braithwaite y Max Black), sin embargo, insiste en que la apariencia de circularidad surge únicamente de la aplicación precipitada de criterios aplicables a la de ducción. Incluso en el caso límite, en que la regla que domina la argumentación de apoyo a partir de la eficacia previa es la regla misma que ha de ser defendida, se puede argumentar de modo plausible que no hay pre sente circularidad formal alguna. Ni existe tampoco la circularidad más sutil que resultaría si fuese necesario el conocimiento de la verdad de la conclusión para justificar el uso de la argumentación independiente. A pesar de las enérgicas objeciones, esta línea de razona miento, según la opinión del autor no se ha demostrado todavía que sea errónea. El hecho de que el apoyo inductivo de la inducción no sea necesariamente circular, tiene cierta importancia como ilustración de las interesantes características de auto-aplicación y auto-corrección propias de las reglas 51
inductivas; en virtud de estas características, el examen de las consecuencias de la adopción de semejantes reglas puede, en casos favorables, utilizarse para clarificar el propio alcance de las reglas inductivas y los enjuiciamientos adecuados de su solidez. Una dificultad más seria de esta clase de defensa, si merece que se la considere como tal, es la falta de claridad sobre lo que se considera satisfactorio en el uso de la regla, que a su vez está relacionada con el problema insuficientemente discutido de la raison d’etre de la inducción considerada como un modo autónomo de razonamiento. Pero, aun cuando esta clase discutible de apoyo inductivo de las reglas inductivas sobreviva en última instancia a la crítica, no resolverá los problemas metafisicos de la inducción. Quienes se sientan satisfechos con la concepción de Hume respecto del problema, en el fondo atacan cualquier uso de conceptos inductivos y del lenguaje en que se expresan, a menos que exista una justificación deductiva para tal uso. Por tanto, rechazarán cualquier apelación a la inducción a titulo de defensa aun cuando se halle libre de defectos formales, por ser tan esencialmente irrelevante a la tarea primaria de la justificación filosófica. Debe admitirse que el apoyo inductivo de la inducción, pese a que sea grato al profano, no llega a las raíces de la perplejidad filosófica.
Defensas a priori
Algunos escritores modernos (principalmente D.C. Williams y R.F. Harrod) han mantenido que determinadas argumentaciones inductivas, sin necesidad de mejorarlas con la adición de premisas suplementarias o con la modificación de la forma de la conclusión, se puede probar que son válidas. Williams ha defendido, 52
con sorprendente plausibilidad, que de la verdad pro bable de la conclusión de un silogismo estadístico puede demostrarse que está supeditada a la verdad de las premisas, con la sola referencia a los principios autorizados de la teoría matemática de azares. Al tiempo que admiran el ingenio desplegado en este planteamiento, los críticos por lo general han estado de acuerdo en encontrarlo erróneo. El hecho de que algunos modos de argumento inductivo se declaren sólidos o aceptables sobre bases más o menos a priori (quizá en última instancia lingüísticas) es, sin embargo, una pretensión de algunas versiones del planteamiento lingüístico. Reconstrucciones deductivas
El esfuerzo para proporcionar una justificación a la inducción, mediante una reconstrucción de las argumentaciones inductivas tal que las haga deductivamente válidas ha tomado principalmente dos formas. a) Búsqueda de principios inductivos supremos Si una argumentación no demostrativa dada, pongamos por caso a partir de la premisa P a la conclusión K (donde K, por el momento, se considera un enunciado factual categórico que no contiene referencia alguna a la probabilidad), es examinada a través de un prisma deductivo, está condenada a parecer inválida y, de este modo, a ser considerada en el mejor de los casos como un entimema, que necesita premisas extra para resultar aceptable. Es fácil, por supuesto, convertir la argumentación original en deductivamente válida añadiendo la premisa adicional «Si P, entonces K» (esta premisa será llamada Q). Con el fin de defender la inducción a la manera clásica, evidentemente, las premisas deben ser verdaderas y saberse verdaderas. Puesto que se supuso
que P no entrañaba K, la nueva premisa Q será un enunciado factual contingente, el conocimiento de cuya verdad se obtendrá posiblemente por deducción a partir de principios más generales o por inducción a partir de datos empíricos. En ambos casos, si se debe tener en cuenta el modelo deductivo de justificación, el proceso debe continuar hasta que obtengamos unos principios fácticos generales, que ni son susceptibles de un ulterior apoyo empírico ni se hallan necesitados de semejante apoyo. La línea de razonamiento es la siguiente: Puesto que K no se sigue estrictamente de P, el hecho de que la verdad de las proposiciones que se asemejan a P en formas precisables esté normalmente asociada con la verdad de las proposiciones que se asemejen a K, es un hecho contingente sobre el universo real. Visto de otro modo, si los acontecimientos ocurrieran puramente al azar, sería imposible llevar a cabo inducciones válidas; a la inversa, si inducciones de cierta clase producen de hecho sistemáticamente conclusiones verdaderas, debe existir una regularidad contingente en el universo que es susceptible de expresarse en la forma de principios o postulados supremos de la inducción. Sólo si tales postulados son verdaderos, pueden ser fundamentadas las inducciones; por consiguiente éstas deben ser las premisas su puestas, aunque no expresadas, de todas las argumentaciones inductivas fundamentadas. Los candidatos predilectos al papel de tales postulados posibilitadores han sido el principio de que el futuro se asemeje al pasado (Hume), un principio general de causalidad al efecto de que cualquier acontecimiento tenga una causa suficiente (Mili), un principio de homogeneidad espaciotemporal, que haga causalmente irrelevantes las localizaciones y fechas, (otra vez Mili), y un principio de variedad independiente limitada que garantice que los atributos de los individuos se congreguen en un número finito de grupos (J.M. Keynes, C.D. Broad; 54
con el principio de Keynes, sin embargo, se intentaba garantizar únicamente la probabilidad de las conclusiones inductivas). Cualquiera de ellos, supuesto que fueran verdaderos, recoge la presencia en el universo de una cierta regularidad u orden global que permite que los procedimientos inductivos den lugar a las conclusiones verdaderas deseadas. Por ejemplo, si de algún modo supiéramos de antemano que un atributo dado C de un acontecimiento observado debe tener algún otro atributo invariable asociado con él, y si además supiéramos que el atributo asociado debía incluirse en una relación finita de atributos conocidos, es decir £j, Ev . . . , En, entonces existiría una buena perspectiva de que observaciones reiteradas de acontecimientos similares eliminasen todas, excepto una de ellas, las posibles asociaciones, £j — E¡. Dejando a un lado los perfeccionamientos, así es como Mili, por ejemplo, concibió el método inductivo; sus famosos «métodos» (que han recibido una atención desmesurada en relación a sus méritos) se reducen, en definitiva, a procedimientos deductivos de eliminación de los candidatos inadecuados al título de condiciones necesarias o suficientes. (Ulteriores intentos de desarrollar la inducción eliminativa siguen en gran parte la misma trayectoria). Es evidente que todo el interés de este programa se apoya en aquellas consideraciones que puedan antici parse en pro de las premisas supremas. Si se pudiera saber que las premisas supremas son verdaderas, los demás procesos de inferencia resultarían triviales (de modo que no existe necesidad alguna de una lógica autónoma de la inducción); en caso contrario, el proyecto entero flota en el vacío. La tarea de formular principios plausibles del tipo deseado por este programa ha demostrado ser más difícil de lo que Mili supuso. Sin embargo, puede argumentarse que su búsqueda es inútil y equivocada. En primer lugar implicarían demasiadas cosas: Si se supiera 55
que son verdaderos, permitirían demostrar que las conclusiones de las inducciones primarias seleccionadas son verdaderas, lo cual es suponer demasiado. Por lo general se está de acuerdo (y con razón) en que incluso la conclusión de la mejor argumentación inductiva puede resultar ser falsa sin contradicción —aunque sólo fuera por mala suerte. Todavía más grave es el problema de cómo, desde el punto de vista de este programa, se podría saber que las premisas supremas deseadas son verdaderas. Puesto que la apelación a la inducción se excluye en lo referente a este punto por motivos de circularidad, y puesto que los mismos principios no pueden ser analíticos si deben servir a los efectos deseados, no parece haber medio alguno. A este respecto, quienes busquen principios inductivos supremos se encontrarán con las manos vacías. Mili, por ejemplo, se vio obligado a hacer que todo su programa se apoyara en la supuesta fiabilidad de la simple enumeración (el método que él mismo consideraba el menos convincente), en cuya defensa no tenía otra cosa mejor para argüir que el que era «universalmente aplicable» (lo cual sobre la base de sus principios constituye, graciosamente, una petición de principio); Keynes, renunciando a sus principios empíricos en pro de un flirteo poco entusiasta con Kant, no podía hacer otra cosa que sugerir que los principios últimos se fundamentan en «algún conocimiento sintético directo» de la regularidad general del universo. La inducción evidentemente puede pedir que se le perdonen defensores semejantes a éstos; mejor el fuerte escepticismo de Hume o Popper que las poco convincentes salidas de Mili y Keynes. Parece ineludible la conclusión de que cualquier intento de mostrar (como Bacon y muchos otros han pretendido) que existen garantías ontológicas generales res pecto a la inducción, está abocado al fracaso desde el principio. 56
b) El recurso a la probabilidad Un camino más prometedor, al menos a primera vista, de llegar a la línea deductiva es modificar la conclusión de una argumentación inductiva incluyendo alguna referencia explícita a la probabilidad. Este planteamiento, influyente desde su calurosa exposición por Keynes, todavía tiene muchos adeptos. Si no hay perspectiva alguna de llenar la laguna deductiva entre P y K mediante adición de ulteriores premisas que se saben verdaderas, entonces tal vez puede obtenerse el mismo resultado si se debilita la conclusión. Si K no se sigue de P , ¿por qué no contentarse con una conclusión más modesta de la forma «Probablemente, K » o quizá «K tiene tal y cual probabilidad relativa a P»l. Los proyectos más impresionantes de este tipo, dis ponibles hasta el momento, han encontrado serias dificultades técnicas. En el programa de Keynes es esencial, por ejemplo, que la probabilidad de una generalización relativa a una serie ininterrumpida de casos confirmatorios tienda invariablemente a la unidad. Las condiciones necesarias para que esto sea posible en su programa son, al menos, que la generalización tenga una probabilidad inicial distinta de cero y que infinitamente muchos de los casos confirmatorios sean independientes, en el sentido de que tengan menos de la probabilidad máxima de ocurrencia, dada la evidencia ya acumulada. Los principios ontológicos supremos a los que Keynes se vio obligado a apelar en última instancia (ver la sección anterior) difícilmente serían suficientes para satisfacer estas condiciones; la crítica subsiguiente —por ejemplo, por parte de Nicod y G.H. von Wright— ha mostrado que se necesitan incluso condiciones más rigurosas. (Von Wright ha defendido que la convergencia asintótica deseada tendrá lugar únicamente en el caso de que, a la larga, se examinen todos los casos de la generalización —lo cual evidentemente convertiría 57
la teoría en algo menos que útil en las aplicaciones prácticas). Pese a toda su importancia como fundador de la teoría de la confirmación, la teoría defendida por Keynes debe ser considerada un fracaso. c) La construcción de Carnap Los méritos de la construcción de Carnap de la lógica inductiva, mantenida de modo impresionante, que sigue la tradición de Laplace y Keynes, aunque superando el trabajo de ambos en elaboración y sofisticación, siguen siendo todavía tema de discusión. Suponiendo que la posibilidad expresa una relación lógica entre proposiciones, Camap ha demostrado cómo, en ciertos lengua jes simplificados, es posible definir la extensión o amplitud lógica de una proposición dada. (Hablando en términos generales, el grado de confirmación dado por una proposición x a una proposición y es la razón de la extensión de X y a la extensión de jc .) La definición de extensión lógica depende de la clase de universos posi bles expresables en el lenguaje en cuestión. Para asignar una medida definida de extensión lógica, es necesario adoptar algún método para pesar los diversos universos posibles («descripciones de estado», en la terminología de Camap) compatibles con una proposición dada. Uno de los méritos del análisis de Camap es haber puesto de manifiesto que hay todo un continuo de procedimientos de peso alternativos y de métodos inductivos asociados, cada uno de los cuales es internamente coherente. La arbitrariedad así reconocida en el procedimiento inductivo ha preocupado incluso al más benévolo lector de Camap; todavía más inquietante es la aparición de lo que debería llamarse la paradoja de la generalización no confirmable —la imposibilidad de asegurar, mediante los principios de Carnap, que una serie ininterrumpida de casos positivos elevará la probabilidad 58
de una generalización por encima de cero. (Camap res ponde que una confirmación de casos —es decir, la conclusión de una educción— adquiere en realidad una pro babilidad progresivamente creciente, pero esto es insuficiente para satisfacer a aquellos críticos que todavía esperan encontrar un lugar para la auténtica generalización dentro del método inductivo.) Es demasiado pronto para decidir si problemas como éstos son algo más que simples marejadas en el nacimiento de una nueva materia. Las ingeniosas modificaciones del programa de Camap sugerido, entre otros, por J.G. Kemeny y Jaakko Hintikka ofrecen alguna esperanza a su eliminación. Más seria es la dificultad básica que dimana de la concepción de Carnap de los enunciados de confirmación como analíticos. Si es una verdad de la lógica (hablando en general) que dada la definición seleccionada de confirmación, la evidencia presentada confirma una hipótesis dada en tal y tal grado, entonces ¿cómo podría dicha verdad a priori justificar cualquier creencia racional en la hipótesis? O, de otra manera, si alguien adoptara una definición diferente de confirmación y, por esa razón, fuera llevado a una creencia contraria, entonces ¿cómo se le podría mostrar que está en un error? La respuesta de Carnap está basada en la concepción de que el nexo entre la confirmación, tal como él la define, y la creencia racional se ha de encontrar en algún principio de maximización de la utilidad esperada (realizándose la pertinente concesión, sin embargo —en su sofisticada interpretación de dicho principio— a las estimaciones subjetivas de probabilidades y utilidades). Parece sin embargo que, debido a que las consideraciones de probabilidad forman parte igualmente del cálculo de probabilidades y de utilidades esperadas, se halla aquí implicado un círculo lógico. Puesto que las discusiones de Camap sobre este esencial punto son todavía relativamente burdas y provisionales, sería prematuro llegar a ningún juicio definitivo sobre el éxito que él, 59
y los que con él están de acuerdo probablemente alcan zarán al enfrentarse con esta dificultad básica. (Debería decirse que la dificultad con respecto a la conexión entre los juicios de probabilidad y la práctica no es pe culiar del trabajo de Camap, puesto que se plantea de una forma u otra a todos los teóricos de la inducción que se toman el trabajo de elaborar con detalle las con secuencias de sus principios y supuestos). Puede decirse, sin embargo, que los juicios relativamente superficiales de Carnap acerca de la justificación de la inducción pertenecen a las partes menos satisfactorias de su apor tación en lógica inductiva. Cuánto implique el recurso a la probabilidad depen derá, por supuesto, de cómo se interprete la referencia a la probabilidad. Con las interpretaciones empíricas de la probabilidad, como las preferidas por los «frecuencialistas» (véase probabilidad), la conclusión de probabilidad aún se extiende más allá de las premisas mediante la referencia oculta a conjuntos finitos o in finitos de acontecimientos no comprendidos por las premisas dadas. El salto inductivo que permanece en la argumentación reconstruida, por consiguiente, de jará el problema de la inducción por resolver. Si, por el contrario, la probabilidad se interpreta de alguna manera lógica (como lo hace Keynes o Carnap), la conclusión obtenida dirá menos que las premisas y, por tanto, no se verá afectada por las subsiguientes pruebas empíricas; la validez deductiva de la argumentación reconstruida será salvada únicamente al precio de hacer problemática su relevancia respecto de la predicción y el control em pírico. Al convertir una argumentación significativa mente inductiva en otra deductiva válida, parece des truirse la característica propia de la argumentación original —a saber, aventurar una predicción referente a lo todavía desconocido.
60
Defensas pragm áticas
Las respuestas de tipo pragmático, ofrecidas originalmente por Peirce, pero desarrolladas independientemente con grandes recursos por Hans Reichenbach, se encuentran entre las contribuciones modernas más originales al tema. Para muchos, representan todavía la mejor esperanza de eludir lo que parece ser el fracaso inevitable de las tentativas hasta ahora discutidas. El germen de la estrategia pragmática es la reflexión de que en la vida ordinaria, en ocasiones se presentan situaciones en que, a falta de un conocimiento seguro de las consecuencias, las decisiones problemáticas pueden estar justificadas todavía por un argumento del tipo de «nada hay que perder». Enfrentado con un alternativa entre una operación de cáncer y una muerte segura, un paciente puede elegir la intervención, no porque exista una garantía de curarse, sino basado en el principio racional de que nada se pierde corriendo el riesgo. a) La «vindicación»
de Reichenbach
Según Reichenbach, el caso es semejante en lo que él considera que es la situación inductiva paradigmática; dado un interés precedente por determinar la probabilidad de ocurrencia de un carácter determinado (inter pretado por él como el limite, en una sucesión infinita de acontecimientos, de la frecuencia relativa de ocurrencias de dicho carácter), Reichenbach mantiene que el único programa racionalmente defendible es el uso de la frecuencia relativa de ocurrencias ya alcanzada como evaluación provisional del valor límite definitivo. Un hombre que procediese de este modo puede que no posea la garantía ni la certeza de que sus estimaciones revisadas constantemente como información acerca de las series acumuladas gradualmente, le llevarán a los umbrales de un valor límite de la frecuencia, pues los 61
valores provisionales de las frecuencias relativas pueden, de hecho, diverger. En ese caso, ningún programa predictivo funcionará de ninguna manera y será imposible una inducción exitosa. Sin embargo si no fuera ése el caso y de hecho la serie tuviera realmente un valor límite con respecto a la frecuencia relativa en cuestión, podría mos saber de antemano y con certeza que el programa está destinado eventualmente a llevar al razonador a estimaciones que estén tan cerca del límite como se desee. Por tanto, no se pierde nada con adoptar el pro grama inductivo: si la serie de acontecimientos sometidos a examen es lo suficientemente regular como para hacer posible la inducción, el programa recomendado está orientado, en definitiva, a ofrecer el resultado apetecido (y de antemano sabemos que así será), mientras que si la serie es lo bastante irregular como para impedir el programa inductivo estándar, nada servirá de nada, y no estaremos en peor situación que si se hubiera elegido la decisión contraria. Este tipo de justificación frecuentemente recibe el nombre de «vindicación», como fue denominada por Herbert Feigl. Se afirma que, en cierto sentido el tipo de vindicación esbozado arriba resuelve el problema de Hume por derivación. Sabemos con certeza que, lo que Hume deseaba —a saber, la certificación de la solidez de la argumentación inductiva por el modelo del razo namiento demostrativo— no puede ser satisfecho. Pero sería una imprudencia dejar la cuestión así. Concibiendo la práctica de la inducción como la adopción de ciertos programas, aplicados ante la estoica aceptación de la imposibilidad de un éxito asegurado en la obtención de conocimiento fiable concerniente a cuestiones de hecho, podremos ver que tales programas son, en un sentido claro, preferibles a cualquier otro que compita con ellos. La inducción estándar es preferible a la adivinación, porque sabemos que será eficaz (a la larga se acercará a los valores límite) si algo ha de serlo. b l
Contra estas afirmaciones plausibles se ha objetado que la analogía con las decisiones genuinamente prácticas a actuar sobre la base de evidencia insuficiente, es erró nea, pues en el estado de perfecta ignorancia postulado por los defensores del planteamiento pragmático nin gún método puede, en abosluto, considerarse superior a otro. Los vindicacionistas se han mostrado relativa mente indiferentes a tal crítica general; sin embargo, se han visto obligados a buscar remedios para un grave defecto técnico que amenaza con destruir su programa entero. Dado el supuesto de que lo mejor que puede conseguirse mediante un programa inductivo es la con vergencia asintótica a una frecuencia relativa límite, es evidente que ningún programa de valoración inductiva a la corta se excluye en principio como irracional. Así, desde el punto de vista de la vindicación pragmática, una serie ininterrumpida de objetos A que resultan ser B, no haría irracional la predicción de la subsiguiente ocurrecia a la corta de objetos A que no son B, siempre que las estimaciones adoptadas se elijan de modo que con verjan eventualmente al límite (si lo hay). Pero, puesto que la sucesión infinita, de hecho, nunca se alcanza ni siquiera por los seres inmortales, se sigue que la defensa pragmática no ofrece ningún criterio para las decisiones inductivas en casos a la corta, a los que se reduce la pre dicción inductiva, y no ofrece ninguna razón diferencial para preferir un programa inductivo a otro. A pesar de los esforzados intentos (principalmente por parte de Wesley Salmon) de mejorar la concepción ori ginal de Reichenbach aportando razones suplementarias con el fin de rechazar los programas no estándar inde seados, las perspectivas del vindicacionismo siguen sien do dudosas. Incluso si se pudiera encontrar algún modo viable de asignar, sobre principios vindicacionistas, un status especial al programa estándar de la inducción, el planteamiento sería vulnerable a la objección de que concibe el método inductivo de un modo extrañamente . 63
restringido. La determinación de los valores límite de frecuencias relativas es, en el mejor de los casos, un problema especial del método inductivo, pero no el más fundamental. b) La perspectiva de Peirce Peirce, cuyos puntos de vista sobre la inducción han ejercido una constante influencia desde la aparición postuma de sus Collected Papers, tenía una concepción más compleja del método científico que los últimos vindicacionistas. La inducción concebida por él como un proceso de poner a prueba hipótesis estadísticas mediante el examen de muestras aleatorias, debe entenderse en sus relacio nes con otros dos procedimientos: la deducción estadís tica y la abducción. La deducción estadística consiste en la inferencia que lleva de la frecuencia de ocurrencia de un atributo en una población a la ocurrencia probable y aproximada de dicho atributo en una muestra extraída de ella al azar. Dada la definición de Peirce de probabilidad como fre cuencia límite y su concepción del azar, se sigue demos trativamente que la mayor parte de las muestras obte nidas tendrán aproximadamente la misma composición que la población original; la deducción estadística es, por consiguiente, —«válida» en el sentido de que genera conclusiones que son verdaderas la mayoría de las veces. La abducción, o formulación creativa de hipótesis estadísticas y el único modo de inferencia científica que introduce nuevas ideas, es una clase de inversión de la deducción estadística. No tiene casi fuerza demostrativa; siendo más bien su valor el proporcionar nuevas genera lizaciones que necesitan verificación independiente y tienen «alguna oportunidad de ser verdaderas». Cuando se usan en combinación los tres procedimien64
tos, la inducción parece ser un método autocorrectivo, que, si se continuara indefinidamente, a la larga conduciría a la comunidad científica, aunque no al pensador individual, indefinidamente cerca de la verdad. En esta convergencia asintótica a la verdad radica la peculiar validez de la inducción. No puede sostenerse que Peirce tuvo éxito en su esfuerzo por defender la racionalidad de los programas inductivos en términos de eficacia a la larga en la generación de conclusiones aproximadamente, y en gran parte, verdaderas. Puesto que la pretendida justificación de la inducción depende esencialmente de la aleatoriedad de las muestras utilizadas, debe objetarse que normalmente no hay modo alguno de garantizar de antemano la presencia de dichos azares. (A esta objeción, Peirce tuvo únicamente la débil y pobre respuesta de que la inferencia inductiva retiene cierta fuerza demostrativa, incluso en ausencia del azar deseado). Entre los puntos débiles más obvios de los puntos de vista de Peirce sobre la inducción se encuentran los que siguen. La tendencia autocorrectora de la inducción, que Peirce, en sus últimos escritos sobre el tema, llegó a considerar como núcleo y esencia del método deductivo, sigue siendo obscura a pesar de sus elogios. Qne las estimaciones inductivas necesitan, sobre la base de los principios de Peirce, reiterados reajustes conforme se acumula más evidencia, es suficientemente claro, pero no puede garantizarse a priori que este proceso haya de mostrar alguna convergencia hacia un valor límite. Si las muestras a examinar fueran aleatorias en el sentido estricto de Peirce de ese término, podríamos disponer al menos de un predominio total de las estimaciones aproximadamente correctas; pero incluso en ese caso no tendríamos razón alguna, en ausencia de garantías adicionales, para esperar que las estimaciones mejores tuvieran lugar casi al final de los procesos de prueba. De cualquier manera, suponiendo condiciones realistas
para la prueba de las hipótesis (tales como nuestra necesaria dependencia de casos que estamos en condiciones de examinar), parece evidente que no se pueden satisfacer las condiciones para el tipo de muestreo requerido por Peirce. Las referencias de Peirce a la sucesión infinita parecen incoherentes en conjunto. La mayor parte de las ocasiones parece haber estado pensando cuál resultaría ser el caso en una serie real e infinitamente extensa de ensayos. Sin embargo, hacia el final de su vida parece ha ber admitido que sus definiciones de probabilidad y de válidez de la inducción necesitaban interpretarse de un modo más general, haciendo referencia al «sería» de los acontecimientos, concebidos como carácteres o há bitos generales reales. Cómo pueden de hecho descu brirse tales rasgos generales de los acontecimientos, incluso mediante series muy largas de ensayos es algo que Peirce nunca explicitó. Y para todo aquel que se sienta atraído por su planteamiento, es grande la necesidad de tal clarificación. La sucesión infinita es una quimera, y decir que un determinado método, si se sigue de un modo consistente, conducirá en tal sucesión infinita eventualmente tan cerca de la verdad como queramos es no decir nada que pueda ser de utilidad respecto al proceso real de verificación. Toda verificación se realiza necesariamente a la corta, por muy extensa que sea la sucesión, y lo que sucedería si per impossibile la «sucesión» fuera infinita no es relevante en lo que res pecta a la valoración relativa de hipótesis dadas. Necesitamos un método de decisión entre hipótesis rivales si no ahora, sí en un futuro previsible y esto es algo que la concepción de Peirce no puede proporcionar. Por su dependencia de la sucesión infinita, el pragmatismo de Peirce, que inicialmente parecía tan positivo en su énfasis sobre los resultados y consecuencias prácticas, acaba por ser tan utópico como cualquiera de las concepciones metafísicas que puso en evidencia.
La justificación como pseudoproblema
En vista de la problemática que mina todos los in tentos de responder al desafío de Hume es razonable considerar si el problema no habrá sido mal interpretado. Realmente, resulta manifiesto tras hacer un análisis, que la tarea de la justificación lógica de la inducción, tal como se concibe clásicamente, está abocada a no tener, a priori, una solución. Si la inducción es por definición no deductiva y si la demanda de justificación consiste en el fondo en que se muestre que la inducción satisface las condiciones de corrección apropiadas únicamente a la deducción, entonces la tarea es ciertamente desesperanzadora. Pero concluir, por esta razón, que la inducción básicamente no es válida o que una creencia basada en principios inductivos nunca puede ser razonable, es transferir, de un modo demasiado seductor, los criterios de evaluación de un dominio a otro, en que resultan inadecuados. Las conclusiones inductivas fundadas no se siguen (en el sentido deductivo de «seguirse») ni siquiera del. mejor y más fuerte conjunto de premisas (en el sentido inductivo de «más fuerte»); no hay razón suficiente alguna de por qué lo habrían de hacer. A quienes tratan de encontrar todavía una defensa clásica de la inducción se les podría invitar a que mostraran por qué motivo serían adecuados los patrones deductivos de justificación. Tal vez, la respuesta sería que no hay un sentido claro en el cual se justifique la afirmación de una conclusión, excepto el sentido en que se sabe que se sigue estricta mente de premisas que se saben verdaderas, y en conse cuencia el peso del argumento descansa en todos los que afirman la existencia en algún otro sentido.
a) Planteam iento lingüístico del pro blem a
Se podría responder al reto que proclama que no puede decirse que las argumentaciones inductivas sean justificadas del siguiente modo: Supongamos que un hombre ha aprendido en parte de su propia experiencia y en parte del testimonio de los demás que, en una am plia variedad de circunstancias, cuando se lanzan las piedras éstas caen al suelo. Hagámosle considerar la proposición # , de que cualquier piedra elegida al azar y lanzada, se comportará de la misma manera. Este es, a juicio del autor, un caso paradigmático para decir que el hombre en cuestión (cualquiera de nosotros) tiene una buena razón para afirmar # y, por tanto, está justificado cuando afirma # en lugar de no-#. Del mismo modo, es éste un caso paradigmático para decir que el hombre en cuestión es razonable cuando afirma # y que no sería razonable si afirmara no-#, con la evidencia disponible. Todo aquel que afirmara otra cosa no sería extraordinaria y admirablemente escrupuloso, sino que estaría abusando del lenguaje al violar alguno de los criterios implícitos de los usos de «buena razón», «jus tificado» y «razonable», con los que tanto él, como el interlocutor con el que logra comunicarse, se hallan de hecho comprometidos. Cualquier hombre —por ejemplo, uno de Marte— que usara estas palabras de acuerdo con criterios que realmente le hicieran inadecuado aplicarlas al tipo de situación a que se enfrenta, no sería en última instancia, entendido por nosotros. Peor todavía, él intentaría, si fuera consecuente, cambiar nuestros conceptos reales de razón y racionalidad, de modo que fuera lógicamente imposible disponer de razones para las aserciones con cernientes a lo desconocido o ser razonables al prever una cuestión de hecho en lugar de otra, sobre las bases de la evidencia empírica. (Se estaría comportando como un hombre que insistiera en que sólo los sementales
merecerían llamarse caballos.) Semejante distorsión no aportaría nada significativo, pues el hombre empeñado en hacer «la razón empírica» tan falta de aplicación como «estar en dos sitios a la vez» se vería obligado a reintroducir esencialmente ef mismo concepto bajo algún rótulo tal como «aceptado generalmente como una razón» o «lo que normalmente pasa por ser una razón». La distinción entre lo que el hombre común y lo que los científicos llaman «buenas razones» y «malas razones» está hecha con buenas miras, tiene consecuencias prácticas, y es indispensable en la práctica. Así, la disputa entre el defensor del planteamiento lingüístico y su oponente parece reducirse a una discusión verbal, predestinada al olvido. Dada la entrelazada complejidad de los conceptos que forman parte de las formulaciones alternativas del problema de la inducción y la plausibilidad seductora de las distorsiones a que están sujetos tales conceptos, no puede esperarse que ninguna respuesta breve, tal como la anterior, clarifique y exponga las confusiones conceptuales en que descansan las formulaciones tradicionales del problema. Una discusión completa, tam bién tendría que considerar al menos los sentidos im portantes de «conocimiento» y «posibilidad» y las nociones epistemológicas relacionadas. El esbozo de la estrategia está quizá lo suficientemente claro; la línea a seguir consiste en que un examen riguroso y detallado de cómo ocurren las palabras clave en la formulación del problema pondrá de manifiesto que los criterios de los usos correctos de dichos términos son violados en formas sutiles y plausibles. Si se puede establecer esto, el famoso problema de justificar la inducción se desvanecerá, y desaparecerá el erróneo supuesto de que la inducción necesita justificación filosófica o que, a falta de ésta, queda en situación precaria. Ni el problema comparativo ni el analítico se diluyen bajo este ataque. A los defensores del planteamiento
lingüístico se les puede muy bien reprochar el haberse contentado frecuentemente con mostrar, para su satisfacción propia, que el problema general de la justificación tiene sus raíces en una confusión, al tiempo que olvidaban las tareas constructivas de clarificar más los criterios de la valoración preferencial de las argumentaciones inductivas. A quienes no simpatizan con el planteamiento lingüístico, les ha parecido que tal ataque al problema tradicional, estaba operando con teorías dudosas e insuficientemente elaboradas del significado o del uso, y que era demasiado simple en su acusación de confusiones semánticas. Por otra parte, un cierto número de críticos han considerado que una apelación al lenguaje ordinario, no puede ser, en última instancia, decisiva desde un punto de vista filosófico. Incluso si se dejara establecido que es una violación del lenguaje ordinario describir la conclusión de algunas argumentaciones inductivas, como avaladas por algo menos que buenas razones, los críticos preguntarían, ¿qué hay en la naturaleza de las cosas que nos exija continuar hablando en la manera acostumbrada o a estar obligados por los prejuicios metafísicos solapados de los inicialmente res ponsables de establecer las reglas de uso a las que se apela ahora? El filósofo lingüista necesariamente usa palabras claves tales como «razonable» en su polémica contra los planteamientos tradicionales del problema. Pero usar los términos cruciales en una discusión sobre la naturaleza del problema inductivo, podría argumentarse, es asumir la verdad del propio problema desde un principio. Un lunático o un filósofo excéntrico bien podría usar la expresión «buena razón», de un modo que fuera descaradamente impropio; con todo, podría demostrar, apelando a sus propios criterios, que tenía «buenas razones» para usar la expresión en la forma en que lo hizo. Pero, ¿nos encontramos en mejor situación? ¿No estamos obligados a perforar la barrera lingüística
y a mostrar, cuando menos, por qué los pretendidos criterios de las buenas razones a que se apela seguirían gozando de nuestra confianza? No hay una forma breve de barajar este tipo de ob jection. Sin embargo, puede ser útil esbozar el punto de vista general, en el que se apoyaría el autor, como defensor del planteamiento lingüístico. b) Defensa del planteamiento lingüístico Todo ser humano adulto actúa bajo los mismos patrones generales y sistemáticos de elaborar inferencias relativas a lo inobservado y aplica los mismos princi pios generales en la evaluación de tales inferencias no demostrativas. Por ejemplo, todas las personas normales esperan que los casos observados de asociación de atri butos se confirmen en ulteriores experiencias, a menos que existan factores compensatorios (el principio de simple enumeración), todos consideran que un incremento del número de casos independientes confirmatorios de una ley refuerza (o al menos no debilita) la probabilidad de la verdad de la ley, y todos igualmente comparten las creencias inductivas que apoyan a las nociones causales. Por tanto, no es gratuito pensar que todos los seres humanos adultos y sanos comparten un sistema complejo de diferentes formas de aprendizaje a partir de la experiencia, que podría denominarse la institución inductiva. Al igual que otras instituciones (guerra, ley, etc.), posee una estructura relativamente delimitada, aunque no inmutable, transmitida de una generación a la siguiente y cristalizada en forma de prohi biciones y autorizaciones, máximas de conducta, y preceptos informales de realización. Como otras instituciones, la institución inductiva requiere que sus partici pantes hayan asimilado un sistema de conceptos distintivos (entre ellos, los conceptos de buena razón, argu71
mentación fundada, y probabilidad relativa) que presen tan aspectos, tanto descriptivos como normativos. Tal asimilación se manifiesta en la capacidad de usar correc tamente el correspondiente lenguaje —que, a su vez, con lleva el reconocimiento de, aunque no la invariable su misión a, reglas asociadas de afirmación, evaluación y valoración de las acciones. La comprensión de lo que en tiende la gente por razones de las conclusiones empíri cas, exige la aceptación de ciertos tipos de situaciones como paradigmáticas de la evidencia empírica; llamar a los hechos dados razones fundadas de alguna conclusión es suponer la aceptación de ciertos criterios con el fin de discernir qué razón es mejor que otra; la afirmación de que cierta creencia respecto a lo hasta ahora inobser vado es razonable, compromete al hablante a sostener que, en igualdad de circunstancias, la acción basada en dicha creencia sería aprobada. El problema filosófico de justificar la inducción puede únicamente planteársele a alguien que sea miembro de la institución inductiva, y, que se halla ya, por consi guiente, comprometido por sus reglas constitutivas. Un hombre puede entender el juego del bridge sin ser un jugador profesional, pero todos nosotros necesariamen te seremos profesionales del «juego inductivo» antes de llegar a la autoconciencia reflexiva característica de la crítica filosófica. Las reglas constitutivas de la institución inductiva (cuya delimitación exacta aún no ha sido ultimada por los filósofos de la inducción) son enormemente abstrac tas, esquemáticas y limitadas en su utilidad práctica. Evidentemente, los principios generales de la inferencia inductiva son a este aspecto tan relevantes en la práctica, como lo son los principios abstractos de justicia en las decisiones respecto a cuestiones legales concretas. En las situaciones particulares concernientes a la fundamentación de las hipótesis empíricas, el pensador se ve obli gado a retroceder sobre su conocimiento específico de 72
hechos y teorías relevantes. De este modo, la conducción de una inferencia inductiva concreta se asemeja al ejercicio de una aptitud o habilidad, más que a la aplicación automática de un método de decisión. Con todo, las reglas constitutivas conllevan importantes restricciones generales que no pueden violarse sin que se produzcan sinsentidos. Tener dominio del lenguaje inductivo, bien como maestro de técnicas avanzadas de inferencia estadística o bien como profano que constantemente y con más o menos fortuna anticipa la experiencia futura, significa necesariamente estar sometido a las normas implícitas de creencia y de conducta impuestas por la institución. Los conceptos inductivos, que adquirimos por el ejemplo y la educación formal y que modificamos por medio de nuestras propias experiencias, no están exentos ni siquiera de revisión drástica. Las normas pueden concebirse útilmente como cristalizaciones formales en reglas lingüísticas de los modos generales de respuesta al universo, que nuestros antepasados, en conjunto, han encontrado ventajosas para sobrevivir; pero la experiencia pasada de la especie no tiene una autoridad absoluta. Puede observarse en la historia de la ciencia moderna la reforma pieza a pieza de la institución inductiva. Sin embargo, lo que sería evidentemente imposible es el tipo de revolución general que estaría implicada en la limpieza total del tablero inductivo para tratar de retroceder a la condición de algún Adán hipotético que se pusiera a aprender de la experiencia sin previa preparación en las reglas relevantes del procedimiento inductivo. Ello equivaldría a destruir el lenguaje que usamos ahora para hablar sobre el mundo y sobre nosotros mismos y, en consecuencia, a destruir los conceptos implicados en dicho lenguaje. La idea de dejar de ser un pensador inductivo es una monstruosidad. La tarea no es imposiblemente difícil; más bien su misma formulación carece de sentido. Con todo, vale la pena insistir en que la institu-
ción inductiva, precisamente porque su raison d’etre con siste en aprender de la experiencia, es intrínsecamente autocrítica. La inducción, lo mismo que el sábado judío, fue hecha para el hombre, y no a la inversa. Así, la experiencia constantemente renovada de los éxitos y fracasos de los procedimientos inductivos específicos, permitidos en el marco general de la institución inductiva, proporciona una sólida base para la reforma gradual de la misma institución, sin circularidad que objetar. Y aun cuando ninguna característica de la inducción esté exenta, en principio, de crítica y reconstrucción, no puede ponerse en juego la institución entera a la vez, sin destruir el mismo significado de las palabras en cuyos términos se plantean los problemas filosóficos de la inducción. Todo abusivo escepticismo filosófico sobre cuestiones de hecho carece de sentido y hay que manifestarlo así. Si éste es el «predicamento lingüocéntrico», tenemos que sacarle el máximo partido. El punto de vista aquí esbozado debe distinguirse cuidadosamente de lo que comúnmente se llama convencionalismo. La argumentación no es que las reglas inductivas constitutivas sean válidas por convención, sino más bien que puede mostrarse que la seductora pregunta «¿Por qué aceptamos reglas inductivas?», se puede demostrar que carece de sentido. Nuestro esquema puede compararse provechosamente con el punto de vista de Hume sobre la inducción como hábito o costumbres. Ambas concepciones coinciden en considerar las prácticas inductivas, en total, como hechos sociales y contingentes que prevalecen en períodos dadps de la historia humana. Después de todo, es un hecho contingente el que hayan existido animales suficientemente racionales para poder hablar y, por consiguiente, para tener conceptos inductivos. Sin embargo, la presente concepción difiere significativamente de la de Hume al considerar la institución inductiva como constituida, en parte, por reglas inductivas normativas 74
con las que el filósofo, como todo hombre que razona, se encuentra ya comprometido. Así, el hecho social total de la existencia de la institución inductiva incluye en sí mismo los medios para valorar y criticar los procedimientos inductivos; no podemos considerar la inferencia inductiva como algo meramente «dado», como un hecho natural, como la Vía Láctea, que sería absurdo criticar. Comprender la inducción es necesariamente aceptar su autoridad. Pero (valga la repetición) los pro blemas sobre la justificación general o última de la inducción, como tal, los problemas del tipo de «¿Por qué habría que confiar en cualquier inducción?», deben considerarse sinsentidos. Si perseveramos en el intento de plantearlos, llegaremos, tal como Wittgenstein lo expresó, a los «límites del lenguaje» y comprobaremos, que es así por el hecho de que advertimos que lo que pensábamos que eran cuestiones importantes y fundamentales, no eran algo mejor que sinsentidos mal interpretados como con sentido. Lo precedente convertirá las críticas del planteamiento lingüístico en demasiado fáciles, pues el núcleo de los problemas filosóficos que hemos titulado «el problema de la inducción» constituye en el fondo su importancia, su fugacidad, y su capacidad para aturdir y confundir, un auténtico paradigma de perplejidad filosófica. La revisión anterior indica que no se dispone todavía de ninguna filosofía completamente satisfactoria de la inducción. El trabajo aún por realizar puede resumirse como sigue: para quienes admiten el papel crucial de la probabilidad en la inferencia inductiva, desarrollar una reconstrucción consistente, sistemática, y relevante del concepto de probabilidad; para los que rechazan la inducción como mito fuera de lugar, elaborar una relación detallada y comprensiva de la práctica científica que sea razonablemente cercana a los mejores procedimientos actuales de razonamientos sobre cuestiones de hecho; para los que ponen sus esperanzas en la construcción
de una lógica inductiva, eliminar las restricciones im puestas por el estudio de los lenguajes artificialmente sim plificados y mostrar con detalle cómo los enunciados analíticos de probabilidad pueden ser relevantes para la práctica de la predicción inductiva; para los justificacionistas, resolver el problema comparativo de la elección entre hipótesis rivales y mostrar cómo la convergencia eventual a largo plazo puede aplicarse a juicios a corto plazo; para los que consideran la inducción como pseudoproblema, articular la teoría del lenguaje presupuesto y demostrar con argumentos convincentes los orígenes y el carácter de las molestas confusiones que han infes tado la materia.
7ft
Bibliografía Estudios generales
La mejor introducción al tema de la inducción sigue siendo la de William Kneale, Probability and Induction (Oxford, 1949). Ver especialmente, parte II, «The Traditional Problem of Induction». Una discusión más breve y actualizada es la de Stephen F. Barker, Induction and Hypothesis, (Ithaca, N. Y., 1957), que es especialmente útil en lo que respecta a la función de la simplicidad en la inferencia inductiva. Georg Henrik von Wright, The Logical Problem of Induction, Oxford, 1941; 2.a ed. rev. 1957, es de gran valor por su amplia discusión de la historia del tema y contiene también profundas críticas. John Patrick Day, Inductive Probability (Londres, 1961), usa un simbolismo algo difícil pero es bastante completa. Induction: Some Current Issues, editado por Henry E. Kyburg Jr., y Ernest Nagel, Middleton, Conn., 1963, es una relación de conferencias que incluye las versiones de las discusiones de Black, Braithwaite, Nagel, Salmon, y otros. Terminología
Para un buen tratamiento conciso de la terminología ver Kneale, op. cit., págs. 24-48, que incluye la discusión del uso de epagoge por Aristóteles. Kneale es útil también en su tra tamiento de la inducción intuitiva y de la inducción matemá tica. S. F. Barker, «Must Every Inference Be Either Deductive or Inductive?», en Max Black, ed., Philosophy in America, Ithaca, N.Y., 1965, págs. 58-73, da una respuesta negativa;
es un esfuerzo aclarativo para distinguir criterios de inferencia no demostrativa. Historia de los métodos inductivos
Andre Lalande, Les Théories de rinduction et de lexpérimentation, París, 1929, contiene discusiones concisas de New ton, Herschel, Claude Bernard, y otros científicos, así como de Bacon y Mili. No existe una historia general satisfactoria de los métodos inductivos. La mayor parte de los que estudian a Bacon se limitan al Libro I del Novum Organum (disponible en varias ediciones). El mejor comentario filosófico sobre Bacon sigue siendo el de R. L. Ellis «General Preface to James Spedding», en R. L. Ellis y D. D. Heath, eds., The Works o f Francis Bacon, Lonres, 1857. Para una apreciación clara y benévola del programa general de Bacon —pero con una discusión relativamente breve de los puntos de vista de Bacon sobre la inducción— ver la conferencia conmemorativa de C. D. Broad, The Philosophy of Francis Bacon, Cambridge, 1926. Para Mill, ver A System o f Logic, 8.a ed., Londres, 1872, especialmente el libro III, cap. 3, «On the Ground of Induc tion», y cap. 21, «Of the Evidence of the Law of Universal Causation». Ernest Nagel, ed. John Stuart M ills Philosophy o f Scientific Method, New York, 1950, es una selección útil de la Logic, que incluye parte de Examination o f Sir William Hamilton’s Philosophy de Mill. La introducción del editor es de mucha ayuda. Un estudioso consciente de Mili deberá consultar a su crítico injustamente olvidado, William Whewell, cuyo The Philosophy o f the Inductive Sciences, Londres, 1847 —especialmente la parte II, titulada «Novum Organum Renovatum »— es todavía instructivo. Un sumario útil de los puntos de vista de Whewell es el de C. J. Ducasse «William Whewell’s Philosophy of Scientific Discovery», págs. 183-217 en Edward H. Madden, ed., Theories of Scientific Method: The Renaissance Through the Nineteenth Century, Seattle, Wash., 1960. Para los puntos de vista de Peirce, ver Charles Hartshome, Paul Weiss, y Arthur Burks, eds., Collected Papers of Charles Sanders Peirce, 8 vols., Cambridge, Mass., 1931-1958, especial7ß
mente «Ampliative Reasoning», vol. II, págs. 272-607. Por desgracia, los escritos de Peirce sobre la inducción están es parcidos por entre los volúmenes, sin un orden cronológico. Un examen crítico y conciso es el de Thomas A. Goudge, «Peirce’s Treatment of Induction», en Philosophy o f Science, vol. 7 (1940), 56-68. La parte VI de la obra del mismo autor, The Thought o f C. S. Peirce, Toronto, 1950, tiene un tratamien to más detallado, al que el resto del libro proporciona una buena base. Para Keynes, ver A Treatise on Probability, Londres, 1921. Los capítulos 18-22 son los más importantes; incluyen, inter alia, las ideas originales de Keynes referentes a la analogía. Jean Nicod, «The Logical Problem of Induction», parte II de Foundations of Geometry and Induction, Londres, 1930, contiene críticas claras y penetrantes de la posición de Keynes. Para una apreciación más reciente ver von Wright, op. cit., páginas 127-132. Rudolf Carnap, Logical Foundations of Probability, Chica go, 1950, es un elaborado tratado que, aunque aún no terminado y en parte superado por los posteriores estudios de Carnap, sigue siendo la fuente original más importante para sus puntos de vista. P. A. Schilpp, ed., The Philosophy o f Rudolf Carnap, La Sa lle, 111., 1963, es indispensable actualmente a los estudiosos conscientes debido a sus importantes ensayos de defensores y críticos de Carnap y por los detallados comentarios y réplicas de Carnap. John G. Kemeny, «Camap’s Theory of Probability and Induction», págs. 711-738, es un esfuerzo excepcionalmente afortunado por transmitir lo esencial de la posición de Carnap de un modo armónico; Emest Nagel, «Camap’s Theory of Induction», págs. 785-825 (fuertemente atacado en la réplica de Carnap, págs. 989-995), expresa detenidamente las dudas de aquellos que ven en el punto de vista de Carnap una retirada del empirismo; Hilary Putnam, «“Degree of Confirmation” and Inductive Logic», págs. 761-783, es un intento sumamente ingenioso por demostrar que una lógica basada en la confir mación debe violar los cánones aceptados del método cien tífico. Carnap, «The Aim of Inductive Logic», págs. 303-318 en Ernest Nagel, Patrick Suppes, y Alfred Tarski, eds., Logic, Methodology, and Philosophy of Science, Stanford, Calif., 1962, 79
es una importante discusión que sienta las bases de la aplica ción de la lógica inductiva. Camap concluye, «La inducción, si se la reformula adecuadamente, puede mostrarse que es válida mediante criterios racionales.» Problema de la justificación
La lectura de Hume es insustituible. Su propio sumario, An Abstract o f a Treatise of Human Nature, Londres, 1740; reimpreso con Introducción de J. M. Keynes y Piero Sraffa, Cambridge, 1938, no puede ser pasado por alto. Las pági nas 11-20 expresan la esencia de la posición de Hume. El estu dioso consciente debe evidentemente leer L. A., Selby-Bigge, ed., A Treatise of Human Nature, Oxford, 1896. Ver especial mente el libro 1, parte 3. La see. 6, contiene los famosos ata ques escépticos sobre la objetividad de la conexión causal. Ver también la obra de Hume, Enquiry Concerning the Human Understanding, en L. A. Selby-Bigge, ed., 2.a ed., Oxford, 1902, especialmente sec. 4, «Sceptical Doubts Concerning the Opera tions of the Understanding.» Bertrand Russell, «On Induction», cap. 6 de The Problems of Philosophy, Londres, 1912, es una versión clara y concisa de lo que básicamente es la posición escéptica de Hume. La mejor exposición del «nuevo enigma de la inducción» se encuentra en Nelson Goodman, Fact, Fiction and Forecast, Cambridge, Mass., 1955, caps. 3 y 4. La posición de Goodman, con algunas modificaciones inéditas, está armoniosamente dis cutida en Israel Scheffer, The Anatomy of Inquiry, Nueva York, 1963, págs. 291-326. Este mismo libro es valioso por su clara apreciación de diversas teorías de la confirmación in ductiva. Recusación de la inducción
Ver Karl Popper, The Logic o f Scientific Discovery, Lon dres, 1959, especialmente el cap. 1. John Oulton Wisdom, Foun dations of Inference in Natural Science, Londres, 1952, está es crito desde un punto de vista popperiano; Las partes II-IV, páginas 85-232, están relacionadas con la inducción. Para una crítica de la posición general de Popper, ver John Arthur Passmore, «Popper’s Account of Scientific Method», en Phi losophy, vol. 35 (1960), págs. 326-331. HO
Defensas a priori
Donald C. Williams, The Ground of Induction, Cambridge, Mass., 1947, afirma haber respondido a Hume sobre bases a priori. Para un veredicto en contra, ver la extensa recensión de Max Black en The Journal of Simbolic Logic, vol. 12 (1947), páginas 141-144. Roy F . Harrod, Foundations of Inductive Logic, Londres, 1956, es otro ingenioso intento por mostrar que la inducción debe ser exitosa. Para una crítica, ver la recensión de Popper en British Journal for the Philosophy o f Science; vol. 9 (19581959), págs. 221-224; la réplica de Harrod aparece en el vol. 10 (1959-1960), págs. 309-312. Apoyo inductivo de la inducción
Consultar Richard B. Braithwaite, Scientific Explanation, Cambridge, 1953, cap. 8, «The Justification on Induction», páginas 255-292. La aguda crítica de Abner Shimony «Braithwaite on Scien tific Method», en Review o f Metaphysics, vol. 7 (1953-1954), páginas 644-660, no ha sido rebatida todavía. Sobre este tó pico véase también H. E. Kyburg, Jr., «R. B. Braithwaite on Probability and Induction», en British Journal for the Philo sophy of Science, vol. 9 (1958-1959), págs. 203-220. Una defensa de la solidez de las inducciones independientes puede encontrarse en Max Black, «Inductive Support of In ductive Rules», págs. 191-208 en Problems o f Analysis, Ithaca, N. Y., 1954 y «Self-supporting Inductive Arguments», páginas 209-218, en Models and Metaphors, Ithaca, N.Y., 1962. Para una crítica de los puntos de vista de Black, ver Peter Achinstein, «The Circularity of a Self-supporting Argument», en Analysis, vol. 22 (1961-1962), págs. 138-141. Ver igualmente la respuesta de Black en la misma revista, vol. 23 (1962-1963), págs. 43-44, y la réplica de Achinstein, ibid., págs. 123-127. Reconstrucciones deductivas
Ver Bertrand Russell, Human Knowledge: Its Scope and Limits, Nueva York, 1948, Russell establece y defiende los «1
postulados de la inferencia científica en la parte final, páginas 421-507. Arthur W. Burks, «On the Presuppositions of Induc tion», en Review o f Metaphysics, vol. 8 (1955), págs. 574-611, es una persuasiva exposición por el defensor contemporáneo más solvente de la reconstrucción deductiva. Véase así mismo el artículo de Burks en Schilpp, ed., The Philosophy of Rudolf Carnap, ya citado, y su libro de próxima aparición Cause, Chance and Reason. La reconstrucción deductiva es criticada en la mayoría de los artículos reseñados a continuación en la sección de la inducción como pseudoproblema. C. D. Broad, «On the Relation Between Induction and Pro bability», en Mind, vol. 27 (1918), págs. 389-404, y vol. 29 (1920), págs. 11-45, es una temprana e injustificadamente ol vidada discusión cuya segunda parte es un desarrollo sugestivo de las ideas de Keynes. Defensas pragmáticas
Los puntos de vista de Herbert Feigl están contenidos en dos de sus artículos, «De Principiis Non Est Disputandum...?», en Max Black, ed., Philosophical Analysis, Ithaca, N.Y., 1950, y «Validation and Vindication», en Wilfrid Sellars y John Hospers, eds.; Readings in Ethical Theory, Nueva York, 1952, páginas 667-680. El primer escrito defiende el caso de la vin dicación como modo especial de justificación, y el segundo se extiende sobre la misma idea. Hans Reichenbach, The Theory of Probability (Berke ley, 1949), es el locus classicus de las recientes defensas pragmá ticas; ver especialmente «The Justification of Induction», págs. 469-482. Del mismo autor Experience and Prediction (Chicago, 1938) contiene una presentación más popular. Isabel P. Creed, «The Justification of the Habit of Induction», en Journal o f Philosophy, vol. 37 (1940), págs. 85-97 y Everett J. Nelson, «Professor Reichenbach on Induction», en Journal of Philosophy, vol. 33 (1936), págs. 577-580, son dos aprecia ciones y críticas minuciosas de la posición de Reichenbach. Max Black, «“Pragmatic” Justifications of Induction», en su Problems o f Analysis, Ithaca, N. Y., 1954, págs. 157-190, es un extenso ataque a la «vindicación pragmática». Wesley C. Salmon, «The Short Run», en Philosophy of
Science, vol. 22 (1955), págs. 214-221, es un intento admirable, aunque en el fondo, infructuoso, de evitar la dependencia de la sucesión infinita. En «Should We Attempt to Justify Induc tion?», Philosophical Studies, vol. 8 (1957), págs. 33-48, Salmon defiende minuciosamente el planteamiento pragmático; la obra de Black «Can Induction Be Vindicated?», en su Models and Metaphors, Ithaca, N.Y., 1962, págs. 194-208, es una réplica pormenorizada a Salmon. Salmon, «Vindication of Induction», en H. Feigl y G. E. Maxwell, eds., Current Issues in the Philosophy of Science, Nueva York, 1961, págs. 245-256, es la versión más actual de la aproximación de Reichenbach por su defensor contemporá neo más solvente. Ver también las contribuciones de Salmon a Nagel y Kyburg, eds., Induction, ya citado. La inducción como pseudoproblema
Para una introducción al creciente número de estudios es critos desde este punto de vista, ver Alice Ambrose, «The Pro blem of Justifying Inductive Inference», en Journal o f Philo sophy, vol. 44 (1947), págs. 253-272; Max Black, «The Justifi cation of Induction», en su Language and Philosophy, Ithaca, N.Y., 1942, págs. 59-88; Frederick L. Will, «Will the Future Be Like the Past?», en Mind, vol. 56 (1947), págs. 332-347; y Paul Edwards, «Russell's Doubts About Induction», en Mind, vol. 58 (1949), 141-163. Tal vez la relación breve más accesible sea la de Peter F. Strawson, «The “Justification” of Induction», en Introduction to Logical Theory, Londres, 1952, págs. 248-263. Una breve crítica del «planteamiento lingüístico» se encuentra en muchos de los recientes trabajos reseñados anteriormente. No se dispone todavía de ninguna exposición satisfactoria mente amplia de la posición de los «lingüistas» o de sus críticos.
Bibliografías e historias
Se presentan bibliografías extensas en los libros anterior mente mencionados de Keynes (hasta 1921), Carnap (has ta 1951), y von Wright (hasta 1955). Black, «Induction and Probability», en Raymond Klibansky, ed., Philosophy in the Mid-century, Florencia, 1958, pági nas 154-163, es una historia crítica del trabajo de la década anterior. H.E. Kyburg, Jr., «Recent Work in Inductive Logic», en American Philosophical Quarterly, vol. 1 (1964), págs. 249-287, es un análisis sumamente útil de las principales corrientes, con una crítica y una bibliografía amplia.
«4
PROBABILIDAD Max Black
Versión castellana de Rafael Beneyto
La probabilidad Nuestra discusión de la probabilidad consta de tres partes principales. Parece aconsejable pergeñar en la primera parte «el sentido común de la probabilidad», el complejo, patrón de los usos ordinarios de «proba blemente» y sus cognados semánticos, lo cual constituye el punto de partida de todos los intentos de análisis y re construcción filosóficos. Igualmente importante es la teo ría matemática bien-establecida de la probabilidad, cuyos puntos principales se conocen desde hace dos siglos, y que se discute en la segunda parte. La parte final bosqueja los principales tipos alternativos de interpretaciones filosóficas de la probabilidad disponibles en el momento de la redacción. Estas tres partes son relativamente independientes y pueden leerse en cualquier orden. El lector debe tener en cuenta que la filosofía de la pro babilidad es sumamente controvertida, y que los puntps de vista expuestos en este artículo son rechazados por muchos teóricos competentes. No es corriente quedarse sorprendido cuando un filó sofo, en su actividad profesional, hace una afirmación del tipo «Probablemente P», o del tipo «La probabili dad de P, dado D, es tal y tal». El contexto natural de una referencia a la probabilidad es una afirmación sobre cuestiones de hecho, sobre las que los filósofos, según consenso general, son profesionalmente indiferentes. Cuando un filósofo dice que espera haber hecho proba ble que la aritmética puede ser reducida a la lógica (Gott87
lob Frege), o insiste en que el sentido común tiene en conjunto una probabilidad más alta de ser correcto que cualquier teoría metafísica conflictiva (Bertrand Russell), quizá esté solamente recordando al lector la falibilidad humana. Sin embargo, toda ineludible referencia a la probabilidad constituye un rasgo distintivo de las argu mentaciones no-demostrativas sobre cuestiones de hecho, que requieren indicaciones más o menos precisas de la fiabilidad reconocida tanto a las premisas como a la conclusión. El fundamento de la argumentación nodemostrativa es un tópico de gran interés filosófico. El consiguiente interés por el concepto de probabilidad resulta incrementado por su íntima conexión con el aún más impreciso e importante concepto de racionali dad. Ciertamente, no es muy exagerada la afirmación de Pierre Simon de Laplace de que los problemas más importantes de la vida son, por lo general, los de la pro babilidad. Cualquiera que aspire a la racionalidad debe guiarse ante la incertidumbre por probabilidades: cómo se ha de hacer esto y con qué justificación son los princi pales temas de la filosofía de la probabilidad. Ahora, como en todo momento, las más urgentes tareas filosóficas son las de analizar, clarificar y, si fuera necesario, reconstruir el concepto y sus cognados. El «punto-de-arranque» de tal trabajo, como reconocen quienes lo acometen, es el concepto «ordinario» o «prea nalítico», cuyas características importantes se manifies tan en los usos aceptados de las correspondientes expre siones de probabilidad.
8B
El sentido común de la probabilidad “Probablemente”, “Probable” y “ Probabilidad ”
Una inspección adecuada del habla del lego sobre la probabilidad debe tener en cuenta los usos de las pala bras «probablemente», «probable» y «probabilidad», junto con sus numerosas sinónimas, antónimas y parónimas. Sin embargo, es plausible dar primacía lógica al uso del adverbio, en combinación con oraciones sin gulares o cláusulas «que». Es en todo caso conveniente comenzar con los usos ordinarios de oraciones tales como «Probablemente se extraerá una bola negra», donde lo que puede llamarse oración semilla («Se extrae rá una bola negra») hace referencia a un evento particular (la extracción de una bola de una bolsa) cuyo acontecer (el rasgo relevante —el si la bola es blanca o negra—) se desconoce en el momento de la proferencia. Los comentarios que siguen son, cuando menos, plausibles: 1) «Probablemente» está semánticamente emparen tado con «posiblemente» y con «seguramente». Más en concreto, «probablemente» encaja, por lo general, en todas las estructuras de oraciones en las que encajan los otros dos adverbios, de modo que puede sustituirse por uno de ellos cualquiera de los otros sin violar la sintaxis o la lógica. 2) «Probablemente» implica «posiblemente» y exclu ye «seguramente», lo que es probable, ni es seguro ni imposible. Todo el que dice que probablemente se ex traerá de una urna una bola negra implica que es posible 89
que se extraiga tal bola y también que no es seguro que vaya a ser así —y similarmente en otros casos. 3) En tales contextos, el sentido relevante de la posi bilidad es el de la posibilidad empírica, no «lógica». Un interlocutor que afirme que cabe que «posiblemente» se extraiga una bola negra está implicando, a ciencia cierta, la ausencia de inconsistencia lógica entre el establecimiento de las condiciones iniciales conocidas (la naturaleza y composición de las bolas de la urna y el modo de extracción) y una predicción referente a que se extraerá de hecho una bola negra. Pero implica algo más. Quiere decir que, a la vista del contenido de la urna, y del modo de selección, la extracción de una bola negra no está excluida por los hechos, en el sentido de que sí lo estaría la extracción de un pájaro negro; (detrás de todo ello se esconde la idea de que la naturaleza de las cosas excluye la ocurrencia de muchas otras que son lógicamente posibles.) 4) Tal como se sugiere en la última observación, hay una referencia implícita, en toda aserción del tipo que estamos considerando, a las «condiciones iniciales» (o, en términos más familiares, al «modo como las cosas son ahora» —esto es, antes del ensayo). «Probablemente se extraerá una bola negra» puede considerarse como una elíptica de «Dado que tenemos un urna de tal y tal tipo, que contiene tantas y tantas bolas de colores conocidos, etc., probablemente se extraerá una bola negra». Las condiciones iniciales se identifican mediante alguna descripción abstracta: diferentes descripciones de un estado del mundo pueden dar lugar a diferentes estimaciones de la probabilidad. (La información sobre la carga eléctrica de las bolas, por ejemplo, puede afectar a la probabilidad de extraer una negra.) 5) Con frecuencia, un interlocutor afirmará «Proba blemente P» con una ignorancia total o parcial de las condiciones iniciales (con razones consiguientemente débiles para su juicio); entonces la fuerza de su afirmado
ción viene a ser, más o menos, «En vista del estado des conocido del universo anterior al ensayo, probable mente se extraerá una bola negra». 6) Hablando gramaticalmente, el adverbio «proba blemente» modifica toda la «oración semilla» (o, en otros contextos, toda la cláusula-«que») a la que está adosado. Ello viene sugerido en inglés, así como en otras lenguas, por el carácter «parentético» de este adver bio, su capacidad de figurar, sin incongruencia gramati cal, casi entre cualesquiera palabras de la oración semilla. 7) Si la oración semilla en sí misma («Se extraerá una bola negra») se considera que expresa la ocurrencia de un suceso, evento o estado de hechos aún por realizar, tendremos que decir, materialmente, que la probabili dad, como la posibilidad y la seguridad, se atribuye ordinariamente a tal «situación» —a algo expresado por la oración. Así, pues, «probablemente» pertenece, prima facie, al lenguaje objeto y no al metalenguaje en el que se mencionan más que se usan las características de las expresiones verbales. Es, por tanto, erróneo decir, como hacen algunos escritores, que la probabilidad es un atributo de las proposiciones. Si se ha de emplear este tipo de lenguaje, la precisión nos obliga a decir que los juicios de probabilidad se refieren a la probabilidad de que una proposición sea verdadera más que a la proba bilidad de la proposición simpliciter. 8) Al menos en algunos usos, «Probablemente se extraerá una bola negra» implica que será extraída una bola negra. (Este punto, más polémico que sus predece sores, sería negado por muchos teóricos.) Es absurdo decir «Probablemente se extraerá una bola negra, pero, no obstante, no se extraerá una bola negra». Aunque con el uso que el interlocutor hace de «probablemente» se pretende insinuar que las condiciones iniciales no son lo suficientemente fuertes como para hacer empíri camente seguro el fenómeno referido, con toda la aser 91
ción, si bien se halla acompañada del reconocimiento de falibilidad, se pretende comprometer al interlocutor con la verdad de la semilla. Un lego, no influenciado por las supuestas demandas de un análisis filosófico correcto, dirá, tras extraer una bola blanca: «Estaba equivocado», la falsedad de la semilla cuenta como un revés, un fracaso. Por supuesto, el interlocutor puede añadir: «Pero tenía razones para decir lo que dije —a saber, que probablemente se extraería una bola negra.» 9) Por lo tanto, podemos distinguir entre la propiedad de una aserción de probabilidad y su corrección. Conforme al punto de vista que aquí se mantiene, una aserción singular de probabilidad cumple la doble finalidad de intentar hacer una atribución apropiada de probabilidad y también de intentar predecir el fenómeno. Así, lo que se persigue con una aserción de probabilidad es hacer una predicción que sea a la vez fundada (justificada por la evidencia) y exitosa (verdadera); si es lo primero, puede decirse garantizada, si lo segundo, satisfecha. (Es interesante hacer notar que «verdadero» y «falso» parecen modificadores incongruentes de oraciones completas de probabilidad.) El carácter asertivo de una aserción de probabilidad adverbial con frecuencia desaparece en los usos adjetivales de «probable» y está casi invariablemente ausente de los usos sustantívales de «probabilidad». 10) «Probablemente» admite adverbios de comparación —la probabilidad es «graduable». A la pregunta suplementaria «¿Cómo de probable?», siempre a punto después de que se ha hecho una aserción «probablemente», se puede contestar con «bastante probable», «muy probable», «casi seguro» e incluso, en contextos especiales que se discutirán más adelante, con una indicación de oportunidades o suertes numéricas. 11) La posibilidad es graduable más o menos en la misma línea en que lo es la probabilidad: la pregunta «¿Cómo de posible?», por extraña que pueda parecer a
algunos filósofos, se da en el habla ordinaria, y a ella puede contestarse con «muy posible», «casi seguro», etc. —«Seguramente», por su parte, funciona como límite al que la posibilidad y la probabilidad pueden tender sin alcanzarlo. En el uso ordinario, la seguridad no es un caso especial de la probabilidad. «Rayano a lo seguro» y «casi seguro» son locuciones naturales, mientras que «muy seguro» y «bastante seguro» resultan decididamente absurdas. 12) Las gradaciones de probabilidad, reflejadas en expresiones tan corrientes como «más probable que menos», «algo probable», «muy probable» y «tan pro bable como para ser casi seguro» parecen corresponder de modo preciso a las correspondientes gradaciones de la posibilidad, (la improcedencia de decir, en castellano, «más posible que menos» y «tan posible como para ser casi seguro» puede eliminarse como resultado de contingencias del idioma). Es interesante, ciertamente, pararse a considerar si la noción común de probabilidad no es sino la de menor o mayor posibilidad relativa a las «condiciones iniciales», considerada a la luz de su «distancia» respecto de la seguridad. Ello es, por supuesto, inaceptable como análisis, pero tal vez no se pida una definición formal; quizá todo lo que se desea no es sino una descripción suficientemente minuciosa de los usos divergentes de «probablemente» y sus parientes semánticos. 13) En esta identificación de la probabilidad con la posibilidad empírica, una pregunta del tipo de «¿Cuál es la probabilidad de P, dado DI» (cuando es congruente) pide una valoración del alcance de la posibilidad de la verdad de «P» puesto al descubierto por la verdad de «D». Igualmente, «¿Cuál es la longitud de » pide una medida de la extensión de B en una determinada dirección. Sin embargo, la longitud no se debe identificar con el resultado numérico de la comparación de la extensión con un cuerpo estándar; ni tampoco se ha de identificar 93
la probabilidad, como se hace con excesiva frecuencia, con su medida numérica. 14) El «aspecto asertivo» de los usos ordinarios de «probablemente» (véase 8, más arriba), está íntimamente ligado, por vías difíciles de precisar, a la función práctica de las estimaciones de probabilidad, dentro de la práctica general de intervenir en las conclusiones de las argumen taciones no-demostrativas. Se consideraría absurdo en contextos comunes decir, por ejemplo, «P es tan pro bable como para ser dado por seguro, pero no creo que P sea el caso». Sería igualmente absurdo decir «P puede darse por seguro, pero propongo que no se tomen medidas pertinentes a que P sea el caso». Hablando llanamente, en la práctica general de extracciones de «inferencias de riesgo» se exige disponerse para lo que es casi seguro y olvidar lo que es extremadamente impro bable. (La evaluación de cuán improbable ha de ser una conclusión, con vistas a ser relegada convenientemente, debe dejarse, en último extremo, al criterio del razonador.) Un tratamiento suficientemente detallado de los usos de «probablemente» (que no puede llevarse a cabo aquí) requeriría un análisis parejo de los usos relevantes de «espectación», «razonable» y «justificación». 15) Un caso paradigmático del uso de «probable mente» es el siguiente: Imagínese que se ha introducido una canica en una caja totalmente cerrada, excepto por un agujero lo suficientemente grande como para permitir que pase por él la canica. Imagínese que se agita fuerte mente la caja durante treinta segundos. El sentido común insinúa que la bola entonces «tiene una oportunidad» de ser expulsada, porque es posible que esto ocurra. Que esta posibilidad empírica está presente puede mostrarse agitando repetidamente la caja por el tiempo prescrito: si la canica cae fuera alguna vez, era posible que sucediera así; si nunca sucede, el sentido común concluirá que es «imposible que la canica se salga» en las condiciones especificadas. Si en una larga serie de ensayos hechos
bajo las condiciones prescritas resulta que la bola ha sido expulsada en una mayoría sustancial de casos, el sentido común concluirá que la bola «probablemente» será expulsada en el próximo ensayo. 16) Supóngase ahora que se practica un nuevo agu jero del mismo tamaño en la caja. Entonces parece «obvio» o «evidente por sí mismo» que la canica cuenta con «una nueva oportunidad» o nueva posibilidad de salirse, y que, correspondientemente, ha aumentado (o, más cautamente, no ha disminuido) la probabilidad de que se salga. Pero, puesto que lo que está sobre el tapete es la posibilidad empírica, el supuesto puede someterse a prueba empírica. Si bajo las nuevas condiciones se ve que la canica se sale en conjunto en una proporción de casos sustancialmente mayor que antes, el supuesto de que «sus oportunidades» de ser expulsada han aumentado resultará suficientemente verificado. (Si el nuevo agujero no altera la frecuencia de éxitos, la conclusión será que un agujero «interfería» de algún modo con el otro.) La observación de ensayos reiterados aporta evidencia para los juicios de probabilidad. Sin embargo, identificar la probabilidad con la frecuencia proporcional es tan criticable como identificar la posibilidad con la ocurrencia eventual. 17) Se habrá observado que hemos estado utilizando «posibilidad» y su sinónimo impreciso «oportunidad» como nombres comunes. En las situaciones paradigmáticas, el sentido común concibe tantas «oportunidades», en plural, como agujeros para obtener el resultado apetecido (repárese en la expresión común «dame una oportunidad», donde «oportunidad» tiene más o menos el significado de «ocasión»). Si, dado D ,P e s empíricamente imposible, entonces la situación inicial que hace a D verdadera cierra todos los caminos al «éxito», (la canica está totalmente encerrada en su caja; pero si se relajan suficientemente las condiciones iniciales tiene cabida el fenómeno —la bola puede salirse o no, porque ahora
hay un paso, una «oportunidad» tangible para salir. Cuando se puede decir justificadamente «dado D, pro bablemente P», la imagen es la de que los «pasos» predominan sobre las «barreras». 18) Si se insta a un lego a que explique en lenguaje no figurativo qué significa decir que los pasos «predominan» sobre las barreras, puede presentar una imagen algo diferente. Puede concebirse ahora que las «condiciones iniciales» comportan fuerzas o influencias, tendentes unas a dar lugar a P y oponiendo resistencia las otras. (La imagen subyacente es la de algo similar al juego de la cuerda entre aliados y adversarios.) Desde esta pers pectiva, decir «probablemente P» no es sino afirmar que, habida cuenta de todas las circunstancias, las influencias propicias prevalecerán sobre sus oponentes. En un caso de seguridad empírica, las condiciones iniciales (la parte efectiva del universo en un momento dado í) fuerzan y determinan totalmente el fenómeno. En un caso de posibilidad empírica, sin embargo, las condiciones iniciales determinan el fenómeno sólo parcialmente, de modo que en el momento t de la proferencia determinadas situaciones pueden tener lugar, mientras que otras no. Finalmente, un caso de probabilidad es tal que entre el conjunto de fenómenos posibles a que dan cabida las condiciones iniciales, uno (la situación expresada por la semilla del enunciado «probablemente») se ve en conjunto favorecido por las condiciones iniciales y, habida cuenta de todas las circunstancias, puede, en consecuencia, preverse. 19) Las referencias anteriores a «imágenes» están justificadas por el grado en que el habla del lego sobre la probabilidad se halla dominado por la imaginación pictórica y la cruda mitología, agazapadas justo a flor de piel. No está claro cuánta sea la influencia que ejerce tal imaginación. Las concepciones dramáticas de oportunidades «favorables» y «adversas», de vías tangibles para
la realización, etc. (cada una de las cuales se difumina necesariamente en situaciones donde encajan con menos plausibilidad que en la situación ya considerada), pare cen dejar inalteradas las condiciones relevantes de la verificación: quien las deseche como cuentos de hadas adoptará los mismos métodos que cualquiera otro para llegar a las probabilidades. Pero la referencia a la posibilidad empírica no se ha de hacer a un lado tan alegremente. Demasiados filósofos manifiestan un injustificable horror possibilitatis: un po sitivista concienzudo, por ejemplo, es propenso a consi derar todo habla en tomo a la posibilidad empírica como algo no superior a pintorescos sinsentidos y tratará de limpiar el habla ordinaria sobre probabilidad de toda referencia implícita a lo inobservable-en-principio. Con todo, hablar de posibilidad empírica y de necesidad empírica no parece más objetable, en principio, que hablar de personas o de mesas; ni parece haber nada malo en admitir una noción de determinación empírica parcial. Las «imágenes» que subyacen al habla ordinaria de probabilidad, por rudas que sean, quizá puedan hacerse tan respetables filosóficamente como los más elegantes puntos de vista generales sobre el universo. 20) Las concepciones de «determinación parcial», «condiciones favorables» y similares, proporcionan un poderoso apoyo a determinados principios generales de la probabilidad que son necesarios en la teoría matemá tica de la probabilidad. En consecuencia, se sigue de lo que ya se ha dicho que todo refuerzo de las «oportuni dades favorables» que deja intactas las oportunidades ini ciales, no puede reducir la probabilidad de P. (Por con siguiente, se podría esperar que el segundo agujero prac ticado en la caja no habría de hacer disminuir la oportu nidad de expulsar la canica). Lo cual puede formularse con más precisión de la siguiente manera: supóngase que P entraña Q; entonces la probabilidad de Q, dado D, no es menor que la probabilidad de P, dado D. Similar97
mente, el aumento de la superioridad relativa o la «fuer za» de las condiciones favorables a P no puede hacer disminuir la probabilidad de que P sea el caso. (En el juego de la cuerda, el incorporar un nuevo hombre a un equipo no puede mermar las perspectivas de éxito del equipo, siempre que el nuevo hombre no interfiera la marcha de aquellos que ya había.) Muchos escritores han acordado tratar esos principios como axiomáticos. 21) Algunos filósofos dirán que el valor efectivo del habla ordinaria sobre la probabilidad, contaminada como se encuentra con metáforas dudosas, puede ha llarse sólo en las correspondientes condiciones de veri ficación. Parece haber dos tipos principales de verificación. El más elemental ya se ha expuesto: consiste en la ape lación a la frecuencia relativa de ocurrencias en casos similares. Si bajo las condiciones iniciales D, D ',D ', . . . , tienen lugar, respectivamente, los resultados P, P', P", . . . sustancialmente más veces que no (donde las D son todas semejantes en los aspectos importantes, y los P son todos semejantes en los aspectos importantes) entonces se considera que esta circunstancia establece que, dado D, P goza de una mayor oportunidad de tener lugar que no-P. Se advertirá que este tipo de método de verificación hace uso de la inferencia inductiva y presupone, por tanto, la validez de los métodos induc tivos. 22) Modos menos directos de verificación, en el uso común, se basan en el examen de las condiciones inicia les dadas más que en una inferencia inductiva a partir de las consecuencias de ensayos repetidos. Un hombre puede (o puede parecer) inferir, a partir del mero cono cimiento de las condiciones definitorias, que hay una mayor oportunidad de extraer una bola negra de una urna que contiene el 99 por ciento de negras que de extraerla de otra urna que contenga el 50 por ciento de negras. Un examen más detenido de los supuestos 98
que se hallan detrás de tal razonamiento pondrá al descubierto el papel esencial desempeñado por la experiencia previa —por ejemplo, sobre cómo el agitar o el bara jar favorecerá las distribuciones «de azar» de los resultados. 23) El último punto sugiere que ciertos compromisos con la uniformidad desempeñan un papel importante en el punto de vista del sentido común. Fijar el habla común sobre «fuerza», «razones» y «determinación», antes mencionadas, constituye la concepción de que de condiciones semejantes deben seguirse consecuencias semejantes. De este modo, si una bola extraída de una determinada manera de una bolsa B que contiene un número dado de bolas, tiene una determinada probabilidad p de ser negra, el sentido común pide que una bola extraída del mismo modo de otra bolsa B ’, similar en todos los aspectos importantes, especialmente en tener el mismo número de bolas, tenga la misma probabilidad de ser negra. Las frecuencias proporcionales correspondientes de ocurrencias se supone que también son aproximadamente iguales. El habla de probabilidades se basa en una generalización del determinismo: Se supone que condiciones similares van acompañadas de distribuciones similares de las probabilidades y de distribuciones similares de las frecuencias correspondientes. 24) Las observaciones anteriores se han referido a lo que podría llamarse sentido absoluto de «probablemente», donde las «condiciones iniciales» a que se hace referencia explícita o implícita se identifican con las características relevantes del «estado del mundo» en el momento de la proferencia. Se debe prestar atención ahora a un sentido explícitamente relativo, ejemplificado en usos tales como «Con base en la evidencia dispobible, probablemente es culpable», o «Dado que es un americano rico, hay una alta probabilidad de que sea repu blicano». El uso absoluto de «probablemente» antes discutido
puede reducirse al uso explícitamente relativo del siguiente modo: en la fórmula «Con base en la evidencia D, probablemente P (en tal y tal grado)» supóngase que D se refiere a lo que anteriormente se llamaban las condiciones iniciales. De este modo, el uso «absoluto» puede considerarse como un caso especial del uso «relativo» cuando el datum es la condición (conocida o supuesta) del universo en el momento de la aserción. Podemos reconocer, pues, el alto grado de verdad existente en el dicho comúnmente aceptado de que la probabilidad es siempre relativa a la evidencia. Lo cual es correcto en su implicación de que todo aserto de probabilidad, tanto si es explícitamente relacional como si no lo es, se retrotrae a las supuestas condiciones que lo posibilitan —o, desde otra perspectiva, a las fuerzas que lo controlan u «oportunidades» favorables —que podrían expresarse en una versión más explícita de la aserción original; sin embargo, es erróneo pretender concluir que, en ausencia de tales indicaciones explícitas de sus fundamentos, los juicios ordinarios de probabilidad son imperfectos o están faltos de complementación. 25) La anterior concepción de los usos ordinarios de «probablemente» puede extenderse, con un pequeño esfuerzo, a los casos en los que el adverbio está adosado a un enunciado general. Después de examinar una amplia y variada muestra de grillos, un biólogo puede decir: «Probablemente todos los grillos tienen oídos en sus patas.» El sentido común se inclina a pensar que los hechos revelados en la muestra examinada fuerzan y favorecen una posibilidad general (que todos los grillos tengan oídos en sus patas) a costa de las posibilidades rivales. La información disponible sobre el universo reem plaza ahora a las condiciones iniciales supuestas. En este uso no es necesario que haya implicación alguna de incertidumbre objetiva respecto al estado de hechos a que se adscribe la probabilidad: una persona que diga «Sobre la evidencia disponible, probablemente todos los
A son B», puede proclamar, sin inconsistencia, que hay
razones concluyentes «en el mundo» para que todos los A sean B. Así pues, se pueden hacer consistentemente atribuciones de probabilidad relativa, por parte de un empedernido determinista, como Laplace. Que algún aspecto general de «los hechos» favorezca ciertos otros aspectos de gran alcance sin necesitarlos por completo es compatible con la determinación total de un suceso en toda su especificidad. (Puede que esta idea estuviera a la base de la observación de Ludwing Wittgenstein de que las aserciones de probabilidad corresponden a un punto de vista «miope» del mundo.) 26) La expresión «Es probable que» funciona a veces como sinónima de «probablemente»; más característico, sin embargo, es su uso para testificar la fuerza de las condiciones determinantes como conducentes, habida cuenta de las circunstancias, al resultado señalado. En muchos casos la no afirmación de la semilla es patente. Con el uso del sustantivo «probabilidad», se produce aún una mayor distancia epistemológica a todo acto de afirmación: decir algo como «Dado D, la probabilidad de que P es tal y tal» es formular un juicio teórico sobre la fuerza de las condiciones de facilitación, sin plantearse el problema de si se puede prever P con la suficiente confianza como para que su afirmación sea justificada. No obstante, a la probabilidad así concebida teoréticamente, aún le acompaña algo del uso adverbial, que tiene más cuerpo, y existen pasos lógicos de afirmaciones sustantívales a adverbiales. Por ejemplo, no se requiere mediación alguna para el paso lógico de «Dado D, la probabilidad de que P es aplastante» a «Dado D, pro bablemente P», con fuerza asertiva. 27) El grado en que se puede asignar medidas exactas a los grados de probabilidad (o —lo que viene a ser lo mismo según el punto de vista que aquí se mantiene— a los grados de posibilidad) es discutible. Al menos en algunos casos, los juicios comparativos de probabilidad 101
(véase, por ejemplo, 16, más arriba) cuando se empareja con el principio generalizado de uniformidad (21, más arriba) convencen fácilmente al lego a asignar determinadas medidas de probabilidad. Supóngase, por ejemplo, que se pegan diez tarjetas iguales, blanca cada una de ellas por un lado y negra por el otro, en un cristal vertical de tal forma que queden a la vista cinco caras blancas y cinco negras: pídase a una persona A , situada a un lado del cristal, que elija una tarjeta cualquiera, y pídase lo mismo a otra persona B, situada al otro lado. Entonces el sentido común está casi ineludiblemente inclinado a decir que las situaciones de A y B son semejantes en todos los aspectos importantes y que, en consecuencia, la oportunidad de que se elija por parte de A una tarjeta blanca es exactamente la misma oportunidad de que se elija por parte de B una negra. Con la convencional asignación de la unidad a la seguridad, se sigue, pues, que la oportunidad de que se elija, bien sea por parte de A o de B una tarjeta blanca es exactamente de 1/2. (Este es un ejemplo del uso del «principio de indiferencia» que se discutirá en la parte final de este artículo). Si se preguntase, en cambio, por la probabilidad de, digamos, hallar vida en Marte, resultaría difícil suponer una medida apropiada concreta. Pero de nuevo ahora un lego estimaría, con toda confianza, la probabilidad por debajo del 99 por ciento. Detrás de tal juicio puede muy bien esconderse una imaginaria comparación con el estado relativo de confianza que se tiene de la ocurrencia de algún resultado concreto en un juego de azar. Si una persona está convencida de que podría apostar mejor por dos seises consecutivos con un dado sin trucar que por la existencia de vida en Marte, podría, en principio, establecer un límite superior a su confianza en la verdad de la última proposición (véase la discusión de las interpretaciones «subjetivas» de la probabilidad en la última parte de este artículo). 102
El punto de vista correcto parece ser que los usos ordinarios de la probabilidad (influenciados, sin duda, por su exposición a la discusión de las diferencias en los juegos de azar) emplea medidas rudimentarias y limitadas de probabilidad, pero se espera que puedan modificarse, mediante artilugios adecuados, para llevar tales estimaciones a cualquier grado de precisión deseado. Las teorías matemáticas de la probabilidad superponen un sistema de coordenadas numéricas a los juicios comparativos de probabilidad del sentido común intuitivo, faltos, en parte, de estructuración. Las relaciones entre tales cálculos matemáticos y la matriz del sentido común pueden ser plausiblemente comparadas a las que hay entre las lecturas termométricas y las toscas apreciaciones de la «calentura». ¿Múltiples sentidos de la probabilidad?
La propiedad de las que parecen ser vías radicalmente diferentes de verificar los juicios ordinarios de probabilidad (por ejemplo, desde contar el número de puntos de un dado hasta consultar las tablas de mortandad) ha conducido a un número de escritores a afirmar que «pro babilidad» es un término equívoco. Dos es el número preferido de sentidos, aunque algunos escritores han defendido hasta cinco. La falta de criterios umversalmente aceptados referentes a la identidad de sentidos o a la identidad de conceptos hace difíciles de amillarar tales afirmaciones. El criterio más influyente para el reconocimiento de sentidos radicalmente distintos de probabilidad ha sido establecido por Rudolf Carnap, que quería distinguir rígidamente entre probabilidad como «credibilidad racional» y probabilidad como «frecuencia relativa límite de ocurrencias». Pero su argumentación, si se examina, resulta basarse exclusivamente en las diferentes vías de verificación de dos afirmaciones 103
de probabilidad, considerada a priori la una y empírica la otra (aunque ulteriormente ofrece una interpretación «lógica» también de esta última). A los escritores que pretenden argumentar que la existencia de afirmaciones de probabilidad tanto a priori como empíricas justifica la atribución de una pluralidad de sentidos se les podría pedir que reflexionaran sobre si «dos» tiene sentidos diferentes en «Jones tiene dos manos» y «Dos y dos son cuatro». No parece haber razones suficientes para reconocer sentidos radicalmente distintos de probabilidad. Estructura del punto de vista del sentido común
En la vida ordinaria, una aserción del tipo de «proba blemente P», donde «P» expresa la realización de algún posible suceso o situación, tiene la función de comprometer al interlocutor con la verdad de P, sobre la base de la existencia de «condiciones iniciales posibilitadoras» que favorecen la realización de P, sin asegurarla. Así, pues, el uso del adverbio significa la supuesta existencia de tales condiciones y garantiza que la aserción en la que ocurre será tenida en cuenta o «prevista». En ausencia de otras indicaciones, las condiciones posibilitadoras se sobreentiende que constituyen el «estado del universo» o la parte relevante del mismo, en el momento de la proferencia. En las aserciones de probabilidad relativamente explícita, sin embargo, el fundamento viene ex presado por una cláusula que formula información concerniente a algún aspecto general del universo, que se concibe como favorable a algún otro aspecto general (una relación de determinación parcial entre atributos). En los usos sustantívales («Dado D, la probabilidad de que P es tal y tal») la fuerza asertiva del uso adverbial es puesta entre paréntesis, o suspendida, siendo el cometido de tales usos tan sólo el estimar el grado en que las condiciones posibilitadoras importantes (expresadas 104
por la referencia a «Z>») favorecen la realización del resultado P. El planteamiento de la probabilidad aquí esbozado difiere de otros análisis actuales en parte, o en la totali dad, de los aspectos siguientes: a) la probabilidad no es tratada como un concepto equívoco: b) la probabili dad se considera tan legítimamente aplicada a situacio nes singulares como a aspectos generales del mundo; c) la probabilidad no se identifica con la frecuencia re lativa ni con ninguna relación lógica definible entre pro posiciones ni con ningún pretendido estado mental de un juez idealmente razonable. Se ha de hacer hincapié en que la concepción del sen tido común de la probabilidad se ha considerado que es enteramente objetiva. Se ha dicho que el lego considera sus aserciones de probabilidad como refiriéndose a «algo externo» más bien que a relaciones lógicas entre proposiciones, concebidas como entidades conceptuales o verbales. Es aún menos plausible desde el punto de vista del sentido común considerar que con las asercio nes de probabilidad se pretende expresar meramente la «confianza» del interlocutor en el resultado señalado. Hay, sin duda, reglas pragmáticas que requieren que el interlocutor se halle convencionalmente poseído de un grado de confianza correspondiente al carácter de la aser ción de probabilidad proferida, pero la manifestación de tal confianza no es el propósito primero de tales pro ferendas. Puede ser, en general, aceptable, como conclusión de la precedente exposición, que los patrones del uso or dinario de «probablemente» y sus cognados son desalen tadoramente complejos. Sin embargo, las diversas dife rencias sutiles entre los modos más o menos sinónimos de expresarse en términos dé «probablemente», «lo verosí mil es», «las oportunidades son», «debe esperarse que» y similares carecen normalmente de consecuencias en con textos primarios de compromiso previsor respecto de re705
sultados inciertos. No es usualmente importante distin guir entre, digamos, el contenido de la aserción misma de probabilidad, los fundamentos de su aserción (típica, aunque no exclusivamente, basada en frecuencias rela tivas de ocurrencias en casos similares), el grado de con fianza convencionalmente atribuido al interlocutor, y sus actitudes y acciones epistémicas justificables. Algunos teóricos, en consecuencia, han podido explotar, muy plausiblemente, un único aspecto de este embrollado tin glado, mientras que otros han abrigado la esperanza de vencer dividiendo, alegando una variedad de sentidos. Las teorías monolíticas tienden a distorsionar los as pectos inoportunos del habla ordinaria de probabiüdad en aras de alguna preconcepción filosófica, mientras que a los planteamientos que abogan por una fragmenta ción apenas si se les urge que presenten algún principio de conexión entre los sentidos divorciados. Parece poco plausible, sin embargo, hacer cargar al habla ordinaria de probabilidad con una inexplicable propensión a los juegos de equívocos, una teoría enteramente satisfactoria, aún por formular, ha de hacer justicia tanto a la varia juegos de equívocos. Una teoría enteramente satisfac toria, aún por formular, ha de hacer justicia tanto a la variabilidad como a la unidad del habla ordinaria de probabilidad.
Teoría matemática de la probabilidad La probabilidad como medida de conjuntos
Los matemáticos han clarificado los fundamentos de la teoría matemática de la probabilidad (o del «cálculo de azares») hasta el punto de poderse presentar riguro samente como una parte de la matemática pura —más concretamente, como parte de la teoría general de las funciones aditivas de conjuntos. Las ideas rectoras de tal planteamiento pueden ilus trarse como sigue: supóngase que tenemos un número de conjuntos, compuestos de objetos cualesquiera —por ejemplo, los conjuntos que pueden formarse si tomamos algunos o todos los vecinos de una ciudad. Llamemos a uno de tales conjuntos s¡. El conjunto de todos los vevecinos de la ciudad —llamémosle S — es, pues, un caso especial de s¡, como también lo es Λ , «el conjunto vacío», que no contiene habitante alguno. Pretendemos encon trar un medio de asignar un número m a cada s, para in dicar lo que provisionalmente podría concebirse como la «dimensión» o «extensión» de dicho conjunto. Con vistas a ello, desearíamos ciertamente que la medida del conjunto obtenido al combinar dos conjuntos que no tengan en común miembro alguno sea la suma de las medidas de los conjuntos iniciales. Llamemos a esto la condición aditiva. Adoptaremos ahora la convención de que la medida de S mismo, m(S), es 1. En estas condiciones, el modo más natural de definir m
sería convenir que su valor es, en todo momento, simple mente el número de miembros del conjunto en cuestión. Es fácil ver, no obstante, que en lo que respecta a satis facer la condición aditiva propuesta, la asignación de valores a m puede hacerse de un gran número de formas distintas. (Podría haber, por ejemplo, alguna razón prác tica para dar a un conjunto compuesto de adultos una me dida mayor que la de un conjunto compuesto por el mismo número de niños.) Supóngase que asignamos un peso ar bitrario a cada uno de los vecinos (siendo 1 la suma de todos los pesos) y considérese que la medida de un con junto es la suma de los pesos de todos sus miembros; es fácil ver que en tal caso se satisface la condición aditiva. Más en general, consideremos un conjunto S que con tenga como miembros un conjunto finito de individuos a t, a2, . . . , am. (El interesante caso general, donde los miembros de S constituyen un conjunto infinito, no nece sariamente enumerables, puede ignorarse aquí en pro de la simplicidad.) Consideremos seguidamente el conjunto U de todos los subconjuntos de S, cuyos miembros son í ,, s2, . . . , sn. Puesto que U se considera, por convención, que incluye tanto a S como al conjunto vacío, A, se sigue que n = 2m). Supongamos ahora que a cada miem bro de U se le ha de asignar un número concreto no negativo, representado por m(s¡), considerado como la «medida» del conjunto en cuestión. Asígnese a cada in dividuo dj un «peso» no negativo, w(a}). Finalmente, defínase m(s ¡) como la suma de los pesos de todos los miembros de s¡. Añadimos la convención de que la medi da del conjunto S (que contiene a todos los a} como miembros) es la unidad. Las siguientes son consecuencias casi inmediatas de estas estipulaciones: (a) La medida del conjunto vacío es cero: m( A) = 0. (Pues A no tiene ningún miembro en absoluto.) (b) La medida de un conjunto y la medida de su con108
junto complemento, relativo a U, suman la unidad: m(s) + m(s) = 1. (Donde «j» representa el subconjunto de 5 compuesto por todos los miembros de 5 que no están incluidos en s.) (c) La medida del conjunto que se forma al combinar la membrecía de dos conjuntos es igual a la suma de sus medidas, menos la medida de su parte común: m(sí U s2) = /n(í,) + m(s2) — m(st Π s2). (Donde «s1 Π s2» se usa para la «unión» de dos conjuntos y «s, Π s2» para su «intersección», el conjunto formado por sus miembros comunes. El resultado formulado se sigue directamnte de la definición de medida que se ha adoptado.) (d) En el caso especial de que los dos conjuntos no tengan miembros comunes, la medida de su unión es la suma de sus medidas: Si s, Π s2 = A, entonces m(sl U s2) = m (s l)
+ m(s2).
Introduzcamos ahora la noción de medida relativa de s con respecto a otro conjunto s , escrito m(sjs2). La definición es, simplemente, m (s js j = m(sí Π sj/m^sj —que es la razón de la medida de la intersección de los dos conjuntos a la medida de la clase de referencia s2. (e) La medida de la intersección de dos conjuntos y s2 es el producto de la medida del primero y la medida relativa del segundo respecto al primero: w(j, Π j 2) = = m (sjs2) X m(s2). (Lo cual se sigue inmediatamente de la definición de medida relativa ya dada.) Podemos aplicar fácilmente este aparato matemático simple a un caso ilustrativo en el que se llevan a cabo cálculos de probabilidad. Supongamos que estamos interesados en el cálculo de diversas diferencias ligadas a resultados concretos, como lanzamientos simultáneos de dos monedas. En consecuencia, el modo más explícito de describir los resultados es «CC», «Ce», «cC» y «ce». Hagamos referencia a estos «resultados básicos» con av av a2 y at respectivamente, y consideremos que constituyen un conjunto S. Supongamos que se les han asig109
nado probabilidades de ocurrencia (no nos importa aquí cómo se conocen estas probabilidades) que son, respectivamente, Pv P2, P3 y P4. Un problema típico (aunque trivial) de probabilidad matemática consiste en determinar la oportunidad de que salga por lo menos una cara cuando se lanzan las dos monedas. El razonamiento elemental discurre como sigue: «El evento en cuestión podría seguirse de a,, o a2, o a3; de ahí que su probabilidad sea de 3/4.» La analogía con el cálculo de medidas precedente salta a la vista. Considérese todo resultado complejo como el conjunto de todos los resultados básicos compatibles con él; identifiqúese la probabilidad de los resultados básicos con los pesos: finalmente, identifiqúese probabilidad y medida, así tendremos
ACQ=/ >, = ιφ,) P(Cc) = p 2 = w{a2) P ( c Q = Pj = w{a1)
P(cc) - p t = w(a4).
Puesto que el resultado complejo «al menos una cara» es compatible con a,, a2 y a3, tendremos que P(CC o Ce o cC) = m({av a2, a3}) = w(a,) + w(a2) + w(a3) = p , + + P 2+ P 3·
En resumen, un cálculo como el que aquí se ilustra podría concebirse como la determinación de una medida, en el sentido ya explicado, de acuerdo con el siguiente diccionario: posible, totalmente analizado, miembro de un conjuno resultado «básico» (como to dado S el de «CC») un resultado generalizado no subconjunto no unitario de 5 básico (como el de «al menos una cara»), concebido como una disyunción de resultados básicos 110
la probabilidad inicial (pv p2, peso del correspondiente miembro de S p 3 o p4) de un resultado básico dado probabilidad de ocurrencia de medida del corresponun resultado generalizado diente subconjunto de S la probabilidad resultante de m( A) = 0 ningún resultado básico es cero la probabilidad de todo resul- m(í) + m(s ) = 1 tado y la probabilidad del resultado complementario suman la unidad etcétera. Este esquema podría extenderse, al propio tiempo, a incluir la probabilidad «condicional», de la forma P(OJO 2), entendida como «la probabilidad de que ocurra O, si ocurre 0 2»: P (0 J 0 2), cuando O, y 0 2 son los resultados correspondientes a Sj y s2 respectivamente.
m (sjs 2)
Bajo esta interpretación, las proposiciones (c) y (e), más arriba, corresponden, respectivamente, al «teorema general de adición» y al «teorema general de multi plicación», que son los principios básicos del cálculo de oportunidades P(Ot u 0 2) = P (0í) + P (02) - P ( 0 1 y 0 2): P (01 y 0 2) = P (0 l tomando 0 2) x P(02).
Estas proposiciones fundamentales parecen casi evidentes por sí mismas en la interpretación indicada. La transición propuesta desde las ideas preanalíticas sobre probabilidad de la teoría abstracta de la medida se ha llevado a cabo aquí vía la noción de resultados 111
básicos dados, dados , concebidos como com o aspectos abstracto abstr actoss rea lizables de una configuración dada (el lanzamiento de dos monedas, por ejemplo). Es posible, no obstante, conectar conecta r las ideas de probabilidad probabilid ad con el cálculo cálculo abstrac abstrac to de otras diversas maneras. Supongamos, por ejemplo, que los pesos deseados se derivan de observaciones de frecuencias relativas, de modo que decir P(CC) P(CC) = p l es afirmar que en una determinada serie de ensayos con las dos pesetas CC tiene lugar según la razón p t : 1— p p ., p 3 y pA p A. Luego la transición ai —e —e igualmente p a ra p., cálculo sería tan factible como antes, porque todo lo que se necesita para tal transición es que los individuos que responden a los resultados básicos tengan ya asig nados números (y de modo tal que todos estos pesos sumen en total la unidad). Este requisito tan modesto podrí po dríaa también tam bién ser ser satisfecho satisfecho p or parte pa rte de quienes dan a entender que tienen un acceso a priori a los «pesos» requeridos —o, también, por parte de quienes afirman ser capaces de medir grados de «confianza racional», y otros por el estilo. Siempre que estas interpretaciones fi losóficas rivales resulten, como por lo general es el caso, en medidas determinadas de probabilidad (no importa cómo se interpreten) que satisfagan la «condición adi tiva» básica antes aludida, será posible considerar el tema con las lentes de la concepción de mediciones-deconjuntos. (La dificultad de la conexión directa de las teorías filosóficas de la probabilidad con la teoría mate mática será exactamente proporcional al grado en que impliquen que no se pueden aducir tales medidas. Ello es en parte verdadero, por ejemplo, para el sistema de probabilid prob abilidades ades de J.M. Keynes y, y, en cierta medida, para pa ra el sistema de Harold Jeffreys.) La teoría matemática, por tanto, puede considerarse propia pro piame mente nte como casi casi totalm to talmente ente neutra ne utrall con respecto a los análisis filosóficos rivales del concepto de probabi lidad. Simplemente aporta una estructura abstracta (aunque asombrosamente fecunda) para calcular los
valores de las probabilidades complejas en términos de valores de las probabilidades conexas. Nos presenta a las primeras como funciones calculables de las últimas, haciendo caso omiso omiso de todo tod o valor determinado que unas y otras puedan tener. Nun N unca ca se hará ha rá exces excesivo ivo hincapié en el último últim o punto pun to,, pues su olvido olvido ha llevado, con frecuencia, a falacias. falacias. La concepción de mediciones-de-conjuntos supone que los pesos pesos se asignan asigna n (bajo las restricciones formuladas) formula das) «fue «fue ra de la teoría»: los valores de las probabilidades de los resultados «básicos» deben ser proporcionados a la teoría y no pueden determinarse dentro de ella. Nada hay en la teoría matemática de la probabilidad que sea competente para fijar el valor «propio» de tales probabi lidades. Ahora bien, en todos los problemas de aplica ción de la matemática pura, la determinación de los va lores de estas probabilidades «básicas» desempeña un papel esenc esencial. ial. La teoría matemática de la probabilidad podría útil mente compararse a una (hipotética) teoría de la longi tud, en la que no se dispusiera de ninguna medida deter minada de longitud. Tal teoría mostraría cómo se rela cionan las longitudes de líneas compuestas con las lon gitudes de sus componentes —1{ —1{AB) + 1{BC) = l(A l( A Q , cuando A, B y C están están en una misma línea, por citar un ejemplo simple— pero sería incompetente para determi nar la longitud ni de tan siquiera un solo segmento. Si se complementara tal teoría con convenciones de congruen cia que permitan analizar la igualdad de longitudes, inmediatamente resultarían posibles las mediciones. Exactamente lo mismo podría decirse de la teoría de azares: con vistas a determinar los «pesos» requeridos de los resultados básicos es suficiente —por lo menos en gran número de casos casos— — poder pod er determina dete rminarr cuándo los resultados dados pueden considerarse igualmente probables. probabl es. (Si (Si la seguridad pudiera pudie ra fragmentarse fragme ntarse en un conjunto finito de n alternativas equiprobables, cada
ellas tendría entonces la probabilidad concreta 1/n, y el resto se seguirá, sin dificultad, como consecuen cia.) La equiprobabilidad desempeña en la teoría pura de azares el mismo papel que la congruencia en la teoría matemática de la medición lineal. En ambos casos, a la teoría pura se le puede dar una aplicación específica sólo mediante convenciones adicionales no derivables de consideraciones puramente matemáticas. (Es éste un caso especial del principio de que la matemática pura no se puede aplicar al mundo sin recurrir a vínculos no matemáticos.) una de
Probabilidad inversa y fórmula de Bayes Un problema de cálculo que constantemente se plan tea en la práctica es el de «invertir» una probabilidad —es —es decir, el de calcular calcula r el valor de P(L/K) cuando se conoce el valor de P(K/L). Tal cálculo —o cualquiera equivalente— se necesita para practicar la importante tarea de inferir a partir de frecuencias observadas las probabi pro babilidad lidades es asociadas. Puede ilustrarse el cálculo con el siguiente ejemplo simple. Supongamos que de cierto conjunto de hombres el 90 90 por po r ciento tiene tiene automóvil, y que que entre esos esos autom aut omo o vilistas el 10 por 100 tiene también bicicleta, mientras que entre los no automovilistas el 20 por 100 tiene bici cleta. Queremos saber la probabilidad de que un hombre del grupo considerado que tenga una bicicleta sea tam bién propi pro piet etari ario o de un automóvil. Escribiendo «A» por «x tiene automóvil» y «B» «B» por «x tiene bicicleta», tenemos:
p, = P ( A ) = . 9 qt = P(BIA)= .1
Pi = P ÍA )= .\ q2 = P(BÍA) = .2
Podemos llamar ahor ah oraa a p, y p 2 probabilidades «pri marias» (un rótulo preferible al clásico de «probabili1Ή
dades a priori») y a qt y q2, probabilidades (condiciona les) «proyectivas» o directas (a veces denominadas vero similitudes). En este ejemplo, por las reglas de multiplicación y adición, tenemos: l \ A B ) = p l q i = .9 X .1 = P {A B )= p2q2= .1 X . 2 = P(B) = P{AB) + P{AB) =
.09 .02 .09 + .0 2=
.11
Con vistas a hallar la probabilidad condicional «retroyectiva» o inversa, P(A/B), recurrimos a la fórmula multiplicativa P(A/B) X P{B) = P(AB)
Escribiendo «rx» por «P(A/B)» y haciendo uso de los resultados ya obtenidos, volvemos a escribir la anterior ecuación así (* )
= (P ,9 , ) /( P , 9 ,
+ P & ) ·
En el caso concreto considerado, nos encontramos con que rv la probabilidad inversa de que quien tenga una bicicleta sea también propietario de un automóvil, tiene el valor de (,09)/(. 11), ó 9/11. Igualmente, la probabili dad complementaria de que quien posea una bicicleta no tenga, a su vez, automóvil es de 2/11. La fórmula elemental (*) es un caso especial de la llamada fórmula de Bayes. En esencia dice que la pro babilidad retroyectiva es proporcional al producto de dos números: la probabilidad proyectiva qx y su corres pondiente probabilidad primaria, p x. (Lo cual concuerda con el «buen sentido» que Laplace deseaba reducir a cálculo. El sentido común pide que la oportunidad de que quien posea una bicicleta tenga, a su vez, automóvil dependa de dos cosas —la probabilidad primaria de 115
que una persona tenga automóvil y la probabilidad condicional de que quien posea un automóvil tenga, a su vez, una bicicleta. La fórmula (*) expresa esta idea de forma numérica precisa.) El caso más general, en que partimos de n probabilidades primarias p¡ y n correspondientes probabilidades proyectivas q¡, sigue la misma aritmética simple. El valor correspondiente de la probabilidad retroyectiva, r,, es, obviamente, (**)
= (?,?,)/(?,<7, + P & + ■■■+ / ’„?„)■
Dados los valores de los p y los q, se obtiene fácilmente por simple aritmética el valor de cada r¡. La fórmula de Bayes, (**), es evidentemente aplica ble de modo legítimo al ejemplo dado. Lo cual es mucho más de lo que puede decirse inmediatamente en aquellos ejemplos en que se desconocen los valores de las proba bilidades primarias. Consideremos el siguiente ejemplo. Se sabe que una bolsa contiene 100 bolas, cada una de las cuales es negra o blanca. De 10 bolas extraídas al azar, y reintegrada a la bolsa cada bola tras su extracción, 6 eran negras y 4 blancas; se quiere calcular la probabilidad (inversa) de que la bolsa contenga un número igual de bolas negras que blancas. Existen 99 alternativas a considerar correspondientes a las 99 posibilidades de composición diferente de los contenidos de las bolsas. En cada una de tales alternativas, se puede calcular la probabilidad «retroyectiva», qv No obstante, para aplicar la fórmula de Bayes, también necesitamos conocer las probabilidades primarias de cada una de estas alternativas. Así, pues, para calcular la probabilidad retroyectiva de que, con base en la evidencia (6 bolas negras y 2 blancas, en nuestro ejemplo), la población original estuviera distribuida, a partes iguales, en bolas negras y blancas, necesitamos conocer las
respectivas probabilidades primarias de que la bolsa contuviera 99 blancas y una negra, 98 blancas y 2 negras, etcétera. Ahora bien, sobre los datos disponibles no se puede asignar valor alguno a dichas probabilidades pri marias —no debido a nuestra ignorancia, sino más bien debido a que no se ha fijado todavía el significado de «probabilidad primaria»; en consecuencia, el problema no está determinado y no puede resolverse sin más datos. En las anteriores aplicaciones de la fórmula de Bayes se supuso que, en tales casos, en ausencia de todo cono cimiento concreto de las probabilidades primarias, es tamos autorizados a tratarlas como de igual valor. Es fácil ver que la fórmula de Bayes se reduce entonces a la fórmula especial r¡ = (,-)/(?, +
+ · ■■+
Puesto que se han dejado ahora fuera de la fórmula los p¡, el cálculo se lleva a cabo fácilmente. No obstante, es difícil ver qué sentido, por no decir ya qué justifica ción, puede darse a nuestra suposición de igualdad de las probabilidades primarias. Tal sentido podría encon trarse en este ejemplo particular, si se llevara a cabo en otras ocasiones un amplio número de extracciones si milares con bolsas de diferente composición. Las pro babilidades primarias requeridas corresponderían en tonces a las frecuencias proporcionales de ocurrencias con bolsas de diferente composición en la serie de ensa yos considerados. Dicho recurso no tendrá, por su parte, cabida en el caso general que ahora se va a considerar. Las situaciones generales en las que surgen las conside raciones de probabilidad inversa son aquellas en las que son compatibles con la evidencia dada E un número de hipótesis H¡, y en las que se conocen o son calculables las probabilidades proyectivas P(E/Ht) . Si se pudiera seleccionar una, o un determinado subconjunto, de las 117
relativamente más apoyada por po r E, sería posible Hi H i como relativamente entonces calcular la probabilidad proyectiva de que se encuentren otros datos D. En pocas palabras, tales situaciones se reducen a la elemental de inferir, a partir de las consecuencias consecuencias del del ejemplo, hipótesis bien fundad fu ndadas as y así, indirectamente, otras observaciones consonantes. Desaparece en este punto la analogía con las bolsas de bolas que antes an tes se ha empleado. Ciertamente, se pueden utilizar en diferentes diferentes ocasion ocasiones es bolsas de variada variad a compocomp osición, pero no es viable inspeccionar los universos en series repetibles de ensayos. Puesto que exactamente una de las hipótesis rivales H¡ H¡ es verdadera de hecho en este único universo, no se le puede dar, en general, ningún buen sentido a la adscripción de una probabilidad primaria asociada, y, a fortiori, no puede darse ningún buen sentido al supuesto de igualdad de tales probabil prob abilidad idades es imputadas. imput adas. Dicha objeción parece ser decisiva contra un uso tan acrítico de la fórmula de Bayes (o de las interesantes variantes derivables de suponer infinitamente muchas hipótesis alternativas). La discusión del tema ha dedicado en el pasado algunas veces una atención indebida a la supuestamente absurda consecuencia conocida como regla de sucesión de Laplace —si se han registrado a aciertos en a + b ensayos independientes, la probabilidad de éxito en un nuevo ensayo es (a + l)/(a l)/(a + b + 2). Sería Sería ciertamente alarma a larmante nte que tuviéramos que suponer que, después de llover tres días consecutivos, la probabilidad de que llueva al día siguiente será exactamente de 4/5 —si bien puede ponerse en duda que se hayan satisfecho aquí las condiciones de aplicación de la regla de sucesión. La objeción anteriormente formulada parece, en todo caso, más fundamental. Una consecuencia nada trivial de la fórmula de Bayes es importante para teóricos como los defensores de la interpretación «subjetiva» de la probabilidad, que se discutirá más adelante, que también se apoya en usos
circunspectos de la probabilidad inversa. Hemos visto que en un ejemplo como el de las extracciones de muestras con reposición en una bolsa de composición desconocida, el calcular a par p artir tir de la composición composición de la muesmuestra la probabilidad retroyectiva depende tanto de las probab pro babilidad ilidades es primaria prim ariass desconocidas desconocida s como de las pro p ro babilidades babilid ades condicionales proyectivas. Puede Pued e mostrarse, sin embargo, que (hablando llanamente) la influencia de los valores valores de las probabilidade probab ilidadess primarias prim arias en la magnitud de la probabilidad proyectiva disminuye progresivamente conforme aumenta el tamaño de la muestra. Así, pues, se puede constr con strui uirr u n caso para pa ra dem de m ostra os trarr que bas b asta ta una un a distribució distri bución, n, arbi ar bitr trar aria ia pero fija, fija, de las p r o babilidades babilidade s prim pr imaria ariass de las hipótesis considerad consid eradas as para pa ra aplicar la fórmula de Bayes, si nos contentamos con obtener resultados aceptables a la larga. Supongamos que estamos considerando en nuestro ejemplo de bolsa con bolas de colores, si la evidencia disponible (composición de una muestra) justifica la aceptación o el rechazo de una hipótesis dada (por ejem plo, que el 90 p o f 100 de las las bolas bola s de la bolsa bols a son negras) negras).. Supongamos que la probabilidad proyectiva P(E/H) es muy baja —por po r ejemplo, ejemplo, menor que .01. .01. Entonces nos puede pue de parecer parec er justificado justificad o rechazar recha zar H sobre la base de que es poco razonable creer en H si nos compromete con la ocurrencia de una consecuencia tan inverosímil. Si tuviéramos que aceptar H, tendríamos que creer que había ocurrido una consecuencia muy improbable (una cuya probabilidad de ocurrencia fuera menor que .01) —lo —lo cual podr po dría ía ser ser suficien suficiente te para pa ra gara ga rant ntiza izarr que buscáramos por otros derroteros otras hipótesis compatibles con la evidencia. La idea rectora de esta simplificadísima corriente de pensamient pens amiento o es caracter ca racterística ística de gran gr an parte pa rte del refinado método estadístico contemporáneo que se basa en el uso de «intervalos de confianza» y «test de significación». Su interés filosófico radica en su aparente marginación 119
de toda apelación dudosa a la probabilidad inversa. Sin embargo, sigue aún en pie la pregunta de qué justificación, si es que hay alguna, puede darse al rechazo de probabilidades pequeñas —o, lo que viene a ser lo mismo— qué justificación puede darse a la convencional elección, por parte de los estadísticos, de un determinado nivel de confianza. Leyy de los grand Le grandes es núme número ross
Supongamos que se ha lanzado una moneda sin trucar, «limpia», un número elevado de veces, n. El sentido común nos lleva a pensar que la proporción de caras en los n ensayos —llamémosle «p»— sería aproximadamente de 1/2 (esto es, la misma que la probabilidad de una cara). Es también razonable pensar que la aproximación «mejore» conforme aumenta n. Nuestras ideas comunes sobre la probabilidad parecen llevarnos a esta gratuita especie de conexión entre la probabilidad inicial, 1/2, y la frecuencia relativa aproximada de salidas de caras en una larga serie de ensayos reiterados. Esta importante idea encontró una exacta expresión matemática en un revolucionario resultado descubierto por Jacob Bernoulli, frecuentemente denominado como teorema de Bernouilli. El teorema se aplica al presente ejemplo del siguiente modo: supóngase que después de n lanzamientos se ve que la frecuencia prop pr oporc orcion ional al fluctúa entre . 5 + . 1 y .5 — . 1; digamos diga mos entonces entonc es que qu e p «ha alcanzado con un margen de .1 la probabilidad inicial 1/2», y llamemos a .1 su correspondiente «distancia». Para un n dado, por po r ejemplo ejemplo 1000, se puede pued e calcular calcu lar las oportun opo rtunida idades des de que p haya hay a alcanzado la distancia distan cia .1 a 1/2; 1/2; similarmente, se puede calcular las oportunidades correspondientes para otros valores de n y otras «distancias» elegidas. Llamemos a la oportunidad favorable a que p 120 120
haya alcanzado, después de n lanzamientos, una distancia dada a la probabilidad inicial (1/2), su correspondiente «esperanza». Es obvio que la esperanza es una función, en general, del número de lanzamientos y de la distancia elegida. El teorema de Bemouilli implica la siguiente información referente a esta interdependencia: para una distancia dada y fija, la correspondiente esperanza, después de n ensayos, puede acercarse indefinidamente a 1 conforme n aumente. En otras palabras, si queremos que p se encuentre dentro de una determinada distancia a 1/2, establecida de antemano, nuestra oportunidad de conseguirlo converge a 1conforme aumenta n. Un ejemplo puede ayudamos a explicar esto. Supongamos que la distancia es del 1 por 100. Entonces para n =40.000, los cálculos muestran que las evidencias en favor de que la proporción de caras se encuentre entre .5 + .01 y .5— .01 están por encima de 999 contra 1 (esto es, la esperanza es entonces superior a .999). El teorema de Bemouilli nos garantiza que, si mantenemos fija la distancia en un 1 por 100, al analizar un número elevado de ensayos, la esperanza se acercaría a 1 por encima de .999. Ciertamente, para esta distancia elegida la esperanza podría aproximarse a l cuanto quisiéramos haciendo que n sea suficientemente alto. Si hubiéramos elegido para empezar una distancia más pequeña, por ejemplo del . 1 por 100, habríamos necesitado un número superior a 40.000 ensayos para obtener evidencias igualmente favorables (999 contra 1) a que la frecuencia se encuentre dentro de la distancia a 1/2, pero todo lo demás que se ha dicho seguiría siendo válido. Todo ello se sigue, por cálculos matemáticos no triviales, de los supuestos establecidos. En esta presentación esquemática se ha elegido una probabilidad inicial de 1/2 con miras a la simplicidad del ejemplo. Si la probabilidad inicial hubiera sido cual121
quier otra fracción, por ejemplo 4/5, valdrían las observaciones correspondientes. Por complicado que pudiera parecer cuanto precede, nos ha parecido conveniente exponer correctamente el carácter general de «la ley de los grandes números», con el objeto de evitar las interpretaciones equivocadas de la misma y los consiguientes abusos, que son increí blemente comunes en la literatura sobre el tema. Es, por ejemplo, completamente erróneo decir categóricamente que, a la larga, la frecuencia relativa observada de las ocurrencias de un carácter será aproximadamente la misma que la probabilidad inicial de su ocurrencia en un único ensayo. La formulación correcta, como hemos visto, se refiere a la «oportunidad» de que éste sea el caso. No hay «puente» directo alguno entre proba bilidad y frecuencia relativa: la ley proporciona una conexión entre la probabiüdad inicial y una probabilidad relativa (que puede acercarse a la unidad cuanto se desee) de una determinada clase específica de distribución de ocurrencias. La validez del teorema de Bemouilli depende de dos supuestos que restringen su aplicación en la práctica: (1) la probabiüdad de un único evento (1/2 en nuestro ejemplo) se supone que es siempre la misma; (2) Los sucesivos ensayos se supone que son independientes unos de otros. Si a una rueda de ruleta se la hiciera girar continuamente, sin corregir su deterioro, se violaría, eventualmente la primera condición; si un crupier tramposo procurase que nunca salieran consecutivamente más de de siete rojos o negros, se violaría la segunda condición. (No se anaüzarán aquí las reformulaciones modernas del teorema de Bernouilli, en las que se puedan debilitar un poco las dos restricciones.) Es posible formular una especie de inversa del teorema que permite inferir, en forma convenientemente cautelosa, a partir de la frecuencia relativa observada, una esperanza de que la probabilidad inicial se encuentre 122
dentro de una distancia preestablecida a la frecuencia relativa observada p. Este método tiene todos los inconvenientes del uso «directo» del teorema de Bemouilli. Sin embargo, la inferencia de «una probabilidad a priori» aproximada (esto es, de la «probabilidad inicial», en la terminología del anterior tratamiento) a partir de «una probabilidad a posteriori» (esto es, de la observación de la frecuencia relativa en un elevado número de ensayos), se hace usualmente de una forma algo distinta. Se considera que una determinada hipótesis se refiere al valor aproximado de la probabilidad inicial desconocida —llamemos « H » a esta hipótesis. Entonces la evidencia en contra de la ocurrencia de la frecuencia relativa observada se calcula sobre el supuesto de que no -H es el caso —usando el teorema de Bemouilli o alguna consecuencia del mismo. Si las evidencias en contra de la distribución observada así obtenida se considera suficientemente alta, se rechaza no-H y se acepta H. Se puede considerar esto como el uso de un test de «significación», sobre el que se puede consultar el final de la sección dedicada a la probabilidad inversa y la fórmula de Bayes. El principio metodológico básico implicado es —hablando llanamente— el de que pueden rechazarse las hipótesis que, de ser verdaderas, harían bastante inverosímiles los datos observados. (Reemplazar esta burda formulación por procedimientos exactos que permitan realizar estimaciones fiables de los riesgos implicados, es una de las principales tareas de la estadística.)
123
Los significados de “probabilidad” Independientemente de si la probabilidad es o no tanto como «la guía de la vida», como pensaba el obispo Butler, las estimaciones de probabilidad son sumamente útiles para la confección de determinados juicios concer nientes a eventos no observados y a hipótesis no verifica das. Ninguna teoría matemática no interpretada o «pu ra» de azares puede ser útil en este sentido hasta que se den a sus términos indefinidos «interpretaciones» con cretas (definiciones semánticas) que conviertan los axio mas del cálculo en aserciones significativas. El estudioso puede escoger, al respecto, entre una compleja variedad de interpretaciones plausibles de las expresiones pro babilísticas básicas. Para sopesar los méritos de las proclamas rivales, conviene considerar en qué medida responden adecuada mente a las siguientes preguntas elementales: 1) ¿Hasta qué punto consigue la teoría garantizar la corrección de los axiomas de la teoría matemática de azares? (Como ya se ha explicado, depende esencialmente de la defini ción de igualdad de oportunidades que se ofrezca.) 2) ¿Qué conexión, si es que hay alguna, establece la teoría entre las probabilidades y las frecuencias obser vadas? (Es totalmente cierto que las frecuencias, empíri camente determinadas, en la práctica dan lugar con frecuencia a juicios justificados de probabilidad. 3) 12 A
¿Puede la teoría tornar inteligible y justificar nuestro crédito en las probabilidades como una guía para lo provisionalmente desconocido? (Esta pregunta está ligada, obviamente, a las que la preceden.) Dogmatismo matemático
Ha de hacerse una rápida mención a un planteamiento de cierto tipo que a veces se encuentra en los textos de matemáticas sobre la probabilidad y que con frecuencia se recomienda en las aulas. Dicho llanamente, se nos pide que entendamos por probabilidad todo cuanto pueda satisfacer los axiomas de la teoría matemática. La teoría pura de azares es comparada a la geometría pura, siendo ambas consideradas «modelos idealizados», que tienen sólo una débil conexión con la realidad, y se mantiene que la tarea de correlatar los resultados matemáticos exactos con sus contrapartidas imprecisas en la ex periencia es, básicamente, una tarea práctica que no necesita difusión teórica alguna.) Como solución al problema de la interpretación, este planteamiento constituye simplemente una evasiva. La obediencia formal a la «idealización» implícita en la construcción de la teoría matemática sirve simplemente de excusa para soslayar el duro trabajo de articular los lazos entre la teoría y sus aplicaciones prácticas. La teoría clásica y el principio de indiferencia.
La denominación «teoría clásica» alude usualmente a los influyentes puntos de vista expresados en el famoso «Essai philosophique sur les probabilités» (1814) de Laplace, que han sido adoptados desde entonces por un centenar de escritores. La noción fundamental de derivar igualdades de probabilidad a partir de la paridad de razones favorables, tiene, sin embargo, por lo menos 125
un siglo más, habiendo sido formulada por Jacob Ber noulli en su Ars Conjectandi (1713), publicada postu mamente. A falta de información explícita en los escritos de Bemouilli y Laplace, no está claro cómo habrían deci dido estos pioneros definir la probabilidad. En conjunto, sin embargo, su práctica sugiere que la concepción básica era, en efecto, la de «un grado justificado de creen cia». La probabilidad alude al «grado de certeza» (Bernouilli) de una creencia que es más bien ideal que real; su valor mide la fuerza de una creencia que mantendría un pensador (un hombre perfectamente razonable) que ajus tase correctamente sus espectativas a la evidencia de que dispone. Para determinar hasta qué extremo tal pensador creería en una alternativa dada (o cómo debiera pensar todo el mundo), volveremos al celebre «principio de indiferen cia» (así denominado siguiendo a Keynes; conocido pri meramente como «principio de razón no suficiente», con una posible alusión al «principio de razón suficiente» de Leibniz). Supóngase que el problema es decidir si una deter minada persona está en Nueva York o en Chicago, dado que deba estar en un lugar o en el otro, y supóngase que cada razón en favor de su estancia en Nueva York (por ejemplo, la de que dijera que estaría allí) se ve ácom pañada de una razón de la misma forma en favor de su estancia en Chicago (por ejemplo, la de que dijera que estaría en Chicago); se dice que entonces estamos auto rizados a considerar iguales las probabilidades de las dos alternativas mutuamente excluyentes. Más generalmente: si hay n alternativas de la misma forma, mutuamente excluyentes, apoyadas por razones simétricas, entonces las n probabilidades deben conside rarse iguales. De ello se sigue directamente la definición de la medida de probabilidad, que se encuentra en innu merables textos de matemáticas, antiguos y modernos,
como «la razón del número de casos favorables al núme ro total de casos». (Para calcular la probabilidad de que salga un 6 en tres lanzamientos de un dado, por ejemplo, suponemos que el principio garantiza probabilidades iguales de que el dado presente un número determinado en cualquier lanzamiento; el resto es ya un simple ejer cicio de permutaciones y combinaciones.) El principio de indiferencia ha sido expuesto antes en su forma más plausible. Cuando cada razón que tenga mos para creer en A se ve acompañada de una razón exactamente correspondiente a favor de creer en B, el sentido común inmediatamente está de acuerdo en que las probabilidades asignadas propiamente a las alterna tivas, sobre las evidencias disponibles, deben ser iguales. Menos plausible es la aplicación del principio a los casos en que la simetría requerida de las razones de apoyo deriva de la carencia total de razones por ambas partes. Los argumentos a partir de lo que se podría llamar «pa ridad de ignorancia» (que ha seducido incluso a un pen sador tan capacitado como William Stanley Jevons) han contribuido a acarrear sobre el principio un mere cido descrédito. (Es difícil, por supuesto, imaginar un caso en el que el pensador carezca totalmente de eviden cia favorable bien sea a P bien a no-/*, y que, en conse cuencia, se vea obligado a asignar a cada alternativa la probabilidad de 1/2. ¿Es el presente lector de estas líneas de sexo masculino? Al escritor se le antoja que la mujer lee artículos de filosofía con menos frecuencia que el hombre lo hace; de ser así, las razones rele vantes son asimétricas y no procede aplicar el prin cipio.) Incluso en contextos más plausibles, el uso del princi pio puede generar rápidamente absurdos. Por ejemplo, las «alternativas» a las que se supone que el principio es aplicable pueden normalmente ser clasificadas en una serie de maneras diferentes, que dan lugar a valores probabilísticos incompatibles. Supongamos que se desea 127
calcular la probabilidad de que dos tarjetas, elegidas al azar de un conjunto compuesto por dos tarjetas rojas y dos negras, sean del mismo color; ¿consideramos alternativas igualmente probables las seis posibles «constituciones» de la elección (considerando diferentes las elecciones si se extraen tarjetas diferentes) o atenderemos sólo a la «naturaleza» de tales elecciones (el número de tarjetas rojas y negras)? Si lo primero, la probabilidad será de 2/6; si lo segundo, de 2/3. Recurrir a «la paridad de razones» no sirve de norte para la respuesta correcta. Aún pueden esgrimirse objeciones más fuertes cuando la variable cuyo valor tiene que determinarse discurre sobre un dominio continuo. Para determinar la masa probable m de un cuerpo del que se sabe que tiene un valor entre 0 y 1, ¿consideraremos igualmente verosímil el que «m» se encuentre en los intervalos (0, 1/2) y (1/2,1)? Pero entonces también tenemos «paridad de razones» para una similar distribución del recíproco, 1¡m —que daría lugar a una respuesta diferente (este tipo de objeción ha sido empleado con insistencia por Keynes). También se ha formulado la objeción de que el principio nunca es estrictamente aplicable, ya que la evidencia nunca es perfectamente simétrica con respecto a un número de alternativas, y que, en todo caso, es inútil en los numerosos casos en que las alternativas a analizar no pueden amillararse en un conjunto de alternativas ostensiblemente paralelas. Algunas tentativas intuitivas, por parte de los primeros expositores de la orientación bayesiana, de hacer uso del principio en el cálculo de probabilidades inversas (suponiendo la equiprobabilidad de las hipótesis a considerar) han añadido motivos al actual descrédito del principio. Está claro que el principio es demasiado débil para alcanzar por sí solo los resultados deseados de la asignación de equiprobabilidades. Algunas de las dificultades anteriormente mencionadas pueden, tal vez, salvarse 12a
mediante adecuados refinamientos del principio. Se verá que variantes del principio de indiferencia ocupan un lugar destacado en las teorías «lógicas» que discutimos a continuación. Teorías lógicas
Cualquier interpretación filosófica de la probabilidad tiene derecho al título de teoría lógica si su autor sostiene que un enunciado de probabilida probab ilidad d básico, básico, de la forma «La probab pro babilid ilidad ad de P, sobre S, es p», es verdadero a priori. Este rasgo distintivo, ostentado, por ejemplo, por las teorías harto conocidas de Keynes, W.E. Jhonson, Ru dolf Camap y Harold Jeffreys, establece una interpreta ción «lógica», frente a los planteamientos «empirista» y «subjetivo» que aún nos falta considerar. (Dicho llana mente, un «empirista» supone que un enunciado básico verdadero de probabiüdad dice algo acerca del mundo inanimado, mientras que un «subjetivi «subjetivista» sta» considera que dice algo acerca de la creencia o grado de confianza de un pensador ideal.) Las teorías lógicas descienden directamente del punto de vista «clásico» de Bemouilli y Laplace, por superiores que puedan ser en la elaboración sofisticada de los su puestos explícitamente invocados. Laplace y sus sus segui segui dores, como hemos visto, concebían característicamente el grado de probabilidad como totalmente determinado por po r una un a relación calculable entre la información inform ación dada (o la carencia de ella) ella) y una un a hipótesis dada, dada , independien independien temente de que se apelara a frecuencias asociadas o a cualesquiera otras materias de hecho. Como los laplacianos, los abogados de moda de las teorías «lógicas» típicamente interpretan la probabilidad como relativa a la evidencia —en realidad, el eslogan «la probabiüdad varía con la evidencia» se considera comúnmente por parte pa rte de ellos ellos casi como autoevidente. 129 129 5
Con frecuencia se introduce algo de confusión en lo que se refier refieree a «la credibilidad credibilid ad racional», rac ional», «afirmabilidad «afirmabilidad justificada» justifica da» y similares. similares. Muestr Mu estraa ello ello la apariencia apari encia de una apelación implícita a algún juez ideal de la fuerza de la evidencia, una persona perfectamente razonable cuyos veredictos determinan el grado de probabilidad «correcto», «racional» o «justificable». El símil es, por supuesto, transparente: dicha persona idealmente racional no responde cuando se le requiere, y la referencia a la misma es, simplemente, una forma pintoresca de aludir a una pretendida relación lógica que se supone que tiene lugar entre un par de proposiciones dadas, en la sola virtud v irtud de sus signif significad icados. os. Realmente, los criterios de «racionalidad» incluyen incluyen la observación de reglas reglas p roro pias p ara ar a la estimación estimació n de las probabilidades probabi lidades;; no hay ningún test independiente de racionalidad. Esta «persona idealmente racional» es tan irrelevante para las teorías «lógicas» como lo sería «el calculador ideal» para la matemática. Keynes, cuya elocuente defensa del tratamiento lógico frente a sus rivales es, en gran medida, responsable de su actual aceptación, quería tratar como indefinible la fundamental relación entre «propuesta» y «sugerencia». Lo cual tiene la seria desventaja de hacer accesible sólo a la intuición la verdad de las proposiciones básicas fundamentales, lo cual es aún más inconcebible en materia de probabilidad que en cualquier otra parte. Ulteriores escritores, como Carnap, empeñados en construir una definición de la relación lógica fundamental, han recurrido típicamente a la noción de «rango» relativo (Spielraum) o algo equivalente. Puede ésta explicarse brevemente como sigue. Supóngase que las funciones proposicionales indefinibles, o «primitivas», de un lenguaje dado L tienen la forma P i{ x v x 2, . . . , x j . Para ca cada P¿, fórmense todos los valores posibles de dichas funciones incorporando todas las elecciones posibles de nombres de individuos del
dominio a que L se refiere. Llamemos a éstas las senten cias «atómicas» de L. Fórmese ahora una conjunción en la que ocurra cada sentencia atómica o su negación. La misma constituye una denominada descripción de estado. De cada una de estas descripciones de estado se puede consider cons iderar ar que expresa un «universo posible» posible» re relativo a la elección del lenguaje L, puesto que consti tuye la descripción más específica en L de cómo podría ser tal universo. Sopesando convenientemente tales des cripciones de estado, se puede asignar a cada proposi ción P una medida m(P), y el grado de probabilidad de H, sobre P, puede entonces definirse simplemente por po r la fracción m(HP)¡m(P). De esta suerte, es teórica mente posible calcular la probabilidad de H con rela ción a P, para cada par de proposiciones H y P expresa bles bles en L. La arbitrariedad es la aplicación del «principio de in diferencia», anteriormente señalada, reaparece aquí en el hecho de que las descripciones de estado pueden so pesarse -de infinitas maneras, cada una un a de las cuales cuales conduce a una atribución autoconsistente de probabi lidades lidades a cada par p ar de proposici proposiciones ones dadas. (La detallada investigación por parte de Carnap de las consecuencias de tales opciones constituye una valiosa contribución al tema.) Muchos críticos interpretan la variabilidad de los valores de probabilidad relativos a la elección de un lenguaje L como una fuente más de inquietud en la ela bora bo rada da construcció constr ucción n de Carna Ca rnap. p. (Se (Se ha de hacer hace r nota no tarr también que Camap ha conseguido desarrollar su teoría sólo en conexión conexió n con deter d etermina minados dos «lenguajes» «lenguajes» muy sim plificados.) plificados.) Si sus métodos méto dos pueden pued en extenderse a un len guaje lo suficientemente rico como para alcanzar al actual «lenguaje de la ciencia», es un problema aún por resolver. La pregunta más difícil que toda teoría «lógica» debe contestarse es la de cómo puede esperarse que las ver13 1
dades a priori tengan algún papel en el problema práctico de anticipar lo desconocido sobre la base de razonamientos no demostrativos. Teorías de frecuencias
Todos los teóricos de la probabilidad coinciden con el planteamiento del sentido común en reconocer que el conocimiento de las frecuencias relativas de ocurrencias influye convenientemente a veces en los juicios de probabilidad. De no ser así, las agencias de encuestas no merecerían más crédito que los adivinos, y su interés por la información estadística sería un desatino inútil. El abogado más fervoroso de un análisis neoclásico de la probabilidad en términos de la fuerza relativa de los razonamientos se ve obligado a reconocer que tal fuerza resulta afectada, algunas veces, por la información relevante que concierne a la frecuencia. Una moneda sin trucar puede, en ausencia de más información, instar a la aplicación del principio de indiferencia, pero cuando ensayos reiterados con la misma muestran que las caras predominan acusadamente sobre las cruces, la evidencia deja de ser simétrica. La idea germinal de una teoría de «frecuencias» consiste en negar la existencia de toda laguna lógica entre frecuencias y razonamientos: la probabilidad tiene que identificarse, en todos los casos, con alguna frecuencia relativa convenientemente definida. (Las versiones modernas sofisticadas de este planteamiento identifican la probabilidad, más bien, con el «valor límite» de dicha frecuencia.) Esta idea encierra una fuerte apelación intrínseca a los empiristas, que, deseando interpretar los enunciados básicos de probabilidad como contingentes (garantizando de esta forma su aplicación práctica), no tienen ningún lugar mejor a donde orientar sus miras que en dirección a las frecuencias observadas. 132
Una anticipación temprana e influyente de las teorías de «frecuencias» la constituye la caracterización de Locke del argumento probable como «prueba . . . tal que en su mayor parte comporta verdad» (Essay Concerning Human Understanding, Lib. 4, Cap. 15, «Of Probability»). Locke, en conjunto, con su definición de la probabilidad como «verosimilitud de ser verdadera... (de) una propo sición para la que existen argumentos o pruebas para hacerla pasar o ser aceptada como verdadera», se halla aún cercano a la concepción clásica. Hace más de un siglo, Leslie Ellis propuso que se hiciera de la teoría de la probabilidad una «ciencia re lativa a las cosas tal como realmente existen», tomando como axiomático el principio de que en una larga serie de ensayos «todo posible evento tiende a recurrir en una razón definida de frecuencias». John Venn recogió esta sugerencia en The Logic o f Chance (1866), definió explícitamente la probabilidad en términos de frecuen cias relativas de ocurrencias de eventos «a la larga» (Cap. 6, See. 35), y desarrolló sus consecuencias con mucho detalle. C.S. Peirce, reconociendo sus deudas tanto con Locke como con Venn, consideró que la pro babilidad correspondía a las argumentaciones, más que a los eventos. Para él, la medida importante era el nú mero proporcional de veces que la argumentación con ducía de premisas verdaderas a conclusiones verdaderas, y se ha de establecer mediante investigación empírica de los «éxitos» de la argumentación a la larga. El más agudo y convincente abogado de la concep ción frecuencial en los tiempos modernos ha sido Ri chard von Mises. Central a su concepción es la idea ori ginal y controvertida de Kollektiv, una serie de eventos en la que los caracteres de interés ocurren al azar. La propia definición de von Mises del tipo deseado de azarosidad puede, al parecer, sobrevivir a las acusaciones de inconsistencia que primero se elevaron contra ella. Las investigaciones minuciosas de Hans Reichenbach so 133
bre la probabilidad pretenden poder dispensamos de las condiciones problemáticas de von Mises relativas a la azarosidad. Aunque el planteamiento frecuencial atrae a los estadísticos profesionales y a otros científicos ocupados con grandes cantidades de eventos (por ejemplo, en la «mecánica estadística»), tiene el inconveniente, desde la más amplia perspectiva de una filosofía de la probabilidad convencionalmente comprensiva, de no reconocer significado alguno a la probabilidad de un evento singular. La probabilidad, según los frecuencialistas, debe inter pretarse siempre como un carácter global de alguna clase indefinidamente amplía o de una serie de eventos indefinidamente extensa. El hecho de que nunca se han de hallar en la experiencia series de tal tipo hace de los enunciados de probabilidad, según esta interpretación, algo que ni es estrictamente verificable ni estrictamente falsable. Esta limitación y la necesaria exclusión de los enunciados de probabilidad referente a eventos singulares contribuyen a restringir el alcance de la probabilidad, así interpretada, demasiado drásticamente por simple comodidad. Otra dificultad consiste en la implausibilidad de asignar alguna probabiüdad, concebida en la línea frecuencial, a las aserciones generales del tipo de las leyes. Pues difícilmente podría concebirse que las leyes «ocurren» como miembros de clases relevantes. A pesar de los valientes intentos de Reichenbach para superar este defecto, puede decirse que la interpretación frecuencial refleja, en el mejor de los casos, sólo una parte de la verdad sobre la probabilidad. Teorías subjetivas
Invitemos a alguien —llamémosle S— a que reflexione sobre el grado de confianza que tendría en la Π4
verdad de la proposición (llamémosle H) «Se extraerá una bola negra en la próxima ocasión» si conociera la verdad de la proposición (llamémosle E) «De diez bolas extraídas, con reposición, de una bolsa todas han sido negras». Parece seguro que la actitud de espectativa de S con respecto a H, en tales casos, variaría con la evidencia E; por ejemplo, si E es la proposición que se obtiene al reemplazar en la anterior E «diez» por «cien», parece seguro que se puede contar con que todo S diría que su confianza en H, dado E', sería mayor que su confianza en H, dado E. Supuesta esta comparabilidad de las espectativas, podemos introducir la simbolización «cs(H¡E )» para representar el grado de confianza de 5 en H, dado E. (Algunos autores prefieren decir «grado de creencia».) También puede suponerse, dejando para más adelante su discusión, que en ocasiones se puede dar valores nu méricos a los grados de confianza. (En general, debemos esperar que, para distintos S elegidos, los valores de cs(H/E) serán diferentes.) Una forma extrema de interpretación «subjetiva» sim plemente identificaría la probabilidad con cs —esto es, con la intensidad de la confianza de una persona dada. Ningún teórico ha propuesto esta concepción, aunque sólo fuera por el hecho de que haría que las probabili dades fluctuaran demasiado para que resultara intere sante considerarlas. La siguiente variante, no obstante, ha sido hábilmente defendida en tiempos recientes, de modo muy especial por parte de Leonard J. Savage y por parte de Bruno Finetti. Supóngase que a nuestro hipotético sujeto, S, se le pide que haga un número indefinidamente elevado de juicios que dan como resultado valores de c£H/E) para diferentes opciones de E y H. Algunas de tales asigna ciones de valores a cs resultarán ser inconsistentes o «incoherentes», en sentidos que se explicarán inmediata mente. Supongamos que adecúa todas sus asignaciones
de valores a cs de modo que elimine tales incoherencias; su confianza en H, dado E se dirá entonces «rectificada» (muchos autores prefieren un término como «razonable», que en este lugar se evita debido a sus implicaciones de algún tipo de patrón de la racionalidad objetiva). Las concepciones que aquí se van a discutir identifican la probabilidad con el grado de confianza rectificada. Se diferencian de todas las teorías lógicas en el importante supuesto de que la confianza rectificada (y por ende la probabilidad) puede variar de persona a persona, sin que ello se considere un defecto. La requerida noción de «coherencia» es bastante más amplia que la de consistencia lógica, la cual se da por supuesta. (Así, se supone que si E t es lógicamente equi valente a E2 y H j es lógicamente equivalente a H2, un S dado asignará los mismos valores a cs(HJE^ y a cs(H2¡E2). Supóngase que un S dado pretendiera dar puntuaciones de dos a uno a que H es verdadera, dado E, y puntuacio nes de tres a uno a que no -H es verdadera, dado E. Aunque esto puede hacerse sin incurrir en contradición formal alguna, un jugador que aceptara ambas apuestas a la vez vencería ciertamente a S. Todo lo que necesita es hacer verdadera E y esperar los resultados. Si resul tara ser verdadera H, cobra 3-1 puntos, mientras que si H resultara falsa cobraría 2-1 puntos, terminando ganador en ambos casos. En la jerga de las apuestas, a esto se le dice «hacer la apuesta del holandés» contra S. Demos a la rectificación de los valores de la confianza de S el siguiente significado: 5 elegirá tales valores que será imposible a toda persona «apostar» contra él acep tando diferencias que garantizan ganancias líquidas. Es sorprendente y demostrablemente verdadero que si el sistema de los valores de confianza de S es coherente en este sentido de hacer a todo el mundo imposible apos tar contra S, dichos valores obedecerán las reglas de adición y de multiplicación de la teoría matemática de azares. Este chocante resultado permite al subjetivista
acceder a los axiomas matemáticos usuales y sus conse cuencias. Si se estipula que los grados de confianza en cuestión son coherentes en el sentido que se acaba de explicar, los abogados de una teoría subjetiva pueden encontrar un firme fundamento al cálculo acostumbrado de probabilidades complejas. Todos los sistemas de valores-de-confianza rectificados usarán los mismos cálcu los para derivar probabilidades complejas a partir de otras simples, por diferentes que sean sus puntos de partida. Puede encontrarse alguna resistencia a suponer que se puede medir en todos los casos con toda precisión los «valores-de-confianza» a los que hace referencia la teo ría. La respuesta que se ofrece, basada en una sugerencia de F.P. Ramsey, es, hablando llanamente, la de determi nar dichos valores a partir del conocimiento de los puntos de ventaja que la persona en cuestión está dispuesta a dar a un resultado sobre el otro. Pídase a S que apueste por la verdad de H, dado E si quiere apostar un dólar contra cincuenta centavos (o algo más, pero no menos), po demos suponer que su confianza en H, dado E, viene medida por la puntuación de 2 a 1 (o, en una termino logía más convencional), que atribuye a H, dado E, la probabilidad de 2/3) y de modo similar en otros casos. (Las complicaciones resultantes de la «menguante uti lidad» de las apuestas monetarias, y otras similares, se pasará aquí por alto, pero el lector puede consultar las referencias que se ofrecen en la bibliografía). Incluso proposiciones a primera vista inconmensurables debido a su diversidad de contenido pueden de esta forma, al menos en principio, encontrar formulados sus grados de confianza correspondientes dentro de un único sis tema. Esta concepción behaviorista de los grados de confianza, aun haciendo un reconocimiento debido a la inevitable idealización requerida por toda teoría com prensiva, parece aportar una ligazón inteligible con los hechos observados. 137
En sus planteamientos de los problemas cruciales de las probabilidades inversas, los subjetivistas como Savage y de Finetti son bayesianos. Puesto que las probabilidades primarias que intervienen en los cálculos se su pone que reflejan sólo las opiniones variantes de diferentes razonadores, se podría pensar que no puede haber lugar a estimación alguna universalmente aceptable de la fuerza de la evidencia dada. De Finetti, no obstante, confía en el efecto asintóticamente decreciente de tales asignaciones de probabilidades iniciales como acumulaciones de evidencia empírica. Puede, en efecto, mostrar que en un amplio número de casos interesantes las elecciones hechas de las probabilidades iniciales, ejercen, a la larga, una influencia sobre las conclusiones de la inferencia estadística que se puede despreciar. (Esta parte de su trabajo, con la introducción de su interesante noción de «eventos intercambiables», tiene interés matemático, independientemente de toda valoración final de su tesis filosófica.) A pesar de la admirable ingeniosidad de sus defensores, y de la cantidad de recursos para contestar a sus críticas, es difícil creer que este tipo de teorías sea satisfactorio desde un punto de vista filosófico. Por ejemplo, no está claro el por qué el deseo de evitar que otros nos hagan la apuesta del holandés debe considerarse un criterio necesario de racionalidad, que se ha de aceptar sin más. Se podría objetar que el querer aceptar apuestas simultáneas a favor y en contra de determinado resultado en una misma ronda (y ser tan coherente como pretenden los subjetivistas) sería destruir la razón de la apuesta asegurando que ningún dinero cambia de manos. Son sólo los corredores de apuestas, que se ven obligados a aceptar una variedad de apuestas de ambos bandos, los que necesitan guardarse de las «apuestas del holandés». E incluso a ellos, al igual que a los cambistas de moneda extranjera, no se les ha de considerar irracionales por comprar a un precio inferior
al que ellos venderían. En todo caso, una conducta que es prudente para apostadores parece no ser una base idónea para un análisis de la racionalidad en general. Una persona no sería irracional si insistiera en apostar sólo por una parte de una apuesta; pero tampoco seria nece sariamente irracional si ofreciera ventajas de 1:3 sobre H y ventajas de 1:2 sobre H, con la condición de que quienes apuesten por H deben ser por lo menos tres veces más que los que apuestan por H. En general, parece dudoso que el planteamiento sub jetivista presente un análisis ni siquiera aproximadamente correcto de lo que usualmente significan los enunciados de probabilidad. Cuando una persona dice, por ejemplo, «La oportunidad de mi muerte en los próximos diez años está equilibrada», ¿significa realmente algo más o menos como «Sobre la evidencia disponible, convenientemente rectificada para evitar que nadie me gane dinero sin que corra riesgo, veo que puedo aceptar los mismos puntos contra mi muerte que contra la salida de una cara en un lanzamiento único con un penique limpio»? Parece dudoso, aunque sólo sea por no hallarse presente la implicación de que en el lenguaje ordinario sea una res puesta correcta a la pregunta planteada. Su desviación respecto del concepto preanalítico del sentido común parece demasiado drástica para ser aceptable en último extremo. Méritos de las diferentes teorías t
Ninguno de los tipos principales de interpretaciones de la probabilidad que ahora gocen de nuestro favor puede aceptarse como plenamente satisfactorio. Una razón de ello puede ser el que se pide a toda filosofía aceptable de la probabilidad el cumplimiento de una se rie de miras que son difíciles de reconciliar: mostrar por qué determinados juicios de probabilidad son a priori 119
mientras que otros son contingentes; procurar una base sólida para un cálculo de la probabilidad, al tiempo que se reconoce que los juicios de probabilidad son incorregiblemente imprecisos; dar razón de, y defender, la conexión entre «racionalidad» y grados especificables de confianza en las conclusiones que se siguen con probabilidad de premisas dadas; y, por encima de todo, mostrar cómo y por qué es justificable trabajar con probabilidades. En la medida en que las teorías que tan brevemente se han examinado en este artículo no responden a dichos problemas con sólo negar su existencia (siguiendo el viejo principio de irse a la cama hasta que se pasen las ganas de trabajar), se puede decir de ellas que han hecho hincapié, de diferentes formas, en planteamientos plausibles de alguna de estas tareas a expensas de las otras. La respuesta de moda de algunos matemáticos, que son demasiado «puros» para abordar con seriedad los problemas de interpretación, consiste en hacer vista gorda a las tareas de la filosofía de la probabilidad. Los planteamientos empiristas acertaron a procurar una base inteligible a que los juicios contingentes de probabilidad no se elevaran a postular, bajo la forma de frecuencias límite, series de observaciones que no pueden llevarse a cabo. Los planteamientos lógicos certifican las credenciales de los juicios de probabilidad a priori, pero difícilmente se les puede urgir a que identifiquen el fundamento de la apelación a frecuencias. Los planteamientos subjetivistas prestan más atención que sus rivales a la importancia de la actitud del razonador, pero operan con una concepción tan esquemática de la racionalidad que hacen recelar de su planteamiento. El que todas las teorías puedan, con un mayor o menor despliegue de ingenio, dar fundamento al cálculo de azares da fe tan sólo de la considerable economía y simplicidad de los axiomas que se necesitan. 140
Un rompecabezas pendiente de solución
Lo que resta aún por hacer tal vez pueda ilustrarse de modo adecuado con unas observaciones, a guisa de conclusión, relativas al problema de la aplicación. Supóngase que un filósofo tiene la opción de publicar su primer libro con uno de dos editores, A y B. Supóngase que sabe también que las probabilidades de una segunda edición de los primeros manuscritos filosóficos publicados por A y por B son de 9/10 en el caso de la publicación por parte de A, y sólo de 1/10 en el caso de su publicación por B. En el supuesto de que el filósofo desee tener una segunda edición de su obra y no conozca ningún otro dato relevante al caso, todo el mundo estaría de acuerdo en que preferiría publicar con A a publicar con B. Pero ¿por qué? Se admite, en general, que la verdad del juicio de que el libro tiene una probabilidad de 9/10 de tener una segunda edición es lógicamente compatible con el hecho de no ser reimpreso. Entonces, dado que el autor está interesado en que su libro continúe en prensa y no simplemente en la corrección de la pro babilidad estimada, ¿por qué habría de preferir A a Peirce, Reichenbach y muchos otros dirían que se ha de encontrar la respuesta al considerar una clase de casos similares y contentarse con lograr los propósitos prácticos particulares «a la larga». Pero incluso a la larga sólo puede haber alta probabilidad de éxito en con junto, de modo que lo único que se hace es posponer el problema de por qué debemos guiarnos por consideraciones de probabilidad. En todo caso, la misma definición de nuestra situación excluye la repetición. Algunos defensores de la interpretación lógica arguyen, en efecto, que es una verdad analítica el que de bemos guiamos por probabilidades para ser considerados racionales. Mas, entonces, ¿pór qué ser racional si la racionalidad no tiene nada que ver con el «éxito» y el logro de propósitos prácticos? 141
Una apelación actualmente de moda a «maximalizar las espectativas de utilidad» invita a quien se precia de ser una persona razonable a elegir la línea de acción que le ofrezca el mayor valor «de espectación» calculable —pero esto, en última instancia, es simplemente invitarle a elegir la línea que probablemente le conducirá a mayores beneficios. El subjetivista, si es que dice algo, instará a nuestro imaginario autor a seguir la línea que esté inclinado a seguir, cualquiera que ésta sea, —supuesto que no dé opción a que nadie «apueste» contra él— lo cual no sirve de mucho. Bien pudiera ser que las raíces de este espinoso rom pecabezas —en el que la acción basada en consideraciones de probabilidad se ha de justificar sólo mediante ulteriores consideraciones que nunca satisface, justo porque también se refieren a probabilidades— se hayan de buscar en una concepción metafísica persuasiva incapaz de encontrar un lugar en el universo más que a hechos categoriales —o, lo que viene a ser lo mismo, a proposiciones que son verdaderas o falsas sin especificar. Si un filósofo tiene la inquebrantable opinión de que todo en el universo es lo que es y no otra cosa, de que los eventos ocurren o bien no lo hacen, y de que es absurdo concebir un «término medio», las nociones básicas de la probabilidad se hallan condenadas a parecer misteriosas. Frustrado su intento de explicar la probabilidad en términos de propiedades objetivas de agregados o de series largas, puede acabar, como muchos otros, pensando que las probabilidades expresan grados de ignorancia o grados de creencia subjetiva o cosas por el estilo. Mas entonces el problema de explicar por qué sería racional obrar con base en la probabilidad sería aún más espinoso que antes. Cualquiera que sea la terapia adecuada para este tipo de «congestión» filosófica, sigue siendo un impresionante desafío a todos los estudiosos de la filosofía de la pro babilidad y la inducción. 142
Bibliografía Obras generales
Quienes se inicien en la materia pueden entrar con buen pie consultando los libros de Nagel, Kneale, Keynes, Carnap, Kyburg y Smokier que se citan más abajo. Ernest Nagel, Principles of the theory of Probability , Chica go, 1939, escrito para la Encyclopedia o f Unified Science, sigue siendo todavía una de las mejores historias breves hoy dispo nibles de toda la materia. Aunque Nagel escribe como empirista, su estudio de los pros y contras de las tesis alternativas es muy acertado. Irving John Good, Probability and the Weighing of Evidence, Nueva York, 1950, contiene un análisis bueno y conciso de las diferentes interpretaciones de la probabilidad (págs. 6-12). Good mantiene una tesis moderadamente «subjetivista». G.H. von Wright, The Logical Problem of Induction, Helsin ki, 1941; 2.a ed. revisada, Oxford, 1957, es especialmente va liosa para la historia de la materia. Rudolf Carnap, Logical Foundations of Probability, Chica go, 1950, constituye fundamentalmente una defensa del punto de vista lógico. No obstante, Camap también ofrece una crítica profunda de las concepciones rivales. John Maynard Keynes, A Treatise on Probability, Lon dres, 1921, debe ser leído por cuantos se interesen seriamente por el tema. Al igual que el libro de von Wright, es igualmente valioso por sus observaciones históricas. William Kneale, Probability and Induction, Oxford, 1949, es quizá la mejor discusión disponible de todo el rango de la filo sofía de la probabilidad. Isaac Todhunter, A History o f the Mathematical Theory of
14.3
Probability From the Time o f Pascal to That o f Laplace, Cam bridge y Londres 1865, constituye una historia útil, aunque pedestre, de la teoría matemática, pero olvida aspectos filosó ficos. Stephen E. Toulmin, The Uses o f Argument, Cambridge, 1958, cap. 2, «Probability», págs. 44-93, mantiene que decir «S es Probablemente P» es comprometerse cautelosa, provisio nalmente o con reservas con la opinión de que S e s P y asimismo cautelosamente comprometerse a conferir la propia autoridad a tal punto de vista. Como crítica del planteamiento de Toul min véase a John King-Farlow, «Toulmin’s Analysis of Pro bability» en Theoria, vol. 29 (1963), págs. 12-26. J.N. Findlay, «Probability Without Nonsense», en Philosophical Quar terly, vol. 2 (1952), págs. 218-239, es de corte fenomenológico: muestra un tacto especial para algunos modismos ordinarios. Kneale, op. cit. (en especial pág. 20), afirma que en la vida ordi naria «probable» significa lo mismo que «digno de aproba ción» o, más precisamente, «tal que una persona racional lo aprobaría como base de decisiones prácticas». Piensa, pues, que acompaña a la palabra cierta «insinuación de mérito». La noción de «probable» aplicada a juicios de valor llega muy lejos en Patrick Day, Inductive Probability, Londres, 1961, en especial págs. 29-39. Para una crítica mordaz del libro de Day véase, por ejemplo, la recensión de Wesley C. Salmon en Philosophical Review, vol. 72 (1963), págs. 392-396. Para la discusión de Carnap de los «Two Senses of Probability» véase Carnap, op. cit., cap. II, sec. 9, págs. 23-36, y cap. IV, sec. 42, páginas 182-192. Véase también John Wisdom, «A Note on Probability», en Max Black, ed., Philosophical Analysis, Itha ca, N.Y., 1950, págs. 414-420. Todavía no se ha publicado ningún examen sistemático y comprensivo de los usos ordinarios de «probablemente» y sus términos cognados.
La matemática de la probabilidad
La obra clásica dentro de la axiomática de la teoría de la probabilidad es A.N. Kolmogorv, Foundations of the Theory o f Probability, Nueva York, 1950. Entre las obras estándar sobre 144
aspectos matemáticos de la materia se podría recomendar las siguientes: Harald Cramer, The Elements of the Probability Theory, Nueva York, 1955; William Feller, An Introduction to Probability Theory and Its Applications, Nueva York, 1950; y Thornton C. Fry, Probability and Its Engineering Uses, Nueva York, 1937. La tercera de ellas es especialmente valiosa para lectores sin mucha base matemática. Para filósofos interesados en la fundamentación de la estadística, Ronald A. Fisher, Statistical Methods and Scientific Inference, Londres, 1956, constituye una lectura fascinante. Debería añadirse que los planteamientos de Fisher son umversalmente compartidos por los estadísticos. Un informe bueno y elemental sobre los enfoques modernos de la teoría estadística lo constituye el de Herman Chernoff y Lincoln E. Moses, Elementary Decision Theory, Nueva York, 1959. Teorías clásicas
Jakob Bernoulli, Ars Conjectandi, Basilea, 1713, no ha sido traducido al inglés. Sin embargo existe una traducción alemana de R. Haussner, bajo el título de Wahrscheinlichkeitsrechnung, 2 vols., Leipzig, 1899. Pierre Simon de Laplace, A Philosophical Essay on Probabi lities, Nueva York, 1952, es una traducción fácilmente asequi ble del «Essai philosophique sur les probabilités» que apareció en la segunda edición, París, 1814, de Théorie analitique des probabilités, 1.a ed., París, 1812. Teorías lógicas
Keynes, op. cit., sigue siendo indispensable. Carnap, op. cit., es el libro más importante entre los hoy asequibles. Otras referencias a las discusiones de los plantea mientos de Carnap pueden encontrarse en la bibliografía del artículo «Inducción». Harold Jeffreys, Scientific Inference, 2.a ed., Cambridge, 1957, y Theory o f Probability, 2.a ed., Oxford, 1948, están en la línea de Keynes. El segundo es un libro más elaborado; el primero tiene un cariz filosófico más controvertido. Sería una lástima pasar por alto los artículos postumos de W.E. Johnson «Probability: The Relations of Proposal to 145
\
Supposal», en Mind, vol. 61 (1932), págs. 1-16; «Probability. Axioms», en Mind, vol. 61 (1932), págs. 281-296; y «Probabi lity: The Deductive and Inductive Problems», en Mind, vol. 61 (1932), págs. 409-423. Bertrand Russell, Human Knowledge: Its Scope and Limits Nueva York, 1948, contiene siete capítulos sobre probabilidad (páginas 335-418). C.I. Lewis, An Analysis o f Knowledge and Valuation, La Salle, 111., 1946, cap. 10, «Probability», considera que la pro babilidad es «una estimación válida de una frecuencia». Henry E. Kyburg, Jr., Probability and the Logic o f Rational Belief, Middletown, Conn., 1961, es una de las últimas sofisti caciones del punto de vista lógico. La tesis, algo oscurecida por el exceso de simbolismo, se halla explicada de modo más simple en «Probability and Randomness» del mismo autor, en Theoria, vol. 29 (1963), págs. 27-55. Teorías frecuenciales
John Venn, The Logic o f Chance, Londres, 1866; 3.a ed. revi sada 1888; reimpresa en Nueva York, 1962, una de las primeras presentaciones de una teoría frecuencialista, constituye aún una buena lectura. Para el punto de vista de C.S. Peirce, véase Collected Papers o f Charles Sanders Peirce, Charles Hartshome, Paul Weiss y Arthur W. Burks, eds., 8 vols., Cambridge, Mass., 1931-1958, en especial vol. II. Richard von Mises, Probability, Statistics and Truth, 2.a ed. inglesa revisada, Nueva York, 1957, contiene una presentación relativamente poco técnica del punto de vista de von Mises y una crítica mordaz de sus alternativas. Los puntos de vista más o menos similares cuidadosamente expuestos en Hans Reichenbach, The Theory of Probability, Berkeley y Los An geles, 1949, han sido objeto de duras críticas. Véase, por ejemplo, Arthur W. Burks, «Reichenbach's Theory of Probability and Induction», en Review o f Metaphysics, vol. 4 (1951), pági nas 377-393. Teorías subjetivas
La obra más valiosa sobre este tópico es, hoy por hoy, Henry E. Kyburg, Jr. y Howard E. Smokier, eds., Studies in
Subjetive Probability, Nueva York, 1964, que contiene, entre otros materiales útiles, una traducción de Henry E. Kyburg, Jr. de la importante memoria de Finetti «La prévision: Ses Lois Logiques, ses sources subjectives» en Armales de Instituí Henri Poincaré, vol. 7, 1937, págs. 1-68, así como «Foresight: Its Logical Laws. Its Subjective Sources», págs. 93-158. La introducción de los editores constituye una excelente presen tación del punto de vista subjetivista. Respecto de la sugerencia de F.P. Ramsey de medir la pro babilidad subjetiva, véase The Foundations of Mathematics and Other Logical Essays, Londres, 1931. La prueba de Ramsey del grado de creencia se halla explicada en págs. 174-182. El nexo entre «hacer la apuesta del holandés» y satisfacción de los axiomas de un cálculo de probabilidad se presenta en John Kemeny, «Fair Bets and Inductive Probabilities», en Journal of Simbolic Logic, vol. 20 (1955), 263-273; en R. Sherman Lehman, «On Confirmation and Rational Betting», en Journal of Simbolic Logic, vol. 20 (1955), págs. 251-262; y en Abner Shimony, «Coherence and the Axioms of Confirmation», en Journal of Simbolic Logic, vol. 20 (1955), págs. 1-28. Puede recomendarse especialmente el primero. Leonard J . Savage, The Foundations o f Statistics, Nueva Y ork, 1954, una defensa pionera del planteamiento subjetivista, con tinúa gozando de considerable ascendiente. Contiene mucho material de interés filosófico. Para una discusión valiosa, aunque difícil, entre los estadísticos sobre las tesis de Savage, véase Savage y otros, The Foundations o f Statistical Inference: A Discussion, Nueva York, 1962. Puede encontrarse una concisa critica filosófica en G.H. von Wright, «Remarks on Epistemology of Subjective Probability», en Ernest Nagel, Patrick Suppes y Alfred Tarski, eds., Logic, Methodology and Philosophy o f Science, Standford, Calif, 1962, páginas 330-339. Para planteamientos alternativos a la pro babilidad subjetiva véase, por ejemplo, I. J. Good, op. cit., y B. O. Koopman, «The Axioms and Algebra of Intuitive Pro bability», en Annals o f Mathematics, vol. 41 (1940), páginas 269-292. Koopman difiere de algunos otros subjetivistas al considerar que la probabilidad es sólo parcialmente mensurable.
147
Bibliografías
Existen muchas referencias en los libros anteriormente cita dos de Keynes, Camap y von Wright. Kyburg y Smokier, op. cit., contiene una excelente lista que hace hincapié en las teorías subjetivistas. Max Black, «Induction and Probability», en Raymond Klibansky, ed., Philosophy in the Mid-century, vol. I, Floren ce, 1958, pigs. 154-163, constituye una visióncríticadela produc ción de una década, y, finalmente, Henry E. Kyburg, Jr., «Recent Work in Inductive Logic», en American Philosophical Quarterly, vol. I (1964), pigs. 249-287, aunque especialmente dedicado a problemas de inducción, es también útil como panorámica de la teoría de la probabilidad. Contiene una ex tensa bibliografía.
' J8
LOS MÉTODOS DE INDUCCIÓN DE MILL
J. L. Mackie
Versión castellana de Rafael Beneyto
Los métodos de inducción de Mill
John Stuart Mill, en su System of Logic (Libro III, capítulos 8-10), formuló y discutió cinco métodos de investigación empírica, a los que denominó el método de las concordancias, el método de la diferencia, el mé todo conjunto de concordancia y diferencia, el método de los residuos y el método de las variaciones conco mitantes. Mili sostenía que son éstos los métodos por los que descubrimos y demostramos las relaciones cau sales y que son de capital importancia en la investiga ción científica. Denominó Mili a estos métodos «métodos eliminativos de inducción». Con ello dejaba entrever cierta analogía con la eliminación de términos en una ecuación algebraica —analogía que, más bien, resulta ser forzada, excepto en lo que respecta a los diversos métodos que se agrupan bajo el título de método de la diferencia. Tal como se demostrará, tal vez sea mejor usar el término «métodos eliminativos» para referirse a la eliminación de candidatos rivales al papel de causa, que caracteriza a todos estos métodos. Ilustraciones de los métodos
La característica general de los métodos de Mili de investigación empírica puede ilustrarse recurriendo a ejemplos de los dos más simples, los métodos de las con151
coTdancias y de la diferencia*. El canon de Mill para el método de las concordancias es éste: «Si dos o más casos del fenómeno sometido a investigación tienen sólo una circunstancia en común, la circunstancia en la que únicamente todos los casos concuerdan es la causa (o efecto) del fenómeno dado.» Por ejemplo, si un determinado número de personas que se hallan aquejadas de una determinada enfermedad se han visto todas ellas privadas durante un periodo considerable de tiempo de fruta o de vegetales frescos, y han tenido, en otros aspectos, dietas totalmente diferentes, han vivido en condiciones diferentes, pertenecen a razas diferentes, etcétera, de modo que la carencia de fruta y de vegetales frescos constituye la única circunstancia común a todos ellos, podemos entonces concluir que la carencia de fruta y de vegetales frescos constituye la causa de esta enfermedad concreta. El canon de Mili para el método de la diferencia es éste: «Si un caso en el que el fenómeno sometido a investigación ocurre, y un caso en el que no ocurre, tienen todas sus circunstancias en común, salvo una, y ésta una ocurre sólo en el primero; la circunstancia en la que únicamente los dos casos difieren, es el efecto, o la causa, o una parte indispensable de la causa del fenómeno.» Por ejemplo, si dos piezas de hierro totalmente similares se calientan en un horno de carbón vegetal y se forjan de modos totalmente semejantes, con la salvedad de que la primera se introduce en agua tras su último caldeo, mientras que la segunda no, y si resulta que la primera es más dura que la segunda, entonces la introducción del hierro en agua mientras está caliente es la causa de tal dureza extra —o, al menos, una parte esencial de la causa, pues puede que también se necesiten * La versión castellana de sus respectivos cánones ha sido tomada de L.E. Palacios, Filosofía del saber (Madrid, Editorial Gredos, 1962). Agradecemos al Prof. Palacios el amable permiso concedido para su uso. (N. del T.) 152
la foija, el fuego del homo, etc. Pese a lo que éste experimento muestra, la sola sumersión no puede dar lugar a tal dureza extra. El método de las concordancias, pues, descubre como causa la única circunstancia común a un número de casos, diferentes en otros aspectos, en los que el efecto tiene lugar; el método de la diferencia descubre como causa el único aspecto en el que difiere un caso en el que el efecto ocurre de otro caso totalmente similar en los demás aspectos y en el que el efecto no ocurre. Ambos se consideran métodos de inducción ampliativa; esto es, métodos mediante los que podemos discurrir desde un número limitado de casos observados hasta una relación causal general. La conclusión pretendida es que una determinada enfermedad resulta siempre producida por una carencia de fruta y de vegetales frescos, o que la sumersión del hierro en agua cuando está caliente siem pre lo endurece, si se lo ha calentado y forjado de determinada hianera. Y se pretende que los otros tres métodos operen de manera semejante. Se ha criticado estos métodos en dos líneas principalmente: En primer lugar, se alega que no establecen las conclusiones pretendidas, de modo que no son métodos de prueba o de demostración concluyente; y, en segundo lugar, que no son útiles como métodos de descubrimiento. Tales críticas se han usado en apoyo de la observación general de que dichos métodos no desempeñan papel alguno, o sólo un papel de última fila, en la investigación de la naturaleza, y que el método científico requiere una descripción radicalmente distinta. Para poder valorar la fuerza de tales críticas, y determinar el valor real de los métodos de reducción, no es preciso discutir detalladamente la formulación de Mili. Antes bien, lo único que se necesita es determinar qué habrían de ser los métodos demostrativos válidos corres pondientes a las clases de Mili, y analizar después si tales métodos, o alguno similar a ellos, tienen algún
lugar en la investigación científica o en la del sentido común. Métodos de las concordancias y de la diferencia
Para evitar complicaciones innecesarias, supongamos que la conclusión establecida por una aplicación del método de las concordancias o del método de la diferen cia ha de tener la forma «Tal-y-tal cosa constituye una causa de tal-y-tal tipo de sucesos o fenómenos». Para un estudio formal de dichos métodos y del método con junto, podríamos considerar una causa como una con dición necesaria y suficiente del efecto —o, en algunos casos, como una condición necesaria solamente, o como una condición suficiente solamente— donde decir que X es una condición necesaria de Y es exactamente decir que, siempre que esté presente Y, está presente X, o, en pocas palabras, que todos los Y son X; y decir que X es una condición suficiente de Y es exactamente decir que, siempre que esté presente X, está presente Y, o, en pocas palabras, que todos los X son Y. En general, buscaremos una condición del fenómeno que sea tanto necesaria como suficiente, pero existen variantes de los métodos en las que buscamos una con dición que sea meramente necesaria, o meramente sufi ciente. En la práctica, no obstante, nos ocupamos de condiciones que no son absolutamente necesarias o sufi cientes, sino que son, más bien, necesarias y/o suficientes en relación con algún campo, esto es, algún conjunto de condiciones fundamentales, que pueden especificarse con menor o mayor precisión. Nos ocupamos, por ejem plo, no de la causa de una determinada enfermedad en general, sino de qué es lo que la motiva en los seres hu manos que viven en la tierra, que respiran aire, etc. De nuevo, no nos ocupamos de la causa de la dureza en general, sino de la causa de una dureza superior a la 1Í4
normal en el hierro en circunstancias normales y a tem peraturas ordinarias. El campo en cuya relación buscamos una causa de un fenómeno debe ser tal que en dicho campo el fenómeno ocurra unas veces y otras, no. Podemos suponer que el campo está constituido por la presencia de determinadas cualidades o, cuando menos, de algunos aspectos descriptivos generales, y no por una localización específica. La observación que fundamenta la conclusión es una observación de uno o más casos en cada uno de los cuales diversos aspectos se hallan bien sea presentes, bien ausentes. Un caso puede ser tal que, en el mismo, ocurre el fenómeno en cuestión, y entonces podemos denominarlo caso positivo, o ser tal que en él no ocurre el fenómeno, y entonces podemos denominarlo caso ne gativo. Sin embargo, para argumentar válidamente desde una observación tal a una conclusión causal general, necesitamos una premisa general adicional, un supuesto. De bemos suponer que existe alguna condición que, respecto del campo, es necesaria y suficiente (o que es necesaria, o que es suficiente) para el fenómeno, y, además, que dicha condición se ha de encontrar dentro de un rango de condiciones restringido de algún modo. Pues estos métodos están comprendidos en la clase general de formas de razonamiento eliminativas, esto es, de argumentos en los que se confirma o se establece una posibilidad mediante la eliminación de todas o de algunas de sus rivales. El supuesto dirá que existe una causa que hay que encontrar y limitará el rango de candidatos al papel de causa; la función de la observación consistirá en excluir bastantes de los candidatos inicialmente admitidos para posibilitar una conclusión positiva. a) Causas posibles Se sigue de lo anteriormente dicho que el supuesto
indicar algún conjunto limitado (aunque no nece-.amente finito) de lo que podríamos denominar stsisas posibles. Estos son los factores (Mili los lla mará circunstancias o antecedentes) de los que inicial mente se supone que pueden ser causalmente relevantes al fenómeno. Toda causa posible, todo factor que pueda ser causalmente relevante en relación al campo en cuestión, debe, al igual que el propio fenómeno, ser algo que en ocasiones ocurre en el campo y en oca siones no ocurre. Pero ¿hemos de suponer que una causa posible actúa, si es que actúa, aisladamente? Si las causas posibles son A, B, C, etc., el fenómeno es F y el campo es Q, ¿hemos de suponer que la causa de F en Q será bien sea A en sí, bien B en sí, y así sucesivamente? ¿O hemos de permitir que pueda serlo una conjunción, por ejemplo AC, de modo que F ocurre en Q cuando y sólo cuando tanto A como C se hallan presentes? ¿Hemos de permitir que la condición necesaria y suficiente pueda ser una disyunción, por ejemplo ( B o D), de modo que F ocurre en Q siempre que ocurre B y siempre que ocurre D, y sólo cuando ocu rra uno u otro (o ambos)? Incluso ¿hemos de permitir que entre las que hemos considerado causas posibles puedan incluirse causas contrarrestantes, de modo que la causa real de F en Q sea, por ejemplo, la ausencia de C (esto es, la negación no-C, o C) o quizá, BC, de modo que F ocurre en Q cuando y sólo cuando B se halla pre sente y C ausente al mismo tiempo? Existen de hecho métodos válidos con supuestos de diferentes tipos, desde la especie más rigurosa, que exige que la causa real sea exactamente una sola de las causas posibles, hasta la especie menos rigurosa de supuesto, que dice simplemente que la causa real suija de algún modo de estas causas posibles, pasando por aquellas especies que progresivamente dan cabida a negaciones, conjunciones y disyunciones de causas posibles y com binaciones de ellas.
b) Clasificación de estos métodos Existirá, pues, no un método de las concordancias, un método de la diferencia, un método conjunto, sino una serie de variantes de cada uno de ellos. Se podría hacer una panorámica completa de todos los métodos posibles de estos tipos numerándolos como sigue: Un número del 1 al 8 delante de un punto decimal indicará el tipo de supuesto. En consecuencia, se supone que existe una causa real que es 1) una de las causas posibles; 2) una de las causas posibles o la negación de una causa posible; 3) una causa posible o una conjunción de causas posibles; 4) una causa posible o una disyunción de causas posibles; 5) una causa posible o la negación de una causa posible, o una conjunción cada uno de cuyos miembros es una causa posible o la negación de una causa posible; 6) una causa posible, o la negación de una causa posible, o una disyunción cada uno de cuyos miembros es una causa posible o la negación de una causa posible; 7) una causa posible, o una conjunción de causas posibles, o una disyunción cada uno de cuyos miembros es una causa posible o una conjunción de causas posibles; 8) una causa posible, o la negación de una causa posible, o una conjunción cada uno de cuyos miembros es una causa posible o su negación; o una disyunción cada uno de cuyos miembros es una causa posible o su negación, o una conjunción cada uno de cuyos miembros es una causa posible o su negación. La primera cifra después del punto decimal indicará el tipo de observación como sigue: 1) 2)
una variante del método de las concordancias; una variante del método de la diferencia; 157
3) una variante del método conjunto; 4) un método nuevo y parejo. La segunda cifra después del punto decimal especificará ulteriores diferencias cuando sea necesario, pero esta cifra no tendrá un significado constante. No puede presentarse aquí la panorámica completa, pero sí se considerarán algunas variantes que se han elegido, numeradas de la suerte que acabamos de fijar. c) Método positivo de las concordancias Empecemos con un supuesto de la primera especie, que existe una condición X necesaria y suficiente para F en Q, esto es, que para algún X todo QF es X y todo QX es F, y X es idéntica a una de las causas posibles A, B, C, D, E. (Puede hacerse notar que una condición es pecificada de tal modo puede en ocasiones no ser algo que ordinariamente consideraríamos la causa del fenómeno : más bien deberíamos decir que contiene la causa real. No obstante, en nuestro planteamiento presente llamaremos a tal condición la causa; más adelante se explica cómo la causa de un fenómeno puede irse localizando progresivamente con mayor precisión.) Obtendremos una variante del método de las concordancias (1.12) si combinamos con este supuesto la observación siguiente: un conjunto de uno o más casos positivos tales que en cada uno de los casos se halla presente una causa posible, por ejemplo A, pero para toda otra causa posible existe un caso en el que diche causa está ausente. Ello nos lleva a la conclusión de que A es necesaria y suficiente para F en Q. Por ejemplo, la observación podría ser ésta: I, l2 1.ΐΗ
A p p
B a p
C p a
D a
E a
donde p indica que la causa posible se halla presente, a que está ausente, y el punto que puede estar ausente o presente sin alterar el resultado. /, e / ? son casos positivos : I j pone de manifiesto que ni 2? m £ son necesarias para F en Q, I 2 que ni Cni D son necesarias, y por tanto, dado nuestro supuesto, se sigue que A es necesaria y suficiente. Dado que este razonamiento elimina candidatos sobre la sola base de que no son necesarios, existe otra variante (1.11) que supone tan sólo que existe alguna condición necesaria para F en Q idéntica a una de las causas posibles, y que (bajo la misma observación) concluye que A es una condición necesaria para F en Q. d) Método negativo de las concordancias Junto al método positivo de las concordancias, en el que se eliminan candidatos como no necesarios debido a que se hallan ausentes en casos positivos, existen variantes paralelas de un método negativo de las concordancias en el que los candidatos se eliminan como no suficientes por hallarse presentes en casos negativos. Este requiere la observación siguiente: un conjunto de uno o más casos negativos tales que en cada uno de los casos se halla ausente una causa posible, por ejemplo A, pero para toda otra causa posible existe un caso en el que dicha causa está presente. Por ejemplo:
x 3
A a a a
B P
C
D
P
P
E
P
Si el supuesto era que una de las causas posibles es suficiente para F en Q, esta observación pondría de manifiesto (1.1 3) que A es suficiente, mientras que si el supuesto 159
era que una de las causas posibles es a la vez necesaria y suficiente esta observación pondría de manifiesto (1.14) que A es necesaria y suficiente. e) Método de la diferencia Para la más simple variante del método de la diferencia (1.2) necesitamos esta observación: un caso positivo /, y un caso negativo N t tales que, de las causas posibles presentes en /,, una de ellas, por ejemplo A, se halla ausente en N r Por ejemplo:
f Ν
A p a
B p p
C p p
D a
E p
En este caso, se elimina D por hallarse ausente en /,, y no ser, por tanto, necesaria, mientras que B, C y E resultan eliminadas por hallarse presentes en N v y no ser, por tanto, suficientes. En consecuencia, dado el supuesto de que una de las causas posibles es a la vez necesaria y suficiente para F en Q, se sigue que A es tal. (Adviértase que por carecer de importancia el que, por ejemplo, E se hallase ausente en /,, la presencia de la causa real en / no precisa ser la única diferencia entre los casos.) Podemos observar aquí que el método de la diferencia, en contraste con algunas variantes del método de las concordancias, requiere el supuesto de que existe alguna condición que es a la vez necesaria y suficiente para F. Es cierto, como veremos más adelante con las variantes 4.2 y 8.2, que la «causa» detectada por este método en ocasiones no es ella misma una condición necesaria, ni incluso suficiente; pero el supuesto que necesitamos es que algo sea a la vez necesario y suficiente. 160
f) Método conjunto El método conjunto puede interpretarse como un método indirecto de la diferencia; esto es, la función desempeñada antes por /, puede distribuirse entre varios casos postivos, y la función desempeñada por N v entre diversos casos negativos. Es decir, necesitamos (para 1.3) la observación siguiente: un conjunto St de uno o más casos positivos y un conjunto Sn de uno o más casos negativos tales que una de las causas posibles, por ejemplo A, se halla presente en todo S¡ y ausente en todo S„, y cada una de las restantes causas posibles o bien se halla ausente en por lo menos uno de los casos positivos o bien se halla presente en por lo menos uno de los cásos negativos. Dado que una de las causas posibles es a la vez necesaria y suficiente, ello nos lleva a la conclusión de que A es tal. g) Variantes simples de estos métodos Con un supuesto del segundo tipo (que la condición requerida es una causa posible o la negación de una causa posible) necesitamos observaciones más fuertes. En este sentido, para las variantes del método positivo de las concordancias (2.11 y 2.12) necesitamos ésta: dos o más casos postivos tales que se halle presente en cada caso una de las causas posibles (o su negación), por ejemplo A, y para toda otra causa posible exista un caso en el que la misma se halla presente y un caso en el que se halla ausente. Ello se necesita para excluir, de entre los candidatos al papel de condición necesaria (o a la vez necesaria y suficiente), las negaciones de causas posibles así como las causas posibles distintas de A. Para la correspondiente variante del método de la diferencia (2.2) necesitamos esta observación: un caso positivo /, y un caso negativo N t tales que una de las 161
causas posibles (o su negación), por ejemplo A, se halle presente en /, y ausente en N t, y cada una de las restantes causas posibles se halle presente tanto en /, como en iV,, o bien ausente en ambos. Por ejemplo: A
A P a
B P P
c
a a
D a a
E P P
Puesto que B se halla presente en JV,, B no es suficiente para F en Q; y dado que B se halla presente en /, no-2? no es necesaria para F en Q; en consecuencia, ni B ni no-2? pueden ser a la vez necesarias y suficientes. De mo do similar se descartan C, D, E y sus negaciones, así como también no-A, y, en concecuencia, la condición necesaria y suficiente debe ser A misma. Es ésta la clá sica observación de diferencia descrita por Mili, en la que la única (posiblemente importante) diferencia entre los casos la constituye la presencia en /, del factor que se identifica como la causa real; pero necesitamos esta observación (en oposición a la más débil de 1.2) sólo si convenimos que la negación de una causa posible pueda ser la causa real. El método conjunto necesita, junto a este supuesto más débil, una observación reforzada de un modo similar: a saber, cada una de las causas posibles distintas de A debe hallarse presente tanto en un caso positivo como en otro negativo, o bien ausente tanto en un caso posi tivo como en otro negativo, y entonces esta variante (2.3) ya conduce a la conclusión de que A es no sólo necesaria, sino también suficiente. (Lo que Mili y sus seguidores describen como método conjunto puede no ser este método indirecto de la dife rencia, sino, más bien, un doble método de las concor dancias, en el que un conjunto de casos positivos iden tifica una condición necesaria y un conjunto de casos negativos identifica una condición suficiente. Tal com binación es redundante bajo un supuesto de alguna de 162
las dos primeras claves, pero no si el supuesto se hace menos rígido.) h) Variantes más complejas Consideraremos a continuación un supuesto de la tercera clase, que la condición requerida es una causa posible, o bien una conjunción de causas posibles. (Esta última posibilidad parece ser al menos parte de lo que Mili significa con «una combinación de efectos».) Dicha posibilidad no afecta al método positivo de las concor dancias, puesto que si una conjunción es necesaria, cada uno de sus conyuntos es necesario, y se pueden eliminar candidatos como anteriormente. Mas, dado que los con yuntos de una condición necesaria y suficiente pueden no ser individualmente suficientes, el método negativo de las concordancias tal como se ha establecido más arriba será inoperante. La observación de (1.13 ó 1.14) dejaría ahora abierta la posibilidad de que, por ejemplo, BC fuera la requerida condición (suficiente o) necesaria y suficiente, ya que si C se hallara ausente en IV, y B en N2, entonces BC en bloque podría aún ser suficiente: no sería eliminada por ninguno de dichos casos. Este método precisa ahora (en 3.14) una observación más fuerte, a saber, un caso individual negativo N t en el que una causa posible, por ejemplo A, se halla ausente, y toda otra causa posible, presente. Ello pondrá de mani fiesto que ninguna causa posible o conjunción de causas posibles que no contenga a A es suficiente para F en Q. Pero incluso eso no muestra que la condición requerida sea A misma, sino meramente que o bien es A misma o bien una conjunción en la que A es uno de los conyuntos. Lo cual puede expresarse diciendo que la causa es (A ...), donde los puntos indican que pueden formar parte de la condición otros conyuntos, y donde los pun tos se hallan subrayados, mientras que A no, para in16 3
dicar que A debe aparecer en la fórmula de la causa real, y que los otros conyuntos pueden figurar o no. La correspondiente variante (3.2) del método de la diferencia necesita tan sólo la observación de 1.2. Pero la misma, por su parte, establece tan sólo la conclusión menos completa de que (A . . . ) es una condición necesaria y suficiente de F en Q. Pues aunque (en el ejemplo presentado para 1.2 más arriba) B, C, D y E son ya eliminadas individualmente como lo fueron en 1.2, y todas las conjunciones que como BC, por hallarse presentes en Iv podrían ser necesarias, se eliminan debido a que también se hallan presentes en JVj y, en consecuencia, no son suficientes, sin embargo una conjunción que contenga a A, como AB, se halla no sólo presente en /,, sino también ausente en N t, y podría, por tanto, ser a la vez necesaria y suficiente. En consecuencia dicho su puesto y dicha observación ponen tan sólo de manifiesto, como indica Mili, que A es «la causa, o una parte indispensable de la causa.» La causa completa se representa con la fórmula (A .. Λ con la restricción de que sólo pueden reemplazar a los puntos causas posibles que se hallen presentes en I r En la correspondiente variante del método conjunto (3.3), necesitamos un caso individual negativo en lugar del conjunto Sn, por las mismas razones que en 3.14 y la causa se especifica sólo como (A . . . ) . Bajo un supuesto del cuarto tipo (que la causa requerida sea una causa posible o una disyunción de causas posibles), el método negativo de las concordancias funciona como en 1.13 y 1.14, pero el método positivo de las concordancias resulta ahora seriamente afectado. Pues con la observación dada para 1.12 más arriba, la condición necesaria y suficiente podría ser, por ejemplo, (B o O , ya que esta disyunción se halla presente tanto en /, como en I2, aunque ninguno de sus disyuntos se halle presente en ambos casos. En consecuencia, la observación de 1.12 dejaría totalmente por decidir el resultado. 1b4
Necesitamos (para 4.12) una observación mucho más fuerte, a saber, un caso individual positivo en el que se halle presente A y ausentes a la vez todas las restantes causas posibles; e incluso esto tan sólo pone ahora de manifiesto que la causa es {A o . . Dicho supuesto (el de que la causa pueda ser una disyunción de causas po sibles) permite lo que Mili denominó una «pluralidad de causas», pues cada uno de los disyuntos constituye de por sí una «causa» en el sentido de que es una condi ción suficiente: y esto sobre lo que acabamos de llamar la atención constituye el modo en que dicha posibilidad socava el uso del método de las concordancias. El método de la diferencia, por otra parte (4.2), sin embargo solamente necesita la observación de 1.2; ésta elimina todas las causas posibles distintas de A, así como todas las disyunciones que no contengan a A, bien sea por no ser suficientes a causa de hallarse presentes en N , bien sea por no ser necesarias debido a que se hallan ausentes en /,. Las únicas disyunciones no eliminadas son aquellas que ocurren en 7, pero no en JVj, y las mis mas deben contener a A. En consecuencia, esta observa ción, bajo este supuesto, pone de manifiesto que una condición necesaria y suficiente es (A o . . esto es, A misma o una disyunción que contenga a A, en la que los restantes disyuntos son causas posibles ausentes en N v Lo cual, por supuesto, significa que la propia A, el factor así aislado, puede ser tan sólo una condición suiciente de F. El método conjunto bajo este supuesto (4.3) necesita un caso individual positivo, pero puede también hacer uso de un conjunto de casos negativos y especifica la causa como (A o .. A medida que los supuestos son menos restrictivos, el método de las concordancias requiere observaciones más y más fuertes. Por ejemplo, en 6.12, que constituye una variante del método positivo bajo un supuesto que permite que la condición necesaria y suficiente pueda ser 165
una disyunción de causas posibles o de sus negaciones, la observación que se necesita es un conjunto S, de casos positivos tales que en cada uno de ellos se halla presente una causa posible, por ejemplo A, y para cada posible combinación de las restantes causas posibles y sus negaciones existe un caso en el que dicha combinación se halla presente íes decir, si hay otras n causas posibles, necesitamos 2" casos diferentes). Esta observación eliminará toda disyunción que no contenga a A, y pondrá de manifiesto que la requerida condición necesaria y suficiente es (A o ^ ^ ), y que, en consecuencia, la propia A es una condición suficiente para F en Q. Una variante paralela del método negativo de las concordancias (5.14) pone de manifiesto que (A , , , ) constituye una condición necesaria y suficiente, y que, por lo tanto, la propia A es necesaria —una curiosa inversión de funciones, porque en las variantes más simples se usaba el método positivo de las concordancias para localizar una condición necesaria, y el negativo, una condición suficiente. En el método de la diferencia, sin embargo, la observación de 1.2 (o, en el caso de que se admitan negaciones, la de 2.2) continúa dando resultados, si bien las conclusiones devienen menos completas, es decir, la causa resulta especificada cada vez de forma menos completa. Por ejemplo, en 8.2, en que suponemos que existe una condición necesaria y suficiente para F en Q que puede ser una de las causas posibles, o la negación de una de ellas, o una conjunción de causas posibles o de sus negaciones, o una disyunción de causas posibles o de sus negaciones o de conjunciones de causas posibles o de sus sus negaciones —lo cual en realidad permite que se construya la condición real sobre la base de las causas posibles de cualquier modo— la observación entonces de 2.2 establece la conclusión de que la condición requerida es (A o ^ ) ; es decir, es la propia A, o una conjunción que contenga a A, o una disyunción en la que uno de
los disyuntas sea A misma o una conjunción que contenga a A, o una disyunción en la que uno de los disyuntas sea A misma o una conjunción que contenga a A. Puesto que cualquier disyunta de tal tipo en una condición necesaria y suficiente constituye una condición suficiente, esta observación, en la que la presencia de A en /, es la única diferencia posiblemente importante entre /, y TV,, pone de manifiesto, incluso bajo el supuesto de tipo menos riguroso, que A constituye al menos una parte necesaria de una condición suficiente para F en Q —siendo (A . . . ) la condición suficiente. El método conjunto, como método indirecto de la diferencia, deja de ser operativo una vez que admitimos tanto conjunciones como disyunciones; pero con este octavo tipo de supuesto cobra entidad propia un doble método de las concordancias. En 8.12, así como en 6.12, si hay n causas posibles distintas de A, el conjunto de los 2" casos posibles en que A se halla presente y en los que las restantes causas posibles se hallan presentes y ausentes en todas las posibles combinaciones pondrá de manifiesto que (A o. ..) es necesaria y suficiente, y que, en consecuencia, A es suficiente. De modo similar, en 8.14, así como en 5.14, el correspondiente conjunto de 2" casos negativos pondrá de manifiesto que (A ...) es necesaria y suficiente y que, en consecuencia, A es necesaria. Combinando ambas observaciones podríamos concluir que es no sólo necesaria sino también suficiente. Puede establecerse un nuevo método, semejante en principio, en los siguientes términos (8.4): si hay n causas posibles en total, y observamos 2" casos (positivos o negativos) que cubren todas las combinaciones posi bles de causas posibles y sus negaciones, entonces la disyunción de todas las conjunciones basadas en los casos positivos es a la vez necesaria y suficiente para F en Q. Por ejemplo, si hay sólo tres causas posibles A , B, C,
A
B
c
P
P P P P a a a a
P P a a P P a a
P a P a P a P a
a P P a a P a a
y si tenemos las observaciones recogidas en la tabla adjunta, entonces ( ABC o ABC o ÄBC) es una condición necesaria para F en Q. Pues si éstas son las únicas condiciones posiblemente importantes, cada combinación de causas posibles y de sus negaciones para la que F resulte hallarse presente es suficiente para F, y éstas son las únicas condiciones suficientes para F, ya que en todas las circunstancias relevantes diferentes F se halla ausente; pero la disyunción de todas las condiciones suficientes debe ser a la vez necesaria y suficiente. i) Proliferación de métodos válidos Nos encontramos, pues, con que al tiempo que podemos reconocer variantes muy diferentes de estos métodos de acuerdo con los diferentes tipos de supuestos que se usen, y a la par que la argumentación que da validez a las variantes más simples falla cuando se permite que puedan constituir la causa real diversas negaciones y combinaciones de factores, existen, sin embargo, métodos demostrativos válidos que hacen uso incluso de las formas menos rigurosas de supuestos, es decir, que suponen sólo que existe alguna condición necesaria y suficiente para F en Q, elaborada de alguna manera a partir de un determinado conjunto restringido de causas 168
posibles. Pero bajo supuestos de tal tipo habremos de contentarnos con extraer (por 8.2) una conclusión muy incompleta de la observación clásica de la diferencia o (por 8.12, 8.14, la combinación de ambos, o bien 8.4) con obtener conclusiones más completas sólo a partir de un mayor número de casos en los que las causas posibles se hallen presentes o ausentes en formas sistemáticamente diferentes. j) Una extensión de los métodos Una importante extensión de todos estos métodos es la siguiente: puesto que en todo caso el razonamiento procede mediante eliminación de determinados candidatos, no importa si lo que no se elimina no es una causa posible individual sino un grupo de causas posibles que en nuestros casos se hallan siempre simultáneamente presentes o simultáneamente ausentes, siendo la conclusión tal como ahora la tenemos, pero reemplazando A por un símbolo del grupo. Por ejemplo, si en 2.2 tenemos, por así decir, a A y B presentes ambas en /, y ausentes ambas en iVj, y a cada causa posible la tenemos presente en ambos o ausente de ambos, se sigue que el grupo (A, B ) es la causa en el sentido de que la causa real se halla dentro de este grupo. Una observación similar en 8.2 pondría de manifiesto que bien sea A, o B, o AB o (A o B) es una parte indispensable de una condición suficiente para F en Q.
Métodos de los residuos y de las variaciones concomitantes
a) Método de los residuos El método de los residuos puede interpretarse como 16 9
una variante del método de la diferencia en el que el caso negativo no se observa sino que se construye sobre la base de leyes causales ya conocidas. Supóngase, por ejemplo, que se ha observado el caso positivo /, siguiente: I,
A P
B P
C a
D p
E a
Ahora bien, si tuviéramos, para combinar con éste, un caso negativo N t en el que B y D se hallaran presentes y A, C y E ausentes, podríamos inferir, de acuerdo con el tipo de supuesto hecho por 2.2, que la causa era A, o por 8.2 que la causa era (A ^ o .. .1. etc. Pero si inves tigaciones inductivas previas han_ establecido ya leyes de las que se sigue que, dado ABCDE en el campo Q, F no tendrá lugar, no hay necesidad alguna de observar iV,: ya conocemos todo lo que N x podría decimos, y, en con secuencia, una de las anteriormente mencionadas con clusiones se sigue de I t solo y el supuesto adecuado. Además, si el efecto o fenómeno de que nos ocupamos puede ser cuantitativamente mensurado, podríamos ra zonar como sigue. Supóngase que observamos un caso positivo, por ejemplo con los factores como antes en /,, en el que existe una cantidad x t del efecto en cuestión, al tiempo que nuestras leyes previamente establecidas nos permiten calcular que con factores como los de N t habría una cantidad x 2 de dicho efecto; podemos en tonces considerar la diferencia (x,-x2) como el fenómeno F que se halla presente en /, y ausente en N t. Bajo μη supuesto del tipo (1) ó (2) ó (4) ó (6) —esto es, cualquier supuesto que no permita términos conjuntivos es la causa— podríamos concluir que la causa de F en este caso /, era A sola, y que, en consecuencia, A es una con dición suficiente para F en Q. Bajo un supuesto del tipo (1) ó (2) podríamos ciertamente inferir que A es a la vez necesaria y suficiente, pero bajo uno del tipo (4) ó (6) 170
podríamos concluir sólo que (A o . . . ) es una condición necesaria y suficiente. Hacer un supuesto de cualquiera de estos cuatro tipos es suponer que los efectos de cualesquiera factores son de hecho importantes y meramente aditivos, y ello nos permite concluir que el factor extra de /,, a saber A, pro duce por sí mismo, en relación a Q, el efecto extra (x,-x2). Pero bajo un supuesto del tipo (3) ó (5) ó (7) u (8), que permiten términos conjuntivos y, por tanto, lo que Mili denomina «combinación de efectos», podríamos sólo inferir que la causa de (x2-x2) en este caso era (A . . . ). Con los restantes factores que se hallaban presentes tanto en 7, como en N v A era suficiente para producir este efecto residual, pero no se sigue que A sea suficiente para ello en relación a Q como totalidad. (Aunque Mili no hace mención de ello, tal uso de casos construidos al lado de otros observados es, en principio, aplicable a todos los métodos, y no sólo al método de la diferencia en la línea que aquí se ha esbo zado.) b) Método de las variaciones concomitantes El método de las variaciones concomitantes, como todos los que ya hemos visto, pretende constituir cierto tipo de inducción ampliativa; queremos pasar de una covariación observada en algunos casos a una regla general de covariación que cubra también casos no ob servados. Para interpretar este método necesitamos un más amplio concepto de causa que el que hasta ahora hemos venido utilizando. Por causa de F en Q debe en tenderse ahora, no una condición necesaria y suficiente, sino algo de cuya magnitud depende funcionalmente la magnitud de F, en Q. Para nuestros actuales propósitos, esto significa solamente que existe alguna proposición legaliforme verdadera que, dentro de Q, relaciona la 171
magnitud de uno de los items con la del otro. La causa completa, en este sentido, sería algo de lo que depende, totalmente, en Q, la magnitud de F, esto es, la magnitud de F está unívocamente determinada por las magnitudes de los factores que constituyen la causa completa. Una investigación completa de tal dependencia funcional comprendería dos tareas: primero, la identificación de todos los factores de que depende, en Q, la magnitud de F, y, segundo, el descubrimiento del modo en que dicha magnitud depende de tales factores. La realización de la primera tarea daría como resultado una mera lista de términos; la de la segunda, una fórmula matemática. Sólo la primera de dichas tareas puede llevarse a cabo por un método de eliminación análogo a los ya considerados. Podríamos tener la esperanza de encontrar una variación concomitante análoga tanto al método de las concordancias como al método de la diferencia, es decir, modos de concluir una relación causal entre F y, por ejemplo, A, tanto a partir de la observación de casos en que F se mantiene constante cuando A se mantiene constante y varían todos los demás factores posiblemente im portantes, como a partir de casos en que F varía cuando A cambia y permanecen constantes los demás factores posi blemente importantes. Y ciertamente existen métodos de ambas clases, pero los de la segunda clase, los análogos al método de la diferencia, son los más importantes. Como anteriormente, necesitamos tanto un supuesto como una observación, pero tenemos una opción entre dos diferentes tipos de supuestos. Un supuesto del tipo más riguroso sería que en Q la magnitud de F de alguna manera dependiera por completo de la magnitud de X, donde X es idéntico exactamente a una de las causas posibles A, B, C, D, E. Dado esto, si observamos que después de cierto tiempo, o en cierta clase de casos, F cambia de magnitud cuando una de las causas posibles, por ejemplo A, cambia también mientras las restantes 172
causas posibles permanecen constantes, podemos con cluir que ninguna de las causas posibles distintas de A puede ser aquella de la que depende por completo la magnitud de F, y así llegar a la conclusión de que X debe ser idéntica a A, que en Q la magnitud de F depende por completo de la de A. (Pero cómo depende, esto es, cuál es la ley funcional, debe descubrirse mediante una investigación de otro tipo.) Un supuesto de tipo menos riguroso sería que en Q la magnitud de .Fdepende por completo de alguna manera de las magnitudes de uno o más factores X, X', X", etc., donde cada uno de los factores realmente importantes es idéntico a una de las causas posibles A, B, C, D, E. Dado esto, si observamos además que F varía cuando, por ejemplo, A cambia y B, C, D, E permanecen cons tantes, ello no pone de manifiesto ahora que B, por ejem plo, no puede ser idéntico a X, etc.; es decir, no pone de manifiesto que las variaciones de B son respecto de F causalmente irrelevantes. Todo lo que pone de manifiesto es que la magnitud de Fno es completamente dependiente de ningún conjunto de factores que no incluya a A, pues cada uno de tales conjuntos ha permanecido constante mientras que F ha variado. Lo cual da opción a que la causa de F en Q pueda ser la propia A o pueda ser algún conjunto de factores, como (A, B, D) que incluya a A y también a alguno de los restantes. Todo lo que sabemos es que la lista debe incluir a A. Dicha observación y dicho supuesto, pues, ponen de manifiesto que (A, ...) es una causa completa de F en Q; es decir, que A es de hecho un factor relevante y que puede haber o no otros distintos. Reiteradas aplicaciones de este método po drían añadir otros factores, pero no cerrarían la lista. (Y, al igual que anteriormente, encontrar cómo la mag nitud de F depende de las de los factores que así se ha mostrado que son de hecho relevantes constituye una tarea distinta, que se ha de realizar mediante investiga ciones-de otra clase.) -173
Para cerrar la lista, es decir, para poner de manifiesto que determinados factores son de hecho irrelevantes, necesitamos recurrir a un método análogo al de las concordancias. Si, como antes, suponemos que la causa completa de F en Q es algún conjunto de factores (X, X', X", etc. ), y también que F es sensible a todos estos factores, en el sentido de que para cualquier variación de X, por ejemplo, cuando X', X", etc. permanecen constantes, F también variará, y que X, X ', X ", etc., son idénticos a alguna de las causas posibles A, B, C, D, E, entonces si observamos que Fpermanece constante cuando, por ejemplo, A, C, D y E permanecen constantes, y B varía, podemos concluir que B es causalmente irrelevante, que ninguno de los X es idéntico a B. Usos y aplicaciones de los métodos de eliminación
Hasta el momento presente sólo nos hemos parado a considerar si hay métodos de este tipo demostrativamente válidos; pero al establecer con mayor precisión qué es lo que tales métodos conllevan, podemos incidentalmente haber alejado alguna de las objecciones más obvias al punto de vista de que tales métodos pueden aplicarse en la práctica. Así, al introducir la idea de campo, hemos concedido a estos métodos el papel más modesto de encontrar la causa de un fenómeno en relación con un campo, y no la más ambiciosa de encontrar condiciones que sean absolutamente necesarias y suficientes. Al introducir explícitamente las causas posibles así como el campo, hemos liberado al usuario del método de las concordancias de tener que hacer la poco plausible afirmación de que sus casos tienen sólo una circunstancia común. En su lugar, simplemente tiene que afirmar qué tienen en común sólo una de las causas posibles, admitiendo al propio tiempo que todos los restantes aspectos que pertenecen al campo, o que son constantes en el 174
campo, pertenecerán a todos los casos, y que puede haber también otros aspectos comunes, pero no entre aquellos que él en un principio ha considerado posiblemente importantes. De modo semejante, el usuario del método de la dife rencia sólo tiene que afirmar que ningún aspecto posible mente importante que no sea el que ha seleccionado como causa se halla presente en /, pero no en Nr Además, hemos tomado nota explícita de los modos en que las posibilidades de causas contrarrestantes, una pluralidad de causas, una combinación de efectos, y así sucesiva mente, afectan la operatividad de los métodos, y hemos mostrado que incluso cuando se admiten dichas posibi lidades podemos también extraer conclusiones válidas, siempre que hagamos notar explícitamente la incompletud de las conclusiones que somos ahora capaces de formular (por ejemplo, mediante el método de la dife rencia) o la mayor complejidad de las observaciones que necesitamos (por ejemplo en las variantes del mé todo de las concordancias o en el método 8.4). a) Métodos de eliminación e inducción Al hacer explícitos los supuestos que necesitamos y al presentar los métodos de eliminación como formas de argumentación deductivamente válidas, hemos abando nado toda pretensión de que métodos como éstos re suelvan por sí solos o eliminen el «problema de la induc ción». Supuesto que puedan hacerse las observaciones requeridas, la justificación última de toda aplicación de cualquiera de estos métodos de inducción ampliativa dependerá de la justificación del supuesto utilizado; y puesto que esta proposición tiene forma universal, pre sumiblemente habrá de ser apoyada por algún otro tipo de razonamiento inductivo, o por lo menos no deductivo. Pero debemos ahora hacer a un lado este problema de la justificación última. 175
b) Métodos de eliminación y determinismo Sin embargo, se puede aportar cierta luz a la sugerencia frecuentemente hecha de que el determinismo causal es un presupuesto de la ciencia. Si es que estos métodos de eliminación desempeñan algún papel importante en la investigación científica, entonces hay que hacer notar que todos ellos requieren supuestos deterministas: todos ellos intentan la identificación de la causa de un fenómeno dado suponiendo antes que hay alguna causa que se le pueda encontrar. Sin embargo, ha quedado claro que lo que necesitamos no es un principio de causalidad concreto y umversalmente aplicable, a saber, que todo suceso tiene una causa, sino algo que es a la vez más débil en ciertos sentidos y más fuerte en otros que tal principio. El principio presupuesto es que el fenómeno particular F tiene en el campo elegido Q una causa, pero que la causa de F en Q se ha de encontrar dentro de un rango de factores que se halla restringido de alguna forma. También hemos visto que se requieren conceptos distintos de causa para el método de las variaciones concomitantes que para los restantes métodos. La objeción de que a la frase «uniformidad de la naturaleza» no se le puede dar un significado preciso o útil, de paso, ha sido refutada al ver justamente en qué sentido nuestros métodos han de suponer que la naturaleza es uniforme. c) Empleo de los métodos Tales supuestos se hacen, de hecho, con toda regularidad tanto en las investigaciones dentro de nuestro cuerpo de conocimiento ya desarrollado como en nuestras formas primigenias o de sentido común de hacer descubrimientos acerca del mundo. En estos dos tipos de investigación actuamos bajo el supuesto de que todo cambio que ocurre es causado; y no «simplemente ocurre». En una ciencia desarrollada, el conocimiento causal de que 176
ya disponemos puede constreñir el rango de factores causales posiblemente importantes. Puede decimos, res pecto de este fenómeno particular, qué tipos de causas se ha de procurar buscar y cómo excluir o mantener constantes algunos factores posiblemente importantes mientras estudiamos los efectos de otros. En muchas investigaciones elementales, restringimos el rango de factores posiblemente importantes principalmente a causa de nuestra espectativa de que la causa de todo efecto se ha de encontrar en la vecindad espacio tem poral próxima al efecto. Las causas posibles, pues, serán aspectos que ocurren de modo variable dentro del campo en cuestión en vecindad con los casos en que el efecto o bien ocurre, o bien podría haber ocurrido, pero no ha sido así. d) Uso del método de la diferencia Como ejemplo de lo dicho, las secuencias causales individuales se detectan principalmente mediante el uso de variantes del método de la diferencia. Becquerel descubrió que el radium que llevaba en un frasco en su bolsillo fue la causa de una quemadura al percatarse de que la presencia del radium era la única posible diferencia importante entre el momento en que la inflamación se fue produciendo y los momentos anteriores en que no lo hizo, o entre aquella parte de su cuerpo donde apareció la inflamación y las restantes partes. Consideraciones semejantes nos dicen que un determinado líquido ha hecho colorearse de rojo este papel tornasol: el papel se ha vuelto rojo justo después de que se ha introducido en el líquido, y ninguna otra cosa verosímilmente importante sucedió exactamente entonces. Las situaciones que anteceden y suceden a un cambio constituyen, respectivamente nuestros casos negativos y positivos, y podemos perfectamente tener plena confianza en que éste es el único factor posiblemente importante 177
que ha cambiado. No elaboramos, ni necesitamos ha cerlo, una lista de causas posibles, sino que con sólo estar a la espectativa de más cambios podemos asegurar que lo que constituye un amplio número de causas po sibles (identificadas como tales por hallarse en su ve cindad cin dad espaciotemp espaci otemporal) oral) es lo mismo en /, que en JV JVr Una reiteración de la secuencia —por ejemplo, intro duciendo otro trozo similar de papel tornasol en el lí quid qu ido— o— confirma el punt pu nto o de vista de que el líquido causó el cambio de color. Y no es que en este caso este mos haciendo uso del método de las concordancias; la reiteración simplemente hace menos verosímil que cual quier otro cambio ocurrido cause el cambio de color simultáneamente a cada una de las dos sumersiones, y ello confirma nuestra creencia en que los casos son los que requería el uso del método de la diferencia. Puesto que, en general, no será plausible hacer un su puesto más riguroso que el del tipo (8), (8), la conclusión entonces establecida será sólo que esta secuencia indi vidual constituye una ejemplificación de una ley causal defectiva, de la forma (A ^ o . . . ) es necesaria y sufi cien ciente te para P e n Q. Y esto es lo que nuestros enunciados causales parti particular culares es signific significan an:: decir que esto h a causado causad o aquello dice tan sólo que se ha necesitado esto, quizá en conjunción con otros factores que se hallaban pre sentes, para producir el efecto, y deja abierta la posibi lidad de que otros antecedentes (no presentes en este caso) produzcan conjuntamente el mismo efecto. Los enunciados causales generales, como «comer dul ces ces produce produ ce caries caries dental», dental», se han de interpretar, interp retar, de modo similar, como afirmaciones de leyes causales defectivas. Quienquiera que diga esto reconocerá que comer dulces produce prod uce este efecto sólo sólo en presencia de otras otr as determi deter mi nadas condiciones o en ausencia de determinadas causas contrarrestantes, y reconocería que podrían producir la caries dental cosas distintas a comer dulces. Y tal ley causal defectiva puede establecerse utilizando el méto178
do 8.2, o el método de las variaciones concomitantes, o mediante métodos estadísticos que pueden considerarse transformaciones de éstos. Tales enunciados causales generales han de entenderse, sin embargo, como afirma ciones de leyes causales defectivas, y no como meras co rrelaciones estadísticas: quienquiera que use tales enun ciados está defendiendo que, en principio, pueden cu brirse las correspondiente correspo ndientess lagunas. lagunas. Aplicac ación ión al descu descubri brimie miento nto de efectos e) Aplic
El uso de los métodos anteriores ante riores no se limita a casos en en que partimos partim os de u n problema del tipo «¿Cu «¿Cuál ál es es la causa de tal-y-tal?» —p o r ejemplo, «¿Cuál «¿Cuál es el efecto de aplicar apl icar un alto voltage en un tubo de vacío?» Pero tenemos razones par p araa afirmar que qu e lo que se observa observa que sucede sucede es es un efecto de esto sólo si se satisfacen los requisitos de la variante adecuada del método de la diferencia. Aplicac ación ión del método método de las las conc conco ordan rdanci cias as f) Aplic
Las variantes más simples del método de las concor dancias pueden emplearse para establecer una conclu sión causal sólo en el caso de que nuestro conocimiento previo restrinj res trinjaa muy fuertemente las causas posibles y justifique la creencia de que actu ac tuar arán án individualmente. individualmente. Por Po r ejemplo, ejemplo, si los síntomas de una un a enfermedad enferm edad son tales como para indicar que es de origen bacteriológico, en tonces puede pue de identificarse identificarse el el microorganismo responsab res ponsable le con el descubrimiento de que sólo una especie de micro organismo del que todavía no se sabe que es inofensivo se halla halla presente en un número núme ro de casos de tal enfermeda enfermedad. d. De no ser así, la observación observaci ón de lo que parece ser el único único factor común en un número de casos de un fenómeno puede usarse usar se sólo sólo de un modo mo do provisional provisiona l para pa ra sugerir sugerir una hipótesis que habrá de ser sometida a prueba de alguna otra manera.
No obstan ob stante, te, cuand cua ndo o nos hallamos hallam os con un amplio número de casos sumamente diversos de un determinado efecto, y sólo un factor parece hallarse presente en todos ellos, podemos utilizar en nuestro razonamiento lo que en efecto es una aproximación al método 8.12. Los casos diversos cubren al menos una larga selección de todas las posibles combinaciones de factores posiblemente importantes y sus negaciones. En consecuencia, es probable que ninguna condición no comprendida en la fórmula (A o . . . ) sea sea neces necesari ariaa y, y, por tanto, si exis xiste una condición necesaria y suficiente, ésta es (A o .. por po r lo que A es una condición suficiente del fenómeno. De modo similar, haciendo uso de una aproximación a 8.14, podemos concluir que el único factor posiblemente importante del que se ha encontrado que se halla ausente en un amplio número de casos negativos muy diferentes es probablemente una condición necesaria del fenómeno (esto es, su negación es una causa contrarrestante). Aplicac ación ión del método método de de las las vari variac acio ione ness conc concom omita itante ntess g) Aplic
El método de las variaciones concomitantes, con procedimientos estadísticos que pueden considerarse modificaciones del mismo, se usa en una gran cantidad de investigaciones experimentales en las que se modifica un factor posiblemente importante (manteniéndose constante todo lo demás que pueda ser relevante) para ver si existe una conexión causal entre este factor y el efecto en cuestión. (Por supuesto, lo que consideramos como un único experimento puede comprender la variación de diversos factores, pero siempre de modo tal que los resultados pongan de manifiesto los efectos de la variación de cada uno un o de los factores mismo mismos: s: tal experimento sería simplemente una combinación de diversas aplicaciones de variaciones concomitantes.) 180 18 0
h) Otras aplicaciones El «experimento controlado», en el que un caso de control o un grupo de control se compara con un caso experimental o un grupo experimental, constituye tam bién una aplicación del método de la diferencia (o quizá del método de los residuos, si utilizamos el caso de control, junto con leyes ya conocidas, para decirnos qué es lo que hubiera sucedido en el caso experimental si la causa supuesta no hubiera sido introducida). Una importante aplicación de estos métodos se encuentra en la progresiva localización de una causa. Si consideramos «la ingestión de vino» como una causa posible individual, entonces una aplicación de 8.2 puede poner de manifiesto que la ingestión de vino produce intoxicación: es decir, este factor es un elemento necesario en una condición suficiente para dicho resultado. Pero podemos entonces someter esta causa posible a un mayor anáfisis y descubrir que en este item que hemos denominado «la ingestión de vino» se incluyen diversos factores, y ulteriores experimentos pueden poner de manifiesto que sólo uno de dichos factores era realmente necesario: el elemento necesario se hallará entonces especificado con mayor precisión. Pero el hecho de que esto sea siem pre posible hace que siga siendo verdadero que en relación con el anterior grado de anáfisis de factores, la ingestión de vino era un elemento necesario en una condición suficiente, y el descubrimiento de esta (desde luego burda) ley causal en tanto que funciona y constituye un paso esencial en el camino hacia la ley más precisa que se basa en un anáfisis más minucioso de los factores. Critica de los métodos
El tipo de ejemplo antes presentado, nos ayuda a rechazar una crítica tipo a estos métodos, que consiste en 181
que dan por supuesto lo que constituye realmente la parte más importante del método, a saber, el descubrimiento y análisis de factores. Toda aplicación concreta de uno de dichos métodos presupone de hecho una identificación de causas posibles, pero no se hallará completamente viciado por el hecho de que sea posible un análisis de factores más minucioso. Además, la aplicación de los métodos mismos (particularmente para descubrir secuencias causales individuales y, en consecuencia, las propiedades disposicionales de cosas particulares) constituye una parte del método por el que ulteriormente se dintinguen y clasifican los factores. Por otra parte, los supuestos de que se hace uso, especialmente respecto al rango de causas posibles admitidas, son corregibles, y en conjunción con los métodos son autocorrectoras. Es de presumir que un supuesto erróneo conduzca, con la intervención de las observaciones, a conclusiones contradictorias, y cuando ello sucede estamos obligados a modificar el supuesto, en particular, a buscar en el campo más que lo hicimos anteriormente factores posiblemente importantes. Una objeción fundamental y aceptada por muchos a la afirmación de que estos métodos constituyen una parte importante del método científico es que la ciencia no se ocupa, o no se ocupa mucho, de relaciones causales en el sentido en que estos métodos pueden descubrirlas. Debe reconocerse que la formulación y confirmación de hipótesis y teorías del tipo de las que constituyen la mayor parte de una ciencia como la física constituyen un método científico totalmente diferente de la aplicación real de estos métodos. Incluso el descubrimiento de una ley de dependencia funcional es, como ya se señaló, un trabajo que supera a lo que se consigue con nuestro método de las variaciones concomitantes. También se ha de reconocer que muchas ciencias se ocupan en gran medida del simple descubrimiento de nuevos items y del descu brimiento de procesos más que de las relaciones causales. 18 2
Además, ya se ha señalado que estos métodos no pueden lógicamente constituir la totalidad del método científico, pues requieren supuestos que ellos mismos no pueden justificar. Contestando a esta objección, se puede, sin embargo, hacer hincapié, primero, en que gran parte del conocimiento cotidiano de sentido común, así como gran parte del conocimiento de las ciencias más empíricas, lo es de relaciones causales de este tipo, en parte de secuencias causales individuales, en parte de leyes, en especial de la forma incompleta o defectiva a que estos métodos conducen de manera característica. En segundo lugar, son en gran medida tales relaciones causales empíricas las que son explicadas por, y las que fundamentan, las teorías e hipótesis más profundas de una ciencia desarrollada. Y si no se han de utilizar de esta manera, se han de establecer independientemente. En tercer lugar, aunque los métodos eliminativos de inducción se han asociado en ocasiones a un tipo de em pirismo de fondo que supone que el conocimiento se ocupa exclusivamente de las relaciones empíricas entre cosas, cualidades y procesos directamente observables, los métodos en sí no se hallan comprometidos con esta doctrina, sino que pueden establecer relaciones causales entre entidades que son indirectamente observables. Por ejemplo, en tanto en cuanto exista un método, directo o indirecto, de determinar cuándo nos encontramos en presencia de un campo magnético y cuándo hay en un hilo corriente eléctrica, los métodos pueden establecer el hecho de que tal tipo de corriente producirá un campo magnético. Finalmente, y aun cuando tales relaciones causales no sean el objeto principal de investigación, en ésta constantemente estamos haciendo uso de relaciones causales, en especial de secuencias causales individuales. Al medir, por ejemplo, un voltaje, estamos suponiendo que ha sido la conexión del voltímetro por tales terminales lo 183
que ha motivado tal desviación de su aguja, y las precau ciones que aseguran que esto es así en realidad han de explicarse en términos de nuestros métodos. De hecho, tales métodos se emplean constantemente, explícita o implícitamente, para sugerir hipótesis cau sales y para confirmarlas. No se puede, desde luego, esperar que ningún método de investigación empírica establezca conclusiones más allá de toda posibilidad de duda o de toda necesidad de perfeccionamiento, pero al utilizar estos métodos con frecuencia podemos decir por lo menos esto: tenemos razones para suponer que para un suceso de este tipo en este campo existe alguna causa, y si la causa no es tal-y-tal, no podemos imaginar qué otra cosa puede ser la causa.
184
Bibliografía Obras sobre inducción El estudio clásico sobre inducción de eliminación sigue sien do el de J.S. Mili, A System o f Logic, Londres, 1843, libro III, capítulos 8-10. Mili reconoce que su estudio debe mucho a John Herschell, A Preliminary Discourse on the Study o f Na tural Philosophy, Londres, 1831, parte II, cap. 6, y ambos se hallan fundamentalmente en deuda con Francis Bacon, Novum Organum (Londres, 1620), libro II. Desde Mill la literatura ha proliferado, pero principalmente en libros de texto más que en obras originales de lógica o filosofía. Ha habido muchos tra tados dignos de mención sobre la inducción de eliminación que se hallan muy por encima del nivel de libros de texto —en especial los de John Venn, Empirical Logic, Londres, 1889, capítulo 17; Christoff von Sigwart, Logic, 2.a ed., Friburgo, 1893), traducido por Helen Dendy como Logic, Londres, 1895, volumen II, parte II, cap. 5; y H.B. Joseph, An Introduction to Logic, Oxford, 1906, Cap. 20. Pero existe sólo un reducido número de autores que, bien sea criticando a Mili, bien desa rrollando su planteamiento, han aportado algo nuevo y sus tancial a la lógica o a la filosofía de la inducción de eliminación. Críticas a los métodos de Mili
Los críticos más importantes de Mill son William Whewell, The Philosophy of Discovery, Londres, 1860, cap. 22; W.S. Jevons, The Principles of Science, Londres, 1874, caps. 11, 19 y 23; F.H. Bradley, The Principles o f Logic, Londres, 1883, libro II, parte II, cap. 3; y M.R. Chen y Ernest Nagel, An Introduction to Logic and Scientific method, Nueva York, 1934, cap. 13. 185
Elaboraciones de los métodos de Mili
Los principales escritores que han tratado de desarrollar las ideas de Mili desde la perspectiva lógica son W.E. Johnson, Logic, Cambridge, 1924, parte II, cap. 10; C.D. Broad, «The Principles of Demonstrative Induction», en Mind, vol. 39 (1930), págs. 302-317 y 426-439; y G.H. von Wright, A Treatise on Induction and Probability, Londres, 1951. Broad, siguiendo a Johnson, emprende una reconstrucción demostrativa de los métodos de Mili e intenta extender los métodos de eliminación a razonamientos que concluyan en leyes cuantitativas. El de von Wright es el más completo tratado hasta ahora publicado y estudia las condiciones bajo las que se puede alcanzar la «eli minación completa», incluso con los que aquí se han denomi nado tipos «menos rigurosos» de supuestos. Su tratamiento, sin embargo, parece algo oscuro. Otros estudios
La única aportación importante a la filosofía pura de la inducción es la de J.M. Keynes, A Treatise on Probability, Londres, 1921, parte III. Tres obras recientes que contienen cierta discusión de ella son J.O. Wisdom, Foundations of Infe rence in Natural Science, Londres, 1952, cap. 11; S.F. Barker, Induction and Hypothesis, Oxford e Ithaca, 1957, cap. 3; y J.P. Day, Inductive Probability, Londres, 1961, sec. 5.