l,
1 1
. \'
1
\
Biblioteca COGNICIÓN Y DESARROLLO HUMANO/ 35 Colección dirigida por César Coll
Títulos publicados 1. S. Moscovici - Psicología social, I ?. S. Moscovici - Psicología social, 11 '.l. J_ Bruner - El habla del niño 4. S. A. Hampson - La construcción de la personalidad !,. D. A. Norman - Perspectivas de la ciencia cognitiva 6. K. Kaye - La vida mental y social del bebé 7. R. Schank y R. Abelson - Guiones, planes, metas y entendimiento 8. R. J. Sternberg - Inteligencia humana, l. La naturaleza de la inteligencia y su medición 9. R. J. Sternberg - Inteligencia humana, 11. Cognición, personalidad e inteligencia 10. R. J. Sternberg - Inteligencia humana, 111. Sociedad, cultura e inteligencia 11. R. J. Sternberg - Inteligencia humana, 111. Evolución y desarrollo de la inteligencia 12. R. E. Mayer - Pensamiento, resolución de problemas y cognición 13. R. Case - El desarrollo intelectual: del nacimiento a la edad madura 14. U. Bronfenbrenner - La ecología del desarrollo humano 1'.>. 1-1. Gardner - La nueva ciencia de la mente. Historia de la revolución cognitiva 1 G M.J. Mahoney y A. Freeman - Cognición y psicoterapia 1 1. J. V. Wertsch - Vygotsky y la formación social de la mente 1B. J. Dewey - Cómo pensamos 19. R. Harre, D. Clarke y N. De Cario - Motivos y mecanismos ?O. J. Bruner y 1-1. Haste - La elaboración del sentido. La construcción del mundo por el niño ? 1. P. N. Johnson-Laird - El ordenador y la mente. Introducción a la ciencia cognitiva ??. M. Wertheimer - El pensamiento productivo ?'.l. J. Lave - La cognición en la práctica ?4. f)_ Middleton y D. Edwards - Memoria compartida ?!). M. Hewstone - La atribución causal ?(i D. Cohen y S. A. Mackeith - El desarrollo de la imaginación : 'I l l. lloqoff - Aprendices del pensamiento :'H .J. 1 '(irrHir Comprender la mente representacional :"I 11 < ,,11d11rn /11/u/igencias múltiples. La teoría en la práctica : 11 l I Vy1 ,, ,1: ;ky I '011samiento y lenguaje . 1 1 .1 /\ 1 rn lrn I I 0/11 w y el experto : 1;' 11 11111, •Id, •1 y < ¡ <:, :111 ir Í()r Los senderos de los descubrimientos del niño :1:1 M 1: w,111,,, k y 1 1 11.tk()r Test y cognición :1-1 11 I' l'.1·.ynl11,·; l'/.1111fw.-u:11Íllr:m711itiva : I', /\ ! :l.11 I, I •,/, 11 .1/11
ANDYCLARK
ESTAR AHÍ Cerebro, cuerpo y mundo en la nueva ciencia cognitiva
fflllt,
ttflf11ttol lf;,1111¡ 11,,,11• Putting Brain, Body, and World Together Again Jlwkfitiltf H 11 1 111uln" I'"' llrn M1t Press, Cambridge, Massachusetts Jtttt11n•t•rn ,,,, 1 , ..111•, · .,1111.t1ez Barberán Mt,lttnlt líh·11h ,, "" 1 n1 11.ir1do Martínez Manrique t111h1111h1 •l t< 1 .. 11,111, ,11111·. y Montse Plass
, 1,1�,1,,.. , !¡j•" �...,,, .,_, I ". ,1,,1.1, 1.,·. ·.111 l.:i autorización escrita de los titulares del ,,Copyright», i •>1!•, le1 1.11 ,1, •• 1, 1.1 ,·11 1.,., leyes, la reproducción total o parcial de esta obra por cualquier .,,"'.¡¡,. .. f"'" -=, 11, ... ,1 ,, "'" /1d"'' iJ reprografía y el tratamiento intormá1ico, y Ja distribución dtea 1a1¡f<1,qde1•>== ,1., ,,11., ,,,. .. 1, 1111,, .i1,¡i1d,•1 o préstamo públicos. .i ..
=
-·
,r, t 11111 H,1,,, .. 1, l 11 ,. ,,,11·. 111,:l1tute of Technology ,, , 1111111 ,1., l,1 1, ,1d11, , ,, '"· r ;1!nis Sánchez Barberán ,, , 1u1111 ,11 , 1, ..1,1 .. 1.1. ,,,1,, 10,1es en castellano, f di• !111111·1 l',1f,l11·, 1/,PIIL,I, S. A., M,111""", ,,1,, ·1.· 111111:•1 Barcelona y 1 ,111.. , 1,11 l 'o11d" , · ,/\ILI. 111111 1111¡¡1 '•'111 lt111111,1·,/\1res. 1111 11 WVi1\1\1 11,tl1 lc1, ( 1111] l',1111 '"' 1•11111 .. 11 1 1111¡11·,,,11.. 1,.q,d 11 .' IJl·I l'}'l!-l llllfllllflll 1111 /\.'1.�.fl i 11,1111 , ', I_, 11111 lll ',111 l'"'l'"I"" ti,• Moqoda (Barcelona) 111 1¡1111•,,, 1111 1 •,11o 111,1 1'11111.,d 111 Spain
A mz'padre, ]im Clark, el chicarrón escocés que me enseñó a preguntarme...
Sumario
Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prólogo: Del conexionismo a la mente corpórea y embebida . . . . . . . . Prefacio: Pensamiento profundo contra acción fluida . . . . . . . . . . . . . . Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Introducción: Un automóvil con cerebro de cucaracha . . . . . . . . . . . .
13 15 31 35 39
Primera parte DE EXCURSIÓN POR LA MENTE l. Agentes autónomos: un paseo por la luna . . . . . . . . . . . . . . . . . . . 1.1 Bajo el volcán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Desfile de robots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Mentes sin modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Nichos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 ¿Sensibilidad para los detalles? . . . . . . . . . . . . . . . . . . . . . . . . 1.6 El robot refinado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49 49 50 61 63 65 71
2. El niño situado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Yo, robot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Bucles de acción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Desarrollo sin diseños . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 «Montaje blando» y soluciones descentralizadas . . . . . . . . . . 2.5 Mentes con andamiajes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 La mente como espejo frente a la mente como controladora .
75 75 76 79 83 86 88
...
1O
I
Estar ahí
3. Mente y mundo: la frontera plástica ........................ 3.1 La mente escurridiza................................. 3.2 Las redes neuronales: una revolución inconclusa .......... 3. 3 Apoyarse en el entorno ............................... 3.4 Planificación y resolución de problemas ....... .......... 3.5 Después del archivador ..............................
93 93 93 100 104 109
4. Sabiduría colectiva al estilo de los hongos mucilaginosos ....... 4.1 Aquí llega el mucílago ............................... 4.2 Dos formas de emergencia ............................ 4.3 Tripulaciones marinas ................................ 4.4 Las raíces de la armonía .............................. 4.5 Modelos de la mente oportunista ....................... Intermedio: una historia condensada .......................
113 113
116
119 120 123
126
Segunda parte EXPLICAR LA MENTE EXTENDIDA 5. Robots en evolución .................................... 5.1 Las elusivas estratagemas de la mente corpórea y embebida . 5.2 Un telón de fondo evolutivo. ......................... 5.3 Los algoritmos genéticos como instrumentos de exploración 5.4 Inteligencia corpórea en evolución ..................... 5.5 La batalla de los simuladores (¡Viva lo auténtico!) ......... 5.6 Cómo comprender los agentes evolucionados, corpóreos y embebidos...............................
13 1 13 1 13 2 13 3 13 5 139
142
(). I·'.mcrgencia y explicación ................................ 149 (,. 1 ¿ Estilos diferentes? .................................. 149 (,.2 l)l' las partes a los todos ............................. . 150 (,. \ l .os sistemas dinámicos y la explicación basada en la l'llH'rgl'ncta ....................................... .
160
<, .. ¡ M:1tl·111;íticos e ingenieros ............................ . 166 /,.'1 1 kcisio1ll'S, lkcisioncs ............................... 170
l'lllll raatac1
.............................. .
l ..1 1111,i¡'.''ll lll"lll
/ 1 i.'
,r(
.l'l1'\litlS1' jl':11'11
lJlll'I
l. 11 ·,,l,·,l,,•.,l,·l111l>l!tl
.............................. ·····················
174
177 177 179
Sumario
1
11
7.3 La visión de los primates: de la detección de características a los filtros sintonizados .................. 18 2 7.4 Hipótesis del control neuronal ......................... 18 4 7.5 Refinar la representación ............................. 19 0 8. Ser, computar, representar ................................ 8.1 ¿Noventa por ciento de vida (artificial)? ................. 8.2 ¿Qué es eso que llamamos representación? ............... 8.3 Representación orientada hacia la acción ................ 8.4 Programas, fuerzas y programas parciales ................ 8.5 Seguir el ritmo ...................................... 8.6 Causalidad recíproca continua ......................... 8.7 Problemas ávidos de representación .................... 8.8 Raíces ............................................. 8.9 Representacionalismo mínimo .........................
19 3 19 3 19 3 20 0 20 4 213 215 219 224 228
Tercera parte MÁS ALLÁ 9. Mentes y mercados ..................................... 9.1 Cerebros salvajes, mentes andamiadas ................... 9.2 Perdidos en el supermercado .......................... 9.3 ¿Oficinas inteligentes? ............................... 9.4 Dentro de la máquina ................................ 9.5 Entornos de diseño ..................................
233 233 235 239 241 245
10. Lenguaje: el artefacto definitivo ........................... 10.1 El poder de la palabra .............................. 10.2 Más allá de la comunicación .......................... 10.3 Cambio de espacios ................................ 10.4 Pensar sobre el pensar: el efecto del manglar ............ 10.5 La adaptación del lenguaje al cerebro .................. 10.6 ¿Dónde acaba la mente y empieza el resto del mundo? ....
247 247 248 255 263 267 27 0
11. Mentes, cerebros y atunes: un resumen en salmuera ........... 27 7 Epílogo: habla un cerebro .................................... 28 1 Bibliografía ............................................... 28 7 Índice analítico y de nombres ................................. 301
Agradecimientos
Parte de los capítulos 6 y 9 y del epílogo se basan en los siguientes ar tículos escritos por mí. Agradezco a los compiladores y editores su autoriza ción para utilizar este material. • «Happy complings: Emergence, exploratory styles and embodied, em bedded cognition», en Readings in the Philosophy o/ Artificial Lije, M. Bo den (comp.), Oxford University Press. • «Economic reason: The interplay of individual learning and external structure», en Frontiers o/ Institutional Economics, J. Drobak (comp.), Aca demic Press. • «I am John's brain», en ]ournal o/ Consciousness Studies, 2 (1995), nº 2, págs. 144-148. La procedencia de las figuras se acredita en las notas al pie correspon dientes.
Prólogo: Del conexionismo a la mente corpórea y embebida
La visión un tanto idealizada que la ciencia cognitiva tiene de sí misma (por ejemplo, Gardner, 1985) es la de un área en la que confluyen los es fuerzos interdisciplinarios de fuentes tan diversas como la inteligencia artifi cial, la psicología, la lingüística o las neurociencias. Cada una de estas disci plinas es a su vez una ciencia en movimiento, en la que cada semana están apareciendo nuevas tecnologías, nuevas hipótesis y un caudal de datos que resulta difícil conjugar en un todo coherente. Si a esto añadimos que la ma teria de estudio, el fenómeno de lo mental, está plagada de embrollos filosó ficos, nos encontramos con una ciencia que está en un proceso continuo de redefinición de sus límites, de sus tareas y de su aparato conceptual. Es fácil que al adentrarse en busca de explicaciones uno se encuentre inmerso en unas arenas movedizas que amenazan con tragarle. Como sabe todo aquel que haya visto una película de la jungla, la mejor manera de salir de unas are nas movedizas no es por medio de brazadas bruscas y movimientos violen tos, sino sujetándose a alguna liana y tirando firmemente pero con paciencia. Estar ahí, el tercer libro de Andy Clark, nos proporciona una de esas lianas. A diferencia de sus dos obras anteriores, Microcognition («Microcogni ción», 1989) y Associative Engines («Motores asociativos», 1993), centradas principalmente en analizar los supuestos que hay detrás del enfoque cone xionista de la cognición y en articular las consecuencias de este enfoque para la concepción general de la mente, el conexionismo no es el tema central de Estar ahl, aunque siga ocupando un lugar preeminente. De hecho, y muy en consonancia con el enfoque de la ciencia cognitiva que se va a ofrecer, no es fácil ni conveniente identificar un aspecto determinado como el tema o ar gumento central de este libro, sino que existe toda una colección de concep tos clave que se entrelazan en un tejido explicativo común. Nociones como descentralización, emergencia, sistemas dinámicos, reconocimiento de pa-
16
1
Estar ahí
trones, conducta adaptativa, van a conformar un entramado caleidóscopico, ,1derezado por una multitud de ejemplos de procedencia tan diversa como la robótica, la etología, la economía o el desarrollo infantil. Todo ello con el ob jeto de recuperar para la ciencia cognitiva cuestiones relativas al cuerpo y al ambiente, que no sólo rodean a la mente sino que, de acuerdo con el autor, forman con ella un mismo sistema. A pesar del carácter notablemente diferente de este último libro respec to a los trabajos anteriores, hay un rastro de preocupaciones y motivos afines a lo largo de las tres obras. El objeto de este prólogo, por tanto, es poner a la vista la evolución del pensamiento de Clark en el contexto de sus primeras obras sobre conexionismo, de modo que el lector pueda apreciar, al menos a grandes rasgos, el proceso que desemboca en la imagen de la mente corpó rea y embebida que se plasma en Estar ahí.
Las redes del pensamiento Los sistemas conexionistas irrumpieron con fuerza en el ruedo cognitivo a mediados de la década de los ochenta. En ese momento la concepción do minante entre quienes emplean modelos computacionales de las funciones mentales se basa en la manipulación de representaciones simbólicas discre tas y sintácticamente estructuradas por medio de reglas sensibles a dicha es tructura. Las representaciones se concib'-n como símbolos capaces de reci bir una interpretación semántica en función de la relación particular que posean con el ambiente o con otros símbolos. Son, asimismo, capaces de combinarse con otros símbolos para formar estructuras más complejas. Los procesos cognitivos, por su parte, serán de carácter algorítmico. Una deter minada función se realizará a través de una serie de transformaciones de es tructuras simbólicas. Las transformaciones vienen dadas por un conjunto de reglas que determinan los pasos permisibles a partir de cada estado del sis tema. El enfoque que se deriva de esta visión ha recibido distintas etiquetas, más o menos afortunadas, como cognitivismo clásico, paradigma simbólico, computacionalismo ortodoxo, enfoque de representaciones y reglas, o el acróstico GOFAI ( Good Old-Fashioned Artificial Intelligence o inteligencia artificial al viejo estilo). En oposición a este tipo de organización, los distintos tipos de sistemas concxionistas están constituidos por unidades simples interconectadas for111a 11do una red cuya estructura está inspirada, de un modo muy general, en Lis l·,,ral·tnístirns d1: la arquitectura neuronal del sistema nervioso, por lo lJlll' ta111liié11 rn·ihl·t1 l·l 11
Prólogo 1 17
a través de las conexiones hacia otras unidades, activándolas o inhibiéndolas en mayor o menor medida según el peso y valor (positivo o negativo) de las conexiones. Para llevar a cabo una tarea es preciso entrenar a la red, de ma nera que modifique los pesos de las conexiones entre las unidades hasta que se asiente en una solución estable al problema. La conducta del sistema es así el producto de la interacción de sus elementos. Este enfoque también ha sido bautizado de diversas maneras, como conexionismo, paradigma sub simbólico, neurocomputacionalismo o enfoque PDP (Procesamiento Distri buido en Paralelo). El conexionismo atrajo inmediatamente la atención de un nutrido grupo de insatisfechos con las aproximaciones computacionalistas simbólicas tradi cionales. Entre ellos se contaban investigadores de muy distintos credos, ta les como balistas, asociacionistas, eliminativistas, neurocomputacionalistas o anticomputacionalistas. Esta diversidad de partidarios se debe, en parte, al carácter opaco de los procesos en los que se basa la conducta de una red co nexionista. La actividad es producto de los vínculos asociativos existentes en tre las unidades de la red, de ahí la etiqueta (o, para algunos, la acusación) de asociacionista. El sistema integra simultáneamente (en paralelo) un cúmulo de elementos de información que determinan conjuntamente la respuesta del sis tema ante un estímulo determinado, de ahí la etiqueta de holista. Por otra parte, los neurocomputacionalistas confiaban en que los nuevos sistemas per mitirían integrar los datos procedentes de la neurociencia en modelos com putacionales que idealizasen el funcionamiento de los sistemas nerviosos. Así, el conexionismo permitiría vislumbrar la forma básica de las representaciones en los sistemas biológicos. Los detractores del computacionalismo, por el contrario, veían en el carácter emergente de la conducta de la red con respec to a la actividad de las unidades un punto de apoyo para rechazar cualquier interpretación representacional y computacional de las estructuras y procesos internos responsables de dicha conducta. Los eliminativistas, sin embargo, in terpretaban la falta de vínculos claros entre las entidades que identificamos en nuestras explicaciones psicológicas de andar por casa (entidades tales como creencias y deseos) para decretar la expurgación de nuestro lenguaje psicológico científico de semejantes entidades ficticias. A la hora de contrastar el enfoque conexionista con el simbólico, el des concierto ha seguido siendo la norma. Las redes eran empleadas con éxito en la solución de problemas del mismo tipo que en el enfoque convencional, y la vocación de sus primeros promotores era más reformista que revolucio naria con respecto a la ortodoxia cognitiva. No obstante, las redes se resistí an al análisis clásico en términos de estructuras (los datos) y procesos (los programas) que caracterizaba a la inteligencia artificial típica. A primera vis ta es evidente que existe alguna diferencia entre ambas familias y para ca-
18 1 Estar ahí
racterizarla se han señalado aspectos como los primitivos computacionales que emplean, la metodología de construcción del sistema, la capacidad re presentacional, la adecuación a los datos procedentes de la neurofisiología, la posesión de reglas, el nivel de explicación en el que se sitúan, el grado o tipo de innatismo que permiten, el modo de tratar las actitudes proposicio nales, el tipo de contenido, el tipo de conceptos y un sinfín de aspectos más; y prácticamente respecto a cada diferencia señalada ha habido quien ha ar gumentado que tal diferencia no existe. El conexionismo pedía a gritos un análisis de sus cualidades y supuestos que permitiera ubicar con mayor claridad su lugar dentro del estudio de la cognición. Microcognition, el primer libro de Clark, es uno de los hitos prin cipales en la tarea de llevar a cabo este análisis. Su objeto es delinear qué imagen de la mente y de la ciencia cognitiva se sigue si aceptamos los postu lados conexionistas. Clark evita los posicionamientos rupturistas y las con frontaciones estériles para rescatar una imagen de la cognición que haga jus ticia tanto a tres décadas de ciencia clásica como a los deseos de renovación. Una propiedad crucial con la que exhibir la diferencia entre los sistemas conexionistas y sus predecesores simbólicos es la transparencia semántica. En expresión de Clark ( 1989, pág. 18), un sistema posee transparencia semánti ca cuando «es posible describir una correspondencia nítida entre una des cripción semántica simbólica (de nivel conceptual) de la conducta de un sis tema y una interpretación semántica proyectable de los obietos de su actividad computacional formal representados internamente». Las descrip ciones de nivel conceptual son, en general, aquellas que nos proporcionan los predicados psicológicos ordinarios que utilizamos para hablar de la con ducta propia y ajena. En estas descripciones tienen un papel destacado las referencias a creencias, deseos y otros términos con los que designamos es tados mentales, tales como ver, esperar, intentar, suponer, etc., pero también pertenece a este nivel todo aquello que identificamos normalmente como un concepto. Así, al ver un perro uno categoriza de una determinada manera una porción de realidad, esto es, la hace corresponder a un concepto. Los sistemas clásicos son inherentemente transparentes. Los objetos de computación son los símbolos que se transforman en las transiciones de es tado del sistema. Muchos de estos símbolos poseen una interpretación se mántica que corresponde a las entidades del nivel conceptual y los distintos estados mentales se diferencian en términos de los roles funcionales en que se puede hacer intervenir a los símbolos. Las reglas que gobiernan las transi ciones l'.stán definidas de modo que la conducta global del sistema sea se rn.ínt icanwnte coherente a través del tiempo, generalmente haciendo que el sistl·nrn rcs¡wtc una serie de principios lógicos. En el caso de los sistemas co11n; i(IIJ i�1 as, p(lr d ulll l r., rio, la t ranspa rcncia desaparece: los procesos com-
Prólogo 1 19
putacionales que tienen lugar en una red neuronal no se llevan a cabo sobre elementos que posean una interpretación directa en el nivel conceptual. In cluso cuando se trata de una red local (aquella en que cada unidad sí corres ponde a una entidad de nivel conceptual, como objetos o proposiciones), la conducta viene determinada por el funcionamiento conjunto de todas las unidades, no por la transformación serial de unos símbolos en otros. Cada una de las pequeñas porciones de información codificadas en las unidades y en los pesos o fuerzas de las conexiones puede considerarse como una res tricción débil que influye en el resultado final de la conducta de la red. Una lección del conexionismo, por tanto, es que la relación entre los pensamien tos y lo computacional puede ser más laxa que lo supuesto inicialmente. Otro importante principio defendido en Microcognition es la multiplicidad de la mente. La polémica entre clásicos y conexionistas gravita, en bue na parte, en una sucesión de intentos de mostrar que el enfoque respectivo es capaz de constituir el sustrato único en el que se desarrolla toda la activi dad mental. En la terminología de Pylyshyn (1984), se puede decir que am bos campos se consideran capaces de proporcionar la arquitectura funcio nal, esto es, una suerte de punto fijo sobre el que se definen todas y cada una de las funciones mentales. Clark rechaza el supuesto de uniformidad que subyace en esta discusión: no tenemos motivos para pensar que todas las funciones mentales tengan que asentarse sobre el mismo tipo de arquitectura computacional. Al igual que es posible programar un determinado soporte computacional para que opere simulando el modo de funcionamiento de un soporte distinto, es po sible que el hardware de la mente esté formado en ocasiones por un sistema PDP que simula un sistema simbólico. Esto no significa, como algunos pro ponen (por ejemplo, Smolensky, 1988), que lo simbólico sólo sea una des cripción aproximada de un mecanismo causal genuinamente conexionista; más bien, lo simbólico podría constituir en ocasiones la descripción funcio nal correcta. Lo cierto es que no tiene por qué existir un solo tipo de rela ción entre ambos tipos de sistemas a lo largo de toda la mente. Es mejor con cebir que existe una pluralidad de máquinas virtuales adaptadas para distintos propósitos en el curso de la evolución, máquinas que dejan traslu cir sus propiedades en dominios de problemas diferentes. La idea de la multiplicidad de la mente cobra nuevos giros en Estar ahí, especialmente en el énfasis en los procesos descentralizados. La imagen sim bólica de la mente está a menudo asociada con la presencia de un sistema central que recibe y procesa la información de una variedad de sistemas pe riféricos. Por ejemplo, en la concepción modular de Fodor (1983) este pro cesador central llevaría a cabo la fijación de creencias atendiendo a toda la evidencia suministrada por los sistemas modulares de entrada, tales como la
20 1 Estar ahí
percepción visual o el lenguaje, para enviar la decisión adoptada a un siste ma motor de salida encargado de ejecutar la orden en cuestión. Clark, sin embargo, muestra una abigarrada colección de ejemplos en que la figura del sistema central desaparece y la mente se multiplica a lo largo de un sistema de entidades individuales enfrascadas en una tarea común. Podemos ver des centralización tanto en las conductas colectivas Je las sociedades de insec tos, como en la estructura neuronal del sistema nervioso o en la organización de las funciones de un determinado grupo humano. Descentralización no entraña desorganización: el medio en el que se de sarrolla la conducta en cuestión impone una serie de restricciones que con figuran el resultado final tanto como la dinámica interna de los agentes im plicados. Si el conexionismo, al igual que los modelos clásicos, no puede fundamentar toda la cognición, los recursos de procesamiento de base esta dística con que cuenta necesitan ser complementados y potenciados. Estar ahí examina los modos en que tanto la misma constitución corporal como la manera en que ésta se relaciona con un ambiente que posee su propia es tructura y dinámica pueden proporcionar dicha complementariedad, en un delicado equilibrio de factores internos y externos. Lo interno y lo externo: el caso de la sistematicidad El desplazamiento desde una posición conexionista hacia una visión que otorga mayor relieve al papel del cuerpo y el medio externo es en parte una consecuencia natural Je las propias ventajas y debilidades de las redes neu ronales artificiales. Podemos tomar como ejemplo una de las más arduas po lémicas entre el cognitivismo clásico y el conexionismo: el argumento de la sistcmaticidad, desarrollado por Fodor y Pylyshyn (1988). Existe una rela ción intrínseca entre pensamientos como Juan ama a Marfa y María ama a juan, de modo que las mentes capaces de pensar el primero son así mismo capaces de pensar el segundo. Una propiedad como ésta puede explicarse si consideramos que el medio en que se desarrollan los pensamientos posee una estructura de constituyentes que corresponden a cada uno de los ele mentos identificables en el pensamiento correspondiente (Juan, ama y Ma ria). Estos constituyentes son combinables entre sí, de modo que el signifi cado del compuesto viene determinado por el significado de los colllpo11c·ntes mús simples 4uc intervienen. En otras palabras, la composicio111tl1di1d (kl lenguaje y el pensamiento sería un factor explicativo crucial para la sist(·111a1icidad. 1-J ;11)'.llllH'lllo 1k la sisll'lnaticidad se emplea contra el conexionismo ;1d1wi!'11do '(11!' 1(), sislt·n1;1s (·ci11L·xionis1as no poseen estructura de constitu-
Prólogo 1 21
yentes, con lo cual no son capaces de explicar una propiedad omnipresente de lo mental. Pero lo que es más, de acuerdo con Fodor y Pylyshyn, poseer dicha estructura es, sumado a la presencia de procesos sensibles a ella, una característica que define a los sistemas clásicos. En consecuencia, si los co nexionistas son capaces de dotar a sus sistemas de una estructura de consti tuyentes, lo máximo que habrán logrado es implementar un sistema clásico en una red neuronal artificial. Dicho de otro modo, la auténtica explicación psicológica seguiría siendo de naturaleza simbólica y el conexionismo sólo habría proporcionado el mecanismo, descrito a un nivel demasiado bajo para los propósitos de la ciencia cognitiva, en el que el sistema de símbolos se realiza. El conexionista se encuentra así ante un dilema: o bien sus mode los no son capaces de explicar la sistematicidad porque carecen de la estruc tura necesaria, o si lo hacen en realidad parasitan la explicación clásica. Ante este dilema la reacción de algunos partidarios del conexionismo (por ejemplo, Smolensky, 1988) es desarrollar metodologías para dotar a las redes de constituyentes y mostrar al mismo tiempo que los sistemas obteni dos no son implementaciones de modelos clásicos. Estas propuestas han sido objeto de una larga disputa con los cognitivistas clásicos, disputa difícil de resolver por cuanto comporta cuestiones espinosas (por ejemplo, cuándo podemos decir que un sistema tiene una estructura de constituyentes o qué condiciones deben cumplirse para afirmar que un sistema realiza o imple menta a otro). Otros (por ejemplo, van Gelder, 1990) desarrollan una noción de composicionalidad que no requiere la concatenación de símbolos, una composicionalidad funcional que podría responder a las necesidades de los procesos conexionistas. En la posición adoptada por Clark, los intentos de emplear la sistematici dad como objeción contra el conexionismo son fútiles, puesto que la sistema ticidad no es una propiedad de la arquitectura interna de la mente. Clark (1989, cap. 8) insiste en que el hecho empírico a explicar es la sistematicidad de la conducta, no la sistematicidad del pensamiento. Esta última propiedad hace referencia a un hecho co1?ceptual. No se trata de que no podamos encon trar organismos que posean capacidades mentales no sistemáticas (en el senti do de que falte la conexión intrínseca reclamada por Fodor y Pylyshyn), sino que precisamente la ausencia de sistematicidad sería motivo suficiente para no atribuir mente a tales entidades. En otras palabras, forma parte
22 1 Estar ahí
La adscripción de un determinado pensamiento a un agente, apunta Clark, se hace en función de una amplia porción de la conducta del agente. Supongamos que un organismo es capaz de responder a una determinada re lación entre dos objetos aRb (por ejemplo, a es más alto que b) pero no a bRa (por ejemplo, un animal al que fuera posible entrenar para que respondiera ante aRb, pero no ante bRa). De un hecho como éste no concluimos, argu menta Clark, que el organismo es capaz de pensar aRb e incapaz de pensar bRa, sino más bien que «su patente incapacidad de tener un espectro de pen samientos que involucren a a, b y la relación mayor-que debería frustrar el intento de adscribirle el pensamiento 'a es mayor que b' en primera instan cia». (1989, pág. 147). En Associative Engines, la sistematicidad va a ser contemplada más bien como una propiedad de determinados entornos. Se puede establecer un contraste entre «la sistematicidad como algo impuesto en una criatura por la forma básica de su arquitectura cognitiva y la sistematicidad como un ras go de uno o más dominios (esto es, como algo a aprender por parte de una criatura a medida que intenta dar sentido a un conjunto de datos de entre namiento)». (1993, pág. 148). En un entorno sistemático existen patrones recurrentes de estados de cosas, por ejemplo, individuos y propiedades aso ciados de maneras estables, que un mecanismo cuya capacidad básica es el reconocimiento de patrones puede llegar a aprehender. Un entorno siste mático por excelencia lo constituye el lenguaje. Su sugerencia, por tanto, es vincular las condiciones de aparición Je la sistematicidad con las de la ad quisición de un lenguaje público estructurado sintácticamente. Pero el pro blema es, a sus ojos, tan intratable que recomienda ponerlo entre parénte sis mientras se investigan ulteriores métodos de procesamiento sensible a la estructura. La actividad de un organismo en su entorno pasa a un primerísimo pla no en Estar ahí, no sólo para la adscripción de estados mentales sino como parte integrante de ellos. Desde el cognitívismo tradicional, la conducta constituye una de las fuentes (o la principal) de evidencia acerca de las pro piedades y capacidades mentales. Pero lo mental propiamente dicho es algo que interviene entre los estímulos (la entrada o input, en términos de proce samiento de información) y las respuestas (la salida o output). A diferencia de esto, Clark va a proponer que la interacción cuerpo-mundo es constituti va de la mente. Esta posición podría parecer a primera vista un retorno al conductismo de viejo cuño, para el cual no existe lo mental como elemento explicativo ni ontológicamente sólido, sino tan sólo cadenas de estímulos y rcspt1l'Stas ohscrvahlcs. Pero la postura de Clark dista mucho de esta disolu ci
Prólogo 1 23
desconectada de los avatares del cuerpo que realiza las acciones y del am biente en que éstas se llevan a cabo. Esta extensión puede interpretarse en dos fases o momentos. El primero tiene que ver con la metodología explicativa. Los constructos necesarios y su ficientes en una explicación cognitiva abarcan mucho más que los estados in ternos del sistema a explicar. No solamente se trata de que estos estados nos sean ininteligibles e indetectables si no es desentrañando las condiciones ex ternas en que la acción del sistema se lleva a cabo; se trata de que la explica ción misma será radicalmente incompleta si no hacemos referencia a tales condiciones. Esta idea se encuentra ya plenamente presente en Associative Engines y permite repensar desde la perspectiva conexionista una clase am plia de fenómenos mentales olvidados en buena medida por la ciencia cogni tiva. Se trata de los fenómenos relacionados con el desenvolvimiento de la conducta en el tiempo, por ejemplo, todos aquellos implicados en el proceso de desarrollo y cambio conceptual. Los análisis de la ciencia cognitiva al uso (por ejemplo, Von Eckardt, 1993) dictaminan que su objeto de estudio típico es la cognición adulta, normal y típica. Los estudios del desarrollo de las fun ciones mentales tienen sólo una función secundaria, en la medida en que ayu den a esclarecer el funcionamiento de una mente formada. Una desafortuna da consecuencia de este enfoque es la concepción de la mente como un estadio «a alcanzar», una suerte de horizonte ideal cuyas bases constitutivas es posible estudiar con independencia de su proceso de adquisición. Los procesos de cambio en el tiempo forman, sin embargo, una parte consustancial del estudio de la mente para Clark. En estos procesos el am biente interviene de una manera crucial. Una red neuronal no alcanza una solución con igual facilidad (o incluso no la alcanza en absoluto) a partir de distintos conjuntos de entrenamiento. La disposición y dosificación de la in formación a lo largo del aprendizaje puede ser crucial para que el sistema no se asiente inicialmente en soluciones erróneas de las que es muy difícil ha cerle salir. Es preciso que la red discurra a través de una apropiada trayecto ria representacional de modo que acceda a las representaciones básicas en primer lugar y aprenda las complejas una vez consolidadas las primeras. El mundo proporciona lo que Clark denomina el andamiaje de esas trayecto rias, tema en el que Estar ahí va a ahondar. En otras palabras, el proceso de desarrollo adquiere un perfil que no se debe tanto a Ia naturaleza del meca nismo dé procesamiento interno, como a la naturaleza y disposición de los datos con que se entrena al sistema. En la explicación de la sistematicidad deben figurar, por tanto, parámetros relativos a la arquitectura y parámetros relativos al proceso temporal de adquisición de propiedades del dominio. La sistematicidad de las capacidades es consecuencia de este proceso de apren dizaje.
241 Estar ahí
1 , " :ispectos temporales desempefi.an un papel destacado en Estar ahí, lohle sentido. Primeramente, respecto a la necesidad de considerar las , "'''!,,etas de los sistemas en tiempo real para calibrar los recursos que son , .q ,:,ces de ofrecer respuestas eficientes rápidas; en segundo lugar, respecto .il ,ksarrollo de dichas conductas eficientes tanto desde el punto de vista ,·,·olutivo como ontogenético. Ello va a requerir nuevos instrumentos de aná1,�is más apropiados para captar el despliegue de actividad en el tiempo. Uno de estos instrumentos es la teoría matemática de sistemas dinámicos, a la cual Clark presta detallada atención. El segundo momento de esta extensión de lo mental va a ser ontológico, esto es, se refiere a la propia naturaleza de la mente e implica difuminar los confines que delimitan dónde acaba la mente y dónde comienza el entorno. Lo mental se extiende hacia los dominios en los que actúa, de modo que «gran parte de lo que identificamos como nuestras capacidades mentales en realidad pueden ser propiedades de los sistemas más amplios, y extendidos en el entorno, de los que los cerebros humanos mismos son sólo una parte (importante)» (1997, pág. 214; esta edición, pág. 255). En la concepción clá sica, los estados mentales internos se relacionan con el mundo externo por medio de mecanismos de transducción, es decir, dispositivos que transfor man la energía presente en un determinado medio (luz, sonido, etc.) en in formación manejable en un medio completamente distinto (por ejemplo, un sistema de símbolos). En expresión de Pylyshyn (1984), la transducción constituye «el puente entre lo físico y lo simbólico», o lo que es lo mismo, entre lo no mental y lo mental. Esto permite contemplar los fenómenos cog nitivos como un coto cerrado que recibe información a partir de toda una se rie de periféricos y que realiza sus acciones a través de diferentes efectores. Pero como sefi.ala Dennett ( 1996, pág. 74), la realidad biológica es que exis ten transductores y efectores prácticamente en cada esquina del organismo, en los niveles mismos de las sinapsis neuronales o de las secreciones quími cas. La consecuencia es que lo externo y lo interno se entremezclan empe zando por nuestro propio cuerpo. Clark comparte esta idea de indisolubilidad de la unión entre mente y cuerpo, esto es, la idea de una mente esencialmente corporeizada (embodied). Esta mente corpórea se encuentra además encajada o embebida (embedded) en el mundo en el que actúa. Las trayectorias representacionales, por tanto, no tienen su principio y fin dentro de la organización interna, sino que los mismos elementos del ambiente que proporcionan el andamiaje pueden verse como parte integrante de la trayectoria. La unidad de estudio, en consecuencia, ya 110 sn,ín las transiciones de estado internas, sino que abarca las interacciones con cl l·ntorno, L'll hs cuales dichas transiciones son un componente posible111,·11!t' 11111d10 111;Ís pn¡uc110 que lo sospcdiado en el enfoque clásico. , 11 1111,
Prólogo 1 25
En resumidas cuentas, el caso de la sistematicidad muestra cómo cambiar la forma de un problema al reconceptualizar como externa una propiedad que inicialmente se atribuye a la arquitectura interna. Si la sistematicidad es una propiedad del dominio externo con el que interacciona un agente y lo mental se extiende hacia lo externo, entonces toda explicación de la sistema ticidad debe incluir los procesos que se realizan en esa interacción entre agen te y entorno. Los requisitos de estructura de constituyentes y procesos sensi bles a dicha estructura no tienen por qué demandar una arquitectura clásica dentro del agente, toda vez que podemos incluir estructuras del ambiente y procesos sensibles a dichas estructuras dentro de nuestras explicaciones cog nitivas. Esto permite al conexionista esquivar el dilema de Fodor y Pylyshyn: la arquitectura cognitiva puede seguir siendo fundamentalmente un sistema PDP siempre y cuando podamos explicar los procesos de interacción que permiten que un sistema de reconocimiento de patrones explote la estructu ra sistemática que el mundo le proporciona. Para los detractores del enfoque conexionista, éste puede parecer un caso paradigmático de cómo hacer de la necesidad virtud, puesto que es la propia carencia de la estructura interna necesaria en las redes neuronales lo que empuja al teórico a buscar una solución (descabellada, para el clásico) extendida en el entorno. Probablemente, como el mismo Clark señala, no sea posible solucionar la disputa en ausencia de ulteriores trabajos empíri cos, trabajos que muestren si es posible o no dar cuenta de funciones men tales complejas partiendo de un dispositivo básico de reconocimiento de pa trones y un ambiente estructurado. Pero el mensaje de fondo es claro: independientemente de la forma que la arquitectura de la mente acabe por tener, es bien posible que debamos aligerar el tipo de representaciones in ternas que el organismo precisa. Representación sin textos El desarrollo de la inteligencia artificial (IA) se puede organizar en torno a tres grandes debates (Franklin, 1995). El primero tendría que ver con la posibilidad misma de existencia de la disciplina, esto es, de la validez tanto de la metáfora del ordenador como de los supuestos filosóficos y metodoló gicos de la IA para proporcionar una comprensión satisfactoria de los fenó menos mentales. El segundo debate sería la polémica simbólico-conexionis ta. El tercer debate se centraría en la cuestión de las representaciones y en él se ven inmersas tanto la IA como la ciencia cognitiva en general. Aunque no puede decirse que los dos primeros debates se hayan disipado por completo ni tampoco que ninguno de ellos haya alcanzado una solución satisfactoria,
26 1 Estar ahí
el más acuciante en el momento presente es el debate sobre la represen tación. Es un tema común de la filosofía de la mente hablar de la intencionalidad como una de las propiedades cruciales de los fenómenos mentales. Estados tales como percepciones, creencias o deseos tienen la característica de estar «dirigidos hacia», de tener un contenido que se refiere a algún otro aspecto de la realidad o incluso a lo inexistente. Si veo un gato, creo que mañana será martes o deseo que vengan los Reyes Magos, mis estados mentales apuntan hacia objetos y estados de cosas que son el objeto de mis pensamientos. Es un problema filosófico y cognitivo de primer orden elucidar cómo es posible que lo mental exhiba esta propiedad. La representación constituye el mo derno ensayo de una solución a este problema. Aunque hay muchas nocio nes de representación, podemos decir que en términos generales implica la idea de una entidad que sustituye o «está por» otra, a la cual se refiere o de nota. La idea de representación resulta más clara en los sistemas de repre sentación externos, como las palabras y los dibujos, así que no es extraño que las teorías acerca de la representación interna hayan tomado a menudo como modelo esos otros sistemas. Desde la aparición de El lenguaje del pensamiento (Fodor, 1975) la teoría representacional de la mente se ha presentado como «el único jue go en la ciudad». Los argumentos a favor de las representaciones estruc turadas como elemento explicativo ineludible de los fenómenos cogniti vos siempre han añadido como colotón la coletilla «¿alguien tiene algo mejor?». En consecuencia, el rechazo categórico a las representaciones tiene un aire de bravata, de mera estratagema por parte del aparato de propaganda de unos científicos deseosos de llamar la atención sobre su trabajo pero que «en el fondo» saben que el estudio de la mente no pue de prescindir de ellas en casi todos los ámbitos
Prólogo 1 27
La crítica de muchos partidarios del enfoque dinámico es que las con ceptualizaciones intentan resolver el problema abarrotando los modelos mentales de detalles del mundo que no requieren ser representados. El clá sico malgasta recursos computacionales en dotar a su sistema de una fuerza expresiva (por ejemplo, por medio de lógicas cada vez más potentes) que es en el mejor de los casos innecesaria y, en el peor, un auténtico obstáculo en la resolución de problemas. En consecuencia, es preferible abandonar la no ción de representación y sustituirla por la de un sistema acoplado con el mundo, que torna de éste los elementos necesarios en el momento en que los precisa, sin necesidad de representarlos internamente. El problema es cómo mantener la idea de representación recogiendo a un tiempo lo que tienen de cierto las críticas dinámicas. En Associative En gines Clark no duda de que cualquier inteligencia que merezca la pena va a requerir el concurso de lo conceptual, pero descarta la visión clásica de los conceptos corno «sólidos mentales» (1993, cap. 1) que se transparentan des de las entidades que identificarnos en el habla ordinaria hasta los estados in ternos responsables causalrnente de nuestros pensamientos y acciones. En su lugar, los conceptos podrían tener un carácter mucho más activo, relaciona do con la capacidad de poner en práctica diversas habilidades. Poseer y em plear un concepto podría ser en el fondo una acción de reconocer o com pletar un patrón y la naturaleza exacta del proceso computacional que subyace en este reconocimiento no tiene por qué mantenerse invariable a lo largo de todas las apariciones del concepto. De hecho, el propio carácter inestable de los conceptos desaconseja este postulado. El rechazo de la soli dificación de los conceptos es congruente con críticas desde dentro de la IA, que sugieren que la división tradicional entre percepción y cognición es in sostenible para poder hablar de conceptos fluidos (por ejemplo, Hofstadter y otros, 1995). El antirrepresentacionalista yerra el tiro porque apunta al blanco equi vocado. Corno señala Curnrnins (1989), es posible distinguir entre el proble ma de la representación y el problema de las representaciones. El primero hace referencia a qué es lo que hace que representar sea posible, cuál es la fuente de la representacionalidad, y el segundo a qué caracterización pre sentan los estados y procesos representacionales. La solución de Clark pue de entenderse corno una reorientación de los ataques del antirrepresentacio nalisrno desde el primero al segundo problema. Lo que los críticos esgrimen corno un ataque frontal contra la noción misma de representación resulta ser, si lo observarnos bien, un ataque contra las representaciones, esto es, contra una de las respuestas ofrecidas a la pregunta por la naturaleza de esos correlatos mentales de la realidad: una respuesta creada a imagen y semejan za de los textos lingüísticos, cuyas representaciones exhiben propiedades de
28 1 Estar ahí
tipo lógico-sintáctico. Si en Assoáatz've Engz'nes Clark propone sustituir la imagen clásica de la mente como texto por la imagen de la mente como pro ceso, en Estar ahí va a permitir que ese proceso abarque más que los sucesos con base cerebral, permitiendo al teórico dinámico entrar en el juego expli cativo. No obstante, el texto no desaparece del todo: el lenguaje público pro porciona a la mente todos los recursos textuales que necesita un dispositivo de reconocimiento de patrones. No es preciso moldear las características computacionales de éste en términos cuasilingüísticos, puesto que el mismo lenguaje es capaz de adaptarse de modo inverso a un mecanismo que fue se leccionado por demandas ambientales bien distintas. Conclusión: ¿un nuevo paradigma? Desde que el filósofo Thomas Kuhn caracterizara el desarrollo de una ciencia en términos de paradigmas, marcos normativos que se constituyen en un proceso histórico y que pueden desaparecer tras un proceso de ciencia re volucionaria, da la impresión de que el sueño de todo científico cognitivo que tiene entre sus manos alguna nueva herramienta o teoría es el de con vertirla en la base de un nuevo paradigma para el estudio de la mente. Una idea tentadora, por tanto, es calificar la imagen de la mente corpórea y em bebida como un nuevo paradigma. Sin embargo, una de las lecciones, a mi entender, del trabajo de Clark es que no debemos apresurarnos a rechazar el bagaje conceptual con el que contamos antes de considerar las posibilidades de una revisión menos traumática. La visión de la ciencia cognitiva que Clark presenta en Estar ahí puede calificarse, al igual que su trabajo sobre el conexionismo, de «razonadamen te ecléctica». No es el de Clark el único enfoque que conjuga una perspecti va favorable a los mecanismos conexionistas con una lectura desde la teoría de sistemas dinámicos (tal es, por ejemplo, la visión de Horgan y Tienson [ 1996], para quienes las matemáticas de los sistemas dinámicos constituyen un marco que engloba el computacionalismo tradicional como un caso es pecial). Ni es tampoco el único en intentar tender puentes entre disciplinas que trabajan en distintos niveles (como es el caso de Hardcastle [1996], que desarrolla una idea de teoría cognitiva que cruza desde lo biológico hasta lo psicológico). Pero el rango de dominios empíricos que recorre y el esfuerzo integrador de todos ellos en una visión coherente es de mayor calado. La ciencia cognitiva es una amalgama de disciplinas que se disputan el papel vcrtchrador y ( :lark está dispuesto a admitir un heterogéneo cúmulo de tra1 l:tjos co1110 partl' intL·grantc del estudio de la mente, no sólo como investi /',;1t·io1ws si t 11:1das l'll los m:í rgl·m·s de la tradición dominante y conspirando
Prólogo 1 29
contra ésta. Una de las riquezas de Estar ahí es el modo en que dirige nues tra atención hacia pautas generales y motivos básicos que aparecen de modo recurrente en los ámbitos y niveles más insospechados. Así, podemos pre senciar la influencia de las restricciones impuestas por la disposición parti cular del ambiente tanto si este ambiente consiste en un nicho ecológico, en un entramado de leyes económicas o en la presencia perenne del lenguaje. Confieso que mis propias intuiciones divergen respecto a algunas de las consecuencias que se desprenden de esta visión de la mente. Por ejemplo, la imagen del lenguaje como sistema representacional externo sometido a una adaptación inversa a los recursos computacionales de la mente parece des conectar en demasía los productos lingüísticos de los propios organismos productores, desatendiendo las características de organización interna que permiten que una mente cree un lenguaje en primer lugar. Igualmente, mien tras como metáfora me parece sugerente la concepción de una mente que se filtra y extiende hacia el entorno próximo, como tesis ontológica me resulta difícil de aceptar. Pero son tantas las intuiciones ordinarias que la moderna ciencia de la mente ha hecho añicos, que no parece conveniente rechazar in cluso estas conjeturas aparentemente extemporáneas sin someterlas primero al más severo escrutinio, tanto en sus aspectos conceptuales como empíricos. Los conceptos clave de este libro también exigen un esfuerzo de acomo dación por parte del lector acostumbrado al punto de vista de la ciencia cog nitiva más clásica. Le solicita que abandone su propia actitud mental centra lizadora de buscar en alguna parte del libro la explicación o el conjunto de elegantes ecuaciones definitivas que da sentido a la totalidad; que sea pa ciente mientras ve emerger entre la barahúnda de insectos artificiales y mun dos simulados un patrón común que sus dispositivos de reconocimiento de ben ir entrenándose para captar; y que adapte su propia mirada al ritmo de la dinámica interna de la ciencia cognitiva que, como cualquier otro sistema vivo, también se desarrolla en el tiempo y obedece a la interacción de una miríada de mentes activas y mundos (reales y simulados) estructurados. Referencias Clark, A., Microcognition: Phzlosophy, Cognitive Science and Parallel Distributed Pro cessing, Cambridge, MA: MIT Press, 1989. Clark, A., Associative Engines: Connectionism, Concepts and Representational Chan ge, Cambridge, MA: MIT Press,1993. Clark, A., Being T here.· Putting Brain, Body, and World Together Again, Cambridge, MA: MIT Press, 1997. Cummins, R., Meczning and Mental Representation, Cambridge, MA: MIT Press, 1989.
30
1
Estar ahí
Dcnnett, D. C., Kinds o/ Minds, Nueva York, Basic Books, 1996. I'odor, J. A., The Language o/ Thought, Nueva York, Crowell, 1975 (trad. cast.:El lenguaje del pensamiento, Madrid, Alianza, 1984) Fodor, J. A., The Modularity o/ Mind, Cambridge, MA: Bradford/MIT Press, 1983 (trad. cast.:La modularidad de la mente, Madrid, Morata, 1986). Fodor, J. A. & Pylyshyn, Z. W., «Connectionism and Cognitive Architecture: A Cri tical Analysis», Cognzúon, 28, 1988, págs. 3-71. Franklin, S., Artificial Minds, Cambridge, MA: Bradford/MIT Press, 1995. Gardner, H., The Mind's New Science, Nueva York, Basic Books, 1985 (trad. cast.:La nueva ciencia de la mente Barcelona, Paidós, 1988). Hardcastle, V.G., How to Build a Theory in Cognitlve Science, Albany, Nueva York, State University of New York Press, 1996. Hofstadter, D. and the Fluid Analogies Research Group, Fluid Concepts and Creati ve Analogies, Nueva York, Basic Books, 1995. Horgan, T. & Tienson, J., Connectionism and the Philosophy o/ Psychology, Cam bridge, MA: MIT Press, 1996. Pylyshyn, Z. W., Computation and Cognition Cambridge, MA: Bradford/MIT Press, 1984 (trad. cast.: Computación y conocimiento, Madrid, Debate, 1988). Smolensky, P., «On the Proper Treatment of Connectionism», Behavioral and Brain Sciences, 11, 1988, págs. 1-23. Van Gelder, T., «Compositionality: A Connectionist Variation on a Classical T he i me», Cognit ve Science, 14, 1990, págs. 355-384. Von Eckardt, B., What Is Cogniúve Sáence?, Cambridge, MA: MIT Press, 1993.
Prefacio
Pensar a fondo o actuar con fluidez Si tuviera el lector que construir un agente inteligente, ¿por dónde empeza ría? ¿Qué cree que es ese algo especial que separa el mundo no pensante de las rocas, las cascadas y los volcanes, de los reinos de la inteligencia sensible? ¿Qué es lo que permite que algunas partes del orden natural sobrevivan percibiendo y actuando, mientras el resto se queda al margen, inerte y sin pensamiento? «Mente», «intelecto», «ideas»: éstos son los elementos que marcan la dife rencia. Pero, ¿cómo los debemos entender? Estas palabras evocan reinos nebu losos. Hablamos de «intelecto puro» y decimos del sabio que está «sumido en el pensamiento». Nos cuesta muy poco dejarmos seducir por la visión de Descar tes de la mente como una esfera totalmente distinta de los reinos del cuerpo y el mundo. 1 Una esfera cuya esencia no debe nada a los accidentes del cuerpo y del entorno: el famoso (en lo bueno y en lo malo) «fantasma en la máquina».2 Esta extrema oposición entre mente y materia ya hace tiempo que ha sido abandonada. En su lugar nos encontramos con una amplia coalición de cien cias de la mente cuya meta común es llegar a comprender cómo es material mente posible el pensamiento mismo. Esta coalición recibe el nombre de ciencia cognitiva y durante más de treinta años los modelos computacionales de la mente han estado entre sus instrumentos más importantes. Teorizando l. Descartes describió la mente como una sustancia inmaterial que se comunicaba con el cuerpo mediante la interfaz de la glándula pineal. Véanse, por ejemplo, Meditations II y IV en The Philosophical Works o/ Descartes, Cambridge University Press, 1991 (trad. cast.: Medita ciones metafísicas, Madrid, Alfaguara, 1997). 2. Véase Gilbert Ryle, The Concept of Mind, Hutchinson, 1949 (trad. cast.: El concepto de lo mental, Buenos Aires, Paidós, 1967).
32
1
Estar ahí
en el vértice entre la ciencia ficción y la ingeniería pura y dura, las personas que trabajan en un subcarnpo conocido corno inteligencia artificial (IA) 3 han tratado de dar un cuerpo cornputational a las ideas sobre cómo puede surgir la mente a partir del funcionamiento de una máquina física que, en nuestro caso, es el cerebro. Como dijo Aaron Sloman en una ocasión, «Todo fantas ma inteligente debe contener una rnáquina». 4 Según parece, el cerebro hu mano es el puntal mecanicista
. Se \i,isa c·n una hi'isqu<.,da l'xhaustivá que examina cerca de un millardo de movi11Jíc·1,1," ¡""il ,ks ¡" ,r sc·¡�u,,d, ,. l '.n camhio. los ex penos humanos en ajedrt'z parecen emplear me "'" L1 l>1N¡11,·,l.1 v h:1sarsc· 111,is ,·11 ,·stilus d,· r,w,namíento muy diferl'ntes: véase, por ejemplo, H. \11""" ,111,I f.: ( ;¡J,11ar1ii1. «A .si11111L1ti<>11 <>i llll'nmrv for chcss positions». Cogmúve Psychology _5 1 I '1i11. ¡ ,.1¡•, . '' 1 \<,
Prefacio 1 33
retroalimentación. Estos bucles pueden decir al ordenador si ha fracasado en el ajuste para que lo intente otra vez con una orientación ligeramente di ferente. Ésta es, si se quiere, la solución formulada mediante «pensamiento puro». La solución basada en el «pensamiento corpóreo» es bastante dife rente. Basta con armar los brazos de la máquina de montaje con articulacio nes de goma, permitiendo que cedan a lo largo de dos ejes espaciales. Una vez hecho esto, el ordenador puede prescindir de los detallados bucles de re troalimentación ya que las piezas «se mueven y deslizan hasta su lugar como si se estuvieran calculando continuamente millones de minúsculos ajustes de retroalimentación hacia un sistema rígido». 6 En esencia, todo esto significa que tratar la cognición como una pura resolución de problemas equivale a separarnos del mismísimo cuerpo y el mismísimo mundo en los que nuestros cerebros han evolucionado para guiarnos. ¿No sería más fructífero pensar en los cerebros como controladores de la actividad corpórea? Este pequeño cambio de perspectiva tiene grandes con secuencias para nuestra manera de construir una ciencia de la mente. De he cho, exige una reforma radical de nuestra manera de concebir la conducta inteligente. Nos exige abandonar la idea (común desde Descartes) de lo mental como una esfera distinta del ámbito del cuerpo; abandonar la idea de unas limpias líneas divisorias entre percepción, cognición y acción; 7 abando nar la idea de un centro ejecutivo donde el cerebro lleva a cabo el razona miento de alto nivel/ y, sobre todo, abandonar los métodos de investigación que separan artificialmente el pensamiento de la actuación corpórea. Lo que emerge es nada menos que una nueva ciencia de la mente; una ciencia que, por cierto, se basa en los frutos de tres décadas de investigación en colaboración, pero cuyos instrumentos y modelos son sorprendentemen te diferentes: una ciencia cognitiva de la mente corpórea. Este libro da testi monio de esta ciencia. Describe parte de sus orígenes, expone su sabor y hace frente a algunos de sus problemas. Seguramente no será la última cien cia nueva de la mente. Pero es un paso más en ese viaje tan fascinante de la mente en su intento de conocerse a sí misma y de comprender cuál es su lu gar en la naturaleza.
6. Este ejemplo se cita en Michie y Johnson, 1984 y se comunica en Clark, 1989. El pasa je en sí proce
Bases
Estar ahí no ha surgido de la nada. La imagen de la mente unida inex tricablemente a cuerpo, mundo y acción, ya visible en Being and Time de Martín Heidegger (1927), encuentra una clara expresión en Structure o/ Be havior, de Maurice Merleau-Ponty (1942). Algunos de los temas fundamen tales están presentes en el trabajo de los psicólogos soviéticos, especialmen te de Lev Vygotsky; otros deben mucho al trabajo de Jean Piaget sobre el papel de la acción en el desarrollo cognitivo. Entre las discusiones previas en la literatura de la ciencia cognitiva, destacan por su importancia e in fluencia Maturana y Varela, 1987, Winograd y Flores, 1986 y, especialmen te, The Embodied Mind (Varela y otros, 1991). The Embodied Mind se en cuentra directamente en las raíces de varias de las tendencias identificadas y estudiadas en esta obra. Creo que mi propio contacto con estas tendencias empezó con la obra de Hubert Dreyfus What Computers Can't Do, publicada en 1979. El persisten te acoso de Dreyfus a la inteligencia artificial clásica contribuyó a motivar mis propias exploraciones de modelos computacionales alternativos (los en foques del conexionismo o del procesamiento distribuido en paralelo; véan se Clark, 1989 y Clark, 1993) y a consolidar mi interés en imágenes biológi camente plausibles de la mente y la cognición. Di mis primeros pasos en 1987 con un breve artículo también titulado (y no por coincidencia) «Being There» [Estar ahí], donde el tema explícito de la discusión era la cognición corpórea y embebida en el entorno. Desde entonces, el conexionismo, la neurociencia y la robótica en mundo real han hecho unos grandes progresos. Y aquí, especialmente en la explosión de la investigación en la robótica y en la denominada vida artificial (véanse, por ejemplo, los artículos de Brooks y Maes, 1994), encontramos por fin el impulso más inmediato de la presente discusión. Por fin (me parece a mí) aparece una imagen más redonda, con-
36 1 Estar ahí
vincente e integradora, que reúne muchos de los elementos de las discusio nes previas en un marco de referencia rico en ilustraciones prácticas y ejem plos concretos. Esta imagen, más amplia e integradora, es la que aquí me propongo exponer y examinar. La postura que desarrollo debe mucho a varios autores y amigos. Sin duda alguna, en el primer lugar de la lista se encuentran Paul Churchland y Dan Dennett, cuyas reconstrucciones cuidadosas y al mismo tiempo imagina tivas de la mente y la cognición han sido la inspiración constante que subya ce a todo mi trabajo. Más recientemente, he aprendido mucho en mis inte racciones y conversaciones con los especialistas en robótica Rodney Brooks, Randall Beer, Tim Smithers y John Hallam. También me han informado, en tusiasmado y desafíado varios fans de la teoría de los sistemas dinámicos, en particular Tim van Gelder, Linda Smith. Esther Thelen y Michael Wheeler. Además, hay varios miembros del Sussex University Evolutionary Robotics Group que me han inspirado, enfurecido y siempre fascinado, especialmen te Dave Cliff e Inman Harvey. Un agradecimiento muy especial a Bill Bechtel, Morten Christiansen, David Chalmers, Keith Butler, Rick Grush, Tim Lane, Pete Mandik, Rob Stufflebeam y a todos mis amigos, colegas y estudiantes del programa PNP (Philosophy/Neuroscience/Psychology) de la Universidad de Washington en St. Louis. También aquí tuve la buena fortuna de conocer a Dave Hilditch, cuyos pacientes intentos de integrar las visiones de Merleau-Ponty con la ciencia cognitiva contemporánea fueron fuente de alegría e inspiración. Gra cias también a Roger Gibson, Larry May, Marilyn Friedman y Mark Rollins, así como a todos los miembros del Departamento de Filosofía de la Univer sidad de Washington por su inestimable ayuda, apoyo y crítica. David van Essen, Charlie Anderson y Tom Thach, de la Escuela Médica de la Universidad de Washington, merecen un agradecimiento especial por introducirme en el funcionamiento de la auténtica neurociencia, aunque pre cisamente aquí la expresión de mi agradecimiento no debe implicar culpa al guna por cualquier vestigio de error o malentendido. Doug North, Art Den zau, Norman Schofield y John Drobak hicieron mucho por aligerar y alentar la breve incursión en la teoría económica que aparece en el capítulo 9: gra cias también a los miembros del Hoover Institute Seminar on Collective Choice de la Universidad de Stanford. No debería olvidarme de mi gato, Lolo, que mantenía las cosas en su verdadera dimensión sentándose sobre muchas versiones del manuscrito, ni del Santa Fe Institute, que me ofreció tiempo de investigación y reacciones críticas básica en varios momentos cru ciales: gracias especialmente a David Lane, Brian Arthur, Chris Langton y Melanie Mitchell por hacer que mis diversas estancias allí fueran tan pro ductivas. Gracias tamhi<'.·n a Paul Bethge, Jerry Weinstein, Betty Stanton y al
Bases
1
37
resto del personal de T he MIT Press: vuestro apoyo, consejo y entusiasmo me han ayudado enormemente. Beth Stufflebeam me proporcionó una fan tástica ayuda durante la preparación del manuscrito. Y Josefa Toribio, mi es posa y colega, me ha ofrecido una combinación perfecta de crítica, apoyo e inspiración. Mi más sincero agradecimiento a todos.
Introducción: un automóvil con cerebro de cucaracha
¿ Dónde están las mentes artificiales prometidas por la ciencia ficción de los años cincuenta y el periodismo científico de los sesenta? ¿Por qué inclu so nuestros mejores artefactos «inteligentes» son aún tan insoportable y mortalmente tontos? Una posibilidad es que, sencillamente, hemos malin terpretado la naturaleza de la inteligencia misma. Concebíamos la mente como una especie de dispositivo de razonamiento lógico asociado a un al macén de datos explícitos: una especie de combinación entre una máquina lógica y un archí\·ador. Al adoptar esta perspectiva, desatendíamos el hecho de que las mentes han evolucionado para hacer que ocurran cosas. Desaten díamos el hecho de que la mente biológica es, antes que nada, un órgano para controlar el cuerpo biológico. Las mentes hacen movimientos y los de ben hacer con rapidez: antes
40
1
Estar ahí
coloca el almacenamiento de datos explícitos y la manipulación lógica en su lugar, es decir, como complemento secundario de la dinámica y los comple jos bucles de respuesta gue unen entre sí cerebros, cuerpos y entornos rea les. Al parecer, la cognición natural no tiene tiempo (literalmente) para ar chivadores. Naturalmente, no todo el mundo está de acuerdo. Un ejemplo extremo del punto de vista opuesto es un reciente intento de inculcar el sentido co mún a un ordenador, previa inversión de 50 millones de dólares, dándole una inmensa colección de conocimientos explícitos. Este proyecto, conoci do como CYC (abreviatura de encvdopedia), pretende construir manual mente una vasta base de conocimientos gue abarque una parte importante del conocimiento general que tiene a su disposición un ser humano adulto. Iniciado en 1984, el proyecto CYC se propuso llegar a codificar cerca de un millón de unidades de conocimiento hacia 1994. Para introducir los datos de este proyecto, una sola persona tardaría dos siglos. Se espernba gue al final de este proceso CYC daría «el gran salto»: llegaría a un punto en el que po dría leer y asimilar directamente textos escritos y, a partir de ahí, «autopro gramar» el resto de su base de conocimientos. Desde mi punto de vista, el aspecto más notable del proyecto CYC es su fe extrema en el poder de la representación simbólica explícita: su fe en la in teriorización de estructuras construidas a imagen de las cadenas de palabras de un lenguaje público. El lenguaje de representación del proyecto CYC co difica la información en unidades (ma :·cos) como la siguiente: Missouri Capital: (Jeffcrson City) Residentes: (An
Introducción: un automóvil con cerebro de cucaracha 1 41
ferencia y control simple y dentro de los límites de la tecnología actual. Los creadores de CYC, Douglas Lenat y Edward Feigenbaum (1992, pág. 192), argumentan que el embudo para la inteligencia adaptativa es el conocimien to, no la inferencia o el control. La base de conocimientos de CYC intenta hacer explícito todo lo que sa bemos de nuestro mundo pero que normalmente no nos molestamos en decir. Por tanto, CYC se propone codificar unidades de conocimiento que todos te nemos pero que rara vez enumeramos, como las siguientes (ibíd., pág. 197): La mayoría
La idea es que, después de haber codificado explícitamente una gran parte de este «conocimiento consensuado de la realidad», CYC llegará a un nivel de comprensión que le permitirá responder con una inteligencia ge nuina. Incluso se espera que CYC emplee el razonamiento analógico para abordar con buen criterio situaciones novedosas, encontrando paralelismos parciales en otras partes de su inmensa base de conocimientos. CYC es un proyecto ambicioso e importante. Sin duda, la base de datos de sentido común que ahora codifica será de gran utilidad práctica como re curso para el desarrollo de mejores sistemas expertos. Pero deberíamos dis tinguir dos objetivos posibles para CYC. Uno sería ofrecer el mejor simulacro posible del sentido común mediante un sistema informático fundamental mente no pensante. El otro sería crear, a partir del fondo de conocimientos de CYC, el primer ejemplo de una mente artificial genuina. Hasta la fecha, en el rendimiento de CYC no hay nada que indique que el segundo objetivo esté al caer. CYC parece destinado a convertirse en un «sistema experto» más grande y más elaborado, pero todavía esencialmen te frágil y falto de entendimiento. Y el hecho de añadir más y más conoci mientos a CYC no será una solución. La razón es que CYC carece de los ti pos más básicos de respuestas de adaptación al entorno. Esta deficiencia no tiene nada que ver con la relativa escasez de los conocimientos que el siste ma codifica explícitamente. Más bien es atribuible a la falta de un acopla miento fluido entre el sistema y un entorno real que plantee problemas rea les de acción y sensación. Como veremos, incluso la humilde cucaracha manifiesta este tipo de acoplamiento fluido: una versión del tipo de inteli gencia práctica, sólida y flexible de la que carecen casi todos los sistemas in form,íticos. ¡ Pero un ser tan sencillo mal puede ser acusado de contar con
42 1 Estar ahí
un gran almacén de conocimientos representados explícitamente! Por tan to , el proyecto CYC, entendido como un intento de crear una comprensión y una inteligencia genuinas en una máquina, folla por su base de una mane ra rotunda y total. Las raíces de la inteligencia y la comprensión no se en cuentran en la presencia y la manipulación de estructuras de datos explíci tas y de tipo lingüístico, sino en algo más terrenal: el ajuste de respuestas básicas a un mundo real que permite a un organismo corpóreo sentir, actuar y sobrevivir. Este diagnóstico no es nuevo. Importantes críticos filosóficos de la inte ligencia artificial han puesto en duda durante mucho tiempo el intento de in ducir la inteligencia por medio de la manipulación incorpórea de símbolos y también han insistido en la importancia del razonamiento situado (es decir, del razonamiento llevado a cabo por seres corpóreos que actúan en un en torno físico real). Pero ha sido demasiado fácil atribuir estas incertidumbres a algún tipo de misticismo residual, a una fe carente
Introducción: un automóvil con cerebro de cucaracha 1 43
¡Claro que siempre se escabulle! Como indica Ritzmann, esta malla
44
1
Estar ahí
Si me atacan, no me estrellaré directamente contra una pared. Si algo grande se interpone entre la comida y yo, intentaré rodearlo. Las brisas suaves no son peligrosas.
Como el filósofo Hubert Dreyfus (1991) y otros han señalado, el proble ma es que los cerebros verdaderos no parecen emplear estos recursos lin guaformes, parecidos a textos, para codificar respuestas hábiles ante el mundo. Y mejor que sea así, ya que como estas estrategias exigirían el almacena miento de enormes cantidades de datos explícitos y la búsqueda consiguien te, no podrían producir las rápidas respuestas que requiere la acción real. De hecho, tras una breve reflexión vemos claramente que la tarea de anotar los conocimientos «de sentido común» necesarios para capturar todo lo que sabe un adulto humano no tendría fin. ¡ Es probable que incluso para captu rar de manera detallada el conocimiento corpóreo de una cucaracha hicieran falta varios volúmenes! Pero, ¿de qué otra manera podría avanzar la inteligencia artificial? Un enfoque prometedor se basa en lo que se ha
Introducción: un automóvil con cerebro de cucaracha
1
45
1993). Los circuitos de esta red estaban limitados por los datos conocidos sobre las poblaciones y las conexiones neuronales que subyacen a la res puesta de escape de las cucarachas reales. Después de un entrenamiento, el controlador de la red neuronal fue capaz de reproducir en el cuerpo del in secto simulado todas las características fundamentales de la respuesta de es cape mencionada anteriormente. En los capítulos que siguen trataremos de comprender, en parte, cómo se logran estos éxitos. Veremos con detalle cómo se combinan los tipos de investigación acabados de esbozar con ideas evolutivas, neurocientíficas y psicológicas para poder esclarecer una amplia gama de conductas, tanto simples como complejas. Y también exploraremos la sorprendente v,iriedad de estrategias adaptativas de que disponen los agentes corpóreos y embebidos en un medio: los seres que se mueven por su mundo y actúan sobre él. Estos comentarios introductorios pretenden destacar un contraste fun damental entre la visión incorpórea, intemporal e intelectualista de la men te, y la imagen de la mente como controladora de la acción corpórea. Esta imagen de la mente como controladora nos obliga a tomarnos en serio las cuestiones del tiempo, el mundo y el cuerpo. Un dispositivo controlador debe generar con rapidez acciones apropiadas en función de la interacción en curso entre el cuerpo y su entorno cambiante. El sistema de planificación de la inteligencia artificial clásica suele ponerse cómodo y tomárselo con cal ma para, al final, producir una descripción expresada simbólicamente de un curso de acción plausible. El agente planificador corpóreo debe entrar en ac ción con rapidez, antes de que la acción de otro agente le guite la vida. Aún no está claro si las codificaciones simbólicas similares al texto tienen algún papel que desempefüir en estas decisiones de vida o muerte, pero hoy sí pa rece claro que no es un papel estelar. El camino que conduce a una comprensión computacional completa de la mente está bloqueado -parafraseando a Lenat y Feigenbaum- por un col chón. Durante muchos años, los investigadores se han desviado para ro dearlo, han tratado de ignorarlo, han hecho de todo excepto ponerse a tra bajar para quitarlo
46
1
Estar ahí
ximo movimiento en situaciones reales. Son unos órganos exquisitamente preparados para la producción de acciones que se despliegan en el esp
Primera parte DE EXCURSIÓN POR LA MENTE
Bueno, ¿y con qué crees que comprendes? ¿Con la cabeza? ¡Bah! NIKOS KAZANTZAKTS, Zorba d griego El noventa por ciento de la vida consiste, simplemente, en estar ahí. WoooY ALLEN
1
Agentes autónomos: un paseo por la luna
1.1 Bajo el volcán 1 En el verano de 1994, un robot explorador de ocho patas y 77O kg de peso lla mado Dante II descendió por una pared muy empinada hacia el fondo del cráter de un volcán activo cerca de Anchorage, Alaska. En el transcurso de una misión de seis días, Dante II exploró las paredes y el fondo del cráter empleando una mezcla de control autónomo (autodirigido) y externo. Dante II es producto de un proyecto financiado por la NASA, con base en la Universidad de Carnegie Mellan y en otros lugares, cuya meta final consiste en desarrollar robots verdade ramente autónomos con el fin de recoger y transmitir información detallada so bre las condiciones ambientales locales de otros planetas. Se espera enviar a Mar te otro robot mucho más pequeño y en gran parte autónomo en 1996, y el explorador lunar LunaCorp, que está basado en el software de Dante II, tiene una plaza reservada en el primer lanzamiento comercial a la luna, previsto para 1997. Los problemas a los que se enfrentan estos proyectos son muy instruc tivos. Los robots diseñados para explorar mundos lejanos no pueden de pender de una comunicación constante con científicos situados en la tie rra: los desfases de tiempo pronto conducirían a un desastre. Estos robots se deben programar para que busquen unas metas generales explorando y transmitiendo información. Para misiones largas deberán reabastecerse de energía. quizá explotando la energía solar. Deberán ser capaces de fun cionar ante dificultades inesperadas y resistir varias clases de daños. En resumen, deberán satisfacer muchas de las exigencias (aunque, desde lue-
l. El material acerca de Dante II se basa en un informe realizado por Peter Monaghen (Chronicle o/ Highcr Education, 1 O de agosto de 1994, págs. A6 AS).
50 1 De excursión por la mente
go, no todas) que la naturaleza ha planteado a los organismos móviles en evolución. El intento de construir robots móviles robustos conduce con sorpren dente rapidez a un replanteamiento radical de muchas de nuestras cómodas y viejas ideas sobre la naturaleza de la inteligencia adaptativa.
1.2 Desfile de robots Elmer y Elsíe Los antepasados históricos de los sofisticados robots de hoy con aspecto animal (a veces llamados «animatas») fueron un par de «tortugas» cibernéti cas construidas en 1950 por el biólogo W. Grey Walter. Estas «tortugas» -llamadas Elmer y Elsie2- empleaban unos sencillos sensores de luz y de tac to y unos circuitos electrónicos para buscar luz, aunque evitando la luz in tensa. Además, cada tortuga llevaba unos pilotos luminosos que se encen dían cuando los motores estaban en marcha. Incluso un equipo incorporado tan simple como éste condujo a unas intrigantes muestras de conducta, es pecialmente cuando Elmer y Elsie interaccionaban entre sí (al ser atraídos por la luz de los pilotos) y con el entorno local (que incluía algunas fuentes de luz por cuya proximidad competían y un espejo que condujo a un diver tido «baile» de autoseguimiento). Lo extraño es que, a ojos de un observa dor casual, sería más fácil ver vida y propósito en la conducta de estas crea ciones tan simples que en los diagnósticos incorpóreos hechos por sistemas expertos tradicionales y de campanillas como MYCIN. 3 2. Véanse, por ejemplo, W. Grey Walter, «An irnitation of life», Scientt/ú.- American, 182 ( 1959), nº 5, págs. 42-45; Steven Levy, Artt/záal Lz"(e. The Quest /ar a New Creatio!! (Pantheon, 1992), págs. 283-284. 3. El trabajo inicial en inteligencia artificial, corno el trabajo de Newell y Simnn (1972) so bre el «Solucionador general de problemas» (General Problem Solver), tendían a acentuar d razonamiento y la resolución de problemas dt: utilidad g<:neral. Sin embargo, pronto se hizo evidente que, para muchos propósitos, una base de conPcimientos detallados y ricos adaptado a un dominio de actividad especifico era un determinante crucial para el éxito. Este descubri miento condujo a una explosión de trabajos con los denominados «sistemas expertos» a los que se proporcionaban datos específicos de ciertas tareas obtenidos de expertos humanos y que, en consecuencia, eran capaces de alcanzar niveles bastante ek\"ados de compeCtcncia en dominios restringidos como el diagnóstico médico. El programa MYCIN (Shortliffe, 1976) se basaba en un conjunto de reglas y directrices explícitamente formuladas, como la siguiente re gL1 para c·xt raccioncs de sangre: «Si 1) el lugar de cultivo es sangre, 2) el organismo es gram1\c"gati\·o, , l el org,111is1110 tic·m· fnrm,1 ,le varilla y 4) el paciente es un receptor en peligro. en tone,·, h.1v i1Hlicio, ,k- lJlll" la identidad dc·I organismo sea ¡,seudomon,11 aeruginose»
Agentes autónomos: un paseo por la luna
1
51
Herbert
Uno de los precursores de las recientes investigaciones sobre los agentes autónomos es RoJney Brooks, del MIT Mobile Robot Laboratory. Los ro bots móviles (mobilc robots o «mobots») de Brooks son robots reales capa ces de funcionar en entornos reales, desordenados e imprevisibles como una oficina abarrotada. Dos características importantes de la investigación de Brooks son la utilización de micromundos horizontales y el empleo de des composiciones basadas en la actividad dentro de cada sección horizontal. El contr,1ste entre micromundos horizontales y verticales se establece en Clark, 1989 y, en términos diferentes, en Dennett, 1978b. La idea es sencilla. Un micromundo es un ámbito de estudio restringido: no podemos resolver a la vez todos los enigmas de la inteligencia. Un micromundo vertical aísla como objeto de estudio una pequeña parte de la competencia cognitiva de nivel hu mano. Como ejemplos cabe citar jugar a ajedrez, generar las formas pretéritas de verbos ingleses y planificar un picnic, todas ellas actividades que han sido objeto de anteriores programas de inteligencia artificial. El problema evidente es que cuando nosotros, los seres humanos, resolvemos estos problemas avan zados, podemos echar mano de recursos computacionales forjados por otras necesidades más básicas para las que la evolución equipó a nuestros anteceso res. Por tanto, las soluciones ingeniosas y orientadas al diseños para estos pro blemas tan recientes pueden ser muy diferentes de Lis soluciones naturales dic tadas por la necesidad de explotar la maquinaria y las soluciones ya existentes. Podemos ser maestros de ajedrez gracias a nuestra capacidad para reconocer patrones, seleccionada para que pudiéramos reconocer parejas, alimentos y depredadores. En contraste con lo anterior, un micromundo horizontal es la
(Feigenbaum, 1977, pág. 1.016). Estm sistemas demostraron ser frágiles y limitados. Degene ran rápidanwnte en una estupidez automatizada si el usuario traspasa una iina línea divisoria gramatical o J"' expresión, o si emplea términos que tienen abundantes significados del mun do real que no se reflejan explícitamente en la base de datos específica de la tarea (por ejem plo, el automóvil oxidado al que se le di,1gnosticó sammpión; \·<'.1se Lenat y feigenbaum, 1992, pág. 197). ¿Cómo se puede evitar este deslizamiento haci,1 la estupideú Una ¡x>sibilidad es que basta con «turboalim<:nar» los tipos de enfoques tradicionales antes 111encionacfos. SOAR (Laird y otros, 1987) es un intento de crear una versión más poderosa del Solucionador gene ral de problemas. CYC (véanse la introducción a este volumen, v Lenat y Feigenbau111. 1992) es un intento de cre,1r csta base de conocimientos más grande y más rica. SOAR y CYC com parten el compromiso con el empleo abundante de formas simbólicas tradicionales e inspira das en el texto para la codificación de conocimientos y metas. Pero puede que el problema fundamental resida en el enfoque tradicional mismo: que el modelo de la inteligencia como manipulación incorpórea de cadcnas de símbolos dentro dc la cabeza o del ordenador sea erróneo en sí mismo. La prl'.sente obra explora algunas de las .llternativas.
52
1
De excursión por la mente
capacidad conductual completa de un ser (verdadero o imaginario) completo pero relativamente simple. Al estudiar estos seres, simplificamos los problemas de la inteligencia de nivel humano sin perder de vista elementos biológicos bá sicos como las respuestas en tiempo real, la integración de diversas funciones motrices y sensoriales y la necesidad de hacer frente a los daños. Brooks (1991, pág. 14 3) establece cuatro requisitos para sus seres artifi ciales: Deben hacer frente de una manera adecuada y oportuna a los cambios de su entorno dinámico. Deben ser robustos en relación con su entorno... Deben poder mantener múltiples metas ... Deben hacer algo en el mundo; su existencia debe tener algún propósito. Los «seres» de Brooks se componen de varios subsistemas o «capas» productoras de actividad. Estas capas no crean ni pasan codificaciones o re codificaciones de entradas (inputs) explícitas y simbólicas. En cambio, cada capa es, en sí misma, una ruta completa que va de la entrada a la acción. La «comunicación» entre capas distintas se limita a pasar alguna señal simple. Una capa puede estimular, interrumpir o anular la actividad de otra. La or ganización resultante es lo que Brooks denomina una «arquitectura de sub sunción» (porque las capas pueden subsumir mutuamente su actividad pero no pueden comunicarse de una manera más detallada). Por tanto, un ser se podría componer de tres capas (Brooks 1991, pág. 156): Capa 1: evitar objetos mediante un anillo de sensores de sonar ultrasónico. Es tos sensores hacen que el mobot se detenga si se encuentra con un objeto directa mente frente a él y le permiten reorientarse hacia una dirección desbloqueada. Capa 2: cuando la capa de evitar objetos está inactiva, un dispositivo incorpo rado puede generar rutas aleatorias para que el mobot «deambule» sin rumbo fijo. Capa 3: esta capa puede anular la capa de deambulación y establecer una meta distante que lleve al mobot a un escenario totalmente nuevo. Una característica esencial de esta metodología es que se pueden añadir capas progresivamente y que cada incremento produce un ser completo y funcional. Obsérvese que estos seres no dependen de un depósito central de datos o de un dispositivo planificador o razonador central. En cambio, ve mos en ellos una «colección de conductas que compiten entre sí» orquesta da por las entradas del entorno. No existe una línea divisoria clara entre la percepción y la cognición, ningún punto donde las entradas perceptivas se traduzcan a un código central compartido por varios dispositivos de razona miento incorporados. Esta imagen de múltiples dispositivos especializados
Agentes autónomos: un paseo por la luna 1 53
de resolución de problemas, orquestados por entradas del entorno y por ti pos relativamente simples de señalización interna es, como argumentaré en un capítulo posterior, un modelo neurocientíficamente plausible incluso para los cerebros más avanzados. Herbert,4 construido en el MIT Mobot Lab durante los años ochenta, ex plotaba el tipo de arquitectura de subsunción acabada de describir. La mi sión de Herbert era recoger latas de refresco vacías esparcidas por el labora torio. No era una tarea trivial; el robot tenía que desenvolverse en un entorno abarrotado y cambiante, evitar tirar cosas, evitar tropezar con la gente, e identificar y recoger las latas. Nos podemos imaginar un dispositivo planifi cador clásico tratando de resolver este complejo problema real empleando abundantes datos visuales para generar un mapa interno detallado del en torno actual, distinguir las latas y planificar una ruta. Pero esta solución es a la vez costosa y frágil: el entorno puede cambiar rápidamente (como cuando entra alguien en la sala) y el procesamiento visual intensivo (por ejemplo, el reconocimiento de escenas y objetos al nivel humano) se encuentra hoy en día más allá del alcance de cualquier sistema programado. Como hemos visto, las arquitecturas de subsunción adoptan un enfoque muy diferente. La meta es conseguir la conducta compleja, robusta y en tiem po real que emerge como resultado de interacciones simples entre subsiste mas productores de conductas relativamente independientes. A su vez, estos subsistemas están controlados de una manera bastante directa por las pro piedades del entorno encontrado.' No existe un control central o un plan glo bal. En cambio, el entorno mismo orienta al ser hacia el éxito gracias a algu nas respuestas conductuales básicas. En el caso de Herbert, estas conductas simples incluían rutinas de evitación de obstáculos (detenerse, reorientarse, etc.) y de locomoción. Estas rutinas se interrumpían cuando su sencillo siste ma visual detectaba un contorno parecido al de una mesa. Cuando Herbert se encontraba al lado de una mesa, las rutinas de locomoción y evitación de obstáculos cedían el control a otros subsistemas que barrían la mesa con un láser y una cámara de vídeo. Cuando detectaba el perfil básico de una lata, el robot giraba hasta situar el objeto con aspecto de lata en el centro de su cam po de visión. En este momento las ruedas se paraban y se activaba un brazo 4. Véase información sobre Herbert en Connell, 1989.
5. Ron McClamrock (1995) comunica un caso procedente de Marr en el que un bucle de
control sale de la cabeza y se extiende al entorno local. En palabras de McClamrock (pág. 85): «Resulta que las moscas no saben del todo que, para volar, deben agitar las alas. No empren den el vuelo enviando una señal del cerebro a las alas. En cambio, existe un enlace de control directo entre las patas y las alas de modo que cuando las patas dejan de estar en contacto con una superficie, las alas de la mosca empiezan a agitarse. Para despegar, la mosca simplemente da un salto y deja que la señal procedente de las patas active las alas».
54 1 De excursión por la mente
mecánico que, equipado con unos sencillos sensores, exploraba cuidadosa mente la superficie de la mesa que tenía delante. Cuando Herbert encontra ba la forma característica de una lata se activaba la conducta de agarrar y, una vez recogida la lata, Herbert continuaba su búsqueda. Por tanto, Herbert es un «ser» sencillo que no tiene almacenado ni un plan a largo plazo ni un modelo de su entorno. Sin embargo, considerado como un animal artificial que busca latas en el nicho «alimenticio» propor cionado por el ecosistema del Mobot Lab, Herbert manifiesta una especie de inteligencia adaptativa simple donde la cooperación mutua entre sensores, circuitos incorporados y el entorno externo conduce al éxito. Attila Rodney Brooks cree que unos robots más pequeños y flexibles que el tor pe y pesado Dante serían más adecuados para las necesidades de la explora ción espacial. Attila6 pesa poco más de kilo y medio y usa múltiples «minice rebros» ( «máquinas de estado finito») especializados para controlar un conjunto de conductas locales que, unidas, hacen que se desplace con gran habilidad moviendo cada pata por separado, detectando las fuerzas ejercidas por el terreno para compensar las pendientes, etc. Attila también emplea sensores infrarrojos para detectar objetos cercanos. Es capaz de desplazarse por terrenos abruptos y hasta puede volver a ponerse de pie cuando se cae de espaldas. Según Rodney Brooks, Attila ya encarna algo parecido a la inte ligencia de un insecto. Periplaneta Computatrix Ésta es la cucaracha simulada mencionada anteriormente. Beer y Chiel (1993) describen un controlador de red neuronal para la locomoción hexá poda. Cada pata tiene un minicontrolador que explota una unidad «marca pasos»: un modelo idealizado de neurona cuya señal de salida oscila rítmica mente. Esta unidad se activa a intervalos determinados por el nivel tónico de excitación de una neurona dominante y de cualquier entrada adicional que reciba. La idea, sacada de un modelo biológico desarrollado por K. G. Pear son (1976), consiste en dar a cada pata su propio generador de patrones rít micos, teniendo en cuenta las influencias moduladoras locales asociadas a las diferentes retroalimentaciones sensoriales de cada pata, a medida que el in6. Attila, descrito en las págs. 300-301 de Arti/iáal Lz/t', de Levy, fue diseñado por Colin Angle y l{odney Krnoks. Un predecesor. Cenghis, se describe en Brooks, 1993.
Agentes autónomos: un paseo por la luna
1
55
secta avanza por un terreno desigual. La coordinación entre las patas se con sigue mediante enlaces inhibidores entre generadores de patrones adyacen tes. Cada pata tiene tres neuronas motrices: la primera controla la oscilación hacia adelante, la segunda controla la oscilación hacia atrás y la tercera hace que la pata se levante. Corno antes, el circuito de control global está total mente distribuido. No existe un procesador central que deba orquestar una respuesta teniendo en cuenta todas las entradas sensoriales. En cambio, cada pata tiene una «inteligencia» individual y los simples enlaces inhibidores ga rantizan una conducta global coherente. Aparecen diferentes maneras de an dar a partir de las interacciones entre los distintos niveles de excitación tó nica procedentes de las unidades marcapasos (los generadores de patrones) y la retroalimentación sensorial local. El robot adoptará una marcha trípeda cuando las frecuencias de excitación sean elevadas y pasará a una marcha metacrónica cuando sean más bajas. En la marcha trípeda, las patas anterior y posterior de un lado se mueven en sincronía con la pata central del otro; en la marcha metacrónica, cada pata empieza a moverse justo después de la pata que tiene detrás, en una especie de movimiento ondulatorio. Aunque diseñado y puesto a prueba como una pura simulación por or denador, este circuito de locomoción se ha utilizado en el cuerpo de un ro bot real y ha demostrado su robustez en el mundo real de los rozamientos, la inercia, el ruido, los retrasos, etc. En la figura I .1 se muestra el primer robot hexápodo, que se analiza con más detalle en Beer y Chie!, 1993, y en Quinn y Espenschied, 1993. El circuito de locomoción empleado también es capaz (al estar tan distribuido) de conservar la mayor parte de su funcionalidad cuando se dañan neuronas o conexiones individuales (Beer y otros, 1992). A pesar de la complejidad de la conducta que produce, el circuito de locomo ción en sí es bastante modesto: sólo consta de 37 «neuronas» estratégica mente situadas e interconectadas. Sin embargo, los vídeos del robot hexá podo y de sus sucesores constituyen un espectáculo fascinante. En una secuencia aparece un robot posterior, algo más complejo (figura 1.2), avan zando cautelosamente por un terreno desigual formado por trozos de po liestireno expandido. Una pata se alza y empieza a descender suavemente. Como no «hace pie» (a causa del terreno local), se levanta otra vez y vuelve a posarse en un punto ligeramente diferente. Al final, cuando encuentra un punto de apoyo adecuado, el robot prosigue su marcha. Esta conducta ex ploratoria y tanteadora tiene todo el sabor de la inteligencia biológica real. Robot braquiador
La braquiación (figura 1.3) es el movimiento pendular que emplean al gunos primates superiores para desplazarse de rama en rmna por zonas den-
56
1
De excursión por la mente
FIGURA 1.1 El primer robot hexápodo, construido por Ken Espenschied en la Case Western Reserve University bajo la supervisión de Roger Quinn. Fuente: Quinn y Espenschied, 1993. Reproducido con la autorización de K. Espenschied, R. Quinn y Academic Press.
FIGURA 1.2 El segundo robot hexápodo, construido por Ken Espenschied en la Case Western Reserve University bajo la supervisión de Roger Quinn. Fotografía ce dida gentilmente por Randall Beer.
Agentes autónomos: un paseo por la luna
1
57
FIGURA 1.3 Braquiación de un gibón. Fuente: Saito y Fukuda, 1994. Reproducido con la autorización de F Saito, T. Fukuda y MIT Press.
samente arboladas. Saito y Fukuda (1994) describen un dispositivo robótica que aprende a braquiar empleando un controlador de red neuronal. Esta ta rea es especialmente interesante puesto que incorpora una dimensión de aprendizaje y aborda una conducta para la que el tiempo tiene una impor tancia fundamental. Este robot utiliza un tipo de aprendizaje basado en redes neuronales denominado Q-aprendizaje conexionista (connectionist Q-learning). 7 El Q aprendizaje implica intentar aprender el valor de distintas acciones en situa ciones diferentes. Un sistema de Q-aprendizaje debe tener un conjunto deli mitado de acciones y situaciones posibles y se le debe dar una señal de recompensa para comunicarle el valor (positivo) de una acción elegida en la situación que se le plantea. El objetivo consiste en aprender un conjunto de emparejamientos situación-acción que maximicen el éxito en relación con una señal de recompensa. Saito y Fukuda demuestran que estas técnicas per miten que una red neuronal artificial aprenda a controlar un robot braquia dar real de dos brazos (figura 1.4). Un robot braquiador totalmente entre nado puede balancearse con éxito de una «rama» a otra y, si no encuentra asidero, puede aprovechar el impulso inicial para balancearse hacia atrás y volverlo a intentar.
7. Véase información sobre el conexionismo en el capítulo 4 Je este mismo libro. El Q aprendizaje es una forma Je aprendizaje por refuerzo (véanse Kaelbling, 1993 y Sutton, 1991) desarrollado por Watkins (1989). I:l empleo de redes neuronales en escenarios Je Q-apren
58 1 De excursión por la mente
FIGURA 1.4 Robot braquiador de dos brazos. Fuente: Saito y Fukuda, 1994. Repro ducido con la autorización de F. Saito, T. Fukuda y MIT Press.
COG Seguramente, _COG (Brooks, 1994; Brooks y Stein, 1993) es el más am bicioso de todos los proyectos de la «nueva robótica» emprendidos hasta ahora. Este proyecto, encabezado por Rodney Brooks, se propone crear un robot humanoide con un funcionamiento extremadamente complejo. Este ro bot, del tamaño de una persona (figura 1.5) no tiene capacidad de ambula ción; sin embargo puede mover las manos, los brazos, la cabeza y los ojos.
Agentes autónomos: un paseo por la luna 1 59
FIGURA 1.5 Tres vistas del robot COG. Fotografías cedidas por Rodney Brooks.
60
1
De excursión por la mente
Aunque su base está firmemente sujeta a un tablero, puede girar a la altu ra de las caderas. Esta libertad de movimientos se obtiene a partir de 24 motores separados, dotados cada uno de un procesador exclusivamente dedicado a supervisar su funcionamiento (de acuerdo con el «espíritu» general
Agentes autónomos: un paseo por la luna
1
61
1.3 Mentes sin modelos La revolución de la «nueva robótica» rechaza una parte fundamental de la imagen clásica de la mente. Rechaza la imagen de un planificador central que tenga conocimiento exclusivo de toda la información disponible en cual quier parte del sistema y que se dedique a descubrir posibles secuencias con ductuales que satisfagan unas metas concretas. El problema del planificador central es que, en esencia, es muy poco práctico. Introduce lo que Rodney Brooks denominó acertadamente un «embotellamiento representacional» que bloquea cualquier respuesta rá1--jida en tiempo real. La razón es que la in formación sensorial entrante debe ser traducida a un código simbólico único para que el mencionado planificador pueda encargarse de ella. Y la salida que produzca el planificador también se deberá traducir desde su propio código interno a los diversos formatos necesarios para controlar varios tipos de res puesta motriz. Estas fases de traducción consumen mucho tiempo y energía. Critters artificiales como Herbert y Attila destacan por su falta de plani ficación central. En su lugar, la arquitectura de subsunción sitúa múltiples dispositivos cuasi independientes, cada uno de los cuales constituye una vía autosuficiente que enlaza la entrada sensorial con la acción. En consecuen cia, las conductas de estos sistemas no están mediatizadas por ninguna base integrada de conocimientos que represente el estado actual del entorno glo bal. A estas bases de conocimientos se les suele llamar «modelos detallados de] mundo» y un tema recurrente de los nuevos enfoques es que logran al canzar un éxito adaptativo sin emplear estos modelos. Sin embargo, sería fácil exagerar est,1 diferencia. Uno de los mayores pe ligros que acechan a toda propuesta revolucionaria en la ciencia es que se puede descartar una parte demasiado grande de la «visión antigua»: es decir, se puede tirar mucha fruta fresca junto con la pocha. Este mismo peligro existe, creo yo, en el rechazo de la nueva robótica frente a las representacio nes, los modelos y los mapas internos. Si sólo se interpreta como un aviso para prestar atención a los costes de los modelos centralizados, integrados y simbólicos, la crítica es oportuna e importante. Pero si se interpreta como un rechazo sistemático a las economías internas cuyas complejidades incluyen múltiples representaciones centradas en la acción y múltiples modelos par ciales del mundo, esto sería un error al menos por dos razones. En primer lugar es indudable que, en ocasiones, el cerebro humano inte gra múltiples fuentes de información. El área que rige los movimientos sacá dicos (los movimientos rápidos de la fóvea de alta resolución hacia un nuevo objetivo) es capaz de responder a múltiples entradas sensoriales: podemos realizar un movimiento sacádico hacia el lugar donde hemos detectado un movimiento periférico, hacia el origen de un sonido o para examinar un ob-
62 1 De excursión por la mente
jeto detectado solo por el tacto. Además, con frecuencia combinamos mo dalidades utilizando el tacto, la vista y el sonido en complejos bucles inter dependientes donde la información recibida en cada modalidad ayuda a sin tonizar y eliminar la ambigüedad del resto ( como cuando nos encontramos con un objeto familiar en un rincón oscuro del armario). En segundo lugar, la presencia de modelos internos que intervienen en tre la entrada y la salida no siempre constituye un embudo costoso en cuan to a tiempo. La emulación motriz ofrece un ejemplo claro y convincente. Consideremos la tarea de alcanzar una taza. Una «solución» para estos pro blemas es el alcance ha!ístZco. Como indica su nombre, esta manera de asir depende de una trayectoria prefijada y no corrige errores a lo largo de la mis ma. Una manera de asir más hábil se basa en la retroalimentación sensorial para realizar correcciones sutiles y guiar el asimiento sobre la marcha. Una fuente de esta retroalimentación es la propioccpción, el sentido interno que nos dice cómo se sitúa nuestro cuerpo (en este caso, el brazo) en el espacio. Pero las señales propioceptivas deben hacer el viaje de \'uelta desde las peri ferias corporales hasta el cerebro y esto requiere tiempo; de hecho, requiere demasiado tiempo para que las se11ales se puedan emplear en la generación de movimientos fluidos de asimiento. Para resolver este problema, el cere bro puede emplear un truco (muy empleado en los sistemas industriales de controll denominado c'1nulación motriz. Un emulador es un circuito incor porado que duplica ciertos aspectos de la dinámica temporal del sistema más amplio. Toma como entrada una cr';1ia de una orden motriz y produce corno salida una se11al cuya forma es idéntica a la de una se11al que vuelva de las pe riferias sensoriales. Es decir, predice cómo debe ser la retroalimen ración propioceptiva. Si el dispositivo es fiable, se pueden utilizar estas prediccio nes en lugar de las señales sensoriales reales para generar una actividad de corrección de errores más rápida. Estos emuladores son el terna de numero sos tratamientos teóricos detallados ( por ejemplo, Kawato y otros, 1987; Dean y otros, 1994) que muestran que el aprendizaje de redes neuronales simples puede producir emuladores fiables y en los que se especula sobre la manera de desarrollar estos emuladores en circuitos neuronales reales. Estos emuladores motrices no son embudos que obstaculicen el éxito en tiempo real. Al contrario, facilitan el éxito en tiempo real al ofrecer un tipo de «retroalimentación virtual» que supera la retroalimentación procedente de las periferias sensoriales reales, proporcionándonos una especie de «hi peragudeza» motriz que nos permite generar unas trayectorias de asimiento más fluidas y precisas de lo que sería posible, dadas las distancias y la velo cidad de conducción que gohiernan el regreso de las sefiales sensoriales des de las periferias corporales. Pero también es indudable que un emulador es 1111;1 l'Spccic (k llH)(klo interno. ( :011sturir modelos dl' aspectos tkstacados
Agentes autónomos: un paseo por la luna 1 63
64 1 De excursión por la mente
La noción de sensación dependiente del nicho no es nueva. En 1934,Ja kob Von Uexkull publicó una maravillosa monografía cuyo título se traduce por Un paseo por los mundos de ani1J2
Así pues, para Von Uexkull, cada especie animal habita en un entorno efectivo distinto . Este entorno efectivo está definido por los parámetros que tienen importancia para un animal y su estilo de vida concreto, y el entorno general es el mundo físico en todo su esplendor y complejidad. La monografía de Von Uexkull está repleta de imágenes maravillosas del aspecto que podría tener el mundo si se viera a través del cristal de la sensa ción dependiente del Umwclt (figuras 1.6 a 1.8). Aunque las ilustraciones son muy caprichosas, sus ideas son profundas e importantes. La cognición biológica es muy selectiva y puede sensibilizar a un organismo a cualquier parámetro (con frecuencia simples) que especifique con fiabilidad las condi-
Agentes autónomos: un paseo por la luna 1 65
ciernes que conciernen a esa forma de vida concreta. La similitud entre los mundos operacionales de Herbert y de la garrapata es sorprendente: ambos se basan en señales simples que son específicas de sus necesidades y ambos salen ganando al no molestarse en representar otros tipos de detalles. Una extensión natural de esta idea, y que da bastante que pensar, es preguntarse si el ser humano también percibe el mundo de una manera sesgada y res tringida. Nuestro tercer mensaje afirma que así es, y de una forma mucho más espectacular de lo que pueda sugerir la experiencia cotidiana. 1.5 ¿Sensibilidad para los detalles? Sin duda, muchos lectores estarán de acuerdo en que incluso la avanza da percepción humana está sesgada hacia los aspectos del mundo que tienen importancia para los intereses y las necesidades del hombre. Según el último y más especulativo mensaje de nuestra breve lista, este sesgo es mucho más fuerte de lo que hayamos podido imaginar. Concretamente sugiere que nues tras experiencias cotidianas de percepción nos pueden inducir a error indi cando la presencia de unos modelos del mundo más duraderos y detallados que los que nuestros cerebros construyen en realidad. Esta idea, en cierto modo paradójica. exige una cuidadosa introducción. 8 Consideremos el acto de correr para atrapar una bola. Se trata de una habilidad que exhiben rutinariamente los jugadores de críquet y de béis bol. ¿Cómo se lleva a cabo? La experiencia común sugiere que vemos la pelota en movimiento, prevemos la continuación de su trayectoria y co rremos para estar en la posición adecuada para interceptarla. En cierto sentido esto es correcto. Pero la experiencia (la «fenomenología») puede ser engañosa si creemos que computarnos activamente estas trayectorias. Investigaciones recientes 9 indican que una estrategia más eficiente en cuan to a computación consiste, simplemente, en correr de manera que la acele ración de la tangente de elevación de la mirada del jugador hacia la bola se mantenga a cero. Si hacemos esto, siempre interceptaremos la bola antes de que llegue al suelo. La observación de secuencias grabadas en vídeo de in terceptaciones reales indican que, en efecto, los seres humanos utilizan -inconscientemente- esta estrategia. Una estrategia como ésta evita mu chos costes de computación porque aísla los parámetros mínimos y más fá8. Esto se expone con precisión en Churchland y otros, 1994 y está presente en gran par te de Dennett, 1991. 9. Estas investigaciones fueron llevadas a cabo por Zolten Díenes en la Universidad de Sussl'x (comunicación persona]).
66 1 De excursión por la mente
---- ---� -· ----==- --
·.,
,
(' L��:.-... .. ........... .
·-. .
. ....
.
.-:,• .. _·,
,_',j°!' : �.
.. .
..
'.\
.,
Flc;r lfü\ 1.6 Entorno y Umzcclt de una vieira. Ilustración basada en la figura 19 de Von Uexkull, l 934; adaptada por Christine Clark, con autorización de International Universities Press.
Agentes autónomos: un paseo por la luna
1
67
fl(;(JRi\ 1.7 Umu,-elt Je un astrónomo. Ilustración basada en la figura 21 Je Von Ucxku!L 1934; aJaptada por C:hristine C:lark, con autorización de lnternational Uni \Trsitics Prcss.
cilrnente perceptibles que pueden apoyar la acción específica de la inter ceptación. Siguiendo una línea similar, un importante corpus de investigaciones co nocido como visión cmirnada /Ballard, 1991; véase también P S. Churchland y otros, 1994) indica que la resolución cotidiana de problemas guiada por la visión puede explotar una gran cantidad de estas estratagemas y rutinas es pecializadas. En vez de considerar la visión como la transformación de unas sefiales luminosas entrantes en un modelo detallado de un mundo externo tridimensional, la investigación de la visión animada estudia cómo se pueden apoyar respuestas adaptativas rápidas y fluidas mediante rutinas que requie ran menos intensidad computacional: rutinas que entrelacen la sensación con la acción y con el movimiento en el mundo. Como ejemplos podemos ci tar el uso de movimientos sacádicos rápidos y repetidos para inspeccionar
68
1
De excursión por la mente
FIGURA 1.8 Entorno y Umwelt de una abeja. Ilustración basada en la figura 53 de Von Uexkull, 1934; adaptada por Christine Clark, con autorización de International Universitics Press.
Agentes autónomos: un paseo por la luna 1 69
una escena visual y extraer información detallada únicamente en posiciones foveales seleccionadas, y la explotación de señales más burdas (como el co lor) que se pueden detectar en las periferias de baja resolución. El caso de la exploración visual rápida es especialmente instructivo. Los ojos humanos utilizan una pequeña área (menos del 0,01 % del campo visual total) de resolución muy elevada. Los movimientos sacádicos desplazan esta ventana de alta resolución
70 1 De excursión por la mente
no tenemos la sensación ele palpar un objeto con agujeros que correspon derían a los espacios que hay entre los dcdos? La razón es, en cierto senti do. obvia. Utilizamos el tacto para cxplrm1r superficies y estamos acostum brados a desplazar las yemas de los dedos para encontrar miÍs superficie, sobre todo cuando sabernos que lo que sostenemos es una botella. No tra tamos los espacios entre las entradas sensoriales como si fueran espacios en el mundo, porque est,lmos acostumbrados a utilizar los sentidos como ins trumentos exploratorios que pasan de un punto a otro. Tras reflexionar so bre este caso. un investigador propuso que lo que con frecuencia pensamos que es el acto sensorial pasivo de «sentir b botella». se entiende mejor si se concibe como un ciclo basado en la acción donde unas percepciones frag nwnta rias provocan nuc\·as exploraciones, \' que este ciclo de .icción es la base de la experiencia de percibir una botella completa. 12 Este punto de vis ta radical, donde el tacto se formula como un instrumento ex ploratnrio que se lanza de acá para allá para explorar una y otra vez el entorno local, se ex tiende de una manera completamente n,itural a la visión y a la percepción en gencral. La sospecha ele que la visión no es to
'
12. «El "pcrcl'pto'' ele- la hot<"lla es una o,cio11· concretanwnte. la l'xploración \'Ísual ,, mental de la b()tella. So es una simple sensaci<Ín pasi,·,1 ljlll' "btl'ncrnos de la H'tina o algún d<: riva,!(1 ic,rnico de la información que ha\· en ella» (( J'Rcgan, 1992, pág . ..¡72). l l. Véanse ,\lcC:onkie 1· lt1vner, 19,6; i\!c<:,rnkic>. 19,9; i\lcConki<:, 1990; O'Rcgan, 199() , R,11·11cr I otros, l 9cs0
Agentes autónomos: un paseo por la luna
1
71
sorprendente una investigación relacionada con la anterior, en la que se le pide a un sujeto que lea un texto presentado en una pantalla de ordenador. El texto en cuestión nunca está totalmente presente en la pantalla al mismo tiempo y se limita a una zona que abarca (para sujetos típicos) 17 o 18 ca racteres. Este texto está rodeado por caracteres aleatorios que no forman p,1labras verdaderas . Pero (y aquí está el truco) la ventana de texto real se des plaza a lo largo de la pantalla de izquierda a derecha acompañando la mirada del sujeto. El texto no es repetitivo porque el programa que se ejecuta en el ordenador garantiza que el texto adecuado vaya apareciendo sistemática mente en lugar del texto aleatorio (aunque, como se trata de una ventana m{Jvi!, van apareciendo nuevos caracteres aleatorios donde antes había tex to real). Cuando este sistema est,Í bien calibrado para un sujeto concreto, ;éste no se da cuenta de la presencia de los caracteres extraños! Además, la impresión subjetiva es, con toda claridad, la de encontrarse frente a una pá gina llena de texto verdadero que abarca toda la periferia visual, de izquier da a derecha. En estos casos por lo menos podemos decir con seguridad que la naturaleza experimentada de la escena visual es una especie de ilusión subjetiva provocada por el empleo de una exploración rápida y una ventana pequeña de resolución y atención. 1.6 El robot refinado Hubo un tiempo en que el Mobile Robot Laboratory de Rodney Brooks tenía un lema: «Rápido, barato y fuera de control». Éste es, de hecho, el mensaje inmediato de la visión de la nueva robótica. Sin una planificación central o incluso sin el empleo de un código simbólico central, estos sistemas artificiales navegan de una manera fluida y robusta por el mundo real. Y lo hacen gracias a unos acoplamientos cuidadosamente orquestados entre unos dispositivos incorporados relativamente independientes y unos aspectos se leccionados del entorno (el Umwe!t del robot, por así decir). A pesar de las apariencias, ahora parece imaginable que gran parte de la inteligencia hu mana se base en estrategias y ardides similares específicos del entorno, y que también nosotros podamos carecer de un modelo del mundo central e inte grado al estilo tradicional. Por tanto, en la medida en que nos tomemos en serio los mensajes generales de la nueva robótica, nos enfrentaremos a dos problemas inmediatos y acuciantes. El primero es un problema de descubrimiento. Si evitamos la imagen fá cil del planificador central que cavila sobre estructuras de datos similares a textos, y si no nos fiamos de nuestras intuiciones sobre Li información que extraemos de los Jatos sensoriales, ¿qué debemos hacer? ¿Cómo podemos
72 1 De excursión por la mente
siquiera formular hipótesis acerca del posible funcionamiento y la estructu ra de estas mentes fragmentarias y que desafían nuestra intuición? Brooks y otros confían en desarrollar un nuevo conjunto de intuiciones basadas en la atención a conductas específicas y organizadas en torno a la idea general de una arquitectura de subsunción. Sin embargo, cuando tratemos de abordar casos cada vez más complejos, es dudoso que este enfoque «artesanal» pue da triunfar. En capítulos posteriores investigaremos algunas maneras de avanzar que parecen estar menos sujetas a las intuiciones humanas: trabajar con datos neurocientíficos y evolutivos reales, procurar que los sistemas ro bóticas aprendan por su cuenta e incluso intentar imitar el cambio genético para hacer evolucionar generaciones de robots cada vez más refinados. ¡Ob servemos la naturaleza y dejemos que la naturaleza simulada siga su curso! El segundo problema es de coherencia. Tanto el poder como el misterio de la investigación de la nueva robótica residen en el empleo de múltiples subsistemas cuasi independientes de los que, en condiciones ecológicas nor males, emerge con delicadeza una conducta orientada a metas. El poder es triba en la capacidad de respuesta robusta y en tiempo real de estos sistemas. El misterio es cómo mantener unas pautas de conducta coherentes cuando los sistemas se hacen más y más complejos y se les exige que muestren una variedad de conductas cada vez más amplia. Naturalmente, una respuesta a este problema es renunciar a la imagen básica e insistir en que las conductas complejas y avanzadas deben basarse en algo parecido a un sistema planifi cador simbólico central. Sin emb:1rgo, no deberíamos rendirnos antes de tiempo. En los capítulos que siguen, sacaremos a la luz una cantidad sor prendente de estrategias y ardides adicionales que pueden inducir una co herencia global. La mayoría de estas estrategias suponen el empleo de algún tipo de estructura externa o «ancbmiaje» para moldear y orquestar la con ducta. Entre los candidatos más evidentes se encuentran el entorno físico inmediato (recordemos a Herbert) y nuestra capacidad para reestructurar activamente ese entorno con el fin de apoyar y extender mejor nuestras ca pacidades naturales para la resolución de problemas. Estas estrategias son especialmente manifiestas en el desarrollo infantil. Entre otros factores menos evidentes pero que tienen una importancia crucial, se encuentran la presen cia restrictiva del lenguaje, la cultura y las instituciones públicas, la economía interna de las respuestas emocionales y diversos fenómenos relacionados con la inteligencia grupal o colectiva. En particular, el lenguaje y la cultura apa recen como unas especies avanzadas de andamiaje externo, «diseñadas» para extraer la máxima coherencia y utilidad de unas mentes fundamentalmente cortas de vista, especializadas e internamente fragmentadas. Por tanto, des de sus inicios en la simple robótica, nuestro viaje llegará a tocar -y en oca siones a poner en entredicho- algunos de los elementos más arraigados de la
Agentes autónomos: un paseo por la luna 1 73
imagen intelectual que tenemos de nosotros mismos. El «deliberador racio nal» resulta ser un «respondedor adaptativo» bien camuflado. Cerebro. cuerpo, mundo y artefacto están estrechamente vinculados entre sí, forman do la más compleja de las conspiraciones. Y mente y acción se manifiestan en un íntimo abrazo.
2
El niño situado
2.1 Yo, robot Robots que recogen latas Je refrescos, exploradores lunares, cucarachas: si todo esto nos suena extraño, pensémoslo mejor. La incipiente perspectiva sobre la cognición corpórea también nos puede ofrecer la mejor esperanza hasta el momento de comprender las características fundamentales Jel pen samiento y el desarrollo humanos. Un campo especialmente prometedor es el estudio de la infancia. La imagen que tiene la nueva robótica de «pensar con los pies» encuentra un complemento natural en nuestra comprensión creciente del desarrollo del pensamiento y la acción en los niños, porque el especialista en robótica y un número cada vez mayor de psicólogos del desa rrollo coinciden en destacar la delicada interacción entre cerebro, cuerpo y entorno local para determinar el éxito cognitivo inicial. De hecho (y para ser históricamente justos), es probable que los psicólo gos del desarrollo fueran de los primeros en destacar la verdadera relación entre los factores internos y externos para determinar el cambio y el éxito cognitivo. En este sentido, teóricos como Jean Piaget, James Gibson, Lev Vygotsky y J erome Bruner, aunque partiendo de enfoques muy diferentes, previeron muchas de las ideas de cariz más radical a las que ahora se dedica la robótica situada. 1 Con todo, continúan existiendo abundantes posibilida des para un mutuo esclarecimiento, pues cada uno de los dos campos dispo ne Je un conjunto distinto de instrumentos conceptuales y experimentales y de corpus de datos diferentes. Por tanto, la alianza intelectual entre la psico logía del desarrollo y las otras ciencias de la mente corpórea puede acabar l. Véanse, por ejemplo, Piaget, 1952, 1976; Cibson, 1979; Bruner, 1 %8; Vygotsky, 1986.
76 1 De excursión por la mente
siendo una de las empresas interdisciplinarias más apasionantes de la próxi ma década. En este capítulo se exploran cinco hitos de fundamental importancia que se encuentran a lo largo de esta frontera interdisciplinaria: la idea de bucles de ac ción que entrecruzan el organismo y su entorno (apartado 2.2); una visión muy interactiva del proceso de desarrollo según la cual mente, cuerpo y mundo ac túan en pie de igualdad (apartado 2.3 ); una imagen de la cognición biológica en la que emergen soluciones a problemas sin un control ejecutivo central (apar tado 2.4); el reconocimiento del papel fundamental desempeñado por apoyos y estructuras externas para posibilitar el éxito adaptativo y proporcionar la en voltura para el aprendizaje individual (apartado 2.5); y un escepticismo cre ciente, enraizado en todas las consideraciones anteriores, acerca del verdadero valor de las divisiones intuitivas entre percepción, acción y cognición ( apartado 2.6). La conclusión a la que se llega es que el desarrollo cognitivo no se puede tratar con eficacia aislándolo del hecho de que el niño está embebido en el mundo e interacciona con él. En una imagen más adecuada de la cognición in fantil (y, de hecho, de toda cognición), percepción, acción y pensamiento se vin culan entre sí en una variedad de formas complejas e interpenetradas. 2.2 Bucles de acción Consideremos un puzzle. Una manera (improbable) de tratar de resolverlo consiste en mirar muy fijamente una pieza y tratar de determinar, sólo con la ra zón, si encaja en una posición determinada. Sin embargo, en la práctica real em pleamos una estrategia mixta en la que hacemos una determinación mental aproximada y luego probamos físicamente si la pieza encaja o no. En general, no nos representamos la forma detallada de una pieza lo suficientemente bien como para saber con certeza si encajará antes de realizar esta manipulación fí sica. Además, podernos hacer girar físicamente las piezas candidatas antes de probar si encajan para simplificar la tarea más «mental» de evaluar aproxima damente su ajuste potencial (recordemos el empleo por parte de Herbert de un procedimiento similar, girando sobre sí mismo para fijar una lata en una posi ción central canónica de su campo visuall. Por tanto, acabar un puzzle supone una danza intrincada y repetida donde el «pensamiento puro» conduce a ac ciones que, a su vez, cambian o simplifican los problemas a los que se enfrenta este pensamiento. Probablemente, éste es uno de los ejemplos más sencillos de los fenómenos conocidos como bucles de acción. 2 2. Véanse exposiciones de fc,n<Ímcnos de bucles Je acci<Ín en Cole y otros, 1978; Rut kowsb, 19,,6, l99,;ThclcnvS111i1h, 1'!94.
El 11ino situado 1
77
Recientes investigaciones sobre el desarrollo realizadas por Esther The len y Linda Smith, indican que estas interacciones entre pensamiento y ac ción puede ser tan omnipresentes y fundamentales, que estas investigado ras sospechan que todo nuestro conocimiento inicial se construye «mediante interacciones trabadas en el tiempo entre percepción y acción en contextos particulares» (Thelen y Smith, 1994, pág. 217). Para ver lo que esto significa, consideremos la conducta de los niños pequeños ante precipicios visuales (un precipicio visual es una caída vertical cubierta con una superficie fuerte, rígida y transparente de plexiglás u otro material si milar). Se ha demostrado que los nÍl1os que aún no pueden gatear son ca paces de distinguir los lados poco profundos del precipicio de la zona que se encuentra más allá de la caída. Muestran una atención y un interés cre cientes y, sorprendentemente, lloran menos cuando se encuentran encima del precipicio que cuando están sobre los lados menos profundos. Los ni ños de más edad y con mayor movilidad responden al precipicio con res puestas asociadas al miedo (Campos y otros, 1978). 3 Claramente, los dos grupos de niños pueden percibir la información visual que especifica la profundidad. La diferencia crucial parece residir en cómo se emplea esta información, es decir, en cómo interviene en la interacción entre percep ción y acción. Un trabajo reciente sobre las respuestas de los niños a las pendientes nos ofrece más información sobre esta interacción. En esta investigación, se co locaron niños pequeños con diferentes tipos de movilidad (niños que gatea ban y niños que caminaban) sobre pendientes con distintos grados de incli nación. Los que caminaban (14 meses) recelaban de las pendientes con 20º o más de inclinación y, o bien se negaban a descender, o bien bajaban desli zándose. Los niños que gateaban abordaban con intrepidez inclinaciones de 20º o más y, normalmente, acababan cayendo (aunque siempre se les cogía a tiempo). Sin embargo, tras un examen detallado apareció una pauta fascinante. A medida que los niños que gateaban iban aumentado su experiencia, apren dían a evitar las pendientes más inclinadas. Pero en el momento de transi ción en el que los niños empezaban a caminar, este conocimiento obtenido con tanto esfuerzo parecía desaparecer. Los niños que empezaban a caminar tuvieron que aprender sobre las pendientes desde el principio. En una prue ba, dos terceras partes de estos niños «se lanzaban sin vacilación por todas las pendientes, igual que hicieron al encontrarse con ellas por primera vez, cuando sólo gateaban» (Thelen y Smith, 1994, pág. 220). 4 3. Véase también Rutkowska, 1993, pág. 60. 4. El trabajo comunicado fue llevado a cabo por Adolph y otros (1993 ).
78 1 De excursión por la mente
Estas pruebas no sólo sugieren que los niños aprenden sobre el mundo realizando acciones, sino también que el conocimiento mismo que adquieren suele ser específico de la acción. Los niños pequeños no emplean su expe riencia de gatear para adquirir conocimientos sobre las pendientes en gene ral. En cambio, adquieren conocimientos sobre el papel de las pendientes en contextos específicos que implican una acción. Otros resultados relaciona dos con la especificidad del conocimiento de los niños pequeños apuntan en la misma dirección general.' Este fenómeno no se limita a la infancia. Investigaciones recientes sobre los mecanismos de compensación perceptiva de los adultos revelan un perfil espe cífico de la acción de carácter similar. Thach y otros ( 1992) presentan un ejem plo centrado en la adaptación perceptiva en condiciones inusuales." Thach y sus colegas estudiaron la adaptación humana a unas lentes especiales que despla zaban la imagen hacia la derecha o la izquierda. Es bien sabido que el sistema de percepción humano puede aprender a adaptarse a esta clase de distorsiones. De hecho, varios experimentos demuestran que los sujetos pueden adaptarse incluso a lentes que invierten por completo la escena visual haciendo que el mundo se vea cabeza abajo. Después de llevar estas lentes de inversión unos cuantos días, los sujetos comunican unos cambios súbitos donde los aspectos del mundo se reorientan correctamente. Naturalmente, cuando se ha produci do esta adaptación, los sujetos dependen de las lentes: si se las quitan, el mun do vuelve a aparecer invertido hasta que se produce una nueva adaptación. Lo que mostró el grupo de Thach es que, en el caso de las lentes de des plazamiento lateral, la adaptación parece ser específica de ciertos bucles mo tores. Se pidió a los sujetos que lanzaran dardos a una diana. Al principio fa llaban como resultado del desplazamiento lateral producido por las lentes. Sin embargo, con el tiempo se produjo una adaptación y fueron capaces de apuntar tan bien como antes (a diferencia de lo que ocurría en los experi mentos con lentes de inversión, esta adaptación no tuvo ninguna conse cuencia en la experiencia: los sujetos no comunicaron ningún «rebote» de la imagen visual consciente). Pero, en la mayoría de los casos, esta adaptación era específica del bucle motor. Al pedírseles que lanzaran los dardos sin le vantar el brazo por encima del hombro -en vez de tirarlos por encima de la cabe?a- o que emplearan su brazo no dominante, los sujetos no mostraron una mejora comparable. La adaptación para los lanzamientos por alto y con el brazo dominante no se extendieron en absoluto a los otros casos. Lo que parece haber ocurrido es un adaptación restringida a la combinación especí fica del ángulo de visión y el ángulo de tiro empleados en un lanzamiento 5. Véanse Shiel
El niño situado 1 79
normal. Lo que no se produjo fue una adaptación perceptiva general que ofreciera «datos de entrada corregidos» para qm: fueran utiiízadus por cu,il c¡uicr subsistema cognitivo o motor. Thach y otros han relacionado sus resultados con algunas hipótesis muy específicas y fascinantes sobrc el papel de una estructura nerviosa concreta -el cerebelo- en el aprendizaje de respuestas pautadas a estímulos encontra dos con frecuencia. Estas conjeturas encajan bien con la imagen que nos va mos forjando, puesto que indican que la antigua imagen que consideraba al cerebelo puramente implicado en tareas motrices es errónea y que las fun ciones motrices y .llgunas funciones cognitivas «superiores» pueden estar ín timamente relacionadas en el cerebro. Por ahora, sin embargo, sólo es nece sario destacar que puede hacer falta algún replanteamiento de la imagen «pasiva» de nuestro contacto perceptivo con el mundo. Al parecer, en mu chos casos la percepción no se debería contemplar corno un proceso en el que se recopilan pasivamente datos del entorno. En cambio, la percepción puede estar orientada desde el principio hacia rutinas de acción específicas.' Así pues. el reto estriba en desarrollar «una estructura teórica que sea, por así decir, más "motorcéntrica" que ''visuocéntrica"» (P. S. Churchland y otros, 1994, pág. 60). Los estudios detallados de microdesarrollos, como el trabajo sobre el modo de superar pendientes, parecen ofrecer una prometedora base experimental sobre la que fundamentar una reorientación tan radical. 2.3 Desarrollo sin diseños Aquí entenderemos por diseño un plan o una especificación muy deta llados de -por ejemplo- un automóvil o un edificio. Las explicaciones más sencillas ( pero normalrnen te menos satisfactorias y admisibles) del desarro llo, describen la alteración y el crecimiento de las capacidades cognitivas de un niño corno el despliegue gradual de un «diseño» para el cambio cogniti vo determinado genéticamente. Según la ingeniosa descripción de Thelen y Smith (1994, pág. 6), estas explicaciones, que predominaron durante los a11os treinta y cuarcnta, 8 conciben el desarrollo corno «una progresión lineal y por etapas a través de una secuencia de conductas cada vez más funciona les que es dirigida hacia unas formas adultas por un plan global (que está programado por un cronometrador global)». Estas concepciones aún siguen con nosotros, pero con unas formas cada vez más sofisticadas. Por ejemplo, el desarrollo gradual de la capacidad para caminar se explica como el efecto 7. Recuérdense los ejemplos de visión animada descritos en el capítulo l. 8. Véasc-,pmejempl.vclrnpít1ilo l ,kTlwk·nvSmith, l')'l-1.
80
1
De excursión por la mente
de unos aumentos de la velocidad de procesamiento del cerebro que están determinados por la maduración y que permiten un control y una integra ción motrices de carácter complejo (Zelazo, 1984). Sin embargo, desde la perspectiva altamente interactiva que hemos esta do desarrollando. estos enfoques suelen incurrir en un error muy común. Toman un fenómeno complejo (por ejemplo, el desarrollo de la capacidad del niño para caminar) y buscan un solo factor determinante. Este error es lo que Mitchel Resnick, del MIT Media Lab, denomina «pensamiento centra lizado»: .. .la gente tiende a buscar la causa, la razón, la fuerza impulsora, el factor decisi vo. Cuando la gente observa pautas y estructuras en el mundo ( por ejemplo, las pautas de las bandadas de a\'es o las pautas de búsqueda de alimento de las hor migas), suele suponer unas causas centralizadas que en realidad no existen. Y cuando la gente intenta crear pautas o estructuras en el mundo (por ejemplo, nuevas organizaciones o máquinas), suele imponer un control centralizado que, en realidad, no es necesario (Resnick. 1994, pág. 120). He citado este pasaje completo porque capta perfectamente un mensaje fundamental de nuestras investigaciones que aparecerá una y otra vez en este libro: los fenómenos complejos presentan una gran autoorganización. De he cho, las aves que vuelan en bandada no siguen a un líder. En cambio, cada ave sigue unas cuantas reglas sencillas que hacen que su conducta dependa de la conducta de las aves que tiene más -.:erca. La pauta de la bandada surge de la masa de estas interacciones locales: no está orquestada por un líder o por un plan general representado en la mente de cada ave. De manera similar, ciertos tipos de hormigas buscan alimento mediante un proceso de «recluta miento en masa». Cuando una hormiga encuentra alimento, vuelve al nido y, durante el recorrido, va soltando un marcador químico (una feromona). Cuando otra hormiga detecta este rastro, lo sigue hasta llegar a la fuente de alimento. Esto hace que, a su vez, esta hormiga refuerce el rastro químico. Este rastro más fuerte tiene más probabilidades de atraer a otra hormiga que, cuando encuentre el alimento, reforzará aún más la señal química aumentan do su potencia. Por tanto, lo que nos encontramos aquí es un proceso exten dido de. retroalimentación positiva que pronto conduce a una concentración masiva de actividad, con centenares de hormigas recorriendo el camino arri ba y abajo. La cuestión es que esta organización se consigue mediante unas cuantas «reglas» locales sencillas que, en presencia de la fuente de alimento y de otras hormigas, dan origen a esta conducta aparentemente organizada." 9. Véase una simulación por ordenador de éste y otros fenómenos emergentes en Rt:snick, 1994, págs. 60-67.
El niño situado 1 81
Algunos estudios recientes proponen que el desarrollo infantil también se puede comprender mejor desde el punto de vista de las interacciones de múltiples factores locales que incluyen, en pie de igualdad, el crecimiento corporal, los factores ambientales, la maduración del cerebro y el aprendiza je. No existe un «diseño» para la conducta ni en el cerebro ni en los genes, igual que no existe un diseño de la bandada en la cabeza de las aves. Para captar el sabor de esta propuesta, consideremos el caso de aprender a caminar. Los datos brutos son los siguientes: cuando un recién nacido es suspendido por encima del suelo, realiza unos movimientos de pisar bien co ordinados; hacia los dos meses de edad estos movimientos de pisar se pierden; los movimientos reaparecen entre los ocho y los diez meses de edad, cuando el niño empieza a apoyar su peso sobre los pies; hacia los doce meses, apare ce el andar independiente. Según el punto de vista «del plan global y el fac tor único», sería de esperar que estas transiciones fueran expresiones de la maduración o el desarrollo de una fuente central (por ejemplo, la apropia ción gradual de unos procesos similares a reflejos por parte de un centro cognitivo superior; véase Zelazo, 1984). Sin embargo, los estudios del mi crodesarrollo indican que estas transiciones no están orquestadas por una entidad central y que, al parecer, se deben a la interacción de múltiples fac tores en condiciones esenciales de igualdad. Por ejemplo, aunque es cierto que el reflejo de pisar desaparece hacia los dos meses de edad, todavía se producen unos movimientos cinemáticos casi idénticos cuando el niño está tendido sobre la espalda. Este «pataleo en de cúbito supino» persiste durante todo el primer año de vida. Ahora parece que el parámetro crucial que subyace a la desaparición del pisar a los dos meses es, simplemente, ¡la masa de las piernas! En la postura erguida, la re sistencia ejercida por la masa de las piernas hacia los dos meses de edad su pera la acción elástica de los músculos. Esta hipótesis está apoyada por unos experimentos (figura 2.1) donde el pisar desaparece cuando se añade peso a las piernas de un niño que pisa y por otros donde el pisar reaparece cuando niños de tres meses de edad que no pisan se sostienen erguidos dentro del agua para reducir la masa efectiva de las piernas. 111 Las manipulaciones del entorno son igualmente eficaces para estudiar la segunda fase: la reaparición del pisar entre los ocho y los diez meses de edad. Cuando colocamos a niños más pequeños que no pisan en una rueda de an dar, pisan de una manera coordinada; incluso son capaces de ajustar el ritmo de su paso a la velocidad de la rueda y de adaptarse a restricciones asimétri cas cuando se les coloca sobre una rueda de andar con dos cintas indepen1 O. Véase Thelen y Smith, l 994, págs. l l-12. Véanse también Thelen y otros, 1982 y The len y otros, 1984.
82 1 De excursión por la mente
l'i<;UJ,,\ 2.1 Este niüo de tres meses de edad fue sometido a prueba para ver si pisa· ha erguido, primero sobre una me,,i y después sumergido en agua t ibia. Fuente: Thelen y Smith, 1994. Por gentileza de T'. Thelcn, L. Smith y lvlIT Press.
dientes que van a velocidades distintas. Se encontró que la conducta de pi sar en ruedas de andar se daba en nifios de edades comprendidas entre uno y siete meses de edad (Thelcn y Smith, 1994, págs. 11-17). 11 Estos últimos resultados indican que la pauta mecánica ocasionada por la extensión de las piernas hacia atrás, que a su vez está provocada por la rueda, tiene un papel fundamental. Este componente de pisar es indepen diente de las transiciones conducrnales generales normales que reflejan la in fluencia de múltiples factores adicionales corno la masa de las piernas. La pauta evolutiva no es la expresión de un diseño interno. Más bien refleja la compleja interacción de múltiples fuerzas, algunas corporales (como la masa de las piernas), otras mecánicas (la extensión de las piernas y las acciones elásticas), algunas totalmente externas (la presencia de ruedas de andar,
El niño situado 1 83
miento volitivo, es decir, deliberado). Centrarse exclusivamente en uno de estos parámetros equivale a pasar por alto la verdadera explicación del cam bio e\·o!utivo, que se basa en comprender la interacción
84 1 De excursión por la mente
empresa compleja puesto que siempre se están creando tareas nuevas y el vo lumen de trabajo de cada máquina varía continuamente. Un solución tradi cional de montaje duro adoptaría un enfoque centralizado donde un sistema contendría un corpus de conocimientos sobre las configuraciones de las di ferentes máquinas. las tareas típicas, etc. Este sistema también reuniría con cierta frecuencia datos procedentes de todas las máquinas acerca de su volu men de trabajo actual, los trabajos que hay en espera, etc. A continuación, y utilizando toda esta información y algunas reglas o heurísticos, el sistema tra taría de elaborar una programación (una asignación eficiente de tareas a má quinas). Ésta es la solución ofrecida por la «cognición centralizada pura». Ahora consideremos, en cambio, la solución descentralizada favorecida por Maes. 13 Aquí, cada máquina controla su propio volumen de trabajo. Si una máquina A crea una tarea, envía una «solicitud de ofertas» a todas las má quinas restantes. Las otras máquinas responden a esta petición enviando un cálculo aproximado del tiempo que tardarían en realizar la tarea Oas m,íqui nas que se utilicen poco o que ya tengan cargado un programa adecuado «pujarán» más que las máquinas muy utilizadas o mal preparadas). Enton ces, simplemente, la máquina original envía el trabajo a la máquina que más haya «pujado». Esta solución es a la vez sólida y de montaje blando. Si en una máquina se produce un fallo, el sistema lo compensa automáticamente. Y no hay una sola máquina que sea crucial: la planificación es más bien una propiedad emergente de las interacciones simples de «anunciar» y «pujar» entre las máquinas que estén activas en cada momento. Como no existe un modelo central de la configuración del sistema en ningún lugar, no se plan tean los problemas asociados con la actualización y la utilización de seme jante modelo. Los montajes blandos formados por múltiples componentes básicamen te independientes producen una mezcla característica de solidez y flexibili dad. Las soluciones que emergen se adaptan a las particularidades del con texto y al mismo tiempo satisfacen un objetivo general. Esta mezcla, que impregna todo el desarrollo, persiste en la resolución de problemas y la ac ción durante la madurez. Por tanto, la variabilidad individual no se debería desestimar como si fuera «mala información» o «ruido» que oscureciera, de alguna manera, unas pautas de desarrollo esenciales. En cambio, como in sisten Thelen y Smith, es una buena pista hacia la naturaleza de los procesos de montaje blando subyacentes. 14 Para ilustrar esto, Thelen y Smith describen el desarrollo de la conducta de alcanzar en varios niños pequeños. A pesar del carácter común de la con13. Se basa en Malone y otros, 1988. 14. Por tanto, la variabilidad es un dato, no ruido; véase Smith v Thelen, 199-1. págs. 86-88.
El niño situado 1 85
ducta global final (la capacidad para alcanzar objetos), encontraron fuertes diferencias individuales. En cada caso concreto, la conducta de alcanzar re sultó ser el resultado del montaje blando de unos componentes un tanto di ferentes, que reflejaban diferencias en la dinámica intrínseca de los ni ños y en su experiencia histórica. Aunque la descripción que ofrecen Thelen y Smith es muy detallada, aquí nos limitaremos a examinar algunos aspectos destacados. Uno de los niños, Gabriel, era muy activo por naturaleza y agitaba los brazos con mucha rapidez. Para él, la tarea consistió en convertir estos mo vimientos en una conducta de alcance dirigido. Para conseguirlo, necesitó aprender a contraer los músculos cuando el brazo estaba cerca de un objeto con el fin de moderar los movimientos y establecer un contacto adecuado. En cambio, Hannah era más bien inactiva en el aspecto motor. Movía las manos con muy poca velocidad y escasa fuerza. Su problema no era moderar los movimientos, sino producir el impulso suficiente para vencer la gravedad. Otros niños presentaban distintas mezclas de dinámica intrínseca, pero en todos los casos el problema básico consistía en aprender a controlar esta dinámica intrínseca (cuya naturalez,1, como hemos visto, puede variar consi derablemente) para alcanzar un objetivo. Para hacerlo, el sistema nervioso central (SNC) debe encontrar una solución que tenga en cuenta una amplia variedad de factores que incluyen la energía, el temperamento y el tono mus cular. Una propuesta prometedora 1 ' es que, cuando hace esto, el SNC trata el sistema total como si fuera un conjunto de muelles y masas. Por tanto, no se ocupa de generar modelos internos de trayectorias de alcance, etc., sino de aprender a modular factores como la rigidez de las extremidades para que la energía transmitida se combine con una dinámica intrínseca parecida a la de los muelles y produzca una oscilación cuyo punto de reposo sea el objeto deseado. Es decir, el SNC se trata como un sistema de control para un cuer po cuya dinámica intrínseca desempeña un papel crucial en la d<:terminación de la conducta. Por tanto, los problemas evolutivos a los que se enfrenta cada niño son diferentes, puesto que la dinámica intrínseca de cada niño es distinta. Lo que tienen en común es el problema de nivel superior de dominar esta dinámica individual para lograr alguna meta como la conducta de alcanzar. A lo largo del desarrollo, el trabajo del SNC no es «meter en vereda» cada vez más al cuerpo para que pueda llevar a cabo unas órdenes detalladas y representadas internamente que especifican, por ejemplo, las trayectorias que deben seguir los brazos. En cambio, su tarea consiste en aprender a modular parámetros (como la rigidez) que después interaccionarán con restricciones intrínsecas 15. Polir y Bizzi, 1978: Bogan y otros. 1987; Jordan y otros, 1994; Thden y Smith, 1994.
86
1
De excursión por la mente
corporales y ambientales para producir los resuludos deseados. En resu men, la tarea consiste en aprender a armar conductas adaptativas mediante montajes blandos que respondan al contexto local y exploten la dinámica in trínseca. Así pues, mente, cuerpo y mundo intervienen en pie de igualdad en la construcción de conductas sólidas v flexibles. 2.5 Mentes con andamiajes
Hay una propiedad final de las soluciones basadas en los montajes blan dos que se debe mencionar explícitamente porque ocupará un lugar desta cado en varios capítulos posteriores. Se refiere a la afinidad natural existen te entre el montaje blando y el empleo de andamiajes extcmns. Como ya se ha apuntado antes, cuando el sistema nervioso central aprende a modular parámetros como la rigidez, lo que hace en realidad es resolver un problema «suponiendo» un telón de fondo formado por una dinámica corporal intrín seca concreta Oas propiedades elásticas de los músculos). Estos telones de fondo no tienen por qué limitarse al cuerpo del agente: con frecuencia po demos resolver problemas «a horcajadas» sobre ciertas propiedades fiables del entorno. Lo que quiero denotar con el término a11damiaje es esta explo tación de la estructura externa. La noción de andamiaje tiene sus raíces en el trabajo del psicólogo sovié tico Lev Vygotsky. 11' Vygotsky destar·ó que la experiencia con estructuras ex ternas (incluyendo las lingüísticas, como palabras y frases, véase el capítulo 10) puede alterar y dar contenido a los modos de procesamiento y compren sión intrínsecos de un individuo. La tradición que siguió incluía la noción de una zona de desarrollo proximal: 17 la idea de que la ayuda de los adultos en momentos cruciales del desarrollo del niño, daría a éste la experiencia de una acción con éxito que el niño, por sí solo, no podría conseguir. Ofrecer apoyo durante los primeros pasos vacilantes de un niño que empieza a cami nar y sostener a un bebé en el agua para que pueda realizar mcwimientos de natación son dos buenos ejemplos. Sin embargo, la noción intuitiva de andamiaje es más amplia pon-1ue pue de abarcar toda clase de apoyos y ayudas externas, tanto si proceden de adultos como del entorno inanimado. 18 Como ejemplos tenemos la utiliza ción de la estructura física del entorno de la cocina como ayuda externa para la memoria (agrupando las especias, los cacharros, etc.; Cole y otros, 1978) y 16. Véase, por cjt,mplo, Vygotsky, 1986. 17. V c'anse, por ejemplo, Valsinn, 1987 y Wl'.rtsch, 1981. 18. Véase esta uti}j7ación, por ejemplo, en Rutkowska, 1993, págs. 79-80.
El niño situado 1 87
el empleo de utensilios especiales p,ira comer que reducen la libertad del ni110 para derramar y pinchar cosas, al tiempo que ofrecen un tosco simula cro del entorno de un adulto cuando come (Valsiner, 1987). 1� Para nuestros propósitos actuales, la cuestión es que las estructuras del entorno, como la elasticidad de los músculos, forman un telón de fondo en relación al cual se configuran los problemas computacionales individuales a los que se enfren ta cada niño. Este andamiaje es muy común en casos no cognitivos. La simple esponja, que se alimenta filtrando agua, explota la estructura de su entorno físico na tural para reducir la cantidad de bombeo que debe realizar: cambia de orien tación y aprovecha las corrientes del entorno para alimentarse.20 Aunque se trat,1 de una estrategia manifiesta, los biólogos no la han reconocido hasta hace muy poco. La razón de esta tardanza es reveladora: los biólogos han tendido a centrarse únicamente en el organismo individual como sede de la estructura adaptativa. Han tratado el organismo como si se pudiera entender indepcndientemcn te de su mundo f(1ico. En este sentido, los biólogos se han parecido mucho a los científicos cognitivos que sólo han buscado explica ciones internas para los fenómenos cognitivos. En respuesta a estas tenden cias, el biólogo Vogel (1981, pág. 182) ha recalcado la necesidad de un prin cipio de parsimonia: «No desarrollar explicaciones que requieran un gasto de energía metabólica (por ejemplo, la hipótesis de bombeo total para la es ponja) hasta que se puedan descartar los efectos físicos simples (por ejemplo, la utilización de las corrientes del entorno)». La extensión de la m,ixima de Vogel al ámbito cognitivo es simple. Es lo que una vez denominé «principio 007»: En gener,t!, los seres evolucionados no almacenarán ni procesarán informa ción de maneras costosas si pueden emplear la estructura del entorno y sus ope raciones sohre él como sustitutos convenientes de las operaciones implicadas en el procesamiento de la información. Es decir, no hace falta saber más de lo nece sario para cumplir una misión (Clark 1989, pág. 64). Este principio se refleja en el lema de la mobótica: «El mundo es la me jor representación de sí mismo». También es un compañero natural de las nociones ele montaje blando y de resolución de problemas descentralizada. En lugar de un dispositivo intelectual que cavila inmerso en un reino de mo delos internos detallados, nos enfrentamos a un agente corpóreo y embebi do que interviene, en pie de igualdad, en respuestas adaptativas que hacen 19. Véanse también el capítulo 4 de Clark, 1989 y el capítulo 3 de Rutkowska, I 993. 20. Véanse Vogel, 1981 y el capítulo 4 de Clark, 1989.
88
1
De excursión por la mente
uso de recursos de la mente, el cuerpo y el mundo. Hasta ahora hemos visto unos cuantos ejemplos preliminares basados en la dinámica corporal y en el empleo de ciertos tipos sencillos de almacenamiento externo de memoria. En capítulos posteriores aplicaremos estas ideas a las esferas especiales de las estructuras externas puestas a nuestra disposición por el lenguaje, la cultura y las instituciones. 2.6 La mente como espejo frente a la mente como controladora Acabamos de ver que la cognición puede explotar de varias maneras la acción real para reducir la carga computacional. La perspectiva desarrollada en los apartados precedentes nos lleva un paso más allá, porque indica algu nas de las maneras en que las conductas sólidas y flexibles pueden depender de procesos descentralizados de montaje blando donde mente, cuerpo y mundo actúan en pie de igualdad en la determinación de la conducta adap tativa. Esta perspectiva conduce a un profundo cambio en nuestra concep ción de la mente y de la cognición, un cambio que yo caracterizo como la transición desde los modelos de la representación como reflejo o codifica ción, hasta los modelos de la representación como control (Clark, 1995). La idea es que el cerebro no se debería contemplar como la sede de unas des cripciones internas de situaciones externas; más bien se debería considerar la sede de unas estructuras internas que operan en el mundo mediante su papel en la determinación de acciones. Podemos encontrar un excelente ejemplo del empleo de estas represen taciones centradas en la acción en el trabajo de Maja Mataric, del MIT Arti ficial Intelligence Laboratory. Mataric ha desarrollado un modelo inspirado en la neurobiología de cómo se orientan las ratas en su entorno. Este mode lo se ha implementado en un robot móvil. La rata robot, que dispone de sen sores de sonar y de una brújula, consigue el éxito en tiempo real empleando la arquitectura de subsunción que se describe en el capítulo 1: utiliza un con junto de «capas» cuasi independientes, cada una de las cuales constituye una ruta de procesamiento completa desde la entrada hasta la salida, y que sólo se comunican pasándose unas señales muy simples. Una de estas capas ge nera el trazado de los contornos: el robot sigue las paredes al tiempo que evi ta los obstáculos. Otra capa detecta referencias físicas o «hitos» del entorno, que se registran como una combinación del movimiento del robot y de su entrada sensorial (así, un corredor se recuerda como la combinación de un movimiento hacia delante y unas lecturas de distancias laterales cortas en los sensores de sonar). Otra capa emplea esta información para construir un mapa del entorno (figura 2.2). Este mapa consiste en una red de hitos que,
El niño situado
C:12
_.....,._
1
89
••• 4 Pll2
es FICLJl{A 2.2 Ejemplo de la conducta de orientación refleja de un robot en un entor no de oficina abarrotado. Las etiquetas incluyen el tipo de referencia física y la orien tación según la brújula (PI8 = pared izquierda hacia el sur; C120 = corredor hacia el norte; J = límite extenso irregular). Fuente: Mataric, 1991. Reproducido con la au torización de M. Mataric y MIT Press.
como hemos visto, son una combinación de lecturas motrices y sensoriales. Todos los nodos del mapa procesan información en paralelo y se comunican entre sí propagando estados de activación. La posición actual del robot es indicada por un nodo activo. El mapa construido representa la proximidad espacial de las referencias físicas mediante conexiones topológicas (a unas referencias adyacentes les corresponden unos nodos contiguos; véase la fi gura 2.3). Un nodo activo excita a sus vecinos en la dirección del recorrido, generando así unas «expectativas» sobre los próximos hitos que se van a en contrar. Supongamos ahora que el robot quiere encontrar el camino hacia una posición recordada. La actividad del nodo para esa posición aumenta. El nodo de la situación actual también está activo. A continuación, el proce so de propagación de la activación difunde una señal por el mapa cognitivo y se computa la trayectoria más corta hasta la meta (figura 2.4). Como los propios nodos del mapa combinan información sobre el movimiento del ro-
90 1 De excursión por la mente
FIGURA 2.3 Mapa construido por un robot en el entorno mostrndo en la figura 2.2. Las conexiones topológicas entre los hitos indican adyacencias espaciales. Fuente: Mataric, 1991. Reproducido con la autorización de M. Mataric y MIT Press.
FIGURA 2.4 El mapa lleva a cabo activamente la búsqueda de tra:-·ectorias. El nodo sombreado es el nodo meta. Las flechas indican la propagación de la activación a partir del nodo meta. Fuente: Mataric, 1991. Reproducido con la autorización de M. Mataríc y MIT Press.
bot y la correspondiente entrada perceptiva, el propio mapa puede actuar como controlador. Resulta que utilizar el mapa y generar el plan para los mo vimientos reales es, exactamente, la misma actividad. Esta característica -la capacidad del propio mapa para actuar como con trolador- es la que tiene más interés para nosotros. Un enfoque más clásico postularía la presencia simultánea de un mapa almacenado y de un módulo de control central que accede a ese mapa y lo emplea para planificar los mo vimientos. En cambio, el robot de Mataric no emplea ningún dispositivo de razonamiento fuera del mapa mismo. El mapa es su propio usuario y su co nocimiento es al mismo tiempo descriptivo (de posiciones) y prescriptivo (representa la relación entre dos posiciones como la secuencia de movimien tos que permiten al robot desplazarse de una posición a la otra). Por tanto, este robot es un ejemplo perfecto de la noción de representaciones orientadas a la acción: representaciones que describen aspectos del mundo y al mismo tiempo prescriben acciones posibles, y que se encuentran entre las puras es tructuras de control y las representaciones pasivas de la realidad externa. El psicólogo James Gibson (1950, 1968, 1979) promovió una imagen de las representaciones internas relacionada con la anterior. Sin embargo este trabajo incurrió en el error de parecer atacar tout cnurt la noción de unos estados internos mediadores complejos. A pesar de este desliz retóri co, los enfoques de Gibson tienen mucho más interés cuando sólo se ven
El niño situado 1 91
en cuanto se oponen a la imagen de la representación interna como codifi cación o reflejo. La afirmación de Gibson, expresada de esta manera aséptica. era que la percepción. en general. no está mediada por unos modelos del mundo inter nos, detallados y neutrales respecto a la acción. No est,í mediada por estados internos que requieran más inspecciones o cómputos (por parte de otro agente interno) para producir acciones adecuadas. Por tanto, esto no signi fica negar totalmente la existencia y la importancia de unos estados media dores internos. Significa, más bien, insistir en que los estados internos están «centrados en la acción», tema en el que Gibson profundiza describiendo a los organismos corno entes adaptados para detectar «facilitaciones (a//or dances)» en el entorno distal. Estas oportunidades no son nada más que las posibilidades de uso, intervención y acción que ofrece el entorno local a un tipo concreto de agente corpóreo. Por ejemplo, un ser humano percibe una silla como algo que «facilita un asiento», pero las facilitaciones ofrecidas por esa silla a un hámster serían totalmente diferentes. Interpretada de esta manera, la percepción está orientada desde el prin cipio a investigar posibilidades para la acción. En lugar de una re-presenta ción pasiva seguida de una inferencia. Gíbson postula la «percepción direc ta» de un complejo de oportunidades para la acción. Al representar (como diría yo, que no Gibson) el entorno como un complejo de posibilidades, crearnos unos estados internos que describen aspectos parciales del mundo y que, al mismo tiempo, prescriben intervenciones y acciones posibles. Estos estados han sido bautizados acertadamente con el nombre de representacio nes «pushmi-pullyu» (animal imaginario de los relatos del doctor Dolittle, obra del escritor Hugh Lofting [n. del ed.]) por la filósofa Ruth Millikan.21 Al igual que esta quimérica fiera, estas representaciones miran en los dos sentidos a la vez: dicen cómo es el mundo _1' 11demcís prescriben un espacio de respuestas adaptativas. El tema común de estas diversas líneas de investigación es el rechazo a cualquier imagen global de la percepción como recepción pasiva de infor mación. Como vimos, las percepciones que tienen los niños de las pendientes parecen estar vinculadas profundamente con los hábitos motores específicos mediante los cuales se enfrentan acti\'arnente a ellas. En los experimentos con lentes distorsionadoras, parece que la habilidad de los adultos con los dardos implica la inten·ención de sistemas de percepción/acción a gran es cala, y no una percepción pasiva que actúe como fuente
92 1 De excursión por la mente
serán explotados por unos sistemas de acción independientes. Estos casos indican que los productos inmediatos de gran parte de la percepción no son tanto descripciones neutrales del mundo como especificaciones ligadas a la actividad de modos potenciales de acción e intervención. Tampoco estas es pecificaciones son neutrales en relación con el sistema. En cambio, como in dica la discusión sobre la acción de alcanzar, es probable que se adapten de maneras que simplemente supongan, como telón de fondo no representado, la dinámica corporal intrínseca Je unos agentes específicos. Vale la pena ha cer una pausa para apreciar cuánta distancia separa esta visión Je la clásica imagen «incorpórea». La percepción se suele formular como un proceso mediante el cual reci bimos información procedente del mundo. Por tanto, la cognición com p rende unos procesos inteligentes definidos en torno a alguna versión inter na de esa información. La acción intencional se interpreta como la ejecución de órdenes que constituyen la salida de un sistema «pensador» central. Pero el éxito en el mundo en tiempo real no respeta esta pulcra división tripartita del trabajo. En cambio, la misma percepción está enmarni°íada con unas po sibilidades específicas
3
Mente y mundo: la frontera plástica
3.1 La mente escurridiza La mente es un órgano escurridizo, que se escapa constantemente de sus confines «naturales» y se mezcla descaradamente con el cuerpo y el mundo. ¿Qué tipo de cerebro necesita semejante apoyo externo y cómo deberíamos caracterizar sus interacciones con el entorno? Como veremos, emergerá una imagen del cerebro como una especie de motor asociativo cuyas interaccio nes con el entorno constituyen una serie repetida de cómputos sencillos orientados a completar patrones. A primera vista, esta imagen puede parecer profundamente inadecw1da. ¿Cómo puede explicar la auténtica escala y dimensión del éxito cognitivo hu mano? Parte (pero sólo parte) de la respuesta es que, con frecuencia, nues tra conducta está esculpida y secuenciada por una clase especial de estruc turas externas complejas: los artefactos culturales y lingüísticos que estructuran la vida moderna, incluyendo mapas, textos y planes escritos. La comprensión de la compleja interacción entre nuestros recursos neuronales incorporados y en línea por un lado, y estos puntales y soportes externos por otro, es una tarea fundamental para las ciencias del pensamiento corpóreo. Empezaré poco a poco, presentando un protagonista destacado de nues tro incipiente escenario: la red neuronal artificial.
3.2 Las redes neuronales: una revolución inconclusa CYC, la enciclopedia electrónica descrita en la introducción, era un ejemplo extremo de inteligencia artificial basada en reglas y símbolos. No to dos los proyectos de la inteligencia artificial tradicional eran tan fanáticos
94 1 De excursión por la mente
acerca del poder de las grandes bases de conocimientos y las codificaciones explícitas, pero persistía un sabor común subyacente a todos ellos: la ima gen general de la inteligencia como manipulación de símbolos siguiendo unas reglas. Por ejemplo, los programas de «física ingenua» pretendían es pecificar en forma lógica nuestro conocimiento cotidiano sobre cómo se de rraman los líquidos, cómo se amontonan los libros, etc. (I-Iayes, 1979). Pro gramas como STRIPS aplicaban técnicas de demostración de teoremas a la resolución de problemas ordinarios (Fikes y Nilsson, 1971), y sistemas gran des como SOAR incorporaban una amplia variedad de métodos y represen taciones de este tipo en una sola arquitectura computacional. Sin embargo, hasta la aparición (o la reaparición 1) de los denominados modelos de redes neuronales de la mente, no se puso sobre la mesa una propuesta}imdamen talmente diferente. Como indica su nombre, los modelos de redes neuronales están inspira dos, por lo menos vagamente, en una reflexión sobre la arquitectura del ce rebro. El cerebro se compone de muchas unidades simples de procesamiento (las neuronas) enlazadas en paralelo por una gran masa de cables y empal mes (axones y sinapsis). En general, las unidades individuales (las neuronas) sólo son sensibles a informaciones locales: cada neurona «escucha» lo que sus vecinas le cuentan. Pero a partir de esta masa de conexiones en paralelo, procesadores simples e interacciones locales, surge la asombrosa habilidad computacional y de resolución de problemas del cerebro humano. Durante los años ochenta, el carn 110 de la inteligencia artificial fue trans formado por una explosión de interés en una clase de modelos computacio nales que compartían esta tosca descripción de la funcionalidad del cerebro. Eran los modelos «conexionistas» (o «de redes neuronales» o «de procesa miento distribuido en paralelo») de la inteligencia y la cognición. El grado de similitud entre estos modelos iniciales y el cerebro no se debería exage rar.2 Las diferencias seguían siendo enormes: la multiplicidad de tipos de l. Algunas de las ideas originales fueron formuladas hace ya muchos años (desde la ¡x'.rs pectiva de la inteligencia artificial), en 1943; véanse McC:ulloch y Pitts, l 943: Hebb, 19-19 y Ro senblatt, 1962. 2. Consideremos el modelo de Mauric, descrito en el apartado 2.6 anterior. El tipo de mapa que detalla Mataric tiene fuertes afinidades con modelos recientes sobre la codifica ción de información espacial por parte del hipocampo IMcNaughton, 1989). Sin cmb,irgo, hay una diferencia relacionada con el empleo en el modelo de 1\!lataric de nodos Crnicos como codificadores de información sobre «hitos». Es probable que el hipocampo emplee una for ma de representación mucho más distribuida, con muchas neuronas i1wolucradas en la re prl'scntacicín de cada «hito». Existen modelos más detallados de la función del hipocampo has,1dos c·n redes m·monalcs artificiales que realmente reconocen el papel de esta distribución (véanse, por cjL·rnplo O'l
Mente y mundo: la frontera plástica 1 95
neuronas y sinapsis y el empleo de propiedades temporales (como las fre cuencias de los picos) no entraban en los modelos, la conectividad no estaba restringida de la mi�ma manera que en los sistemas nerviosos reales, etc. A pesar de todo esto, el sabor de los modelos era ciertamente diferente y, en un sentido muy real, biológicamente más atractivo. Para los investigadores de la inteligencia artificial que trabajaban en el nuevo paradigma, llegó a ser mu cho más fácil entrar en contacto con los resultados y las hipótesis de la neu rociencia real. Por fin, los vocabularios de las diversas ciencias de la mente parecían acercarse entre sí. El estilo básico ele este nuevo enfoque se transmite mejor mediante ejem plos. Consideremos la tarea de pronunciar textos escritos en inglés convir tiendo la entrada escrita (palabras) en salida fonética (habla). Este problema se resuelve mediante sistemas que codifiquen reglas para convertir textos a fonemas y listas de excepciones, todas ellas cuidadosamente codificadas a mano por programadores humanos. Por ejemplo, DECtalk 3 es un programa comercial que realiza esta tarea y cuy a salida puede gobernar un sintetizador de voz digital. Por tanto, DECtalk se basa en una base de conocimientos bas tante grande, formulada explícitamente y hecho a mano. En cambio, NET talk aprende a resolver el problema usando una red neuronal artificial. A esta red no se le ha proporcionado ningún conjunto de reglas codificadas a mano para resolver el problema, y aprende a resolverlo mediante la exposi ción a un gran conjunto de ejemplos de parejas texto-fonemas y empleando una rutina de apren
96
1
De excursión por la mente
de esta red artificial es verdaderamente impresionante. Como las unidades de salida están conectadas a un sintetizador de voz, se puede escuchar al sis tema mientras aprende lentamente a hablar, pasando de un balbuceo entre cortado a palabras medio formadas y, por último, a una buena simulación de una pronunciación normal. NETtalk (al igual que DECtalk) no entiende nada. No se le ha dicho nada sobre el significado de las palabras y no puede emplear el lenguaje para lograr una meta mundo real. Pero, con todo , es una demostración de refe rencia de la capacidad de las redes neuronales artificiales para resolver pro blemas complejos y realistas. ¿Cómo funciona? Los elementos de este sistema informático son unas neuronas idealizadas o «unidades». Cada unidad es un dispositivo procesador simple que recibe señales de entrada de otras unidades mediante una red de conexiones en pa ralelo. Cada unidad combina sus entradas y produce una salida basándose en una simple función matemática." Por tanto, la unidad se activa en la me dida dictada por los datos de entrada y pasa una señal a las unidades vecinas. La señal que llega a estas unidades vecinas está determinada tanto por el ni vel de activación de la unidad «remitente» como por la naturaleza de la co nexión implicada. Cada conexión tiene un peso que modula la señal. Este peso puede ser positivo (excitador) o negativo (inhibidor). La señal que se recibe está determinada por el producto del peso numérico y la fuerza de la señal de la unidad «remitente». Una red conexionista típica coP10 NETtalk consta de tres capas de uni dades: las «unidades de entrada» (que codifican los datos que se deben pro cesar), las «unidades ocultas» (que intervienen en el procesamiento)' y las «unidades de salida» (que especifican la respuesta del sistema a los datos en forma de un vector de valores numéricos de activación). El conocimiento del sistema se codifica en los pesos de las conexiones entre las unidades, y estos pesos se adaptan durante el aprendizaje. El procesamiento supone la dise minación de la activación por toda la red, tras la presentación de un conjun to específico de valores de activación en las unidades de entrada. En el caso de NETtalk hay siete grupos de unidades de entrada con 29 unidades cada uno. Cada grupo representa una letra y la entrada consta de siete letras de las que la �uarta es el objetivo cuya contribución fonémica se debe determinar en cada momento (dentro del contexto proporcionado por las seis letras res4. Estas funciones no suelen ser lineales: es decir, la fuerza de la salida no es directamen te proporcional a la suma Je las entradas. En cambio, puede sn proporcional cuando (por ejemplo) las señales entrantes son de intensidad media pero allanarse cuando son muy fuertes o muy débiles. 5. Las caracll"rísticas Je respuesta Je las unidades ocultas se han descrito más arriba.
Mente y mundo: la frontera plástica
1
97
tantes). Las entradas se conectan a una capa de 80 unidades ocultas, que a su vez se conectan a 26 unidades de salida que codifican fonemas. En total, la red consta de 18.829 conexiones con sus correspondientes pesos. ¿Cómo aprende un sistema como éste? Aprende ajustando los pesos en tre las unidades según un algoritmo o procedimiento sistemático. Uno de es tos procedimientos es el «algoritmo de retropropagación» (backpropaga tion ), que funciona de la manera siguiente: el sistema se inicializa con una serie de pesos aleatorios (dentro de ciertos límites numéricos). Como los pe sos son aleatorios, el sistema no solucionará el problema planteado. Enton ces es cuando se entrena a la red. Se le da un conjunto de entradas y para cada entrada producirá (gracias a los pesos aleatorios iniciales) una salida, casi siempre incorrecta. Sin embargo, hay un sistema supervisor que consul ta la salida correcta para cada entrada (como un profesor que sabe las res puestas de antemano). El sistema supervisor compara automáticamente la salida real (un conjunto de valores numéricos de activación) con la salida co rrecta. Por ejemplo, un sistema de reconocimiento de rostros puede tomar como entrada la especificación de una imagen visual y se le puede exigir que dé como salida unos códigos artificiales que correspondan a unos individuos nombrados. En este caso, la salida correcta para una entrada visual dada po dría ser la sucesión numérica (1010) si hubiera sido designada de antemano como un código arbitrario para «Esther Russell». A causa de los pesos alea torios, el sistema quizás no acierte y dé, por ejemplo (0,7, 0,4, 0,2, 0,2) como salida inicial. En este punto, el sistema supervisor compara la salida real con la deseada para cada unidad de salida y calcula el error correspondiente. Los errores se elevan al cuadrado (por razones que no hace falta especificar aquí) y se calcula su media, obteniéndose un error cuadrático medio (ECM). Lue go el sistema se centra en el peso de una conexión y comprueba (mantenien do invariables los otros pesos) si aumentando o disminuyendo ligeramente el peso se reduce el ECM. Si es así, el peso se corrige en consecuencia. Este pro cedimiento se repite para cada peso y el ciclo total de entrada/salida/ajuste de peso se repite una y otra vez hasta que se alcanza un ECM bajo. En este mo mento la red funcionará bien (en nuestro caso, asignando el nombre correcto a cada imagen visual). Ahora es cuando cesa el entrenamiento y los pesos se conservan: la red ha aprendido a resolver el problema.6 Este tipo de aprendizaje se puede concebir como un descenso por un gra diente. Imaginemos que nos encontramos en algún punto de la pendiente in terior de un cráter en forma de cuenco gigante. Nuestra tarea es encontrar el fondo, es decir, la solución correcta o el error más bajo. Como tenemos los 6. Véase una explicación especialmente clara y accesible
i :1 '
98
1
De excursión por la mente
ojos vendados, no podemos ver dónde está el fondo. Sin embargo, cada vez 4ue damos un paso pe4ueño podemos determinar si nos mo\'emos hacia arrib._1 (es decir, en la dirección de más error) o hacia abajo (en la dirección de menos error). Simplemente utilizando esta retroalimentación local y avan zando paso a paso, nos acercaremos inexorablemente al fondo Je la cuenca, 4ue es donde nos detendremos. Los métodos de aprendizaje de descenso por un gradiente (de los 4ue la retropropagación es un ejemplo) actúan esen cialmente de la misma manera: el sistema es empujado cuesta abajo por la pendiente del error decreciente hasta que no puede bajar más. En este pun to (en paisajes con forma de cuenco) se alcanza la solución y el problema se resuelve. Obsérvese que los pesos no se codifican a mano en ninguna etapa de este proceso. Para cualquier problema complejo, encontrar un conjunto funcio nal de pesos de conexión mediante un análisis reflexivo está mucho más allá de nuestras capacidades actuales. Lo que se nos ofrece es una arquitectura inicial con una Cémtidad dada Je unidades y un tipo determinado de conec tividad, y un conjunto de casos de entrenamiento (pares entrada-salida). Ob sérvese también que, en general, el resultado final del aprendizaje no es que el sistema memorice como un papagayo los datos de entrenamiento. En el caso de NETtalk, por ejemplo, el sistema aprende aspectos generales de la relación entre el inglés escrito y hablado. Después del entrenamiento, la red puede enfrentarse con éxito a palabras nue,·as que no estaban en el conjun to de entrenamiento inicial. Lo más importante es que el conocimiento de las transiciones de texto a fonemas de NETtalk no adopta la forma de codificaciones explícitas Je re glas o principios mediante cadenas de símbolos. Este conocimiento se alma cena de una manera adecuada para su empico directo mediante un sistema parecido al del cerebro: como pesos o conexiones entre unidades o «neuro nas» idealizadas. En cambio, las formas de tipo textual fayorecidas por CYC y SOAR son adecuadas para que unos agentes avanzados como los seres hu manos las utilicen como estructuras de conocimiento externas y pasivas. Si miramos hacia atrás, sin duda consideraremos muy poco verosímil que nues tros propios cerebros (que no son tan diferentes de los de algunos seres que carecen de lengu¡_,je) emplearan un formato simibr al elegido por las débiles proyecciones de nuestros pensamientos en medios públicos como el papel y las moléculas de aire. Los códigl�S cerebrales deben ser activos en un sentido en el que el almacenamiento de textos no lo es. Por tanto, creo que la princi pal lección de la in\'estigación de las redes neuronales ha sido expandir nues tra visión de las maneras en que un sistema físico como el cerebro puede co dificar y explotar informaciones y conocimientos. En este sentido, la revolución de las redes neuronales ha sido un éxito indudable.
Mente y mundo: la frontera plástica 1 99
Además, parece que la tecnología de las redes neuronales va a permane cer entre nosotros. Técnicas como las que acabamos de describir se han apli cado con éxito en una increíble variedad de campos, incluyendo el recono cimiento de códigos postales escritos a mano, tareas de procesamiento visual, el reconocimiento de rostros, el reconocimiento de firmas, el control robótico e incluso la planificación y la demostración automatizada de teore mas. La potencia y la utilidad de esta tecnología son indudables. Sin embar go, su capacidad para dilucidar la cognición biológica no depende simplemen te de utilizar un estilo de procesamiento que recuerda aproximadamente al de los sistemas nerviosos reales, aunque sea de una manera aproximada, sino también del despliegue de estos recursos de una manera biológicamente re alista. Creo que la elección de representaciones de entrada y salida muy arti ficiales y de ámbitos de problemas muy pobres ha privado a la revolución de las redes neuronales de parte de su impulso inicial. Esta inquietud está di rectamente relacionada con el énfasis creciente en la acción real y, en conse cuencia, merece una explicación más detallada. El problema es, en esencia, que gran parte de la investigación sobre las redes neuronales artificiales se ha apoyado demasiado en una concepción más bien clásica de la naturaleza de los problemas. Muchas redes se han de dicado a investigar lo que una vez denominé «micromundos verticales» (Clark, 1989, capítulo 4; véase también el apartado 1.2 anterior): pequeñas piezas de cognición de nivel humano como producir el pretérito de verbos ingleses' o aprender gramáticas simples. 8 Incluso en tareas aparentemente más básicas ( por ejemplo, equilibrar bloques de construcción en una barra que se apoya sobre un fulcro móvil9), la elección de las representaciones de entrada y de salida solían ser muy artificiales. Por ejemplo, la salida de los programas para equilibrar bloques no era un conjunto de acciones motrices reales de brazos robóticos o, por lo menos, una codificación de estas accio nes; era simplemente la actividad relativa de dos unidades de salida, inter pretada de modo que una actividad igual en las dos unidades indicaba la expectativa de un estado de equilibrio y una actividad excesiva en cualquier unidad indicaba la expectativa de un desequilibrio en la dirección corres pondiente. Las entradas proporcionadas al sistema también eran artificiales: una codificación arbitraria para el peso en un canal de entrada y otra para la distancia desde el fulcro en el otro canal. Es bastante razonable suponer que esta manera de establecer el espacio del problema puede conducir a solucio7. Clark, 8. 9.
Véanse Rumelhart y McClellan
1 00
1
De excursión por la mente
nes artificiales e irreales. Seguramente una estrategia alternativa y quizá me jor sería darle al sistema datos de entrada realistas (por ejemplo, proceden tes de cámaras) y hacer que produjera como salida acciones reales (desplazar bloques reales hasta el punto de equilibrio). Naturalmente, un sistema como éste requiere la solución de muchos problemas adicionales y la ciencia siem pre debe simplificar los experimentos cuando sea posible. Sin embargo, cabe la sospecha de que la ciencia cognitiva ya no puede permitirse más simplifi caciones que excluyan del bucle al mundo real y al organismo que actúa: es tas simplificaciones pueden oscurecer las soluciones a los problemas ecoló gicamente realistas que caracterizan a agentes corpóreos activos como los seres humanos. La aspiración de la ciencia cognitiva -dilucidar la cognición biológica real- no puede ser compatible con una estrategia basada en la abstracción continua de los anclajes de la percepción y de la acción en el mundo real. Creo que esta sospecha está totalmente confirmada por los im portantes corpus de investigación descrítos en este libro. Un tema funda mental, que ya ha aparecido anteriormente, es que abstraer los polos reales de la sensación y de la acción priva a nuestros sistemas artificiales de la opor tunidad de simplificar, o de transformar de otras maneras, sus tareas de pro cesamiento de información mediante la explotación directa de la estructura de la realidad. Sin embargo, y como veremos a continuación, esta explota ción puede ser especialmente esencial si pretendemos abordar la resolución de problemas sofisticados utilizando los tipos de recursos biológicamente plausibles de compleción de patrom's que nos ofrecen las redes neuronales artificiales. 3.3 Apoyarse en el entorno Las redes neuronales artificiales de tipo general descritas anteriormen te 1º presentan una interesante combinación de ventajas e inconvenientes. Son capaces de tolerar datos «ruidosos», imperfectos o incompletos. Son resistentes a daños locales. Son rápidas. Y sobresalen en tareas que suponen la integración simultánea de muchas pequeñas señales o elementos de infor mación, una capacidad que es esencial para el reconocimiento perceptivo y el control motor en tiempo real. Estas ventajas se derivan del hecho de que estos sistemas se dedican a completar patrones con un procesamiento en pa ralelo masivo. La tolerancia a datos «ruidosos», incompletos o imperfectos equivale a la capacidad de recrear patrones completos a partir de señales parciales. La resistencia a los daños locales se debe al empleo de múltiples 1 O. Vease una Lkscripción mucho más cuidadosa de esta clase de modelos en Clark, 199,.
Mente y mundo: la frontera plástica 1
101
recursos, a nivel de unidad, para codificar cada pauta. La velocidad se debe al funcionamiento en paralelo, igual que la capacidad para tener en cuenta simultáneamente múltiples señales pequeñas. 11 Incluso algunos fallos de es tos sistemas son atrayentes en el plano psicológico. Pueden sufrir «interfe rencias» cuando unas codificaciones similares se obstaculizan mutuamente (de manera similar a cuando aprendemos un número de teléfono que se pa rece a otro que ya sabemos y enseguida los confundimos, olvidándonos de los dos). Y no son intrínsecamente adecuados para la resolución de proble mas secuencial y gradual típica de la lógica y la planificación (Norman, 1988; Clark, 1989, capítulo 6). Estos sistemas se podrían caracterizar en pocas pa labras diciendo que son «buenos al fútbol pero malos en lógica», un perfil más que familiar. Los sistemas clásicos, con sus direcciones de memoria or denadas y bien definidas, son inmunes a estas interferencias y ofrecen un ren dimiento excelente en la resolución de problemas lógicos y secuenciales, pero rinden mucho peor en tareas de control en tiempo real. Por tanto, las redes neuronales artificiales son sistemas rápidos pero li mitados que, de hecho, sustituyen el razonamiento clásico por el reconoci miento de patrones. Como era de esperar, esto es a la vez una ventaja y un in conveniente. Es una ventaja en el sentido de que ofrecen, precisamente, los recursos necesarios para las tareas que los seres humanos realizan mejor y con más fluidez: control motor, reconocimiento de rostros, lectura de códigos postales escritos a mano, etc. Gordan y otros, 1994; Cottrell, 1991; LeCun y otros, 1989). Pero es una desventaja cuando nos enfrentamos a tareas como razonar de manera secuencial o planificar a largo plazo. Esto no es necesaria mente malo. Si nuestro objetivo es modelar la cognición humana, se deben fa vorecer aquellos fundamentos computacionales que produzcan una pauta de puntos fuertes y débiles parecida a la nuestra. Y en general somos mejores al fútbol que en lógica. De todos modos, también somos capaces, por lo menos en ocasiones, de planificar a largo plazo y de llevar a cabo razonamientos se cuenciales. Si en el fondo somos dispositivos asociativos reconocedores de patrones, 12 ¿cómo es esto posible? Creo que nuestra capacidad para elevarnos 11. Véanse los detalles completos en el capítulo 5 de Clark, 1989. 12. Naturalmente, esto sigue siendo objeto de debate. Pero cada vez parece más claro que. sean como sean realmente los cerebros, están más cerca del perfil de procesamiento de in formación de las redes neuronales artificiales que del perfil
102 1 De excursión por la mente
por encima de nuestras raíces computacionales es el resultado combinado de varios factores. Algunos de ellos aparecerán en capítulos posteriores. 13 Sin embargo, hay uno que merece nuestra inmediata atención . Es el empleo de nuestro viejo amigo, el andamiaje externo. Las mentes conexionistas son las candidatas ideales para utilizar un abun dante andamiaje externo. Un ejemplo sencillo, detallado en Parallel Distri buted Processing (la «biblia» en dos volúmenes de la investigación sobre las redes neuronales 14 ), es el caso de las multiplicaciones largas. El argumento es que la mayoría de nosotros podemos aprender a reconocer de un vistazo la respuesta a multiplicaciones simples como 7 x 7 = 49. Este conocimiento se puede apoyar fácilmente en un dispositivo incorporado básico para el reco nocimiento de patrones. Sin embargo, las multiplicaciones más largas plan tean un problema diferente. Si se nos pide que multipliquemos 7 .222 X 9.422, la mayoría de nosotros echará mano de lápiz y papel (o de una calculadora). Con el empleo de lápiz y papel, lo que conseguimos es reducir un problema complejo a una sucesión de problemas más simples que empieza con 2 X 2. Utilizamos el medio externo (un papel) para almacenar los resultados de es tos problemas simples y al final llegamos a una solución mediante una serie interrelacionada de compleciones de patrones simples y almacenamientos externos. Rumelhart y otros (1986, pág. 46), comentan: «Lo que aquí vemos es un verdadero procesamiento de símbolos, y empezarnos a pensar que es el principal procesamiento de símbolos que somos capaces de realizar. De he cho, desde este punto de vista, el entorno exterior se convierte en una ex tensión fundamental de nuestra mente». Naturalmente, algunas personas aprenden a hacer estos cálculos mental mente. En estos casos el truco parece consistir en aprender a manipular un modelo mental de la misma manera que antes manipulábamos el mundo real. Este tipo de manipulación interna de símbolos es fundamentalmente distinta de la concepción clásica de los símbolos internos, porque no dice nada del sustrato computacional de estas imágenes. La cuestión es, pura y simplemente, que podemos simular mentalmente el entorno exterior y que, en consecuencia, a veces interiorizarnos competencias cognitivas que no por ello dejan de estar enraizadas en manipulaciones del mundo exterior. Dicho de otra manera: la ciencia cognitiva se encuentra con la psicología soviética.15 13. Véanse especialmente las exposiciones sobre la actividad colectiva (capítulo 4) y so bre el papel más amplio del lenguaje y la cultura (capítulos 9 y 10). 14. Para!lel Distrzhuted Processing: ExploratZons in the Nlicrostructure o/ Cugnition, volu men 1: Foundations y volumen 2: Psychological and Biological Models (MIT Press, 1986). El trabajo descrito (Rumelhart y otros, 1986) se encuentra en el capítulo 14. 15. Véase, por ejemplo, Vygotsky. 1962. Véanse también los capítulos 9 y 10 de este libro.
Mente y mundo: la frontera plástica 1
103
Por tanto, podríamos decir que la combinación de unas capacidades bá sicas para la compleción de patrones con unos entornos complejos y bien es tructurados nos permite alzarnos del suelo tirando de nuestras propias orejas computacionales. Quizás la visión original de la inteligencia artificial clásica equivalía, en realidad, a considerar que las capacidades básicas de comple ción de patrones de los organismos estaban embebidas en un entorno per fectamente estructurado: una visión erróneamente proyectada en los recur sos de procesamiento básicos incorporados en el organismo. Dicho en otros términos, la inteligencia artificial clásica basada en reglas y símbolos puede haber cometido un error fundamental, confundiendo el perfil cognitivo del agente más el entorno, con el perfil cognitivo del cerebro aislado (Clark, 1989, pág. 135; Hutchins, 1995, capítulo 9). La clásica separación limpia y tajante entre datos y procesos, entre estructuras de símbolos y procesadores centrales, quizás no haya reflejado nada más que la separación entre el agen te y un andamiaje externo de ideas que persisten sobre papel, en archivado res o en soportes electrónicos. Los atractivos de esta visión no deberían disimular sus defectos. El en torno externo humano está perfectamente estructurado en virtud de nues tro empleo de formalismos lingüísticos, lógicos y geométricos y de los múl tiples sistemas de memoria externa de la cultura y el aprendizaje. No todos los animales son capaces de crear estos sistemas ni se pueden beneficiar de ellos una vez establecidos. Por tanto, la insistencia en el andamiaje externo no puede soslayar el hecho evidente de que los cerebros humanos son espe ciales. Pero la diferencia computacional puede ser menor y menos radical de lo que en ocasiones creemos. Quizás el origen y la explotación de instru mentos lingüísticos y culturales simples se deba a una pequeña serie de di ferencias neurocognitivas. A partir de aquí se puede poner en marcha un efecto tipo bola de nieve (un bucle de retroalimentación positiva). Unos simples apoyos externos nos permiten pensar mejor y crear nuevos apoyos y prácticas de carácter más complejo que, a su vez, «turboalimentarán» nuestro pensamiento un poco más, lo que conduce al desarrollo de apoyos aun mejores... ¡ Es como si la longitud de nuestra orejas creciera al tirar de ellas para alzarnos! De nuevo con los pies en el suelo, podemos profundizar en la idea de un razonamiento completador de patrones en algunos ámbitos más sencillos. Consideremos el estudio de David Kirsh (1995) sobre el empleo inteligente del espacio físico. Kirsh, que trabaja en el Departamento de Ciencias Cogni tivas de la Universidad de California en San Diego, observa que los estudios típicos de inteligencia artificial tratan la planificación como un fenómeno muy incorpóreo: sobre todo, desatienden nuestra manera de utilizar las pro piedades espaciales reales del ámbito de trabajo para simplificar el cómputo
104
1
De excursión por la mente
interno. Naturalmente, una vez expresada esta idea los ejemplos abundan. Veamos algunos de los ejemplos favoritos de Kirsh: •Si al seguir una dieta queremos consumir las 3/4 partes de la ración de requesón
Mente y mundo: la frontera plástica 1
105
sión interiorizada de uno de estos conjuntos de instrucciones (véanse, por ejemplo, Tate, 1985, y Fikes y Nilsson, 1971). Sin embargo, en cuanto observamos detenidamente las conductas de pla nificación de agentes reales, es evidente que existe una interacción bastante compleja entre el plan y el entorno de apoyo. Esta interacción va mucho más allá del hecho evidente de que unas acciones específicas, una vez realizadas, tal vez no tengan el efecto deseado y, en consecuencia, exijan replantear so bre la marcha la consecución de algunos subobjetivos concretos. En estos ca sos el plan interiorizado original sigue siendo una especificación completa, aunque falible, de un camino hacia el éxito. Sin embargo, en muchos casos el plan resulta ser mucho más parcial y dependiente de las propiedades del entorno local. El caso anterior del puzzle es un buen ejemplo. Aquí, un agente puede explotar una estrategia que incorpore la actividad física de una manera fun damental. Tomar piezas, hacerlas girar para buscar potenciales coincidencias espaciales y después probarlas son partes de la actividad de resolución de pro blemas. Imaginemos, en cambio, un sistema que primero resuelva el puzzle entero por puro pensamiento y que después emplee el mundo meramente como el campo donde la solución ya alcanzada se va a representar. Incluso un sistema que luego reconociera los fallos de ajuste físico y los empleara como señales para volver a planificar (una versión menos caricaturizada de la planificación clásica) seguiría utilizando el entorno mínimamente en com paración con las ricas interacciones (rotaciones, evaluaciones de piezas can didatas, etc.) que caracterizan la solución humana. Esta diferencia crucial es descrita con precisión por David Kirsh y Paul Maglio (1994) mediante la distinción entre acción pragmática y acción episté mica. Una acción pragmática es una acción llevada a cabo por la necesidad de alterar el mundo con el fin de lograr alguna meta física (por ejemplo, hay que pelar las patatas antes de hervirlas). En cambio, una acción epistémica es una acción cuyo propósito principal es alterar la naturaleza de nuestras propias tareas mentales. En estos casos seguimos actuando sobre el mundo, pero los cambios que imponemos están impulsados por nuestras propias ne cesidades computacionales y de procesamiento de información. Ya hemos visto varios ejemplos de acción epistémica: recuérdese el em pleo de movimientos corporales y oculares en la visión animada para recu perar tipos específicos de información como y cuando sea necesario. Lo que Kirsh y Maglio añaden a este marco de referencia es la idea de que la clase de las acciones epistémicas es mucha más amplia de lo que muestran los ejem plos de visión animada. Incluye todo tipo de acciones e intervenciones cuyo papel adaptativo sea simplificar o alterar los problemas a los que se enfren tan los cerebros biológicos.
1
106
1
De excursión por la mente
Un ejemplo sencillo, de nuevo procedente de Kirsh (1995, pág. 32), se re fiere al empleo de las fichas del juego Scrabble o Intelect. Mientras jugamos, ordenamos y reordenamos físicamente las fichas como método para estimu lar nuestros propios recursos neuronales en línea. Si relacionamos esto con la investigación sobre redes neuronales artificiales descrita en el apartado 3 .2 anterior, podemos imaginar este recurso neuronal en línea como una especie de memoria asociativa completadora de patrones. Una estrategia para jugar al Scrabble es emplear una clase especial de manipulaciones externas para crear una variedad de entradas fragmentarias (nuevas cadenas de letras) ca paces de estimular al ingenio completador de patrones para que recuerde palabras enteras. El hecho de que encontremos tan útiles estas manipulacio nes externas indica claramente que nuestros ingenios computacionales in corporados (en el cerebro) no se prestan muy bien a estas manipulaciones (mientras que un programa clásico de inteligencia artificial encontraría tri viales estas operaciones internas). Este simple hecho habla en favor de un modelo de los recursos internos distinto al clásico. Es como si la imagen clá sica incluyera dentro de la máquina un conjunto de capacidades operativas que en la vida real sólo emergen a partir de las interacciones entre esa má quina (el cerebro) y el mundo. Una conclusión de estas observaciones es que las estructuras externas (incluyendo símbolos externos como las palabras y las letras) son especiales en la medida en que permiten realizar tipos de operaciones que difícilmente (o nunca) se pueden realizar en el ámbito interno. 16 Un ejemplo más complejo, que conduce esencialmente a la misma con clusión, procede de los estudios detallados de Kirsh y Maglio (1994) sobre el rendimiento en el juego de ordenador Tetris. En este juego, el jugador debe colocar unas piezas geométricas multicolores (denominadas «zoides») formando hileras compactas (figura 3 .1). Cuando se completa una hilera, ésta desaparece de la pantalla dejando espacio para nuevos zoides. Los zoides aparecen por la parte superior de la pantalla y caen a un ritmo que aumenta a medida que avanza la partida. Mientras un zoide cae, el jugador puede ha cerlo girar, desplazarlo haciá la derecha o la izquierda, o hacerlo caer directa mente al fondo. Por tanto, el objetivo es hacer encajar unas formas con unas oportuniJades geográficas dentro _de unas fuertes restricciones en tiempo real. Un resultado sorprendente de las investigaciones de Kirsh y Maglio fue 16. En Clark, 1986 y Clark, 1988a examino resultados del ámbito del dibujo que ofrecen más apoyo a esta conjetura. En estos artículos también examino el trabajo de Chamhers y Reis herg ( 1985) sobre las propiedades especiales de los dibujos reales en comparación con las imá gL·nes lllL'llt.tles de dihujos. EsL1 i11Vl'stig,1ci(ll1 se cita tarnhién en Kirsh, 1995 y en Zhang y Nor rn,111, I'!'!-+.
Mente y mundo: la frontera plástica 1 107
Soltar
La hilera completa desaparece
FIGURA 3 .1 El juego Tetris se caracteriza por unas piezas llamadas «zoides» que caen de una en una desde la parte superior de la pantalla y acaban depositándose directa mente en el fondo o sobre otras piezas que hayan caído antes. Mientas cae una pieza, el jugador puede hacerla girar, desplazarla hacia la derecha o hacia la izquierda, o ha cerla bajar de inmediato. Cuando se consigue que una hilera de cuadrados llene hori zontalmente toda la pantalla, la hilera en cuestión desaparece y las que se encuentran por encima de ella bajan un nivel. Fuente: Kirsh y Maglio, 1994. Reproducido con la autorización de D. Kirsh, R. Maglio y Ablex Publishing Corporation.
que los jugadores expertos realizaban una amplia variedad de acciones epis témicas: acciones cuyo propósito era reducir la cantidad de computación in terna en lugar de ganar terreno físico. Por ejemplo, un jugador puede hacer girar físicamente un zoide para determinar mejor su forma o para comprobar su coincidencia potencial con alguna oportunidad geográfica. Estas opera ciones externas parecen más rápidas y fiables que sus equivalentes internas (como imaginar la rotación del zoide). Es especialmente interesante destacar (como hacen Kirsh y Maglio) que, en el caso del Tetris, las operaciones inter nas y externas deben estar tan coordinadas en el tiempo que los sistemas in ternos y externos (el cerebro/SNC y las operaciones en pantalla) parecen fun cionar conjuntamente como una sola unidad computacional integrada.
108
1
De excursión por la mente
Por tanto, el mundo puede funcionar de maneras que van mucho más allá de la simple memoria externa. Puede ofrecer un campo donde unas cla ses especiales de operaciones externas transformen sistemáticamente los problemas que se plantean a un cerebro. 17 De la misma manera que Einstein sustituyó las nociones independientes del tiempo y el espacio por un cons tructo unificado (el espacio-tiempo), Kirsh y Maglio proponen que para la ciencia cognitiva puede ser conveniente sustituir los constructos indepen dientes del espacio físico y el espacio del procesamiento de la información por un espacio «físico-informacjonal» unificado. 18 Como comentario final sobre la interacción entre la mente y la estructu ra del entorno, consideremos el caso de pacientes con la enfermedad de Alzheimer en estado avanzado. Muchos de estos pacientes llevan una vida sorprendentemente normal en la comunidad, a pesar de que las evaluacio nes estándar de sus capacidades indican que muchos de ellos deberían ser incapaces de sobrevivir fuera de instituciones especializadas. Al parecer, la clave de estos éxitos sorprendentes reside en la medida en que estas perso nas se basan en entornos muy estructurados que primero crean y después habitan. Estos entornos pueden incorporar múltiples letreros recordatorios colocados por toda la casa y el seguimiento estricto de unos hábitos con cretos. Una paciente vive, virtualmente, en un sofá que se encuentra en el centro de su apartamento, ya que esto le brinda una posición estratégica desde la cual puede acceder visualmente a la situación de cualquier cosa que necesite: este sí es, realmente, un caso de empleo del mundo como me moria externa. 19 ¿Cómo encaja en todo esto la noción de planificación? Al parecer, la re solución sistemática de problemas de los cerebros biológicos no sigue real mente el modelo del plan como programa. En cambio, los agentes desplie gan unas estrategias generales que incorporan ciertas operaciones sobre el mundo como parte intrínseca de la acti\'idad de resolución de problemas. Es evidente que esta actividad puede suponer unos planes formulados de una manera explícita (quizá por escrito). Pero incluso en estos casos, el plan ac túa más como una limitación externa sobre la conducta que como una rece ta completa para el éxito. 2º En cierto sentido, somos como mobots muy inte ligentes dotados de archivadores. Nuestra inteligencia se demuestra en la 17. Este terna se explora a fondo en el capítulo 1 O posterior. 18. Véanse los comentarios de Kirsh y Maglio ( 1994, pág. 515) acerca de la necesidad de redefinir el espacio de estados donde tiene lugar la planificación. 19. Agradezco a Caroline Baurn, directora de la Occupational Therapy Unit de la Was hington Univcrsity School of Medicine, por l'omunicarrne estos casos. Véanse Baurn, 1993 y Edwards y otros, 1994. 20. Véanse, por ejemplo, Suchman, ] 987 y I3ratrnan y otros, 1991.
Mente y mundo: la frontera plástica
1
109
capacidad de estructurar nuestro entorno y de operar activamente sobre él para simplificar nuestras tareas de resolución de problemas. Esta estructu ración y explotación activa va desde la simple utilización de distribuciones espaciales, pasando por el empleo de transformaciones específicas (mezclar las fichas de Scrabble, hacer girar los zoides del Tetris), hasta la producción de planes escritos explícitos que permiten reorganizar y cambiar el foco de atención con facilidad. Estos últimos casos comportan el empleo de la clase especial de estructuras externas formada por mapas, códigos, lenguajes y símbolos, estructuras que examinaremos con detalle en el capítulo 10. 3.5 Después del archivador Como hemos visto, las redes neuronales artificiales proporcionan un mo delo útil (aunque claramente parcial) de algunas de las estrategias computa cionales que los cerebros reales parecen desplegar. Estas estrategias hacen hincapié en la compleción de patrones y en la memoria asociativa a costa de las manipulaciones lógicas y simbólicas más familiares. Por tanto, el trabajo con las redes neuronales artificiales proporciona un valioso antídoto contra lo que se ha denominado «imagen de archivador» de la mente: la imagen de la mente como un almacén de símbolos pasivos, parecidos al lenguaje, que esperan ser recuperados y manipulados por una especie de unidad central de procesamiento neuronal. Con todo, quedan por eliminar algunos aspectos residuales de esta «imagen de archivador». Al igual que un archivador, la mente ha sido tratada con demasiada frecuencia como un recurso pasivo: como un órgano para clasificar y transformar datos de entrada pero que no está intrínsecamente orientado a actuar en el mundo. Esta falta de atención a los problemas y las posibilidades que acompañan a las acciones en el mun do real y en tiempo real se manifiesta de varias maneras. La elección de ám bitos de tareas muy abstractos (como generar las formas pretéritas de verbos ingleses) y el empleo de formas de codificación de entrada y salida muy arti ficiales, son síntomas de una imagen de la mente que, en esencia, la conside ra el órgano de una razón intemporal e incorpórea. Naturalmente, nadie ha pensado que la percepción, el movimiento y la acción carezcan totalmente de importancia. Todo el mundo está de acuerdo en que, tarde o temprano, estos factores se deberán tener en cuenta. Sin embargo, según la creencia más arraigada, los problemas adicionales que plantean estas cuestiones se pueden separar sin riesgo alguno de la tarea principal de comprender la mente y la cognición, y las soluciones a estos problemas más «prácticos» sim plemente se pueden «adjuntar» a los dispositivos de procesamiento de la ra zón incorpórea.
11 O I De excursión por la mente
Esta separación metodológica entre las tareas de explicar la razón y la mente (por un lado) y la acción en tiempo real y en el mundo real (por otro) es lo que la ciencia cognitiva de la mente corpórea se propone cuestionar. Cuando se abordan problemas del mundo real en su verdadero escenario y con toda su complejidad, se hace evidente que ciertos estilos de resolución de problemas simplemente no funcionan. Y los tipos de solución que sí fun cionan suelen fusionar los procesos de razonamiento y de acción de maneras inesperadas, atravesando una y otra vez los límites tradicionales entre men te, cuerpo y entorno. En cierto sentido, esto no nos debería sorprender. Nuestros cerebros evo lucionaron como controladores de unos cuerpos que se movían y actuaban en un mundo real (y con frecuencia hostil). Seguramente estos órganos evo lucionados desarrollaron unos recursos computacionales complcme11tarios de las acciones e intervenciones que controlaban. Después de todo, el cere bro así entendido no necesita mantener una réplica interna y a pequeña es cala del mundo que sustente exactamente los mismos tipos de operación y manipulación que habitualmente aplicamos sobre él. La responsabilidad del cerebro es ofrecer prestaciones complementarias que apoyen la explotación reiterada de operaciones sobre el mundo. Su tarea consiste en proporcionar procesos computacionales (como una potente compleción de patrones) que el mundo, incluso cuando es manipulado por nosotros, no suele ofrecer. 21 Entonces, ¿dónde se encuentra la mente� ¿Se encuentra realmente «den tro de la cabeza» o quizá ahora se ha extendido, de una manera un tanto li bertina, por el mundo? A primera vista, esta pregunta es extraña. Después de todo, cada cerebro individual sigue siendo la sede de la conciencia y la ex periencia. Pero, <'qué ocurre con la razón? Cada pensamiento es considera do por un cerebro. Pero ahora vemos que el/lujo de pensamientos y el éxito adaptativo de la razón dependen de interacciones reiteradas y cruciales con recursos externos. El papel de estas interacciones, en los casos que he desta cado, es claramente computacional e informacional: consiste en transformar entradas, simplificar búsquedas, contribuir al reconocimiento, estimular el recuerdo asociativo, descargar la memoria, etc. En cierto sentido, un ser hu mano que razona es un dispositivo cognitivo verdaderamente distribuido: re aliza llamadas a recursos externos para que lleven a cabo unas tareas de pro cesamiento específicas, de manera muy parecida a cuando un ordenador conectado a una red hace llamadas a otros ordenadores conectados para que 21. Naturalmentc, esto y,t no es c'strictamente cierto. Las mismas reJes neuronales artifi ciales constituyen recursos externos completadores de patrones (Churchland, 1995, capítulo 11). Además, otros agentes y animales también constituyen recursos de complcción de patro nes e�tcrnos al individuo. Vc'ase más información al respecto en el capítulo .J,
Mente y mundo: la frontera plástica 1 111
realicen unas tareas concretas. Por tanto, propongo que la demostración que hacen Kirsh y Maglio del papel de la acción epistémica tiene como conse cuencia una distribución correspondiente del mérito epistémico. El flujo de pensamientos o la generación de respuestas razonadas no son un mérito ex clusivo del cerebro. La colaboración entre cerebro y mundo es mucho más rica y está más impulsada por necesidades de computación e información de lo que se creía hasta ahora. Sería reconfortante suponer que esta imagen más integrada de la mente y el mundo no plantea ninguna amenaza a cualesquiera de nuestras ideas fa miliares sobre la mente, la cognición y el yo. Reconfortante, pero falso. Por que si bien los pensamientos concretos continúan estando vinculados a los cerebros individuales, el flujo de la razón y las transformaciones de informa ción que dicho flujo implica parecen entrecruzar el cerebro y el mundo. Sin embargo, sospecho que este flujo de ideas es lo que la mayoría de nosotros asocia con más fuerza con la idea de la mente como sede de la razón y del yo. Este flujo es más importante que las instantáneas que nos ofrecen los pensa mientos o las experiencias aisladas.22 Corno veremos, el verdadero motor de la razón no está delimitado ni por la piel ni por el cráneo.
22. El epílogo ilustra esta afirmación considerando el papel del cerehro en la generación de uoa complej,1 corriente
4
Sabiduría colectiva al estilo de los hongos mucilaginosos
4.1 Aquí llega el mucílago Es la primavera del año 1973 y el tiempo ha sido anormalmente húme do. Al mirar por la ventana que da al jardín, nuestra mirada es atraída por una proliferación de masas redondeadas de un intenso color amarillo. ¿Qué podrán ser? Intrigados, intentamos volver a trabajar pero somos in capaces de concentrarnos. Un poco después volvemos a mirar por la ven tana. Las masas gelatinosas de color amarillo siguen ahí, pero podríamos jurar que se han movido. Tenemos razón. Sin prisa, pero sin pausa, estos seres desconocidos se arrastran por el jardín y trepan por el poste telefóni co, acercándose a nosotros. Llenos de espanto, telefoneamos a la policía para comunicarles la probable visión de formas de vida extraterrestre. Pero en realidad lo que hemos visto (como han visto muchas otras perso nas) es un ser totalmente terrestre, aunque con un ciclo de vida ciertamen te muy extraño: se trata del Fuligo septica, un tipo de hongo mucilaginoso acelular.1 Existen hongos mucilaginosos de muchas variedades2 y tamaños, pero to dos pertenecen a la clase de los micetozoos. El nombre es revelador, ya que combina «miceto» (hongo) y «zoos» (animales). Les gustan los ambientes húmedos y suelen encontrarse sobre troncos podridos..., tocones o en mon tones de restos vegetales en descomposición. Su distribución geográfica es muy extensa y no parece limitarse a unos climas específicos. Como se dice en l. Esta historia se basa en informes de Alexopoulos y Mims, 1979 y Farr, 1981. 2. Existen dos tipos principales de hongos mucilaginosos: los acelulares, donde las célu las se fusionan para formar una masa multinuclear y los celulares, donde las células se agrupan pero nunca se fusionan y donde la masa multicelular forma un cuerpo móvil (denominado ba bosa en ocasiones). Véase el capítulo 1 de Ashworth y Dee, 1975.
114
1
De excursión por la mente
un manual, «muchas especies tienden a aparecer en cualquier lugar, de ma nera inesperada» (Farr, 1981, pág. 9). De interés especial es el ciclo de vida de los hongos mucilaginosos «celu lares». Tomemos, por ejemplo, la especie Dictyostelium discoideum, 3 descu bierta por primera vez en 1935, en Carolina del Norte. El ciclo de vida del D. discoideum empieza con lo que se denomina una fase vegetativa, donde las células del hongo mucilaginoso existen individualmente, como las ame bas (se llaman mixoamebas). Mientras las fuentes locales de alimento duran (las mixoamebas se alimentan de bacterias), las células crecen y se dividen. Pero cuando las fuentes de alimento se agotan, ocurre una cosa verdadera mente extraña. Las células empiezan a agruparse formando una masa con as pecto de tejido llamada pseudoplasmodio. Aunque pueda parecer increíble, el pseudoplasmodio es un ser colectivo móvil, una especie de babosa en minia tura (figura 4.1) que puede arrastrarse por el suelo. 4 Es atraído por la luz y si gue gradientes de temperatura y humedad. Estas señales le ayudan a encontrar un lugar con más alimento. Cuando encuentra un lugar adecuado, el pseudo plasmodio vuelve a cambiar de forma, esta vez diferenciándose por medio de un tallo y un cuerpo fructífero con una masa de esporas que comprende unos dos tercios del número total de células. Cuando las esporas se propagan, el ci clo vuelve a empezar con una nueva población de mixoamebas. ¿Cómo saben agruparse las células individuales (mixoamebas) del hon go mucilaginoso? Una solución -el equivalente biológico de un planificador central (véase el capítulo 3)- sería qll''. la evolución hubiera elegido unas «células líder». Estas células estarían especialmente adaptadas para «lla mar» a las otras células, probablemente por medios químicos, cuando el ali mento empezara a escasear y, de alguna manera, orquestarían la construc ción del pseudoplasmodio. Sin embargo, parece que la naturaleza ha optado por una solución más «democrática». De hecho, las células del hon go mucilaginoso parecen comportarse como las hormigas descritas en el apartado 2.3 anterior. Cuando el alimento escasea, cada célula libera un compuesto químico (AMP cíclico) que atrae a otras células. A medida que las células se van agrupando aumenta la concentración de AMP cíclico, que atrae a más células. Por tanto, un proceso de retroalimentación positiva conduce a agrupación de las células que constituyen un pseudoplasmo dio. Como comenta Mitchel ResniGk (1994, pág. 51), este proceso es un buen ejemplo de lo que se conoce como autoorganización. En los sistemas autoorganizados emergen pautas de nivel superior a partir de las interne-
fa
3. La explicación sobre el D. discoideum se basa en Ashworth y Dee, 1975, págs. 32-36. 4. Los hongos mucilaginosos acelulares como el Fuligo septico no forman una babosa mó vil. En cambio, el plasmodio emigra mediante corrientes de protoplasma.
Sabiduría colectiva al estilo de los hongos mucilaginosos
1
115
FIGURA 4.1 Agrupaciones migradoras (pseudoplasmodios) de un hongo mucilagi noso celular. Fuente: Morrissey, 1982. Reproducido con la autorización de Academic Press.
ciones
116
1
De excursión por la mente
4.2 Dos formas de emergencia La emergencia de fenómenos nuevos a partir de una actividad colectiva (sin líderes ni controladores centrales) se puede producir, por lo menos, de dos maneras. La primera, a la que denominaré emergencia directa, se basa principalmente en las propiedades de los elementos individuales (y en sus re laciones mutuas); en este caso, las condiciones ambientales sólo desempeñan un papel de contexto. La emergencia directa puede implicar múltiples ele mentos homogéneos (como cuando emergen la temperatura y la presión a partir de las interacciones entre las moléculas de un gas), o puede implicar elementos heterogéneos (como cuando emerge agua a partir de las interac ciones entre moléculas de oxígeno y de hidrógeno). La segunda forma de emergencia, a la que denominaré emergencia indirecta, también se basa en las interacciones de elementos individuales pero requiere que estas interaccio nes estén mediadas por unas estructuras ambientales activas y, con frecuen cia, bastante complejas. Por tanto, la diferencia reside en la medida en que podemos comprender la emergencia de un fenómeno dado centrándonos, principalmente, en las propiedades de los elementos individuales (emergen cia directa) o en la medida en que la explicación del fenómeno requiere aten der a detalles bastante específicos del entorno. Esta distinción está lejos de ser absoluta puesto que todos los fenómenos se basan en mayor o menor me dida en condiciones ambientales contextuales. (Se puede hacer un poco más precisa formulándola en función de l0s papeles explicativos de diferentes ti pos de «variables colectivas»; véase el capítulo 6). Pero podemos obtener una impresión intuitiva básica de esta diferencia examinando algunos casos sencillos. Un ejemplo clásico de emergencia directa es el familiar fenómeno de los atascos de tráfico. Puede producirse un atasco aun cuando no se pueda cul par de ello a ningún suceso externo inesperado (como una colisión o una se rie de semáforos averiados). Por ejemplo, mediante unas sencillas simulacio nes, Mitchel Resnick5 demuestra que se producirá un embotellamiento si cada automóvil sigue simplemente dos reglas intuitivas: «Si nos vamos acer cando al vehículo que tenemos delante, reduciremos la velocidad; si no, la aumentaremos (salvo si ya hemos alcanzado la velocidad máxima permiti da)» (Re�nick, 1994, págs. 69, 73 ). Pero cuando se siguen estas dos reglas y no hay ningún obstáculo externo, ¿por qué el tráfico no acelera hasta la má xima velocidad permitida y se queda ahí? La respuesta se encuentra en las 5. Aquí, como en los apartados 4.1 y 4.2, sigo a Mitchel Resnick cuyo libro Turtles. Ter mites, and Tra//ic Jams (1994) es a la vez un modelo de claridad y un poderoso testimonio del alcance y la fuerza del pensamiento descentralizado.
Sabiduría colectiva al estilo de los hongos mucilaginosos 1 117
posiciones iniciales. Al principio de la simulación, la distancia entre los au tomóviles que circulan por la carretera es aleatoria. Por tanto, en ocasiones un automóvil empieza a acercarse a otro y pronto debe reducir la velocidad; esto hace, a su vez, que el vehículo que tiene detrás también reduzca la suya. El resultado final es una mezcla de tramos de tráfico rápido y de tráfico len to. De vez en cuando un automóvil sale del atasco, acelerando y dejando es pacio para el que tiene detrás. Pero con la misma rapidez con que el embo tellamiento se «desatasca» en una dirección, crece en la otra a medida que se incorporan nuevos automóviles por detrás y se ven obligados a reducir la marcha. Aunque cada vehículo avanza hacia adelante, el atasco de tráfico en sí, considerado como un tipo de entidad de orden superior, ¡ se mueve hacia atrás! Por tanto, esta estructura de orden superior (a la que Resnick deno mina estructura colectiva) muestra una conducta fundamentalmente diferen te de la conducta de sus componentes. De hecho, los componentes no dejan de cambiar (a medida que unos vehículos van saliendo y otros nuevos se van incorporando), pero la integridad del colectivo de orden superior se conser va. (De una manera similar, el cuerpo humano no siempre está formado por la misma masa de materia: las células mueren y son reemplazadas por otras nuevas construidas a partir de la energía obtenida de los alimentos. También nosotros somos colectivos de orden superior cuya materia constituyente se encuentra en flujo constante.) Los atascos de tráfico se consideran casos de emergencia directa porque el necesario telón de fondo ambiental (las dis tancias variables entre los vehículos) es mínimo: seguramente el espaciado aleatorio es la condición por defecto y no requiere ninguna manipulación ambiental especial. Sin embargo, la emergencia indirecta es intuitivamente muy diferente, como veremos a continuación. Consideremos el siguiente ejemplo: tenemos que acordarnos de com prar una caja de latas de cerveza para una fiesta. Para refrescarnos la me moria, colocamos una lata de cerveza vacía sobre el felpudo de la puerta. Cuando volvemos a salir de casa, tropezamos con la lata y nos acordamos de nuestra misión. Hemos empleado lo que a estas alturas ya es un truco familiar (recordemos el capítulo 3): explotar algún aspecto de la realidad como sustituto parcial de la memoria incorporada. De hecho, hemos em pleado una alteración de nuestro entorno para comunicarnos algo a noso tros mismos. Este truco de emplear el entorno para provocar acciones y co municar señales figura en muchos casos de lo que yo denomino emergencia indirecta. Tomemos la conducta de construcción de algunas termitas. La conducta de construcción de una termita supone modificar su entorno local en res puesta a los estímulos proporcionados por alteraciones previas del entorno realizadas por otras termitas o por la misma termita en otra ocasión. Dicho
118 1 De excursión por la mente
de otra manera, la construcción de un termitero está bajo el control de lo que se conoce como algoritmos estigmérgicos. 6 Un ejemplo simple de estigmergia es la construcción de arcos (un aspec to básico de los termiteros) con pelotillas de barro. He aquí cómo funciona este proceso: 7 todas las termitas hacen pelotillas de barro que, al principio, depositan al azar. Pero cada pelotilla incluye una señal química añadida por la termita. Las termitas prefieren dejar caer las pelotillas donde la señal quí mica es más fuerte. Por tanto,es probable que las pelotillas nuevas se depo siten encima de las antiguas,generándose entonces una fuerza de atracción aún mayor (¡sí,es la historia de siempre!). De esta manera se van formando columnas. Cuando dos columnas están muy próximas entre sí, las señales químicas de la columna vecina influyen en la conducta de soltar las peloti llas,incitando a los insectos a añadir barro en el lado de cada columna que encara a la otra. Este proceso continúa hasta que las puntas de las columnas se inclinan la una hacia la otra y se forma un arco. El producto final de una gran cantidad de estigmergias distintas es una estructura compleja de celdi llas,cámaras y túneles. En ningún punto de este prolongado proceso se sigue o se representa un plano del termitero. Ninguna termita actúa como líder durante la construcción. Ningún termita «sabe» nada, salvo responder cuan do se encuentra con una pauta específica en su entorno local. Las termitas no se hablan entre sí de ninguna manera, salvo mediante los productos am bientales de su propia actividad. Esta coordinación basada en el entorno no requiere ninguna codificación o descodificación lingüística y no impone car ga alguna a la memoria; además, las «señales» persisten aunque el individuo responsable de las mismas se haya ido a hacer otra cosa (Beckers y otros, 1994,pág.188). Resumiendo: aprendemos lecciones importantes incluso a partir de estos casos simples de emergencia de fenómenos colectivos. Estos fenómenos se pueden producir de maneras directas o muy mediadas por el entorno. Pue den sustentar conductas adaptativas complejas sin necesidad de líderes,di seños o planificadores centrales. Y pueden manifestar rasgos característicos totalmente diferentes de los -rasgos de los individuos cuya actividad reflejan. En el siguiente apartado veremos estas conductas en un contexto más fami liar: el de la actividad humana.
6. «Estigmérgico», una combinación de «estigma» (señal) y «ergon» (trabajo), implica la utilización del trabajo como señal para más trabajo. 7. Véame Grasse, 1959 y Beckcrs y otros, 1994.
Sabiduría colectiva al estilo de los hongos mucilaginosos 1 119
4.3 Tripulaciones marinas En la investigación más prolongada y con más éxito realizada hasta la fe cha sobre bs propiedades cognitivas de grupos humanos, Edwin Hutchins -antropólogo, científico cognitivo, marinero y oficial de derrota en regatas a mar abierto- ha descrito y analizado el papel de las estructuras externas y de las interacciones sociales en la navegación en alta mar. He aquí su descrip ción de cómo se realizan y coordinan algunas de las tareas necesarias (Hut chins, 1995, pág. 199; la nota al pie� es mía): De hecho, es posible que el equipo [de navegación] organice su conducta en una secuencia adecuada sin que exista un guión o un plan global en ninguna par te del sistema.' Cada miembro de la tripulación sólo necesita saber qué debe hacer cuando se producen ciertas condiciones en el entorno. Un examen de los debe res ele los integrantes de la tripulación muestra que muchos de ellos se especifi can en la forma <>. He aquí algunos ejemplos extraídos de los procedimientos: A. Hacer sondeos y enviarlos al puente cuando se soliciten. B. Anotar hora y profundidad cada vez que se envíe un sondeo al puente. C. Medir y comunicar las demoras en relación con los objetos especificados por el piloto cuando éste lo ordene. Al parecer, cada miembro de la tripulación sólo debe seguir una especie de procedimiento estigmérgico9 esperando que una alteración del entorno local (como la colocación de una carta de navegación concreta sobre una mesa, la llegada de una petición verbal o el sonido de una campana) motive una conducta específica. Esa conducta, a su vez, influirá en el entorno local de otros miembros de la tripulación, provocará nuevos arranques de activi dad y así sucesivamente, hasta que la tarea se haya realizado. Naturalmente, estamos hablando de agentes humanos que se formarán ideas y modelos mentales del proceso global. Y como comenta Hutchins, esta tendencia general hace que el sistema sea más robusto y flexible, porque 8. De hecho. en muchos navíos existe un plan formal. Pero los miembros de la tripubción no lo emplean explícitamente para estructurar sus acciones; en realidad, como sugiere Hut chins (1995, pág. 178), el plan no funcionaría aunque lo hicieran. 9. La verdadera estigmergta requiere una falta total de flexibilidad de respuesta en pre sencia de una condición desencadenante. Por tanto, la actividad humana. en general, sólo es cuasi estigrnérgica. Lo común es el empleo de condiciones ambientales como instigadoras de la acción y la capacidad global del grupo para realizar una actividad de resolución de pro blemas que sobrepasa el conocimiento y el alcance compurncion,t! de cada miembro por se parado.
!
120
1
De excursión por la mente
los individuos pueden supervisar mutuamente su actividad (por ejemplo, pi diendo una demora que no se haya dado a tiempo) y, si es necesario, pueden encargarse de otras tareas (por ejemplo, si alguien cae enfermo). Sin embar go, ningún miembro de la tripulación tendrá interiorizados todos los cono cimientos y habilidades pertinentes. Además, vemos que una gran cantidad de trabajo la llevan a cabo, una vez más, estructuras externas: reglas de cálculo náuticas, alidadas, registros de demora, transportadores, cartas de navegación, sondas, etc. 111 Estos dis positivos cambian la naturaleza de ciertos problemas computacionales, ha ciendo que sean más fáciles de abordar por unos cerebros que tienden a la percepción y la compleción de patrones. La regla de cálculo náutica, que es el ejemplo favorito de Hutchins, convierte operaciones matemáticas com plejas en operaciones de alinear escalas en el espacio físico. 11 Por último, y recordando temas del capítulo 3, diremos que el espacio de trabajo mismo para la navegación está estructurado para reducir la comple jidad de la resolución de problemas. Por ejemplo, las cartas que se emplean para atracar en un puerto dado están reunidas en un tablero de cartas y co locadas unas sobre otras en el orden en que se van a utilizar (la que primero se necesite, encima de las restantes). Según Hutchins, todos estos factores se unen para posibilitar que el sis tema global formado por artefactos, agentes, el mundo natural y la organiza ción espacial, resuelva el problema de navegar. La conducta global (en el ni vel de la embarcación) no está controlada por un plan detallado en la cabeza del capitán. El capitán puede establecer los objetivos, pero la secuencia de reunir y transformar información para alcanzar estos objetivos no necesita representarse explícitamente en ningún lugar. En cambio, la potencia y la pericia computacionales necesarias se distribuyen por todo un conjunto he terogéneo de cerebros, cuerpos, artefactos y otras estructuras externas. Así navegan los cerebros que completan patrones por mares hostiles y matemá ticamente exigentes. 4.4 Las raíces de la armonía Pero, ¿cómo se produce esta' delicada armonización entre cerebros, cuer pos y mundo? En los casos de lo que he llamado emergencia directa, este 10. Hutchins (1995, capítulo 3) los describe de forma detallada. Un,i alidada es un dispo sitivo telescópico para dirigir visuales; los transportadores son semicírculos graduados que se emplean para trazar líneas o ángulos sobre cartas de navegación. 11. Véanse la pág. 171 de Hutchins, 1995 y los capítulos 3 y 10 de este libro.
Sabiduría colectiva al estilo de los hongos mucilaginosos 1 121
problema es menos acuciante porque las propiedades colectivas están direc tamente determinadas por la acción masiva de una tendencia individual uni forme. Por ejemplo, si la naturaleza hiciera evolucionar -¡nos libren los dio ses!- vehículos y carreteras (partiendo de una distribución inicial aleatoria y de las dos reglas expuestas en el apartado 4.2 anterior), inmediatamente se producirían embotellamientos de tráfico. A primera vista, la emergencia indirecta plantea un enigma mayor. En los casos de este tipo, la propiedad que hay que alcanzar (por ejemplo, la cons trucción de un termitero o navegar con éxito) surge a partir de interacciones múltiples y con frecuencia variadas entre un conjunto de individuos y un en torno estructurado con gran complejidad. Los individuos están aparente mente construidos o diseñados para que su dinámica, coordinada con estos entornos complejos, produzca un éxito adaptativo. En estos casos no hay ningún individuo que deba conocer un plan al completo. Sin embargo, en cierto sentido el sistema global está bien diseñado. Constituye un método ro busto y computacionalmente económico de lograr la conducta deseada. La pregunta ahora es, ¿cómo se produce este diseño? Para el sistema nervioso de cada una de las termitas, una parte impor tante de la respuesta 12 es, evidentemente, «mediante la evolución». Hutchins propone que en el grupo que forma una tripulación también puede estar ac tuando una especie de proceso cuasi evolutivo. La característica clave es, simplemente, que se producen cambios pequeños sin una actividad de dise ño previa y que estos cambios tienden a conservarse en la medida en que me joren el éxito biológico. Por tanto, los cambios evolutivos implican un acre cimiento gradual de pequeños cambios «oportunistas»: cambios que, a su vez, alteran el «paisaje adaptativo» para cambios posteriores, tanto para la misma especie como para otras especies que habiten en el mismo ecosistema. Ahora, y siguiendo todavía a Hutchins, consideremos el caso donde un colectivo cognitivo establecido (como una tripulación) se enfrenta a un reto nuevo e inesperado. Supongamos que este reto exige una respuesta rápida y que no hay tiempo para que el grupo se reúna y reflexione sobre la mejor manera de abordarlo. 13 En estas condiciones, ¿cómo puede descubrir el gru po una nueva división social del trabajo que responda a las exigencias del en12. No deseo (ni necesito) incurrir en una petición de principio acerca de las contribu ciones relativas de la variación ciega y la selección natural por un lado, y de propiedades de au toorganización más fundamentales de la materia, los compuestos químicos y las células, por otro. Véanse planteamientos al respecto en Kauffman, 1993; el capítulo 8 de Dennett, 1995 y las págs. 180-214 de Varela y otros, 1991. Gracias a Arantza Etxeberria por ayudarme a acla rar esta importante cuestión. 13. Hutchins (1995, capítulo 8) explica con detalle un caso concreto en el que un sistema de propulsión de una embarcación fracasó inesperadamente en un momento crítico.
1
122 1 De excursión por la mente
torno? Lo que realmente sucede, como demuestra Hutchins, es que cada miembro del grupo trata de Jesempefiar las funciones básicas necesarias para evitar que la embarcación encalle; sin embargo, al actuar así, cada miembro limita la actividad de los demás e influye en ella, en una dinámica que equivale a una búsqueda colectiva y en paralelo Je una división del tra bajo nueva y al mismo tiempo eficiente desde el punto de vista computacio nal. Por ejemplo, cuando un miembro de la tripulación se da cuenta de que no tiene tiempo suficiente para hacer una suma crucial, le encarga el cálculo a otro tripulante. Esto, a su vez, desencadena otros efectos. La solución al problema Je evitar el desastre surge como una especie de punto de equili brio en una serie repetida de negociaciones locales centradas en la distribu ción de tareas, un punto de equilibrio que está determinado tanto por las ha bilidades de los individuos como por la frecuencia y la secuencia de los datos de entrada. Ningún miembro de la tripulación reflexiona sobre un plan glo bal para redistribuir las tareas. En cambio, cada tripulante hace lo que sabe hacer mejor, negociando cualquier ayuda local o cambio de procedimiento que necesite. En estos casos se produce una búsqueda rápida y en paralelo de una respuesta colectiva coherente, pero esta búsqueda no implica ningu na representación localizada y explícita del espacio de las soluciones globa les posibles. En este sentido, como observa Hutchins, la nueva solución se encuentra mediante un proceso más semejante a la adaptación evolutiva que al disefio racionalista global. He aquí una versión algo más s<'ncilla de la misma idea: 14 imaginemos que nuestra tarea consiste en determinar el trazado óptimo de unos senderos para conectar entre sí un complejo de edificios ya construidos (por ejemplo, el nuevo campus de una universidad). La estrategia usual es el disei'ío racio nalista global, donde una persona o un grupo pequei'ío consideran la utiliza ción de los diversos edificios, los números de viandantes, etc, y buscan una pauta de enlaces óptima que refleje las pautas de uso probable. Sin embar go, una solución alternativa sería establecer el campus sin ningún sendero y cubriendo de césped todos· los espacios entre los edificios. Al cabo de unos meses, empezarán a surgir senderos que reflejarán tanto las verdaderas ne cesidades de los usuarios como la tendencia de las personas a seguir sende ros incipientes. Al cabo de un tiempo, los senderos más marcados se podrán pavimen'tar y el problema se habrá resuelto sin que nadie haya tenido que considerar el problema global de encontrar una distribución óptima de los senderos o haya necesitado saber o representar los usos a los que se destinan todos los edificios. La solución se habrá encontrado por medio de una serie interactiva de cálculos aislados pequei'íos como, por ejemplo, «Tengo que ir 14. Tuve noticia de este t'jcmplo por primera vez a través de Aaron Sloman.
Sabiduría colectiva al estilo de los hongos mucilaginosos 1
123
desde aquí hasta los comedores: ¿cómo lo haré?» y «Tengo que llegar al la boratorio de física lo antes posible: ¿cómo lo hago?». El efecto acumulado de estas múltiples decisiones locales resuelve el problema global de una for ma que se parece más a una especie de evolución que a un diseño centraliza do clásico. Al parecer, la necesidad de explicar los orígenes del éxito colectivo no nos obliga a volver a la imagen de un agente planificador central que conoz ca la forma del espacio de problemas global. De hecho, en ocasiones pode mos estructurar nuestro propio entorno de resolución de problemas como una especie de subproducto de nuestra actividad básica de resolución de problemas. En nuestro campus hipotético, los primeros viandantes estruc turan el entorno como un subproducto de sus propias acciones, pero los viandantes posteriores se encontrarán con un entorno ya estructurado que, a su vez, puede ayudarles a resolver, precisamente, los mismos problemas.15 4.5 Modelos de la mente oportunista Espero que estos primeros capítulos hayan transmitido una impresión cada vez más clara del carácter oportunista de gran parte de la cognición biológica. Cuando el cerebro biológico se enfrenta a las fuertes limitaciones temporales propias de la acción en el mundo real y sólo dispone de un estilo de cómputo incorporado bastante restrictivo y orientado a la compleción de patrones, aceptará toda la ayuda que pueda conseguir. Esta ayuda incluye el empleo de estructuras físicas externas (tanto naturales como artificiales), el empleo del lenguaje y de instituciones culturales (véanse también los ca pítulos 9 y 10) y el empleo abundante de otros agentes. Sin embargo, reco nocer la naturaleza oportunista y extendida en el espacio-tiempo de la ver dadera resolución de problemas equivale a exponerse a una potencial pesadilla metodológica. ¿Cómo podemos estudiar y comprender estos siste mas extendidos, complejos y a menudo construidos de una manera poco o nada intuitiva? Existe una metodología científica cognitiva clásica que, claramente, no /unciont1 en estos casos. Es la metodología de la reconstrucción mcional, que consiste en formular inmediatamente cada problema en función de un siste ma abstracto de relaciones entre entradas y salidas, y buscar una solución óptima para el problema así definido. Aunque es probable que, en principio, esta metodología nunca haya sido defendida ni siquiera desde la inteligencia 15. Compárese con el tratamiento de unas hormigas en una playa llevado a cabo por Hut chins ( 1 LJLJ5, pág. 169).
124 1 De excursión por la mente
artificial clásica, sí que parece haber dado origen a un gran corpus de inves tigación.16 Pensemos en todas esas investigaciones sobre micromundos abs tractos: jugar a
Sabiduría colectiva al estilo de los hongos mucilaginosos 1
125
error al ocultar el papel de la historia en la constricción del espacio de solu ciones biológicamente plausibles. Como veremos en el capítulo 5, la natura leza está muy límita
¡I I'
Así interpretado, el estudio de la cognición activa y corpórea plantea cla ramente unos importantes retos conceptuales y metodológicos. Entre ellos se incluyen (aunque no son todos) los siguientes: El problema de la tratabilidad. Ante esta visión radicalmente promiscua de la cognición, siempre escurriéndose hacia su entorno local, ¿cómo pode mos aislar fenómenos tratables para poderlos estudiar? Este desenfrenado li beralismo cognitivo, ¿no hace que resulte absurda la esperanza de encontrar una ciencia genuina de la mente? El problema de la cognición avanzada. ¿Hasta qué punto podemos espe rar llegar con una concepción descentralizada
,¡ 1
126 1 De excursión por la mente
Además, ¿qué ocurre con la visión de la razón individual misma? ¿Qué ima gen de la elección y la toma de decisiones racional está implícita en una vi sión radicalmente emergentista y descentralizada del éxito adaptativo? El problema de la identidad. ¿Qué lugar ocupa en todo esto la persona in dividual? Si los procesos cognitivos y computacionales entrecruzan afanosa mente los límites de la piel y el cráneo, ¿implica esto alguna extensión corre lativa de la identidad personal hacia el entorno local? Dicho de una manera menos misteriosa, ¿implica esto que los cerebros y los organismos indivi duales no son objetos apropiados para el estudio científico? Desde luego, conclusiones como éstas serían bastante difíciles de discernir. Nos encontramos aquí con una mezcla de inquietudes prácticas (¿cómo podemos estudiar la mente corpórea y embebida?), problemas sin resolver (¿funcionará el mismo tipo de explicación para la cognición verdaderamen te avanzada?) y anomalías conceptuales (una cognición escurridiza, ¿implica personas escurridizas? Los cerebros, ¿son en algún sentido objetos inade cuados para el estudio?). En los capítulos restantes abordaré todas estas cuestiones. Especialmente trataré de responder de manera detallada a las in quietudes prácticas y metodológicas (capítulos 5-7), trataré de aclarar los problemas conceptuales (capítulos 6 y 8) y empezaré a abordar el acuciante pro blema de la cognición avanzada (capítulos 9 y 10). Propondré que la clave para integrar los datos sobre la cognición avanzada con la visión de una cog nición activa y corpórea reside en comprender mejor los papeles de dos an damiajes o apoyos externos muy especiales: el lenguaje y la cultura. En resumen: la muerte de la reconstrucción racional crea una especie de vacío conceptual y metodológico. Nuestra tarea consiste ahora precisamen te en llenar este vacío. Intermedio: una historia condensada La ciencia cognitiva, tal como se ha esbozado en los capítulos preceden tes, se puede contempbr.como una progresión en tres etapas. La primera (el apogeo del cognitivismo clásico) describía la mente en función de un dispo sitivo logico central, unas bases de datos simbólicas y algunos módulos peri féricos «sensoriales». L1s características fundamentales de esta visión in cluían estas ideas: la memoria como recuperación de una base de datos simbólica almace nada, la resolución de problemas como una inferencia lógica,
Sabiduría colectiva al estilo de los hongos mucilaginosos 1 127
la cognición como un proceso centralizado, el entorno como un (simple) ámbito de problemas, y el cuerpo como periférico de entrada. La revolución conexionista (redes neuronales artificiales) tenía como ob jetivo sustituir las tres primeras características por las siguientes: la memoria como re-creación de patrones, la resolución Je problemas como compleción y transformación de dichos patrones, y
la cognición como un proceso progresivamente descentralizado. Sin embargo, este replanteamiento radical de la naturaleza del dispositi vo cognitivo interno estaba acompañado, en gran medida, de una aceptación tácita de la clásica marginación del cuerpo y el mundo. A este clasicismo re sidual se enfrentan directamente las investigaciones antes presentadas. En estas investigaciones se mantienen los principios más generales de la con cepción conexionista, aunque potenciados por las siguientes imágenes: una imagen del entorno como recurso activo cuya dinámica intrínseca puede desempeñar importantes funciones en la resolución de problemas, y
una imagen del cuerpo como parte del bucle computacional. Tomarse en serio de esta manera el cuerpo y el mundo inYita a adoptar una perspectiva emergentista en relación con muchos fenómenos fundamen tales; equiYale a considerar que el éxito adaptativo es tan inherente a las complejas interacciones entre cuerpo, mundo y cerebro como a los procesos internos limitados por la piel y el cráneo. Sin embargo, los desafíos a los que se enfrenta este enfoque son numerosos y profundos. El más crucial es la acuciante necesidad de equilibrar de alguna forma el tratamiento de la apor tación interna (centrada en el cerebro) y el tratamiento de los factores exter nos, de u11;1 manera que haga justicia a cada cual. Este problema se maní-
128 1 De excursión por la mente
fiesta como una serie de inquietudes de cariz bastante abstracto, aunque son inquietudes con importantes consecuencias concretas para la dirección y la metodología de una ciencia de la mente corpórea. Estas inquietudes in cluyen: encontrar el vocabulario adecuado para describir y analizar los procesos que entrecruzan el límite agente/entorno, aislar para su estudio sistemas adecuados a gran escala y motivar alguna descomposición de estos sistemas en partes y procesos componentes que interaccionen entre sí, y
comprender expresiones familiares como «representación», «computa ción» y «mente» de maneras que encajen con la nueva imagen (o, si no, rechazar por completo estas expresiones). En resumen: ¿cómo debemos concebir el tipo de fenómenos que hemos expuesto y cuántas de nuestras viejas ideas y prejuicios tendremos que aban donar para hacerlo? A esta cuestión se dedica la segunda parte.
Segunda parte EXPLICAR LA MENTE EXTENDIDA
Nuestro propio cuerpo está en el mundo como el corazón en el organismo... forma un sistema con él. MAURlCE MERLEAU-PONTY, Phenomenology o/ Perceptlon. Versión en castellano del pasaje traducido al inglés por David Hilditch en su tesis doctoral (Universidad de Washington, 1995).
··-
L,\r.:1.:-.A 1. Hqm:kn1;1d,�n l1i,lim,:1)sional ,11: b 001'IC'.C'I cc;x:brn.l >'delos prindpalcs centros vis1..1:1les subconic:1k-s dd macaco. t:t flgura alx-m::1 10do el h1:misforio dcr1:cho, ¡:.,�111..:: "''"' r;,,�·t, y <:"�?1,,i1, !.,d,! ''J" E1,,:t1. KMk C::o!l:ont 'J C.dl
Ln \11 ,'-/• 2. l{<·s¡m..:�111$ ,!..,, d\l< ,:i:Jul:,� ,Je V4 :1 Jift,cnt<.'1' pZ!u!;1s t::i:1 1 1: 1:.. C.:u!.1 icum• 1\'p,x•,;.¡;nrn un �'lilinwl,;• \'isu:11 p,micuhr y ...u evlút 1v1m::;<.'l11:11:, í('SJ)u�·sta media :l cs...· .:/.IÍ1ll11!11 en 1'1d:1,·ibu n•u In fr(•i;ue:u:ia ('Spom,i· 1:c.t ,le J(,n,!111 t•mpl<·1m,!,, 1-ii (�<.·;1):1 de c<.•lor mos1rJd:l :111ib::i. :\) 11curorn1 eon 111m ,�,. puc!>l :1 m:ixim;t :11lh: ó!Í1nulv., ¡,ulmx-s, <.'SP<-'L·i.1l111c111e ,._•�pirnl L"i,:,; mud10 m.::11us :tlltc H"jill.1:- hfpcrl"K>lk:•S r ":11-cesi:in:1s (mo...lit'kudl', L'<,n u11tori�11<·it'•11 d,· Gi,1111111 >' 11!1'<:'$, 199;). Bl 1wum11.1 (.:•n ,m,,. r.:�pUL"'Slll m:ixim:, .1ntc l'Stimc!lúi- hi¡x::l xiiic,� ,-.,u (r,:. C"Ul'lldai- l':il):1t'.i:,ks ti.: b:,j:,:." n11,,l,:rnd11s
1,..,-,i,· ,..., . , ,....,, ., l c;,,Um,. l'n-1.n.•¡,u,i!•..:i..l, ¡wr r.·11111,•,u ,!., l).¡,·kl , .,.,. (..,,,,, �,.. k l;:,Um1 >·('.:ll 1'11: ,•
LÁMI?\' ,\ ;. /min m!n)5. f(ll<'.>J:Uth<11: S,:s1 ()µfo>: r�r;,J�i,IJ {'*'� 1:�·m¡ll·�11,I,: S;rm O�J..-,� > '"" 11, JVt•>:iiw.:il'A d,· sa�nlil'k-:\11!,·,it""" lrx-.
t
2
({,.)
3
4
,. �· �·... .'
L,�MINA -l. Un colC'l!l�.o �·nC.rgko .sc�ui-:lo C'n nipicl:1 f.UCL-siún porúltú en b din:tdlSII cn111r111Í¡1 prJ1u'('. un fru:fté im¡mlf.n huL ..¡11 :uld:mlc. r 11rn1 ft,.;nm 111:ernl dt:1>vi!1d11. :1.unqm: 111,,neiablc (4), Fu.-r.:c: T1it:u,·,fylfou y ·r,h,�:�íy!lm,. l'J'J'S; ,.,,.,,..,_1,,,.;.!11 rm p:onik-o ,!,: M,$,l· C, :;, Tri,,nuf!B:mrik;m.. ,rfk ,\IM'lf.:l.!l. lu,:.
5
Robots en evolución
5.1 Las elusivas estratagemas de la menle corpórea y embebida ¿C6mo dchc:ri: 1mos cstudi:1; b mcnrc ('ótpOr1.·a y cmbebid;1? í.:'.st,;,- pro l)J,:1)w se conviene: i::n apn::miantc .:u:mdo n0s d:1mos cucntl'! de que 1:is SO· ludones Je fa mu urnfcz:1 suc:foo <.'(Infundir l:1s im:i!te1)(:$. por bs <1uc nos .l;Uiamos }' b1.11.'h11• fos nítidas I rc1lido ¡'l<>r l;1 01tturnk.,,:1 que debe cons,ruir m1cvus soluciones)' C.'itrntcgi11s ;11.fap;:11iv:is 1>1uci i:11do d<' los rccurs.os. cognitivos y dd h,,rdw,m: c:>:istCl\tt".S, Y como hc:mos vislo, cs1:i p<1tl'1h·i:ldo por l:t di�1)onibiliJ11.d :1dm�tros d<: ,1rcial consis1e o . 1ufo... <: l: d 1.'lllplco de un:1 <,vc,/u('/(1,, s/1md,ul11 como m�di<., pam p.cncr:1r sis•
1
132 1 Explicar la mente extendida
temas de control para robots (verdaderos o simulados). La evolución simu lada (como el aprendizaje de redes neuronales) promete ayudarnos a reducir el papel de nuestras predisposiciones y prejuicios racionalistas en la búsque da de soluciones eficientes. 5.2 Un telón de fondo evolutivo Con frecuencia se ha dicho que los sistemas que han evolucionado de una manera natural simplemente no funcionan como un diseñador huma no podría esperar. 1 Hay varias razones para ello. Una, que ya hemos visto ejemplificada muchas veces, supone una tendencia a soluciones distribui das. La cuestión, ahora ya familiar para nosotros, es que mientras un di señador humano normalmente construiría la funcionalidad necesaria para resolver un problema directamente en un dispositivo separado, la evolu ción no estaría limitada de ninguna manera por los límites entre un orga nismo o dispositivo y el entorno. La resolución de problemas se distribu ye fácilmente entre organismo y mundo o entre grupos de organismos. La evolución, que en un sentido muy real no tiene ninguna perspectiva sobre ningún problema, carece de impedimentos para encontrar soluciones dis tribuidas económicas porque no necesita las anteojeras (por ejemplo, la firme división entre dispositivo y ámbito de operación) que ayudan a los técnicos humanos a enfocar su atención y a descomponer problemas com plejos en componentes. Sin embargo, esto no quiere decir que los principios de descomposición no desempeñen ningún papel en el diseño natural. Pero el tipo de descom posición que caracteriza al diseño por selección natural es, de hecho, muy di ferente. Es una descomposición dictada por la restricción del·holismo evolu tivo, un principio formulado explícitamente por Simon (1969) que afirma que las totalidades complejas se suelen desarrollar de modo incremental con el tiempo evolutivo y que )as di\'ersas formas intermedias deben ser ellos mismos sistemas completos y robustos capaces de sobrevivir y reproducirse. Como dice Dawkins (1986, p,íg. 94), la clave reside en pensar en función de trayectorias o vías a través del tiempo evolutivo, considerando a los organis mos completos que tienen éxito como pasos a lo largo del camino. Esta restricción es muy fuerte. Un diseño complejo extremadamente adaptativo que carezca de alguna descomposición evolutiva de esta clase (con formas ancestrales más sencillas pero exitosas), nunca evolucionará. Además, las trnnsiciones entre estas formas no deberían ser demasiado ex1. Véanse, por ejemplo, Simon, 1 %2; Dawkins, 1986 y el capítulo 4 de Clark, 1989.
!
Robots en evolución 1 133
tremas: deberían consistir en pequeñas alteraciones estructurales, cada una de las cuales genera un organismo completo y con éxito. Se dice, por ejemplo,2 que nuestros pulmones evolucionaron a partir de la base proporcionada por las vejigas natatorias de los peces. Las vejigas na tatorias son unas bolsas de aire que facilitan el movimiento en entornos acuosos. Se ha propuesto que el origen de nuestra común propensión a la pleuresía y el enfisema se remonta a ciertos aspectos de la adaptación de la ve jiga natatoria. Así, Lieberman (1984, pág. 22) se ve conducido a comentar que «las vejigas natatorias son dispositivos diseñados lógicamente para na dar; para respirar constituyen un sistema complicado y extravagante». La importante conclusión de todo esto es que las limitaciones del holis mo evolutivo, junto con la necesidad de avanzar mediante pequeños cambios incrementales de estructuras ya existentes, pueden producir soluciones a problemas presentes que deben mucho a sus antecedentes históricos parti culares. Como dice el especialista en genética celular Franc;oisJacob ( 1977, pág. 1.163): «Los objetos simples son más dependientes de las limitaciones [físicas] que de la historia. Cuanto más aumenta la complejidad, más impor tante es el papel desempeñado por la historia». ParaJacob, la evolución se parece más a un hojalatero que a un ingeniero. Un ingeniero se sienta frente a un tablero de dibujo en blanco y diseña una solución para un problema nuevo partiendo desde cero; un hojalatero toma un dispositivo ya existente y trata de adaptarlo para algún propósito nuevo. Al principio, lo que produ ce el mecánico puede tener poco sentido para el ingeniero, cuyo pensamien to no está limitado por los dispositivos y los recursos disponibles. De la mis ma manera, las soluciones naturales para los problemas a los que se enfrentan los seres evolucionados complejos también pueden parecer poco claras desde una perspectiva de diseño puro y sin tener en cuenta la historia. Una manera de empezar a comprender estas soluciones a problemas inicial mente opacas, oportunistas e históricamente dependientes de trayectorias, con siste en tratar de recapitular artificialmente el proceso evolutivo mismo: hacer que un hojalatero alcance a otro. Con ello damos paso a los algoritmos genéticos. 5.3 Los algoritmos genéticos como instrumentos de exploración
Como todos sabemos, la evolución biológica funciona mediante un pro ceso de diversificación y selección. Dada una población de organismos y una diversidad dentro de esa población, algunos individuos sobreviven y se re producen mejor que otros. Añadamos a esto un mecanismo de transmisión 2. Véase una revisión de éstas y otras posibilidades en el capítulo 4 de Clark, 1989.
. 134 1 Explicar la mente extendida
que haga que los descendientes de los más aptos hereden parte de la estruc tura de sus antepasados y tendremos las condiciones mínimas para la bús queda evolutiva. Normalmente, esta transmisión supone otros medios incor porados de variación (por ejemplo, la mutación) y de diversificación (por ejemplo, los procesos de división y recombinación característicos de la re producción sexual). Mediante una serie repetida de variaciones, diversifica ciones, selecciones y transmisiones, el proceso evolutivo realiza una búsque da en el espacio de opciones estructurales, una búsqueda que tenderá a concentrarse en las soluciones más aptas para los problemas de la supervi vencia y la reproducción. Los algoritmos genéticos' simulan este tipo de proceso evolutivo. La po blación consiste, inicialmente, en una variedad de individuos de software, que o bien se han codificado a mano, o bien se han generado al azar. Estos «individuos» podrían ser líneas de código, estructuras de datos, programas informáticos jerárquicos completos, redes neuronales, etc. A continuación, se permite que estos individuos actúen en algún entorno para poder com putar, después de cierto tiempo, una medida de aptitud para cada uno (¿Cuánto alimento ha encontrado? ¿Ha evitado a los depredadores? ... ). Después se emplea la codificación inicial de los individuos más aptos (nor malmente almacenada en forma de cadenas binarias) como base para la re producción (es decir, para generar la próxima población). Pero en vez de li mitarse a copiar los individuos con más éxito, se emplean operaciones de cruce y mutación. En las mutaciones se realiza un pequeño cambio aleato rio en la estructura de la codificación de un individuo. Por ejemplo, si el in dividuo es una red neuronal, se pueden modificar sutilmente algunos pesos. En los cruces se recombinan partes de las codificaciones de dos individuos para imitar la dinámica general de la reproducción sexual. Así, la nueva ge neración se basa en las variantes con más éxito de la generación anterior, pero continúa el proceso de búsqueda de soluciones eficientes investigando parte del espacio que circunda las buenas soluciones anteriores. Cuando este proceso se repite durante centenares de miles de generaciones, consti tuye (para ciertos ámbitos de problemas) una potente versión de la búsque da de descenso por un gtadiente,4 salvo por el hecho de que aquí los incre mentos de aprendizaje se producen generación tras generación y no durante la vida· de un solo individuo. Estas técnicas se han utilizado para desarrollar soluciones a problemas en una amplia variedad de ámbitos, desde el seguimiento de pistas en hormigas ar3. Véase, por ejemplo, Hollan
Robots en evolución 1 135
tíficiales (Tefferson y otros, 1990; Koza, 1991), hasta el descubrimiento de leyes del movimiento planetario (Koza, 1992), pasando por la evolución de contro ladores de redes neuronales para insectos artificiales (Beer y Gallagher, 1992). Esta última aplicación es especialmente interesante porque, como veremos a continuación, nos permite estudiar los efectos de aprendizajes evolutivos incre mentales en entornos que incluyen una rica dinámica corporal y ambiental.
5.4 Inteligencia corpórea en evolución Caminar, ver y navegar son estrategias adaptativas fundamentales explo tadas por muchas criaturas evolucionadas. ¿Puede ayudarnos la evolución si mulada a comprenderlas mejor? La respuesta parece ser un «sí» provisional. Consideremos el caminar. Randall Beer y John Gallagher ( 1992) han uti lizado algoritmos genéticos para hacer evolucionar controladores de redes neuronales para la locomoción de insectos. Resulta que estos controladores evolucionados explotan una variedad de estrategias robustas y, en ocasiones, nada evidentes. Muchas de estas estrategias se basan en interacciones estre chas y continuas entre el controlador y el entorno, y no suponen la cons trucción previa de programas motores detallados y explícitos. Además, los mejores controladores fueron capaces de enfrentarse con éxito a una varie dad de situaciones que constituían un desafío, incluyendo funcionar con re troalimentación sensorial y sin ella, y compensar automáticamente ciertos ti pos de cambio estructural. El insecto robot de Beer y Gallagher era una especie de cucaracha simu lada 5 con seis patas. Cada pata estaba articulada y se podía alzar y bajar. Un sensor en cada pata comunicaba el ángulo de las patas en relación con el cuerpo. El insecto simulado estaba controlado por una red de redes neuro nales (cada pata tenía un controlador de red dedicado, formado por cinco neuronas). Cada subred de cinco neuronas incluía tres neuronas motoras que gobernaban la pata y dos neuronas «extra» con una función abierta. Cada subred recibía datos de entrada procedentes del sensor asociado a la pata que controlaba. Se utilizó un algoritmo genético ( véase el apartado 5 .3 anterior) para descubrir un conjunto de características (como los pesos de conexión; véase el capítulo 3 anterior) que permitiera a este tipo de arqui tectura de control generar una locomoción sólida y estable. Esto, a su vez, implicaba encontrar pesos, sesgos y constantes de tiempo (velocidades de respuesta) capaces de generar una pauta de movimiento viable para cada pata y de coordinar los movimientos de todas las patas. 5. Véanse la introducción y el capítulo 2 de este libro.
136
1
Explicar la mente extendida
Beer y Gallagher desarrollaron once controladores, cada uno con un conjunto diferente de valores para los parámetros y los pesos. Todos los con troladores produjeron una buena locomoción y todos emplearon Ll «marcha trípeda», favorita de los insectos reales que se desplazan con rapidez. La importancia de la interacción controlador-entorno quedó demostrada por el desarrollo evolutivo de soluciones en tres entornos diferentes. En el primer entorno, la búsqueda evolutiva se producía con los sensores de las patas en funcionamiento. Como era de esperar en estas condiciones, las so luciones finales se basaban firmemente en una continua retroalimentación sensorial. Si más adelante se desactivaban los sensores, la locomoción se per día o presentaba muchos problemas. En el segundo entorno, la búsqueda evolutiva se producía sin retroalimentación sensorial. En esta condición «a ciegas» se descubrieron soluciones que sólo estaban basadas en generadores centrales de pautas y que, en consecuencia, producían una locomoción algo torpe pero fiable, semejante a la de un robot de juguete. Muchísimo más interesantes fueron los resultados obtenidos cuando la retroalimentación sensorial estaba presente de una manera i1ttermite11!t' durante la búsqueda evolutiva. En estas condiciones inestables, evolucio naron unos controladores que podían producir un caminar fluido emple ando la retroalimentación sensorial cuando estaba disponible, pasando a una generación de paut,1s «a ciegas» en ausencia de retroalimentación sen sorial (y produciendo una locomoción viable aunque menos elegante) e in cluso compensando automáticamente ciertos cambios estructurales ( por ejemplo, alteraciones de la longitud de las patas, como ocurre durante el crecimiento biológico). La explicación de esta última propiedad supone que, en estas soluciones «mixtas», la retroalimentación sensorial modula el generador de pautas. Una alteración en la longitud de una pata influye en las lecturas del sensor correspondiente y esto, a su vez, ocásiona una ra lentización en el generador de salidas motrices. Este tipo de compensación automática tiene un sabor biológicamente realista: pensemos cómo se adapu1 automáticamente un gato para andar a tres patas cuando se ha le sionado una o cómo se adapta un ser humano a caminar sobre una super ficie helada o con un tobillo torcido. Sin embargo, como señala Beer ( 1995b), este tipo de adaptación no es el resultado de un aprendizaje indi vidual como tal: es más bien algo inherente a la dinámica original del siste ma, y las nuevas condiciones (lesiones, crecimiento de las patas, etc.) no hacen más que ponerla de manifiesto. En general, el tipo de solución encarnada por este controlador mixto su pone un equilibrio tan sutil entre la generación centralizada de pautas y la modulación sensorial que, según Beer, es muy fácil que un analista humano lo hubiera pasado por alto. Mediante el empico de algoritmos genéticos, se
Robots en evolución 1
137
pueden encontrar soluciones que saquen el máximo partido Je aquellas es tructuras ambientales disponibles y que no se vean perjudicadas por nuestra tendencia natural a buscar soluciones ordenadas, nítidas y fáciles Je des componer. Naturalmente, la vertiente negativa Je estas soluciones más de sordenadas, más interactivas y más realistas biológicamente es que no sólo son difíciles de descubrir sino que también son difíciles de comprender una vez descubiertas. Volveremos a este problema en el apartado 5.7. Posteriores experimentos realizados en otros ámbitos han dado los mis mos resultados que los de Beer y Gallagher. Harvey y otros ( 1 994) hicieron evolucionar sistemas de control para robots orientados visualmente y Yamu chi y Beer (1994) hicieron evolucionar redes capaces de controlar un robot que empleaba como entrada señales de sonar para realizar tareas de recono cimiento y navegación por terrenos accidentados. J ohnson y otros ( 1994) emplearon la programación genética para hacer evolucionar rutinas pareci das a la visión animada para solucionar tareas de procesamiento visual eco lógicamente realistas y computacionalmente poco costosas (recordemos el capítulo 1), y aparecieron soluciones que superaron significativamente a los mejores programas que ellos mismos habían escrito a mano. Por tanto, exis ten muchos indicios de la potencia de la búsqueda evolutiva simulada para descubrir soluciones robustas y poco evidentes a problemas biológicamente realistas. Con todo, el optimismo de esta afirmación se debería atenuar re conociendo varias limitaciones importantes que aquejan a la mayor parte de los trabajos en este campo. Las principales limitaciones son la «congelación» del espacio de problemas, el empleo de arquitecturas neuronales y corpora les fijas, la falta de una distinción adecuada entre fenotipo y genotipo, y el problema del «aumento de la escala» de la búsqueda evolutiva. La «congelación» del espacio de problemas se refiere a la tendencia a predeterminar una función adaptativa fija y a utilizar la evolución simulada sólo para maximizar la aptitud en relación con esta meta prefijada (caminar, navegar, etc.). Este enfoque desatiende uno de los factores que con más fuer za diferencian la adaptación evolutiva real de otrns formas de aprendizaje: la capacidad de hacer coevo!ucionar problemas y soluciones. Un ejemplo clási co es la coevolución de técnicas de persecución y evasión en especies anima les.1' La cuestión esencial es, simplemente, que la evolución natural no actúa para «resolver» un problema fijo. En cambio, los problemas mismos se alte ran v evolucionan en una compleja red de cambios coevolutivos. Igualmente problemática es la tendencia a buscar dentro de un espacio de problemas definido parcialmente por alguna arquitectura neuronal o cor6. Véanse al�tmos experimentos Je evolución simulaJa que implican persecución v eva ,it',11 en Miller v ( :lit{ 199--!.
138 1 Explicar la mente extendida
poral fija. Una vez más, estas búsquedas congelan parámetros que, en el mundo natural, están sujetos al cambio evolutivo. Por ejemplo, la cucaracha simulada tenía una forma corporal fija y un conjunto fijo de recursos neuro nales. En cambio, la búsqueda evolutiva real es capaz de modificar tanto la forma corporaF como la arquitectura nerviosa general. Otra distorsión biológica es el empleo de correspondencias genotipo fenotipo bastante directas. En la búsqueda normal por algoritmo genético, las nuevas poblaciones de individuos están totalmente especificadas por sus genotipos. En cambio, la manera en que los genes reales llegan a ex presarse en los cuerpos reales permite que las interacciones ambientales desempeñen un papel mucho mayor durante el tiempo de desarrollo indi vidual. De hecho, la imagen de que los genes «codifican» características fí sicas suele ser errónea. En realidad, los genes codifican características físi cas posibles cuya expresión depende, en gran medida, de la influencia de una variedad de factores ambientales. La capacidad de seleccionar factores genéticos cuya expresión final en los individuos sigue estando en gran me dida bajo el control del entorno, permite que la evolución biológica explo te varios grados de libertad que no están presentes en la mayoría de los modelos artificiales. 8 Finalmente existe el problema ampliamente reconocido del «aumento de la escala». La mayoría de los trabajos presentados anteriormente aplican la búsqueda genética a controladores de redes neuronales relativamente pe queños. A medida que aumenta el n(,mero de parámetros que caracterizan a los controladores, las variedades normales de búsqueda evolutiva son cada vez más ineficaces. La clave para superar este problema parece residir en combinar una mejora de las codificaciones genéticas con una «descarga» de parte de la tarea en el entorno (es decir, reducir la cantidad de información codificada en el genotipo y depender más de las interacciones evolutivas con un entorno estructurador). Vemos así que el problema del aumento de la es cala y el anterior problema de la correspondencia entre fenotipo y genotipo pueden estar más vinculados de lo que parece a primera vista.'' 7. Siguiendo esta línea, Menczer y Belew ( 1994) emplean un algoritmo genético para de terminar la elección de una interfaz organismo-entorno haciendo evolucionar diferentes tipos de sensor. 8. Véase un examen excelente de las complejidades de las interacciones gen-entorno en Gifford, 1990. 9. El trabajo de Nolfi, Miglino y Parisi (1994) es uno de los pocos intentos de introducir la plasticidad fenotípica en un modelo combinado de algoritmo gen�tico y red neuronal. En este modelo, la correspondencia genotipo-fenotipo es un proceso extendido en el tiempo y sensible al entorno. Además, la búsqueda evolutiva misma se emplea para determinar el equi librio entre la influencia dl' los genes y del entorno.
Robots en evolución
1
139
Por tanto, es evidente que el empleo de la evolución simulada está lejos de ser una panacea para la investigación sobre agentes autónomos. Sin embargo, estos métodos ya se han ganado un lugar en la «caja de herramientas»
140 1 Explicar la mente extendida
en un eje vertical conectado con el volante principal. El eje tiene dos brazos, unidos por goznes, con una esfera metálica en el extremo de cada uno. Cuando el volante gira, los brazos se van separando del eje a medida que aumenta la velocidad de rotación. Los brazos actúan directamente sobre una válvula reguladora que reduce el flujo de vapor cuando los brazos se separan (cuando aumenta la velocidad del volante) y que lo aumenta cuando los bra zos se acercan (cuando disminuye la velocidad del volante). Este dispositivo hace que el volante mantenga una velocidad de rotación constante, necesaria para muchas aplicaciones industriales. Según Smithers, cuando aumentó la precisión en los procesos de fabricación apareció una nueva generación de re guladores que empezó a mostrar un problema no observado en las versiones anteriores, más «rudimentarias». Los nuevos reguladores, fabricados con pre cisión, solían ser incapaces de establecer una velocidad de rotación fija y pro vocaban una oscilación de aceleraciones y desaceleraciones. Esta oscilación pendular en torno a una velocidad constante se producía porque los nuevos reguladores reaccionaban con demasiada rapidez a la velocidad del eje prin cipal, produciendo una compensación excesiva. ¿Por qué el rendimiento de las primeras versiones rudimentarias superaba al de las posteriores, diseñadas con precisión? La razón era que el rozamiento entre las juntas, los cojinetes y las poleas de las primeras versiones era suficiente para amortiguar las res puestas del sistema, protegiéndolo así de los ciclos de rápida sobrecompen sación observados en las máquinas más nuevas. Los reguladores modernos se basan en componentes adicionales par J impedir la oscilación pendular, pero al precio de ser más difíciles de montar y utilizar (ibíd., pág. 66). Smithers demuestra que los intentos de hacer más precisos los sistemas sensoriales de robots sencillos se pueden encontrar con problemas similares. Si la conducta del robot depende estrechamente de las lecturas de los senso res, unos dispositivos muy sensibles quizás respondan en exceso ante pe queñas perturbaciones ocasionadas por cambios ambientales relativamente insignificantes o incluso por el funcionamiento del sensor mismo. Por tanto, un aumento de resolución rio siempre es positivo. Mediante el empleo de componentes menos precisos, se pueden diseñar robots con dispositivos fí sicos cuyas propiedades (por ejemplo, pérdidas mecánicas y eléctricas) amor tigüen las .respuestas y eviten variaciones y fluctuaciones no deseadas. Según Smithers, de todo esto se deduce que también puede ser erróneo concebir los sensores como dispositivos de medición y que deberíamos verlos como filtros cuyo papel consiste, en parte, en absorber variaciones conductalmcn te insignificantes para que el sistema pueda mantener unas interacciones sen cillas y robustas con su entorno. Según Smithers, los componentes físicos reales suelen ofrecer gran parte de esta capacidad de filtración o absorción corno resultado Je las pérdidas eléctricas y mecánicas inherentes a los me-
r
Robots en evolución 1 141
dios físicos. Es evidente que estos efectos «de propina» no aparecen en los sistemas agente-entorno simulados. Por tanto, los trabajos basados en simu laciones corren el peligro de pasar por alto soluciones económicas a proble mas importantes porque no reconocen el papel estabilizador de ciertas pro piedades físicas brutas como la fricción y las pérdidas mecánicas y eléctricas. Otro problema de los enfoques basados en la pura simulación es la fuer te tendencia a simplificar en exceso el entorno simulado y a concentrarse en la inteligencia del agente simulado. Esto refuerza aún más la visión errónea del entorno que lo considera poco más que el marco en el que se establece un problema dado. En cambio, todos los argumentos de los capítulos ante riores describen el entorno como un recurso rico y activo que actúa como «cómplice» en la producción de la conducta adaptativa. Otras inquietudes relacionadas con ésta son la pobreza relativa de la física simulada (que, en general, excluye parámetros cruciales de la realidad como el rozamiento y el peso), la alucinación de un flujo perfecto de información entre el «mundo» y los sensores, y la alucinación de unos componentes uniformes y perfecta mente diseñados 12 (por ejemplo, el empleo de cuerpos idénticos para todos los individuos en la mayoría de los escenarios evolutivos). Esta lista se podría ampliar, pero el mensaje es claro. La simulación ofrece, como mucho, una versión empobrecida de la realidad y este empobrecimiento sigue unas líneas bastante peligrosas: líneas que amenazan con deformar nuestra imagen del funcionamiento de los agentes, enmascarando las aportaciones de las carac terísticas del entorno y de los cuerpos físicos reales. A pesar de todo esto, las ventajas de emplear las simulaciones con mesu ra pueden ser grandes, especialmente cuando se investiga el cambio evoluti vo. Las grandes poblaciones simuladas son baratas de producir y fáciles de controlar. Dentro de un entorno virtual, la evaluación de la aptitud en rela ción con una conducta se puede automatizar. Los problemas de la ingeniería real se evitan completamente. Además, la evolución simulada a gran escala ofrece un considerable ahorro de tiempo en comparación con el empleo re petido de observaciones y evaluaciones en el mundo real. Por tanto, lo más indicado a efectos prácticos parece ser una estrategia mixta. Así, teóricos como Nolfi, Miglino y Parisi (1994), y Yamuchi y Beer (1994), emplean simulaciones en las etapas iniciales de investigación y desa rrollo y después transfieren los resultados a robots móviles verdaderos. Na turalmente, los controladores de redes neuronales que se han hecho evolu cionar para guiar un robot simulado, difícilmente se podrán transferir sin problemas a un sistema real. Pero la fase de simulación se puede utilizar, por 12. Estas desventajas se identifican y se discuten en la pág. 194 de Nolfi, Floreano, Migli no y Mondada, 1994.
142 1 Explicar la mente extendida
lo menos, para obtener valores generales de una variedad de parámetros que después se pueden ajustar y adaptar con más precisión al contexto real.13 Finalmente, se debe destacar que incluso la investigación basada en la si mulación pura puede ser inmensamente valiosa, en la medida en que permi ta la investigación de cuestiones generales relacionadas (por ejemplo) con la interacción entre el aprendizaje individual y el cambio evolutivo (Ackley y Littman, 1992; Nolfi y Parisi, 1991) y con las propiedades de grandes colec tivos de agentes muy simples (Resnick, 1994). Sin embargo, como medio para comprender la dinámica detallada de las interacciones entre agentes y entornos reales, las simulaciones siempre se deberían tomar «con pinzas». 5.6 Cómo comprender los agentes evolucionados, corpóreos y embebidos Al parecer, el proceso de diseño natural superará sistemáticamente las fi guraciones de los teóricos humanos. En particular, la evolución biológica prescinde totalmente de nuestra nítida delimitación entre lo meramente físi co y lo computacional o informacional. Se pueden explotar características fí sicas burdas (como las pérdidas eléctricas y mecánicas, el rozamiento y el ruido) junto con estrategias computacionales familiares (como el aprendiza je de redes neuronales) para encontrar soluciones robustas a problemas de supervivencia y respuesta. Además, como hemos visto repetidamente en ca pítulos anteriores, el entorno se puede explotar activamente para transfor mar la naturaleza de los problemas que se nos plantean. Y como se comentó en el apartado 5.2 anterior, con frecuencia la evolución biológica debe tras tear con recursos viejos para producir nuevas capacidades: por tanto, la in novación cognitiva rara vez se confecciona a partir de un solo tejido com pleto, con un diseño ideal. Estos factores se unen para hacer que el diseño biológico acabe siendo curiosamente opaco. Si desmontamos una grabadora de vídeo encontraremos un ¿onjunto bien delimitado de módulos y placas de circuitos que desempeñan unas funciones claras y específicas en la produc ción de un rendimiento con éxito. Esto ocurre porque los diseñadores hu manos (rnsa nada sorprendente) optan por el tipo de diseño global basado en componentes que tiene más sentido para una reflexión secuencial y cons ciente. En el cerebro humano parecen intervenir como componentes unas 13. Este ajuste se puede lograr mediante una evolución continuada, empleando robots reales como fuente de genotipos que luego son seleccionados y modificados con el uso de una simulación de algoritmo genético, o también se puede lograr mediante un diseño y un ajuste manual. Véasl' ttn planteamil'nto en Nolfi, Floreano, Miglino y Mondada, 1994.
Robots en evolución 1 143
t"structuras y unos cableados mucho menos transparentes, incluyendo enor111es cantidades de circuitos recurrentes que permiten modificaciones mu1 uas y repetidas entre muchas áreas. Y de todos modos el papel del cerebro 110 es más que hacer que el cuerpo ejecute los movimientos correctos. Al fi1ial, el éxito adaptativo no se puede atribuir a los cerebros sino a coaliciones cerebro-cuerpo embebidas en entornos ecológicamente realistas. Y aquí se plantea una pregunta muy amplia y, por ahora, sin respuesta: ¿cómo pode rnos estudiar y comprender (no sólo reproducir) el éxito adaptativo de los seres biológicos, cuyos principios de diseño no respetan los límites intuitivos entre cognición, cuerpo y mundo? Una posibilidad, que hoy por hoy va ganando terreno, es sustituir la teo rización computacional y el discurso representacional, que son los instru mentos usuales de la ciencia cognitiva, por la teorización y el discurso de la teoría de los sistemas dinámicos. El argumento es el siguiente: la imagen de la cognición como generación de transformaciones computacionales de re presentaciones internas, supone un retorno a la concepción del cerebro como sede fundamental de un tipo de inteligencia esencialmente incorpórea. Y la razón de ello es que, en esta imagen, se parte del supuesto de que las re presentaciones así concebidas sustituyen a elementos y sucesos reales y que el razonamiento se produce en una especie de terreno simbólico interno. Pero hemos visto que la inteligencia corpórea real es, fundamentalmente, una manera de enlazar con el mundo, de emplear estrategias activas que de jan gran parte de la información fuera, en el mundo, y de emplear astuta mente secuencias repetidas, en tiempo real, de interacciones cuerpo-mundo para resolver problemas de una manera robusta y flexible. La imagen es la de dos sistemas complejos acoplados (el agente y el entorno) cuya actividad conjunta resuelve el problema. En estos casos, puede tener poco sentido de cir que un sistema representa al otro. Como esta idea puede ser difícil de captar, será útil dar un ejemplo. Tim van Gelder nos invita a considerar, desde esta perspectiva, el funcionamien to del regulador de Watt descrito en el apartado 5.5 anterior. Recordemos que este regulador mantiene el volante a una velocidad constante, mediante dos brazos lastrados cuya oscilación cierra la válvula reguladora cuando aumenta la velocidad de rotación y la abre cuando esta velocidad disminuye. Van Gelder (1995, pág. 348) contrasta esto con la operación de un «regula dor computacional» imaginario que funcionaría de la manera siguiente: Medir la velocidad del volante. Comparar la velocidad real con la velocidad deseada. Si hay una discrepancia, entonces: medir la presión actual del vapor,
144
1
Explicar la mente extendida
calcular la alteración deseada en la presión del vapor, calcular el ajuste necesario para la válvula reguladora. Ajustar la válvula reguladora. Volver al paso l. Este regulador computacional utiliza mediciones explícitas de la veloci dad y de la presión del vapor que luego actúan como entrada para otros pro cesos que calculan los ajustes necesarios. En cambio, el regulador de Watt incorpora las etapas de medición, cálculo y control en un proceso único que integra las influencias recíprocas entre la velocidad del motor por un lado, y la velocidad y el ángulo de los brazos por otro. Según van Gelder, es mejor concebir el funcionamiento del regulador de Watt en función de bucles de retroalimentación y de sistemas físicos estrechamente acoplados, que en fun ción de representaciones y de cálculos. Estos fenómenos pertenecen al te rreno de la teoría general de los sistemas dinámicos. Hagamos ahora una pau sa para conocer mejor esta teoría. La teoría de los sistemas dinámicos es un marco de referencia 14 bien establecido para describir y comprender la conducta de sistemas comple jos (véase, por ejemplo , Abraham y Shaw, 1992). Las ideas fundamentales que subyacen a la perspectiva de los sistemas dinámicos son la noción de un espacio de estados, la noción de una trayectoria o un conjunto de tra yectorias posibles a través de ese espacio y el empleo de la matemática (continua o discreta) para describir las leyes que dictan las formas de es tas trayectorias. Por tanto, la perspectiva de los sistemas dinámicos incorpora, como un aspecto fundamental del análisis, la idea de la evolución de los estados de un sistema a lo largo del tiempo. Como formalismo general es aplicable a todos los sistemas computacionales existentes (tanto conexionistas como clásicos), pero su alcance es más amplio y también se puede aplicar al análisis de siste mas físicos no cognitivos y no computacionales. Desde esta perspectiva, el objetivo del análisis de un sistema dinámico es presentar una imagen de un espacio de estados con una dimensionalidad de tamaño arbitrario (dependiendo del número de parámetros significativos del sistema) y comprender las conductas del sistema en función de su posición y 14. Los precursores directos de la nueva ola de «dinamicistas cognitivos» fueron los fe nomenales especialistas en cibernética de los años cuarenta y principios de los cincuenta. En tre las publicaciones fundamentales se encuentran la obra de Norbert Wiener Cybernetics, or Control and Communication in the Animal ,md in the Machine (Wiley, 1948), diversos volúme nes con transcripciones literales de las exposiciones realizadas durante una serie de conferen cias Macy sobre cibernética (Tra11sactions o/ the Sixth, SeL'enth, Eighth and Ninth (1949-1952) Macy Cun/aences [Josiah Macy J r. Foundation] ), la obra de W. Ross Ashby fotroducticm to Cy hcrnetics (Wiley, 1956) y el clásico de Ashby Design /or ,1 Brain (Chapman and Hall, 1952).
Robots en evolución
1
145
su movimiento dentro de ese espacio geométrico abstracto. Para reforzar esta comprensión se suelen invocar con regularidad varios constructos adi cionales. Estos constructos capturan las propiedades distintivas de ciertos puntos o regiones (conjuntos de puntos) del espacio determinadas por la matemática que rige el sistema. Esta matemática suele especificar una ley di námica que determina cómo evolucionan con el tiempo los valores de un conjunto de variables de estado (esta ley puede consistir, por ejemplo, en un conjunto de ecuaciones diferenciales). Dado un estado inicial, la sucesión temporal de estados determinada por la ley dinámica forma una trayectoria a través del espacio. El conjunto de todas las trayectorias que pasan por cada punto se denomina/lujo y su forma es el objeto típico de estudio. Para comprender mejor la forma de este flujo se utilizan varios constructos, in cluyendo el de atractor: un punto o una región del espacio que, de acuerdo con las leyes que gobiernan el movimiento a través de ese espacio, «absorbe» cualquier trayectoria que pase cerca de él. Otros conceptos relacionados son la «cuenca de atracción» (el campo de influencia
146
1
Explicar la mente extendida
del ángulo de la pata, la dinámica se colapsa hasta un punto fijo, congelando al insecto en una fase de postura permanente. Obsérvese especialmente que la dinámica descrita por Beer no pertenece al controlador de red neuronal per se, sino más bien al sistema acoplado formado por el controlador y el cuerpo (pata) del insecto. La interacción recíproca entre el controlador y la pata (mediada por la capacidad de detección de ángulos del sensor de la pata) proporciona la trayectoria en el espacio de estados que acabamos de descubrir. Aunque es indudable que este tipo de comprensión geométrica basada en espacios de estados es a la vez valiosa e informativa, sigue abierta la cues tión sobre la medida en que estas explicaciones pueden reemplazar, y no sólo complementar, las interpretaciones más tradicionales formuladas en térmi nos de transiciones computacionales y estados representacionales internos. Esta postura radical (que pronostica la sustitución total del discurso compu tacional y representacional por un discurso centrado en sistemas dinámicos geométricos) se enfrenta a dos retos cruciales. El primer reto se refiere a la escala y la tratabilidad. Incluso el conjunto de 30 neuronas que controlan las patas del insecto artificial acabado de mencio nar, constituye un sistema dinámico de tal complejidad que nuestra com prensión geométrica intuitiva se viene abajo. Además, la matemática detalla da de la teoría de los sistemas dinámicos se hace menos tratable a medida que aumentan el número de parámetros y el tamaño del espacio de estados. Por eso el análisis de Beer se aplicó a los �istemas más simples, de cinco neuronas, que controlaban cada pata. Por tanto, el alcance práctico de la teoría de los sistemas dinámicos para sistemas acoplados muy complejos y dimensionales (como el cerebro humano) se debe poner seriamente en duda. El segundo reto, más fundamental, se refiere al tipo de comprensión que ofrecen estos análisis. Esta comprensión corre el riesgo de éonvertirse más en una descripción abstracta que en una explicación completa. Sabemos qué hace el sistema y cuándo lo hace, y qué pautas de evolución temporal mues tra su conducta; pero esta información, aunque valiosa, no parece ser ex haustiva. De hecho, y como argumentaré después con más detalle, con fre cuencia nos quedamos corí una imagen empobrecida del rol adaptativo de los componentes y de la organización funcional interna del sistema. Mi propuesta es que los mejores aspectos de los análisis dinámicos son su atención intrínseca a la dimensión temporal y su fácil capacidad para entre cruzar los límites entre cerebro, cuerpo y entorno. Destacaré los aspectos temporales en un capítulo posterior. Pero la cuestión de los límites ya debe ría estar clara: cuando tratamos el cerebro como un sistema dinámico, en esencia lo estamos tratando igual que la mecánica corporal y los procesos del entorno. El resultado es que la tarea de caracterizar la conducta adaptativa
Robots en evolución 1 14 7
en función de acoplamientos complejos entre cerebro, cuerpo y entorno, se convierte en algo especialmente fácil y natural. Por tanto, abogaré por una postura un tanto ecuménica. Los instrumen tos de la teoría de los sistemas dinámicos son una baza muy valiosa para comprender las conductas estrechamente acopladas con el entorno que an tes he destacado. Pero se deberían considerar complementarios de la bús queda de interpretaciones basadas en la computación y la representación. Varios de los próximos capítulos se dedicarán a exponer los argumentos en favor de esta complementariedad.
6
Emergencia y explicación
6.1 ¿Estilos diferentes? ¿Qué instrumentos hacen falta para comprender la cognición corpórea y embebida en tiempo real? Concretamente, ¿existe una gama de fenómenos emergentes cuya dependencia tan estrecha del acoplamiento entre cerebro, cuerpo y mundo haga fracasar a los análisis tradicionales? Argumentaré que los fenómenos emergentes sí exigen unos estilos nuevos de explicación y es tudio, pero que es mejor considerar estos estilos como complementarios (no como contrarios) de los enfoques analíticos más familiares. Sin duda, vere mos una sensibilidad creciente hacia lo que se puede denominar una «deter minación ecológica» 1 de las funciones de diversos estados y procesos inter nos (es decir, que la situación del organismo en un entorno más amplio y sus interacciones con ese entorno influyen en lo que se debe representar y com putar internamente). Y también veremos la otra cara de esta sensibilidad: una atención creciente a la dinámica global de los sistemas completos for mados por los organismos y su entorno. Pero ninguno de estos desarrollos evita la necesidad de comprender la contribución de los componentes neu ropsicológicos reales a las capacidades que caracterizan psicológicamente a un agente: un proyecto que aún parece exigir el empleo de algunos instru mentos analíticos bastante tradicionales. En consecuencia, argumentaré que una ciencia cognitiva con éxito deberá estudiar tanto la macrodinámica de los sistemas agente/entorno como la microdinámica computacional y repre sentacional de los circuitos neuronales reales.
l. Debo esta expresión a Josefa Toribio.
150 1 Explicar la mente extendida
6.2 De las partes a los todos En este apartado distinguiré tres estilos de explicación científica cogniti va. Estos estilos son muy generales y reúnen modos de programación opues tos entre sí (como el conexionista y el clásico). Explicación basada en componentes
Explicar el funcionamiento de una totalidad compleja detallando los pa peles individuales y la organización total de sus partes equivale a dar una ex plicación basada en componentes2 • Éste es el estilo explicativo natural que adoptamos, por ejemplo, cuando explicamos el funcionamiento de un auto móvil, un televisor o una lavadora. Explicamos la capacidad global del siste ma haciendo referencia a las capacidades y funciones de sus componentes y a la manera en que estos componentes interaccionan entre sí. Así interpretada, la explicación basada en componentes es la equivalen te contemporánea de la explicación reduccionista al viejo estilo. Evitaré el vo cabulario del reduccionismo por dos razones. En primer lugar, gran parte de la discusión filosófica sobre el reduccionismo suponía que las reducciones designaban relaciones entre teorías y que las teorías eran constructos lingua formes que implicaban leyes. Pero, en muchos casos (especialmente en la biología y en la inteligencia artificial), las explicaciones reduccionistas no adoptan esta forma; en cambio, sup,men el desarrollo de unos modelos par ciales que especifican unos componentes y sus modos de interacción, y ex plican ciertos fenómenos de orden superior (como el funcionamiento de un receptor de televisión) haciendo alusión a componentes e interacciones de nivel inferior. 3 Se trata de explicaciones reduccionistas en un sentido más amplio, sentido que la <
Emergencia y explicación 1 151
pótesis emergentistas recientes no se callan en absoluto ante estas cuestiones. El contraste reside en las maneras en que se combinan las propiedades y las características de nivel inferior para producir los fenómenos de interés. En realidad, estas explicaciones emergentistas son un caso especial de explica ción reduccionista -por lo menos si se interpretan de una manera intuitiva porque intentan eliminar el misterio de la presencia de una propiedad de ni vel superior haciendo referencia a una multitud de datos organizativos de nivel inferior.4 Así pues, y por todas estas razones, creo que será más preciso y menos confuso contrastar la explicación emergentista con la explicación basada en componentes y no con la teorización reduccionista en general. Los métodos de programación modular de la inteligencia artificial clási ca' se prestaban muy bien a una forma de explicación por componentes. Cuando intentamos comprender el éxito de estos programas, suele ser útil aislar las diversas subrutinas, módulos, etc. y mostrar su papel para dividir el problema que interesa en una serie de subproblemas manejables (Dennett, 1978a). Como indica Wheeler ( 1994), ciertos trabajos «conexionistas» recientes también se prestan a un tipo de explicación por componentes. Las solucio nes a problemas complejos como el reconocimiento de códigos postales es critos a mano (Le Cun y otros, 1989) explotan redes (o redes de redes) muy estructuradas y con múltiples capas. En estos casos es posible profundizar en nuestra comprensión del funcionamiento del sistema preguntándonos por las funciones de estos componentes brutos (capas o subredes). Este tipo de explicación es más convincente cuando los componentes admiten una inter pretación representacional directa, es decir, cuando el sistema de interés po see unas configuraciones de componentes, internas e identificables con fia bilidad, que en cierto modo «representan aspectos del dominio... y [también posee] unos componentes internos, identificables con fiabilidad, que se pue den interpretar como transformadores algorítmicos de esas representacio nes» (Beer, 1995a, pág. 225). En resumen: existe una relación entre el análi sis de componentes de los sistemas inteligentes y la imagen de estos sistemas como dedicados al intercambio de representaciones internas, porque las fun ciones distintivas de los componentes postulados se suelen definir haciendo referencia a la forma o el contenido de las representaciones internas que pro cesan.
4. Véase un argumento acerca de que es mejor tratar la emergencia como una especie de reducción en Wimsatt, 1986 y Wimsatt (en prensa). 5. Véanse, por ejemplo, Newell y Simon, 1976 y Haugeland, 1981.
152 1 Explicar la mente extendida
Explicación de "atrapar y lanzar» Éste es mi nombre favorito para un enfoque que se toma en serio muchas ideas de la cognición corpórea y embebida pero que sigue contemplándolas a través del cristal del análisis tradicional. La característica principal del mé todo de «atrapar y lanzar» es que el entorno se sigue tratando como una sim ple fuente de entradas al verdadero sistema de pensamiento: el cerebro. La concesión a la perspectiva corpórea reside en reconocer que estas entradas pueden conducir a acciones que simplifiquen cómputos posteriores. La ima gen tradicional de un ciclo entrada-pensamiento-acción se mantiene, pero se reconocen las influencias complejas y recíprocas entre la acción en el mundo real y el procesamiento interno. La investigación sobre la visión animada muestra algo de este carácter cuando describe que una entrada visual de baja resolución puede conducir a unas acciones reales (como mover la cabeza o la fóvea) que, a su vez, generan entradas adecuadas para procesamientos de mayor resolución. Aquí nos encontramos ante una descripción que recono ce las múltiples y complejas maneras en que se pueden alterar y simplificar las tareas internas por medio de la estructura de la realidad, la dinámica cor poral y las intervenciones activas en el mundo. Pero también encontramos un énfasis -y un interés- bastante tradicional en los ámbitos del procesa miento interno, las representaciones internas y la computación (como la construcción de unas bases de datos internas mínimas que codifican repre sentaciones «indéxicas» especializ:1das del tipo «mi taza es amarilla»; véase Ballard. 1991, págs. 71-80). La coexistencia pacífica de estas dos imágenes (del sistema activo y embebido y de la primacía de la economía del procesa miento interno) se mantiene mediante una firme insistencia en el límite en tre cerebro y mundo. El mundo lanza entradas al cerebro, que las atrapa y responde lanzando acciones. Estas acciones pueden alterar o simplificar pro cesamientos posteriores, al hacer que el mundo lance entradas más fáciles de utilizar, y así sucesivamente. En resumen, aunque existe un fuerte compro miso con unos modos interactivos de explicación, se mantiene el interés tra dicional en la representación y el procesamiento dentro del cerebro. Una causa de esto, implícita en la idea misma de «atrapar y lanzar» es que. en es tos casos, gran parte del interés se centra en simples cadenas de retroali mentación donde las acciones del sistema alteran sus próximas entradas; es tas entradas, a su vez, controlan la siguiente acción, y así sucesivamente. En estos casos, la dimensionalidad relativamente baja de las interacciones nos permite comprender la conducta del sistema empleando instrumentos bas tante convencionales. Sin embargo, a medida que aumentan la complejidad y la dimensionalidad de estas interacciones cruciales, es más difícil (y quizá imposible) conccptualizarlas añadiendo un simple factor de retroalimenta-
_. ,
Emergencia y explicación
_ ___ ___ _ _ 1
153
ción a nuestra comprensión normal. Esta complejidad crítica surge cuando aumenta el número de procesos de retroalimentación y cuando el montaje temporal de los diversos procesos se «desincroniza», permitiendo que la re troalimentación se produzca a lo largo de múltiples canales y en múltiples es calas asincrónicas de tiernpo.6 Explicación basada en la emergencia
La explicación basada en la emergencia es el miembro más radical y es curridizo de nuestra tríada. Mientras que la explicación de «atrapar y lan zar» en realidad no es más que una versión sutil y astuta de la explicación ba sada en componentes, la explicación basada en la emergencia se propone ofrecer una perspectiva totalmente nueva del éxito adaptativo. En el corazón de esta nueva perspectiva se encuentra, naturalmente, la peliaguda noción de la emergencia misma. Nos acercaremos a ella con cautela, mediante una se rie de ejemplos ilustrativos. J. A. Scott Kelso, en su excelente tratado Dynamic Patterns (1995), pre senta el clásico ejemplo del fluido calentado desde abajo. Concretamente, describe la conducta del aceite calentado en una sartén. Cuando se empieza a aplicar el calor, hay poca diferencia de temperatura entre la parte superior y la parte inferior del aceite y no observarnos ningún movimiento en el líqui do. Sin embargo, a medida que Li temperatura aumenta, la masa de aceite empieza a moverse de una manera coordinada: observarnos lo que Kelso (ibíd., pág. 7) describe corno «un ordenado movimiento rotatorio». La fuen te de este movimiento es la diferencia de temperatura entre el aceite más frío de la parte superior y el aceite más caliente de la parte inferior. El aceite más caliente y menos denso se eleva y el más denso y frío desciende en un ciclo que se va repitiendo a medida que el aceite anteriormente frío, ahora en el fondo, se calienta y vuelve a ascender para enfriarse otra \'ez. El resultado es un persistente movimiento rotatorio conocido como bucle de convección. La 6. Esta obser\·Jción ha sido hecha por Kelso (l
154 1 Explicar la mente extendida
aparición de estos bucles de convección es un ejemplo de propiedad autoor ganizada que emerge de un grupo de moléculas, y no es muy distinta de la autoorganización de las células del hongo mucilaginoso descrita en el capí tulo 4 anterior. Kelso (ibíd., págs. 7-8) comenta: Los bucles Je comTcción resultantes son lo que los físicos llaman un efecto colectivo o cooperativo, que surge sin ninguna instrucción externa. En el len guaje de los sistemas dinámicos, el gradiente de temperatura se llama parámetro de control. Obsérvese que el parámetro de control no prescribe la pauta emer gente ni contiene un código para la misma. Simplemente conduce al sistema por una variedad de pautas o estados posibles... Esta formación espontánea de pau tas es precisamente lo que entendemos por autoorganización: el sistema se orga niza a sí mismo, pero no hay ningún «yo», ningún agente dentro del sistema que lleve a cabo la organización.
Naturalmente, la idea no es que las pautas emergentes carezcan por com pleto de causa: evidentemente, la causa inmediata es la aplicación de calor a la sartén. La idea es que las pautas observadas se explican principalmente por la conducta colectiva (bajo unas condiciones específicas) de un gran conjunto de componentes simples (las moléculas), ninguno de los cuales de sempeña un papel especial o principal en el control o la orquestación del proceso de formación de las pautas. De hecho, cuando empieza el movi miento rotatorio, se alimenta y se mantiene a sí mismo según la manera ca racterística de los sistemas autoorgar :zados. De estos sistemas se puede afir mar, simultáneamente, que las acciones de las partes ocasionan la conducta global y que la conducta global guía la acción de las partes. Como ejemplo cotidiano de esta idea (en ocasiones denominada «causalidad circular»), consideremos cómo se combinan las acciones de los individu9s que forman una muchedumbre para abalanzarse en una dirección, y cómo esa actividad succiona y moldea la actividad de los individuos indecisos manteniendo y re forzando la dirección del movimiento colectivo. Estos fenómenos se prestan a ser comprendidos en funeión de variables colectivas, variables que se cen tran en unas características de nivel superior cruciales para la explicación de un fenómeno, pero que no �eflejan las propiedades de los componentes sim ples. Estas variables pueden reflejar propiedades que dependen de la inte racción de múltiples componentes como la temperatura y la presión de un gas, la aceleración de una muchedumbre aterrada o la amplitud de los bucles de convección que se forman en un líquido calentado. Si trazamos los valo res de estas variables colectivas a medida que un sistema se despliega en el tiempo, podremos obtener datos importantes sobre la conducta posible y real del sistema más amplio. Y si trazamos las relaciones entre los valores de las variables colectivas y los parámetros de control (como el gradiente de tem-
Emergencia y explicación
1
155
peratura), podemos llegar a entender algunos hechos importantes sobre las circunstancias en las que emergerán estas pautas de nivel superior, cuándo Jará paso una pauta Je nivel superior a otra, etc. Así pues, ahora ya disponemos de un sentido básico del esquivo término «emergencia». Se produce emergencia cuando aparece una conducta intere sante, y sin un control central, como resultado de las interacciones de múlti ples componentes simples dentro de un sistema. Pero ya nos hemos encon trado antes con otro sentido de la emergencia, principalmente arraigado en las ideas sobre las interacciones organismo-entorno. Este tipo de emergen cia, que caracteriza gran parte del trabajo de la robótica en mundo real des crita en capítulos anteriores, se puede ilustrar con un sencillo ejemplo pro cedente de Steels, 1994. Steels nos invita a imaginar un agente robótica que necesita situarse entre dos polos para recargarse. El punto de recarga está in dicado por una fuente de luz. Una solución ( no emergentista) consistiría en dotar al robot de unos sensores que midieran su posición en relación con los polos y de una subrutina que computara una trayectoria entre los mismos. Una solución alternativa (emergentista) se basaría en dos simples sistemas de conducta cuyas interacciones ambientales producirían el posicionamiento entre los polos como una especie de efecto secundario. Estos sistemas de conducta serían: 1) un sistema de fototactismo que produjera un acerca miento en zigzag a cualquier fuente de luz y 2) un sistema de evitación de obstáculos que hiciera que el robot se desviara cuando golpeara contra algo. Con estos dos sencillos sistemas en acción, la conducta deseada emerge con facilidad y solidez. El robot es atraído por la luz y zigzaguea hacia ella. Si toca un polo, recula, pero vuelve a ser atraído por la luz y hace otro intento, aunque esta vez con un ángulo nuevo. Tras unos cuantos intentos, encuentra la única posición donde sus sistemas de conducta están en equilibrio: una posición cercana a la luz pero sin tocar ningún polo. La conducta de orien tación hacia los polos se considera emergente porque no hay ningún compo nente que calcule la trayectoria correspondiente: el fototactismo, la evitación de obstáculos y la estructura del entorno local (la situación de la fuente de luz) ocasionan colectivamente el resultado deseado. Aquí nos encontramos con otro sentido de la emergencia que gira en torno a la idea de unos efectos secundarios funcionalmente valiosos producidos por la interacción entre unos componentes heterogéneos, y que coloca en primer plano las interac ciones entre unos sistemas de conducta y la estructura del entorno local. Es tos dos sentidos de la emergencia se corresponden, a grandes rasgos, con la anterior distinción entre formas de emergencia directas e indirectas (véase el apartado 4.2 anterior). Ahora profundizaremos un poco más y aclararemos el tema común que une a toda esta variedad de casos. Dicho en pocas palabras, ¿existe una ex-
156
1
Explicar la mente extendida
plicación razonablemente precisa y no trivial de la idea general de caracte rística emergente? En ocasiones, la noción general de emergencia se equipara con la idea de conductas inesperadas (existen rastros de esto en el énfasis de Steels en los «efectos secundarios», aunque el autor es consciente del peligro y procura evitarlo). Sin embargo, existe el problema de que lo que puede ser inespera do para una persona puede haber sido predicho por otra: un ingeniero hábil podría diseñar el robot que encuentra el centro entre los polos, precisamen te para explotar las interacciones entre los componentes básicos y el mundo con el fin de resolver el problema de la recarga. Con todo, aunque el resul tado se haya predicho desde el principio, la solución consen·a el sabor ca racterístico de la emergencia. En resumen: lo que realmente necesitamos es un criterio independiente del observador o, por lo menos, un criterio menos sujeto al capricho de las expectativas individuales. Una idea más prometedora, también mencionada por Steels, dice que un fenómeno es emergente si su descripción exige un vocabulario nuevo, total mente diferente del que empleamos para caracterizar las facultades y las pro piedades de sus componentes. Steels cita como ejemplo ciertas propiedades químicas como la temperatura y la presión, que no figuran en las descripcio nes del movimiento de las moléculas individuales pero que son necesarias para describir la conducta de conjuntos de moléculas. Esto parece promete dor, pero no lo suficiente. La razón es que el cambio de vocabulario también caracteriza casos que , intuitivamente, no son de verdadera emergencia. Parte de la conducta de un equipo de alta fidelidad compuesto por un amplifica dor, un sintonizador y unos altavoces, se describe mejor con un vocabulario que no se aplica a ninguno de los componentes individuales; sin embargo, un sistema como éste parece ser un buen candidato para la antigua explica ción basada en componentes. 7 Una mejor explicación de la emergencia (para nuestros fines, por lo me nos) es la generalización de la distinción entre lo que Steels ( ibíd.) denomi na variables cu11troladas (que reflejan conductas o propiedades que se pue den manipular d� una �anera simple y directa) y variables incontroladas (que reflejan conductas -o propiedades que surgen de la interacción entre múltiples parámetros y que, en consecuencia, tienden a resistirse a una ma nipulación simple y directa). Consideremos el relato de Douglas Hofstadter 7. En re,t!idad, las propiedades complejas de retroalimentación y alimentación hacia ade lante de los circuitos de alta fidelidad suelen producir características ,1cústicas que se podrían describir adecuadamente como emergentes (\·c'ase más adelante). Pero los fabricantes se es fuerzan mucho para reducir estas interacciones, simplificar la señal que pasa entre los com ponentes y aislarlos de la retroalimentación, interacciones no lineales, etc. Véase un plantea miento en Wimsmt kn prensa).
Emergencia y explicación 1 157
sobre un sistema operativo que empieza a «colgarse» cuando tiene a unos 35 usuarios conectados en línea. Hofsradter observa que, en este caso, se ría un error pedirle al programador del sistema que aumentara el umbral de «cuelgue» hasta (por ejemplo) 60 usuarios. La razón es que este um bral no está determinado por una simple variable interna que el progra mador pueda manipular directamente y que, en cambio, <
158 1 Explicar la mente extendida
glas anteriores, en ese lugar no se puede iniciar ningún montón nuevo. La disminución con el tiempo del número de posiciones posibles para los mon tones en la cuadrícula artificial, obliga a amontonar las astillas en las posi ciones restantes. Esta característica de «bloqueo de posiciones» no progra mada y determinada por el entorno permite que la actividad de acumulación supere a la de dispersión. En este ejemplo, es evidente que la conducta de amontonar no está controlada directamente sino que surge de la interacción entre dos reglas simples y un entorno restringido. Otro ejemplo: Hallam y Malcolm (1994) describen una solución simple para el problema de hacer que un robot se desplace siguiendo el contorno de las paredes. Construimos en el robot una tendencia a desviarse hacia la dere cha y colocamos en su lado derecho un sensor que se activa por contacto y que hace que el robot gire un poco hacia la izquierda. Cuando este robot topa con una pared a la derecha, primero se aparta (gracias al sensor) y luego vuelve rá pidamente a dirigirse hacia la pared (gracias a la tendencia). Este ciclo se irá repitiendo y, de hecho, el robot irá siguiendo la pared rebotando repetida mente contra ella. Como ha indicado Tim Smithers en una comunicación per sonal, esta solución exige un equilibrio bastante delicado entre la cantidad de «viraje hacia la derecha» y la cantidad de «rebote hacia la izquierda». Smithers también indica que esta idea general de emplear «fuerzas opuestas para lograr una conducta regulada estable» puede verse en la tecnología de las clepsidras primitivas, ¡un buen ejemplo de cronometraje emergente! Sin embargo, la cuestión que cabe destacar es que la conducta de seguimiento de paredes que acabamos de describir surge de la interacción entre el robot y su entor no. No está controlada por ningún estado interno que codifique el objetivo de seguir las paredes. Nosotros, como teóricos externos, aplicamos la des cripción del seguimiento de paredes como una capa de barniz sobre la con ducta embebida global del aparato. En estos dos casos, la distinción de Ste els entre variables controladas e incontroladas parece darnos lo que necesitamos. Esta explicación también se puede aplicar con éxito al proble ma de encontrar el centro entre los dos polos y sospecho que a cualquier otro caso de emergencia indirecta. Sin embargo, el énfasis en fenómenos que no se pueden controlar ni manipular alterando los valores de un solo pará metro, no puede abarcar fenómenos intuitivamente emergentes como la apa rición ·de bucles de convección en líquidos calentados. La razón es que los bucles de convección están bajo el control de un parámetro simple (el gra diente de temperatura o, pasando a las causas inmediatas, el calor aplicado) y, como resultado, es posible «juguetear» con ellos (para emplear la célebre frase de Hofstadter). De hecho, el gradiente de temperatura que dirige el movimiento se llama parámetro de control precisamente porque rige las con ductas colectivas del sistema de una manera tan potente.
Emergencia y explicación 1 159
Ante esta importante clase de casos, creo que una explicación mejor de la emergencia (una especie de generalización débil de la idea de variable in controlada) es simplemente ésta: un fenómeno es emergente si se compren de mejor prestando atención a los valores cambiantes de una variable co lectiva. Veamos a continuación algunos comentarios breves acerca
160
1
Explicar la mente extendida
mediante una variable colectiva que marca la amplitud variable de los bucles de convección; véase Kelso, 1995, pág. 8). • La emergencia así definida se vincula con el objetivo de determinar qué variables deben figurar en una buena explicación de la conducta de un sistema. Este objetivo depende un poco del observador porque se basa en la idea de una buena explicación teórica y, en consecuencia, implica cierta re lación con las mentes de los científicos humanos. Pero por lo menos no de pende de los caprichos de las expectativas individuales sobre la conducta del sistema. 6.3 Los sistemas dinámicos y la explicación basada en la emergencia
¿Cuál es el marco explicativo más eficaz para comprender los fenómenos emergentes? Una intuicíón negativa ampliamente compartida es que, en estos casos, la explicación clásica basada en componentes suele salir, como mínimo, mal parada (Steels, 1994; Maes, 1994; Wheeler, 1994). Hay dos razones bas tante distintas para este fracaso. Una razón gira en torno al hecho de que muchos fenómenos cognitivos emergentes (no todos) tienen su origen en factores que abarcan el organismo y su entorno. En estos casos (y ya hemos visto varios ejemplos) lo ideal sería un marco explicativo que cumpliera las siguientes condiciones: 1) que fuera adecuada para modelar tanto los parámetros del organismo como los del en torno y 2) que facilitara la comprensión de las complejas interaccíones entre los dos, modelando estos parámetros en función de un marco y de un voca bulario uniformes. Según parece, un marco que invoque unos homúnculos dedicados a computar y procesar información no es un medio ideal para sa tisfacer estas demandas. Otra razón gira en torno a la naturaleza de los componentes. Cuando cada componente hace una contribución definid,l a la capacidad de un siste ma para mostrar una propiedad concreta, el análisis de componentes es un potente instrumento. Pero algunos sistemas son muy homogéneos en el nivel de los componentes y la mayoría de las propiedades interesantes dependen únicamente de los efectos conjuntos de interacciones simples entre las par tes. Un ejemplo (van Gelder, 1991; Bechtel y Richardson, 1992) sería una simple red conexionista simple, formada por unas unidades de procesa miento muy similares y cuyas propiedades interesantes son principalmente atribuibles a la organización (mediante una gran densidad de conexiones con pesos) de estas unidades. Se produce un caso más complejo cuando un sistema es muy heterogéneo pero las contribuciones de las partes están muy
Emergencia y explicación 1 161
interdefinidas; es decir: la función de un componente C en el tiempo t1 , ade más de estar determinada por las funciones de los otros componentes en t 1 (y de contribuir a determinar estos otros componentes), también puede con tribuir de una manera totalmente diferente en un momento t2 gracias a unos enlaces complejos (y con frecuencia no lineales; véase nota 8) de retroali mentación y alimentación hacia adelante con otros subsistemas. Así pues, la presencia de una heterogeneidad interna y de una especialización funcional en línea no garantiza que un análisis de los componentes constituya la des cripción más reveladora. Estas complejidades se reflejan en la estupenda descripción que hace Wimsatt ( 1986) de los «sistemas agregados». Los sistemas agregados son los que más se adecuan a una explicación basada en los componentes. En estos sistemas, las partes muestran su conducta explicativa pertinente incluso es tando aisladas entre sí, y se pueden invocar las propiedades de un número pequeño de subsistemas para explicar fenómenos sistémicos interesantes. 9 A medida que aumenta la complejidad de la interacción entre las partes, el peso de la explicación recae cada vez más en la organización de las partes que en las partes en sí. En este momento nos vemos conducidos a buscar nuevos tipos de marcos explicativos. Como veremos después, es probable que la cognición biológica avanzada se encuentre en algún punto intermedio de este continuo. Los sistemas tienen componentes neuronales diferenciados y funcionalmente especializados, pero las interacciones complejas y con fre cuencia no lineales (relaciones de retroalimentación y alimentación hacia adelante) entre estos componentes pueden ser factores determinantes de la mayoría de los fenómenos intuitivamente «psicológicos». Para comprender bien los casos de este tipo, además de una explicación tradicional basada en componentes hace falta algo más. Pero, ¿qué es ese algo? Teniendo en cuenta nuestros dos deseos (dar cabida por igual a las inte racciones organismo-entorno y a las interacciones complejas entre los com ponentes), es natural que consideremos el marco de la teoría de los sistemas dinámicos (brevemente introducido en el capítulo 5 anterior), un enfoque teórico que ofrece un conjunto de instrumentos para describir la evolución de los estados de un sistema con el tiempo (Abraham y Shaw, 1992). En es tas descripciones, el teórico especifica un conjunto de parámetros cuya evo lución colectiva est,Í regida por un conjunto de ecuaciones (normalmente) diferenciales. Una característica fundamental de estas explicaciones es que pueden abarcar con facilidad el organismo y el entorno. En estos casos, las dos fuentes de variación (el organismo y el entorno) se tratan como sistemas acoplados cuya evolución mutua se describe mediante un conjunto específi9. Véa,e también Bechtel y Richar
i 62
1
Explicar la mente extendida
co de ecuaciones entrelazadas. La conducta de un péndulo de pared coloca do en el entorno de otro péndulo similar constituye un ejemplo sencillo. La conducta de un solo péndulo se puede describir mediante ecuaciones sim ples y constructos teóricos como atractores y ciclos límite 10 pero, sorpren dentemente, dos péndulos colocados uno cerca del otro tienden a sincroni zar su oscilación con el tiempo. Esta sincronización admite una elegante explicación basada en la teoría de los sistemas dinámicos: los dos péndulos se tratan como si fueran un solo sistema acoplado y la ecuación para el mo vimiento de cada péndulo incluye un término que representa la influencia del estado actual del otro péndulo, alcanzándose el acoplamiento por medio de las vibraciones que se transmiten a través de la pared. 11 De mayor impor tancia en nuestro contexto es que la teoría de los sistemas dinámicos tam bién proporciona un nuevo marco explicativo. En el corazón de este marco se encuentra la idea de explicar la conducta de un sistema aislando y mos trando un conjunto de variables (variables colectivas, parámetros de control, etc.) que subyacen a las pautas distintivas que emergen a medida que el sis tema se despliega en el tiempo, y de describir estos modelos de despliegue real y potencial mediante la terminología distintiva y matemáticamente pre cisa de los atractores, los puntos de bifurcación, los retratos de fase, etc. (vé ase el apartado 5 .6 anterior). La explicación dinámica típica difiere en muchos aspectos de la com prensión tradicional centrada en los componentes. A primera vista, la dife rencia más desconcertante es que l::i teoría de los sistemas dinámicos parece querer explicar unas conductas describiendo otras. Sin embargo (por lo me nos intuitivamente), proporcionar una descripción, por rica y detallada que sea, parece distar mucho de proporcionar una explicación, porque ésta suele reducir el desconcierto poniendo de manifiesto parte de los mecanismos ocultos que provocan una conducta. Además, muchos científicos y filósofos creen que ciertos sistemas físicos (como el cerebro) dependen de unos prin cipios organizativos especiales y que, en consecuencia, requieren un vocabu lario y un estilo explicativ0 muy diferentes de los empleados para explicar la coordinación entre dos péndulos o el goteo de un grifo. No obstante, la teo ría de los sistemas dinámicos nos sorprende al emplear el mismo enfoque bá sico para abordar muchos tipos de fenómenos reales que superficialmente son muy diferentes. Esto ayuda a explicar por qué muchos científicos cogni tivos se sienten decepcionados al ver que este estilo de explicación ofrece unas interpretaciones detalladas de pautas de conducta generales, pero dice poca cosa sobre los «mecanismos reales». Esta sorpresa tiene sentido si lo que 10. Véase una buena introducción en Nc)fton, 1995. 11. Véa:;e una explicación más completa en Salzman, 1995.
Emergencia y explicación
1
163
esperamos es encontrar una clase especial de interpretación centrada en suce sos ocultos e internos. Pero para un teórico de los sistemas dinámicos intere sado en la cognición, tanto la dinámica neuronal como la dinámica corporal general derivan de los mismos principios que subyacen a la autoorganización de los sistemas complejos. Desde esta perspectiva, es natural tratar ambos ti pos de pautas de maneras similares: en palabras de Kelso (1995, pág. 28), «lo que se propone es que tanto la conducta manifiesta como la conducta del ce rebro, adecuadamente interpretadas, siguen los mismos principios». 12 Para captar el verdadero sabor de los tipos de explicación aquí debatidos, nos centraremos en el estudio de un caso real llevado a cabo por Kelso y otros ( 1981) y resumido con precisión en el capítulo 2 de Kelso, 1995. Este estudio se centra en el fenómeno de la conducta rítmica y, concretamente, en la produc ción de movimientos rítmicos con los dedos. Intentemos mover nuestros dos
164 1 Explicar la mente extendida
bían mejor estas conductas. Descubrió que la variable crucial era la que re flejaba la relación de fase entre los dedos. Esta variable, como hemos visto, es constante para una amplia gama de frecuencias de oscilación de los dedos y cambia repentinamente cuando la frecuencia alcanza un valor determina do. Es una variable colectiva porque no se puede definir para un solo com ponente (un dedo) sino sólo para el sistema más amplio. Por tanto, la fre cuencia de movimiento es el parámetro de control de la relación de fase que ahora se traza como una variable colectiva. Pero el verdadero meollo del análisis reside en ofrecer una descripción matemática detallada del sistema así descrito: un conjunto de ecuaciones que muestren el espacio de posibles evoluciones temporales de la fase relativa en función del parámetro de con trol. Esta descripción representa eficazmente el espacio de estados del siste ma (véase el capítulo 5 anterior) mostrando, entre otras cosas, qué áreas del espacio actúan como atractores (valores de la variable hacia los que tenderá el sistema desde otras localizaciones determinadas del espacio). Haken y otros (1985) encontraron precisamente una descripción como ésta y pudie ron mostrar las detalladas pautas de coordinación correspondientes a distin tos valores del parámetro de control. Entre otros aspectos importantes, este modelo no sólo podía describir las transiciones de fase observadas sin pos tular un «mecanismo conmutador» aparte de la dinámica colectiva, sino que también podía reproducir los resultados de interferencias de poca impor tancia en el sistema, como ocurre cuando se obliga a un dedo a abandonar brevemente su relación de fase esuble. El modelo de Haken y otros también podía predecir con precisión ciertas características del sistema, como el tiempo necesario para pasar de un estado desfasado a un estado de fase. 13 Ahora debería estar más claro por qué la explicación dimímica no es me ramente una buena descripción de los fenómenos observados. Debe su con dición de explicación a su capacidad para dilucidar lo que los filósofos de nominan «contrafácticos»; es decir. a su capacidad para informarnos no sólo sobre la conducta real observada en el sistema, sino también sobre su com portamiento en varias ottas circunstancias. Con todo, estas explicaciones to davía carecen de una pqtente característica de sus parientes más tradiciona les. No están obligadas a dar unas recetas detalladas para construir los dispo?itivos que describen y explican. En este aspecto, difieren de los mo delos familiares donde se explica una conducta mostrando cómo surge a partir de las propiedades de una variedad de componentes bien comprendi dos. Por ejemplo, los modelos computacionales tradicionales tienen la virtud muy real de descomponer tareas complejas en secuencias de tareas cada vez 13. Véanse detalles de estos resultados y del modelo matemático empleado en las págs. 54-61 de Kelso, 199'5.
Emergencia y explicación 1 165
más simples, hasta llegar a un punto en el que podemos ver cómo llevarlas a cabo únicamente con puertas lógicas, placas de memoria, etc., como recur sos básicos. En su vertiente positiva, las explicaciones dinámicas, con su aparato de variables colectivas y conductas acopladas, se prestan de una manera natu ral a abarcar múltiples componentes en interacción e incluso sistemas com pletos agente-entorno. Mientras que el marco normal parece orientado a describir los cómputos y representaciones del agente, los constructos de los sistemas dinámicos se aplican con la misma facilidad a aspectos del entorno (por ejemplo, los ritmos de un grifo que gotea) que a sucesos internos de procesamiento de información. Esta facilidad para describir sistemas inte grados más amplios es lo que conduce a teóricos como Beer y Gallagher ( 1992) y Wheeler (1994) a preferir antes la teoría de los sistemas dinámicos que los enfoques clásicos basados en componentes para explicar conductas emergentes que con frecuencia implican al entorno. Las conductas estudia das hasta ahora tienden a ser relativamente básicas, como la locomoción me diante patas (véase el capítulo 5 anterior) y el movimiento orientado visual mente. Pero muchos teóricos intuyen que la mayor parte de la inteligencia biológica cotidiana tiene sus orígenes en unos acoplamientos precisos entre los organismos y los entornos específicos de ciertas tareas y que, en conse cuencia, este estilo de explicación puede ir mucho más allá que las explica ciones de fenómenos de «nivel» relativamente bajo. De hecho, en Port y van Gelder, 1995, se encuentran varios ejemplos de aplicación de la teoría de los sistemas dinámicos a tareas de nivel superior como la planificación, la toma de decisiones, la producción del lenguaje y el reconocimiento de sucesos. Sin embargo, es importante recordar que los parámetros sistémicos re flejados en estas explicaciones dinámicas se pueden alejar mucho, y de una manera arbitraria, Je los datos reales sobre la estructura y el procesa miento interno del agente. Van Gelder (1991) observa que una explica ción basada en la teoría de sistemas dinámicos para la conducta del motor de un automóvil a lo largo del tiempo podría tener que centrarse en un parámetro como la temperatura, que no corresponde a ningún compo nente interno o a ninguna variable di rectamente controlada. Según van Gelder, esto puede ocurrir porque «en su forma pura, la explicación di námica no hace referencia a la estructura propiamente dicha del mecanis mo cuya conducta explica. Nos dice cómo evolucionan con el tiempo los valores de los parámetros del sistema, no qué hay en la constitución del mismo sistema que haga que estos parámetros evolucionen de la manera especificada. Se dedica a explorar la estructura topográfica de la dinámi ca del sistema, pero esta estructura es totalmente diferente de la del siste ma mismo» (ibíd., pág. 500).
166
1
Explicar la mente extendida
Evidentemente, también disponemos de las opciones intermedias. Salz man (1995) ofrece una explicación dinámica de la producción del habla ba sada en la coordinación de múltiples músculos y observa que esta dinámica coordinadora se debe especificar en términos abstractos de información que no reflejan directamente ni la estructura biomecánica ni la neuroanatómica. En sus propias palabras, «esta dinámica abstracta se define mediante coor denadas que representan las configuraciones de diferentes tipos de restric ción como, por ejemplo, las restricciones bilabiales empleadas para producir lb/, /pi o /m/, las restricciones alveolares empleadas para producir /d/, !ti o /n/, etc.» (ibíd., pág. 274). Estas restricciones se definen en términos físi cos que implican elementos como la abertura y la prominencia de los labios. Pero la explicación basada en los sistemas dinámicos se define en función de los tipos más abstractos mencionados anteriormente. Éste es un caso inter medio en la medida en que está claro que los parámetros más abstractos ci tados en el análisis dinámico se relacionan con componentes y estructuras fí sicas del sistema. Estos análisis intermedios tienen una gran importancia. A continuación argumentaré que la ciencia cognitiva no se puede permitir prescindir de nin guno de los diversos estilos explicativos que acabamos de revisar y que, en consecuencia, es crucial que nos aseguremos de que estas diversas explica ciones se entrelacen y se ilustren mutuamente de un modo u otro. Ahora de sarrollaré un argumento en pro de este liberalismo explicativo y mostraré que la necesidad del entrelazamiento mencionado impone unas fuertes res tricciones adicionales a nuestra teorización. 6.4 Matemáticos e ingenieros Exactamente, ¿qué poder tiene el estilo de explicación y análisis basado puramente en los sistemas dinámicos? Mi punto de vista, como se verá cada vez con mayor claridad 9urante los próximos capítulos, es que nos ofrece una parte fundamental de la comprensión que necesitamos pero (por lo me nos en la actualidad) no nos la puede ofrecer toda. Para ver por qué, prime ro debemos tener claro qué entiendo por un estilo de explicación basado pu ramente en los sistemas dinámicos. Una explicación basada puramente en los sistemas dinámicos es aquella donde el teórico sólo busca aislar los parámetros, las variables colectivas, etc., que controlan con más fuerza la manera en que el sistema se despliega en el tiempo, incluyendo (esto es importante) la manera en que responderá en circunstancias nuevas, aún no encontradas. Por tanto, el teórico de los siste mas dinámicos puros busca modelos matemáticos o geométricos que permi-
Emergencia y explicación 1 167
tan captar con fuerza los fenómenos observables. Esto, además de ser buena ciencia, es ciencia explicativa (y no sólo descriptiva). Además, como acaba mos de ver, gran parte del atractivo y el poder distintivo de estos enfoques reside en su capacidad de centrarse en variables colectivas, es decir, en va riables cuyas raíces físicas suponen las interacciones de múltiples sistemas (que con frecuencia se extienden por el cerebro, el cuerpo y el mundo). Pero este poder distintivo tiene un precio: estos modelos «puros» no apelan di rectamente a los intereses del ingeniero. El ingeniero quiere saber cómo construir sistemas que muestren propiedades parecidas a las de la mente y, en particular, quiere saber cómo surge la dinámica global mostrada con tan ta precisión por las explicaciones puras a partir de la microdinámica de di versos subsistemas y componentes. Aceptará que una comprensión plena del sistema en acción exige unas explicaciones dinámicas puras como las que acabamos de enumerar. Sin embargo, no creerá que esas explicaciones sean suficientes para comprender cómo funciona el sistema, porque se sitúan a una gran distancia de los datos sobre las capacidades de unos componentes físicos familiares y bien comprendidos. En este sentido, una explicación computacional típica (conexionista o clásica) se acerca mucho más a consti tuir una receta para construir un dispositivo capaz de mostrar las conductas deseadas. La razón de ello es que las transiciones de estado básicas que in tervienen en la especificación se deben poder reproducir mediante unas combinaciones conocidas de unas operaciones básicas que, a su vez, se de ben poder realizar empleando puertas lógicas, unidades de procesamiento conexionistas, etc. En cierto sentido, lo que se consigue mediante una discusión dinámica pura se parece más a un sofisticado análisis de tareas que a una explicación computacional totalmente elaborada. Pero se trata de un análisis de tareas que está preñado contra/ácticamente (véase el apartado 6.3 anterior) y que al mismo tiempo es potencialmente a1nplio. Es amplio en la medida en que puede «unir» aspectos del espacio del problema que, por un lado, dependen del entorno exterior y, por otro, dependen de propiedades del organismo particular. En estos casos habrá múltiples maneras de implementar la diná mica descrita, y algunas de ellas incluso podrán dividir las subtareas entre cuerpo, cerebro y mundo de manera diferente. Por ejemplo, lo que hace un niño A gracias a la grasa corporal puede hacerlo un niño B gracias a unos pe sos artificiales, y lo que puede hacer un ser C mediante unos cálculos com plejos lo puede hacer un ser D mediante la resistencia de sus músculos elás ticos. Por tanto, a partir de unas «divisiones del trabajo» muy diferentes pueden emerger unas dinámicas generales idénticas. Así pues, el principal motivo de queja es que una buena caracterización dinámicamente pura del sistema no llega a constituir una receta para cons-
168
1
Explicar la mente extendida
truir un sistema que muestre las conductas de interés. Una respuesta a esta queja (respuesta que he oído muchas veces en labios de defensores acérri mos de la teoría de los sistemas dinámicos) consiste en atacar su misma base. ¿Por qué insistir en que la verdadera comprensión de algo exige «saber cómo construirlo»? Esther Thelen (comunicación personal) observa que «según este criterio, deberíamos echar por la borda casi toda la biología», por no mencionar la economía, la astronomía, la geología y quién sabe qué más. ¿Por qué la ciencia cognitiva debe satisfacer un criterio explicativo mucho más exigente que el de las restantes ciencias? A pesar de su superficial verosimilitud, esta respuesta está desencami nada porque se toma la exigencia de la «capacidad de construcción» de una manera demasiado literal. Lo que aquí se propone no es que realmente po damos construir sistemas que muestren las características deseadas (aunque en favor de la inteligencia artificial se debe decir que, con frecuencia, su ob jetivo es precisamente éste), sino que deberíamos comprender algo sobre el origen de las propiedades a mayor escala a partir de las interacciones de las partes. Aunque no podamos construir nuestros propios volcanes, compren demos cómo se confabulan las fuerzas subterráneas para crearlos. También podemos buscar explicaciones convincentes del crecimiento y la disminu ción de la actividad volcánica a lo largo del tiempo, e incluso lo podemos hacer aislando parámetros de control, definiendo variables colectivas, etc. Sin duda, una comprensión plena de la naturaleza de la actividad volcánica depende de seguir simultáneamentF y entrelazar con cuidado ambos tipos de explicación. Así pues, ¡ en cierto sentido sí que sabemos cómo construir volcanes, torbellinos, sistemas solares y todo lo demás! Los problemas para llevar a cabo esta construcción provienen de dificultades prácticas (de es cala, materiales, etc.) y no de alguna carencia en el nivel necesario de com prensión. Por tanto, es necesario suavizar el criterio de la «capacidad de construc ción» para dar cabida al gran número de casos donde hay otros problemas que obstaculizan nuestro camino. Unos obstáculos típicos, tomados de un artículo de Fred Dretske de acertado título, 14 podrían ser: «Los materiales brutos no están disponiblés. No podemos pagarlos. Somos demasiado torpes o no somos lo suficientemente fuertes. La policía no nos deja» (Dretske, 1994, pág. 468). A la inversa, según Dretske, el mero hecho de que podamos construir algo no garantiza que realmente lo comprendamos: podemos mon14. El título es «lf you can't make one, you don't know how it works» (Si no lo pue
Emergencia y explicación
1
169
tar las piezas de una maqueta y no ser más listos que antes. Así pues, la afir mación fundamental (y en mi opinión la correcta) es, simplemente, que para comprender de verdad un fenómeno complejo es necesario que comprenda mos por lo menos algo de sus orígenes en las propiedades más básicas de sus partes biológicas o físicas. Propongo que, en última instancia, esto requiere explorar continuamente más allá del nivel de las variables colectivas y simi lares con el fin de comprender las raíces más profundas de la misma dinámi ca colectiva. La vertiente positiva es que -retóricas esporádicas aparte- la mayoría de los proponentes de un enfoque dinámico reconocen esta necesidad y res ponden a ella. Después de describir la conducta corpórea y embebida de los niños pequeños con gran detalle, Thelen y Smith (1994) siguen investigando cuestiones relacionadas con la dinámica de las organizaciones neuronales subyacentes. Como indican ellas mismas, su descripción de los paisajes di námicos variantes (atractores cambiantes) de los niños, las deja «en una to tal ignorancia acerca de los mecanismos más precisos de la estabilidad cam biante de los atractores» (ibíd., pág. 129). En respuesta a esta necesidad, Thelen y Smith abordan mediante un enfoque dinámico el nivel de la orga nización neuronal. Kelso (1995, pág. 66) es aún más claro cuando insiste en que hace falta un «"esquema tripartito" que implique un mínimo de tres ni veles (el nivel de las metas o tareas..., el nivel de las variables colectivas y el nivel de los componentes) para obtener una comprensión completa». Kelso también observa -importante cuestión- que lo que realmente cuenta como componente o como variable colectiva dependerá, en parte, de nuestros in tereses explicativos concretos. Citando su propio ejemplo, los osciladores no lineales se pueden tratar como componentes para algunos fines. Pero la mis ma conducta osciladora no lineal es un efecto colectivo que surge de las in teracciones de otras partes más fundamentales. Randall Beer, en sus intentos cuidadosos y progresivos de comprender el funcionamiento de los controladores de redes neuronales de agentes senci llos, destaca la necesidad de comprender la dinámica detallada de cada neu rona individual, de pares acoplados de neuronas, de pares acoplados de neu ronas acoplados a su vez a cuerpos simples, etc., aumentando la escala de complejidad. En resumen, Beer busca una comprensión basada en los siste mas dinámicos que llegue hasta abajo y en relación a la cual las propiedades especiales de sistemas cada vez más grandes y complejos empiecen a tener más sentido (véase, por ejemplo, Beer, 1995). Por tanto, todos estos teóricos comparten el reconocimiento de que las aspiraciones explicativas de la cien cia cognitiva van más allá de la representación detallada de la conducta cor pórea y embebida, e incluso más allá de las explicaciones genuinas de esta conducta que se puedan dar en función de variables colectivas adecuadas
170
1
Explicar la mente extendida
para comprender la conducta general observada. Lo que en última instancia distingue estos enfoques del trabajo más tradicional, es la insistencia (Kelso y otros) o la sospecha (Beer) de que las nociones familiares de representa ción interna, procesamiento de información y (quizá) computación no pro porcionan el mejor vocabulario o marco para comprender las restantes cues tiones relacionadas con la organización neuronal. En cambio, estos autores abogan por el empleo de un vocabulario de sistemas dinámicos para descri bir y explicar todos los niveles de organización biológica. Mi opinión, como se verá claramente en los próximos capítulos, es que no sólo necesitaremos una mezcla de niveles de análisis (algo parecido al «esquema tripartito» de Kelso) sino también una mezcla de instrumentos explicativos que combine los constructos de los sistemas dinámicos con ideas sobre la representación, L1 computación y la función de procesamiento de información de unos sub componentes identificables. Para captar el sabor general de este enfoque mixto, consideremos un ejemplo concreto. 6.5 Decisiones, decisiones La explicación basada en componentes y la explicación de «atrapar y lanzar» son adecuadas para explicar la conducta adaptativa desentrañando las aportaciones de componentes específicos del agente. La explicación de «atrapar y lanzar» se distingue princi 1ialmcnte por reconocer de una ma nera explícita las profundas diferencias que puede producir, en nuestras hipótesis sobre la organización interna requerida para el procesamiento de información, la atención a las oportunidades ambientales y a las exigencias de la acción en tiempo real. En cambio, las explicaciones de fenómenos emergentes basadas pUramente en los sistemas dinámicos, esperan impor t,1r una perspectiva completamente nueva que se centra en la evolución de parámetros sistémicos globales y que es especialmente idónea para mode lar la compleja interacción e!'ltrc múltiples parámetros del agente y del en torno. Así descritos, parece _casi evidente que los dos tipos de explicación (el análisis basado en componentes y en el procesamiento de información, y el estilo 9e análisis de la dinámica global) son necesarios y que se debe rían entralazar con fluidez. Sin embargo, varios escritos recientes propo nen un punto de vista alternativo, más imperialista. Según éstos, la teoría de los sistemas dinámicos es preferihll' al discurso de descomposiciones del procesamiento de información y de componentes internos que trabajan con representaciones. Un punto de vista tan radical sólo se puede mante ner adoptando una visión excesivamente empobrecida de los objetivos de la ciencia cognitiva.
Emergencia y explicación 1
171
Consideremos el objetivo de explicar los efectos sistemáticos de varios ti pos de daños y trastornos locales. Con frecuencia, el hecho de centrarse en parámetros sistémicos globales que nos ayuden a comprender la dinámica imperante en sistemas organismo-entorno que funcionan bien, oculta deta lles sobre la contribución a ese acoplamiento de diversos sistemas internos y, en consecuencia, oculta información sobre la influencia de los fallos de estos sistemas en la conducta global. Sin embargo, un importante corpus de traba jo en la neurociencia cognitiva pretende precisamente determinar la organi zación interna que explica las pautas de fallo que se producen tras un daño local (Farah, 1990; Damasio y Damasio, 1994 ). Estas explicaciones suelen adoptar al mismo tiempo una perspectiva basada en módulos/componentes y una perspectiva basada en representaciones. Este tipo de comprensíón complementa cualquier comprensión más amplia de la dinámica global. Cada estilo explicativo ayuda a capturar una gama distinta de fenómenos y ofrece tipos diferentes de generalización y predicción. Por ejemplo, Busemeyer y Townsend ( 1995) presentan una elegante apli cación de la teorización dinámica para comprender la toma de decisiones, El marco de referencia que desarrollan estos autores, llamado «teoría del campo de decisiones», describe cómo evolucionan los estados de preferencia con el tiempo. Busemeyer y Townsend presentan unas ecuaciones dinámicas que de finen la interacción de diversos factores generales (como el valor previsto a lar go y a corto plazo para diferentes opciones) y que también predicen y explican las oscilaciones entre elecciones probables que se producen durante la delibe ración. Estas oscilaciones se explican como los efectos de variar la cantidad de atención que quien toma la decisión dedica en cada momento a diversos fac tores. Esta interpretación captura y explica varios fenómenos interesantes, in cluyendo las aparentes incoherencias entre los órdenes de preferencias medi dos por la elección y los medidos por el precio de venta. 15 Por tanto, a partir de las ecuaciones específicas que emplean estos autores para modelar la evo lución en el tiempo de las variables y los parámetros elegidos, aparece una da se entera de generalizaciones, explicaciones y predicciones. Sin embargo, hay otros tipos de explicación y de generalización que no se pueden subsumir en este nivel de descripción. Consideremos, por ejem plo, el famoso caso de Phineas Gage a mediados del siglo XIX. Gage, que ua bajaba de capataz en el tendido de raíles de ferrocarril, sufrió una terrible le sión cuando una barra de hierro le atravesó la cara, el cráneo y el cerebro. Increíblemente, Gage sobrevivió y recobró todas sus aptitudes lógicas, espa ciales y físicas. Pero aunque su memoria y su inteligencia no se vieron afec tadas, su vida y su personalidad cambiaron radicalmente. Ya no era digno de 15. Véase también Lid1tcnstein y Slovic, 1971.
172
1
Explicar la mente extendida
confianza, ni afectuoso, ni capaz de cumplir con sus deberes y compromisos. Al parecer, la lesión de su cerebro había ocasionado un efecto muy específi co pero extraño: era casi como si sus «centros morales» se hubieran destrui do (Damasio y otros, 1994). Para ser más precisos, parecía que su capacidad de «tomar decisiones racionales acerca de cuestiones personales y sociales» (ibíd.) hubiera sido dañada selectivamente, dejando intactas su inteligencia y sus restantes capacidades. Hace unos años, un equipo de neurocientíficos especializados en imágenes cerebrales analizó el cráneo de Gage y, mediante simulaciones por ordenador, pudieron identificar las probables localizacio nes de las lesiones cerebrales. Al identificar unas estructuras neuronales es pecíficas como localizaciones de las lesiones, Damasio y otros (ibíd.) pudie ron empezar a comprender las alteraciones selectivas de Gage (y de otros casos parecidos; véase el caso de E.V.R. en Damasio y otros, 1990). La lesión estaba en las regiones ventrales mediales de los dos lóbulos frontales, es de cir, en las áreas que parecen desempeñar un papel fundamental en el proce samiento emocional. Este hallazgo condujo al equipo de Damasio a especu lar que las respuestas emocionales desempeñan un papel especial en la toma de decisiones sociales.16 Inspirándose en parte en estos estudios, los Dama sio también desarrollaron un marco más general para la explicación de los déficit psicológicos selectivos. Se trata de la «hipótesis de la zona de conver gencia» que se explica con cierto detalle en el próximo capítulo. Como ve remos, un aspecto característico de esta hipótesis es cómo combina la aten ción a la compartimentación funcional básica del cerebro con el reconocimiento del papel de los circuitos integradores de mayor escala. Por tanto, parece que una explicación completa de déficit como los de Gage y E.V.R. requiere combinar localizaciones de procesamiento de información bastante familiares (asignar tareas definidas a zonas diferentes de la corteza motriz y sensorial) con análisis a mayor escala que implican la.vinculación de múltiples zonas mediante complejas redes de conectividad retroalimentado ra y de alimentación hacia adelante. Los detalles de esta explicación quedarán más claros cuando nos centre mos en la neurociencia contemporánea (capítulo 7). De momento, lo impor tante no es evaluar los detalles de esta propuesta de Damasio y otros, sino observar que su objetivo es un tipo de comprensión que no está presente en la descripción global ofrecida por la teoría del campo de decisiones (que no ha sido diseñada para predecir o esclarecer las alteraciones inesperadamen te selectivas del proceso de toma de decisiones que abordan estos estudios neuroanatómicos). Esto no es una crítica de la teoría del campo de decisio nes, que en sí misma proporciona un tipo de comprensión, predicción y ex16. Véanse más detalles en el capítulo 8 de Damasio, 1994 y en el capítulo 7 de este libro.
Emergencia y explicación
1
173
plicación ausente en la propuesta de los Damasio. Y esto es así porque la teoría del campo de decisiones puede tratar las propiedades emergentes del sistema completo, intacto y que funciona bien como variables colectivas y, en consecuencia, proporciona un vocabulario y un nivel de análisis muy ade cuado para capturar pautas de evolución con el tiempo en la conducta de agentes intactos que funcionan bien. Además, con frecuencia estas descrip ciones más abstractas serán las que nos servirán mejor si queremos com prender los acoplamientos existentes entre unos sistemas completos y sus entornos. Debemos reconocer sin reparos que las características globalmen te emergentes suelen desempeñar un papel importante en aclarar las expli caciones de estos acoplamientos. Sin embargo, como estos dos estilos de explicación se complementan de manera natural, sobra la rivalidad que al gunos defensores del análisis basado en los sistemas dinámicos parecen fo mentar. En cambio, deberíamos distinguir claramente dos proyectos expli cativos, cada uno con su propia clase de generalizaciones. Uno de estos proyectos pretende comprender la manera en que se interrelacionan agentes y entornos intactos y, al hacerlo, puede invocar parámetros abstractos y glo balmente emergentes. El otro intenta comprender las funciones específicas de procesamiento de información que desempeñan diversos subsistemas in ternos en la producción de conductas y, en consecuencia, ayudar a explicar clases enteras de fenómenos (por ejemplo, los efectos de lesiones locales) que a su homólogo, simplemente, no le interesan. De hecho, una manera natural de concebir los dos proyectos que acaba mos de resumir, consiste en describir el análisis de componentes como si proporcionara (en parte) la implementación detallada del relato más global y abstracto basado en los sistemas dinámicos. Van Gelder (1991) es escép tico acerca del valor de estas descripciones de implementación, por lo me nos para comprender redes neuronales complejas; observa (pág. 502) que la explicación basada en componentes (o, como él dice, «sistemática») es poco útil en casos donde «las "partes" de la estructura son muchas y muy simila res, y los parámetros esenciales... no hacen ninguna referencia en absoluto a partes del sistema». Pero si bien esto puede ser cierto para comprender las conductas de redes conexionistas aisladas y relativamente homogéneas, pa rece manifiestamente inexacto en lo que se refiere a los cerebros de la ma yoría de los organismos biológicos. Propongo que una imagen más realista debe aceptar tres tipos de explicación y descripción igualmente importan tes y entrelazados: 1. Una explicación de las conductas generales del organismo que fun ciona bien en el entorno: una explicación que pueda invocar variables co lectivas cuyas raíces constituyentes abarquen ccrchro, cuerpo y mundo.
17 4
1
Explicar la mente extendida
2. Una explicación que identifique los diversos componentes cuyas pro piedades colectivas son el objetivo de las explicaciones apropiadas a 1. Este objetivo consta de dos importantes subtareas: identificar los componentes neuronales pertinentes y explicar cómo interaccionan estos componentes en tre sí. 3. Una explicación de las div€rsas funciones de procesamiento de infor mación desempeñadas por los componentes (tanto internos como externos) identificados en 2., que además puede asignar unos roles computacionales y unas capacidades representacionales específicas a distintos subsistemas neu ronales. Afirmo que las explicaciones satisfactorias del éxito adaptativo corpóreo y embebido deben abarcar estas tres bases. Además, cada tipo de explica ción impone limitaciones y requisitos a los otros. No puede haber ninguna variable colectiva legítima en l. que carezca de detalles de implementación microdinámica en 2., y estos detalles no se pueden entender totalmente sin el comentario, al nivel del sistema general, de las funciones de los diversos componentes que se ofrece en 3. Podría parecer que la mejor manera de con seguir esto sería dedicarse a los tres tipos de explicación identificados ante riormente en mi exposición: el análisis de componentes, para asignar fun ciones generales de procesamiento de información a estructuras neuronales; el análisis tipo «atrapar y lanzar», para investigar de qué manera actúa el or ganismo sobre su entorno y cómo aCLÚa el entorno sobre el organismo; y el análisis emergentista, para describir las clases de conducta adaptativa que dependen más de las variables colectivas y de las interacciones organismo entorno. 6.6 El cerebro contraataca Al parecer, una explicac'ión completa de la cognición corpórea, embebi da y cargada de emergencia debe hacer justicia a varios tipos de datos. Uno de estos corpus de datos se refiere a los cambios en la conducta general de un sistema con el tiempo. Otro se refiere, por ejemplo, a los efectos especí ficos de daños locales e internos al sistema. Para explicar estos fenómenos heterogéneos, el teórico debe estar dispuesto a explotar múltiples tipos de instrumentos explicativos que van desde unos análisis que entrecruzan el organismo y el entorno hasta otros que cuantifican múltiples componentes internos y complejas conectividades, pasando por otros que aíslan compo nentes y ofrecen un comentario funcional y representacional de sus roles básicos.
Emergencia y explicación
1
175
Las propiedades emergentes figurarán en esta actividad explicativa en dos niveles. En primer lugar, habrá unas características emergentes internas reflejadas por variables colectivas constituidas por la interacción de múlti ples fuentes internas de variación. En segundo lugar, habrá unas caracterís ticas emergentes conductuales reflejadas por variables colectivas constitui das por interacciones entre organismos completos y activos, y su entorno local. Es preciso comprender estas dos clases de propiedades semejantes y la teoría de los sistemas dinámicos proporciona un conjunto de instrumentos que pueden ayudar en cada campo. Pero todos estos esfuerzos explicativos no son autónomos. Las variables colectivas se deben traducir en fuentes de variancia reales (neuronales y ambientales). Y las especializaciones básicas de los componentes se deben identificar y factorizar en nuestra comprensión y en nuestros modelos. Si no hacemos esto último, el resultado será un fra caso explicativo que se propagará hacia todos los niveles (por ejemplo, cuan do nos enfrentamos a datos sobre daños selectivos ocasionados por una le sión cerebral local). En el próximo capítulo, empezaremos a desarrollar este amplio marco, observando con más detalle algunas investigaciones neuro científicas recientes.
7
La imagen neurocientífica
7.1 ¿Cerebros? ¡Para qué! ¿Realmente necesita la ciencia cognitiva ocuparse del cerebro biológico? Para un observador casual, la respuesta parecerá evidente: naturalmente que sí. En caso contrario, ¿de qué otra manera podemos esperar lograr una mejor comprensión de la mente? Y lo que es más, ¡ese observador casual tendría ra zón! Por tanto, es aún más sorprendente que influyentes programas de inves tigación en la ciencia cognitiva hayan minimizado o ignorado con tanta fre cuencia los estudios neurocientíficos en sus intentos de modelar y explicar los fenómenos mentales. Una razón popular para este desinterés era la afirmación, común entre los primeros investigadores de la inteligencia artificial simbólica, de que el nivel correcto de descripción del dispositivo físico (a efectos psico lógicos) se encuentra a bastante distancia de las descripciones de las estructu ras y los procesos neuronales. Se creía que hacía falta un nivel de descripción mucho más abstracto: por ejemplo, una descripción basada en las funciones de procesamiento de información de un sistema computacional. 1 Se creía que los detalles precisos de la organización neuronal constituían una solución especí fica para el problema de construir físicamente un dispositivo que satisficiera una explicación computacional tan abstracta, pero eso era todo. 2 Con la aparición (o la reaparición) de los modelos conexionistas, todo esto empezó a cambiar. Estos modelos fueron especificados deliberadaL Véanse Newell y Simon, 1972 y las págs. 151-170 de Boden. 1988. 2. Zenon Pylyshyn, uno
178 1 Explicar la mente extendida
mente para reducir la distancia entre la explicación computacional y la na turaleza general de la implementación neuronal. Con frecuencia, el ajuste entre el trabajo conexionista y la teoría del cerebro real era mucho más dé bil
3. Véanse ensayos en Gluck y Rumclhart, 1990 y en Nadcl y otros, 1989; véanse también varias de las contribuciones en Koch y Davis, 1994.
La imagen neurocientífica 1 179
7 .2 Los dedos del mono Consideremos una pregunta aparentemente sencilla: ¿cómo guía el cere bro del mono el movimiento de sus dedos? Durante muchos años, los neu rocientíficos han dado por buena una imagen intuitiva y simple. Según esta imagen, parte del cerebro del mono era la sede de un mapa somatotópico: una región donde conjuntos de neuronas agrupadas espacialmente se dedi caban al control de cada dedo por separado. La actividad de un grupo haría que el dedo correspondiente se moviera. Mover varios dedos a la vez exigi ría la actividad simultánea de varios grupos neuronales. Esta imagen del con trol de los dedos por el cerebro del mono quedó inmortalizada en las imáge nes «homunculares» de las subdivisiones espaciales de la zona cerebral Ml (área motriz 1), que representaban distintos grupos neuronales, dispuestos en sucesión lateral medial, que controlaban cada dedo por separado. Este modelo es elegante e intuitivo y representaría una buena solución para problemas que exigen que los dedos se muevan independientemente (como cuando se toca el piano con destreza). Pero no es la solución de la naturaleza, como demuestran algunas investigaciones más recientes. Para ver esto, observemos una evidente predicción del simple modelo homuncu lar. Este modelo predice que los movimientos donde intervienen varios de dos deben exigir una activación más extendida y de más neuronas que los movimientos de un solo dedo. Además, también predice que los movimien tos del pulgar se corresponden con la actividad de la región más lateral de la región Ml de la mano, y que los movimientos de los otros dedos se co rresponden con la actividad de otras zonas ordenadas en sucesión hasta lle gar a la región más medial (correspondiente a los movimientos del dedo me ñique). Ninguna de estas predicciones se confirma. Marc Schieber y Lyndon Hibbard, neurocientíficos de la Washington University School of Medicine, encontraron que los movimientos de cada dedo por separado es taban acompañados de una diseminación de la actividad por toda la zona Ml de la mano. Además, se ha observado que para los movimientos preci sos hace falta más actividad de la corteza motriz que para los movimientos más básicos de toda la mano y que algunas neuronas de la corteza motriz parecen dedicadas a impedir los movimientos de otros dedos cuando un dedo concreto debe actuar por separado. Schieber (1990, pág. 444) propone que interpretemos todo esto conside rando los movimientos aislados de los dedos como casos complejos, y las «si nergias más rudimentarias, como las empleadas para abrir y cerrar la mano», como adaptaciones básicas. Estas adaptaciones son perfectamente razonables para seres cuya principal necesidad sea asir ramas y balancearse, y el diagnós tico total encaja como anillo al dedo con nuestra perspectiva evolutiva del di-
180 1 Explicar la mente extendida
seña cognitivo natural. El problema fundamental es producir una acción rá pida, fluida y adaptada al entorno. Para ello se seleccionan unas estrategias de codificación neuronal que faciliten una gama particular de conductas de asi miento en las que el factor tiempo es fundamental. Esta necesidad básica e históricamente determinada condiciona las soluciones para problemas más recientes centrados en los movimientos de dedos aislados (como tocar el pia no). Para alcanzar estas metas más recientes, Schieber (ibíd.) sugiere que «la corteza motriz puede superponer un control, en parte sobre los centros sub corticales filogenéticamente más antiguos y, en parte directamente sobre... las neuronas motrices espinales, para ajustar el movimiento de todos los dedos». Por tanto, la evolución trastea con las sinergias de toda la mano, dedicando recursos neuronales tanto a la supresión de movimientos como a su produc ción, con el fin de posibilitar movimientos precisos. La lección parece ser que la evolución biológica puede seleccionar es quemas internos de codificación que a primera vista parecen extraños y tos cos pero que, en realidad, representan soluciones bastante elegantes al pro blema combinado de satisfacer unas necesidades básicas y aprovechar al máximo los recursos existentes. Dicho de una manera más general, la litera tura neurocientífica abunda en casos de codificaciones neuronales un tanto inesperadas. Por ejemplo, se ha visto que la respuesta de algunas neuronas de la corteza parietal posterior de la rata es máxima (en el contexto de reco rrer un laberinto radial) ante ciertas orientaciones de la cabeza y en presen cia de alguna característica o marca local (McNaughton y Nadel, 1990, págs. 49-50), y que otras neuronas responden a determinados movimientos de giro hechos por la rata (otro caso de las representaciones «motorcéntricas» y orientadas al agente presentadas en capítulos anteriores). El modelo de Schieber también ilustra el papel que tienen en la cogni ción natural las representaciones internas distribuidas. Este tema ha ocupa do un lugar preponderante en los trabajos recientes sobre redes neuronales artificiales.4 Una representación distribuida es una codificación interna donde el contenido de interés no está a cargo de un recurso individual (por ejemplo, una sola neuronaÍ y tampoco está necesariamente a cargo de un grupo espacialmente localüado de unidades o neuronas. En cambio, este contenido (relacionado, por ejemplo, con el movimiento de un dedo aislado) está a cargo de un patrón de activación que se disemina por una población de neuronas o unidades. Las codificaciones distribuidas ofrecen varias ven tajas y oportunidades. Por ejemplo, el patrón mismo puede codificar una in formación estructural significativa haciendo que ciertas variaciones de poca importancia en su configuración reflejen diferencias pequeñas, pero a veces 4. Recuérdese la anterior discusión del capítulo 3.
La imagen neurocientífica 1 181
importantes, en lo que se representa en cada momento. Y también es posible emplear métodos de almacenamiento superpuesto para que cada neurona individual pueda desempeñar un papel en la codificación de muchas cosas diferentes (de la misma manera que el número 2 puede aparecer en muchos patrones numéricas diferentes: «2, 4, 6», «2, 3, 4», «2, 4, 8», etc.). Cuando este tipo de almacenamiento superpuesto se emplea sistemáticamente para representar elementos semánticamente afines mediante patrones superpues tos pero no idénticos, se obtienen las ventajas adicionales de la generaliza ción (unos elementos o sucesos nuevos pueden recibir unas codificaciones no arbitrarias en la medida en que se parezcan a otros elementos o sucesos ya existentes) y de la «degradación elegante» (una lesión física limitada será menos problemática porque en la codificación de cada clase general de ele mentos o sucesos participan muchos componentes y el rendimiento será aceptable mientras se conserven algunos de ellos). Estas ventajas se exami nan con detalle en otro lugar (Clark, 1989, 1993), por ahora la cuestión es, simplemente, que el cerebro puede estar empleando unos esquemas repre sentacionales muy complejos, superpuestos y espacialmente distribuidos in cluso en casos donde, intuitivamente, podríamos haber esperado una estra tegia de codificación simple y espacialmente localizada como en el caso de la zona motriz Ml. 5 Al parecer, el método de la naturaleza consiste en emplear unas codificaciones distribuidas en el espacio y superpuestas entre sí para gobernar movimientos similares (pero no idénticos) de los dedos. Por tanto, la imagen final nos muestra unas neuronas corticales específicas que desem peñan un papel en el control de los músculos de varios dedos, participando en patrones de actividad ampliamente extendidos en el espacio que corres ponden a diferentes tipos de movimientos y con distintas direcciones. 5. El caso del control del movimiento de los dedos parece encontrarse en el extremo «muy distribuido» de un continuo de posibilidades de codificación. De hecho, en el extremo opuesto encontramos algunos esquemas de codificación que utilizan agrupaciones espaciales de neuronas para mantener un mapa topográfico interno (un mapa interno que mantiene las relaciones espaciales entre las entradas sensoriales). Por ejemplo, existe un grupo de neuronas en la corteza cerebral de la rata cuya organización espacial refleja la distribución espacial de los bigotes del animal. Sin embargo, incluso en estos casos aparentemente claros, se debe destacar que la topografía interna está adaptada a las respuestas máximas de las neuronas individuales y, en consecuencia, deja espacio para que otros aspectos del ajuste de estas neuronas desem peñen una función (véase el apartado 7.3 más adelante), y que los perfiles de respuesta se sue len obtener en situaciones artificiales (que implican el empleo de manipulaciones eléctricas o quirúrgicas) y no pueden reflejar con fidelidad el papel de las neuronas en la respuesta a si tuaciones ecológicamente normales. Con todo, la existencia de la correspondencia topográfi ca interna es un resultado sorprendente e importante que demuestra que la naturaleza puede utilizar varias estrategias y ardides diferentes para fomentar el éxito adaptativo. Véase una ex posición del caso de los bigotes de la rata en Woolsey, l 990.
182
1
Explicar la mente extendida
7 .3 La visión de los primates: de la detección de características a los filtros sintonizados6 Para paladear aún más d sabor de la investigación neurocientífica actual, haremos una breve incursión en el mundo cada vez mejor comprendido de la visión de los primates. En los trabajos computacionales sobre la visión ani mada ya vimos en qué medida es probable que una naturaleza de carácter ahorrativo se base en señales poco costosas y en el estado del entorno local para minimizar su carga de procesamiento interno. Pero aun teniendo esto en cuenta, la complejidad de los mecanismos de la visión real sigue siendo ,1sombrosa. Lo que sigue es un esbozo, necesariamente truncado, basado en el reciente trabajo de David Van Essen, un destacado investigador de la vi sión de los primates que (de manera muy conveniente para mí) tiene su sede en la Washington University School of Medicine. 7 La investigación neuronatómica ha descubierto una multiplicidad de par tes y vías anatómicas que parecen desempeñar papeles especiales en el pro cesamiento visual. La neurociencia cognitiva se propone, mediante el em pleo de una amplia variedad de instrumentos experimentales y teóricos, identificar las distintas características de respuesta de las neuronas y las po blaciones neuronales participantes. Anatómicamente, el macaco posee por lo menos 32 áreas visuales en el cerebro y más de 300 vías de conexión. Entre las áreas más importantes (véase la lámina 1) se incluyen centros de procesa miento cortical inicial como Vl y V2, sedes intermedias como V4 y MT y se des superiores como TI (corteza temporal inferior) y PP (corteza parietal posterior). Las vías de conexión tienden a ir en ambos sentidos: por ejemplo, de Vl a V2 y viceversa. Además, existe cierta conectividad «lateral» como, por ejemplo, entre las subáreas de Vl. Aunque según la descripción de Felleman y Van Essen ( 1991) el sistema global comprende diez niveles de procesamiento cortical, a continuación sólo se describen algun(')S de los más importantes. Subcorticalmente, el sis tema recibe entradas procedentes de tres poblaciones de células, incluyendo las llamadas poblacion�s magnocelulares y parvocelulares. A continuación, una v_ía de procesamiento se ocupa básicamente de la entrada magnocelular y otra de la entrada parvocelular. Esta división tiene sentido dados los dife rentes tipos de información de bajo nivel en los que se «especializa» cada po blación. Las células parvo (P) tienen una resolución espacial alta y una reso6. Esta Jiscusión se basa en grnn medida en Van Essen v Callant, 19<.J-L 7. Véanse especialmente Van Essen y Gallant, l 99st: .Knierim y Van Esscn, 1992 y Felle man y Van Essen, 1991. Gran parte del trabajo se basa en estmlios con macacos, cuyo sistema visual parece ser aJecuadarnente similar al humano.
La imagen neurocientífica
1
183
l11ción temporal baja; las células magno (M) tienen una resolución temporal ,tita. Como resultado, las células M permiten la percepción de movimien1 os rápidos, mientras que las células P se encargan (entre otras cosas) de la diferenciación de colores. La destrucción selectiva de células P impide que L·l mono pueda distinguir los colores pero deja intacto el reconocimiento del movimiento. La corriente de procesamiento también denominada «magno» (MD) incluye muchas poblaciones de neuronas sensibles a la dirección de un es1 ímulo de movimiento, especialmente en el área MT. La estimulación eléc trica de parte de la zona MT puede hacer que el mono «perciba» un movi miento hacia la izquierda cuando, en realidad, el objeto de referencia se mueve hacia la derecha (Salzman y Newsome, 1994). En etapas aún más avanzadas de la jerarquía procesadora (como la MSDT) existen indicios de la presencia de células sensibles a estímulos de movimiento muy complejos, como el movimiento en espiral ( Graziano y otros, 1994). Al final, la corrien te MD se conecta con la corteza parietal posterior, que parece emplear la in formación espacial para controlar funciones de nivel superior como, por ejemplo, decidir dónde se encuentra un objeto y planificar los movimientos de los ojos. Mientras tanto, la misión de determinar qué es cada cosa (reconoci miento de objetos) está a cargo de una corriente de procesamiento distinta que tiene sus raíces, especialmente, en unas entradas parvocelulares quepa san por las zonas Vl, V4 y PIT (áreas inferotemporales posteriores) y que acaban en las áreas inferotemporales centrales y anteriores. Esta vía parece estar especializada en la forma y el color. En el nivel correspondiente a V4, existen indicios de la presencia de células sensibles a formas muy complejas como estímulos concéntricos, radiales, espirales e hiperbólicos (véase la lá mina 2). En niveles superiores, ciertas células individuales de la corteza temporal inferior dan una respuesta máxima ante estímulos geométricos complejos como caras y manos. Pero (y esto es crucial) estas respuestas má ximas no especifican de una manera exhaustiva el papel desempeñado por una célula dada en el procesamiento de la información. Aunque una célula puede dar una respuesra máxima ante (por ejemplo) un patrón en espiral, la misma célula también responderá en cierta medida a muchas otros patro nes. Con frecuencia, lo más revelador es la sintonización de una célula con un conjunto entero de estímulos. Esta sintonización global permite a una célula participar en un gran número de patrones distribuidos de codifica ción, aportando información tanto por el hecho de estar activa como por su grado de actividad. Estas consideraciones condujeron a Van Essen y otros a tratar las células no como simples detectores de características que indican la presencia o ausencia de algún parámetro fijo, sino más hícn como /il!ms
184
1
Explicar la mente extendida
sintonizados con varias dimensiones del estímulo, de manera que las diferencias en la frecuencia de disparo permiten que una célula codifique múltiples tipos de información." También hay fuertes indicios de que las respuestas de las células de los niveles medios y superiores de la jerarquía procesadora dependen de la atención y de otros parámetros cambiantes (Motter, 1994), e incluso de que las características de la respuesta de las células
7.4 Hipótesis del control neuronal Un desarrollo importante en la neurociencia cognitiva reciente es el creciente reconocimiento del papel de las estructuras neuronales de control. Las estructuras neuronales de control, tal y como voy a usar el término, son 8. «Las diferencias en la frecuencia de disparo transmiten información útil para distinguir entre estímulos que se encuentran en las pendientes de la superficie de sintonización multidimensional de cada cé·lula» (Van Essen y (;,t!Jant. 1994, pág. 4 l.
1 La imagen neurocientífica
1
185
aquellos circuitos, estructuras o procesos neuronales cuyo papel principal sea modular la actividad de otros circuitos, estructuras o procesos neuronales, es decir, cualquier elemento o proceso cuyo papel sea controlar la eco11omía interna en vez de seguir las condiciones externas o controlar directamente la actividad corporal. Una útil analogía, propuesta por Van Essen y otros ( 1994), es la división de los procesos en una factoría moderna, donde muchos procesos no se dedican a la construcción del producto en sí sino más hien al tráfico interno de materiales. Muchos neurocientíficos creen ahora que, de una manera similar, se dedican grandes cantidades de capacidad neuronal al tráfico y el tratamiento de información. Según esta explicación, d papel de ciertas poblaciones neuronales consiste en modular el flujo de actividad entre otras poblaciones para potenciar ciertas clases de atención, recuerdos multimodales, etc. Siguiendo esta línea, Van Essen y otros (1994) postulan la existencia de unos mecanismos neuronales dedicados a regular el flujo de información entre áreas corticales. Según estos autores, esta regulación nos permite (por ejemplo) dirigir una ventana interna de atención visual hacia un objetivo concreto (como una letra del alfabeto que aparece en una posición aleatoria dentro del campo visual) o dirigir la misma orden de movimiento a cualquier parte del cuerpo. El gasto computacional dedicado a generar una set'íal distinta para cada caso sería prohibitivo. Mediante el desarrollo de un único recurso que puede ser «dirigido» con flexibilidad hacia diversas posiciones, se consiguen unos enormes ahorros de procesamiento. Según Van Essen y otros, la clave de esta orientación flexible es el empleo de poblaciones de «neuronas de control» que encaminan dinámicamente la información por el cerebro. La propuesta de estos autores no se queda en un simple esbozo intuitivo y está acompañada de un modelo detallado del funcionamiento de estos controladores al estilo de las redes neuronales; además, los autores relacionan este modelo con tuda una variedad de sustratos y mecanismos neurológicos conocidos. Los perfiles de respuesta muy dependientes del contexto de algunas neuronas corticales (mencionados en el apartado 7 .3 anterior) se pueden explicar mediante estos mecanismos que encaminan una y otra vez la información entrante. Otro tipo de hipótesis de control neuronal se basa en la idea de «procesamiento reentrante» (Edelman y Mountcastle, 1978; Edelman, 1987). Es bien sabido que el cerebro incluye muchas vías que enlazan áreas corticales distantes y que regresan de las zonas superiores del cerebro a las inferiores. La idea del procesamiento reentrante es que estas vías «laterales y descendentes» se emplean para controlar y coordinar la actividad de múltiples centros (con frecuencia de nivel inferior). Estas vías transportan unas «señales reentrantes» que provocan la activación de las zonas receptoras. Considere-
186
1
Explicar la mente extendida
mos dos poblaciones de neuronas que responden a unos tipos diferentes d1· estímulos externos (por ejemplo, la vista y el tacto) y que están interconecta das recíprocamente mediante estas vías reentrantes. Estas conexiones recí procas permiten que, con el tiempo, lo que ocurre en un lugar se correlaci() ne con lo que ocurre en el otro. Estas correlaciones podrían llegar a codificar propiedades de nivel superior, como las combinaciones de textura y color características de una clase particular de objetos. Como ejemplo final de una hipótesis de control neuronal, considere mos el intento reciente de Damasio y Damasio ( 1994) de desarrollar un marco general para explicar los déficit psicológicos selectivos. Se produ ce un déficit selectivo cuando una persona, normalmente a causa de un trauma o
1
La imagen neurocientífica
1
187
lira! local puede dañar selectivamente la recuperación de diferentes tipos
,le· conocimientos. Con todo, para explicar la disociación entre el conoci111iento de sucesos únicos y no únicos, también hace falta presentar la no' 1tín de jerarquía de zonas de convergencia. Recordemos que las zonas de , onvergencia, según la concepción Je Damasio y Damasio, se proyectan 1:1nto hacia atrás (reactivando representaciones corticales anteriores) , orno hacia adelante (hacia zonas Je mayor convergencia). Estas zonas su¡>L·riores pueden impulsar de una manera poco costosa una actividad ex1L·nJida de bajo nivel, explotando conexiones de retroalimentación con los enlaces previos dentro de una jerarquía de zonas de convergencia. La lI ipótesis básica es la siguiente: ... el nivel en el cual se recupera el conocimiento (por ejemplo, supraordinado, objeto básico, subordinado) dependerá del alcance de la activación multirregional. A su vez, esto dependerá del nivel de zona de convergencia que se active. Las zonas de convergencia de bajo nivel vinculan señales relacionadas con categorías de entidades ... Las zonas de convergencia de nivel más ele,,ado vinculan señales relacionadas con combinaciones más complejas ... Las zonas de convergencia capaces de vincular entidades con sucesos ... se encuentran en la cima de las corrientes jerárquic1s. en las regiones frontales y temporales más anteriores (ibíd., pág. 73).
Por tanto, la recuperación de conocimientos sobre entidades y sucesos únicos requiere la activación conjunu de varios locus más básicos que el conocimiento de entidades y sucesos no únicos (donde los primeros subsumen a los segundos, pero no a la inversa). De manera similar, el conocimiento de conceptos requerirá la activación conjunta de varias áreas distintas, mientras que el conocimiento de características simples (por ejemplo, el color) se puede limitar a una sola área. Si suponemos una jerarquía de zonas de convergencia extendida en el espacio neuronal, esta imagen explicaría por qué las lesiones en las cortezas visuales previas dañan selectivamente el conocimiento de características simples como el color, mientras que las lesiones en las cortezas intermedias alteran el conocimiento de entidades y sucesos no únicos y las lesiones en las cortezas anteriores alteran las respuestas relacionadas con enticfodes y sucesos únicos. Según este marco unos sistemas neuronales distintos pero superpuestos promueven el acceso a distintos tipos de conocimiento. Cuanto más complejas sean las conjunciones de información necesarias para fijar una clase de conocimientos, más necesaria será esta actividad de coordinación. Esto, a su vez, implica unos centros correlativamente más elevados en una jerarquía de zonas de convergencia que corresponden a locus de las cortezas temporales cada vez más anteriores. Damasio y Damasio destacan que su intención no es
188
1
Explicar la mente extendida
describir las zonas dañadas como si fueran las sedes físicas de diferentes cla ses de conocimientos: lo que proponen es que las regiones dañadas son zo nas de control que promueven la activación conjunta Je varias áreas muy distantes entre sí. En general, se trata de cortezas sensoriales y motrices pre vías que, mediante las señales reentrantes, serían estimuladas a crear de nuc vo sus respuestas particulares ante ciertos estímulos externos. Resumiendo sus propuestas, Damasio y Damasio comentan lo siguiente: ... [la imagen] que proponemos implica una compartimentación funcional relati va para el cerebro normal. Un gran conjunto de sistemas en las cortezas senso riales y motrices previas sería la base para los conocimientos «de sensación» y «de acción» ... Otro conjunto de sistemas en las cortezas de orden superior or questaría la trabazón de actividades en el tiempo en los primeros; es decir, susci taría y establecería una correspondencia temporal entre áreas separadas (ibíd., pág. 70).
Según esta explicación, existen unas regiones neuronales localizadas para varios tipos de información sensorial y motriz y para varios niveles dL· control mediados por zonas de convergencia. Sin embargo, las aptitudes
1
La imagen neurocientífica
1
189
,·ste caso, la presencia del análisis de componentes parece esencial para sal1·ar el abismo existente entre los fenómenos que hay que explicar (es decir, los déficit que afectan a tipos específicos de conocimientos) y los modelos que creamos. Si no habláramos de las funciones cognitivas de las cortezas sensoriales previas ni de las estructuras corticales de nivel superior especializadas en volver a crear unos complejos específicos
190
1
Explicar la mente extendida
Por tanto, las hipótesis de control neuronal constituyen una potente mez cla de radicalismo y tradicionalismo. Su radicalismo se debe a que ofrecen u11 modelo de la cognición superior descentralizado y sin en\'Ío de mensajes, .1 que suelen describir la cognición superior como si surgiera de la actividad trabada en el tiempo de múltiples tipos de zonas de procesamiento senso riomotor más básicas, y a que reconocen la dinámica compleja y recurrente del procesamiento neuronal. Pero consen•an elementos fundamentales de enfoques más tradicionales. como el empleo de una descomposición, al estilo del procesamiento de la in formación, en la que se asocian unos componentes neuronales definidos con unas funciones específicas
7 .5 Refinar la representación Como se puede ver incluso en estos ejemplos breves y superficiales, la neurociencia contemporánea constituye una interesante mezcla entre loradical y lo tradicional. Retiene gran parte del énfasis tradicional en los análisis de la computación neuronal basados en componentes y en el procesamiento de información. Pero lo hace dentro
1
La imagen neurocientífica
1
191
para complementar el estudio de la dinámica organismo-entorno más amplia destacada en capítulos anteriores. Para completar este proyecto de integración y reconciliación, debemos obserrnr con más detalle las nociones fundamentales concretas de computación y representación.
1 8
Ser, computar, representar
8.1 ¿Noventa por ciento de vida (artificial)? Según Woody Allen, el noventa por ciento de la vida consiste, simplemente, en estar ahí; y, desde luego, hemos visto de muchas maneras que los hechos sobre la corporeización y la situación ambiental tienen una importancia considerable para explicar nuestro éxito adaptativo. Sin embargo, en los últimos dos capítulos hemos encontrado algunas advertencias importantes. En concreto, no deberíamos tener demasiada prisa en rechazar los aparatos explicativos más tradicionales de la computación y la representación. Las mentes pueden estar esencialmente corporeizadas y embebidas y, aun así, depender fundamentalmente de unos cerebros que computan y representan. Sin embargo, para hacer que esta postura ecuménica cuaje, necesitamos enfrentarnos específicamente a algunos retos directos relacionados con las nociones mismas de computación y representación (¿tienen estas nociones unas definiciones no triviales compatibles con el nuevo marco?) y a algunos problemas relacionados con la aplicación práctica de estas nociones a sistemas que muestran propiedades emergentes dependientes de procesos marcados por una causalidad compleja, continua y recíproca. 1
8.2 ¿Qué es eso que llamamos representación? Los científicos cognitivos suelen hablar de los cerebros y de los modelos informáticos como si albergaran «representaciones internas». Esta idea bási1. Vé·asc la definición mús adelante.
194
1
Explicar la mente extendida
ca ofrecía un terreno común incluso para los campos, por lo demás opuestos, del conexionismo y la inteligencia artificial clásica. 2 Las diferencias entre conexionistas y clasicistas se centraban únicamente en la naturalela precisa del sistema de representaciones internas, no en su existencia misma. Los clasicistas creían en una economía interna «simbólicamente sólida» donde los contenidos mentales se almacenaban como cadenas de símbolos que podían ser leídas, copiadas y trasladadas por algún tipo de unidad central de procesamiento interno. Los conexionistas creían en un estilo mucho más implícito de representación interna que sustituía las cadenas de símbolos sólidos y manipulables por vectores numéricos complejos y operaciones básicas de reconocimiento y transformación de patrones. Aun así, tanto las representaciones simbólicas explícitas y sólidas como las representaciones conexionistas distribuidas y vectoriales se consideraban representaciones internas propiamente dichas. Desde este punto de \'isrn, en un sistema se da representación interna siempre que ese sistema cumpla los siguientes requisitos intuitivos (Haugeland, 1991): 1. El sistema debe coordinar sus conductas con características del entorno cuya presencia no siempre sea «segura». 2. El sistema se debe enfrentar a estos casos «sustituyendo» las sefiales recibidas directamente desde el entorno por otra cosa que guíe la conducta. 3. Esa «otra cosa» debe formar parte de un esquema de representación más general que permita que esta ,c1stitución se produzca sistemáticamente y que dé cabida a una variedad de estados de representación relacionados (\'éase Haugeland, 1991, pág. 62).
El primer requisito descarta los casos donde no hay ninguna «sustitución» y donde la conducta está controlada directamente por la característica del entorno (por medio de una «señal detectable>>). Por tanto, «las plantas que siguen al sol con sus hojas no necesitan una representación del sol ni de su posición porque el seguimiento está guiado directamente por el mismo sol» (ibíd., pág. 62). El segundo requisito identifica como representación cualquier cosa que «sustituya» a la característica ambiental pertinente. Pero el tercer requisito limita esta categoría a las sustituciones que figuran en un esquema de sustitución más amplio, descartando así (por ejemplo) los jugos gástricos como representaciones completas de futuros alimentos (ibíd.l. Aunque estos requisitos están bien encaminados, creo que el papel Je la capacidad de desacoplamiento (la capacidad de emplear estados internos para 2. v¿anse la introducción y el capítulo 3 nnteriores, así como Smolensky, 1988: Fodor y Pylyshrn. 1988, y Cb·k, 1989
1 Ser, computar, representar 1 195
orientar la conducta en ausencia de la característica ambiental pertinente) es un poco exagerado. Consideremos una población de neuronas en la corteza parietal posterior de una rata. Estas neuronas contienen información sobre la dirección (izquierda, derecha, enfrente) hacía la que se orienta la cabeza del animal. Lo hacen utilizando un esquema de codificación que es «general» en un sentido parecido al expresado en el tercer requisito de Haugeland. Según mí parecer, la noción de esquema representacional general es muy generosa y no requiere la presencia de una sintaxis de combinación clásica que permita yuxtaponer y concatenar elementos con toda libertad; creo que sólo requiere que nos encontremos frente a algún tipo de sistema de codificación. Y estos sistemas pueden ser de muchísimas maneras. Por ejemplo, bastará con que el sistema sea tal que los elementos que se deban tratar de una manera similar estén representados por unas codificaciones (como patrones de activación en una población de neuronas o en una red neuronal artificial) que estén próximas entre sí en un espacio de estados multidimensional adecuado. 3 De hecho, este tipo de esquema de representación es característico de gran parte del trabajo conexionista examinado anteriormente y pretende caracterizar por lo menos algunos de los sistemas de codificación encontrados en los cerebros biológicos. Las poblaciones de neuronas parietales posteriores de la rata son un caso ejemplar. Sin embargo, hasta ahora no hay nada en nuestra descripción que sugiera que estas neuronas puedan desempeñar su papel en ausencia de una corriente continua de señales propíoceptívas procedentes del cuerpo de la rata. Si este «desacoplamiento» no es posible, nos enfrentamos a un caso que satisface plenamente la tercera condición de Haugeland Oa presencia de un esquema de codificación sistemática) pero no satisface las otras dos (este esquema de codificación no actúa como sustituto en ausencia de señales entrantes). ¿Qué podemos decir de un caso como éste? 4 Parece razonablemente claro que si interpretamos los estados de la población neuronal como codificaciones de posiciones específicas de la cabeza obtendremos una base explicativa útil. Estas interpretaciones nos ayudan a comprender el flujo de información dentro del sistema cuando, por ejemplo, nos encontramos con otros grupos neuronales (como poblaciones dedicadas 3. Véase mucha más información sobre la codificación de espacios de estados en Churchland, 1989; Clark. 1989 y Clark. 1993. Véase una discusión del contraste con los esquemas de combinación clásicos en van Gdder, 1990. Véase una discusión de la naturaleza especial de los sistemas de representación conexionistas en Clark, 1994. 4. La cuestión no es si Lis neuronas parietales posteriores de la rata pueden actuar en ausencia de entradas visuales (por ejemplo, al soñar, si es que las ratas sueñan). En cambio, la cuestión es que la incapacidad de desacoplamiento en sí no parece privar a la interpretación represcntacion,11 de toda su fuerza l'Xplicativa.
196
1
Explicar la mente extendida
al control motor) que consumen la información codificada en la población estudiada. Sin embargo, una aplicación estricta
1
Ser, computar, representar
1
197
Por tanto, el hecho de que un estado interno sea una representación no depende tanto de su naturaleza detallada (por ejemplo, si se asemeja a una palabra en un lenguaje interno, o a una imagen, o a otra cosa totalmente distinta) como del papel que desempeña dentro del sistema. Puede ser una estructura estática o un proceso extendido en el tiempo. Puede ser local o muy distribuido. Puede ser muy preciso o lamentablemente impreciso. Lo que cuenta es que se supone que contiene un tipo determinado de información y que su papel en relación con otros sistemas internos y con la producción de la conducta es, precisamente, contener esa información. Este punto está muy bien argumentado por Miller y Freyd, quienes añaden que «el punto fuerte del representacionalismo siempre ha sido la concepción normativa básica de que las representaciones internas deben registrar con precisión procesos y estados externos importantes» y que «su punto débil... es consecuencia de supuestos demasiado limitados sobre qué puede actuar como representación y qué cosas vale la pena representar» (1993, pág. 13). Estoy totalmente de acuerdo, aunque matizando el énfasis innecesario en la precisión del registro. Teniendo presentes todas estas observaciones, consideraremos que una explicación es representacionalista si describe sistemas enteros de estados (locales o distribuidos) o procesos (secuencias temporales de estos estados) internos identificables, como entidades cuya función es contener tipos específicos de información acerca de estados de cosas corporales o externos. Por tanto, la teorización representacionalista se encuentra en los tramos superiores de un continuo de posibilidades cuyos límites inferiores, que no son representacionalistas, incluyen meras correlaciones causales y casos muy simples de lo que puede denominarse «conexión adaptativa». Las conexiones adaptativas van más allá de las meras correlaciones causales en la medida en que requieren suponer que los estados internos del sistema coordinan sus conductas (mediante la evolución, el disefio o el aprendizaje) con contingencias ambientales específicas. Pero cuando la conexión es muy simple (como en el caso de un girasol o de un robot que busca una fuente de luz) ganamos poca cosa tratando el estado interno como una representación. Mi propuesta es que el discurso representacionalista es adecuado cuando abordamos estados internos que presentan además una coordinación sistemática con un espacio entero de contingencias ambientales. En estos casos es útil concebir los estados internos como un código que puede expresar toda una gama de posibilidades y que es «leído» eficazmente por otros sistemas internos que necesitan obtener información sobre las características del entorno que se están reflejando. Por tanto, la conexión adaptativa se va convirtiendo paulatinamente en una representación interna genuina a medida que la conexión se hace más compleja y sistemática. En el otro extremo de este continuo nos encontramos con los seres de Haugeland, que pueden desplegar es-
198
1
Explicar la mente extendida
tos códigos internos en ausencia total de las características ambientales pertinentes. Se trata de los seres que más representan su mundo, y que pueden llevar a cabo imaginaciones complejas, reflexiones fuera de línea y razonamientos contrafácticos. Los problemas cuya solución exige estas capacidades están ávidos de representación, es decir, parecen pedir a gritos el empleo de aspectos sistémicos internos como sustitutos de estados de cosas externos. Sin embargo, esto no implica que los seres capaces de resolver estos problemas deban emplear representaciones internas para hacerlo. Según la noción de representación interna propia de la ciencia cognitiva, también podemos obtener una base explicativa tratando los subestados o procesos internos identificables como si fueran portadores de contenidos específicos, y descifrando los esquemas de codificación más generales en los que figuran. Si este proyecto se viera obstaculizado (por ejemplo, si encontráramos seres capaces de pensar en lo distal y en lo inexistente, y cuya capacidad para el razonamiento y el pensamiento se resistiera a todos nuestros intentos de sustentar interpretaciones representacionales en sucesos internos concretos), ¡nos enfrentaríamos a agentes representadores que no trabajarían con representaciones internas! Por tanto, la pregunta que se nos plantea es la siguiente: ¿qué papel desempeñarán -si es que llegan a desempeñar alguno- las interpretaciones representacionales de sucesos internos específicos en las explicaciones de una ciencia cognitiva madura? Esta pregunta tiene una sorprendente variedad de respuestas, que incluye las siguientes: l. Estas interpretaciones carecen de importancia explicativa pero pueden desempeñar una función heurística. 2. Estas interpretaciones inducen a error. Vincular unos estados o procesos internos concretos con unas funciones de portar contenido lleva a conclusiones teóricas erróneas. 3. Estas interpretaciones forman parte del ap,lrato mismo explicativo y reflejan verdades importantes sobre las funciones de diversos estados y procesos.
Algunos entusiastas (que no todos) de la teoría de los sistemas dinámicos y
1
Ser, computar, representar
1
199
jor manera de estudiar la cognición corpórea es mediante ideas y esquemas explicativos no computacionales y no representacionales que supongan, por ejemplo, los instrumentos de la teoría de los sistemas dinámicos. Se pueden encontrar versiones de esta tesis en trabajos recientes en el campo de la psicología del desarrollo (véase el capítulo 2 anterior; véanse también Thelen y Smith, 1994 y Thelen, 1995), en el campo de la robótica en mundo real y en la teoría de los agentes autónomos (véase el capítulo 1 anterior; \'éanse también Smithers, 1994 y Brooks, 1991 ), en tratamientos fílosóficos y de ciencia cognitiva (Maturana y Varcla, 1987; V,uela y otros, 1991; \'vheeler, 1994) y en algunos enfoques neurocientíficos (Skarda y Freeman, 1987). Entre otras perspectivas más prudentes que, sin embargo, tienden al escepticismo en relación con el cómputo y la representación interna se incluyen Beer y Gallagher, 1992; Beer, 1995b; van Gelder, 1995; y varios ensayos de Port y van Gelder, 1995. Los precedentes históricos de este escepticismo también están en boga: véanse especialmente Heidegger, 1927; MerleauPonty, 1942; y los trabajos de J. J. Gibson 7 y los psicólogos ecológicos. Por tanto, parece que la tesis de la cognición corpórea radical tiene un apoyo genuino. 8 La perspectiva resultante supone rechazar las explicaciones basadas en representaciones internas y la aplicación de explicaciones computacionales a la psicología, y nos insta a abandonar estos instrumentos anticuados en favor de los flamantes instrumentos de la teoría de los sistemas dinámicos. Creo que este radicalismo es a la vez injustificado y un tanto contraproducente. Tiende a fomentar la competición cuando el progreso exige coope7. Véase, por ejemplo, Gibson, 1979. 8. Consideremos las siguientes citas: «Nuestro compromiso con una teoría biológicamente coherente significa que rechazamos categóricamente las analogías con máquinas de la cognición y el desarrollo ... Evitamos deliberadamentl' d \'ocabulario tecnológico que habla de dispositivos procesadores, programas. unidades de almacenamiento, esquemas, módulos odiagramas de cableado. Lo sustituimos ... por un vocahularil, adecuado para un sistema fluido y orgánico con ciertas propiedades termodinámic1s» IThelen y Smith, 199..J l. «Postulamos que el desarrollo se produce a causa de una pauta de áctividad trabada en d tiempo que atraviesa componentes heterogéneos. ¡No construimos ninguna representación! La mente es una actividad en ... tiempo real de causas físicas reales» (ibíd). «La representación es la unidad errónea de abstracción en la construcción de las partes más voluminosas de los sistemas inteligentes» (Brooks, 1991). ,,El concepto de "representación" ... es innecesario como pinlra angular para explicar el cerebro, la conducta» iSkarda y frceman, 1987). «Las explicaciones basadas en estructuras dentro de la cabeza-" creencias", "re¡.das", "conceptos" y "esquemas" - no son aceptables ... Nuestra teoría gira en torno a nuevos conceptos: no lincalicLid, rccntrada, acoplamiento, heterocronicidad, atractores, momento, espacios de estados, dinámica intrínseca, fuerzas. Estos conceptos nuevos no se pueden reducir a los antiguos» (Thclcn y Smith, 199..JJ.
200
1
Explicar la mente extendida
ración. En la mayoría de los casos, por lo menos, el énfasis incipiente en los papeles del cuerpo y del mundo se puede considerar complementario de la búsqueda de interpretaciones computacionales y representacionales. En los próximos apartados examinaremos varias causas posibles de este escepticismo hacia las perspectivas representacionales y computacionales y mostraré que, en general, la conclusión radical no está justificada, bien porque los fenómenos aludidos carecen de una «avidez de representación» suficiente, bien porque la conclusión escéptica exige una lectura demasiado estrecha y restrictiva de los términos fundamentales «representación» y «computación».
8.3 Representación orientada hacia la acción Una cosa está cada vez más clara. En la medida en que el cerebro biológico opere con algo que se pueda describir adecuadamente como «representación interna», una gran parte de esas representaciones serán locales y estarán orientadas hacia la acción en vez de ser objetivas e independientes
l Ser, computar, representar
1
201
de café) no depende, por ejemplo,
202
1
Explicar la mente extendida
nidoras Je clases de objetos interpersonalmente válidas. Sin embargo, estas explicaciones siguen haciendo ,ilusión a unas bases de datos donde se asocian unas características localmente eficaces con unos elementos
l Ser, computar, representar 1 203
saria para vincular localizaciones diferentes (véase el apartado 2.6 anterior) es un buen ejemplo. Como ejemplo adicional, consideremos brevemente el cangrejo robot descrito en el capítulo 5 de Churchland, 1989 y examinado en Hooker y otros, 1992. Este cangrejo emplea enlaces punto a punto entre dos mapas topográficos deformados para especificar directamente conductas de asimiento a partir de entradas simples de percepción. En este ejemplo, las propias codificaciones visuales iniciales se deforman o sesgan con el fin de reducir la complejidad de los cómputos necesarios para emplear esa información en la especificación del asimiento. También aquí se explota un tipo de representación interna centrada en la acción (o «deíctica»; véase Agre, 1988) donde el sistema no crea primero un modelo completo y objetivo del mundo y después define un procedimiento costoso que (por ejemplo) tome este modelo como entrada y genere como salida unas acciones orientadas hacia la búsqueda de alimento. En cambio, las codificaciones iniciales del sistema ya se dirigen hacia la producción de la acción apropiada. Este tipo de sesgo orientado hacia la acción puede ser, al menos en parte, lo que Gibson pretendía establecer cuando decía, con un discurso retóricamente problemático, que los organismos «perciben directamente» el mundo en función de sus facilitaciones para la acción. 1n Al parecer, la percepción no se debería conceptualizar (o, por lo menos, no siempre) independientemente de la clase de acciones que un ser necesita llevar a cabo. Por tanto, las representaciones orientadas hacia la acción presentan ventajas e inconvenientes. Como ya hemos visto, las ventajas incluyen la capacidad para guiar acciones apropiadas en circunstancias ecológicamente normales de una manera computacionalrnente económica. Las desventajas son igualmente evidentes. Si un ser necesita emplear el mismo conjunto de información para desarrollar actividades múltiples o de carácter abierto, con frecuencia será más económico desplegar una codificación más neutral respecto a la acción que pueda actuar como entrada para toda una gama de rutinas de procesamiento más concretos. Por ejemplo, si el conocimiento sobre la situación de un objeto se debe emplear para múltiples fines diferentes, puede ser más eficiente generar un solo mapa interno independiente de la acción al que accedan múltiples rutinas con un objetivo más especializado. Con todo, es razonable suponer que las clases de representación interna más orientadas hacia la acción son las más básicas en relación con la 10. Véase el apartado 2.7 anterior. Hookcr y otros ( 1992) plantearon una propuesta similar en un brillante artículo que contrasta con claridad las diversas concepciones de la representación interna y defiende una noción de la representación como control. Véase tamhiC·n Clark, 1995
204
1
Explicar la mente extendida
evolución y el desarrollo.11 Y h,1sta puede ocurrir que la inmensa mayoría de las acciones y las resoluciones de problemas de carácter cotidiano, rápido y fluido, dependan de ellas. Para nuestros fines actuales, la cuestión es, simplemente, que el hecho de que esto sea cierto no basta para establecer la tesis de la cognición corpórea radical, porque seguiríamos obteniendo una considerable base explicativa a partir de la comprensión de las características específicas del espacio personal o egocéntrico implicado en el análisis basado en la acción. Por tanto, la comprensión de los contenidos específicos de las representaciones orientadas hacia la acción desempeña la habitual función explicativa de poner de manifiesto la función adaptativa de ciertos procesos o estados internos y ayudar a determinar su contribución a unas redes de procesamiento de información cada vez mayores.
8.4 Programas, fuerzas y programas parciales A continuación, consideremos algunas afirmaciones de Thelen y Smith (véase el capítulo 2 anterior) según las cuales aprender a caminar y aprender a alcanzar no dependen de programas almacenados. Recuérdese que Thelen y Smith mostraron, de una manera muy convincente, que estos aprendizajes dependen de una multiplicidad de factores extendidos por el cerebro, el cuerpo y el entorno local. Sin duda, esta imagen difiere profundamente de concepciones más tradicionales, donde las diversas etapas de (por ejemplo) caminar se describen como la mera ejecución de un conjunto de instrucciones ya existentes que están codificadas en un recurso interno especificado genéticamente. La diferencia reside en que Thelen y Smith no consideran que las pautas de conducta del niño 12 se encuentren bajo el control de un recurso interno fijo, sino que emergen de un «diálogo continuo» en el que intervienen factores neuronales, corporales y ambientales. Por ejemplo, vimos que los movimientos de pisar de un niño se pueden inducir fuera de su momento evolutivo usual si sostenemos al niño erguido dentro de agua tibia. Y vimos que las diferencias individuales en los niveles de energía y en los repertodos básicos de movimientos con los brazos hacen que cada niño se enfrente a problemas diferentes cuando aprende a alcanzar. (Los niños más ac11. Para la evolución véase 1\Iillikan, 1995. Para el desarrollo véanse Karmiloff-Smith, 1979; Karmiloff-Smith, 1992 y Clark y Karmiloff-Smith, 1993. La imagen tentadora de una transición gradual desde unas codificaciones orientadas hacia la acción hasta unas codificaciones más neutrales respecto a ella se discute brevemente en Clark, 1995. 12. Véase Thelen y Smith, 1994, págs. 8-20 y 263-266.
1 Ser, computar, representar
1
205
tivos en el aspecto motor deben aprender a moderar y controlar sus movimientos cuando agitan los brazos, mientras que los niños más pasivos deben aprender a generar una fuerza inicial suficiente para lanzar el brazo hacia un objetivo). Un estudio detallado de varios niños que mostraban estas diferencias en sus pautas de actividad apoyaba la conclusión general de que «[los niños] descubrieron [soluciones al problema de alcanzar] en relación con sus propias situaciones, forjadas a partir de sus paisajes individuales y sin estar prefiguradas por una sinergia conocida de antemano por el cerebro o por los genes» (Thelen y Smith, 1994, pág. 260). Naturalmente, esto no significa que estas soluciones no tengan nada en común. Según Thelen y Smith, comparten una rutina de aprendizaje donde el sistema brazo-músculo se trata como un ensamblaje de muelles y masas, y la tarea del sistema nervioso central consiste en aprender a controlar ese ensamblaje ajustando parámetros como la rigidez inicial de los muelles. Por tanto, la tarea consiste en coordinar la dinámica intrínseca del sistema para ponerla al servicio de una meta dada. En consecuencia, «no existen instrucciones o programas explícitos 11 priori ni para la trayectoria de la mano, ni para coordinar los ángulos de las articulaciones, ni para las pautas de activación muscular» (ibíd., pág. 264 ). En cambio aprendemos a manipular unos cuantos parámetros básicos (como las condiciones iniciales de rigidez) para esculpir y modular la conducta de un sistema físico cambiante que posee una dinámica intrínseca rica y en proceso de desarrollo. Los experimentos y datos presentados por Thelen y Smith son fascinantes, importantes y convincentes. Pero no apoyan inequívocamente la serie de afirmaciones radicales resumida en el apartado 8.2 anterior. En vez de un argumento claro en contra del computacionalismo y el representacionalismo en general, nos encontramos con un conjunto de evidencias que indican que no descubriremos explicaciones computacionales y representacionales correctas si no damos la importancia que merece al papel del cuerpo y del entorno local: un papel que incluye definir problemas y, en ocasiones, resolverlos. Hemos visto que las cualidades elásticas de los músculos y los niveles variables de energía de los niños contribuyen a concretar los problemas específicos que un cerebro determinado debe resolver. Y es fácil imaginar situaciones similares donde unos parámetros ambientales y corporales pueden contribuir a la obtención de unas soluciones concretas: por ejemplo, ajustarse a unas extremidades basadas en muelles permite que los robots ambulantes se adapten a terrenos irregulares sin el esfuerzo computacional masivo que haría falta para obtener el mismo resultado empleando sensores y bucles de retroalimentación en un medio que no se ajuste (véanse también Michie y Johnson, 1984 y el capítulo 1 anterior). Además, cuando reconocemos el papel del cuerpo y del entorno (recuérdense los ejemplos de los niños que pi-
206
1
Explicar la mente extendida
saban suspendidos en el agua) en la construcción de problemas y de soluciones, se hace evidente que, para ciertos fines explicativos, el sistema global formado por cerebro, cuerpo y entorno local puede constituir un objeto de estudio apropiado y unificado. Sin embargo, estas nociones e ideas tan importantes son totalmente compatibles con el estudio de la cognición desde una perspectiva computacional 11 y representacional. En mi opinión, la auténtica conclusión de estas consideraciones es una mejor explicación computacional y representacional, no un rechazo total de estas perspectivas. Teniendo esto presente, es revelador observar con más detenimiento algunos pasajes específicos donde se rechaza el computacionalismo. He aquí un ejemplo típico: Los datos sobre el desarrollo brindan un convincente apoyo a ... las posturas contrarias al computacionalismo. Es necesario rechazar la visión piagetiana
La cuestión que cabe destacar es que, aquí (como en otros lugares), la expresión enérgica de una postura anticomputacional está seguida de una descripción más minuciosa y precisa de los objetivos. Si ignoramos las afirmaciones espectaculares y nos centramos en estas descripciones más minuciosas, veremos que el verdadero malo de la película no es el computacionalismo (o el representacionalismo) per se sino más bien: l. La afirmación de que el desarrollo está dirigido por un plan totalmente detallado de antemano. 13. Quedan pendientes muchas cuestiones delicadas acerca
l Ser, computar, representar 1 207
2. La afirmación de que la cognición adulta implica operaciones lógicas internas sobre estructuras de datos proposicionales (es decir, la noción logicista de la etapa final del desarrollo cognitivo atribuida a Piaget). En lugar de estas tesis, Thelen y Smith proponen (de una manera bastante convincente desde mi punto de vista) lo siguiente: l '''. El desarrollo (y la acción) presentan un orden que es meramente ejecutor. Las soluciones son el resultado de un «montaje blando» de múltiples componentes heterogéneos, incluyendo la mecánica corporal, los estados y procesos neuronales y las condiciones ambientales (1994, pág. 311). 2"'. Aun cuando la cognición adulta parezca muy lógica y proposicional, en realidad se basa en recursos (como metáforas de fuerza, acción y movimiento) desarrollados en una actividad en tiempo real y que tienen su base en la experiencia corporal (ibíd., pág. 323; Thelen, 1995).
El apoyo experimental para 1''' se presentó en el capítulo 2 anterior. No enumeraré los argumentos a favor de 2"' ni intentaré decidir sobre ninguna de estas afirmaciones. Sólo diré que admitir estas dos afirmaciones es totalmente compatible con un compromiso sustancial con el empleo de la explicación computacional. De hecho, las pruebas presentadas funcionan mejor contra modelos que suponen codificaciones clásicas cuasi lingüísticas y contra la noción de que los estados iniciales de la mente del niño determinan por completo el curso de su desarrollo posterior. Pero incluso el venerable conexionismo hizo frente, hace ya tiempo, a la tiranía ejercida por las codificaciones cuasi lingüísticas. Y sin duda los especialistas en desarrollo atraídos por los modelos informáticos pueden abrazar la noción (que se expondrá más adelante) de soluciones parcialmente programadas, es decir, aquellos casos donde el programa inicial del niño está configurado por la evolución precisamente para permitir que la dinámica corporal y las contingencias del entorno local ayuden a determinar el curso y el resultado del proceso de desarrollo. Por tanto, los programas parciales compartirían el carácter lógico de la mayoría de los genes: no llegarían a constituir un diseño completo del producto final y cederían muchas decisiones a las condiciones y procesos del entorno local. Sin embargo, continuarían siendo unos factores aislables que, en un contexto natural, con frecuencia marcan una «diferencia típica e importante». 15 Por tanto, supongamos que admitimos que, por lo menos en los casos examinados, el cerebro no contiene ninguna receta exhaustiva para el éxito 15. Véase una exposición completa del complejo caso de la especificación genética parcial en las págs. 116-117 de Dennett, 1995.
208
1
Explicar la mente extendida
conductual. ¿Se desprende de ello que el discurso sobre programas internos es necesariamente erróneo en casos como éstos? Y si fuera así, ¿también se desprendería que no es útil contemplar las raíces neuronales de esta actividad como algo que implica procesos computacionales? Argumentaré que la respuesta a ambas preguntas es «no». En pocas palabras, pongo en duda las transiciones implícitas desde «no existe ninguna receta exhaustiva» a «no hay programas internos» y desde «no hay programas internos» a «no hay computación». Me parece que estas posturas fallan por su base, aunque plantean una pléyade de cuestiones sutiles y profundas que no pretendo ser capaz de resolver completamente. Consideremos la idea misma de un programa para hacer tal o cual cosa como, por ejemplo, calcular nuestros impuestos. La imagen más básica es la de una receta: un conjunto de instrucciones que, si se siguen fielmente, resolverán un problema. ¿Cuál es la diferencia entre una receta y una fuerza que, si se aplica, tiene un resultado determinado? Tomemos, por ejemplo, el calor aplicado a una sartén llena de aceite: el calor, cuando alcanza un valor determinado, ocasiona la emergencia de remolinos y bucles de convección en el aceite. ¿Es el calor (en ese valor determinado) un programa para lacreación de estos efectos? ¿Es una receta para crear remolinos y bucles de convección? Sin duda, no: sólo es una fuerza aplicada a un sistema físico. Pero, aunque el contraste es evidente, es sorprendentemente difícil dar una explicación razonada de la diferencia. ¿Dónde deberíamos buscar las diferencias que marcan esa diferencia? Un lugar donde mirar es la idea de programa, entendido literalmente como un conjunto de instrucciones. Las instrucciones se formulan en algún tipo de lenguaje: un sistema de signos que se pueden interpretar mediante algún dispositivo de lectura (un oyente para instrucciones habladas; un compilador para instrucciones en LISP; etc.). Por tanto, una razón por la que el calor aplicado a la sartén no se parece a un programa para bucles de convección puede ser que no presenta ningún indicio de un lenguaje: ningún rastro de símbolos o señalés que necesiten posterior interpretación o descodificación. Otra razón, relacionada con la anterior, es que el parámetro de control (la cantidad de calor necesaria para producir, por ejemplo, bucles de convección) parece ser demasiado simple e indiferenciado. Como uno de mis estudiantes comentó acertadamente, se parece más a enchufar el ordenador que a ejecutar un programa en él. Desde luego, sospecho que esta diferencia es la fundamental (aunque aquí es donde las aguas aún están demasiado turbias para ver con claridad) y que la cuestión de exigir un lenguaje o un código es, en cierto modo, derivada. Consideremos dos supuestos «programas» para calcular nuestros impuestos. Uno consta de 400 líneas de instrucciones
1 Ser, computar, representar 1 209
y abarca explícitamente todo el terreno que cabe esperar. El otro está diseñado para ser ejecutado en un equipo muy especial que ya está preparado para calcular impuestos. Este «programa» sólo contiene la instrucción «calcular impuestos». Sin duda, es un ejemplo de programa muy restrictivo o marginal. Contiene una instrucción que (supongamos) debe ser descodificada por un dispositivo de lectura para que se produzca la conducta deseada. Pero parece tener más en común con el ejemplo del «mero enchufe» (y, en consecuencia, con el modelo del calor aplicado a la sartén) que con la imagen de una receta para el éxito. Así pues, quizá la base conceptual no sea la mera intervención de señales y descodificaciones sino la medida en que la conducta deseada (el cálculo de impuestos, los bucles de convección) esté realmente especificada por la fuerza aplicada en vez de ser simplemente activada por ella. Este diagnóstico parece intuitivamente atractivo y puede ayudar a explicar, por ejemplo, por qué es tentador tratar el ADN como si programara resultados físicos, 16 mientras se niega que el calor programe el aceite de la sartén. Por tanto, la idea de un programa parcial es la idea de una especificación genuina que, no obstante, cede gran parte del trabajo y de la toma de decisiones a otras partes de la matriz causal global. En este sentido, se parece 16. Sin embargo, el caso de la programación genética es delicado e interesante y porrazones que guardan mucha relación con nuestra discusión. El genoma, ¿codifica realmente los resultados evolutivos? En cierto sentido, no. Cada vez está más claro que la mayoría de las características o rasgos de los individuos son el resultado de una compleja interacción entre múltiples genes y las condiciones ambientales locales. Por tanto, ¿debemos abandonar por completo la noción de «genes para algo específico»? La pregunta sigue abierta, pero recientemente varios teóricos han propuesto que las ideas sobre la codificación y Lt especificación genéticas todavía pueden tener sentido y ser útiles a pesar del hecho de que, como mucho, un gen determinado es un determinante parcial cuyos efectos definitivos dependen en gran medida de la estructura del entorno y de 1<1 presencia de otros genes. Una razón es que decir que un gen determinado es «para algo» nos alerta sobre cierto tipo de hecho funcional: un hecho cuya especificación no es problemática siempre y cuando las otras condiciones (el resto de los genes, el entorno local) se mantengan constantes. Así, se argumenta que es seguro y apropiado decir que un gen es un gen para un cuello largo si «los rivales para el lugar de ese gen en el cromosoma condujeran en el entorno pertinente (incluyendo el entorno genético) a un cuello más corto» (Sterelny, 1995, pág. 1621. ¿Por qué adornar la contribución genética con el barniz de un propósito (un gen para un cuello largo)? Porque, dicho simplemente, el material genético existe para controlar esa característica, mientras que los parámetros ambientales locales (normalmente) no. Sterelny cita el ejemplo de unas plantas que se desarrollan de maneras distintas en climas diferentes. Estas diferencias tienen un valor adaptativo y son provocadas por la combinación de las condiciones climiíttcas locales (que actúan corno disparadores) y las influencias genéticas. Pero el genoma está estructurado precisamente para permitir esta adaptación climática, mientras que el clima, como todos sabemos, es totalmente indiferente al destino de los seres vivos. Véanse más exposiciones de todas estas cuestiones en Oyama, 1985; Dawkins, 1982; Gifford, 1990; Gifford, 1994; Dennnett, 1995 y Sterelny, 1995.
21 O
I Explicar la mente extendida
mucho a un programa normal de ordenador (escrito, por ejemplo, en LISP) que no especifica cómo o cuándo se alcanzarán ciertos subobjetivos y que cede estas tareas a funciones incorporadas al sistema operativo (de hecho, ningún programa informático ofrece una especificación completa de la manera de resolver un problema: en una o en varias ocasiones, la especificación se interrumpe y la actividad corre a cargo del sistema operativo o del hardware). Por tanto. la expresión «programa parcial» sirve principalmente para distinguir la clase de casos, más bien especiales, donde algunas de estas decisiones y procedimientos se dejan en manos de unas estructuras bastante distantes: estructuras de la matriz causal más amplia del cuerpo y el mundo externo. Por ejemplo, es correcto decir que un sistema de control motor como el circuito emulador descrito en] ardan y otros (1994) y examinado en el capítulo 1 anterior, aprende un programa para controlar las trayectorias del brazo. Sin embargo, se trata de un programa que sólo tendrá éxito si existe un telón de fondo específico de dinámica corporal (la masa del brazo, la elasticidad de los músculos) y de aspectos ambientales (la fuerza de la gravedad). Es adecuado verlo como un programa porque, en el fondo, especifica movimientos de alcanzar en una especie de vocabulario neuronal. Cuanto menos detallada sea la especificación requerida (es decir, cuanto más trabajo sea realizado por la dinámica intrínseca del sistema, bien a largo plazo, bien de una manera temporal), menos necesario será tratarlo como un programa. Por tanto, más que enfrentarnos a una dicotomía entre soluciones programadas y no programadas, nos enfrentamos a un continuo donde las soluciones pueden estar más o menos programadas en la medida en que un resultado deseado dependa de una serie de movimientos (lógicos o físicos) que requieran una especificación concreta en vez de una mera incitación. Sin embargo, al profundizar en este contraste debemos tener presente la posibilidad m11y real de que se produzca una cascada de actividad computacional donde, por medio de una secuencia de sistemas subordinados, una simple instrucción no estructurada sea tranformada progresivamente en una especificación muy detallada que al final controle la conducta (véanse, por ejemplo, Gre;ne, 1972 y Gallistel, 1980). Si este desarrollo progresivo se produce en la cadena de sucesos neuronales, podemos considerar la etapa (o etapas) de especificación más detallada como un programa almacenado.- La polémica afirmación de Thelen y Smith, Kelso y otros autores, es que quizá no valga la pena tratar como programas almacenados ni siquiera las etapas más detalladas de especificación neuronal: que la dinámica sinér-
17. El concepto de sinergia intenta capturar la idea de vínculos o acoplamientos que limitan el despliegue colectivo de un sistema que comprende muchas partes. Kelso (1995, pág. 38) cita corno ejemplo las rued-as delanteras de un automóvil. que están obligadas a girar al
l Ser, computar, representar 1 211
gica 17 del sistema corporal lleva a cabo tantas cosas, que las órdenes neuronales se comprenden mejor en todas las etapas como la aplicación de fuerzas simples a un sistema complejo cuerpo-entorno cuya propia dinámica recibe gran parte de la carga relacionada con la resolución de problemas. Sin embargo, desde una perspectiva menos radical se podría decir que lo que realmente demuestran estas investigaciones es que el problema de producir movimientos de alcanzar y similares puede exigir menos conjuntos internos de instrucciones detalladas de lo que hemos supuesto hasta ahora, a causa de la dinámica sinérgica bastante compleja que ya está implementada (por ejemplo) en los brazos y músculos mismos. Como dicen Thelen y Smith, puede que la especificación requerida para generar algunas conductas motrices se limite a estipular la configuración de unos cuantos parámetros esenciales (como, por ejemplo, la rigidez inicial del sistema muscular) que pueden tener unos efectos complejos en la dinámica total del sistema físico, de modo que la conducta de alcanzar se lleve a cabo sin especificar directamente ciertos panímetros como las configuraciones angulares de las articulaciones. La cuestión que cabe destacar es que la ausencia de un tipo particular de instrucciones o especificaciones (por ejemplo, que estipulen explícitamente las configuraciones angulares de las articulaciones y la pauta de activación muscular) no implica la ausencia completa de una especificación o programa. De hecho, esta caracterización solo parece convincente en el caso extremo donde la noción de una especificación codificada se reduce a la noción de una simple fuerza aplicada o de una sola instrucción no estructurada. Así pues, queda mucho espacio por explorar entre la idea de un programa almacenado que especifica una estrategia de resolución de problemas en un nivel muy bajo (por ejemplo, el nivel de la pauta de activación del músculo) y la idea de un sistema cuya dinámica intrínseca hace que una especificación sea totalmente innecesaria o la reduzca a la aplicación de una simple fuerza (que, en realidad, viene a ser lo mismo). Entre estos dos extremos se encuentra el espacio de lo que he denominado «programas parciales». Creo que la verdadera enseñanza de los trabajos sobre el control motor basados en los sistemas dinámicos es que éste es el espacio donde encontraremos los programas de la propia naturaleza. Pero supongamos que no es así. Supongamos que no existe ningún nivel de elaboración neuronal de instrucciones que merezca denominarse «programa almacenado». Aun así, propongo que de ello no se deduce que la imagen del cerebro como dúpositivo computacional carezca de base. De hecho, mismo tiempo en una sinergia incorporada que, sin duda, simplifica la dirección. Se puede aplicar con éxito el mismo concepto al ejemplo de las pautas de coordinación entre manos examinado en el capítulo 6 anterior (véase Kclso, 1995, pág. 52).
212
1
Explicar la mente extendida
considero escandaloso que, después de todos estos años, la ciencia cognitiva siga comprendiendo mal la idea misma de computación. Ante esta falta de claridad, es imposible presentar aquí un argumento irrebatible. Pero una opción atractiva es aceptar una noción de computación que esté estrechamente vinculada con la idea de procesamiento automatizado de información y con la transformación mecanicista de representaciones. Según esta explicación, existiría una actividad de computación siempre que observáramos una transición entre representaciones controlada de una manera mecanicista, independientemente de que estas representaciones intervengan o no en un esquema de especificación que esté lo suficientemente detallado como para que lo consideremos un programa almacenado. Además, esta noción relativamente generosa 18 de la computación da cabida a una variedad de estilos de computación que van desde la computación digital (definida en función de estados discretos) hasta la computación analógica (definida en función de cantidades continuas). Por esta razón, la tarea de demostrar que un sistema es computacional se reduce a demostrar que lleva a cabo transformaciones y procesamientos automatizados de información. Así pues, en muchos aspectos parece prematuro deducir, a partir de las imágenes y pruebas aducidas por Thelen y Smíth y otros autores, que deberíamos abandonar las nociones de computación y de representación interna en nuestros intentos por comprender la cognición biológica. En cambio, lo que realmente emerge de este trabajo y de los trabajos en la visión animada y la robótica examinados anteriormente, es un par de advertencias, ahora ya familiares pero muy importantes, que se pueden resumir como sigue: l. Procuremos no atribuir demasiadas cosas a la cabeza (o al sistema representacional interno). Lo que se llegue a representar y/o c9mputar internamente estará determinado por un complejo malabarismo que hace intervenir factores ambientales y corporales en el hábito de resolución de problemas. Como resultado, en el quehacer biológico cotidiano habrá tanto soluciones parcialmente programadas·como representaciones personalizadas u orientadas hacía la acción. 18. Naturalmente, el peligro es que esta noción sea ahora demasiado generosa, permitiendo (por ejemplo) que el sistema de fichas de una biblioteca y las redes de fax se consideren sistemas computacionales. Estoy de acuerdo en que, como mucho, estos casos son marginales. Sin embargo, la principal noción alternativa incurre en el error contrario. Esta noción (en ocasiones denominada «idea formalista de la computación») vincula la idea misma de computación a ideas sobre codificación digital y «computabilidad clásica». Pero la noción de computación analógica tiene una historia larga y distinguida y, en consecuencia, no se puede considerar contradictoria. Véanse exposiciones detalladas de todas estas cuestiones en Harnad, 1994; Hardcastle, 1995; Smith, 1995 y Giunti, 1996.
1 Ser, computar, representar 1 213
2. Cuidémonos de los supuestos rígidos sobre la forma de las representaciones internas o el estilo de la computación neuronal. No hay razón para suponer que las representaciones clásicas (localizadas en el tiempo y en el espacio) y la computación discreta y serial limiten el espacio de las soluciones representacionales y computacionales. De todos modos, los modelos conexionistas ya han empezado a relajar estas limitaciones y no han hecho más que arañar la superficie de la gama de posibilidades abiertas a los sistemas biológicos.
8.5 Seguir el ritmo Quizá haya otras razones para recelar de los enfoques basados en la representación. Como se ha argumentado recientemente, estos enfoques no pueden hacer justicia a las cruciales dimensiones temporales de la respuesta adaptativa real (véase especialmente la introducción a Port y van Gelder, 1995). Por ejemplo, los primeros modelos de carácter conexionista (véase el capítulo 3 anterior) no manifestaban ningún conocimiento intrínseco del tiempo o del orden y dependían de una variedad de ardides 1'' para eliminar la ambigüedad de secuencias con elementos idénticos. Además, la información de entrada para estas redes eran «instantáneas» del mundo y las salidas nunca eran patrones de actividad esencialmente extendidos en el tiempo. La aparición de las redes recurrentes (J ordan, 1986; El man, 1991) constituyó un avance porque estas redes incorporaban bucles internos de retroalimentación que permitían que las respuestas a nuevas entradas tuvieran en cuenta las actividades previas de las redes. Sin embargo, como indican Port y otros (1995), estas redes son más adecuadas para tratar con el orden que con la sincronización real. Por ejemplo, pueden especificar como salida una secuencia ordenada de operaciones (como una serie de instrucciones para trazar un rectángulo; véaseJordan, 1986) o ser sensibles a restricciones gramaticales que dependan del orden de las entradas (véase el trabajo de Elman, 1991, sobre gramáticas artificiales). Pero el orden no es lo mismo que la sincronización real. Cuando corremos para alcanzar un autobús en marcha, debemos hacer algo más que producir la secuencia correcta de órdenes motrices. Debemos tomar nota de una pauta que se despliega en el tiempo (el autobús que acelera alejándose de nosotros) y generar una gama de acciones compensatorias (una serie de órdenes motrices coordinada en el tiempo para las piernas, los brazos y el cuerpo). Y en el momento del contacto (si es que tenemos suerte) se debe producir un delicado acoplamiento entre la activi19. Véanse algunos ejemplos en las págs. 119-120 Je C:hurchland y Sejnowski, 1992.
214
1
Explicar la mente extendida
dad extendida en el tiempo de los dos sistemas (nosotros y el autobús). Esta conducta requiere que por lo menos uno de los sistemas responda a la sincronización real (no simplemente al orden) de los sucesos en el otro. Para modelar esto, los investigadores han empezado a buscar maneras de emplear las propiedades en tiempo real de las señales entrantes para «configurar» los recursos internos. El truco estriba en emplear la sincronización real de algunas señales de entrada como un «reloj» con el que medir otras señales similares. Una manera de conseguir esto es mediante el desarrollo de un «oscilador adaptativo». Estos dispositivos (Torras, 1985; McCauley, 1994; Port y otros, 1995) tienen dos propiedades fundamentales. En primer lugar, generan salidas periódicas de modo independiente (como las neuronas que tienen una frecuencia tónica de picos). En segundo lugar, esta actividad periódica puede estar influida por señales entrantes. Si este oscilador detecta señales entrantes, se dispara (produce un pico) inmediatamente y altera su periodicidad para acercarla un poco más a la de las señales entrantes. Con el tiempo, y dentro de unos límites fijos, este oscilador acabará activándose perfectamente en fase con las entradas. Si la señal de entrada cesa, el oscilador volverá gradualmente a su valor natural. Las versiones de estos dispositivos basadas en redes neuronales consiguen adaptarse empleando el familiar procedimiento de aprendizaje de descenso por un gradiente. Pero, en este caso, la información que impulsa el descenso es la diferencia entre la sincronización usual («esperada») de un pico y la sincronización real ocasionada por la tendencia del dispositivo .1 dispararse de inmediato si se detecta una señal de entrada. Por tanto, estos dispositivos se dejan «arrastrar» por la frecuencia de una señal detectada y entonces pueden mantener esa frecuencia durante un tiempo aunque la señal desaparezca o pierda el ritmo. Como este arrastre no es inmediato, las señales no periódicas no tien_en efectos reales (sólo producen uri pico con un ritmo inusual). Pero las señales regulares hacen que el dispositivo «siga el ritmo». Un sistema complejo puede utilizar muchos osciladores adaptativos, cada uno con un ritmo natural diferente y, en consecuencia, especialmente sensible a señales entrantes con cadencias distintas. El arrastré global en relación con un estímulo que contenga varios elementos periódicos diferentes (por ejemplo, una pieza musical) se produce 'cuanqo varios osciladores individuales se dejan arrastrar por elementos diferentes de la estructura temporal.2° Por ahora, la principal lección de todo esto es que los procesos internos con características temporales intrínsecas pueden figurar de manera destacada en la explicación de un subconjunto importante de conductas adapta20. Véase una amplia exposición en Port y otros, 1995; los párrafos anteriores de mi capítulo deben mucho a su tratamiento claro y conciso.
1 Ser, computar, representar
1
215
tivas. En estos casos, el «ajuste» entre el estado interno y las circunstancias externas permite abarcar mucho más que la noción usual de representación interna. El oscilador adaptativo realiza su trabajo ajustando su actividad a los ritmos de sucesos externos que producen señales periódicas. No representa esa periodicidad mediante algún símbolo arbitrario y menos aún con alguna codificación de tipo textual. Es mejor concebirlo como un sistema interno que se fusiona temporalmente con sistemas externos parasitando sus propiedades temporales reales. Para intentar analizar y explicar estas capacidades, necesitamos tanto la perspectiva en la que el sistema externo es una fuente de entradas que arrastran al oscilador, como la perspectiva que se centra en las propiedades posteriores del sistema acoplado más grande. Sin embargo, y a pesar de estas complicaciones, es indudable que sigue siendo natural e informativo describir el oscilador como un dispositivo cuyo papel adaptativo consiste en representar la dinámica temporal de algún sistema externo o de unos sucesos externos concretos. Después de todo, los aspectos temporales de los sucesos y los procesos externos son tan reales como los colores, los pesos, las orientaciones y todos los objetivos más familiares de las codificaciones neuronales. Sin embargo, en este caso es especialmente evidente que el tipo de representación implicada difiere de las concepciones corrientes: el vehículo de la representación es un proceso, con propiedades temporales intrínsecas. No es una estructura vectorial o simbólica arbitraria y no forma parte de un sistema de codificaciones cuasi lingüísticas. Quizá estas diferencias sean suficientes para persuadir a algunos teóricos de que es totalmente inadecuado denominar representacionales a estos procesos. Y en última instancia no vale la pena pelearse por esta palabra. Lo que sí parece claro es que sólo entenderemos el papel y la función del oscilador si comprendemos a qué aspectos de los procesos y sucesos externos está adaptado y los efectos que puede tener en otros sistemas neuronales y de control motor que consuman la información que proporciona.
8.6 Causalidad recíproca continua Sólo queda una manera (que yo sepa) de intentar argumentar con fuerza en contra del representacionalismo. Se basa en apelar a la presencia de unas influencias continuas y mutuamente .moduladoras que vinculan cerebro, cuerpo y mundo. Ya hemos encontrado indicios de esta complejidad mutuamente moduladora en el funcionamiento interno del mismo cerebro (véase el caso de la visión de los mamíferos en el apartado 7.3 anterior). Pero supongamos que algo parecido a este nivel de complejidad interactiva caracterizara a algunos de los enlaces entre los circuitos neuronales, el cuerpo físico
216
1
Explicar la mente extendida
y ciertos aspectos del entorno local. Los casos en los que estoy pensando se pueden presentar adaptando una analogía debida a Tim van Gelder (comunicación personal). Consideremos un receptor de radio, cuya señal de entrada podemos tratar como un modulador continuo de la «conducta» de la radio (su salida de sonido). Ahora imaginemos (aquí es donde adapto la analogía para insistir en este punto) que la salida de la radio también es un modulador continuo del dispositivo externo (el transmisor) que emite la señal de entrada. En este caso, observamos una interacción verdaderamente compleja y temporalmente densa entre los dos componentes del sistema que podría conducir a dinámicas globales distintas (por ejemplo, a una retroalimentación positiva o a un equilibrio estable) dependiendo de los detalles precisos de la interacción. El hecho fundamental es que, dada la naturaleza continua de las modulaciones mutuas, una estrategia analítica común daría pocos resultados. Naturalmente, esta estrategia común es el análisis de componentes tal como se ha descrito en el capítulo 6 anterior. Es indudable que en este ejemplo podríamos -y deberíamos- identificar distintos componentes. Pero esta estrategia fracasa si después intentamos comprender el despliegue conductual de un componente dado (por ejemplo, el receptor) tratándolo como si fuera una unidad aislada 21 de su entorno local por los límites tradicionales de la transducción y la acción, porgue estos límites, en vista de los hechos de t1 modulación mutua continua, parecerían arbitrarios en relación con este des1,liegue conductual concreto. No serían arbitrarios si, por ejemplo, la unidad receptora mostrara conductas discretas, en unidades de tiempo de recepción de señales y de su posterior emisión. Sí así fuera, podríamos reconceptualizar los sucesos del entorno como si el mundo diera entradas a un dispositivo que luego. produce salidas («acciones») que influyen en el mundo y que, en consecuencia, ayudan a moldear la próxima entrada de la secuencia: por ejemplo, podríamos desarrollar una versión interactiva tipo «atrapar y lanzar» del análisis de componentes, como se predice· en el capítulo 6 anterior. Otro ejemplo (propues.to por Randy Beer) puede ayudar a definir mejor esta diferencia. Consideremos un sistema simple con dos neuronas que, por separado, no muestran ninguna tendencia a oscilar rítmicamente. Sin embargo, en ocasiones ocurre que dos neuronas como éstas, cuando están vinculadas por algún proceso de señalización continua, modulan mutuamente su conducta y producen una dinámica oscilatoria. Llamemos «cerebro» a la 21. He tomadl, esta noción de aislamiento de Butler (en prensa). El capítulo 4 de esta obra presenta buenos argumentos contra la tesis radical de la cognición corpórea, aunque no aborda la clase de casos que constituyen un reto especial y que se examinan en el presente apartado.
l Ser, computar, representar
1
217
neurona 1 y «entorno» a L1 neurona 2. ¿Qué valor concreto tendría una división como ésta para comprender la conducta oscilatoria? Está claro que aquí hay dos componentes y que es útil distinguirlos e incluso estudiar su dinámica individual. Sin embargo, si el objetivo es explicar la oscilación, la neurona «cerebro» no tiene nada de especial. Tranquilamente podríamos optar por tratar al otro componente (la neurona «entorno») como el sistema básico y describir la neurona «cerebro» como una mera fuen te de perturbaciones para el «entorno». El hecho es que, en este caso indudablemente simplista, ningún componente disfruta de una posición especial cuando se trata de explicar las oscilaciones rítmicas. De hecho, la propiedad estudiada se entiende mejor si se trata como una propiedad emergente del sistema más amplio creado por el acoplamiento de las dos neuronas. De manera similar, en el caso de los cerebros biológicos y los entornos locales sería injustificable -como destaca ,lCertadamente Butler ( 1998 l- fingir que no nos enfrentamos a componentes distintos. Sin embargo, lo importante es ver si ciertos fenómenos estudiados se explican mejor otorgando una posición especial a uno de los componentes (el cerebro) y tratando al otro como una mera fuente de entradas y un espacio para salidas. En casos donde la conducta estudiada implica una causalidad recíproca continua entre los componentes, esta estrategia parece inadecuada. Admito que en estos casos no nos enfrentamos a un solo sistema indiferenciado. Pero el fenómeno estudiado es una propiedad emergente del acoplamiento de los dos componentes (perfectamente reales) y no se debería «asignar» a ninguno de los dos por separado. Tampoco me parece que la causalidad recíproca continua 22 sea un caso raro o excepcional en la resolución de problemas del ser humano. Los integrantes de un trío de jazz, cuando improvisan, están inmersos precisamente en una red de complejidad causal. La interpretación de cada miembro responde continuamente a las de los demás y, al mismo tiempo, ejerce su propia fuerza moduladora. Bailar, jugar a deportes interactivos y hasta tener una conversación son actividades que, en ocasiones, muestran el tipo de dinámica mutuamente moduladora que quiere premiar perspectivas más amplias que las que se centran en un solo componente y tratan a todos los demás como meras entradas y salidas. Naturalmente, se trata de casos donde lo que cuenta es algo parecido al entorno social. Pero las interacciones recíprocas densas pueden caracterizar igualmente bien nuestras relaciones con máqui22. También conocida como «causalidad circular»; véase. por ejemplo. la bibliografía sobre cibernética citada en las notas del capítulo 5. Esta noción también se destaca en Keho. 1995. Evito esta expresión porque parece sugerir un proceso simple que implica una etapa de retroalimentación desde la salida a la entrada. Los casos más interesantes de causalidad recíproca continua implican múltiples fuentes asincrónic.1s de retroalimentación; véanse Kelso. 1995, pág. 9 y Ashby, 1956, pág. 54.
218
1
Explicar la mente extendida
nas complejas (como los automóviles y los aeroplanos) o incluso la interacción continua entre músicos e instrumentos. Lo que importa no es si el otro componente es por sí mismo un sistema cognitivo, sino la naturaleza del acoplamiento causal entre los componentes. Cuando este acoplamiento sustenta un intercambio continuo y mutuamente modulado, con frecuencia será productivo tener en cuenta la dinámica emergente del sistema global. Por tanto, en la medida en que cerebro, cuerpo y mundo participen conjuntamente en episodios con una densa influencia causal recíproca, nos enfrentaremos a despliegues de conducta que se resistirán a la explicación basada en entradas y salidas de un motor cognitivo individual supuestamente aislado. ¿Qué significado tendría esto para el empleo en estos casos de la noción de representación interna en las explicaciones cognitivas científicas? Parece que sólo hay dos posibilidades. La primera es que, a pesar de todo, podríamos añadir un barniz representacional a algún subconjunto específico de las estructuras correspondientes a la vertiente del agente. Imaginemos una red neuronal compleja A cuya dinámica acoplada con el entorno incluye una frecuencia de picos (de activación) específica que es utilizada por otras redes como fuente de información acerca de la presencia o ausencia de ciertos procesos ambientales externos: aquellos con los que la red A está acoplada tan íntimamente. Por tanto, las redes que se encuentran más abajo emplean los perfiles de respuesta de A como sustitutos de estos estados del entorno. Imaginemos también que, en ocasiones, los perfiles de la respuesta acoplada de A también se pueden inducir, en ausencia de las entradas del entorno, por influencias neuronales que van de arriba abajon y que cuando ocurre esto el agente se encuentra a sí mismo imaginando que participa en la interacción compleja en cuestión (por ejemplo, tocar en un trío de jazz). En estas circunstancias, parece natural y productivo tratar a A como si fuera un locus de- representaciones internas a pesar de su participación ocasional en episodios de interacción recíproca densa con sucesos y procesos externos. Sin embargo, la otra pgsibilidad es, sencillamente, que el sistema nunca muestre el tipo de evolución interna potencialmente desacoplada que acabamos de describir. Esto es lo que ocurrirá, por ejemplo, si ciertos recursos internos sólo participan en intercambios ambientales densamente acoplados, continuos y recíprocos, sin que parezca existir ningún estado o proceso interno identificable cuyo papel en estas interacciones consista en contener elementos específicos de información acerca de los sucesos externos. Es decir, lo interno y lo externo interaccionan de una manera adaptativamente va23. De hecho, éste es precisamente el tipo de escenario previsto por la hipótesis de las zonas de convergencia de Damasio y Damasio (véase el apartado 7.4 anterior).
l Ser, computar, representar 1 219
liosa pero, sencillamente, no sucumben a nuestros intentos de asignar unas funciones concretas de procesamiento de información a determinados componentes, estados o procesos puramente internos. En estos casos, el sistema muestra lo que se puede denominar un equilibrio adaptativo no representacional (un ejemplo cotidiano es el juego del tira y afloja con una cuerda: no sirve de nada concebir uno de los equipos como si fuera una representación de la fuerza ejercida por el otro, pero hasta el desplome final los dos conjuntos de fuerzas se influyen y sostienen entre sí con un delicado equilibrio). Creo que cuando lo interno y lo externo muestran esta coevolución continua, mutuamente moduladora y no desacoplable, los instrumentos de descomposición del procesamiento de información alcanzan su máxima ineficacia. Lo que importa en estos casos son las propiedades reales y temporalmente ricas del intercambio continuo entre el organismo y el entorno. Sin embargo, aunque estos casos son muy interesantes conceptualmente, no constituyen un desafío serio para el papel general de la representación en la ciencia cognitiva. De hecho, no pueden plantear este desafío porque, por definición, se encuentran fuera de la clase de casos para los que lo más indicado es un enfoque representacional, como veremos a continuación.
8. 7 Problemas ávidos de representación Como hemos visto, el mayor desafío que se puede plantear a una interpretación basada en la representación proviene de casos donde la red de influencia causal llega a ser tan amplia y compleja que es prácticamente imposible aislar unos «elementos privilegiados» a los que asignar unas funciones adaptativas específicas de portar información. Estos casos suelen suponer la evolución continua y recíproca de múltiple sistemas estrechamente vinculados entre sí, cuyo efecto acumulativo («emergente») consiste en suscitar algún tipo de conducta o respuesta útil. Sin embargo, al intentar hacer justicia a estos casos problemáticos no deberíamos olvidar la gama de casos igualmente convincentes para los que una comprensión representacional parece muy adecuada. Se trata de los casos que suponen lo que en otro lugar24 he denominado «problemas ávidos de representación». Recordemos el primer requisito de Haugeland para un sistema que utilice representaciones internas (véase el apartado 8.2 anterior). Según este requisito, el sistema debe coordinar sus conductas con características del entorno cuya presencia no siempre sea «segura». Creo que hay dos clases principales de casos donde se cumple esta condición. Se trata de: 1) los ca24. Véase Clark y Torihio, 1994.
l 220
1
Explicar la mente extendida
sos que suponen razonar sobre estados de cosas ausentes, inexistentes o contrafacticos, y/ o 2) los casos que suponen una sensibilidad selectiva a estados de cosas cuyas manifestaciones físicas son complejas y difíciles de controlar. La primera clase de casos (ya mencionada en el apartado 8.2 anterior) incluye pensamientos sobre sucesos distantes en el tiempo o en el espacio y pensamientos sobre los resultados potenciales de acciones imaginadas. En estos casos es difícil evitar la conclusión de que el razonamiento con éxito implica crear algún tipo de sustitutos previos e identificables para los fenómenos ausentes: sustitutos internos que hacen posible una coordinación conductual adecuada sin la orientación facilitada por una entrada externa constante. La segunda clase de casos (que Haugeland no tiene en cuenta) es igualmente familiar, aunque un poco más difícil de describir. Son casos donde el sistema cognitivo debe responder selectivamente a estados de cosas cuyas manifestaciones físicas son totalmente diversas: estados de cosas que se unifican en algún nivel más bien abstracto, pero cuyos equivalentes físicos tienen poco en común. Como ejemplos podemos citar la capacidad para elegir todos los elementos valiosos de una habitación y la capacidad para razonar acerca de todas las posesiones
,¡,¡ '11
:( 1
1
Ser, computar, representar 1 221
orientar la conducta a pesar de la hostilidad efectiva de las señales del entorno (es decir, o no hay ninguna señal, o las señales requieren un cómputo considerable para orientar de manera útil la acción). Al parecer, en estos casos ávidos de representación el sistema debe crear algún tipo de elemento, pauta o proceso interno cuya función sea sustituir el estado de cosas esquivo. Por tanto, se trata de casos donde lo más natural es esperar encontrar estados del sistema que se puedan considerar representaciones internas con todas las de la ley. Realmente puede parecer que en tales casos deberían existir siempre representaciones internas subyacentes al éxito conductual. Sin ern bargo, esta conclusión es demasiado tajante porque es indudable que existe un elemento pragmático importante que aún podría desbaratar el intento de comprender el sistema desde un punto de vista representacional. Por tanto, aunque es evidente que los casos ávidos de representación exigen que algún tipo de propiedad sistémica compense la carencia de entradas procedentes del entorno seguras o fáciles de utilizar, de ello no se sigue que la propiedad pertinente se pueda individuar útilmente. Una vez más, esta individuación no será útil si supone una actividad tan compleja en el tiempo y una influencia recíproca entre tantos subsistemas que sea mejor concebir la «sustitución» corno una propiedad emergente del funcionamiento total del sistema. En estos casos (si es que existen), se podría decir con toda la razón que el sistema total representa su mundo, pero no lo haría explotando nada que pudiéramos tratar productivamente como representaciones internas. Por tanto, la noción de representación interna sólo se puede utilizar cuando podemos establecer unas correspondencias relativamente detalladas entre unos vehículos internos y unas funciones adaptativas de transporte de información. Estos vehículos pueden estar distribuidos espacialmente (como en la hipótesis de las zonas de convergencia), ser temporalmente complejos e/o implicar cualidades analógicas y valores numéricos continuos. Pero deben ser identificables como subconjuntos bien diferenciados de la estructura o actividad sistémica total. Mi opinión (coherente con el estado de la neurociencia contemporánea) es que esta identificación acabará siendo posible y que desempeñará un papel fundamental en la comprensión de ciertos aspectos de nuestro éxito adaptativo. Como mínimo, ahora podemos ver con más claridad qué haría falta para socavar un enfoque basado en la representación: haría falta demostrar que, incluso en los casos ávidos de representación, es prácticamente imposible aislar un sistema de vehículos detallados que desempeñen unas funciones adaptativas específicas de transporte de información. Además, hemos visto de muchas maneras que las ideas fundamentales de un enfoque corpóreo y embebido (codificaciones orientadas hacia la acción, resolución de problemas relacionada con el entorno y acoplamientos sinérgicos entre múl-
'1,
222
1
Explicar la mente extendida
tiples elementos) son, en cualquier caso, compatibles con el empleo de interpretaciones computacionales y representacionales. Así pues, y a fin de cuentas, la resolución de este debate debe depender de futuros estudios empíricos. Sin duda, en el grado de complejidad de los procesos y estados internos existe un límite superior 26 más allá del cual es simplemente poco informativo y explicativamente ocioso describir estos procesos y estados como representaciones internas. Pero probablemente la cuestión sobre el lugar exacto de este límite solo ~e resolverá mediante la experiencia práctica. La respuesta surgirá por ensayo y error, a medida que los experimentadores generen y analicen soluciones dinámicas reales a problemas cada vez más complejos y superficialmente «ávidos de representación». Estas confrontaciones pueden desembocar en un proceso de acomodación mutua donde las explicaciones basadas en los sistemas dinámicos se adapten y enriquezcan con interpretaciones y análisis computacionales y representacionales, y viceversa. 27 O puede ocurrir que la pura complejidad de los procesos y las pautas dinámicas implicadas, y el profundo entretejido de elementos internos y externos, nos convenzan de que es inútil tratar de identificar unos aspectos específicos de la compleja y cambiante red causal como indicadores de la presencia de características ambientales específicas y que, en consecuencia, es inútil pretender obtener una comprensión representacional de la estructura y el funcionamiento del sistema. El resultado más probable, creo yo, no es tanto un rechazo total de las nociones de computación y representación como un replanteamiento parcial de estas nociones. Este replanteamiento está prehgurado en muchos análisis dinámicos de otros tipos de problema ávidos de representación (como la toma de decisiones y la planificación 28 ) y es una continuación natural de programas de investigación basados en el conexionismo y en la neurociencia computacional. Sin embargo, un replanteamiento como éste tendría consecuencias que irían más allá de la mera identificación de una nueva gama de vehículos internos capaces de desempeñar funciones de representación. Un aspecto positivo de este replanteamient9 es que los vehículos dedicados a la representación ya no se limitarían al ámbito de los procesos y los estados internos. Por ejemplo, al hacer que los valores de unas variables colectivas tengan importancia para la representación, los teóricos dinámicos pueden permitir 26. Esta cuestión surgió durante una conversación especialmente fructífera con Randy Beer. 27. El trabajo reciente de Melanie Mitchell y Jim Crutchfield se dedica intensamente a esta visión de enriquecimiento mutuo; véanse, por ejemplo, Crutchficld y Mitchell, 1995 y Mitchell y otros, 1994. 28. Véanse ensayos en Port y van Gelder, 1995. Véase también van Gelder, 1995, págs. 376-377.
'
'
Ser, computar, representar
1
223
que algunos de los estados portadores de contenidos de un sistema sean intrínsecamente amplios: que dependan de estados definidos únicamente en el sistema más general que comprende al agente y a algunas partes selectas del entorno local. 29 Un aspecto negativo sería que, en la medida en que los vehículos dedicados a la representación floten más y más por encima del nivel de las variables y de los parámetros básicos del sistema,3° podremos presenciar la fractura parcial de un potente y familiar esquema explicativo. La inquietud (ya familiar desde el apartado 6.4 anterior) es que, de esta manera, empezamos a separar la descripción representacional de un sistema (y, de una manera más general, su caracterización como procesador de información) del tipo de descripción que apelaría directamente al proyecto de elaborar o construir un sistema como él. En cambio, una de las principales virtudes de los modelos computacionales más habituales es que muestran cómo fluyen la información y las representaciones a través del sistema con el fin de producir recetas eficaces para generar esa conducta en un dispositivo físico real. Al permitir que se adhieran barnices representacionales a entidades dinámicas complejas (ciclos límite, trayectorias en espacios de estados, valores de variables colectivas, etc.), el teórico lanza la explicación basada en el procesamiento de información hacia un nivel de abstracción muy por encima de los detalles de los componentes y las variables básicas del sistema, cercenando así los vínculos entre la descripción representacional y los detalles específicos del funcionamiento interno. Ahora parece que las mejores explicaciones representacionales se pueden separar31 de los detalles de la implementación física mucho más de lo que se creía anteriormente.
29. Aquí, la idea (que inicialmente puede parecer paradójica) es que, en ocasiones, sobrevienen unos «contenidos estrechos» (F odor, 1986) a estados del agente junto con partes seleccionadas del entorno local. Véase Clark y Chalmers, 1998. 30. Por tanto, esta inquietud sólo se aplicará a las elecciones de vehículos dinámicos que no se basen en una comprensión detallada al nivel de los componentes. Las explicaciones conexionistas basadas en trayectorias, espacios de estados y atractores (véase, por ejemplo, Elman, 1991) no se verán afectadas porque sus parámetros básicos ya están determinados por las propiedades de los componentes básicos. Lo mismo se podría decir de las explicaciones dinámicas con base neuronal (véase, por ejemplo, Jordan y otros, 1994). 31. Naturalmente, siempre ha habido una gran distancia entre una descripción algorítmica y cualquier implementación concreta. Pero una virtud fundamental de los enfoques computacionales usuales era que al menos limitaban las descripciones algorítmicas para garantizar que, en principio. se pudieran implementar empleando únicamente los recursos básicos de una máquina universal de Turing; véase, por ejemplo, Newell y Simon, 1981. (Por tanto, lo que una descripción dinámica abstracta puede perder como prescripción mecanicista detallada, lo puede compensar en fuerza temporal; véase van Gelder, 1995.)
1
1
! ¡
224
1
Explicar la mente extendida
8.8 Raíces
Los argumentos contrarios al representacionalismo y la computación examinados en los apartados anteriores tienen varios antecedentes, algunos recientes y otros no tanto. Concluiré la presente exposición esbozando algunas; 2 de estas raíces y mostrando diversas diferencias en cuanto a énfasis y alcance. Heidegger (1927) escribió sobre la importancia de Dasein (ser-ahí),"' un modo de «ser-en-el-mundo» en el que no somos observadores distantes y pasivos sino participantes activos, y destacó que nuestras relaciones prácticas con el mundo (clavar clavos, abrir puertas, etc.) no suponen tanto unas representaciones separadas (por ejemplo, del martillo como un objeto rígido con un peso y una forma concretos) como unos acoplamientos/uncionales: utilizamos el martillo para clavar el clavo. Para Heidegger, este acoplamiento práctico con el mundo se encuentra en el corazón de todo pensamiento e intencionalidad. 13 Una noción fundamental en este análisis es la idea de utensilio, es decir, de cosas que nos rodean y que figuran en las múltiples actividades basadas en la habilidad que subyacen a nuestras aptitudes cotidianas para solventar problemas con éxito. Por tanto, el trabajo de Heidegger prefigura el escepticismo hacia lo que se puede denominar tipos de representación interna «neutrales respecto a la acción» y se hace eco de nuestro énfasis en el empleo de instrumentos y en los acoplamientos entre organismo y mundo orientados hacia la acción. Sin embargo, algunas inquietudes de Heidegger son radicalmente distintas de las del presente proyecto. En particular, Heidegger se oponía a la idea de que el conocimiento supone una relación entre las mentes y un mundo independiente (Dreyfus, 1991, págs. 48-51), una cuestión más bien metafísica en relación con la cual no adoptaré ninguna postura. Además, la noción que tiene Heidegger del entorno de la acción corpórea es completamente social. Mi versión de «estar ahí» es considerablemente más amplia e in-cluye todos los casos donde el cuerpo y el entorno local aparecen como elementos en una actividad extendida de resolución de problemas. 34 Más cercano al proyecto actual en cuanto a espíritu y ejecución es el trabajo del fenomenólogo Maurice Merleau-Ponty,3 5 que se ocupó de describir La.expresión inglesa para el Dasein heideggeniano es «belng thcre», que significa tanto «ser ahí» como «estar ahí». El autor juega con ambos sentidos a lo largo del texto, empezando por el mismo título del libro (N. del TJ. 32. Entre otros trabajos especialmente pertinentes se incluyen Maturana y Varela, 1987; Dreyfus, 1979; Winograd y Flores, 1986; Kelso, 1995 y varios de los artículos de Boden, 1996. 3 3. \' éase una excelente discusión en los capítulos 3 y 6 de Dreyfus, 1991. 34. \X'heeler (1995) aborda este conflicto y ofrece como solución una ampliación fundamentada de Li noción de trasfondo de I !cidegger. 35. Véase una excelente discusión de los temas comunes que vinculan el trabajo de Mer-
1 Ser, computar, representar 1 225
la actividad inteligente cotidiana como la puesta en juego de sinergias completas entre organismo, cuerpo y mundo. En particular, Merleau-Ponty destacó la importancia de lo que yo he denominado «causalidad recíproca continua», es decir, la idea de que debemos ir más allá de la imagen pasiva del organismo que percibe el mundo y reconocer que nuestras acciones pueden responder continuamente a sucesos del mundo que, a su vez, responden continuamente a nuestras acciones. Consideremos un encantador ejemplo, al que llamo «el caso del hámster y las pinzas»: Cuando mi mano sigue cada esfuerzo que hace un animal para escapar mientras sostengo un instrumento para capturarlo, es e\·i
En este ejemplo, los movimientos de mi mano responden continuamente a los del hámster que se esfuerza por escapar, pero los forcejeos del hámster están continuamente moldeados y determinados por los movimientos de mi mano. Aquí. como dijera David Hilditch (1995), acción y percepción se fusionan en una especie de «danza interactiva libre entre el perceptor y lo percibido». Esta danza interactiva e iterada, como vimos, se reconoce ahora en el trabajo reciente sobre los fundamentos computacionales de la visión animada. Además, Merleau-Ponty también destaca que la percepción se dirige hacia el control de la conducta en el mundo real y en tiempo real. Aquí aporta algo muy parecido 36 a la noción de «facilitación» de Gibson, noción que, a su vez, ha inspirado directamente la idea de representaciones internas orientadas hacia la acción examinada en el capítulo 2 y el apartado 8.3 anteriores. Una facilitación es una oportunidad de uso o interacción que un objeto o condición brinda a cierto tipo de agente. Por ejemplo, a una persona una silla le facilita un asiento, pero para un pájaro carpintero la misma silla puede facilitarle algo muy diferente. leau-Ponty con proyectos actuales de l.i ciencia cognitiva rnrpórea \' embebida en Hilditch. 1995. Varela y otros, 1991, ofrecen un convincente tratamiento de muchos de los temas
226
1
Explicar la mente extendida
A Gibson le interesaba especialmente el ajuste de la percepción visual a las características invariantes de la señal luminosa entrante para seleccionar directamente clases de acciones posibles (por ejemplo, las pautas de luz que especifican la presencia de un terreno llano y que brindan al ser humano la oportunidad de andar). Según Gibson, en la medida en que el sistema de percepción humano pudiera sintonizar con estas facilitaciones, no habría ninguna necesidad de invocar entidades adicionales, como las representaciones internas, que mediaran entre la percepción y la acción. En el apartado 8.3 anterior argumenté que, con frecuencia, un rechazo tan tajante deriva de una refundición innecesaria de dos nociones totalmente distintas. Una es la idea enteramente general de las representaciones internas como estados, estructuras o procesos internos cuyo papel adaptativo consiste en contener tipos específicos de información que serán utilizados por otros sistemas neuronales y orientadores de la acción. La otra es la idea más específica de las representaciones internas como codificaciones ricas y neutrales respecto a la acción de condiciones externas. Sólo en este último sentido más restringido se produce una contradicción entre las ideas de Gibson y el constructo teórico de la representación interna.; 7 Por último, la reciente discusión de «la mente corpórea» presentada por Varela y otros (1991) muestra tres intereses básicos que también desempeñan un papel fundamental en el presente proyecto. 38 En primer lugar, Varela y otros se proponen colocar en el lugar que se merece a la naturaleza activa de la percepción y a la manera en que nuestra organización cognitiva refleja nuestra participación física en el mundo. En segundo lugar, ofrecen algunos ejemplos muy convincentes de conductas emergentes en sistemas simples. 39 En tercer lugar, colocan en un primer plano la noción de causali3 7. La idea de que los estados internos incorporan información que se puede desplegar de una manera computacionalmente económica para orientar la acción posterior se encuentra, de una forma u otra, en Ballard, 1991; Brooks, 1991; Mataric, 1991; Chapman, 1990; Gibson, 1979; Gibson, 1982; Neisser, 199}" y Turvey y otros, 1981. 38. Otra área recierite de investigación donde la cuestión de la corporeización también ocupa un lugar preponderante, se dedica a estudiar cómo los esquemas y las imágenes basados en el cuerpo impregnan a estilos de pensamiento mucho más abstractos. Aquí, la idea fundamental es que nuestra manera de conceptualizar ciertos ámbitos rarificados (problemas morales, relaciones temporales, estructuras argumentales, etc.) depende mucho de una especie de extensión metafórica de nociones básicas basadas en experiencias corporales. Aunque en espíritu mi interés por el papel del cuerpo y el mundo es claramente similar, en realidad es bastante diferente porque yo me centro en cómo las intervenciones físicas y las estructuras ambientales reales reconfiguran el espacio de los cómputos neuronales individuales. El estudio de las metáforas corporales se profundiza en Lakoff, 1987; Johnson, 1987, y en el capítulo 11 de Thelen y Smith, 1994. 39. Véase especialmente el ejemplo de Bittorio en el capítulo 8 de Varcla y otros, 1991.
1 Ser, computar, representar
1
227
dad recíproca (o «circular») y sus implicaciones negativas para ciertos tipos de proyectos reduccionistas basados en componentes. Estas cuestiones se unifican en la idea de cognición como enacción. La ciencia cognitiva enactiva, tal como la definen Varela y otros, es un estudio de la mente que no describe la cognición como el reflejo interno de un mundo objetivo externo sino que designa como locus básico del interés científico y explicativo las interacciones sensoriomotrices repetidas entre agente y mundo ..¡º Por tanto, Varela y otros se dedican a un proyecto muy relacionado con el nuestro. Con todo, existen algunas diferencias importantes en cuanto a énfasis e interés. En primer lugar, Varela y otros emplean sus reflexiones como pruebas para rebatir las perspectivas realistas y objetivistas del mundo. Yo evito deliberadamente esta postura porque conlleva el riesgo de oscurecer el valor científico de un enfoque corpóreo y embebido, vinculándolo a la idea problemática de que los objetos no son independientes de la mente ..¡ 1 Lo que yo afirmo es, simplemente, que los aspectos de la estructura de la realidad que representan los cerebros biológicos se suelen orientar estrictamente hacia unas necesidades y capacidades sensoriomotrices específicas. Por tanto, el objetivo de gran parte de la crítica actual no es la idea de que los cerebros representen aspectos de un mundo independiente real, sino más bien la idea de que estas representaciones sean neutrales respecto a la acción y que, en consecuencia, requieran un importante esfuerzo computacional adicional para producir respuestas inteligentes. En segundo lugar, Varela y otros (ibíd., pág. 9), se oponen a la idea de que «la cognición es, fundamentalmente, representación». Nuestro enfoque es mucho más cordial con los análisis representacionales y basados en el procesamiento de información. Pretende reconceptualizar parcialmente las ideas sobre los contenidos y los formatos de varios estados y procesos internos, pero sin rechazar las ideas mismas de procesamiento de información y de representaciones internas. Además, nuestro proyecto destaca un cuerpo de investigaciones de ciencia cognitiva algo diferentes (las investigaciones sobre la robótica en mundo real la teoría de los agentes autónomos) y trata de mostrar cómo encajan las ideas y los análisis que emergen de estas investigaciones muy recientes en la trama más amplia de las investigaciones psicológicas, psicofísicas y evolutivas que constituyen el terreno común de ambas disciplinas. 40. Véanse las págs. 172-l 79 de Varela y otros, 1991, donde la influencia de las ideas de Merlcau-Ponty sobre la causalidad circular se destaca explícitamente. 41. No puedo dejar de sospechar que existe algún desacuerdo entre Varela, Thompson y Rosch acerca de esta cuestión porque en algunos lugares (véanse, por ejemplo, las págs. 172179) su argumento se detiene deliberadamente justo antes de esta conclusión radical, mientras que en otros lugares (véase, por ejemplo, el capítulo 1O) parece apoyarla. Sin embargo, toda exégesis es delicada y la insinuación de la existencia de una tensión interna cs. necesariamente, tentativa.
228
1
Explicar la mente extendida
8.9 Representacionalismo mínimo En mi opinión, el reciente escepticismo hacia el papel de la computación y la representación en la ciencia cognitiva es exagerado. Gran parte de este debate se puede formular mejor como una discusión entre los/ans de los modelos maximalistas, detailados y neutrales respecto a la acción del mundo interno, y quienes sospechan (incluyendo a este autor) que gran parte de la conducta inteligente depende de unos recursos mínimos como, por ejemplo, codificaciones internas de carácter múltiple, parcial, personalizado y/u orientado hacia la acción. De manera similar, gran parte de la oposición a la idea del cerebro como dispositivo computacional se puede formular mejor como una oposición a la idea del cerebro como codificador de «especificaciones plenamente programadas» para el desarroIIo o la acción. He argumentado que las condiciones mínimas para hablar con sentido de representaciones internas se dan cuando podemos desvelar con éxito la compleja trama causal de influencias y poner de manifiesto el papel adaptativo basado en el procesamiento de la información de algún sistema de estados o de procesos: un sistema que suponga una distribución espacial y una complejidad temporal, y que permita identificar con éxito las configuraciones físicas que sustituyen a estados específicos de cosas. Esta amplitud de miras puede perturbar a aquellas personas cuyas intuiciones sobre estas cuestiones se hayan forjado en la fragua más restrictiva de la reflexión sobre el lenguaje, los textos y las gramáticas artificiales, 42 pero sospecho que u,das las partes estarán de acuerdo en que 42. Véase, por ejemplo, el debate entre Vera y Simon (extremadamente liberales) y Touretzky y Pomerleau en Co,gnzúve Science, 18 (1994l. Aunque se presenta más como una discusión sobre símbolos internos que sobre representaciones internas, este debate muestra exactamente el choque de intuiciones comentado en el texto. Touretzky -y Pomerleau sólo identifican como símholos internos los elementos que sean sintácticamente arbitrarios !lo que importa no es el estado físico per se sino solo su papel convencional), relativamente pasivos (manipulados por un procesador bien diferenciado) y capaces de entrar en episodios recursivos de combinación y recombinación basados en funciones. Vera y Simon cuentan como símbolos cuales4uiera señales o estados internos cuya función sea designar P denotar. Mi propio punto de vista, como debe resultar evidenle, se encuentra a medio camino entre estos dos extremos. Estoy de acuerdo con TouretLkv y Pomerleau en que no se debe considerar un símholo (o una representación interna) cualquier señal que pase por un sistema complejo. Pero basta con que una señal sea capaz de actuar como un sustituto genuino (controlando respuestas en ausencia de una entrada real del entorno) y que forme parte de algún tipo de sistema representacional. Sin embargo, como se argumentó en el apartado 8.1 anterior, estas limitaciPnes adicionales están muy lejos de exigir los sistemas de símbolos clásicos y concadenadores imaginados por Touretzky y Pomerleau. De una manera más general. considero intuitiva la idea global de que un sistema inlerno de representación no se debe vincular en exceso con nuestra experiencia con lenguajes, textos y gramáticas artificiales, que son tipos específicos de esquemas cuyas propiedades put:den decir más sobre el perfil computacional dc>l pensamiento hu-
Ser, computar, representar
1
229
una importante lección que se puede extraer del trabajo actual en la neurociencia y en la teoría de los sistemas dinámicos es que no deberíamos tener una mentalidad cerra
230
1
Explicar la mente extendida
Parece probable que para avanzar más en estas cuestiones deberemos aguardar la generación y el análisis de una gama más amplia de demostraciones prácticas: modelos basados en sistemas dinámicos que tengan como objetivo el razonamiento y la acción en dominios cada vez más complejos y abstractos. Creo que, a medida que se desarrollen estas investigaciones, veremos una coevolución cooperativa y bastante delicada entre múltiples tipos de análisis e ideas. Veremos la aparición de nuevas ideas sobre la representación y la computación que incorporen las economías de los estados internos orientados hacia la acción y de los procesamientos analógicos continuos, y que reconozcan la compleja danza conjunta de diversas fuentes internas y externas de variación. Aprenderemos a caracterizar la función adaptativa basada en el procesamiento de información de los estados y procesos internos, de maneras que no nos cieguen ante las complejidades de los intercambios interactivos que refuerzan gran parte de nuestro éxito adaptativo. Pero, en general, nos encontraremos a11adiendo nuevos instrumentos al repertorio de la ciencia cognitiva, refinando y reconfigurando -aunque no abandonando- los que ya poseemos. Después de todo, si el cerebro fuera tan sencillo que un solo enfoque pudiera desentra11ar sus secretos, ¡nosotros mismos seríamos tan sencillos que no podríamos llevar a cabo esta tarea!-1-1
44. Aunque esta frase es muy conocida, su origen es bastante incierto. Durantl'. mucho tiempo yo la había atribuido al neurocicntífico soviético A. R. Luria, pero no he podido encontrnr ninguna prueb,1 que lo confirme. C:asi todos mis colccgas científicos cognitivos ingleses y norte.1mericanos la conocen pero tampoco han podido encontrar su origen. Así que lo dejo como un ejercicio para el lector.
-,
Tercera parte MÁS ALLÁ
Y el autobús de Jerónimo el Bosco partió de casa de Kesey con un rótulo de destino en la parte delantera que decía «Masalla» y otro rótulo en la parte trasera que rezaba «Precaución: carga extraña». TOM WOLFE,
Thc Electric Kool-Aid Acid Test.
Vi\'Ímos en un mundo donde el habla es una institución. MAURJCE MERLL\U-PONTY,
Phenomenology o/ Pcrceptzón (1945/1962), púg. 184.
9
Mentes y mercados
9.1 Cerebros salvajes, mentes andamiadas Como hemos visto, la razón biológica con frecuencia consiste en un batiburrillo de estratagemas en línea desplegadas «sobre la marcha» que están disponibles, en parte, gracias a nuestra capacidad para intervenir en diversos tipos
\ 234
1
Más allá
mentar nuestros perfiles cognitivos individuales y difundir la razón humana a través de redes físicas y sociales cada vez más amplias cuyos cómputos colectivos muestran sus propias dinámicas y propiedades especiales. Esta extensión de nuestro marco básico a casos más avanzados implica tres pasos fundamentales. En primer lugar, el razonamiento individual se vuelve a formular como una especie de estilo de cómputo rápido para la compleción de patrones. En segundo lugar, una parte considerable de la tarea de resolver problemas se descarga en estructuras y procesos externos, pero estas estructuras y procesos ahora tienden a ser más sociales e institucionales que puramente físicos. Y en tercer lugar, el lenguaje público (como medio de coordinación social y como instrumento para el pensamiento individual) ahora desempeña un papel fundamental. En resumen, la idea es que la cognición avanzada depende de manera crucial de nuestras capacidades para disipar razonamiento: para difundir a través de estructuras sociales complejas el conocimiento y la sabiduría práctica que adquirimos y para reducir las cargas de los cerebros individuales situando estos cerebros en complejas tramas de restricciones lingüísticas, sociales, políticas e institucionales. Así pues, empezamos a vislumbrar que podemos enfrentarnos a los fenómenos de la cognición avanzada con métodos que presentan una continuidad, al menos de una manera general, con el enfoque básico adoptado en los casos más simples. A poco que esto sea cierto, nuestros cerebros no serán tan diferentes de los órganos fragmentados, especializados y orientados hacia la acuón de otros animales y de los robots autónomos. Pero nosotros, los seres humanos, destacamos en un aspecto crucial: somos expertos en estructurar nuestros mundos físicos y sociales y en extraer conductas complejas y coherentes de estos recursos tan difíciles de controlar. Empleamos la inteligencia con el fin de estructurar-m1estro entorno para poder tener éxito con menos inteligencia. ¡ Nuestros cerebros hacen que el mundo sea inteligente para que nosotros podamos ser unos tontos felices! O dicho de otra manera, el cerebro humano más estas piezas de andamiaje externo son los qÚe finalmente constituyen h1 máquina de inferencias racional e inteligente-que llamamos mente. Vistas así las cosas, está claro que somos inteligentes: sin embargo, nuestros límites se adentran en el mundo mucho más de lo que inicialmente pudiéramos suponer.;
3. La elección entre estas dos perspectivas es delicada v controvertible. Se abordará con más detalle en el capítulo 1O.
' Mentes y mercados
1
235
9.2 Perdidos en el supermercado Entramos en d supermercado para comprar una lata de alubias. Enfrentados a una abrumadora colección de marcas y precios, debemos decidir cuál vamos a comprar. Según la teoría económica clásica, en estas circunstancias un agente racional procede, a grandes rasgos, de la manera siguiente: el agente posee un conjunto preexistente y exhaustivo de preferencias que reflejan la calidad, el coste y quizá otros factores (el país de origen, etc.). Estas preferencias están asociadas a unos pesos o valores y el resultado final es una clasificación de las características deseadas. A continuación, esta clasificación compleja (y sistemática) de las preferencias se aplica a un conocimiento perfecto de las opciones que ofrece el mundo (el supermercado) y el agente seleccionador de alubias actúa para maximizar la utilidad esperada; es decir, el agente compra el artículo que mejor satisfaga los requisitos establecidos en el conjunto ordenado de preferencias (Friedman, 1953). Recientemente, esta imagen de la elección económica racional se ha denominado «paradigma de la racionalidad sustantiva» (Denzau y North, 1995). Sin embargo, como teoría de los mecanismos psicológicos de la elección individual cotidiana, el modelo de la racionalidad sustantiva falla por su base. El problema principal, según la conocida descripción de Herbert Simon (1982), es que los cerebros humanos, como mucho, sólo son locus de racionalidad parcial o limitada. 4 Nuestros cerebros, como avalan repetidamente los capítulos precedentes, no han sido diseñados como instrumentos de una razón sin prisas, totalmente informada, ni para ofrecer respuestas perfectas partiendo de una información supuestamente perfecta. En vista de la naturaleza «sobre la marcha», limitada y circunscrita en el tiempo de la cognición biológica, quizá sea sorprendente que la teoría económica clásica, con su visión de un razonador totalmente informado, lógicamente coherente, sin prisas y tranquilo, haya dado tanto de sí. Vista la evidente irrealidad psicológica de su modelo de la elección humana, ¿cómo es que la economía tradicional ha podido desarrollar modelos que predicen con un éxito por lo menos moderado el comportamiento de las empresas (en mercados competitivos con precios fijos), el comportamiento de los partidos políticos y los resultados de manipulaciones experimentales como la «doble subasta»? (Satz y Ferejohn, 1994; Denzau y North, 1995). Y -empleando un tono menos 4. Sin embargo, deberíamos distinguir la concepción de la razón como corpórea y embebida de la noción importante, pero todavía insuficientemente radical, de «racionalidad limitada»; \'éase el apartado 9.3, más adelant<:.
236
1
Más allá
optimista- ¿por qué no ha podido aclarar toda una colección de fenómenos sociales y económicos diferentes? Entre sus fracasos más sonados se encuentran la incapacidad de construir modelos de cambios económicos a gran escala con el tiempo y la incapacidad de construir modelos de elección en condiciones de gran incertidumbre como, por ejemplo, cuando no hay ningún conjunto preexistente de resultados que se puedan clasificar según su conveniencia (Denzau y North, 1995; North, 1993). Se trata de fracasos fundamentales en la medida en que se ramifican hacia una gran variedad de casos más concretos, como la incapacidad para construir modelos de la conducta de los votantes, para predecir el desarrollo de instituciones económicas y sociales, y para abordar la mayor parte de las elecciones que llevan a cabo los legisladores. 5 Esta pauta de éxitos y fracasos es a la vez fascinante y reveladora porque la mejor manera de explicarla parece suponer una disociación entre casos de lo que se puede denominar elección muy andamiada y casos de pensamiento individual menos restringido. Como varios autores han argumentado recientemente,6 el paradigma de la racionalidad sustantiva parece funcionar mejor en los casos muy andamiadas y fracasa progresivamente a medida que aumenta el papel del pensamiento individual poco restringido. La idea de elección muy andamiada se encuentra en la base de unos importantes trabajos llevados a cabo recientemente por Satz y Ferejohn (1994) y Denzau y North (1995). El tema común es que la teoría económica neoclásica funciona mejor en situaciones donde la elección racional individual está muy limitada por la selección cuasi e, olutiva de políticas y prácticas institucionales restrictivas. Esta ironía es-destacada explícitamente por Satz y Ferejohn: «La teoría [tradicional] de la elección racional es más potente en contextos donde la elección está limitada» (pág. 72). ¿Cómo puede ocurrir esto? Según Satz y Ferejohn, la razón es simple: lo que actúa en estos casos no es tanto el pensamiento individual como las estructuras sociales e institucionales más amplias en las que está embebido el individuo. Estas mismas estructuras han evolucionado y prosperado (en los casos donde funciona la teoría económica) fomentañdo la selección de acciones colectivas que realmente maximicen el rendimiento en relación con un conjunto fijo de metas. Por ejemplo, el entorno competitivo de la economía de mercado garantiza que, en general, sólo sobrevivan las empresas que maximicen sus beneficios. Este hecho, más que cualquier otro hecho sobre las creencias, los deseos u otros aspectos psicológicos de los individuos implicados, asegura el éxito 5. La cuestión de la conducta de los votantes se plantea convincentemente en Satz y Ferejohn, 1994. La cuestión del cambio institucional y la política pública se examina en North, 1993. 6. Especialmente Satz y Fercjohn, 1994, y Denzau y North, 1995.
-, Mentes y mercados
1
237
frecuente de los modelos de racionalidad sustantiva en predecir la conducta de las empresas. Las fuertes limitaciones impuestas por la estructura más amplia del mercado originan, en el nivel de la empresa, estrategias y políticas orientadas a maximizar los beneficios. Bajo la influencia de un andamiaje tan poderoso, las teorías y las visiones individuales del mundo pueden tener poco impacto en la conducta global de la empresa. Cuando el andamiaje externo de políticas, infraestructuras y costumbres es fuerte y -más importante aún- es el resultado de una selección competitiva, los miembros individuales son, en realidad, piezas intercambiables de un engranaje mayor. Este engranaje se extiende mucho más allá del individuo, incorporando estructuras sociales, físicas e incluso geopolíticas a gran escala. Lo que la teoría económica tradicional suele modelar con éxito es el razonamiento y conducta difusos de este engranaje más amplio. Existe una gran variedad de perfiles psicológicos individuales que son totalmente compatibles con ciertos roles funcionales concretos dentro de ese engranaje más amplio. Como comentaron Satz y Ferejohn (ibíd., pág. 79): «Muchos conjuntos de motivaciones individuales son compatibles con las limitaciones que el entorno competitivo del mercado impone a la conducta de una empresa. Con frecuencia, cuando explicamos la conducta de una empresa nos encontramos con pautas causales que se mantienen constantes en las diversas prácticas de actividad maximizadora que encontramos en la Inglaterra calvinista y en la Comunidad de Ahorro y Préstamo de Texas». En cambio, la teoría de la conducta de los consumidores es floja y tiene menos éxito. La razón de ello es que las ideas y la visión del mundo de cada individuo tienen preponderancia en las elecciones de consumo y el andamiaje externo es proporcionalmente más débil. De manera similar, la teoría de la conducta de los votantes es floja en comparación con la teoría de la conducta de los partidos durante las convocatorias electorales. Como ocurría antes, sólo sobreviven los partidos que superan la fuerte presión selectiva que impone la actividad orientada a maximizar los votos. En comparación, la elección individual es relativamente espontánea (ibíd., págs. 79-80). Según Satz y Ferejohn, el factor crucial que distingue los casos con éxito de los casos sin éxito (del empleo de la teoría neoclásica que supone la racionalidad sustantiva) es la disponibilidad de una teoría de intereses determinada estructuralmente. En los casos donde el entorno estructurador global actúa para seleccionar acciones limitadas que se ajusten a un modelo específico de preferencias, la teoría neoclásica funciona. Y funciona porque la psicología individual deja de importar: las «preferencias» están impuestas por la situación más amplia y no hace falta que se repitan en la psicología individual. Por ejemplo, en un sistema electoral democrático bipartidista, la situación global selecciona al partido que actúa para maxi-
238
1
Más allá
mizar los votos. Esta fuerza estructuradora externa nos permite atribuir «preferencias» a partir de las limitaciones para obtener el éxito en este engranaje mayor. Las limitaciones para los votantes individuales son mucho más débiles. Por tanto, los perfiles psicológicos reales pasan a un primer plano y la teoría neoclásica fracasa (Satz y Ferejohn, 1994, págs. 79-80; North, 1993, pág. 7). Este diagnóstico general está apoyado por el análisis de Denzau y North (1995), quienes destacan que la teoría económica tradicional construye buenos modelos de la elección en mercados competitivos de precio fijo y en ciertos estudios experimentales restringidos. En estos casos, según ellos, determinados aspectos institucionales desempeñan papeles importantes en el fomento de un rendimiento económico «de estilo maximizador». A modo de ilustración, Denzau y North citan algunos estudios computacionales fascinantes realizados por Gode y Sunder (1992) que se basan en unos agentes de bolsa de «inteligencia nula», unos agentes simulados que no teorizan, ni recuerdan sucesos, ni tratan de maximizar los resultados de una manera activa. Cuando se limitó a estos agentes simples a que sólo pujaran cuando ello no acarreara pérdidas inmediatas, se alcanzó una eficiencia del 75 º!,, (medida como «porcentaje de la suma de las rentas potenciales de compra y venta» (ibíd., pág. 5). Sustituir los agentes de inteligencia nula (IN) por seres humanos sólo aumentó la eficiencia en un simple 1 'Yo. Pero la alteración del andamiaje institucional (por ejemplo, reunir todas las ofertas en una subasta doble antes de contratar o permitir ofertar y contratar simultáneamente) ;:,rovocó una mejora del 6 %. La conclusión firme es que «la mayor parte de los aumentos de eficiencia en algunas situaciones de distribución de recursos se pueden atribuir a detalles institucionales, independientemente de sus efectos en agentes racionales» (ibíd., pág. 5). _ Los resultados de los experimentos con agentes IN demuestran claramente el poder de los entornos institucionales y de las limitaciones externas para fomentar conductas colectivas que se ajusten al modelo de la racionalidad sustantiva. Estos resultados encajan muy bien con las noticias, por lo demás inquietantes, de que la !Ilayor parte de la economía tradicional no se vería afectada si las personas eligieran al azar (Alchian, 1950, citado en Satz y F erejohn,_ 1994) en vez de maximizar la satisfacción de sus preferencias, y de que las palomas y las ratas con frecuencia pueden rendir de maneras coherentes con la teoría de la racionalidad sustantiva (Kagel, 1987, citado en Satz y Ferejohn, 1994). Estos resultados tienen sentido si el andamiaje de la elección por medio de estructuras restrictivas de escala superior es, en ocasiones, el portador más vigoroso de fuerza maximizadora. En los casos más extremos de esta restricción, el individuo que elige no es más que una simple pieza que desempeña el mismo papel funcional limitado que también pueden
-, Mentes y mercados
1
239
desempeñar un agente de inteligencia nula, una paloma, una rata, un agente humano o, en los peores casos, un dispositivo que funcione a cara o cruz. 7
9.3 ¿Oficinas inteligentes? Todo lo dicho hasta ahora indica que el andamiaje es importante: la estructuración externa proporcionada por instituciones y organizaciones carga con gran parte del peso explicativo para interpretar las pautas económicas actuales. Para ver dónde encaja la psicología humana, empecemos por preguntarnos: ¿qué tipo de mente individual necesita un andamiaje externo? Como hemos visto, un papel vital de las estructuras y los andamiajes externos está plenamente predicho por trabajos recientes sobre la cognición individual. La noción de racionalidad limitada de Simon (1982) probablemente fue el primer paso en esta dirección. Pero aunque Simon rechazó con razón la noción de los agentes humanos como razonadores lógicos perfectos, siguió comprometido con un modelo de computación básicamente clasicista (véanse la introducción y el capítulo 3 anteriores) que implicaba unas reglas explícitas y unas estructuras de datos cuasi lingüísticas. La principal diferencia era el empleo de la heurística con el objetivo de satiJjacer más que de optimizar, es decir, el empleo de «reglas generales» para encontrar una solución viable con unos gastos mínimos de tiempo y potencia de procesamiento. El resurgir de las ideas conexionistas (redes neuronales artificiales, procesamiento distribuido en paralelo; véase el capítulo 3 anterior) nos llevó aún más allá al poner en duda los modelos clásicos de la representación interna y del proceso computacional. En el apartado 3 .3 anterior vimos que, de hecho, estos sistemas sustituyen el razonamiento y la inferencia paso a paso por el reconocimiento rápido de patrones. Esta sustitución produce un perfil concreto de puntos fuertes (aptitudes motrices, reconocimiento de rostros, etc.) y débiles (planificación a largo plazo, lógica) que nos permite determinar de qué manera las estructuras externas pueden complementar y potenciar la cognición individual aislada. Se había argumentado que las estructuras externas nos permitían su7. Con esto no quiero afirmar (erróneamente) que las elecciones extremadamente andamiadas siempre se ajustan a las normas de la racionalidad sustantiva. Esto sólo ocurre si el mismo andamiaje institucional ha evolucionado como resultado de una presión selectiva para maximizar las recompensas, y si el entorno económico ha permanecido estable o si el propio andamiaje institucional original incorpora una flexibilidad suficiente para abordar cambios posteriores.
240
1
Más allá
perar dominios de problemas que requerían un despliegue secuencial y sistemático de capacidades básicas para la compleción de patrones y para la producción y reutilización de resultados intermedios. El sencillo ejemplo presentado en el capítulo 3 anterior se refería al empleo de lápiz y papel para extender unos conocimientos aritméticos simples (por ejemplo, que 7 X 7 = 49) a la solución de problemas más complejos (por ejemplo, 777 x 777). Ahora podemos ver, de una manera muy general, que las instituciones, las empresas y las organizaciones parecen compartir muchas propiedades esenciales con el lápiz, el papel y la práctica aritmética de este ejemplo. El lápiz y el papel proporcionan un medio externo en el que nos comportamos (empleando recursos básicos en línea) según dicte la práctica o política general de las multiplicaciones largas. La mayoría de nosotros no conocemos la justificación matemática del procedimiento. Pero lo empleamos y funciona. De manera similar, las empresas y las organizaciones constituyen un recurso externo donde los individuos se comportan de acuerdo con una serie de normas, políticas y prácticas. En estos ámbitos, la resolución cotidiana de problemas suele suponer el empleo de estrategias de reconocimiento de patrones localmente eficaces que se invocan como resultado de alguna incitación externa (como un papel verde en la bandeja de «entrada», cumplimentado de una manera prefijada) y que dejan huellas en forma de otras señales (hojas de papel, mensajes de correo electrónico, etc.) que estarán disponibles para manipulaciones futuras dentro del engranaje más amplio de la empresa. En estos contextos, al menos a corto pla,o, el papel de la racionalidad individual puede llegar a ser marginal. Si el engranaje global y las estrategias se han seleccionado para maximizar los beneficios, el hecho de que los individuos sean piezas que desplieguen formas muy limitadas de racionalidad, orientada a la compleción de patrones, carecerá de importancia. (Se podría decir que las neuronas individuales son piezas aún más limitadas, pero una vez organizadas en cerebros mediante la selección natural también sostienen una razón más elevada). Así pues, gran parte de lei que sucede en el complejo mundo de los seres humanos se puede comprender, de una manera un tanto sorprendente, como si implicara algo seme)ante a los «algoritmos estigmérgicos» presentados en el apartado 4.3 anterior. Recordemos que la estigmergia supone el empleo de estructuras externas para controlar, inducir y coordinar acciones individuales. También es posible modificar estas estructuras externas y moldear así las conductas futuras. En el caso de la construcción de termiteros, aunque las acciones de cada termita están controladas por la estructura local del nido, esas mismas acciones suelen producir modificaciones en la estructura que, a su vez, inducen a los mismos -o a otros- individuos a desarrollar más actividad. Naturalmente, aunque los seres humanos se encuentran in-
1
Mentes y mercados
1
241
mersos en los entornos restrictivos de grandes instituciones sociales, políticas o económicas, ¡no son termitas! A diferencia de las termitas, nosotros no desempeñaremos siempre una acción sólo porque un estímulo externo parezca exigirlo. Sin embargo, nuestros éxitos (y a veces nuestros fracasos) colectivos se suelen comprender mejor sí consideramos que el individuo sólo elige sus respuestas dentro de las limitaciones -con frecuencia poderosasimpuestas por los contextos de acción más amplios de carácter social e institucional. Y de hecho esto es justamente lo que cabe esperar cuando reconocemos que la naturaleza computacional de la cognición individual no es ideal para abordar ciertos ámbitos complejos. Al parecer, en estos casos sólo resolvemos el problema (por ejemplo, construir un «J umbo» o gobernar un país) de una manera indirecta, creando estructuras externas más grandes, tanto físicas como sociales, que puedan inducir y coordinar una larga sucesión de episodios -que se pueden tratar individualmente- de resolución de problemas, conservando y transmitiendo las soluciones parciales a lo largo de la sucesión.
9.4 Dentro de la máquina Las organizaciones, las fábricas, las oficinas, las instituciones y otras entidades similares son los andamiajes a gran escala de nuestro éxito cognitivo distintivo. Sin embargo, estas totalidades más amplias, al tiempo que ofrecen información y andamiaje al pensamiento individual, también reciben estructura e información a través de los actos de comunicación de los individuos y mediante episodios de resolución de problemas en solitario. Un proyecto crucial para las ciencias cognitivas de la mente corpórea es iniciar la difícil tarea de comprender y analizar esta compleja relación recíproca: una tarea de enormes proporciones que exigirá el empleo de simulaciones que operen en múltiples escalas de tiempo y niveles de organización. Lo ideal sería que estas simulaciones abarcaran el cambio evolutivo genético, el aprendizaje y la resolución de problemas de carácter individual, los procesos de evolución de culturas y artefactos y las capacidades emergentes para la resolución de problemas de grupos de agentes en comunicación. Sin embargo, y muy a mi pesar, esto es pedir demasiado dada la situación actual en este campo. Pero al menos es posible empezar a rascar la superficie de estas cuestiones. Se han dado algunos intentos apreciables de construir modelos para parte de la interacción entre la evolución genética y el aprendizaje individual (Ackley y Líttman, 1992; N olfi y Parisí, 1991; véanse discusiones en Clark, 1993 y Clark, 1996b). Sin embargo, para la presente discusión son más pertinentes los intentos de construir modelos de la interacción entre el aprendí-
242
1
Más allá
zaje individual, la evolución de culturas y artefactos, y las pautas de comunicación entre grupos. Siguiendo esta línea, H utchins (1995) se propuso investigar la influencia de diversas pautas de comunicación en las capacidades colectivas de resolución de problemas de grupos pequeños de «agentes» artificiales simples. En esta simulación, cada agente era una red neuronal pequeña que comprendía algunas unidades de procesamiento conectadas entre sí. Cada unidad codificaba algún rasgo específico del entorno. Unos vínculos excitadores conectaban entre sí rasgos que se sustentaban mutuamente; otros vínculos inhibidores conectaban entre sí rasgos mutuamente contradictorios. Por ejemplo, un rasgo como «es un perro» sería codificada por una sola unidad con vínculos excitadores con (por ejemplo) las unidades «ladra» y «es peludo» y con vínculos inhibidores con (por ejemplo) las unidades «maúlla» y «es un gato» (estando estas dos últimas vinculadas entre sí mediante una conexión excitadora). Estas redes se conocen como redes de satisfacción de restricciones. Una vez configuradas (mediante el aprendizaje o codificándolas a mano) las redes de satisfacción de restricciones muestran unas notables propiedades de razonamiento semejantes a la compleción de patrones. Imaginemos que las diversas unidades reciben señales de entrada procedentes del entorno. La activación de unas pocas unidades que figuren en una red de conexiones excitadoras producirá actividad en todas las unidades restantes de esa red. Así, la entrada «ladra» producirá un perfil de activación global adecuado para la categoría «perro», etc. Con frecuencia, las unidades individuales «eligen» entre responder (activarse) o no sumando las entradas recibidas a través de diversos canales y comparando el resultado con un valor de umbral. Como resultado, cuando una red de satisfacción de restricciones se ha acostumbrado a una interpretación de la entrada (por ejemplo, haciendo que se activen todas las unidades relacionadas con las características del perro), eliminar esta interpretación puede ser difícil porque las unidades se prestan entre sí un apoyo considerable. Según Hutchins, esta característica de esta clase redes concuerda basta)1te bien con el familiar efecto psicológico del sesgo a la confirmación, es decir, la inclinación a desatender, descartar o reinterpretar de una manera creativa las pruebas que van contra alguna hipótesis o modelo que ya se ha establecido (como una entrada «maúlla» aislada; véase,-por ejemplo, Wason, 1968). Ahora imaginemos una comunidad de redes de satisfacción de restricciones donde cada red tiene un nivel distinto de actividad inicial («predisposición») y un acceso diferente a los datos del entorno. Hutchins demuestra que, en estos casos, la manera precisa en que se estructura la comunicación entre las redes marca una profunda diferencia en el tipo de resolución colectiva de problemas que vaya a aparecer. Sorprendentemente, Hutchins (pág. 252) en-
Mentes y mercados 1 243
contró que, en esta clase de casos, no siempre es mejor más comunicación que menos. En particular, si desde el principio se permite que todas las re des influyan en 1d actividad de las demás (que se comuniquen), el sistema global muestra un grado extremo de sesgo a la confirmación: mucho más que cualquiera de las redes estudiadas por separado. La razón es que la den sidad de las pautas de comunicación impone una fuerte tendencia a descu brir con rapidez una interpretación compartida de los datos, es decir, a en contrar un patrón de actividad estable para todas las unidades. En vez de asignar el valor debido a los datos externos que reciben como entrada, las re des se vuelcan mucho más en estas restricciones internas (la necesidad de en contrar un conjunto de patrones de activación que no perturbe a las otras re des). Como resultado, el grupo social se precipita «hacia la interpretación más cercana al centro de gravedad de sus predisposiciones, independiente mente de la evidencia» (ibíd., pág. 259). En cambio, si limitamos el nivel de comunicación inicial daremos tiempo a cada red para que equilibre sus predisposiciones con la información pro cedente del entorno. Si la comunicación entre las redes se posibilita después, el sesgo global a la confirmación se reduce activamente: es decir, el grupo tie ne más probabilidades de encontrar una solución correcta que cualquiera de sus integrantes por separado. Estos resultados indican que la ventaja colec tiva de un jurado sobre una decisión individual se puede disipar proporcio nalmente al nivel de comunicación inicial entre sus miembros. 8 Con todo, lo más importante es que este ejemplo ilustra una manera de poder empezar a comprender, de una forma rigurosa, algunos aspectos de la delicada interac ción entre la cognición individual y la dinámica de grupo. Sin duda, esta comprensión será crucial para apreciar mejor las funciones de las estructu ras institucionales y organizativas en la resolución colectiva de proble mas, y para determinar el papel del equilibrio entre la cognición individual y el andamiaje externo al que esa misma cognición da forma y en cuyo seno habita. Una consecuencia de la sencilla demostración acabada de presentar es que hay espacio para que evolucionen pautas de comunicación entre los agentes (a lo largo del tiempo cultural-evolutivo) que satisfagan mejor las ne cesidades de resolución de problemas de un colectivo determinado. En una fascinante simulación anterior, Hutchins y Hazelhurst (1991) mostraron que los artefactos culturales (palabras y símbolos) que fluyen por el interior de la máquina colectiva pueden «evolucionar» para satisfacer mejor ciertas nece8. Compárese con el teorema del jurado de C:ondorcet, según el cual si (entre otras cosas) las elecciones del jurado son i11dcpc11die11tcs, entonces el voto por mayoría del jurado será co rrecto con más frecuencia que el de cualquiera de sus integrantes por separado.
' 244 1 Más allá
sidades específicas de resolución de problemas. En este estudio, Hutchins (un científico cognitivo) y Hazelhurst (un antropólogo cultural) crearon una sencilla simulación por ordenador en la que varias generaciones con secutivas de redes conexionistas sencillas mejoraban gradualmente su ca pacidad para resolver problemas creando y pasándose un conjunto de ar tefactos culturales: concretamente, un lenguaje simple que codificaba información sobre algunas correlaciones destacadas entre sucesos del en torno. Esta simulación se basaba en un grupo de «ciudadanos» (redes co nexionistas) capaces de aprender a partir de dos tipos de estructuras del entorno: unas «estructuras naturales» ( correlaciones observadas entre su cesos y, en este caso, entre las fases de la luna y la marea) y unas «estructu ras artificiales» (que suponían aprender mediante la exposición a símbolos que representan los estados de la luna y de la marea). Gracias a su capaci dad intrínseca para la compleción de patrones y el aprendizaje, estas redes pueden aprender a asociar símbolos con sucesos y a denotar sucesos me diante símbolos. Por tanto, pueden generar símbolos para reflejar expe riencias y pueden emplear estos símbolos para ocasionar los tipos de expe riencia que normalmente provocaría el suceso real (que, en sí mismo, no es más que otro tipo de codificación en esta simulación sencilla). En conse cuencia, la exposición a unos símbolos produce una especie de «experien cia vicaria» de los sucesos asociados. Además, algunas simulaciones incor poraban un «sesgo en la selección de artefactos» donde unos productos culturales (estructuras de símbolos) eran seleccionados por otros ciudada nos con una probabilidad que reflejaba, en parte, la competencia (el grado de éxito) de la red que los había producido. El estudio de Hutchins-Hazelhurst suponía observar el éxito relativo de muchas generaciones de redes. Pero, a diferencia del trabajo sobre algorit mos genéticos examinado en el capítulo 5 anterior, todas las generaciones eran idénticas en cuanto a estructura interna: no se permitía ninguna mejora genética. A pesar de ello, la acumulación gradual de mejores artefactos ex ternos (las estructuras simbólicás que representaban los estados de la luna y las mareas) permitió que las generaciones posteriores aprendieran unas re gularidades ambientales que las generaciones anteriores a ellas no habían po dido aprender. La contribución de cada individuo a las generaciones futuras no era genética: consistía en un artefacto simbólico que comprendía entra das para las fases de la luna y los estados de la marea. En parte, los ciudada nos de generaciones posteriores recibían entrenamiento con los artefactos generados por sus predecesores inmediatos, aunque la selección de estos ar tefactos se hacía o bien al azar (todos los artefactos de la generación anterior tenían la misma probabilidad de ser empleados) o bien en relación con el sesgo de selección (favoreciendo así a los mejores artefactos).
Mentes y mercados 1 245
Los resultados fueron claros: las primeras generaciones no podían prl' decir la regularidad. Las generaciones posteriores, idénticas al nacer y c111 pleando los mismos procedimientos de aprendizaje, fueron capaces de re solver el problema. Las simulaciones en las que intervenía el sesgo dL· selección tuvieron más éxito que las basadas en la elección al azar. Por tan to, la existencia de unos productos artificiales y de unas estrategias para se leccionar estos productos posibilita un tipo de aprendizaje multigeneracio nal que es independiente del cambio genético y que amplía enormemente los horizontes del aprendizaje individual.9 En estas sencillas simulaciones vemos algunos de los primeros intentos de dar un poco de cuerpo cuantitativo y analítico a las ideas sobre la resolu ción colectiva de problemas en comunidades de agentes capaces de crear y explotar diversos tipos de estructuras externas de símbolos. Estas estructu ras de símbolos son la «sangre» que fluye por el tejido social e institucional más amplio que moldea y habilita el pensamiento humano individual. 9.5 Entornos de diseño Hace poco, Rodney Brooks, el creador ele muchos de los robots móviles descritos en capítulos anteriores, planteó esta pregunta: ¿cómo podemos ob tener una conducta coherente a partir de múltiples procesos adaptativos sin un control centralizado? Se trata ele una pregunta acuciante si, como sospe chan muchos neurocientíficos y especialistas en robótica, incluso la cogni ción humana avanzada depende ele múltiples sistemas internos, con una co municación limitada, que explotan formas de representación interna parciales y orientadas hacia la acción. Sin el gran homúnculo central -el área interna donde, como dice Dennett (1991), todo «se junta»- ¿qué impide que la conducta se convierta en caótica y contraproducente? Brooks (1994) con sidera tres fuentes de restricción: la coherencia natural (donde el mundo fí sico determina, por ejemplo, que la acción A se realice antes que la acción B), la coherencia diseñada (donde el sistema posee, por ejemplo, una jerar quía preincorporada de metas) y diversas formas de modulación global de bajo coste (como los efectos hormonales). A esta lista podemos añadir ahora la idea de automodulación estigmérgi ca: el proceso mediante el cual los cerebros inteligentes estructuran activa mente sus propios mundos externos (físico y social) para suscitar acciones exitosas con menos cómputo individual. Al parecer, la coherencia y la fuer9. Véase más información sobre la interacción entre el aprendizaje humano y los artefac tos culturales en Norman, 1988 y en el apartado 10.3 posterior.
246
1
Más allá
za de la resolución de problemas de gran parte de la actividad humana pue de estar enraizada en el hecho simple, pero con frecuencia desatendido, de que somos los seres que más explotan los andamiajes externos de todo el pla neta. Construimos «entornos de diseño» en los que la razón humana es ca paz de sobrepasar ampliamente el ámbito computacional del cerebro bioló gico básico. Por tanto, la razón avanzada es, más que nada, el reino del cerebro andamiado: el cerebro en su contexto corporal, interaccionando con un mundo complejo de estructuras físicas y sociales. Estas estructuras exter nas limitan y potencian a la vez las actividades de resolución de problemas del cerebro básico, cuyo papel principal es sustentar una sucesión de res puestas iteradas y locales de compleción de patrones. Dentro de este para digma, los éxitos de la economía clásica (por citar sólo un ejemplo) emergen como si dependieran básicamente de la dinámica a corto plazo de respuestas fuertemente determinadas por tipos particulares de estructuras organizativas o institucionales: estructuras que, a su vez, han evolucionado como resulta do de la presión selectiva para maximizar cierto tipo de gratificaciones. Con todo, en la mayoría de los casos estos mismos andamiajes externos son producto del pensamiento y la actividad de seres humanos aislados o en colectividad. Por tanto, la presente discusión apenas rasca la superficie de un proyecto enorme y difícil: comprender la manera en que nuestro cerebro es tructura y habita a la vez un mundo poblado de culturas, países, lenguas, or ganizaciones, instituciones, partidos políticos, redes de correo electrónico y toda la inmensa parafernalia de estructc1ras externas y andamiajes que orien tan y dan contenido a nuestras acciones cotidianas. Todo esto, como observa Hutchins ( 1995) de forma harto significativa, sólo sirve para recordarnos algo que ya sabíamos: si nuestros logros superan a los de nuestros antepasados, no es porque nuestros cerebros sean más in teligentes que los suyos. Nuestros cerebros son las piezas de unos engranajes sociales y culturales más grandes que muestran la huella de los ingentes es fuerzos realizados anteriormente por individuos y colectividades. En un sen tido bastante literal, este engranaje es la corporeización persistente de la ri queza de conocimientos alcaQzados. Esta gigantesca razón extendida es la que más se beneficia de nuestros simples esfuerzos individuales y por ello cons tituye el ve.hículo principal de nuestro éxito cognitivo distintivo.
10
Lenguaje: el artefacto definitivo
10.1 El poder de la palabra ¿Qué hace por nosotros el lenguaje público? Hay una respuesta fácil y común que, si bien no es incorrecta, induce sutilmente a error. Esta respues ta es que el lenguaje nos ayuda a comunicar ideas, permitiendo que otros se res humanos se beneficien de lo que sabemos y que nosotros nos beneficie mos de lo que saben los demás. Sin duda esto es cierto y establece una de las principales fuentes de nuestro éxito cognitivo. Con todo, el énfasis en el len guaje como medio de comunicación tiende a cegarnos ante otro papel más sutil, pero igualmente poderoso: el papel del lenguaje como instrumento 1 para alterar la naturaleza de las tareas computacionales que intervienen en diversos tipos de resolución de problemas. La idea básica es muy sencilla. Consideremos un artefacto o instrumento familiar como unas tijeras.2 Normalmente, un artefacto como éste suele prel. Entre los autores recientes que suscriben alguna versión de este punto de vista del len guaje se incluyen Dennett (1991, 1995), Carruthers (1996) y, posiblemente, Gaukcr (1990, 1992). Carruthers distingue muy cuidadosamente entre el interés «comunicativo» y el interés «cognitivo» del lenguaje (págs. 44 y 52). En el apartado 10.2 posterior intentaré aclarar algu nas similitudes y diferencias entre estas concepciones y la noción del lenguaje como transfor mador computacional. En una línea parecida, McC:lamrock (1995) ofrece una interesante ex plicación del «lenguaje embebido» donde destaca hechos acerca del contexto externo (físico y social) en el que se usa el lenguaje. Aunque la discusión de McClamrock (véase, por ejemplo, ibíd., págs. 116-131) se centra en el debate entre las teorías «internalistas» y «externalistas» del significado, varias de sus observaciones tienen que ver directamente con mis intereses y los examinaré en el apartado 10.3 posterior. La perspectiva que desarrollo está muy en deuda con el tratamiento que hace Hutchins (1995) del papel de los medios externos en la construcción de sistemas cognitivos extendidos (véanse también los capítulos 4 y 9 anteriores). 2. Richard Gregory (1981) comenta el papel de los artefactos (incluyendo las tijeras)
248
1
Más allá
sentar una adaptación doble: un ajuste bidireccional, con el usuario por un lado y con la tarea por otro. Por una parte, la forma de las tijeras se adapta muy bien a la forma y las capacidades de manipulación de la mano humana. Por otra parte, cuando el artefacto se utiliza confiere al agente unas capaci dades o facultades características que los seres humanos no poseen de ma nera natural: la capacidad de hacer cortes rectos y limpios en ciertos papeles y tejidos, la capacidad de abrir envoltorios, etc. Esto no puede ser más evi dente: después de todo, ¿por qué otra razón valoramos este artefacto? En muchos aspectos, el lenguaje público es el artefacto definitivo. No sólo nos confiere facultades adicionales de comunicación; también nos per mite reestructurar una variedad de tareas difíciles, pero importantes, y dar les unos formatos más adecuados para las capacidades computacionales bá sicas del cerebro humano. De la misma manera que las tijeras nos permiten explotar nuestras capacidades manipuladoras básicas para alcanzar nuevos fines, el lenguaje nos permite explotar nuestras capacidades cognitivas bási cas de transformación y reconocimiento de patrones para que se amplíen ha cia nuevos horizontes conductuales e intelectuales. Además, como el len guaje público también presenta la adaptación doble descrita anteriormente, puede constituir un conjunto de artefactos lingüísticos cuya misma forma ha evolucionado, en parte, para explotar las contingencias y los sesgos del aprendizaje y el recuerdo de los seres humanos. (Esta adaptación inversa -del artefacto al usuario- podría ser la base de una nueva perspectiva sobre la controversia acerca de los mecanismos innatos para la adquisición y la comprensión del lenguaje.) Por último, la pura intimidad de las relaciones entre el pensamiento humano y los instrumentos del lenguaje público nos plantea el interesante y delicado enigma consistente en determinar dónde acaba el usuario y dónde empieza el instrumento. 10.2 Más allá de la comunicación La idea de que el lenguaie puede hacer mucho más que servir simple mente como vehículo para la comunicación no es nueva. Está claramente presente e_n el trabajo de especialistas en el desarrollo como Lev Vy gotsky (1962) y Laura Berk (véase, por ejemplo, Díaz y Berk, 1992). Ficomo medios para reducir la carga computacional del individuo y ampliar nuestros horizontes conductuales. Daniel Dennett (1995, págs. 375-378) se ha dedicado al mismo tema, descri biendo una clase de animales a los que denomina seres «gregorianos» (en homenaje a Richard Gregory): seres que explotan artefactos diseñados como amplificadores
El lenguaje: un artefacto definitivo 1 249
gura en los argumentos y las conjeturas filosóficas de, por ejemplo, Peter Carruthers (1996) y Ray Jackendoff (1996). Y aparece en las especula ciones más orientadas hacia la ciencia cognitiva de Daniel Dennett (1991, 1995). Será útil examinar algunas ideas fundamentales de esta literatura antes de seguir con nuestra versión preferida: concretamente, la idea del lenguaje como transformador computacional que permite a los cerebros completadores de patrones abordar problemas cognitivos que, si no, se rían intratables. Durante los años treinta, Vygotsky, un psicólogo de la época, propuso la idea de que el empleo del lenguaje público tiene unos profundos efec tos en el desarrollo cognitivo. Postuló unos fuertes vínculos entre el dis curso, la experiencia social y el aprendizaje. Dos ideas de Vygotsky que son especialmente pertinentes para nuestros fines actuales se refieren al habla privada y la acción andamiada (la acción realizada dentro de la «zona de desarrollo proximal»; véanse Vygotsky, 1962 y el capítulo 3 ante rior). Decimos que una acción está «andamiada» si se basa en algún apoyo externo. Este apoyo puede consistir en el empleo de instrumentos o en la explotación del conocimiento y las aptitudes de otras personas; dicho en otras palabras, el concepto de andamiaje (tal como yo lo utilizaré) 3 abarca una amplia clase de potenciaciones físicas, cognitivas y sociales que nos permiten alcanzar una meta que, en caso contrario, sería inalcanzable. Como ejemplos sencillos se pueden citar el empleo de un compás para tra zar un círculo perfecto, el papel de los miembros de una tripulación para que el piloto mantenga el rumbo y la capacidad de un niño pequeño para dar sus primeros pasos cuando sus padres lo sostienen. Aunque la noción de «zona de desarrollo proximal» de Vygotsky se refiere a los casos en que un niño es temporalmente capaz de tener éxito en determinadas tareas sólo mediante la orientación o la ayuda proporcionada por otro ser humano (normalmente uno de los padres o un educador), esta noción encaja con el interés de Vygotsky en el habla privada de la manera siguiente: cuando un niño sigue las indicaciones verbales de un agente más experimentado, con frecuencia puede tener éxito en tareas que, en caso contrario, encontraría imposibles de realizar (pensemos en cuando aprendimos a atarnos los cor dones de los zapatos). Más adelante, cuando el adulto no está presente, el niño puede llevar a cabo un diálogo similar, pero esta vez consigo mismo. Aunque hay quien dice que, incluso en este último caso, el habla (sea en 3. Como mencioné en el capítulo 3 anterior, esta utilización es algo más amplia de lo nor mal. Gran parte de la literatura de inspiración soviética considera que el andamiaje es intrín secamente social. Yo amplío esta noción para incluir todos los casos donde se hacen intervenir estructuras externas para potenciar la resolución de problemas.
250
1
Más allá
voz alta, sea «interiorizada») desempeña la función de orientar la conduc ta, enfocar la atención y evitar errores comunes. En estos casos, el papel del lenguaje consiste en orientar y dar forma a nuestra propia conducta: es un instrumento para estructurar y controlar la acción, no un mero medio de transferencia de información entre agentes. Esta idea de Vygotsky está apoyada por investigaciones más recientes so bre el desarrollo. Berk y Garvin (1984) observaron y grabaron el discurso de un grupo de niños de edades comprendidas entre cinco y diez años. Encon traron que la mayor parte de su habla privada (no dirigida a otros oyentes) parecía orientada a dirigir y controlar las propias acciones del niño y que la incidencia de este discurso aumentaba cuando el niño estaba solo y trataba de llevar a cabo alguna tarea difícil. En estudios posteriores (Bivens y Berk, 1990; Berk, 1994) se encontró que los niños que más hablaban para sí eran los que después dominaban mejor las tareas. A partir de este estudio y de otros similares, Berk llegó a la conclusión de que el habla dirigida hacia uno mismo (sea en voz alta, sea interiorizada) es un instrumento cognitivo crucial que nos permite destacar las características más desconcertantes de situacio nes nuevas, y dirigir y controlar mejor nuestras propias acciones orientadas a la resolución de problemas. El tema del lenguaje como instrumento también ha sido desarrollado por el filósofo Christopher Gauker. Sin embargo, el interés de Gauker se centra en replantear el papel intraindividual del lenguaje en función de lo que él de nomina «análisis causa-efecto». La ide:1 es describir el lenguaje público «no corno un instrumento para representar el mundo o expresar los propios pen samientos, sino como un instrumento para efectuar cambios en el propio en torno» (Gauker, 1990, pág. 31). Para captar el sabor de esta afirmación, con sideremos el empleo de un símbolo por parte de un chimpancé para pedir un plátano. El chimpancé pulsa una tecla concreta de un teclaao (la situa ción física precisa de la tecla puede variar en cada prueba) y aprende que ha cer que se ilumine ese símbolo tiende a provocar que aparezcan plátanos. Se gún Gauker, la comprensión c.uasi lingüística del chimpancé es explicable en función de su reconocimiento de una relación causa-efecto entre la produc ción de un símbolo y cambio·s en su entorno local. Gauker examina una va riedad de conductas de empleo de símbolos y concluye que todos sucumben a este tipo ele análisis. Esto le lleva a suponer que, si bien la comprensión lin güística de los seres humanos es claramente más compleja, también «consis te en captar las relaciones causales en las que pueden intervenir los signos lingüísticos» (ibíd., pág. 44). Gauker tiende a ver el rol del lenguaje como si fuera, por así decir, di rectamente causal: como una manera de conseguir que se hagan las cosas, muy parecida a alargar la mano y tomar una tarta. Sin embargo, la idea de
El lenguaje: un artefacto definitivo 1 251
que aprendemos mediante la experiencia las fuerzas causales peculiares de unas señales y unos símbolos concretos es, en principio, mucho más amplia. Incluso podríamos descubrir, como en los ejemplos de Vygotsky, que la emi sión de palabras y frases dirigidas a nosotros mismos tiene ciertos efectos en nuestra propia conducta. 4 También podríamos aprender a explotar el len guaje como instrumento de una manera mucho más indirecta, para alterar la forma de los espacios de problemas computacionales (véase el apartado 10.3 siguiente). Una pregunta evidente que plantea el supuesto papel del lenguaje como instrumento dirigido hacia uno mismo es, «¿cómo funciona?». ¿Qué tiene el habla dirigida hacia uno mismo que la hace adecuada, por ejemplo, para de sempeñar una función orientadora? Después de todo, ¡no está nada claro cómo nos podemos decir algo que no sepamos ya! En este sentido, es indu dable que el lenguaje público puede llegar a ser, como mucho, un medio para expresar ideas ya formuladas y entendidas en otro código interno más básico. Sin embargo, éste es precisamente el punto de vista que una explica ción «supracomunicativa» del lenguaje tiene que rechazar en última instan cia. Una manera de rechazarlo consiste en describir el lenguaje público como si él mismo fuera el medio para un tipo especial de pensamiento. Otra ma nera (en modo alguno exclusiva y no del todo definida) consiste en describir las entradas linguaformes como si tuvieran efectos distintivos en algún dis positivo computacional interno. C:arruthers (1996) defiende la primera; Dennett (1991) ofrece una versión de la segunda. 5 Carruthers argumenta que, en este caso por lo menos, deberíamos tomarnos muy en serio la evi dencia de nuestra propia introspección. Por supuesto, muchas veces parece que nuestros propios pensamientos estén compuestos por palabras y oracio nes del lenguaje público. Y según Carruthers, la razón de que tengamos esta impresión es porque es verdad: «...el pensamiento interno se da, literalmen te, en forma de habla interna».1' Por extensión, Carruthers considera que muchos empleos del lenguaje, más que una cuestión de simple comunica4. Creo que esta idea se origina en la corwincente discusión Je Dennett (1991, capítulos 7 y 8) acerca Je! papel ele las palabras corno medio de autoestirnulación. La discusión de este terna continúa en el capítulo 13 de Dennett, 1995. 5. Un foco fundamental de los tratamientos de Carruthers y de Dennett es la relación en tre lenguaje y conciencia. No discutirc' estas cuestiones aquí, salvo para decir que me inclino más por Churchland ( 1995, capítulo 10), quien describe la conciencia básica como la propie dad común de los seres humanos y Je muchos animales no lingüísticos. El lenguaje aumenta increíblemente el poder de la cognición humana. Pero no creo que intervenga en las percep ciones básicas del placer, el dolor y el mundo sensorial inherentes al verdadero misterio de la conciencia. 6. Véase una detallada exposición en el capítulo 2 de Carruthers ( 1996).
252 1 Más allá
ción, son una cuestión de lo que él acertadamente denomina pensamiento pú blico. Esta perspectiva encaja satisfactoriamente con la noción de Vygotsky defendida por Berk y también es aplicable al interesante caso de escribir nuestras ideas. Según Carruthers (íbíd., pág. 56), «no es que primero tenga mos un pensamiento personal y después lo escribamos, sino que pensar es el escribir». Volveré más adelante a esta cuestión (véanse el apartado 10.3 y el epílogo posteriores) porque creo que, sí bien lo que dice Carruthers es casi correcto, podemos comprender mejor su idea tratando la escritura como una manipulación del entorno que transforma el espacio de problemas para los cerebros humanos. Como ya se ha dicho, otra manera de desarrollar un punto de vista su pracomunícatívo del lenguaje consiste en suponer que, en realidad, las en tradas lingüísticas reprograman o alteran de alguna otra manera la estructura computacional de alto nivel del cerebro mismo. Aunque su interpretación es delicada (y, en consecuencia, tentativa), Dennett (1991, pág. 278) parece sostener este punto de vista cuando propone que «las mentes humanas conscientes son máquinas virtuales más o menos seriales, implementadas de manera ineficiente en el hardware en paralelo que la evolución nos ha pro porcionado». En éstos y en otros pasajes del mismo trabajo, la idea parece ser que bombardear (algo parecido a) un cerebro que procesa en paralelo, que es conexíonísta y que completa patrones con (entre otras cosas) textos y frases en lenguaje público ( recordatorios, planes, exhortaciones, pregun tas, etc.), da como resultado un tipo de rr·organízacíón cognitiva semejante a la que se produce cuando un sistema informático emula a otro. En tales ctsos, la instalación de un nuevo programa permite que el usuario trate una rnúquina serial basada (por ejemplo) en el lenguaje LISP como si fuera un l'llorme dispositivo conexíonista en paralelo. Lo que Dennett propone (ihíd., pág. 218), es el mismo truco pero al revés: la simulación d; algo pa J'l'cido a un instrumento serial lógico pero empleando los recursos total1m·nte diferentes de las redes neuronales masivamente paralelas que la evo l11ción biológica favorece para� la supervivencia y la acción en mundo y tic·mpo reales. Sorprendentemente, Dcnnett (1995, págs. 3 70-373) propone que esta su til reprogramación del cerebro mediante (principalmente) un bombardeo li11gi'iístico es 1o que produce el fenómeno de la conciencia humana (nuestro sl·11tido del yo) y nos permite sobrepasar con mucho los logros conductuales v cog11itivos de la mayoría de los animales. Por tanto, Dennett atribuye en gr:111 medida nuestras habilidades cognitivas avanzadas no a nuestro hard11·,1rc innato (que sólo puede diferir en aspectos pequeños, aunque impor l:111tes, del de otros animales) sino a la manera especial en que los efectos de Li rn lt11 rn y el lenguaje modifican diversas características plásticas (progra-
El lenguaje: un artefacto definitivo 1 253
mables) del cerebro. Como dice Dennett (1991. pág. 219), esta máquina se rial se instala gracias a una «miríada de microajustes en la plasticidad del ce rebro». Naturalmente, la mera exposición a la cultura y el lenguaje no es su ficiente para garantizar una cognición parecida a la humana. Podemos exponer una cucaracha a todo el lenguaje que queramos y no hallaremos ningún rastro de las transformaciones cognitivas que Dennett ve en noso tros. Dennett no dice que 120 haya diferencias iniciales en cuanto al hardwa re. Lo que dice es que la existencia de unas diferencias relativamente peque ñas en el hardware (por ejemplo, entre nosotros y los chimpancés) nos permite crear un lenguaje público y otros desarrollos culturales que, me diante un efecto de bola de nieve, conducen a grandes cambios y potencia ciones de la cognición, incluyendo quizá la instalación literal de un nuevo tipo de dispositivo computacional dentro del cerebro. La visión de Dennett es compleja y adolece de ambigüedad. Sin duda, la imagen que yo deseo desarrollar está profundamente relacionada con ella, aunque difiere (creo yo) en un aspecto fundamental. Mientras que Dennett considera que el lenguaje público es a la vez un instrumento cognitivo y una fuente de reorganización profunda pero sutil del cerebro, yo me inclino a ver lo, en esencia, como un simple instrumento: como un recurso externo que complementa, pero no altera en profundidad, los modos básicos de repre sentación y computación del cerebro. Es decir, considero que los cambios son relativamente superficiales y que se dirigen a permitirnos el empleo y la ex plotación de diversos recursos externos. Naturalmente, estas posturas no son completamente distintas. El mero hecho de que repitamos frases mentalmen te y las utilicemos para orientar y alterar nuestra conducta significa que no podemos -y no deberíamos- tratar el lenguaje y la cultura corno recursos to talmente externos. Sin embargo, sigue siendo posible que esa repetición, más que implicar el empleo de un dispositivo computacional fundamentalmente diferente en el cerebro, implique el empleo de los mismos recursos de siem pre (esencialmente completadores de patrones) para construir modelos de los tipos especiales de conducta observados en el mundo del lenguaje público. Y como observa Paul Churchland ( 1995, págs. 264-269), de hecho existe una clase de redes conexionistas ( «redes recurrentes»; véanse el capítulo 7 ante rior; Elrnan, 1993 y una discusión adicional en Clark, 1993) que parecen ser muy adecuadas para modelar y apoyar esta conducta lingüística. Esta visión de la repetición interior está muy bien desarrollada por los conexionistas David Rumelhart, Paul Smolensky, James McClelland y Geof frey Hinton, quienes argumentan que la estrategia general de «construir mo delos mentales» de la conducta de determinados aspectos de nuestro entor no es especialmente importante en la medida en que nos permite imaginar recursos externos con los que hemos interaccionado físicamente con ante-
254 1 Más allá
rioridad y repetir mentalmente la dinámica de estas interacciones. Así, la experiencia de traz,u y utilizar diagramas de Venn nos permite entrenar una red neuronal que, más adelante, nos permitirá manipular mentalmen te diagramas de Venn imaginarios. Sin duda, estas manipulaciones imagi narías requieren un recurso neuronal especialmente entrenado, pero no hay razón para suponer que este entrenamiento tenga como resultado la instalación de un tipo diferente de dispositivo computacional. Es el mismo proceso de siempre, dedicado a la compleción de patrones en espacios re presentacionales de muchas dimensiones, pero aplicado al ámbito especial de un tipo específico de representación externa. Rumelhart y otros desta can el claro vínculo con la noción de Vygotsky resumiendo su punto de vis ta como sigue (1986, pág. 47): Se nos puede instruir para que nos comportemos de una manera concreta. Podemos considerar que responder a este tipo de instrucciones equi\'ale, sim plemente, a responder a un suceso del entorno. También podemos recordar una de estas instrucciones y «decirnos a nosotros mismos» lo que debemos hacer: de esta manera, interiorizamos la instrucción . Creemos que el proceso de seguir ins trucciones es esencialmente el mismo, independientemente de que nos las diga mos nosotros mismos o de que se nos diga lo que debemos hacer. Así pues, tam bién aquí se da la interiorización de un formato representacional externo.
El pasaje (págs. 44-48) del cual se ha extraído la cita anterior es extraor dinariamente rico y toca varios de nuestros temas principales. Rumelhart y otros observan que estos formalismos externos son especialmente difíciles de inventar y lentos de desarrollar, y que por sí mismos son ejemplos de pro ductos que sólo pueden evolucionar (de una manera parecida al intento de alzarse uno mismo tirándose de las orejas) gracias a un proceso, mediatizado lingüísticamente, de almacenamiento cultural y refinamiento -gradual a lo largo de muchas vidas. También observan que, cuando utilizamos represen taciones externas reales, podemos emplear nuestras capacidades motrices y perceptivas básicas para descomponer problemas en p,1rtes y ocuparnos de series de subproblemas, almacenando mientras tanto los resultados interme dios: una importante propie·dad que volveremos a examinar en el apartado 10.3 posterior. De mahera similar, el enfoque que voy a proponer describe el lenguaje como un artefacto externo cuyo diseño se orienta más a complementar el perfil de procesamiento básico que compartimos con otros animales que a transformarlo. En este enfoque no se considera que la experiencia con el lenguaje sea fuente de una profunda reprogramación interna. La cuestión de si presenta la repetición lingüística interna como algo que, en ocasiones, constituye literalmente determinados procesos cognitivos humanos ( como
El lenguaje: un artefacto definitivo
1
255
afirma Carruthers) es discutible. Creo que lo importante no es tratar de res ponder a la difícil pregunta: «¿Realmente pens,imos con palabras?» /cuya respuesta seguramente es, «¡En cierto sentido sí y cierto sentido no!»), sino tratar de ver, simplemente, qué beneficios computacionales puede extraer un cerebro completador de patrones del fértil entorno de estructuras exter nas simbólicas y manipulables. Así, ha llegado el momento de que desafie mos al lenguaje en su guarida. 10.3 Cambio de espacios ¿Cómo pueden complementar los artefactos lingüísticos la actividad de un cerebro completador de patrones? Propongo que una función funda mental se refleja en el concepto de cambio de esp,wós: el agente que explota estructuras externas de símbolos cambia lo que sería (en el mejor de los ca sos) un cómputo interno que exigiría mucho tiempo y esfuerzo por una re presentación adquirida culturalmente. De hecho, es el mismo cambio que re alizamos de una manera puramente interna cuando nos detenemos justo antes de manipular físicamente unos símbolos externos y empleamos nues tros modelos internos de esos mismos símbolos para formular un problema mediante una forma de notación que lo haga más fácil de resolver. Y como se ha observado con frecuencia, seguramente son nuestras experiencias an teriores con la manipulación de símbolos externos reales lo que prepara el camino para estos episodios más autosuficientes de resolución de problemas simplificada mediante símbolos. Los ejemplos son innumerables y entre ellos se incluyen el empleo de la numeración arábiga (en \'eZ, por ejemplo, de la numeración romana) como notación para resolver problemas aritméticos; el empleo de diagramas de Venn para resolver problemas de la teoría de conjuntos; el empleo de los len guajes especializados de la biología, la física, etc., para plantear y resolver problemas complejos; y el empleo de listas y agendas como ayuda para la planificación individual y la coordinación de grupos. Todo estos casos com parten una base lógica subyacente: incorporar directamente parte del cono cimiento necesario para resolver un problema a los recursos mismos que em pleamos para representar el problema. Pero los detalles precisos de cómo se realiza este intercambio y cómo expande nuestro potencial cognitivo varía de un caso a otro. Por tanto, será útil distinguir varias manerns de cambiar esfuerzos computacionales individuales por representaciones transmitidas culturalmente. Los casos más simples son los que suponen el empleo de soportes exter nos de símbolos para descargar parte de nuestra memoria en el mundo. En
256
1
Más allá
estos casos, simplemente utilizamos el mundo artificial formado por textos, diarios, libretas, etc., como soporte para almacenar sistemáticamente con juntos de datos grandes y con frecuencia complejos. También podemos em plear manipulaciones externas simples (como dejar una nota en el espejo) para suscitar el recuerdo en la memoria biológica incorporada, y en el mo mento oportuno, de ciertas intenciones e informaciones. Por tanto, este em pleo de artefactos lingüísticos forma una continuidad con una variedad de manipulaciones del entorno más sencillas, como dejar un envase de aceite vacío en la puerta para que topemos con él al salir y nos acordemos de com prar más aceite. Un caso algo más complejo (Dennett, 1993) se refiere al empleo de eti quetas para simplificar el entorno. En ciertos casos empleamos señales y eti quetas perceptivamente simples para que nos ayuden a abordar entornos complejos. Los dibujos de las puertas de los servicios, los rótulos de los clu bes nocturnos y las señales de los centros urbanos cumplen este papel. Ha cen que un pequeño aprendizaje individual pueda dar mucho de sí, ayudán donos a encontrar objetivos en escenarios nuevos sin que sepamos de antemano, y de una manera detallada, qué debemos buscar o dónde debe mos buscarlo. McClamrock (1995, pág. 88) describe muy bien esta estrate gia diciendo que mediante ella «imponemos en el entorno ciertas propieda des estables que hacen disminuir nuestra carga computacional y la necesidad de que hagamos inferencias». Muy similar, pero quizá menos evidente, es el empleo de etiquetas lin güísticas para simplificar el entorno de aprendizaje de ciertos conceptos im portantes (esta función ya se ha examinado y ejemplificado en el capítulo 9 anterior mediante la simulación de «la luna y las mareas» de Hutchins). Al parecer, el empleo de etiquetas simples ofrece al dispositivo de aprendizaje una base sólida que le permite comprimir enormes espacios de búsqueda hasta un tamaño manejable.' Los beneficios más sofisticados del empleo de la representación lingüís tica se concentran en el empleo del lenguaje para coordinar la acción. Deci mos a otros que estaremos en tal lugar a tal hora. Incluso jugamos a este jue go con nosotros mismos, quizá escribiendo en una lista qué cosas vamos a hacer y cuándo las haremos. Un efecto de esta planificación explícita es fa cilitar la coordinación de acciones. Así, si comunicamos a alguien que esta remos en la estación a las 9 de la mañana, esa persona podrá planificar su viaje para venir a recogernos. O, en el plano individual, si tenemos que comprar pintura para retocar el coche y salir a comprar otras cosas, pode7. Vé,mse discusiones adicionales de este fenómeno, especialmente cuando se presenta en el aprendizaje· conexionista, en Clark, 199, (p,ígs. 97-98), y Clark y ThorntPn (1997).
El lenguaje: un artefacto definitivo
1
257
mos minimizar nuestro esfuerzo imponiendo un orden adecuado y siguien do un plan explícito. Cuanto mayor sea el espacio de demandas y oportuni dades, más necesario será emplear lápiz y papel para reunir y reorganizar repetidamente las opciones y para conservar el resultado como una especie de estructura externa de control, disponible para orientar nuestras acciones posteriores. Sin embargo, aunque estas funciones de coordinación son importantes, no agotan todas las ventajas de la planificación explícita (normalmente ba sada en el lenguaje). Como ha indicado Michael Bratman (1987), la crea ción de planes explícitos puede tener un papel especial en la reducción de la carga cognitiva en línea de agentes con recursos limitados como nosotros. Es decir, nuestros planes poseen una estabilidad que reduce la cantidad de deliberaciones en línea que realizamos cuando nos ocupamos de gran parte de nuestro quehacer cotidiano. Naturalmente, una información nueva pue de hacer -y así ocurre con frecuencia- que modifiquemos nuestros planes. Pero no dejamos que cualquier cambio leve provoque un replanteamiento de nuestros planes, ni siquiera cuando, permaneciendo igual todo lo res tante, podemos elegir de una manera ligeramente diferente. Según Brat man, el papel de esta estabilidad es impedir el derroche que significaría un proceso continuo de replanteamientos y elecciones (exceptuando. natural mente, los casos donde este trastorno esté bien compensado). 8 Por tanto, las formulaciones y los intercambios lingüísticos desempeñan un papel funda mental en la coordinación de actividades (tanto en el plano interpersonal como en el individual) y también en la reducción de la cantidad de delibe raciones en línea que llevamos a cabo. Muy relacionado con estas funciones de control y coordinación se en cuentra el fascinante -pero mal comprendido- papel de la repetición in terna del habla en la manipulación de nuestra atención y en la distribución de nuestros recursos cognitivos. Los resultados evolutivos mencionados en el apartado 10.2 anterior (sobre la manera en que el habla dirigido hacia uno mismo mejora la resolución de problemas) sugieren que el habla in terno es como una especie de bucle de control adicional capaz de modular el uso que hace el cerebro de sus propios recursos cognitivos básicos. En las relaciones interpersonales, este fenómeno se da cuando seguimos ins trucciones escritas o respondemos a las indicaciones orales de otra perso na para aprender a conducir o a navegar. Cuando practicamos por nuestra cuenta, la repetición mental de estas mismas instrucciones actúa como una señal de control que, de alguna manera, nos ayuda a supervisar y corregir nuestra conducta. 8. Véase una exposición a fondo en Bratman, 1987.
258
1
Más allá
Dreyfus y Dreyfus (1990) han argumentado que la repetición interna sólo desempeña este papel en los principiantes y que los verdaderos expertos de jan atrás estos apoyos lingüísticos. Pero, aunque es claramente evidente que, por ejemplo, los conductores expertos no repiten mentalmente consignas como «retrovisor, intermitente, maniobra», esto no demuestra que el razo namiento basado en el lenguaje no desempeñe ningún papel en el rendi miento de los expertos. Un interesante estudio llevado a cabo recientemen te por Kirsh y Maglio (véase el capítulo 3 anterior) examina el papel de la reacción y de la reflexión linguaforme en sujetos expertos en el juego de or denador Tetris. Recordemos que, en este juego, el jugador intenta acumular puntos colocando de una manera compacta unos objetos geométricos (zoi des) que caen hacia abajo desde la parte superior de la pantalla. Cuando un zoide desciende, el jugador puede manipularlo haciendo que gire o se des place antes de llegar al fondo. Cuando un zoide llega al fondo se detiene y aparece otro zoide por la parte superior de la pantalla. La velocidad de caí da aumenta a medida que avanza la partida. Pero (y aquí está el truco) cuan do se completa una hilera (es decir, cuando una hilera está totalmente ocu pada por zoides) ésta desaparece. Si el jugador es lento colocando los zoides, la pantalla se va llenando hasta que ya no pueden entrar más zoides por arri ba y la partida finaliza. Por tanto, los niveles de juego más avanzado exigen fundamentalmente una toma rápida de decisiones. El juego del Tetris es un ejemplo claro de ámbito que parece exigir un razonamiento de estilo cone xionista y de compleción de patrones para alcanzar el nivel de un experto. Además, si el modelo de Dreyfus y Dreyfus es correcto, este razonamiento en paralelo y orientado a la compleción de patrones debería explicar de una manera exhaustiva la habilidad de un experto. Pero curiosamente no parece que sea así. El juego de un experto parece depender de una delicada -y nada evidente- interacción entre un módulo rápido dedicado a la cÓmpleción de patrones y un conjunto explícito de intereses o normativas de nivel superior. Aunque estos resultados son preliminares y sería inapropiado presentarlos de una manera detallada, su rrincipal observación es que los verdaderos ex pertos en el Tetris dicen que no se basan únicamente en un conjunto de res puestas adaptativas rápidas producidas (por así decir) por una red entrena da, sino que también emplean unos intereses o normativas de nivel superior para supÚvisar la salida de la red especializada con el fin de «descubrir ten dencias o desviaciones en relación con... la normativa» (Kirsh y Maglio 1991, pág. 10). Entre los ejemplos de estas normas se incluyen «no agrupar en el centro y tratar de mantener el contorno plano» y «evitar depender de pie zas» (ibíd., págs. 8-9). Pero precisamente éstas son las normas improvisadas que (según Dreyfus y Dreyfus) sólo podríamos asociar a jugadores novatos. Con todo, como la atención a estas normas parece marcar especialmente el
El lenguaje: un artefacto definitivo 1 259
juego
260 1 Más allá
casos gramaticales más complejos (como dependencias muy distantes) lleva ría a unas malas «soluciones» (mínimos locales) iniciales de las que la red no se podría liberar. 9 El aprendizaje humano, como el de las redes neuronales artificiales, parece estar sometido, al menos hasta cierto punto, a la depen dencia de trayectorias. Ciertas ideas sólo se pueden comprender cuando ya se han comprendido otras. El entrenamiento recibido por una mente la pre para para que capte y abarque ideas que no pueden ser comprendidas por otra. De hecho, los procesos de la educación formal pretenden guiar a men tes jóvenes (y no tan jóvenes) por un genuino viaje intelectual, viaje que in cluso podría empezar con ideas que ahora se sabe que son incorrectas pero que, por sí solas, parecen ser capaces de preparar al sistema para que más adelante aprecie unas verdades más exactas. Estos hechos prosaicos reflejan dependencias de trayectorias cognitivas: no podemos llegar a todas partes desde cualquier lugar y el lugar donde ahora nos encontramos limita enor memente nuestras futuras trayectorias intelectuales potenciales. De hecho, la dependencia de trayectorias se explica muy bien si consideramos que el pro greso intelectual supone algo parecido a un proceso de búsqueda computa cional en un espacio grande y complejo. Los aprendizajes previos hacen que el sistema se incline a probar ciertas regiones de ese espacio y no otras. Cuanto más adecuado sea el aprendizaje previo, más manejable será la tarea de aprender una nueva regularidad: el aprendizaje previo actúa como un fil tro en el espacio de opciones que hay que explorar. Las redes neuronales ar tificiales que aprenden mediante el método de descenso por un gradiente (véase el capítulo 3 anterior) están extremadamente restringidas porque la rutina de aprendizaje las obliga a explorar siempre los bordes de su posición actual en el espacio de pesos. Como esto constituye su conocimiento actual, estas redes no puede ir «saltando» por un espacio de hipótesis. Por tanto, la situación actual de una ·red en el espacio de pesos (su conocimiento actual) restringirá de una manera fundamental las «ideas» nuevas que podrá explo rar posteriormente (Elman, 1994, pág. 94). Cuando nos enfrentamos a dispositivos que muestran señales de depen der de trayectorias, la-observación trivial de que el lenguaje permite empa quetar y transmitir ideas entre individuos adquiere un nuevo vigor. Ahora podemos apreciar cómo estas migraciones permiten la construcción comu nitaria de trayectorias y progresiones intelectuales sumamente delicadas y di fíciles. Una idea que sólo estaba al alcance de la experiencia previa de Joe, pero que sólo puede florecer en el nicho intelectual que ofrece ahora el ce rebro de Mary, puede desarrollar todo su potencial viajando entre Joe y 9. Véase un tratamiento detallado de este caso, incluyendo la otra manera principal de re solver el problema por parte:' de Elman (limitando la memoria inicial), en Clark, 1994.
El lenguaje: un artefacto definitivo 1 261
Mary como y cuando haga falta. La trayectoria hacia una buena idea puede entrecruzar varias historias individuales de aprendizaje, haciendo que el mí nimo local de un agente se convierta en un sólido bloque de construción para otro. Además, la gran cantidad de nichos intelectuales disponibles den tro de una comunidad vinculada lingüísticamente, constituye una matriz im presionante de posibles trayectorias entre agentes. Por tanto, la observación de que el lenguaje público permite que la cognición humana sea colectiva (Churchland, 1995, pág. 270) adquiere una nueva dimensión cuando reco nocemos el papel de este empeño colectivo en trascender la naturaleza de pendiente de trayectorias de la cognición humana individual. Incluso una búsqueda ciega y poco inteligente de recodificaciones productivas de datos almacenados, producirá, de vez en cuando, unos resultados impactantes. Al permitir que estos resultados circulen entre los individuos, la razón anda miada por la cultura es capaz de explorar progresivamente unos espacios en los que la razón individual dependiente de trayectorias nunca se podría adentrar. (Véase una investigación detallada y con base estadística de esta afirmación en Clark y Thornton, 1997.) Esta imagen general encaja limpiamente con el trabajo exploratorio de Merlín Donald (1991) sobre la evolución de la cultura y la cognición. Donald reconoce claramente el papel crucial de ciertas formas de andamiaje externo (concretamente, de los sistemas externos de memoria) en el pensamiento hu mano. Pero distingue dos tipos principales de andamiaje, que él denomina mítico y teórico. Según Donald, antes de los griegos ya se utilizaban diversos formalismos externos pero sólo al servicio de mitos y narraciones. La inno vación fundamental de los griegos fue empezar a utilizar el medio escrito para registrar los procesos del pensamiento y el razonamiento. Mientras que los registros escritos anteriores sólo contenían mitos o teorías acabadas (que se debían aprender a rajatabla y transmitir relativamente inalteradas), los griegos empezaron a registrar ideas parciales, especulaciones con pruebas a favor y en contra de ellas, etc. Esta nueva práctica permitió la circulación de conjeturas y soluciones parciales, que luego eran enmendadas y completadas por otros, etc. Según Donald (ibíd., pág. 343), lo que así se creó fue «mucho más que una invención simbólica, como el alfabeto, o que un soporte espe cífico de memoria externa, como la mejora del papel o la impresión»; lo que se creó fue «el proceso de descubrimiento y cambio cognitivo externamente codificados». Para completar nuestro inventario inicial de las virtudes cognitivas del pensamiento andamiada por el lenguaje, consideremos las propiedades físi cas de ciertos medios externos. Por ejemplo, mientras redacto este capítulo no paro de crear, eliminar y reorganizar trozos de texto. Tengo ficheros (tan to en papel como informáticos) con todos los apuntes y fragmentos que he
262
1
Más allá
ido almacenando durante un largo período de tiempo y que pueden tener re lación con este tema. Tengo libros y artículos originales llenos de comenta rios y anotaciones. Mientras traslado cosas de acá para allá (de una manera literal y física), interaccionando primero con una y luego con otra y elabo rando nuevos comentarios, anotaciones y planes, la forma intelectual del ca pítulo crece y se solidifica. Esta forma no surge totalmente desarrollada a partir de una meditación interna. Es el producto de una sucesión de interac ciones sostenidas y repetidas entre mi cerebro y una variedad de accesorios externos. Me atrevo a decir que, en estos casos, gran parte del pensamiento real incluye bucles y circuitos que salen de la cabeza y pasan por el entorno local. Los argumentos y las tesis intelectuales de gran amplitud casi siempre son producto de cerebros que actúan en concierto con múltiples recursos externos. Estos recursos nos permiten llevar a cabo manipulaciones y yuxta posiciones de ideas y datos que pronto desconcertarían a un cerebro no po tenciado.10 En todos estos casos, el entorno físico real de los símbolos y las palabras impresas nos permite buscar, almacenar, ordenar y reorganizar da tos de maneras ajenas al repertorio incluido en el cerebro biológico. 11 La lección es clara. El habla pública, la repetición interna y el empleo de textos escritos e informáticos son poderosos instrumentos que reconfiguran la forma del espacio computacional. Una y otra vez cambiamos cómputos in dividuales por representaciones adquiridas culturalmente. Una y otra vez empleamos palabras para enfocar, aclarar, transformar, descargar y controlar 11t1cstro propio pensamiento. Así entendidn, el lenguaje no es un mero espe jo imperfecto de nuestro conocimiento intuitivo. 12 Es una parte integrante del mecanismo mismo de la razón. 1 ll. El caso sencillo de manipu . lar físicamente fichas ele lntelect o Scrabble para presentar 1111n·os rragmentos ele palabras potenciales a un cerebro especializado en completar patrones 11·,-;111"· Kirsh, 1995 y el capítulo 3 anterior) es una versión a escala minúscula de la misma es l l";lli.:gia. 1 1. l'or ejemplo, Bechtel ( 1996, pág� 128) comenta que «las representaciones lingüísticas i"'"·,·11 c.1racterísticas que no se pueden encontrar en nuestras representaciones cognitivas in1<·111;1,. 1 'or cjl'mplo, los registros escrito,; pueden perdurar sin cambios durante largos perío do, ,k I i,·rnpo, mientras que nuestra "memoria" interna parece basarse en la reconstrucción, 11<1 ,·11 :,1 r,·c11pl'ra(:ÍÓn de registros almacenados. Además, mediante los diversos dispositivos "111.1c1 icos proporcionados por el lenguaje, se pueden guardar directamente relaciones entre 1•1l'l;1, d,· i1dorrnaci<Ín (por ejemplo, que un árbol se cayó y una persona dio un salto) que, de 11<1 S<'I :1,í, s,· podrían llegar a confundir (como ocurre cuando sólo se vinculan mediante una ,·,1111,1 m,1 a,ocial iva como una red conexionista simple)». 12. ( :1·,·o q11,·, c:n ocasiones, el hecho de no apreciar plenamente las múltiples funciones del l,·11¡•.11;1j,· ¡111hlirn conduce al ncurofilósofo Paul C:hurchland a desestimar la expresión linguafor11w n '""' si luna 1111 simple rdkjo superficial de nuestro conocimiento «real» (véase, por ejemplo, < 11111 ,lil.111d, l '!S'!, p:Íg. 1 SI. Vé·asc una disrnsi<Ín en Clark, 1996a y en el apartado 10.4 siguiente.
El lenguaje: un artefacto definitivo 1 263
10.4 Pensar sobre el pensar: el efecto del manglar Si vemos que un árbol crece en una isla, ¿cuál de los dos creemos que apa reció primero? Lo natural (y casi siempre correcto) es suponer que la isla pro porcionó el suelo fértil en el que pudo arraigar una semilla afortunada. Sin embargo, los manglares 13 constituyen una reveladora excepción a esta regla general. Los mangles crecen a partir de unas semillas flotantes que introdu cen las raíces en fondos cenagosos de poca profundidad. La semilla hace cre cer unas complejas raíces verticales desde la superficie del agua, formando lo que a todas luces parece un árbol pequeño con zancos. Sin embargo, el com plejo sistema de raíces aéreas pronto atrapa tierra, hierba y detritus. Después de un tiempo, la acumulación de material atrapado forma una pequeña isla. A medida que pasa el tiempo, la isla crece más y más. Al final, un número cre ciente de estas islas pueden acabar uniéndose, haciendo que la línea de la cos ta llegue hasta los árboles. Durante todo este proceso, y a pesar de nuestras intuiciones previas, la tierra es construida progresivamente por los árboles. Sospecho que en algunas clases de pensamiento humano actúa este «efecto del manglar». Es natural suponer que las palabras siempre están en raizadas en el suelo fértil de los pensamientos preexistentes. Pero al menos en algunas ocasiones la influencia parece ir en la dirección contraria. Un ejemplo sencillo es la poesía. Cuando elaboramos un poema, no sólo nos li mitamos a emplear palabras para expresar pensamientos: con frecuencia, las mismas propiedades de las palabras (su estructura y su cadencia) determinan los pensamientos que el poema llegará a expresar. Se puede producir una in versión parcial similar durante la elaboración de argumentos y textos com plejos. Cuando escribimos nuestras ideas, generamos una señal cuyo forma to nos abre una nueva gama de posibilidades. Podemos revisar una y otra vez las mismas ideas, abordándolas desde ángulos diferentes y con actitudes mentales distintas. Podemos conservar las ideas originales para juzgarlas y probar sin ningún riesgo algunas alteraciones sutiles. Las podemos almace nar para compararlas y combinarlas con otros conjuntos de ideas de mane ras que pronto desconcertarían a una imaginación no potenciada. Como se destacó en el apartado anterior, así es como las propiedades reales del texto físico transforman el espacio de pensamientos posibles. Estas observaciones me llevan a formular la siguiente conjetura: quizá el lenguaje público es el responsable de un conjunto de características dis13. Un ejemplo especialmente espectacular es el gran bosque de mangles, conocido como «Las diez mil islas», que se extiende hacia el norte desde Cayo Oeste hasta la región de los Everglades. Los mangles negros de esta región pueden alcanzar alturas de 25 m (Landi, 1982, págs. 361-363 ).
264 1 Más allá
tintivas del pensamiento humano que se plasman en la capacidad para ma nifestar una dinámica cognitiva de segundo orden. Denomino dinámica cog nitiva de segundo orden a un cúmulo de capacidades que implican autoe valuación, autocnt1ca y respuestas compensatorias ajustadas con precisión. 14 Esto es lo que ocurre, por ejemplo, cuando reconocemos un defecto en uno de nuestros planes o argumentos y dedicamos recursos cog nitivos a eliminarlo, o cuando reflexionamos sobre la poca fiabilidad de nuestros juicios iniciales en ciertos tipos de situaciones y, como resultado, actuamos con un cuidado especial, o cuando averiguamos por qué hemos llegado a una conclusión determinada comprendiendo las transiciones ló gicas de nuestro propio pensamiento, o cuando descubrimos las condicio nes bajo las cuales pensamos mejor y tratamos de provocarlas. La lista po dría continuar, pero creo que la pauta y a está clara. En todos estos casos pensamos en nuestros propios perfiles cognitivos o en unos pensamientos concretos. Este «pensar sobre el pensar» es un buen candidato para una capacidad inconfundiblemente humana, es decir, que no esté manifiesta mente presente en los animales con los que compartimos este planeta y que no emplean ningún lenguaje. Por tanto, es natural que nos preguntemos si esto puede constituir una clase entera de pensamiento en la que el lengua je desempeñe un papel generativo: una especie de pensamiento que no sólo se refleje en nuestro empleo de palabras (o que esté potenciado por ellas) sino que dependa directamente del lenguaje para su propia existencia. En este modelo, el lenguaje público y la repetición interna de oraciones actúan como las raíces aéreas del mangle: las palabras actuarían como puntos fijos rnpaces de atraer y acumular más material intelectual, creando las islas de pensamiento de segundo orden tan características del paisaje cognitivo del / lomo sapiens. A grandes rasgos, es fácil ver cómo puede haber ocurrido esto. En cuan 'º formulamos un pensamiento en palabras (o sobre papel) se convierte en 1111 ohjeto para nosotros mismos y para los demás. Como objeto, es una cosa sohre la cual podemos pensar. Pata crear ese objeto no necesitamos pensar so lirl' pensamientos, pero en cuanto está ahí, inmediatamente se da la oportu nidad de tratarlo como si fuera nn objeto por derecho propio. Por tanto, el pro(TSO de formulación lingüística crea una estructura estable a la que se ad l1inen pensamientos posteriores. 14. Sl' llll' ha informado de dos trabajos muy recientes que destacan estos temas. Jean-Pie11t· < :h,111gl'ux (ncurocientífico y biólogo molecular) y Alain Connes (matemático) proponen q11,· L, a11tol'valuación es lo que distingue a la verdadera inteligencia; véase Changeux y Con11<·s, 1 '!'!5. lkrl'k Bickerton (lingüista) ensalza el «pensamiento fuera de línea» y destaca que 11111¡•,1111:1 01 ra cspccie parece tcncr la capacidad para detectar problemas en su propio rendi11,ic1110 v 101n,11· lnl'didas ,1dec11adas para rectificarlos; véase Bickerton, 1995.
El lenguaje: un artefacto definitivo
1
265
El linguista Ray Jackendoff ha propuesto algo parecido acerca del papel potencial de la repetición interna de frases. Jackendoff (1996) propone que la repetición mental de frases puede ser el medio principal por el que nues tros pensamientos se convierten en objetos a los que luego podemos dedicar más atención y reflexión. La afirmación fundamental es que la formulación lingüística hace que los pensamientos complejos estén disponibles para los procesos de atención mental y que esto, a su vez, los abre a toda una gama de posteriores operaciones mentales. Por ejemplo, nos permite seleccionar dis tintos elementos de un pensamiento complejo y examinarlos uno a uno. También nos permite «estabilizar» ideas muy abstractas en la memoria de trabajo, así como revisar y criticar nuestro propio razonamiento de maneras que serían imposibles con otra modalidad de representación. ¿Qué hace que la repetición interna de frases desempeñe un papel tan fuera de lo común? Propongo que la respuesta se debe encontrar en el pa pel más prosaico (y anterior en el tiempo) del lenguaje como instrumento de comunicación. Para funcionar como un instrumento eficiente de comu nicación, el lenguaje público se habrá ido transformando en un código ade cuado para los intercambios interpersonales donde se presentan ideas que después se examinan y se someten a crítica. Y esto, a su vez, implica el desa rrollo de un código que minimice la contextualidad (la mayoría de las pala bras retienen, esencialmente, los mismos significados en las diferentes ora ciones en las que aparecen), que sea efectivamente neutral en cuanto a la modalidad (una idea puede ser suscitada por entradas visuales, auditivas o táctiles y aun así conservarse empleando la misma fórmula verbal) y que per mita memorizar con facilidad cadenas simples de palabras.15 Por tanto, cuan do «congelamos» nuestros propios pensamientos en forma de oraciones re cordables, independientes del contexto y que trascienden la modalidad, creamos un tipo especial de objeto mental: un objeto que se deja examinar desde múltiples ángulos cognitivos, que no está condenado a sufrir cambios o alteraciones cada vez que nos exponemos a nuevas entradas o a nueva in formación y que organiza ideas en un nivel de abstracción más elevado a par tir de los detalles idiosincrásicos de sus orígenes proximales en la impresión sensorial. Propongo que este objeto mental encaja de manera ideal en las operaciones evaluadoras, críticas y enfocadas con precisión que caracterizan la cognición de segundo orden. Es un objeto adecuado para los exámenes minuciosos y repetidos que supone la noción de Jackendoff de prestar aten15. Annette Karmiloff-Smith destaca las dimensiones del lenguaje público neutrales en cuanto a la modalidad en su trabajo estrechamente relacionado sobre la redescripción repre sentacional. Para la relativa independencia del contexto de los signos y símbolos del lenguaje público, véanse Kirsh, 1991 y el capítulo 6 de Clark, 1993.
266
1
Más allá
ción a nuestros propios pensamientos. Por tanto, el sistema de codificación del lenguaje público es especialmente idóneo para intervenir en el ámbito más privado de la representación interna, el autoexamen y la autocrítica, tal como había predicho Vygotsky en los trabajos mencionados en el apartado 10.2 anterior. El lenguaje se revela como un recurso fundamental mediante el cual redescribimos con eficacia 16 nuestros propios pensamientos en un for mato que los hace asequibles para una variedad de nuevas operaciones y ma nipulaciones. Es verosímil concebir la emergencia de esta dinámica cognitiva de segun do orden como una raíz de la auténtica explosión de tipos y variedades de es tructuras externas de andamiaje acaecida en la evolución cultural humana. La capacidad de pensar en nuestro propio pensamiento nos permite estructurar activamente nuestro mundo con el fin de fomentar, sostener y ampliar nues tros propios logros cognitivos. Este proceso también se alimenta a sí mismo, como cuando la aparición del texto escrito y de la notación nos permitió em pezar a fijar secuencias de pensamiento y de razonamiento cada vez más com plejas y extendidas, y tratarlas como objetos de posterior examen y atención (recordemos las conjeturas de Merlín Donald en el apartado anterior). Una vez asentado este aparato (interno y externo) de reflexión basado en oraciones y textos, podemos esperar el desarrollo de nuevos tipos de pensamiento y de codificación de carácter no lingüísticos dedicados a dirigir las oraciones y los textos y a interaccionar con ellos de maneras cada vez más poderosas y efi cientes.17 Así consideradas, las construcciones lingüísticas son una nueva clase de objetos que nos invitan a desarrollar nuevas capacidades (no basadas en el lenguaje) de utilización, reconocimiento y manipulación. Por tanto, los modos de pensamiento con frases y sin ellas han coevolucionado para complementar, v 110 para duplicar, las ventajas cognitivas que ofrece cada uno. Creo que el hecho de no.apreciar esta profunda complementariedad es lo que ha llevado a Paul Churchland (uno de los mejores y más imaginativos lll't1rofilósofos) a rechazar la expresión linguaforme como si fuera un simple reflejo superficial de nuestro conpcimiento «verdadero». Churchland teme que sin este rechazo podríamos describir erróneamente todo el pensamiento v la cognición como si implicara: la repetición inconsciente de cadenas de s1111holos parecidos a frases y que, en consecuencia, podríamos pasar por alto 1 h. l .a idea Je que la cognición avanzada implica procesos repetidos donde el conoci111 i, ·111 o y la reprl'.sentación obtenidos se redescriben en nuevos formatos (que luego sostienen 1111,·vos I ipos de operación y de acceso cognitivos) se examina con mucho más detalle en Kar111ilol l Srnit h, 1992; C:lark, 1993; Clark y Karmiloff-Smith, 1994, y Dennett, 1994. La hipótesis "''l',111al d" la rl'.descripción representacional fue desarrollada por Karmiloff-Smith (1979, l'IK<,). 1/ V,·.111s,·, por ,·je1nplo, lkchtel, 1996, págs. 125-131; C:lark, 1996a, págs. 120-125.
El lenguaje: un artefacto definitivo 1 267
las potentes codificaciones basadas en patrones y prototipos que parecen ser biológica y evolutivamente fundamentales. Pero ahora hemos explorado una parte sustancial del fértil territorio que hay en medio. 18 Al combinar un con junto de aptitudes biológicamente básicas para el reconocimiento de patro nes con los «adhesivos cognitivos» especiales de la palabra y el texto, noso tros, al igual que los mangles, creamos paisajes nuevos: nuevos puntos fijos en el mar del pensamiento. Concebido como un artefacto cognitivo comple mentario, el lenguaje puede ampliar genuinamente nuestros horizontes cog nitivos sin necesidad de intentar la tarea imposible de recapitular los conte nidos detallados del pensamiento no lingüístico. 10.5 La adaptación del lenguaje al cerebro Consideremos un artefacto mal diseñado como, por ejemplo, uno de los primeros programas para procesar textos que era extraordinariamente difí cil de aprender y muy incómodo y frustrante de utilizar. ¡ Un ser mutante imaginario que encontrara fácil un programa como éste seguramente hubie ra necesitado unos recursos nerviosos diseñados especialmente para adqui rir esta competencia con rapidez! Ahora consideremos un artefacto diseñado a la perfección: el clip para sujetar papeles. 1� Para aprender a utilizar los clips con rapidez y habilidad no es necesario ser un mutante con un cerebro diseñado especialmente, porque el mismo clip está adaptado para facilitar una utilización sencilla por parte de seres como nosotros (pero no por parte de ratas o palomas) en nuestros entornos de oficina. Supongamos (y sólo supongamos) que el lenguaje es así. Es decir, que es un artefacto que ha evolucionado, en parte, para que seres como nosotros lo puedan adquirir y utilizar con facilidad. Por ejemplo, puede presentar es tructuras fonéticas o gramaticales que exploten determinadas predisposicio nes naturales del cerebro y del sistema perceptivo del ser humano. De ser esto así, podría parecer que nuestros cerebros están especialmente adapta dos para adquirir un lenguaje natural, pero de hecho sería el lenguaje natu ral el que estaría especialmente adaptado para ser adquirido por nosotros, a pesar de todas las imperfecciones cognitivas. 18. Dennett ( 1991) explora precisamente este territorio intermedio. Examino
268 1 Más allá
Sin duda, la verdad se encuentra a medio camino. Recientes conjeturas de varios científicos cognitivos (véase, por ejemplo, Newport, 1990) indican que ciertas características de los lenguajes naturales (como la estructura mor fológica) pueden estar orientadas a explotar efectos «de ventana» propor cionados por las limitaciones de la memoria y la atención típicas de los seres humanos jóvenes. Y Christiansen (1994) ha argumentado explícitamente, desde el punto de vista de la investigación conexionista, que la adquisición
El lenguaje: un artefacto definitivo 1 269
porqué diferir profundamente del cerebro de los animales superiores. En cambio, los seres humanos normales se benefician de una pequeña innova ción neurológica que, junto con un entorno increíblemente potenciador de un lenguaje público cada vez más adaptado a la inversa, ha conducido a las explosiones cognitivas de la ciencia, la cultura y el aprendizaje humanos. A la vaga y sugerente noción de la adaptación inversa se le puede dar un poco de cuerpo cuantitativo y computacional (aunque de una manera clara mente simplista). Hare y Elman (1995) han utilizado una «filogenia cultural» de redes conexionistas para construir un modelo, con cierto detalle de la se rie de cambios que caracterizaron la evolución desde el pretérito del inglés antiguo (hacia el año 870) hasta el pretérito del inglés moderno. Mostraron que esta evolución histórica se puede modelar, con cierto detalle, mediante una serie de redes neuronales donde las salidas de una generación se utilizan como datos de entrenamiento para la próxima. Este proceso produce cam bios en el mismo lenguaje a medida que éste se altera para reflejar los perfi les de aprendizaje de sus usuarios. En pocas palabras, esto es lo que sucede: una red original es adiestrada en las formas del inglés antiguo. Luego se adiestra otra red (aunque no a la perfección) a partir de las formas produci das por la primera. A continuación se utiliza esta salida para adiestrar otra red, y así sucesivamente. Lo crucial es que cualquier error que cometa una red cuando aprende a establecer correspondencias, pasan a formar parte del conjunto de datos de la siguiente red. Los patrones difíciles de aprender y los elementos que se parecen a otros con inflexiones diferentes, tienden a de saparecer. Como dicen Hare y Elman (ibíd., pág. 61): «Al principio, las cla ses [de verbos] difieren en su coherencia fonológica y en el tamaño de su cla se. Las pautas que inicialmente son menos comunes o están menos definidas son las más difíciles de aprender y tienden a perderse tras varias generacio nes de aprendizaje. Este proceso va en aumento a medida que la clase domi nante capta nuevos miembros y se convierte en un atractor cada vez más po deroso». Al estudiar así la interacción entre un conjunto de datos externos y los procesos de aprendizaje individual, Hare y Elman pudieron hacer algu nas predicciones bastante precisas (confirmadas por los hechos lingüísticos) sobre la evolución histórica del inglés antiguo al inglés moderno. La conse cuencia más importante para nuestros fines es que, en estos casos, los anda miajes mismos externos de la cognición se adaptan para prosperar mejor en el nicho proporcionado por los cerebros humanos. Por tanto, la comple mentariedad entre el cerebro biológico y sus accesorios y apoyos artificiales está impuesta por unas fuerzas coevolutivas que unen a usuarios y artefactos en un bucle virtuoso de mutua modulación.
270
1
Más allá
10.6 ¿Dónde acaba la mente y empieza el resto del mundo?23 Las complejidades de la dinámica usuario-artefacto nos invitan a refle xionar sobre un tema más general: cómo concebir la frontera entre un siste ma inteligente y el mundo. Como vimos en capítulos anteriores, esta fronte ra parece ser más plástica de lo que se había supuesto anterioramente: en muchos casos, unos recursos extracorporales seleccionados son parte im portante de unos procesos computacionales y cognitivos extendidos. Lleva da hasta el extremo, esta fug,1 de la mente hacia el mundo amenaza con re configurar la imagen fundamental que tenemos de nosotros mismos, ampliando nuestra visión de las personas para incluir, en ocasiones, caracte rísticas del entorno local. Probablemente, esta ampliación es más verosímil en casos donde intervienen como accesorios externos el texto escrito y la pa labra hablada, porque las interacciones con estos accesorios son omnipre sentes (en las sociedades cultas modernas), fiables y evolutivamente básicas. En estas culturas, los cerebros humanos dan por sentados estos soportes de texto y discurso con la misma seguridad con que dan por sentado que actúan en un mundo de peso, fuerza, fricción y gravedad. El lenguaje es una cons tante y, como tal, se puede confiar en él con toda seguridad como telón de londo contra el cual se desarrollan los procesos en línea de la computación neuronal. De la misma manera que un controlador de red neuronal diseña do para mover un brazo hacia un objetivo en el espacio definirá sus órdenes para tener en cuenta la elasticidad de los ni úsculos y los efectos de la grave dad, los procesos del razonamiento pueden aprender a tener en cuenta las ;1portaciones potenciales de la reorganización y la descarga textual, y de la rq1l'.tición y el intercambio vocal. Por tanto, las capacidades cognitivas ma dmas que identificamos como mente e intelecto se pueden parecer_más a la 11avcgación en barco (véase el capítulo 3) que a las capacidades del cerebro liiológico aislado. La navegación en barco emerge de la adecuada orquesta ,·i<Íll de un sistema extenso y complejo que comprende personas, instrumen1 os y prácticas. De la misma manéra, sospecho que gran parte de lo que iden.' l. 1 :11 la literatura filosófica, esta pregunta se presta a dos respuestas usuales. O seguimos I:" d,·1 ,1;11 c·acio1H:s. intuiti\·as de la piel y el cráneo. o suponemos que, en realidad, esta cuestión "· rd i,·,·c· ,il análisis del significado y procedemos a examinar los pros v contras de la doctrina
1.1 ¡•,ra11dl's rasgos) putnamianos según la cual «los significados, simplemente, no están en la ca l'ul 11am, 1975 l. Sin embargo mi propuesta es adoptar una postura distinta de estas dos "'l'.1111 l:1 ,11al los procesos cognitivos no respetan los límites de la piel o del cráneo. Es decir, .tli1111" 11 q11,· Li lllll·iún int11iti\·a di:'. la mente se debl'.rÍa desprender de sus tendencias internis1:1,. v .'I q11,· las razn11es par,1 ello no dependen del (discutible) papel de la referencia del mun ,1" n·;il I' dt· Lis condiciones dt· vcrclad para determinar d significado de símbolos mentales o lí1q•,i11,1 i,os. V,·asc· 111w ,·x¡Hisici<Ín ,1 fondo en CL,rk y Chalmcrs, 1998. lw1.,1» (
El lenguaje: un artefacto definitivo
1
271
tificamos como nuestras capacidades mentales en realidad pueden ser pro piedades de los sistemas más amplios, y extendidos en el entorno, de los que los cerebros humanos mismos son sólo una parte (importante). Esto es mucho decir y no espero convencer aquí a los escépticos. Pero creo que no es tan descabellado como puede parecer a primera vista. Des pués de todo, en general es bastante difícil trazar una línea divisoria clara entre un instrumento y su usuario. 24 Cuando tomamos una piedra para cas car una nuez, es evidente que esa piedra es un instrumento. Pero si un pá jaro suelta una nuez en pleno vuelo para que se rompa al chocar contra el suelo, ¿es el suelo un instrumento? Algunas aves tragan piedras pequeñas para facilitar la digestión: ¿son instrumentos estas piedras? ¿O quizá una vez tragadas simplemente pasan a formar parte del ave? ¿Es un instrumen to el árbol al que trepamos para escapar de un depredador? ¿ Y la tela de una araña? Propongo que el lenguaje público y sus apoyos en el texto y la notación simbólica no son diferentes de las piedras tragadas por las aves. En ambos casos, la respuesta a la pregunta «¿Dónde acaba el usuario y empieza el ins trumento?» es muy delicada. A la luz del conjunto global de nuestras discu siones anteriores, como mínimo estoy convencido de dos afirmaciones. La primera es que algunas acciones humanas se asemejan más a pensamientos de lo que parece a primera vista. Se trata de las acciones cuyo verdadero ob jetivo es alterar fas tareas computacionales a las que se enfrenta el cerebro cuando trata de resolver un problema: lo que Kirsh y Maglio llaman «accio nes epistémicas». La segunda afirmación es que ciertos daños causados al entorno pueden tener la misma relevancia moral que los daños causados a personas: al decir esto pienso especialmente en las personas con lesiones neurológicas (véanse los casos del capítulo 3 anterior) que consiguen salir adelante añadiendo a su entorno cotidiano unas capas especialmente densas de accesorios y apoyos externos. Me parece que alterar estos apoyos se pa recería más a un delito contra las personas que a un delito contra la propie dad. Por ejemplo, Clark y Chalmers ( 1998) describen el caso de una perso na con lesiones neurológicas que depende en grado extremo de un cuaderno que siempre lleva consigo y a cuyos contenidos se remite en numerosas si tuaciones cotidianas. En este caso, la destrucción gratuita del cuaderno ten dría un aspecto moral especialmente inquietante: es indudable que dañaría a la persona en el sentido más literal que se pueda imaginar. A la luz de estas inquietudes y del evidente valor metodológico (véanse los capítulos 3, 4, 6 y 8 anteriores)
272
1
Más allá
bro-cuerpo-mundo como totalidades computacionales y dinámicas integradas, estoy convencido de que (en ocasiones) es valioso tratar los procesos cognitivos como si se extendieran más allá de los estrechos confines de la piel y del cráneo. Y me pregunto si también se debería ampliar la noción intuitiva de la mente misma para abarcar una variedad de accesorios y apoyos externos; es decir, me pregunto si el sistema que solemos denominar «mente», en realidad es mucho más amplio que el que denominamos «cerebro». A primera vista, esta conclusión tan general puede parecer difícil de digerir. Creo que una razón de ello es que tendemos a confundir lo mental con lo consciente. Y aunque no pretendo afirmar en absoluto que la conciencia individual se extienda más allá de la cabeza, parece evidente que no todo lo que ocurre en el cerebro y constituye un proceso mental o cognitivo (en el sentido científico actual) está vinculado con un procesamiento consciente. 25 Quizá sea más verosímil suponer que lo que mantiene los verdaderos procesos mentales y cognitivos en la cabeza es una especie de transportabilidad. Es decir, nos inclinamos hacia una visión de lo que podría llamarse «lamente desnuda»: una visión de los recursos y operaciones que siempre podemos hacer intervenir en una tarea cognitiva, independientemente de cualquier otra oportunidad que el entorno local nos pueda facilitar o no. Comprendo bien este reparo. Parece evidente que el cerebro (o quizá, desde este punto de vista, el conjunto cerebro-cuerpo) es un objeto de estudio y de interés definido y genuino. Y lo que hace que sea así es, precisamente, el hecho de que abarque un conjunto central, básico, y transportable
25. El reflejo vestibular-ocular (RVO), por tomar solo un ejemplo de entre varias docenas de ellos, estabiliza la imagen del mundo en la retina para compensar el movimiento de la cabeza (véase, por eiemplo, Churchland y Sejnowski, 1992, págs. 353-365). Naturalmente, esta operación es crucial para la visión humana. Y la conciencia humana percibe el mundo de una forma que depende del funcionamiento correcto del RVO. Pero los pasos computacionales realizados por los circuitos del RVO no figuran entre nuestros contenidos conscientes. Si las transformaciones computacionales'cle las que depende el RVO se realizaran empleando algún dispositivo externo (una versión neuronal de un pulmón de acero o una máquina de diálisis), la interacción entre los estados conscientes y los cómputos del RVO podría seguir inalterada. Por tanto, sea cual sea el papel que desempeñe la consciencia (y sea cual sea el significado de este términc:r) en algún punto ele! bucle, ese papel mismo no se puede arrogar la potestad de rechazar la caracterización ele las transformaciones de algunos elatos externos como parte de nuestro procesamiento cognitivo. Algo así sólo tendría sentido si nos liáramos la manta a la cabeza y no consideráramos cognitivos los procesos que no pudieran ser ohieto de una introspección consciente. 1Si el lector cree que el RVO se encuentra en un nivel demasiado bajo para que se le considere un ejemplo de proceso no consciente pero genuinamente cognitivo, que lo sustituya por otro que le parezca mejor como, por ejemplo, los procesos ele recuerdo dirigidos por los contenidos o la habilidad, invisible a la introspección, que pueda subyacer a la capacidad para sahl'.r la rqda que sl'. dehe aplicar en l'.l paso siguiente de una deducción lógica).
El lenguaje: un artefacto definitivo
1
273
de recursos cognitivos. Estos recursos pueden incorporar acciones corporales como partes integrales de ciertos procesos cognitivos (como cuando, durante un cálculo difícil, utilizamos los dedos para descargar la memoria de trabajo). Pero no abarcarán los aspectos más contingentes de nuestro entorno externo que pueden estar presentes o no, como una calculadora de bolsillo. En última instancia, no creo que la transportabilidad pueda tener un peso conceptual suficiente, y por dos razones. En primer lugar, existe el riesgo de incurrir en una petición de principio. Si nos preguntamos por qué tendría que ser importante la transportabilidad para la constitución de ciertos procesos mentales o cognitivos, parece que la única respuesta es que deseamos que estos procesos vengan en un paquete separado y transportable individualmente. Pero esto sería volver a invocar el límite entre la piel y/o el cráneo cuando lo que se discute es, precisamente, la legitimidad de este límite en sí. En segundo lugar, sería fácil (aunque un poco tedioso para el lector) concebir varios casos problemáticos. ¿Qué ocurriría si alguien siempre llevara encima una calculadora de bolsillo? ¿Qué pasaría si algún día lleváramos estos dispositivos implantados en el cerebro? ¿Qué pasaría si tuviéramos «acoplamientos corporales» para una variedad de dispositivos como éstos y nos «preparáramos» cada día añadiendo dispositivos adecuados para la actividad de resolución de problemas prescrita para ese día? Tampoco la vulnerabilidad de estos dispositivos adicionales a ciertos desperfectos o daños concretos sirve para distinguirlos, porque el cerebro biológico también corre el riesgo de perder capacidades específicas para la resolución de problemas a causa de lesiones o traumas. Pero, en el fondo, quizá la causa más profunda de nuestras inquietudes sea esa entidad extraordinariamente enigmática a la que llamamos yo. 26 La supuesta extensión de los procesos cognitivos y mentales hacia el mundo, ¿implica una especie de «fuga» correlativa (ciertamente inquietante) del yo hacia el entorno local? Ahora parece (¡lo siento!) que la respuesta es «Sí y No». No, porque (como ya se ha admitido) los contenidos conscientes sobrevienen a los cerebros individuales. Pero Sí, porgue estos episodios conscientes son, como mucho, instantáneas del yo considerado como un perfil psicológico en desarrollo. Estoy dispuesto a admitir que los pensamientos, considerados única mente como instantáneas de nuestra actividad mental consciente, se pueden explicar totalmente mediante el estado del cerebro en cada momento. Pero el flujo del razonamiento y el pensamiento, y la evolución en el tiempo de las ideas y las actitudes, están determinados y explicados por la interacción íntima, compleja y continua entre cerebro, cuerpo y mundo. Nada me impide de26. Véase en Varela y otros (1991) una exposición interesante, aunque muy difrn,nte, de Lis implicaciones de un enfoque corpóreo y embebido para las concepcionl's del yo.
274 1 Más allá
cir que el hecho de que escriba un libro como éste responde a una caracterís tica genuina de mi perfil psicológico, a pesar de que el flujo y la forma
lle l·;1�t1:-..
El lenguaje: un artefacto definitivo 1 275
En el caso de la persona y el cuaderno, el aspecto crucial es que las en tradas del cuaderno desempeñan, en la conducta de la persona como agen te, la misma función explicativa 28 que una información codificada en la me moria a largo plazo. Las condiciones especiales mencionadas (accesibilidad, refrendo automático, etc.) son necesarias para garantizar este tipo de iso morfismo funcional. Sin embargo, aunque admitamos que este isomorfismo existe (algo que muchos no harán), puede que sea posible evitar la conclu sión radical del agente distribuido. Una conclusión alternativa (que conside ro igualmente aceptable) sería que el agente continúa encerrado dentro del envoltorio de la piel y el cráneo, pero que sus creencias, sus conocimientos y quizá otros estados mentales, ahora dependen de vehículos físicos que (en ocasiones) se pueden extender para incluir unas características seleccionadas del entorno local. Esta imagen mantiene la noción del agente como combi nación de cuerpo y cerebro biológico y, en consecuencia, nos permite decir -como seguramente deberíamos h-acer- que el agente, en ocasiones, mani pula y estructura esos mismos recursos externos con el fin de reforzar, des cargar o transformar aún más sus propias actividades básicas de resolución de problemas. Pero también permite que, a veces, este «alcanzar» el mundo suponga la creación de redes cognitivas y computacionales más amplias: re des cuya comprensión y análisis requiere aplicar los instrumentos y concep tos de la ciencia cognitiva a entidades híbridas más amplias que comprenden cerebros, cuerpos y una amplia variedad de procesos y estructuras externas. En resumen, me conformo con dejar que las nociones de yo y de agencia encajen donde sea. A fin de cuentas sólo afirmo que, como mínimo, tenemos buenas razones explicativas y metodológicas para aceptar (en ocasiones) una noción bastante liberal del alcance de los procesos cognitivos y computacio nales que permita explícitamente la diseminación de estos procesos por el cerebro, el cuerpo, el mundo y los artefactos. Entre estos artefactos destacan las diversas manifestaciones del lenguaje público. El lenguaje es, en muchos aspectos, el artefacto definitivo: es tan omnipresente que casi es invisible y su carácter es tan íntimo que no está claro si es un instrumento o una di mensión del usuario. Cualesquiera que sean los límites, como mínimo nos enfrentamos a una economía estrechamente vinculada donde el cerebro bio lógico está increíblemente potenciado por algunas de sus creaciones más ex trañas y recientes: palabras en el aire, símbolos en páginas impresas.
28. Véase un planteamiento a fonJo Je esta afirmaciún en Clark y Chalmers, 1998.
11
Mentes, cerebros y atunes: un resumen en salmuera
La capacidad para nadar de muchos peces y animales acuáticos, como los atunes y los delfines, es asombrosa. Estos seres superan de largo cualquier producto que la ciencia náutica haya podido producir. No sólo son magos de la maníobrabílidad: al parecer, su propulsión es totalmente paradójica. Por ejemplo, se estima que el delfín carece de la fuerza suficíente 1 para propul sarse a las velocidades que llega a alcanzar. En un intento de desenmarañar este misterio, dos expertos en dinámica de fluidos, los hermanos Míchael y George Tríantafyllou, se han visto conducidos a una interesante hipótesis: que la extraordinaria eficiencia natatoria de ciertos anímales se debe a la evo lución de una capacidad para explotar y crear fuentes adicionales de energía cinética en un entorno acuoso. Al parecer, estos animales explotan los remo linos, torbellinos y vórtices del agua para «turboalimentar» su propulsión y ampliar su capacidad de maniobra. En ocasiones, estos fenómenos aparecen en los fluidos de manera natural (por ejemplo, cuando una corriente de agua choca contra una roca). Pero la explotación de estas ayudas externas por parte de estos anímales no se acaba aquí. Por ejemplo, también pueden crear activamente una variedad de vórtices y gradientes de presión (sacudiendo la cola) que después utilizan para dar velocidad y agilidad a una conducta pos terior. Controlando y explotando de esta manera la estructura de su entorno local, estos animales pueden arrancar y girar con tal rapidez que, en campa1. La estimación de que el delfín es unas siete veces más débil de lo que debiera tiene su origen en el biólogo James Gray. Como indican Triantafyllou y Triantafyllou 0995, pág. 66), aún no es posible comprobar con rigor esta estimación. Pero realmente parece que los delfines generan una extraordinaria fuerza de propulsión a partir de unos recursos bastante limitados: de ahí los intensos esfuerzos de investigación dedicados recientemente a desentrañar los mis terios de la propulsión de los animales pisciformes. (Véanse Gray, 1968; Hoar y Randall, 1978, y Wu y otros, 1975, así como los estudios avanzados de los hermanos Triantafyllou.)
278 1 Más allá
ración, nuestros transatlánticos parecen torpes, pesados y lentos. «Con la ayuda de un desfile continuo de estos vórtices», dicen Triantafyllou y Trian tafyllou (1995, pág. 69), «es posible que la eficiencia natatoria de un pez lle gue incluso a superar el cien por cien.» Los buques y los submarinos no ob tienen estas ventajas: tratan el entorno acuático como un obstáculo que hay que superar y no buscan transformarlo para sus propios fines controlando y manipulando la dinámica de los fluidos que rodean el casco. Este relato sobre los atunes2 nos recuerda que los sistemas biológicos se benefician profundamente de la estructura de su entorno local. La mejor ma nera de concebir el entorno no es viéndolo únicamente como un ámbito de problemas a superar. El entorno también es, en un sentido fundamental, un recurso que cabe tener en cuenta en las soluciones. Como hemos visto, esta simple observación tiene algunas consecuencias de gran alcance. Antes que nada, debemos reconocer el cerebro por lo que es. No es el ce rebro de un espíritu incorpóreo convenientemente anclado a un armazón ambulante de carne y sangre. Al contrario, en esencia es el cerebro de un agente corpóreo capaz de crear y explotar estructuras en el mundo. Si con cebimos el cerebro como controlador de la acción corpórea, en ocasiones ve remos que dedica una considerable cantidad de energía a controlar y explo tar estructuras del entorno y no a solucionar un problema directamente y de una vez. Estas estructuras, moldeadas mediante una secuencia repetida de interacciones cerebro-mundo, pueden alterar y transformar el problema original hasta que adopte una forma manejable para los recursos limitados de una cognición orientada a la compleción de patrones, al estilo de las re ( ks neuronales. En segundo lugar, y como consecuencia de lo anterior, no deberíamos confundir el perfil de resolución de problemas de la mente corpórea y em lll'hida en el entorno físico y social, con el perfil de resolución de problemas del cerebro básico. El hecho de que los seres humanos pueden hacer lógica v ciencia no implica que el cerebro contenga un auténtico instrumento lógi rn o que codifique teorías científicas con un formato similar a su expresión lwhitual mediante palabras y frases. 1 En realidad, tanto la lógica como la 2 El atún robot ele aluminio anodizado ele 1,25 m de largo y con ocho segmentos que .,¡ i;mn· en la lámina 3, está siendo estudiado en un tanque de prueba ele! Massachusetts Insti1111c· , ,1 Tcchnology. Este trabajo se esboza en Triantafyllou y Triantafyllou, 1995. Algunos es111dios detallados anteriores se comunican en Triantafyllou y otros, 1993, y en Triantafyllou y "Iros, 1994. l. 1\q11í, la imagen corpórea y embebida simplemente va en apoyo de la antigua insisten ci:1 d,· los concxionistas en que la codificación neuronal no adopta la forma de frases. Véanse Lis vnsion,·s connionistas de este argumento, por ejemplo, en C:hurchlan
Mentes, cerebros y atunes: un resumen en salmuera 1 279
ciencia se basan en gran medida en el empleo y la manipulación de medios externos, especialmente los formalismos del lenguaje y la lógica, y las capa cidades de almacenamiento, transmisión y refinamiento proporcionadas por las instituciones culturales y el empleo de textos escritos y hablados. Como he argumentado, es mejor ver estos recursos como ajenos pero complemen tarios al estilo de almacenamiento y computación del cerebro. El cerebro no necesita malgastar su tiempo duplicando estas capacidades. En cambio, debe aprender a conectar4 con los medios externos para aprovechar al máximo sus virtudes características. En tercer lugar, ya es hora de que empecemos a encarar algunas cuestio nes bastante desconcertantes (¿o debería decir metafísicas?). Para empezar, la naturaleza y los límites del agente inteligente parecen ser más borrosos cada vez. En el cerebro ya no existe un ejecutivo central: 5 un verdadero jefe que organice e integre las actividades de múltiples subsistemas especializa dos. Y tampoco existe ya un límite nítido entre el pensador (el ingenio inte lectual incorpóreo) y su mundo. En lugar de esta reconfortante imagen de la mente, nos encontramos con una especie de caja de sorpresas repleta de agencias internas, cuyos papeles computacionales se suelen describir mejor incluyendo características del entorno local (tanto en los complejos bucles de control como en una amplia variedad de manipulaciones y transforma ciones de información). En vista de todo esto, en algunos casos quizá sea conveniente considerar el sistema inteligente como un proceso extendido en el espacio y en el tiempo que no está limitado por el tenue envoltorio de la piel y el cráneo. 6 Desde una perspectiva menos radical, las divisiones tradi cionales entre percepción, cognición y acción' parecen ser cada vez menos útiles. Con la desaparición del ejecutivo central, la percepción y la cognición parecen más difíciles de distinguir en el cerebro. Y la división entre pensa miento y acción se hace añicos en cuanto reconocemos que las acciones en el mundo real suelen desempeñar, precisamente, los tipos de funciones que más se suelen asociar con los procesos internos de cognición y computación. 4. Curiosamente, la repetición interna de frases (y otras maneras de construir modelos de medios externos) ocupa un lugar intermedio. En estos casos, realmente nos beneficiamos du plicando internamente la dinámica general de un medio externo. Pero, como vimos en el capí tulo 10, no necesitamos suponer que esta repetición implique la creación de un recurso compu tacional totalmente nuevo. En cambio, podemos utilizar tipos familiares de redes neuronales completadoras de patrones, entrenados mediante nuestras experiencias de manipulación de formalismos externos reales. Véanse más comentarios al respecto en el capítulo 10 de Church land, 1995, y en Rumclhart y otros, 1986. 5. Dennett ( 1991) ofrece una extensa y fascinante meditación sobre este tema. 6. Véase otra exposición al respecto en Clark y Chalmers, 1998. 7. Esto se reconoce cada vez más en la psicología dd desarrollo. Véansc los trahajos cxa minados cn el capítulo 2, especialmcntc Thclen y Smith, 1994, y Rutkowska, l lJlJl.
280 1 Más allá
En cuarto (y último) lugar, e independientemente de cualesquiera sutile zas metafísicas, todo esto implica unas consecuencias metodológicas urgen tes e inmediatas. En la medida en que la perspectiva corpórea y embebida esté bien encaminada, la ciencia cognitiva ya no se podrá permitir los sesgos individualistas y aislacionistas que caracterizaron los primeros decenios de su andadura. Ahora necesitamos una visión más amplia que incorpore múl tiples enfoques culturales y ecológicos además del núcleo tradicional de la neurociencia, la lingüística y la inteligencia artificial. Y necesitamos instru mentos nuevos con los que investigar efectos que abarcan múltiples escalas temporales, implican a múltiples individuos e incorporan complejas interac ciones ambientales. Es probable que, hoy por hoy, lo mejor sea combinar hábilmente enfoques basados en los sistemas dinámicos, la robótica en mundo real y simulaciones a gran escala (de efectos evolutivos y colectivos). Pero he argumentado que estas investigaciones se deben entrelazar cuida dosamente con la investigación neurocientífica en curso y anclarse, siem pre que sea posible, en el conocimiento del cerebro biológico. En la bús queda de este entrelazamiento, sería una insensatez echar por la borda el 11 úcleo de la comprensión científica cognitiva -que tanto esfuerzo ha costa do construir- basada en las nociones de representación interna y de compu tación. La verdadera lección de nuestras investigaciones sobre la cognición corpórea y embebida no es que tengamos éxito sii1 representación (o, peor aún, sin computación), sino que los tipos de representación interna y de rnmputación que empleamos han sido seleccionados para complementar los complejos entornos sociales y ecológicos en los que debemos actuar. Así pt1cs, seni conveniente que no ignoremos ni minimicemos la importancia de L'stos entornos más amplios. Y aquí estamos. Al final de un viaje largo y seguramente inacabado. He111os encontrado curvas, desvíos y -admitámoslo- uno o dos escollos que no lll'111os podido demoler y nos hemos limitado a rodear. Aún queda mucho por hacer, pero espero haber ata.do algunos cabos, haber tendido algunos pt1c11tes y haber destacado algunas cuestiones apremiantes. Y aunque puede sL·r qt1c -como Humpty Dumptyen la segunda parte de Alicia e¡¡ el país de /,11 111araui!las, Alicia a traués del espejo- cerebro, cuerpo y mundo tarden un 111n11trí11 de tie1t1po en reunirse otra vez, creo que vale la pena perseverar en L'SlL' l'lllpct'ío porque hasta que estas piezas no encajen en su sitio, no nos po drc111os wr tal como somos ni podremos apreciar la compleja confabulación q11L· suhyacc al éxito adaptativo
Epílogo: habla un cerebro 1
Soy el cerebro de Juan. 2 Físicamente no soy más que una masa de células de color grisáceo y de aspecto más bien mediocre. Mi superficie tiene un re lieve muy intrincado y poseo una estructura interna bastante diferenciada. Juan y yo mantenemos una relación muy íntima; de hecho, en ocasiones es difícil distinguirnos. Pero, a veces, Juan lleva esta intimidad demasiado lejos y se siente muy confundido acerca de mi papel y mí funcionamiento. Imagi na que organizo y proceso información de maneras que reflejan su propia perspectiva del mundo. En resumen: piensa que sus pensamientos son, en un
l. Las ideas y los temas presentados en esta peque11a fantasía deben mucho ,1 las visiones de Paul Churchland, Patricia Churchland, Daniel Dennett, Marvin Minsky, Gilbert Ryle, John Haugeland y Rodney Brooks. Al reunir estos temas he tratado de conseguir una divergencia máxima entre los hechos en el nivel del agente y los hechos en el nivel del enebro. No preten do afirmar dogmáticamente que la neurociencia actual postule inequívocamente una diver gencia tan radical. Varias de las cuestiones acerca de las cuales permito que el cerebro adopte una postura siguen siendo ,,bjeto de debate científico. (Véase una muestra de estl' debate en Churchland y Sejnowski, 1992, y Churchland y otros, l 994.) En vista del concepto literario adoptado, hac<:r referencias explícitas me parecía fuera de lugar; sin embargo, si las hiciera. in cluiría especialmente las siguientes: Dennett, 1978a; Dcnnett, 1991; Minsky, 1985; Church land, 1989; Haugeland, 1995; el artículo de R. Brooks, «Tntelligencc without representation», ilrtz/zcz
282 1 Estar ahí
sentido muy directo, mis pensamientos. Pero aunque en esto hay algo de ver dad, en realidad las cosas son bastante más complicadas de lo que Juan sos pecha, como trataré de demostrar. En primer lugar, Juan es ciego por naturaleza a la mayor parte de mis ac tividades cotidianas. Como mucho, capta algunos detalles ocasionales y som hras deformadas de mi verdadero trabajo. Hablando en general, estos efíme ros detalles sólo representan los productos de mi vasta actividad subterránea y no los procesos que los originan. Estos productos incluyen el juego de las imágenes mentales y los pasos en una serie lógica de pensamientos o ideas. Además, Juan accede a estos productos de una manera bastante impro visada. Lo que filtra hacia su consciencia es algo parecido a lo que aparece 1._·11 la pantalla de un ordenador. En los dos casos, lo que se muestra es un re sumen, hecho a medida, de los resultados de ciertos episodios de actividad interna: resultados que tienen una utilidad concreta para el usuario. Después de todo, la evolución no derrocharía tiempo y dinero (búsqueda y energía) 1._·n mostrar a Juan un registro fiel de ese funcionamiento interno, a menos qt1e pudiera ayudar a Juan a cazar, sobrevivir y reproducirse. Así que, a Juan, se le hace saber lo mínimo acerca de mis actividades internas. Todo lo que 11L'CL'sita saber es el significado global del resultado final de algunas activida des selectas: que parte de mí se encuentra en un estado asociado con la pre �rncia de un depredador peligroso y que lo más oportuno es huir, y otras co sas por el estilo. Por tanto, lo que Juan (el agente consciente) obtiene de mí �e parece bastante a lo que obtiene un conJuctor de los indicadores del sal pic;1dero: información sobre unos cuantos parámetros internos y externos que pueden influir productivamente en su actividad general de conducción. Existe un conjunto de importantes malentendidos en torno a la cuestión de la procedencia de los pensamientos. Juan me concibe como la f_uente de 1( >s productos intelectuales que identifica como sus pensamientos. Pero, ha hla11do en plata, yo no tengo pensamientos de Juan. Juan sí tiene pensa111irntos de Juan y yo no soy más que un elemento en el conjunto de proce sos v sucesos físicos que permiten que se produzca el pensar. Juan es un agl'llte cuya naturaleza se concreta mediante una compleja interacción en la S l'Sk sL·11cillo l'jclllplo: hace unos días, Juan estuvo sentado l'll s11 L·scritorio d11r;111tl' 11111L·l1(> til'111po y tr,1h,1jando muy duro. Al final se
Epílogo: habla un cerebro 1 283
levantó y salió del despacho, satisfecho con el trabajo del día. «Mi cere bro», reflexionaba (porque se precia de su físcalismo), «ha trabajado muy bien. Se le han ocurrido varias buenas ideas.» En la imagen que te nía Juan de los sucesos del día, yo era la fuente de esas ideas: ideas que él creía haber plasmado en papel por mera conveniencia y para evitar d ol vido. Naturalmente, agradezco que Juan me dé tanto mérito. Me atribu ye directamente los productos intelectuales terminados. Pero, al menos en este caso, el mérito se debería repartir un poco más. Sin duda, mi pa pel en el origen de estos productos intelectuales es vital: ¡ destruidme y -ciertamente- esta productividad intelectual se acabará! Pero mi función está constituida de una manera más delicada de lo que sugiere la sencilla imagen que tenía Juan. Esas ideas de las que tan orgulloso se sentía no surgieron totalmente formadas a partir de mi actividad. La verdad sea di cha, actué más bien como un factor mediador en algunos bucles comple jos de retroalimentación que abarcaban a Juan y a partes seleccionadas de su entorno local. Dicho claramente, me pasé el día en una variedad Je in teracciones íntimas y complejas con varios aditamentos externos. Sin ellos, los productos intelectuales terminados nunca hubieran tomado for ma. Si mal no recuerdo, mi papel fue acompañar a Juan mientras repasa ba un montón de anotaciones y materiales antiguos, y reaccionar a estos materiales produciendo unas cuantas críticas e ideas fragmentarias. Estas pequeñas respuestas se fueron almacenando en forma de más anotaciones en papeles y márgenes de hojas. Más adelante, intervine en la reorganiza ción de estas anotaciones al ponerlas en limpio, añadiendo nuevas reac ciones sobre la marcha a esas ideas fragmentarias. Este ciclo de lectura, respuesta y reorganización externa se repitió una y otra vez. Al final de la jornada, las «buenas ideas» cuyo mérito me había adjudicado Juan con tanta rapidez habían surgido como fruto de esas interacciones pequeñas y repetidas entre los diversos medios externos y yo. Por tanto, el mérito no fue tanto mío como del proceso extendido en el espacio y en el tiempo en el que yo había cumplido una función. Si lo pensara bien, es probable que Juan estuviera de acuerdo con esta descripción de mi papel aquel día. Pero yo le advertiría que hasta esto pue de ser ilusorio. Hasta ahora me he permitido hablar como si fuera un re curso interno unificado que contribuye a estos episodios interactivos. Esto es una ilusión reforzada por el presente dispositivo literario y que Juan pa rece compartir. Pero, una vez más, y en honor a la verdad, yo no soy una voz interna sino muchas. De hecho, soy tantas voces internas a la vez, que la me táfora misma de la voz interna debe ser ilusoria, porque sugiere la existen cia de unas subagencias internas bastante sofisticadas y que quizá poseen una conciencia rudimentaria de sí mismas. En realidad, yo sólo estoy for-
284 1 Estar ahí
mado por múltiples corrientes sin conciencia de procesos computacionales que se ejecutan en paralelo y que suelen ser relativamente independientes. Más que una masa de agentes minúsculos, soy una masa de «no agentes» sintonizados y sensibles a unas entradas concretas, hábilmente orquestados por la evolución para producir una conducta intencional con éxito en la mayoría de las entornos cotidianos. Por tanto, mi voz única sólo es un arti ficio literario. En el fondo, todos los errores que comete Juan son variaciones del mis mo tema. Cree que veo el mundo como él, que empaqueto las cosas como él y que pienso de la misma manera que él comunicaría sus pensamientos. Nada de esto es cierto. No soy el eco interno de las conceptualizaciones de Juan. Más bien soy la fuente, algo extraña, de las mismas. Para ver lo extra ño que puedo llegar a ser, basta con que Juan reflexione en las consecuen cias extraordinarias e inesperadas que pueden tener mis lesiones en los per files cognitivos de seres como él. Por ejemplo, si me lesionara podría provocar un deterioro selectivo de la capacidad de Juan para recordar los nombres de objetos manipulables pequeños y, sin embargo, dejar intacta su capacidad para nombrar objetos grandes. Y es que almaceno y recupero de una manera diferente la información con una gran carga visual y la infor mación que tiene una gran carga funcional; el primer método ayuda a dis tinguir objetos grandes y el segundo objetos pequeños. La cuestión es que esta faceta de mi organización interna es totalmente ajena a Juan: respeta necesidades, principios y oportunidades de las que Juan es totalmente in consciente. Por desgracia, en vez de tratar de comprender mis maneras de almacenar información tal como son, Juan prefiere imaginar que organizo mi conocimiento de la misma manera que él organiza el suyo, muy influido por las palabras particulares de su lenguaje. Así, supone que almaceno in formación en grupos que corresponden a lo que él denomina «conceptos» (en general, nombres que figuran en sus clasificaciones lingüísticas de suce sos, estados y procesos del mundo). Aquí, como de costumbre, Juan se da demasiada prisa en identificar mi organización con su propia perspectiva. Es indudable que almaceno y ac;:cedo a grupos de información que juntos, y siempre y cuando yo funcione normalmente, apoyan una amplia gama de empleos pro4uctivos de las palabras y una gran variedad de interacciones con los mundos físico y social. Pero los «conceptos» que tanto ocupan la imaginación de Juan, no son más que los nombres públicos de unas cajas de sorpresas que contienen unos conocimientos y unas aptitudes con unas ba ses neuronales múltiples y diversas. En lo que a mí respecta, los «concep tos» de Juan no se corresponden con nada especialmente unificado. ¿ Y por qué deberían hacerlo? Esta situación se parece a la de una persona que sabe construir barcos. Hablar de la capacidad de construir un barco es emplear
Epílogo: habla un cerebro 1 285
una frase sencilla para denotar un conjunto de aptitudes cuyas bases cogni tivas y físicas varían enormemente. Esta unidad sólo existirá en la medida en que ese conjunto concreto de aptitudes físicas y cognitivas tenga un sig nificado especial para una comunidad de agentes (marineros). Me parece que los «conceptos» de Juan son precisamente eso: nombres para comple jos de aptitudes cuya unidad no se basa en hechos sobre mí, sino en hechos sobre el modo de vida de Juan. La tendencia de Juan a proyectar ilusoriamente su propia perspectiva en mí, se extiende a su concepción de mi conocimiento del mundo externo. Cuando Juan da un paseo, se siente poseedor de una imagen tridimensional estable de su entorno inmediato. A pesar de las sensaciones de John, y o no dispongo de nada semejante. Yo me limito a detectar pequeñas regiones dc detalle en rápida sucesión, pasando de un aspecto de la escena visual a otro. Y no me molesto en almacenar todos esos detalles en un modelo interno quc requiera un mantenimiento y una actualización constantes, porque soy ex perto en repasar partes de la escena y volver a crear un conocimiento deta llado siempre que sea necesario. Como resultado de este truco y de otros pa recidos, la capacidad de Juan para desenvolverse en su entorno local es ta11 fluida que se cree poseedor de una visión interna constante de los detalles dc ese entorno. La verdad es que lo que Juan ve está más relacionado con las ca pacidades que yo le confiero para interaccionar constantemente, en tiempo real, con abundantes fuentes externas de información, que con el registro pasivo y permanente de información en función del cual él concibe su visión. La verdad, triste pero cierta, es que no tengo casi nada que ver con lo que Juan cree que soy. Seguimos siendo unos extraños a pesar de nuestra intimi dad ( o quizá a causa de ella). El lenguaje de Juan, sus introspecciones y su fiscalismo, lo inclinan a identificar en exceso mi organización con su propia perspectiva limitada y así no puede ver mi naturaleza fragmentaria, oportu nista y, en general, extraña. Se olvida de que, en gran medida, soy un dispo sitivo orientado hacia la supervivencia muy anterior a la emergencia de la ca pacidad lingüística, y así que mi función de promover la cognici<Í11 consciente y linguaforme no es más que una reciente actividad suplemrnla ria. Naturalmente, esta actividad es una raíz básica de sus falsas ideas. Al po seer un vehículo tan magnífico para la manipulación y la expresión compac ta y comunicable del conocimiento, Juan tiende a confundir las formas v convenciones de ese vehículo lingüístico con la estructura misma dc Li acl i vidad neuronal. Pero mientras hay vida hay (más o menos) esperanza. Últirnamc111c 11H· siento animado por la aparición de nuevas técnicas de invcstigaci<Í11, corno la obtención no invasiva de imágenes del cerebro, el cstudio de rcdcs 11L·111·011;1 les artificiales y la investigación de la robótica cn rnu11do rcal. l·'.slos l'Slll!lios
286 1 Estar ahí
y técnicas auguran una mejor comprensión de las complejas relaciones exis tentes entre mi actividad, el entorno local y la construcción del mosaico que constituye la sensación de yo. Mientras tanto no olvidemos que, a pesar de nuestra intimidad, Juan sabe realmente muy poco sobre mí. Imagina
3. Gracias a Daniel Dennett, Joseph (;ogul:'.n, Keith Sutherland, Da\'e Chalmers y a un evaluador anónimo por s,, ,,poyo, Sl!S consejos y sus sugerencias.
Bibliografía
Abraham, R. y Shaw, C., 1992, Dynamics-The Geometry o/ Behautor. Addison-Wesley. Ackley, D. y Littman, D., 1992, «Interactions between learning and evolution», en Artz/icf,¡/ Lije II, C. Langton y otros (comp.), Addison-Wesley. Adolph, K., Eppler, E. y Gibson, E ., 1993, «Crawling versus walking: Infants' perception of affor dances for locomotion on slopes», Child Development, 64, págs. 1.158-1.174. Agre, R., 1988, «The Dynamic Structure of Everday Life», tesis doctoral, Department of Elcctrical Engineering and Computer Science, Massachusetts Institute ofTechnology. Agre, P. y Chapman, D., 1990, «What are plans for?», en Designil1[!, Autonomous Agcf//1, I'. Maes (comp.), MIT Press. Albus, J. 1971, «A theory of cerebellar function», Mathematical Biosciences, 10, págs. 25-(, 1. Alexopoulos, C. y Mims, C., 1979, lntroductory Myco!og_y, Y ed., Wiley. Ashby, R., 1952, Design/é,r a Brain, Chapman & Hall (trad. cast.: Proyecto para un cerebro. l l)(,5). Ashby, R., 1956. Tntroductzón to Cybernet/cs, Wiley. Ashworth, J. y Dee, J., 1975, The Biology o/ Slime Molds, Edward Arnold. Ballard, D., 1991, «Anímate vision». Artz/iczál lntelligence, 48, págs. 57-86. Baum, C., 1993, «The Effects of Occupation on Behaviors of Persons with Senile Dcnwnria ol the Alzheimer's Tvpe and Their Carers», tesis doctoral, George \X'arren Brown Scl]l)ol ol Social Work, Washington University, St. Louis. Bechtel, W. y Richardson, R., 1992, Discovering Complexity. Decompositlon and Í,oc,zlz:<111011 "' Scientz/ic Research Strategies, Princeton University Press. Beck, B., 1980, Animal Too! Behavior.· The Use and Manufacture o/ Tools by Animal,. ( ;ada11,I. Beckers, R., Holland, O. y Deneubourg, J., 1994, «From local actions to global tasks: Stig mergy and collective robotics>>, en Artificial Lzfe ../, R. Brooks y P. Ma<:s (cornps. ). M IT Pres s. Beer, R., 1995a, «Computational and dynamical languages for autonomm1s agen rs». ,·11 M 111il as Motion, R. Port y T. van Gelder (comps.), MIT Press. Beer, R., 1995b, «A dynamical systems perspective on agent-cnvironmcnt intcraction», 11r11/1 cia! Intelligence, 72, págs. 173-215. Beer, R. y Chie!, H. 1993. «Simulations of cockroach locomotion ,111d c·srnpc». ,·11 ll111/u,'.1,,1/ Ncura! Networks 111 fouertebrali' Ncuroetho[ogv ,111d I
288 1 Estar ahí Beer, R., Ritzman, R. y McKenna, T. (comps.), 1993. Biolagical Neural Networks in lnvertebra te Neuroethology and Rabotics, Academic Press. Beer, R., Chie!, H., Quinn, K., Espenschied, S. y Larsson, R., 1992, «A distributed neural net work architecture for hexapod robot locomotion», Neural Computation 4, nº 3, págs. 356365. Belew, R., 1990, «Evolution, learning, and culture: Computational metaphors for adaptive al gorithms», Complex Systems, 4. págs. 11-49. Berk. L., 1994, «Why children talk to themselves», Scirntz/ic American, 271, nº 5, págs. 78-83. Berk, L. y Garvin, R., 1984, «Development of privare speech among low-income Appalachian children», Developmental Psychology, 20, nº 2, págs. 271-286. Bickerton, D., 1995, Lan guage and Human Behavior, University of Washington Press. Bivens, J. y Berk, L., 1990, «A longitudinal study of the development of elementary school chil · º dren's privare speech», Merrill-Palmer Quarterly, 36. n 4, págs. 443-463. Boden,M., 1988, Computer Models o/ Mind, Cambridge University Press. Boden,M., 1996, Ox/ord Readings in the Philosophy o/Artificial Lije, Oxford University Press. Bratman, M., 1987, Intentions, Plans and Practica! Reason, Harvard University Press. Bratman,M., Israel, D. y Pollack,M., 1991, «Plans and resource-bounded practica! reasoning», en Philosophy and AL Essays at the Interface, R. Cummins y J. Pollock (comps.),MIT Press. Brooks, R., 1991, «Intelligence without reason», en Proceedings o/ the 12th International ]oint Con/erence on Artificial Intelligence, Morgan Kauffman. Brooks, R., 1993, «A robot that walks: Emergent behaviors from a carefully evolved network», en Biological Neural Networks in Invertebrate Neuroethology and Rohotics, R. Beer y otros (comps.), Academic Press. Brooks, R., 1994, «Coherent behavior from many adaptive processes», en From Animal.r to Animats, 3, D. Cliff y otros (comps.),MIT Press. Brooks, R. y Maes, P., (comps.), 1994, Artzficial Lzfe, 4,MIT Press. Brooks, R. y Stein, L., 1993, «Building Brains for Bodies», memorándum 1.439, Artificial In telligence Laboratory,Massachusetts Instit•ite of Technology. Bruner, J., 1968, Processes in Cognitive Growth: I n/ancy, Clark University Press. Busemeyer, J. y Townsend, J., 1995, «Decision field theory », en Mind as Motion. R. Port y T. van Gelder (comps.),MIT Press. Butler, K., Interna! A//alrs: A Critique o/ Externalism in the Philosophy o/Mind, Kluwer, 1998. Campos, J., Hiatt, S., Ramsey, D., Henderson, C. y Svejda,M., 1978, «The emergence of fear on the visual cliff», en The Development o/ A/Ject, volumen 1, M. Lewis y R. Rosenblum (comps.), Plenum. Carruthers, P. (1996) Language, Thought and Consáousness.· An Essay in Philosophica! Psycho logy Cambridge University Press. Chambers, D. y Reisberg, D., l 985� «Can mental images be ambiguous?», ]ournal o/ Experi mental Psychology: Human Perception and Performance, 11, págs. 317-328. Changeux, J.-P., y Connes, A., 199.5, Conversations on Mind, Matter and Mathematics, Prince ton University Press. Chapman, D,., 1990, «Vision, Instruction and Action», informe técnico 1204, Artificial Intelli gence Laboratory,Massachusetts Institute of Technology. Christiansen,M., 1994, «The Evolution and Acquisition of Language», PNP Research Report, Washington University, St. Louis. Churchland, P.M., 1989, A Neurocomputational Perspective,MIT Press. Churchland, P.M., 1995, The Engine o/ Reason, the Seat o/ the Soul, MIT Press. Churchland, P. S. y Sejnowski, T., 1992, The Computational Brain, MIT Press. Churchland, P. S., Ramachandran, V. S. y Sejnowski, T. J., 1994, «A critique of pure vision», en Large-Scale Neuronal Theories o/ the Brain, C. Koch y J. Davis (comps.),MIT Press.
Bibliografía 1 289 Clark, A., 1986, «Superman; the image», Anafrsis, 46, nº 4, págs. 221-224. Clark, A., 1987, «Being there; why implementation matters to cognitive science», AJ Review l, nº 4, págs. 231-244. Clark, A., 1988a, «Superman and the duck/rabbit», Analysis 48, nº l, págs. 54-57. Clark, A., 1988b, «Being there (again); a reply to Connah, Shiels and Wavish», Artt/iáal Intc º !ligence Review 66, n 3, págs. 48-51. Clark, A., 1989, Microcognzt/011: Phi!osophy, Cogmtzve Sáence ami Parallel Distributcd Procc.r sing, MlT Press. Clark, A., 1993, Associative Engines. Connectionism, Concepts and Representationa! Changc, MlT Press. Clark, A., 1994, «Representational trajectories in connectionist learning», Minds ami Machi nes, 4, págs. 317-332. Clark, A., 1995, «Moving minds: Re-thinking representation in the heat of situated action», en Philosophical Perspectives, 9: Al Connectzónism and Philosophirnl Psychology, J. Tomhcr !in (comp.). Clark, A., 1996a, «Connectionism, moral cognition and collahorative problem solving», v11 Mind and Morals. Essays on Ethics and Cognitive Science, L. May y otros (comps.), M IT Press. Clark, A. (1996). «Philosophical foundations», en Handbook o/ Pcrception and Cognition, vo lumen 14: Artificial lntelligence and Computatlonal Psychology, M. Boden (comp.), Aca demic Press. Clark, A. y Chalmers. D., l 998, «The Extended Mind». Analysis, 58, págs. 7-19. Clark. A. y Karmiloff-Srnith, A., 1993, «The cognizer's innards: A psychological and philosop hical perspective on the development of thought», Mind and Lmguage, 8, págs. 487-519. Clark, A. y T hornton, C. ( 1997), «Trading spaces: Connectionism and the limits of birning», Behavioral and Brain Sciences, 20, págs. 57-90. Clark, A. y Toribio,] ., 1995, «Doing without representing?», Synthese, 101, págs. 401- 4 3 1. Cliff, D., 1994, «Al and a-life: Never mind the blocksworld», AISB Quarterly, 87, págs. 16-21. Cole, M., Hood, L. y McDermott, R., 1978, «Ecological niche picking», en Memory Oh1,·n·l'J Rememben11g in Natural Contexts, U. Neisser, (comp.) Freeman, 1982. Connell, J., 1989, «A Colony Architecture for an Artificial Creature», informe técnico 11 5 I, MIT Al Lab. Cottrell, G., 1991, «Extracting features from faces using compression networks», en <:01111,·c tionist Models: Proceedings o/ the 1990 Summer School, D. Touretzky y otros komps.), Morgan Kauffman. Crutchfield,J. y Mitchell, M., 1995, «The evolution of emergen! computation», en l'mu·<'d111,t'.1 o/ the Nationa! Academy o/ Science, 92, págs. 10.742-10.746. Culicover, R, y Harnish, R., (comps.), Neural Connections, Mental Computatlon, M IT l'rl'ss. Damasio, A., 1994, Descartes' Error, Grosset Putnam (trad. cast.: El error de Dc.1cart1·.r. ( :rí1 irn, 1996). Damasio, A. y Damasio, H., 1994, «Cortical systems for retrieval of concrete knowll'dgc: Tlll' convergence zone framework». en Large-Scale Neuronal Theorics o/ thc llrain, ( :. Ko,·I, v J. Davis (comps.), MIT Press. Damasio, A., Tramel, D. y Damasio, H., 1989, «Amnesia caused by herpes sirnplL'x ,·11cq,li:1li1i,. infarctions in basal forebrain, Alzheimer's disease and anoxia», en l lmzdhooÁ' o/ N,·1m,¡,, 1· chology, volumen 3, F. Boller y J. Grafman (comps.), Elsevicr. Damasio, A., Trame!, D. y Damasio, H., 1990, «Tndi\'iduals with socillp;irhi,· h,·h,1,·1"r, ª''"'' 1 by frontal damagc foil to rcspnnd autonornically ro social si i11111li,,. l>,·h,11•i,mil ,111,/ l!r,1111 Research, 4, págs. 81-94. Dam,1sio, H., (;rahowski, T., Frnnk, I{., CaLd,t1rda, 1\. v l)a1na,io, A. l'l'>·I, «Tlll' ITllll"II ni
290
1
Estar ahí
Phineas Gage: Clues about the brain from the skull of a famous patient», Science, 264, págs. 1.102-1.105. Davidson, C., 1994, «Common sense and the computer», .''iew Soátút, 142, Abril 2, p,ígs. 30-33. Davidson, D., 1986, «Rational animals», en Actions and Events, E. Lepore y B. McLaughlin (comps.), Blackwell. Davies, M. y Stone, T., (comps.), 1995, Mental Simulation: Evaluations and Applications. Blackwell. Dawkins, R., 1982, The Extended Phenotype, Oxford University Press. Dawkins, R., 1986, The B!Znd \Vatchmaker, Longman (trad. cast.: El relojero ciego, RBA, 1993). Dean, P., Mayhew, y Langdon, P., 1994, «Learning anJ maintaining saccadic accuracy: A model of brainstem-cerebellum interactions», journal o/ Cognitive Neuroscience, 6, págs. 117-138. Dennett, D,. 1978a, Brainstorms, MIT Press. Dennett, D., 1978b, «Why not he whole iguana?», Behavzóral and BrainSciences, 7. págs. 10.3104. Dennett, D., 1991, Consciousness Explained, Little, Brown (trad. cast.: La consciencia ex¡,lica da, Buenos Aires, Paidós, 1996). Dennett, D., 1993, «Labeling and learning», Mind and Language, 8, págs. 540-548. Dcnnett, D., 1995, Darwin 's Dangerous Idea: El'Olution and the Meanings o/ Lz/e, Simon and Schuster. Denzau, A. y North, D., 1995, «Shared Mental Models: ldeologies and Institutions», inédito. 1 )iaz, R. y Berk, L. (comps.), 1992, Private Specch FromSocial lntm1ction to Se/fRegulation, Erlbaum. Dona Id, lvl,. 1991, Origins of the l'vfodern Mmd, Harvard University Press. 1 )rctsk,'., F., 1988, Explai11ing Behavior: Rea.1011s in a World o/ Causes, MIT Press. 1 )rl'tskc·, F., 1994, «If you cm't make one you don't know how it works», enMidwestStudzés in Phi lornphy XIX: Philosophica! Naturalism, University of Notre Dame Press. 1 )rl'ylus, H., 1979, W hat Computers Can't Do, Bar¡ c:r & Row. 1 )r...yfus, H., 1991, Being-in-thc- World: A Commentary on Heidegger's Betng and Time, Division /, MIT Press. 1 >rvyfus. H. y Dreyfus, S., 1990, «\Xlhat is moralitv? A phenomenological account of the deve lop111ent of ethical experience», en Uniuersalism vs, Communitarianism, D. Rasmussen (rnmp.J, MlT Press. 1 :,lc-1111,m, e;., 1987, Neural Darwinism, Basic Books. l·:dclma11. G. y Mountcastle, V., 1978, The Mindfu! Brain, MIT Press. 1 :dwards. D., Baum, C. y Morrow-Howell, N., 1994, «Home environments of inner city elderly with dt>mentia: Do they facilitate or inhibir function?», Cerontologist, 34, nº 1, págs. 64. 1 :l11u11, J .. 1991. «Representation and st;ucture in connectionist models», en Cognilzve Modcls "/ .\¡,c<'Ch Processi11g, G. Altman (c9mp. ), MIT Press. 1 ·.l,na11, J. I 994, «Learning and development in neural networks: The importance of starting slllall», C:ognition, 48, págs. 71-99. I J111a11, .1 ., 1995, ,,Language as a dynamical system», en Mind as Motion, R. Port y T. van Geldn lrnmps.l. M!T Press. 1 ·,11:1\1, M., 1990, Visual Agnosia. MIT Press. 1 .11T, M., 1981. llow to Knou• thc TrueSlimeMo!ds, William Brown. h·i¡'.<'lll1a11111, 1:., 1977, «The art of artificial intelligence: l. Themes and case studies of know blgv v11gÍ11<.'t'ring», en Proceedings of the Fifch International Joint Conference on Artifi c1.1I lllkiligcllcc. h·ll,·ll1.111, 1 ). v Van l·:sscn. D., 1991, «l)ist rihutcd hicrarchial processing in primate visual cor1,·-'"· < _,.,.,.fmil e .·nrln, I. p,igs. I ,rl.
J.
Bibliografía 1 291 Fodor, J .. 1975, The Languagc o( Thought, Crowell (trad. cast.: El lmguaJe del pensamle11to, Alianza. 1984). Fodor. ]., 1986, Jndividualism and supervenience. Proceedmgs o/ the Anstotelian Society, Suppl. 60, págs. 235-263. Fikes, R. y Nilsson, N., 1971, «STRIPS: A new approach to the application of theorem proving to problem solving», Artz/záal Intelligence, 2, págs. 189-208. Fodor, J. y Pylyshyn, Z., 1988, «Connectionism and cognitive architecture», Cognition, 28, págs. 3-71. Friedman, M., 1953, Essays in Positive Economics, lJniversity of Chicago Press (trad. cast.: En sayos sohre economía positiva, Gredas, 1967). Gallistel, C., 1980, The Organization o/ Behavior, Erlbaum. Gauker. C., 1990, «How to Iearn a language like a chimpanzee», Philosophical Psychology, 3, nº 1, págs. 31-53. Gauker, C., 1992, «The Lockean theory of communication», Noíis, n º 26, págs. 303-324. Gesell, A., 1939, «Reciproca! interweaving in neuromotor development»,Journal o/Compara tive Neurology, 70, págs. 161-180. Gibson. J. J, 1979, The Ecological Approach to Visual Perception, Houghton Mifflin. Gibson. J. J., 1982, «Reasons for realism», en Sc!ected Essays o/James J. Gzbson, E. Reed y R. Jones (comps.), Erlbaum. Gibson, K. y lngold, T. (comps.), 1993, Tools, Language and Cognition in Human Evo!utlon, Cambridge University Press. Gifford, F.. 1990, «Genetic traits», Bzólogy and Philosophy, 5, págs. 327-347. Giunti, M.. 1996, «Is Computationalism the HarJ Core of Cognitive Science?», ponencia pre sentada en Convego Triennale SILFS, Roma. Gluck, M. y Rumelhart, D. (comps.J, 1990, Neurosczence and Conncctzonist Theory, Erlbaum. Gode, D. y Sunder, S., 1992, «Allocative Efficiency of Markets with Zero lntelligence (Zl) Tra ders: M,ukets as a Partía] Substitute for Individual Rationality», Documento de trabajo nº 1992-16, Carnegie Mellon Graduare School of lndustrial Administration. Goldberg. D., 1989, Genetzc Algorithms in Search, Optimization, and Machine Learning, Ad dison-Wesley. Go!Jman. A .. 1992, «In defense of the simulation theory», Mind and Language, 7, nº 1-2, págs. 104-119. Gopalkrishnan, R., Triantafyllou, M. S., Triantafyllou, G. S. y Barren, D., 1994, «Active vorticity control in a shear flow using a flapping foil», ]ournal o/ Fluid Dynamics, 274, págs. 1-21. Gordon. R., 1992, «The simulation theory: Objections and misconceptions», Mind and Lan guagc. 7, nº 1-2, págs. 1-33. Grasse, P. P.. 1959, «La Reconstruction du NiJ et les Coordinations lnter-Individuelles chez Be !licos1tcrmes Natalensls et Cubitermes sp. La Theorie de la Stigmergie: Essai D'interpretation des Termites Constructeurs», Insect Soczctles, 6, págs. 41-83. Gray, J., 1968, Anima! Locomotion, Weidenfeld & Nicolson. Graziano, M., Anderson, R. y Snowden, R., 1994, «Tuning of MST neurons to spiral morions», Journa! o/Neuroscience, 14, págs. 54-67. Greene, P. H., 1972, «Problems of organization of motor systems», en Progress in Theoretical Biolog,y. volumen 2, R. Rosen y F. Schnell (comps.), Academic Press. Gregory, R. 1981, Mind in Science, Cambridge University Press. Grifford, F., 1990, «Genetic traits», Biology and Phi!osophy, 5, págs. 327-347. Haken, H., Kelso, J. y Bunz, H., 1985, «A theoretical model of phase transitions in human hanJ movements», Biological Cybernetics, 51, págs. 347-356. Hallam, J. y Malcolm, C. A. (en prensa), «Behavior, perception, action and intelligence: the view from situatcd rohots», Phi!osophical Tr,mscript1 o( thl' Royal Socictv, Londres.
292 1 Estar ahí 1 lardcast!e, V. ( [995), «Computatio1ulism», Sy11these, 102, págs. l-15. 1 larc, M. y El man, J., 1995, «Learning and morphological change». Cognition, 56, págs. 61-98. l larnad, S. (comp.), 1994, «Special issue on "What is Computation?"», Minds and Machines, 4, nº 4, p,ígs. 377-488. 1 lar\'ey, I., Husbands, P. y Cliff. D., 1994, «Seeing the light: Artificial evolution, real \·ision», en From Animats to Animals, 3, D. Cliff y otros (comps.), MIT Press. l laugeland,J ., 1981, «Semantic engines: A introduction to mind design», en Mind Design: Phi losophy, Psychology, Artificial lntelligence, Haugeland (comp.), MIT Press. 1 L1ugeland, J., 1991, «Representational general», en Phi!osophy ami Connectionist Theory, W. Ramsey y otros (comps.), Erlbaum. [ laugeland, J., 1995, «Mind embodied and embedded», en Mind and Cognition, Y.-H. Houng v J.-C. Ho (comp.), Taipei: Academia Sínica. 1 L1yL'S, P., 1979, «The naive physics manifesto», en Expert Systems in the Microelectronic Age, D. Michie (comp.), Edinburgh University Press. l lchb, D., 1949, The Organization o/ Behavior, Wiley (trad. cast.: Organización de la conducta, Debate, 1985). 1 kidegger, M., 1927, Being and Time (traducción), Harper and Row. 1961 (trad. cast.: El ser y el tiempo, FCE, 1980). 1 lilditch, D., 1995, «At the Heart of the World: Maurice Merleau-Ponty's Existential Pheno rnenology of Perception and the Role of Situated and Bodily Intelligence in Perceptually C uided Coping», tesis doctoral, Washington University, St. Louis. l lolstadtcr, D., 1985, Metamagical Themas: Questing/or the Essence o/Mind and Pattern, Pen guin. l logan, N., Bizzi, E., Mussa-Ivaldi, F. A. y Flash, T., 1987, «Controlling multijoint motor he l,;1\'Íor». ExC'rcise ami Sport Science Reviews, 15, págs. 153-190. l lol land, J., 1975, AdaptatzOn in Natural and Artificial Systems, University of Michigan Press. l lookl'I', C:., Penfold, H. y Evans, R., 1992, «Control, connectionism and cognition: Towards a 11,·w rc¡iularory paradigm», British Journal for the P l-i!osophy o(Science, 43, n" 4, págs. 517'5 $(,. l l111cl1i11s, E., 1995, Cognltion in the Wild, MIT Press. l l 111 ,l,i ns, E. y I Iazelhurst, B., 1991, «Learning in the cultural process», en Arti/iaal Lzfe JI, C. 1 ,111gtun y otros komps.), Addison-\Vesley. 1 .1, k, ·11dol l, J{. ( 1996), «How language helps us think», Pragmatics and Cognitwn, 4, págs. 1.'4 '·" ol ,. 1 :., 1977, «Evolution and tinkering», Sácnce, 196, nº 4.295, págs. 1.161-1. 1 66. l .11 "' "' IZ., .Jordan, M. y Barto, A., 1991, «Task decomposition through competitíon in a rno , I, dar n,nnl'ctionist architecture: The what and where visual tasks», Cognitive Science, 15, • p:1gs. 219-250. ol is, [(, )cnd,111, M., Nowlan, S. y Hinton, G., 1991, «Adaptive mixtures of local experts», 1 ·" N,·11r,il Com¡,utatirm, 3, págs. 79 87. klkrso11, [). ( :olli11s, R., Cooper, C., Dyer, M .. Flowers, M., Korf, R., Taylor, C. y Wang, A., l '!'i 1, «l·:vnl11tion as a thcme in artificial life», en Proceedings o/ the Second Con/erence on lr11/iu,il l.1/,·, C. Langton y D. farrner (comps.), Addison-Wesley. ¡,,¡"""11, 1\1.. l ')87, /he Hody in the Mind: The Bodily Basis o/ Imagination, Reason and Mea11!!1.1;. l li1i\'LTsity of Chicago Press (trad. cast.: El cuerpo en la mente: Fundamentos corpo r,iln J,·I 11)',111/icado, la imaginación y la razón, Debate, 1991). 1<>1111,<>11. M.. MaL's, !'. y l),1rrcll, T., 1994, «Evolving visual routines», en Artt/icitzl Lz/e 4, R. l\tt><>ks v I'. M:ll'S ko111ps.), l\l]T Press. 1, ,, d.111, M., / '>X(,. «Serial ( lrdcr: A 1':1ralkl Distrihuted Processing Approach», informe 8.604, l 11,1 i 1111 ,· 1 "' ( :og11it Ívl' Sci,·1JC,·, l 111 ivLTsÍ I y o/· ( :,diforni,1. San Diego.
J.
Bibliografía 1 293 Jordan, M., Flash, T. y Arnon, Y., 1994, «A model of the learning of arm trajectories from spa tial deviations», ]ournal o/ Cognitive Neurosciencc, 6, nº 4, págs. 359-3 76. Kaelbling, L., 1993, Learning in Embedded Systems, MIT Press. Kagel, J., 1987, «Economics according to the rat (and pigeons too)», en Laboratory Experi menta/ion in Economics: Six Points o/ \'iew, A. Roth (comp.), Cambridge University Press. Kandel, E. y Schwarz, J., 1985, Principies o/ Neural Science, Elsevier. Karmiloff-Smith, A., 1979, A Functional Approacb to Cbild Language, Cambridge University Press (trad. cast.: Más allá de la modemidad, Alianza, 1994). Karmiloff-Smith, A., 1986, «From meta-process to conscious access», Cognition, 23, págs. 95-147. Karmiloff-Smith, A., 1992, Beyond Modularlty. A Developmental Perspective On Cognitive Science, MIT Press (trad. cast.: Más allá de la modernidad, Alianza, 1994). Kauffman, S., 1993, The Origins o/Order. Sel/-Organizatzón and Selection in Euolutzón, Oxford University Press. Kawato, M., y otros, 1987, «A hierarchical neural network model for the control and learning of voluntary movement», Bzólogical Cybernetics, 57, págs. 169-185. Kelso, S., 1995, Dynamic Pattenzs, MIT Press. Kirsh, D., 1991, «\X'hen is information explicitly represented?», en In/ormation Thought and Content, P. Hanson (comp.), UBC Press. Kirsh, D., 1995, «The intelligent use of space», Artzficial Intelligence, 72, págs. 1-52. Kirsh, D. y Maglio, R., 1991, «Reaction and Reflection in Tetris», informe de investigación D015, Cognitive Science Department, University of California, San Diego. Kirsh, D. y Maglio, P., 1994, «On distinguishing epistemic from pragmatic action», Cognitiue Science, 18, págs. 513-549. Kleinrock, L. y Nilsson, A., 1981, «On optima! scheduling algorithms for timeshared systems», ]oum,zl o/ the ACM, 28, pág. 3. Knierim, J. y Van Essen, D., 1992, «Visual cortex: Cartography, connectivity and concurrent processing», Current Opinion in Neurohiology, 2, págs. 150-155. Koza, J., 1991, «Evolution an
294 1 Estar ahí Mackay, D., 1973, «Visual stability and voluntary eye movements», en Handbook o/ Sensory Physiology, volumen VII/3a, R. Jung (comp.), Springer-Verlag. Maes, P., 1994, «Modeling adaptive autonomous agents», Artificial Lz/e, 1, nº 1-2, págs. 135-162. Magnuson, J.]., 1978, «Locomotion by scobrid fishes: Hydromechanics morphology and beha vior», en Fúh Physiology, W Hoar y D. Randall (comps.), Academic Press. Malone, T., Fikes, R., Grant, K. y Howard, M., 1988, «Enterprise: A markerlike task schedu ler for distributed computing environments», en The Ecology o/ Computation, B. Huber man (comp.), North-Holland. Marr, D., 1969, «A theory of cerebellar cortex», ]ournal o/ Physiology, 202, págs. 437-470. Marr, D., 1982, Vision, Freeman (trad. cast.: La visión, Alianza, 1985). Mataric, M., 1991, «Navigating with a rat brain: A neurobiologically inspired model for robot spatial representation», en From Animals to Animats 1, (comps.), J.-A. Meyer y S. Wilson, MIT Press. Maturana, H. y Varela, F., 1987, The Tree o/ Knowledge: The Biological Roots o/ Human Un derstanding, New Science Library (trad. cast.: El árbol del conocimiento: Las bases biológi ms del conocimiento humano, Debate, 1989). l'vkCauley, J., 1994, «Finding metrical structure in time», en Proceedings o/ the 1993 Conneclionist Models Summer School, M. Mozer y otros (comps.), Erlbaum. Me< :auley, R. (comp.), 1996, The Churchlands and Their Critics, Blackwell. Me< :lamrock, R., 1995, Existential Cognition, University of Chicago Press. Md :Jelland,J., 1989, «Parallel distributed processing Implications for cognition and develop ment», en Parallel Distributed Processing: Implications /or Psychology and Neurobiology, R. Morris (comp.), Clarendon. Md :lclland, J., Rumelhart, D. y Hinton, G., 1986, «The appeal of parallel distributed proces sing», en Parallel Distributed Processing: Explorations in the Microstructure o/ Cognition, volumen 1: Foundations, D. Rumelhart y otros (comps.), MIT Press (trad. cast.: «El atrae ' ivo del procesamiento distribuido en paralelo», en Introducción al procesamiento distri /,11ido en paralelo, Alianza, 1992). M, < .01,kie, G., 1979, «On the role and control of eye movements in reading», en Processing o/ \'111h!c Language, P. Kolers y otros (comps.), Plenum. Me< :onkic, G., 1990, «Where Vision and Cognition Meet», ponencia presentada en el HFSP \\'orkshop on Object and Scene Perception, Leuven, Bélgica. /\k< :onkic, G y Rayner, K., 1976, «Identifying the span of the effective stimulus in reading: Lite r:11111T rcview and theories of reading», en Theoretical Models and Processes o/ Reading, H. Si11¡•,l'r y R. Ruddell (comps.), International Reading Association. 1\1, < :ulloch, W. y Pitts, W., 1943, «A logical calculus the ideas immanent in nervous activity», !>11/lc1111 o/ Mathematical Geophysics, 5, págs. 115-133. l'vld; r:rn•, M. B., 1945, The Neuromuscular Maturation o/ the Human Infant, Columbia Uni ,.l'rsi I y l'ress. M, N,n1gh1nn, B., 1989, «Neuronal mechanism for spatial computation and information stora ¡•,,·». rn Neura! Connections, Mental Computation, L. Nade! y otros (comps.), MIT Press. M, N,n,gh:on, B. y Nade!, L., 1990, «Hebb-Marr Networks and the neurobiological represen1 :11 ion ,,J .1ction in space», en Neuroscience and Connectionist Theory, M. Gluck y D. Ru nH·lhart (rnmps.), Erlbaum. /\lrnon, I·:., y Belew, R., 1994, «Evolving sensors in environments of controlled complexity», ,." 1lr11/iua! U/e, 4, R. Brooks y P. Maes (comps.), MIT Press. l'v1nk:tll l'onty, M., 1942, LaStructure du Comportment, Presses Universitaires de France, tra ,l,1l'l'i,111 al ingle·s: ThcS!ructure o(Behavior (Beacon, 1963) (trad. cast.: La estructura del ,0111¡,or/11111/1•11/o, 1 lachette, 1976). l'v1' .,lt,,11, 1 'olll v. M., J 94 5, Phc111J111,·1wloJ!J<' de la Pcrception, París: Gallimard, traducción al in-
Bibliografía 1 295 glés: Phenomenology o/ Perception (Routledge y Kegan Paul, 1962) (trad. cast.: Fenome nología de la percepción, Península, 1997). Michie, D. y Johnson, R., 1984, ]'he Creative Computer, Penguin. Miller, G. y Cliff, D., 1994, «Protean behavior in dynamic garues: Arguments for the co-evo lution of pursuit-evasion tactics», en From Animals to Animats, 3, D. Cliff y otros (comps.), MTT Press. Miller, G. y Freyd, J., 1993, Dynamic Mental Representations o/ Animate Motion. Cognitive Science Research Paper 290, University of Sussex. Millikan, R., 1984, Language, Thought and Other Biological Categories, MIT Press. Millikan, R., 1994, «Biosemantics», en Mental Representation. A Reader, S. Stich y T. Warfield (comps.), Blackwell. Millikan, R., 1995, «Pushmi-Pullyu» Representations, en Philosophical Perspectives 9: AJ, Con nectionism and Phzlosophical Psychology, J. Tomberlin (comps.). Minsky, M., 1985, The Society o/ Mind, Simon & Schuster (trad. cast.: La sociedad de la mente, Galápagos, 1986). Mitchell, M., Crutchfield, J. y Hraber, P., 1994, «Evolving cellular automata to perform computa tions: Mechanisms and impediments», Physician D, 75, págs. 361-391. Morrissey, J. H., 1982, «Cell proportioning and pattern formation», en The Development o/ Dictyostelium discoideum, W. Loomis (comp.), Academic Press. Motter, B., 1994, «Neural correlates of attentive selection for color or luminance in extrastria te area V4»,Journal o/Neuroscience, 14, págs. 2.178-2.189. Nade!, L., Cooper, L., Culicover, P., y Harnish, R. (comps.), 1989, Neural Connections, Mental Computations, MIT Press. Neisser, U., 1993, «Without perception there is no knowledge: Implications for artificial inte lligence», en Natural and Artz/icial Minds, R. Burton (comp.) , State University of New York Press. Newell, A., 1990, Unz/zéd Theories o/ Cognition, Harvard University Press. Newell, A. y Simon H., 1972, Human Problem Solving, Prentice-Hall. Newell, A. y Simon, H., 1981, «Computer science as empírica! inquiry», en Mind Design, J. Haugeland (comp.), MIT Press. Newport, E., 1990, «Maturational constraints on language learning», Cognitive Science, 14, págs. 11-28. Nolfi, S., Floreano, D., Miglino, O. y Mondada, F., 1994, «How to evolve autonomous robots: different approaches in evolutionary robotics», en Artificial Lije, 4, R. Brooks y P. Maes (comp.), MIT Press. Nolfi, S., Miglino, O. y Parisi, D., 1994, «Phenotypic Plasticity in Evolving Neural Networks», informe técnico PCIA-94-05, CNR Institute of Psychology, Roma. Nolfi, S. y Parisi, D., 1991, «Auto-Teaching: Networks That Develop Their Own Teaching In put», informe técnico PCIA91-03, CNR Institute of Psychology, Roma. Norman, D., 1988, The Psychology o/ Everyday Things, Basic Books. North, D., 1993, «Economic Performance Through Time», texto del discurso de aceptación del Premio Nobel de Economía. Norton, A., 1995, «Dynamics: An introduction», en Mind as Motion, R. Port y T. van Gelder (comps.), MIT Press. O'Keefe, J., 1989, «Computations the hippocampus might perform», en Neural Connections, Mental Computations, L. Nade! y otros (comps.), MIT Press. O'Regan, J., 1990, «Eye movements and reading», en Eyc Movcmcnt.1· and 'f'hcir Role in Visual and Cognitivc Proccssc1, E. Kowln (comp.), l·:lscvier. O'Regan, K., 1992, «Solving thc "real" mystnics lli vis11al pncq1tilln: Thc world asan outsi dc nwmorv», C:,11111ili1111 /1111m11! 11/l'svd",!11.�v. 4(,, p,ígs. 4(,1 4S8.
296 1 Estar ahí Oyama, S., 1985, The Ontogeny of Information: Developmental Systems and Evolution, Cam bridge University Press. Pearson, K., 1985, «Are there central pattern generators for walking and flight in insects?», en Feedback and Motor Control in Invertebrates and Vertebrales, W. Barnes y M. Gladden (comps.), Croom Helm. Petroski, H., 1992, «The evolution of artifacts», American Scientzst, 80, págs. 416-420. Piaget, J., 1952, The Origins of Inte!ligence in Children, International University Press (trad. cast.: El nacimiento de la inteligencia en el nzno, Crítica, 1985). Piaget, J., 1976, The Grasp of Consciousness: Action and Concept in the Young Chzld, Harvard University Press (trad. cast.: La toma de conciencia, Morara, 1981). Pinker, S., 1994, The Language Instinct. Morrow (trad. cast.: El instinto del lenguaje, Alianza, 1995). Plunkett, K. y Sinha, C., 1991, «Connectionism and developmental theory», Psyhkologisk Skrz/tserie Aarhus, 16, págs. 1-34. Polit, A. y Bizzi, E., 1978, «Processes controlling arm movements in monkeys», Science, 201, págs. 1.235-1.237. Port, R., Cummins, F. y McCauley, J., 1995, «Naive time, temporal patterns and human audi tion», en Mind as Motzón, R. Port y T. van Gelder (comps.), MIT Press. Port, R. y van Gelder, T., 1995, Mind as Motion: Explorations in the Dynamics of Cognition, MIT Press. Posner, M. y Rothbart, M., 1994, «Constructing neuronal theories of mind», en Large-Scale Neuronal Theories of the Brain, C. Koch yJ. Davis (comps.), MIT Press. Preston, B., 1995, «Cognition and Too! Use» (borrador l. Putnam, H., 1975, «The meaning of "meaning"», en Mind, Language and Reality, H. Putnam (comp.), Cambridge University Press (trad. cast.: «El significado de "significado"», en L. M. Valdés Villanueva (comp.) La búsqueda del significado. Lecturas de filosofía del lengua je, Tecnos, 1991). Pylyshyn, Z., 1986, Computation and Cognition. MIT Press (trad. cast.: Computación y conoci miento, Debate, 1988). Quinn, R. y Espenschied, K., 1993, «Control of a hexapod robot using a biologically inspired neural network», en Bzólogical Neural Networks in Invertebrate Neuroethology and Robo tics, R. Beer y otros (comps.), Academic Press. Rayner K., Well, A. y Pollarsek, A., 1980, «Asymmetry of the effective visual field in reading», Perceptua! Psychophysics, 27, págs. 537-544. Resnick, M., 1994a, «Learning about life», Artt/icial Lz/e, 1, págs. 229-242. Resnick, M., 1994b, Turtles, 1'ermites, and Traffic ]ams: Explorations in Massive!y Para!lel M1 croworlds, MIT Press. Rítzmann, R., 1993, «The neural organization of cockroach escape and its role in context-dc pendent orientation», en Bzo!ogica! Neura! Networks in Invertebrate Neuroethology a11J Robotics, R. Beer y otros (comps.), Academic Press. Rosenblatt, E., 1962, Principies of Neurodynamics, Spartan Books. Rovee-Colliet, C., 1990, «The "memory system" of prelinguistic infants», en The Dcvclop111ml and Neural Bases of Higher Cognitive Functions, A. Diamond (comp.), New York J\c1 demy of Sciences. Rumelhart, D. y McC!ellandJ., 1986, «On learning the past tenses of English vcrhs», en l'11r,1 lle! Distributed Processing: Explorations in the Microstructurc o/ Cog1útúm, volu111c11 2: / 'I 1' chological and Biological Models, J. McClelland y otros (comps.), M 11' l'rl'ss. Rumelhart, D., Smolensky, P., Me( :Idland,.J. y I línton, ( ;,, J 986, «Schc111a1a and sn111c111ial 1!1<>11¡',lll processes in PDP modds», en /Jara/le! /)i,1rih11tccl l'rncns111g /:x¡,!of'll/10111 /111/,,· M1,n!l//'I!, 111 re ofC:ogni//on, D. R1111wlharl yolros lco111ps.), MIT J>r,·ss llrad. casi.: «J·:sq11,·111as v pron·s<>',
Bibliografía 1 297 de pensamiento secuencia en los modelos PDP», en Introducción al Procesamiento Distri
buido en Paralelo, Alianza, 1992).
Rutkowska, J., 19R4, «Explaining Infant Perception: Insights from Artificial Intelligence», Cognitive Studies Research Paper 005, University of Sussex. Rutkowska, J., 1986, «Developmental psychology's contribution to cognitive science», en Ar tificial Intelligcnce Society, K. Gill (comp.), Wiley. Rutkowska,J., 1993, The Computational In/ant, Harvester Wheatsheaf. Saito, F, y Fukuda, T., 1994, «Two link robot hrachiation with connectionist Q-learning», en Fmm Animals to Animat.,, 3, D. Cliff y otros (comps.), MIT Press. Saltzman, E., 1995, «Dynamics and coordinate systems in skilled sensorimotor activity», en Mind as Motion, R. Port y T. van Gelder (comps.), MIT Press. Salzman, C. y Newsome, W., 1994, «Neural mechanisms for forming a perceptual decision», Sczénce, 264, págs. 231-237. Satz, D. y Ferejohn,J., 1994, «Rational choice and social theory»,journal o/Philosophy, 9.102, págs. 71-87. Schieber, M., 1990, «How might the motor cortex individuare rnovements?», Trends in Ncu roscience, 13, nº 11, págs. 440-444. Schieber, M. y Hibbard, L., 1993, «How sornatotopic is the motor cortex hand area?», Scien ce, 261, págs. 489-492. Shields, P. J. y Rovee-Collier, C., 1992, «Long-term memory for context-specific category in formation at six rnonths», Child Devclopment, 63, págs. 245-259. Short!iffe, E., 1976, Computer Bascd Medica! Consultations: MYCIN, Elsevier. Simon, H., 1969, «The architecture of complexity», en The Scienccs o/ the Artz/icial, H. Simon (comp.), Cambridge University Press (trad. cast.: Las ciencias de lo artz/iczál, ATE, 1979). Simon, H., 1982, Models o/Bounded Rationality, Volúmenes 1 y 2, MIT Press. Skarda, C. y Freeman, W., 1987, «How brains rnake chaos in order to make sense of the world», Behavioral and Brain Sciences, 10, págs. 161-195. Smith, B. C., 1995, «The Foundations of Computation», ponencia presentada en el AISB95 Works hop on the Foundations of Cognitive Science, University of Sheffield. Srnith, B. C., 1996, On the Origin o/ ObJects, MIT Press. Smithers, T., 1994, «Why better robots make it harder», en From Animals to Animat_r, 3, D. Cliff y otros (comps.), MIT Press. Smolensky, P., 1988, «On the proper treatment of connectionism», Bchavioral and Brain Scien ces, 11, págs. 1-7 4. Steels, L., 1994, «The artificial life roots of artificial intelligence», Arti/iczál Lz/e 1, nº 1-2, págs. 75-110. Stein, B. y Meredith, M., 1993, The Merging o/ the Senses, MIT Press. Sterelny, K., 1995, «Understanding life: Recent work in philosophy of biology», Britzsh ]ournal for the Philosophy o/ Science, 46, nº 2, págs. 55-183. S11chman, A., 1987, Plans and Situatcd Actions, Cambridge University Press. S111 ton, R., 1991, «Reinforcement learning architecture for anirnats» , en From Animals to Animat.1 1, J.-A. Meyer y S. Wilson (comps.), MIT Press. l':1tc>, A., 1985, «A review of knowledge based planning techniques», Knozuledgc Engineering l<.cuicw, l, págs. 4-17. 1'11:1ch, W., ( ;oodkin, H. y Keating, J., 1992, «The cerebellum and the adaptive coordination of movcmcnt», lt1111ua! Rcuicw o/ Neuroscience, 15, págs. 403-442. l lll·lc-11, f,:., 1986, «Trcadmill-clicited stepping in seven-month-old infants», Child Dcue!o¡1111,·11t, 57. p,ígs. 1.498-1.506. i'll<'kn, 1,: .• l'J'J5, «Tirnc-scalc· dynamics and the devclopment of an c111hodicd cognition», ,·n i\li11d ,11 Muliu11, R. l'ort y T. van Ccldcr komps.), MIT l'rc·ss.
298 1 Estar ahí Thelen, E., Fisher, D.M., Ridley-Johnson, R. y Griffin, N., 1Y82, «The effccts of body build and arousa! on newborn infant stepping», Devc/opmcnt Psychobiology, 15, págs. 447-4 53. Thelen, E. Fisher, D. M. y Ridley-Johnson, R., 1984, «The relationship between physical growth and a newborn retlex», In/ant Behavzór and Deve!opment, 7, págs. 479-493. T helen, E. y Smíth, L., 1994, A Dynamic Systems Appmach to the Devc!opment o/ Cognition and Action, MIT Press. Thelen, E. y Ulrich, B., 1991, «Hidden skills: A dynamic system arrnlysis of treadmill stepping during the first year», Monographs o/the Society /or Research in Child Deve!opment, n" 223. Thelen, E., Ulrich, B. y Niles, D., 1987, «Bilateral coordination in human infants: Stepping on a splítbelt treadmill», Journa! o/ Experimenta! Ps_ycho!og_y: Human Perception and Perfor mance, 13, págs. 405-410. Tomasello, Kruger, y Rutner, 1993, «Cultural learning». Beha1,ioral and Brain Sciences, 16, págs. 495-552. Torras, C., 1985, Tempora!-Pattern Ledrning in Neural Models, Springer-Verlag. Touretzky, D. y Pomerleau, D., 1994, «Reconstructing physical symbol systems», Cognitive SC/ence, 18, págs. 345-353. Triantafyllou, G. S., Triantafyllou, M.S. v Grosenbaugh. M. A., 1993, «Optima! thrust de velopment in oscillating foils with application to fish propulsion», Jouma! of Fluzds ,md Structures, 7, n º 2, págs. 205-224. Trüntafyllou, M. y Triantafyllou, G., 1995, «An efficient swimming machine», Scientz/ic Ame rican, 272, nº 3, págs. 64-71. Turvey, M., Shaw, R., Reed, E. y Mace, \V., 1981, «Ecological laws of perceiving and acting», Cognition, 9, págs. 23 7-304. Valsiner, A.. 1987, Culture and the Development o/ Chi!drrn'.1 Action, Wiley. Van Essen, D., Anderson, C. y Olshausen, B., 1994, «Dynamic routing strategies in sensory, motor, and cognitive processing», en Large-Scale Neuronal Theories o/ the Brain, C. Koch y J. Davis (comps.), MIT Press. Van Essen, D. y Gallant, J., 1994, «Neural mech ,nisms of form and motion processing in the primate visual system», Neuron, 13, págs. 1-10. Van Gelder, T., 1990, «Cornpositionality: A conncctionist variation on a classical theme», CoJZ,11itive Saence, 14. págs. 355-384. Van Gelder, T., 1991, «Connectionism and dynamical explanation», en Proceedings of the 13th Annual Conference of the Cognitive Science Society, Chicago. V,m Celder, T., 1995, «\X'hat might cognition be, if not computation?»,Journa! o/ Philosophv, ')2, n" 7, págs. 345-381. \l;ir,·la. F. Tl10mpson E. y Rosch, E.. 1991, The EmbodzéJ Mmd. Cog11itiue Science and Human I: \('cricnce, MIT Press (trad. cast.: De cuerpo presente.· Las ciencias cognitivas y la expe ri, ·11cia humana, Gedisa, 1992). \'l'1;1, 1\. y Simon, H., 1994, «Reply to Touretzky and Pomerleau: Reconstructing physical sym hol svstems», Cognztive Science, 18, págs. 355-360. V, ,g,·l, S., 198 l, «Behavior and the physic:al \\'orld of an animal», en Perspectiues in Ethology, vnl111m·n 4, P Bateson y P Klopfer (comps.), Plenum. \'"11 1 o,·1·stcr, Jf., (comp.), 1951, C'_ybernetics· Transactiom o/ the Seventh Conference. Josiah l\focv ./ r. Foundation. Vrn1 l lcxkull, J., 1934, A stroll through the worlds on animals and men, en Instinctlve Beha1·mr. K. Lashley (comp.), lnternational Universities Press. Vvgol sk v. L. S., 1986, J'hought and Language (traducción al inglés de la edición de 1962), MIT f > n·ss ltrnd. cist.: JJ,·11s<111li,·1tto y li'/1,�ua¡e, Buenos Aires, Paidós, 1995). \\'"" 111. 1 '., l 'H,K, «lk:1so11 ing about a ntlc,,, Quartcr!y Journal o/ Experimental Ps_ycho!oí!,.V, 20, '"'!'.' 27 \ 281.
Bibliografía
1
299
\X1atkins, C., J 989, «Learning from Delayed Rcwards», tesis doctoraL Kings College. Welch, R., 1978, Perccptual M.odi/záztion · Adapting to Altercd SenSOt)' Environments, Academic Press. Wertsch, J., (comp.), 1981, The Concept of Actzvlty in Soviet Psychology, Sharpe. Wheeler. M., 1994, «from activation to activity», AISB Q11arterly, 87, págs. 36-42. Whecler. M .. 1995, «Esrnping from the Cartesian mind-set: Heidegger and artificial life». en Lecture Notes in Artificial Intdligcnce 929, Advances in Artificial Life, Granada, España. Whorf, B., 1956, Lanf!,uage, Thought ,md Realzty, Wiley (trad. cast.: Lmguaje, pensamiento y realidad, Barral, 1971). \X'icner. N., 1948, Cybernetics, or Control and Communication in the Animal and in thc Machi� ne. \'\/iley (trad. cast.: Cibernética o el control y la comunicación en animales y máquinas, Tusquets. 1985). \X'imsatt, W., 1986, «Forms of aggrcg,nivity», en H11m,m Nature and Natural Knowledge, A. Donagan y otros (comps.), Rei
Índice analítico y de nombres
Abraham, R., 144. 161 Acción, epistémica, 105-109, 124 Ackley, D., 142,241 Adaptación, inversa, 268-269 Agentes autónomos, --1--1. 49-60, 71-74 Agentes de inteligencü nula, 238-239 \léase tamhic'n- Mobots Agre, R, 203 Algoritmos genéticos, 134-139, 241-242. 2--1--1 \1éase tamhié11 fa·olución Algoritmo de retropropagación, 97-98 \1éase tamhién Redes neuronales Allcn, Woody, 193 Alzheimer, cnfermed,1J Je, 108 Análisis de tareas, 167 Andamiaje, 86-88, 102-10-l, 125-126, 233-246, 248-275 Aprendizaje de descenso por un gradiente, 98, 135, 213-21-l, 260 Véase tamhién Redes neuronales Atún, 277-278 Autoorganización, 80, 84, 114 Véase tamhién Sistemas dinámicos Ballard, D., 67, 69, 152, 200-201 Bcchtel, W., 160 Beckers. R. 118 Bccr, R.,44, 5-l-55. 135-137. 141,145, 1-!6. 151, 165, 169-170. 196,199,216 Lkrk, L., 248,250 Bivcns, J., 250 Braquiación, 'i5, 57. hO llratman. M .. 257 l\rooks, !{., 51 5-l. 5S-5lJ, 69, 71-72, 189, 199, 245
H11cll's de ;1<.Tinr1
\léase desarrollo Busemeycr,]., 171 But!cr, K., 217 Carruthers, R, 249, 251-252, 255 Causalidad - circular, 154 - recíproca rnntinua, 143, 154-155, 225 Véanse tambi,'11 Sistemas dinámicos; Representaciones
Cerebelo, 78 Chalmers, D., 271 Chapman, D., 104 Chie!, I !., 44, 54 55 Christiansen, M., 268 Churchland, P M., 20l, 253. 262 Churchland, P S., 69, 70, 79 Clip, 267 Cognición, corpórea radical, 198-199 COC, 58-60 Comunicación, 243-246 Véase también Lenguaje Computación Véanse también Representación; Sistemas dinámicos -extendida hacia el entorno, 255-262, 272 -y éxplicación. 149-175 - y programas. 204-213 -y representación. 212�213, 255-262 Conexión adaptativa, 197 Concxionismo Véase Redes neuronales Consciencia, 253, 272 Contrafactuales, 164 Control, centralizado, 80. 83-86 Control neuronal. 18-l- 1 cJ 1
302 1 Estar ahí CottrclL G.,101 ( :rccncias,extendicLis, 275 < :11caracha. 42. 43,135-139 ( :Yt :, proyect0. 4042,43,45, 46, 93, 98 ll:nnasi0, A.,171,172,186-190 llarnasio,H ..171,172 1lasein,224 Dawkins,R.,132 1 lean, P.,62 l lcnnett, D., 51,151,245,248,249, 251-253,
256 lknzau, A., 235-236, 238 1 kpendcncia de trayectorias, 259-260 1 ksarrollo,75-92 proximal, 86,249-250 sin plant>s, 79-83 v ,111dami,1je,86-88 y hueles de acción, 76-79 y montaje blando, 83-86 1 kscornposición. basada en la actividad \','""' Arquitectura de subsunción 1 h-1,Tlores de características, 183 1 lia1, I{, 248 I >1, tvu.,tdium doscoidcum, 114 1 li11a111irn usuario-artefacto,270-275 1 lisrn rso, privado,250 \ ·,·,11c /11mh1é11 Lenguaje 1 )<111"1.I, 1\1.. 261,266 l>1<"1skc, F .. 168,196 1 )1ni 11,, 11. 44,224,258 1>1cvl 1"· S .. 2'íg / tc)ll(ll!JLI, 2�5-2...f6 1 ,1, 1111;111. ( :., 185 1 I,·, 1« ,lt-1 111a11glar, 263-267 1 1, , , 1«11. r:rci<11wl, 2 l l-246 1 1111.111. 1 '·' 1 \, 25 \,259-260,269 1 11111¡•.,·rr, 1.1. S4 S'i, l."7
\ , ..,,( /,u11!,101 ,,\utoorg;rnización
,111<·, 1.1 ,. i11.lir,·e1.1, 116-118, 120-121. 155, J')¡'
,·11 l.1 11111�t11ntlt)lldl'tl'r!Tliteros, 117-IIS \' d1",( (llllllPSÍCÍ()tl, 127 1 ,·,1 ,l 1.:1li«11. 1-J') 175,215-219 1 1 ,·, 111n 1<111, 1 'ill 151 J '111111.h it1 11 lll()I rÍ1., (12 63 l 11.1t111111, .>.1 ; ¡ ·',ll i"fhl l 11n/, � , )') 1 ·.1q•.1111·1¡,r;1, I IS I l'l, .!-10,245 f·l1tptt·[,I'> \ ·1',/\1 1 .Vll)',ll
1 \olll( 1(111 l,1<11<>/'.l<,I, ll.1 1 \\, I-J<, 1-J"j ,1111111.1,l.1. 1 \I 1 \'!. 1-11 \ ,·,111· ! n11!•1, 11 :\l::11rit 1110� gl·1H··1 ico:-. 1
Explicación basada en comp1.,1. J .• 1 \5 l.,· ( :1111, Y.,1111 l.,n · ,11.ll.,-ll,-1',
Índice analítico y de nombres 1 303 Lenguaje - como adaptado inversamente al cerebro, 267-269 - como artefacto. 2.J7 -275 -como instrumento para el pensamiento, 234, 247-275 - como sistema de comunicación, 247-255, 259-262 - del pensamiento, 234 - nociones supracomunicativas del, 251,252 - y atención, 264-267 - y discurso interno, 2,19-250, 254-255 - y dependencia
Norman, D., 101 North, D., 235-236,238 Oportunidades, 226 Osciladores adaptativos, 214 Parisi, D., 142,241 Pearson,K., 54 Percepción - contenidos, 63-71, 91-92 - y acción, 69-70, 77-79, 241 -y cognición, 46, 52-53, 76-77, 91-92 Piagcr, J., 75, 207 Planificación - a Lugo plazo, 101 - central, 61, 71-72 - y acción corpórea, 88-90, 103 -y autoorganización,115, 119-123 - v lenguaje, 257 -259 Port. R., 165,213,214 Principio 007,235-236, 238 Problemas ávidos de representación, 198, 200, 219-223, 229 Proces.imiento distribuido en paralelo Véase Redes neuronales Procesamiento reentrante, 185 Programas parciales, 204-213 Pseudoplasmodio, 115 Quinn, R., 55-56 Ramachandran, V, 70 Racionalidad, limitada, 239-241 sustantiva, 235-239 Reconstrucción racional, 123-124, Redes neuronales artificiales, 54-55, 58-59, 9311, 127 Véase t,1mbié11 Representaciones - aprendizaje en, 97-99, 260 - como controladoras de la acción, 135-139 - como dispositivos de compleción de patrones, 93, 100-104, 109,233, 239-2,16, 258 - recurrentes, 25 3 - ventajas e inconvenientes, 100-103, 123-124 - y algoritmos genéticos, 135-139 - y cerebros reales, 94-95 - y estructuras externas, 100-111, 239-2-+6 - y satisfacción de restricciones, 242-243 Redescripcion representacional, 265 Reduccionismo, 150-151 Regulador de Watt, 139, 143 Representaciones internas Véanse también Cómputo; Sistemas dinámi cos; Mente; Problemas ávidos de repre sentación
304 1 Estar ahí -en el cerebro,177-191 -explícitas, 52,72,98,108-109,120 -orientadas hacia la acción,76,88-92,200-204 -parciales,63-65,67,69-70, 85-86, 92 -pushmi-pullyu, 91 -replanteamiento,222-223,228-229 -y cómputo,142-143 -y desacoplamiento,219-223 -y explicación, 142-175,215-219,71-72 -y lenguaje público,253-275 -y modelos del mundo, 61-71,87 -88,92 -y símbolos, 40-42,44,71-72 -y tiempo, 213-215 Representación orientada hacia la acción, 76, 88-92,200-204 Resnick, M.,80,116,142,157 Retroalimentación positiva,81,103, 114-115 Véase también Autoorganización Ríchardson,R.,160 Rítzmann. R.,42-43 Robots -Attila, 54 -Herbert, 51-54, 63,65 -hexápodo,54-55 Rumelhart,D.,253-254 Saito, F.,57-58 Salzman,C., 183 Salzman,E.,166 Satz,D.,236-238 Schieber,M.,179-180,190 Sejnowski, T.,70 Sensación dependiente del nicho,63-64 Sensores, 141 Shaw, C.,144,161 Símbolos externos, 243-275 Simon,H.,132,235,239 Simulación,139-142 Sinergia,180-181,204-205 Véanse también Variables colectivas, Sistemas dinámicos Sistemas dinámicos,143 147 - acoplados, 139,144 -puros,166-167 -teoría de los,143-147,161-166 -y comprensión explicativa,149-175,188-191 -- y cognición d_e alto nivel, 165-166 -y representación,198-230 -y tiempo,213-215 Skarda, C.,199
Smith,L.,76-77,169,199,204-207,211-212 Smithers,T.,199,158,139-140 Smolensky,R,253 SOAR,sistema,94 Soluciones descentralizadas,113-123,189-191 Véanse también Planificación,Autoorganización Steels, L.,155-156,158, 160 Stein, L.,58 STRIPS, programa, 94 Subsunción,52-54,61,72,88 Sunder,S.,238-239 Tetris,juego,107,258 T hach,T.,78-79 T helen,E.,76-77,79,83-85,168-169,199,204207,211-212 Thornton,C.,261 Tiempo,213-215 Véase también Sistemas dinámicos Torras,C.,214 Townsend,J.,171 Triantafyllou,G.,277 Triantafyllou,M.,277 Umwelt, 64-71
Van Essen,D.,182-185 Van Gelder, T., 143-144, 160, 165, 173, 199, 213,216 Varela,E. 199,226-227 \ ariables colectivas,116 Vejiga natatoria,133 Visión,182-185 - animada, 67, 69-71, 105, 152-153, 182-183, 190 Vogel,S.,87 Von Uexkull,J.,64,66-67 Vygotsky,L.,75,86,249-250 Wason,R,242 Wheeler,M.,151,160,165,199 Wimsatt, W.,161 Yamuchi, B.,137 Yarbus, A.,69 Yo,273-275 Zelazo, R,80-81 Zonas de convergencia, 186-190, 202