Subido por:
Libros de Ingeniería Química y más
https://www.facebook.com/pages/InterfaseIQ/146073555478947?ref=bookmarks
Si te gusta este libro y tienes la posibilidad, cómpralo para apoyar al autor.
Fundamentos físicos de los procesos biológicos Vol. 3 - Bioelectromagnetismo, ondas y radiación
Raúl Villar Lázaro Cayetano López Martínez Fernando Cussó Pérez
Fundamentos físicos de los procesos biológicos. Volumen III © Fernando Cussó Pérez Cayetano López Martínez Raúl Villar Lázaro ISBN: 978–84–16113–24–8 e-book v.1.0
ISBN edición en Papel: 978–84–15787–95–2
Edita: Editorial Club Universitario. Telf.: 96 567 61 33 C/. Decano, 4 – San Vicente (Alicante) www.ecu.fm Maqueta y diseño: Gamma. Telf.: 965 67 19 87 C/. Cottolengo, 25 – San Vicente (Alicante) www.gamma.fm
[email protected]
Reservados todos los derechos. Ni la totalidad ni parte de este libro puede reproducirse o transmitirse por ningún procedimiento electrónico o mecánico, incluyendo fotocopia, grabación magnética o cualquier almacenamiento de información o siste ma de reproducción, sin permiso previo y por escrito de los titulares del Copyright.
Introducción Este libro, Fundamentos físicos de los procesos biológicos, se ha concebido como una ayuda para los estudiantes de los primeros cursos de titulaciones cuyo objeto de estudio principal sean las Ciencias de la Vida, como la Biología, la Medicina, la Farmacia, la Veterinaria y otras, en las que sea necesario manejar algunas nociones básicas de la Física. No se supondrá, por lo tanto, la existencia de ningún conocimiento previo en esta materia, circunstancia frecuente en quienes inician estudios en Ciencias de la Vida. Lo único que se presupone es el conocimiento de las matemáticas elementales correspondientes al nivel de bachillerato. De todas formas, se recuerdan algunos conceptos y fórmulas importantes en el texto y en los apéndices. El contenido del libro resulta de una modificación de un libro anterior, escrito por los mismos autores, llamado Física de los procesos biológicos y publicado en 2004 por Ariel. La modificación principal consiste en la eliminación de las partes más generales de la Física y un enfoque más centrado en las aplicaciones al mundo de la Biología, lo que se ha traducido en una reducción neta de contenidos y una más estricta selección de estos en lo que afecta a la explicación de ciertos fenómenos biológicos. Una gran parte del texto que ahora presentamos es similar al anterior, aunque se ha cambiado el contexto en que se introducen algunas nociones de Física con objeto de hacerlas más directamente aplicables a las Ciencias de la Vida. Al mismo tiempo, se han incorporado más ejercicios para mejor adaptarse a los cambios que se están produciendo en el perfil y desarrollo de los estudios universitarios. Con todo, sigue siendo y se ha construido como un libro de Física en el que se introducen los conceptos y la metodología propios de esta ciencia, aunque se busca, en todo momento, aplicar los resultados obtenidos al ámbito de los seres vivos. El hecho, además, de que no se requieran conocimientos previos en esta materia por parte del lector implica que cada tema sea presentado desde su inicio, indicando lo que significa en el mundo físico en general, con aplicaciones y ejemplos, y con un énfasis especial en el ámbito de las Ciencias de la Vida, a fin de mejor entender sus leyes y familiarizar al lector con el modo de tratar y formular los problemas físicos. iii
iv
Fundamentos físicos de los procesos biológicos
El programa, igual que el del texto anterior, cubre todos los contenidos mínimos u obligatorios de los programas de las carreras mencionadas en el primer párrafo, a desarrollar en uno o dos semestres. Pero va más allá, tanto en el desarrollo de cada tema como en el catálogo de temas, incorporando otros contenidos que serán de interés en estados más avanzados del estudio de la relación entre Física y Ciencias de la Vida. Intentamos que sirva de referencia permanente para aclarar las nociones de Física que aparecen una y otra vez en determinadas ramas del estudio de los seres vivos. Para el estudiante y el público en general, la Física y la Biología se presentan como disciplinas científicas muy distintas, incluso contradictorias o incompatibles en sus métodos. Y es cierto que hay diferencias en su objeto de estudio, en su metodología y también en su lenguaje. La Física se ocupa normalmente de sistemas simples que se pueden caracterizar con unos pocos parámetros, incidiendo siempre en los aspectos cuantitativos de las leyes que rigen su comportamiento, lo que implica un alto grado de formalización matemática y un método deductivo a partir de unos principios generales, lo que le confiere una gran potencia predictiva. Por supuesto, se llega a esos principios generales desde la observación y la experimentación de los fenómenos naturales, es decir, tienen una naturaleza empírica, muy distinta de la de los postulados puramente matemáticos. La Biología, por su parte, se ocupa de los sistemas más complejos que existen en el mundo físico, los seres vivos, cuyo comportamiento no puede caracterizarse únicamente con ayuda de unos pocos parámetros y cuya estructura no puede entenderse fuera del marco evolutivo, de la historia concreta de la vida sobre este planeta, sujeta a contingencias impredecibles que cristalizan en las formas de vida actualmente existentes. La Biología es más descriptiva, menos deductiva, y su lenguaje no es el lenguaje altamente formalizado de las matemáticas. Y, sin embargo, los seres vivos forman parte del mundo físico y, por lo tanto, se ven afectados por las leyes generales que rigen el comportamiento de cualquier sistema físico, ya sea la gravedad, la tensión superficial, los intercambios de energía, la dinámica de los fluidos o las interacciones electromagnéticas. El funcionamiento de los seres vivos y de sus distintos órganos y tejidos, su estructura y su relación con el entorno, están condicionados por las leyes generales de la Física, lo que constituye el nivel más básico de relación entre Física y Ciencias de la Vida. Existe otro nivel, más instrumental, que se refiere a la utilización, en los laboratorios de prácticas y de investigación, así como en otros ámbitos de la actividad profesional relacionados con las Ciencias de la Vida, de equipos e instrumentos basados en fenómenos físicos, o surgidos de la actividad de investigación en Física, que permiten observar ciertas características de los seres vivos. Ambos aspectos, básico e instrumental, están presentes en el libro.
Introducción
v
Desde luego, sería absurdo pretender que entenderemos a los seres vivos si conocemos bien los fenómenos físicos en los que se basa su actividad vital. Se trata de sistemas tan complejos y con una componente “histórica” tan fuerte que, en nuestro estado actual de conocimientos, solo es posible formular en términos físicos algunos aspectos de su actividad y estructura. Pero también sería absurdo pensar que podemos entenderlos haciendo abstracción del mundo físico en el que viven y evolucionan y cuyas leyes les afectan. Es de gran importancia comprender que se trata de sistemas que deben ajustarse a lo estipulado por las leyes de la Física, desde las que se refieren a los átomos y moléculas que los constituyen, hasta las que regulan el comportamiento térmico y dinámico de conjuntos de muchas partículas y extrema complejidad. Las leyes de la Física plantean límites a la actividad vital que deben ser tenidos en cuenta, de forma que el juego de la evolución biológica debe discurrir dentro de esos límites. Como veremos en muchos de los casos tratados en el texto, lo difícil es plantear de forma correcta la aplicación de una ley física general al caso particular de un organismo o una función biológica. En todo caso, la finalidad de las dos ciencias es idéntica: entender e interpretar los fenómenos naturales en términos de hipótesis que puedan ser confrontadas con la observación o el experimento. Aunque, teniendo en cuenta que la complejidad de los seres vivos es superior a la de cualquier sistema inanimado, la aproximación usual en la Física se enfrenta con numerosas limitaciones y requiere adaptaciones a su nuevo objeto de estudio. Lo que no obsta para que, cuando se dilucida el fenómeno físico que subyace a una determinada función vital, se entienda esta de forma clara, así como el espectro de alternativas posibles permitidas por las leyes de la Física y la lógica del proceso evolutivo que ha conducido a esa solución específica. A los autores, científicos cuya disciplina de origen es la Física, nos resulta especialmente grato dejar constancia de que, durante nuestra experiencia docente en la materia y la preparación de este texto, hemos adquirido conciencia de las contribuciones que la Física, a lo largo de su historia, debe a numerosos biólogos, fisiólogos y médicos, especialmente en el desarrollo de las teorías termodinámicas y la física de fluidos. Como se ha indicado anteriormente, el presente texto resulta de la modificación de un libro anterior. Afrontar una revisión y reelaboración de una obra con objetivos similares sólo es concebible si se ha recibido la justa combinación de elogios y críticas relativas al primer texto que nos ha permitido concluir que el esfuerzo merece la pena. Así que, además de los agradecimientos que figuran en esa primera obra a las personas que nos ayudaron en
vi
Fundamentos físicos de los procesos biológicos
la tarea de componerla, los autores nos sentimos en la obligación de añadir aquí nuestro agradecimiento a los muchos colegas y amigos que han tenido la generosidad de hacernos partícipes de sus opiniones y sugerencias de modificación, lo que nos ha ayudado a identificar tanto aquellos contenidos que debían cambiarse como aquellos merecedores de mantenerse en este nuevo empeño. En particular, José Manuel Calleja, Juan Rojo y Elena Escudero, quienes han realizado una detallada lectura de la obra y cuyos comentarios han resultado especialmente esclarecedores. Sin olvidar a Carmen Gilabert y Álvaro Moreno, que han corrido con la siempre peliaguda tarea de crear las ilustraciones que ayudan a mejor entender el texto. Huelga decir que los responsables de posibles deficiencias somos únicamente los autores. Por último, deseamos expresar nuestro agradecimiento a los estudiantes de Física del grado en Biología de la Universidad Autónoma de Madrid, que son responsables de muchos de los elogios y críticas a los que nos hemos referido, y que han constituido la principal referencia para juzgar la adecuación de nuestra descripción de los fundamentos físicos de los procesos biológicos.
Agradecimientos Muchas son las personas que nos han ayudado en la tarea de componer este libro. Proponiéndonos temas o enfoques o leyendo capítulos o fragmentos y mejorándolos con sus sugerencias, como Magdalena Cañete, Ángeles Villanueva, Elena Escudero, José Manuel Calleja, Arkadi Levanyuk, Sebastián Vieira, Francisco Jaque, Gines Lifante y Cristina Bernis. O proporcionándonos fotografías, ilustraciones o referencias con las que completar el texto, como M. C. y A. V., ya citadas, Estrella Rausell, Rodolfo Miranda, Jorgina Satrustegui, Eduardo Elizalde, Tomás López, Isabel Jimeno, Nicolás Fernández Baillo, Luis Munuera, José María Segura y José Manuel Suárez de Parga, así como el Servicio Interdepartamental de Investigación de la Universidad Autónoma de Madrid. Mención aparte merecen las personas que se han responsabilizado de las ilustraciones, una notable aportación sin la que el libro perdería una gran parte de su interés, sobre todo Carmen Gilabert, que ha debido plasmar gráficamente muchas de las ideas, y hasta los caprichos, de los autores, y Álvaro Moreno, así como E. E., ya citado, Carmen Morant y Eugenio Cantelar. Por último, es necesario agradecer a las numerosas promociones de alumnos de Biología que han debido cursar con nosotros la asignatura Física de los Procesos Biológicos en la UAM, por su paciencia, por sus sugerencias y por permitirnos hacernos una idea de cómo abordar esta disciplina. En realidad, hemos aprendido al mismo tiempo que ellos.
vii
Índice general abreviado Volumen I. Biomecánica y leyes de escala Capítulo 1. Cinemática. La percepción de la aceleración Capítulo 2. Dinámica. La fuerza en los animales Capítulo 3. Fuerzas elementales y derivadas. Entornos con fricción Capítulo 4. Bioestática y locomoción Capítulo 5. Trabajo y energía. La tasa metabólica Capítulo 6. Leyes de escala en los seres vivos Capítulo 7. El metabolismo y las leyes de escala Apéndices A-F Volumen II. Calor y dinámica de fluidos en los seres vivos Capítulo 8. Temperatura, calor y trabajo Capítulo 9. El primer principio: balance energético de los seres vivos Capítulo 10. Procesos espontáneos: segundo principio de la termodinámica Capítulo 11. Transiciones de fase: la transpiración en los seres vivos Capítulo 12. Teoría cinética molecular de los gases: la difusión Capítulo 13. Fluidos ideales: la flotación Capítulo 14. El flujo viscoso: la circulación sanguínea y el vuelo Capítulo 15. Fenómenos de superficie y disoluciones Capítulo 16. Propiedades mecánicas de los biomateriales Volumen III. Bioelectromagnetismo, ondas y radiación Capítulo 17. Fuerzas, campos y potenciales eléctricos Capítulo 18. Corriente eléctrica Capítulo 19. La membrana celular y el impulso nervioso Capítulo 20. Magnetismo y campos electromagnéticos Capítulo 21. Ondas: luz y sonido Capítulo 22. La visión y los instrumentos ópticos Capítulo 23. Átomos, núcleos y radiactividad
ix
Índice Volumen III. Bioelectromagnetismo, ondas y radiación Introducción ................................................................................................ iii Agradecimientos......................................................................................... vii Índices .......................................................................................................... ix Capítulo 17. Fuerzas, campos y potenciales eléctricos 17.1 Carga eléctrica y estructura de la materia ........................................ 1 17.2 Fuerzas eléctricas: ley de Coulomb .................................................. 3 17.3 Campo eléctrico................................................................................ 5 17.4 Campos eléctricos en la materia. Polarización ............................... 12 17.5 Interacción electrostática y energía ................................................ 16 17.6 Propiedades eléctricas de la membrana celular .............................. 25 17.7 Ejercicios propuestos...................................................................... 30 17.8 Referencias ..................................................................................... 37 Capítulo 18. Corriente eléctrica 18.1 Movimiento de cargas: cargas libres, conductores y aislantes ....... 39 18.2 Intensidad de corriente eléctrica ..................................................... 42 18.3 Resistencia. Ley de Ohm................................................................ 43 18.4 Aspectos energéticos. FEM y circuitos .......................................... 47 18.5 Circuitos simples ............................................................................ 50 18.6 Circuitos con resistencia y capacidad (RC).................................... 54 18.7 Apéndice: pilas y baterías. Volta y Galvani .................................... 64 18.8 Ejercicios propuestos...................................................................... 66 18.9 Referencias ..................................................................................... 70 Capítulo 19. La membrana celular y el impulso nervioso 19.1 Biopotenciales ................................................................................ 71 xi
19.2 Conducción nerviosa ...................................................................... 92 19.3 Apéndice 1: modelo de Hodgkin-Huxley del potencial de acción .. 130 19.4 Apéndice 2: bases físicas de la electrocardiografía ...................... 134 19.5 Ejercicios propuestos.................................................................... 149 19.6 Referencias ................................................................................... 152 Capítulo 20. Magnetismo y campos electromagnéticos 20.1 Introducción ................................................................................. 153 20.2 Fuerza magnética sobre cargas en movimiento............................ 154 20.3 Campos magnéticos creados por corrientes ................................. 167 20.4 Fuerzas entre corrientes: definición de amperio ........................... 172 20.5 El magnetismo en la materia ........................................................ 174 20.6 Biomagnetismo............................................................................. 177 20.7 Campos electromagnéticos dependientes del tiempo ................... 186 20.8 Ondas electromagnéticas .............................................................. 193 20.9 Ejercicios propuestos.................................................................... 195 20.10 Referencias ................................................................................. 203 Capítulo 21. Ondas: luz y sonido ............................................................ 205 21.1 Introducción: propagación............................................................ 205 21.2 Tipos de ondas .............................................................................. 206 21.3 Ondas: características generales ................................................... 208 21.4 Luz y sonido ................................................................................. 225 21.5 Fronteras: reflexión y refracción .................................................. 249 21.6 Interferencia ................................................................................. 264 21.7 Difracción ..................................................................................... 270 21.8 Efecto Doppler ............................................................................. 284 21.9 Apéndice: el oído humano ............................................................ 287 21.10 Ejercicios propuestos.................................................................. 293 21.11 Referencias ................................................................................. 298 Capítulo 22. La visión y los instrumentos ópticos 22.1 Introducción: el ojo y la visión en los animales ........................... 301 22.2 Imágenes sin lentes: la cámara oscura y el ojo del Nautilius ....... 303 22.3 Uso de la refracción. El ojo con lente .......................................... 304 22.4 Instrumentos ópticos .................................................................... 320 22.5 Ejercicios propuestos.................................................................... 339 22.6 Referencias ................................................................................... 342
xii
Capítulo 23. Átomos, núcleos y radiactividad 23.1 Los fundamentos de la Física Cuántica ........................................ 345 23.2 El núcleo atómico ......................................................................... 369 23.3 Radiactividad................................................................................ 379 23.4 Efectos biológicos de la radiación ionizante ................................ 387 23.5 Apéndice. La cadena de desintegración del U238 .......................... 406 23.6 Ejercicios propuestos.................................................................... 407 23.7 Referencias ....................................................................................411 Glosario ..................................................................................................... 413
xiii
Capítulo 17. Fuerzas, campos y potenciales eléctricos 17.1 Carga eléctrica y estructura de la materia Hoy día estamos familiarizados con el hecho de que la materia está formada por átomos, que a su vez están formados por partículas cargadas. Cada átomo posee un núcleo que contiene protones con carga positiva y neutrones de carga nula. El número de protones en el núcleo es el número atómico Z y es característico del elemento de que se trate. Rodeando al núcleo existe un número igual de electrones, con carga negativa. La carga de los protones y electrones son exactamente iguales pero opuestas en signo (+e y –e), por lo que los átomos son eléctricamente neutros. La carga e constituye la unidad fundamental de carga, de forma que todas las cargas de la naturaleza se presentan como múltiplos de dicha cantidad.1 En la casi totalidad de las manifestaciones de fenómenos eléctricos a escala macroscópica, incluyendo la mayoría de los fenómenos celulares, intervienen siempre un número elevado de cargas (Q = Ne, con N un número entero muy grande), por lo que la cuantificación de la carga eléctrica no se observa normalmente. Aunque la descripción rigurosa del átomo requiere del uso de la Mecánica Cuántica, como se verá en el capítulo 23, resulta útil en muchos casos acudir a un modelo atómico simplificado, de tipo “planetario”, donde los electrones de carga negativa dan vueltas en torno al núcleo de carga positiva, constituido por los protones y neutrones (fig. 17.1).
1 A escala subatómica se supone que los “hadrones” (partículas que interaccionan por medio de la fuerza nuclear fuerte, entre ellos los protones y neutrones) están formadas por “quarks”, con carga fraccionaria ± 1/3e o ± 2/3e. Sin embargo, no se ha detectado ningún quark libre y, en el marco de las teorías en vigor, sólo pueden existir combinados formando partículas de carga múltiplo de la fundamental e.
1
2
Fundamentos físicos de los procesos biológicos
Fig. 17.1. Modelo atómico planetario. Los electrones (carga –e) giran en torno a un núcleo cargado positivamente de unos 10 -15 m de radio. El radio de las órbitas electrónicas es 100.000 veces mayor.
El radio atómico es del orden del angstrom (1 Å = 10 -10 m) mientras el radio del núcleo es del orden de tan solo 10 –15 m (100.000 veces más pequeño). Por su parte, la masa del átomo se concentra en el núcleo, ya que la masa del electrón es aproximadamente 1.840 veces menor que la del protón o neutrón. Se conocen cerca de 90 átomos estables, con número atómico desde Z = 1 (hidrógeno) hasta Z ≈ 90, estando sus propiedades sistematizadas en la tabla periódica de los elementos. En los átomos multielectrónicos, los electrones internos apantallan en gran medida la interacción eléctrica entre el núcleo y los electrones externos, que pueden ser transferidos con más o menos facilidad, constituyendo los electrones de valencia, responsables de la mayoría de las propiedades químicas de estos átomos. También es posible que algún átomo (o molécula), en principio eléctricamente neutro, pueda captar o perder algún electrón, dando lugar a iones de signo negativo (aniones) o positivo (cationes). La facilidad para este proceso está determinada por la energía de ligadura de los electrones y depende de la estructura de la “corteza electrónica” de cada átomo. En particular, muchas
Fuerzas, campos y potenciales eléctricos
3
moléculas eléctricamente neutras se disocian formando iones al incorporarse a una disolución, propiedad de gran importancia para los fenómenos biológicos, que se desarrollan básicamente en medio acuoso. Por ejemplo, el cloruro sódico (NaCl) en disolución acuosa se disociaría dando lugar al catión Na+ y al anión Cl‒: NaCl → Na+ + Cl‒ Mientras en la mayoría de las aplicaciones macroscópicas de la electricidad (metales, conductores) lo que se mueve son electrones, en los seres vivos los fenómenos de tipo eléctrico están ligados a la presencia de diferentes iones (Na+, K+, Ca2+, Cl‒ …) que se encuentran presentes en los fluidos orgánicos.
17.2 Fuerzas eléctricas: ley de Coulomb La interacción entre cuerpos cargados fue estudiada en el siglo XVIII por Charles Augustin de Coulomb (1736-1808). La ley de Coulomb expresa el valor de las fuerzas ejercidas entre sí por dos cargas puntuales. Sean dos cargas puntuales, q1 y q2, separadas una cierta distancia r (fig. 17.2). Las fuerzas que las cargas ejercen entre sí son proporcionales al producto de las cargas e inversamente proporcionales a la distancia entre ellas, estando dirigidas según la línea que une ambas cargas. Si las dos cargas tienen el mismo signo la fuerza es repulsiva, y si tienen signos distintos la fuerza es atractiva. En forma vectorial, la fuerza ( F12 ) que la carga q1 ejerce sobre la carga q2 puede expresarse de la forma:
qq F12 = K e 1 2 2 ur r
(17.1)
donde ur = r r es un vector unitario en la dirección de q1 a q2 y Ke es una cierta constante que depende del sistema de unidades. A su vez, de acuerdo con la tercera ley de Newton, la fuerza que la carga q2 ejerce sobre la carga q1 . es:
4
Fundamentos físicos de los procesos biológicos
Fig. 17.2. La fuerza entre dos cargas puntuales tiene un módulo Keq1q2/r2 y está dirigida según la línea de unión entre las cargas. La fuerza es repulsiva cuando las cargas son de igual signo y atractiva si son de signo opuesto (ley de Coulomb).
En el SI de unidades, la unidad de carga es el culombio (C) y la constante Ke, determinada experimentalmente, es muy aproximadamente: K e ≈ 9 × 109 N m 2C −2
En ocasiones la constante de Coulomb, Ke, se expresa en función de otra constante denominada permitividad dieléctrica del vacío (ε0). Ke =
1 4πε 0
El valor de la permitividad dieléctrica del vacío en unidades SI es, por tanto: ε0 =
1 1 ≈ = 8, 85 × 10−12 C 2 N −1 m −2 4π K e 4π × 9 × 109
La ley de Coulomb y la ley de Newton de atracción gravitatoria son notablemente semejantes. La magnitud de las fuerzas eléctricas o gravitatorias es proporcional al producto de los valores de las cargas o masas respectivamente, y ambas son inversamente proporcionales al cuadrado de la distancia entre las cargas o masas. Se diferencian, claro está, en que la interacción gravitatoria es siempre atractiva mientras la interacción eléctrica puede dar lugar a atracción o repulsión dependiendo del signo de las cargas. Observación. Sistema Internacional de Unidades. En realidad, es la unidad de corriente eléctrica (el amperio, A) la que se adopta como unidad fundamental en el SI. El culombio se define a partir de ella como la cantidad = 1 A ×1s ) . de carga que fluye por dicha corriente en cada segundo (1C
5
Fuerzas, campos y potenciales eléctricos
El valor de la carga fundamental es: = e 1, 60 × 10−19 C
por lo que hacen falta del orden de 1019 electrones para conseguir un culombio de carga. Esto significa también que el culombio es una carga muy grande. En efecto, si calculamos cuál sería la fuerza entre dos cargas de 1 C separadas una distancia de 1 m, aplicando directamente la ley de Coulomb, ec. (17.1), se obtiene: F = 9 × 109 ×
1 = 9 × 109 N 12
Esta fuerza es aproximadamente igual al peso de 1 millón de toneladas (109 kg), lo que equivale aproximadamente a diez petroleros cargados o unas tres veces el Empire State Building o unas cinco veces el iceberg con que chocó el Titanic o la sexta parte de la pirámide de Keops.
17.3 Campo eléctrico 17.3.1 Campo eléctrico creado por una carga puntual La descripción de las fuerzas que actúan sobre una partícula cargada puede hacerse también utilizando el concepto de campo eléctrico. El lenguaje es análogo al utilizado al describir la interacción gravitatoria. Cuando un satélite se mueve en el espacio bajo la atracción terrestre decimos que se encuentra en el campo gravitatorio terrestre. Análogamente, cuando una carga se encuentra en una región del espacio donde le afectan otras cargas, se dice que se encuentra en el campo eléctrico que han creado dichas cargas. Es decir, se adopta el punto de vista de considerar que las cargas crean en su entorno una perturbación (un campo eléctrico) y este campo actúa sobre cualquier carga que se encuentre allí, dando lugar a la fuerza descrita por la ley de Coulomb (fig. 17.3).
6
Fundamentos físicos de los procesos biológicos
Fig. 17.3. La carga Q crea en su entorno un campo eléctrico (r), y la fuerza eléctrica sobre una carga q es igual al producto de dicha carga por el campo eléctrico.
La intensidad de campo eléctrico en un punto se define como la fuerza por unidad de carga colocada en ese punto. F E= q
(17.2)
La unidad de campo eléctrico en el SI es la unidad de fuerza dividida por la unidad de carga, es decir, el N C‒1. El campo eléctrico creado por una carga puntual se calcula inmediatamente a partir de la ley de Coulomb: F Q E = = K e 2 ur q r
(17.3)
donde Q es la carga que crea el campo eléctrico en un punto situado a una distancia r (fig. 17.3). La dirección del campo viene dada por el vector unitario ur = r r y el sentido del campo depende del signo de la carga: hacia fuera si ésta es positiva y hacia dentro si es negativa. La existencia del campo eléctrico se pondría de manifiesto al situar una carga de prueba, q, en dicho punto, ya que la carga experimentará, de acuerdo con la ecuación (17.2), una fuerza: F = qE
7
Fuerzas, campos y potenciales eléctricos
Cuando el campo eléctrico es debido a la presencia de varias cargas Q1, Q2, ..., QN (fig. 17.4), su valor es el resultante de la suma vectorial del campo creado por cada una de ellas: N Etot = ∑ Ei 1
y la fuerza total sobre una carga q puede calcularse a partir del campo total: N N N = = = = Ftot qE q E qE ∑1 Fi tot i ∑ i ∑ 1 1
( )
Fig. 17.4. Cuando una carga q interacciona con varias cargas Qi, la fuerza resultante es la suma de las fuerzas de cada una de las cargas (a) o, alternativamente, se puede calcular como el producto de la carga por el campo resultante, igual a la suma de todos los campos eléctricos (b).
Para visualizar el campo eléctrico creado por una distribución cualquiera de cargas, resulta conveniente utilizar una representación basada en la utilización de las líneas de campo eléctrico. Dicha representación consiste en dibujar mediante líneas continuas la dirección del campo eléctrico resultante que, a veces, reciben también el nombre de líneas de fuerza, ya que indican la dirección de la fuerza que el campo ejercería sobre una carga positiva. La figura 17.5 representa las líneas de campo eléctrico en presencia de cargas puntuales positiva (a) y negativa (b).
8
Fundamentos físicos de los procesos biológicos
Fig. 17.5. Líneas de campo eléctrico en presencia de una carga puntual: (a) positiva y (b) negativa.
Como indica la ecuación (17.3), las líneas de campo son radiales y se dirigen (a) hacia fuera en el caso de campo creado por una carga positiva y (b) hacia la carga si el campo es creado por una carga negativa. Al alejarnos de la carga el campo disminuye y, como vemos en la figura, las líneas de campo están más separadas. Análogamente, en distribuciones de carga más complejas, el número de líneas representado en cada región del espacio indica la intensidad del campo. Las líneas de campo pueden visualizarse experimentalmente utilizando pequeños objetos alargados (semillas, trocitos de hilo...) que tienden a orientarse según la dirección del campo. Los diagramas de líneas de campo eléctrico nos indican también la dirección de las fuerzas que actúan sobre las cargas, si bien hay que recordar que el sentido de la fuerza viene determinado por el signo de la carga ( F = q E ): las cargas positivas se mueven en la dirección del campo, mientras las cargas negativas lo hacen en dirección opuesta al campo.
17.3.2 Algunas distribuciones de carga i) Dipolo eléctrico Aunque la materia es neutra, en general, ya que tiene el mismo número de cargas positivas que negativas, la distribución de las mismas no es siempre simétrica, por lo que en muchas moléculas el centro de las cargas positivas y negativas está desplazado. Estas moléculas constituyen dipolos eléctricos y este carácter polar tiene importantes consecuencias en sus propiedades fisicoquímicas. La forma más simple de dipolo eléctrico lo constituye un par de cargas iguales, pero de signo opuesto, +q y –q, separadas una pequeña distancia, d.
9
Fuerzas, campos y potenciales eléctricos
El producto de la carga (q) por su distancia ( d ), considerada como un vector, orientado desde –q hacia +q (fig. 17.6), recibe el nombre de momento dipolar eléctrico: p = qd
(17.4)
Fig. 17.6. El momento dipolar p =deq dun dipolo se define como el producto de la carga por la distancia entre ellas d y está dirigido de la carga negativa hacia la positiva.
El campo eléctrico creado por el dipolo será la suma de los campos eléctricos creados por las cargas positiva y negativa. Aunque la carga total es nula, el campo eléctrico del dipolo no es nulo, al no coincidir exactamente la posición de ambas cargas. El resultado se presenta, de forma esquemática, por medio de las líneas de fuerza, en la figura 17.7a. En las proximidades de las cargas las líneas de fuerza son aproximadamente radiales (como en el caso de cargas aisladas), mientras que en posiciones intermedias el campo cambia apreciablemente. Obsérvese que las líneas de campo salen de la carga positiva y se dirigen a la negativa.
Fig. 17.7. (a) Líneas de campo del dipolo eléctrico constituido por dos cargas iguales pero de signo opuesto, separadas una cierta distancia, d. (b) Para puntos sobre el eje del dipolo, suficientemente alejados (r >> d), el campo eléctrico creado por el dipolo es:
10
Fundamentos físicos de los procesos biológicos
Como puede verse en la figura, el campo eléctrico en un punto del eje del dipolo es paralelo a dicho eje. Es fácil calcular su valor, sumando las contribuciones debidas a ambas cargas. El valor del campo en un punto P, situado a una distancia r del centro del dipolo, suficientemente alejado (r >> d), puede escribirse como: 2K E = 3e p r
(17.5)
donde p es el momento dipolar, tal como se indica en la figura 17.7b. Nótese que el campo eléctrico creado por el dipolo decrece como el cubo de la distancia (E ~ 1/r3), es decir, más rápidamente que en el caso del campo creado por una carga aislada (E ~ 1/r2). La mayoría de las moléculas formadas por átomos distintos, aun siendo eléctricamente neutras, presentan una distribución de carga asimétrica, teniendo alguno de sus átomos un exceso de carga positiva y otros exceso de carga negativa, por lo que se comportan como dipolos eléctricos. Un ejemplo, particularmente importante, lo constituye la molécula de agua, donde el átomo de oxígeno está cargado negativamente y los átomos de hidrógeno positivamente, lo que dota a la molécula de agua de un marcado carácter dipolar, de gran importancia para sus propiedades fisicoquímicas. ii) Distribuciones continuas de carga Con frecuencia, el número de cargas que intervienen en las situaciones de interés es muy elevado, por lo que en lugar de describir individualmente cada carga, se puede considerar que ésta se distribuye continuamente en el espacio o sobre una superficie. En esos casos la carga se define a partir de la densidad de carga, bien de volumen (ρ = dQ/dV), o bien de superficie (σ = dQ/dS). Distribución de carga con simetría esférica El campo eléctrico creado por una distribución de carga con simetría esférica, en un punto exterior a dicha distribución, es el mismo que si toda la carga estuviese concentrada en el centro de la esfera. Este resultado es similar al que se obtiene para el campo gravitatorio, debido a la similitud entre la ley de la gravitación de Newton y la ley de Coulomb. Planos cargados uniformemente Es fácil comprender que el campo eléctrico creado por un plano cargado uniformemente debe ser perpendicular al plano (fig. 17.8). Al calcular el valor del campo en un punto cualquiera P, y sumar la contribución de todas las cargas del plano, por cada carga situada en un punto A existe otra igual
11
Fuerzas, campos y potenciales eléctricos
ubicada simétricamente, B, con lo que la suma de los campos creados por ambas cancela las componentes paralelas al plano y la resultante es perpendicular al mismo. Este razonamiento es válido si el plano es infinito o, en términos más realistas, si la distancia entre el punto P y el plano es mucho menor que las dimensiones de éste, es decir, cuando P está “próximo” al plano. Se demuestra que el campo eléctrico creado por un plano infinito cargado es: σ E= uN 2ε 0
(17.6)
donde σ es la densidad superficial de carga y u N es un vector unitario perpendicular al plano. Nótese que el campo resulta ser independiente de la distancia al plano y, salvo constantes, su valor depende exclusivamente de la densidad de carga eléctrica. Si el plano está cargado positivamente (+σ) el campo se dirige hacia fuera (fig. 17.8), mientras que si la carga es negativa (–σ), el campo se dirige hacia el plano.
Fig. 17.8. El campo eléctrico en las proximidades de un plano cargado uniformemente, con densidad de carga σ = Q/S, es perpendicular al plano y su módulo (E = σ/2ε0) es independiente de la distancia al plano.
Una configuración habitual es el conjunto de dos planos cargados, con densidades de carga iguales pero de signo contrario +σ y –σ, lo que constituye un condensador plano. El campo eléctrico resultante será la suma de los campos creados por cada plano, que son iguales en módulo (e independientes de la distancia a los planos) cambiando tan solo el sentido respecto de cada plano debido al signo de la carga. En consecuencia, en la región exterior a los planos la dirección de los campos es opuesta y la suma se cancela ( E = 0 ), mientras en la región comprendida entre ambos planos las direcciones coinciden y el campo resultante se suma, resultando un campo eléctrico uniforme en el espacio comprendido entre los planos cargados, de valor:
12
Fundamentos físicos de los procesos biológicos
σ σ E= 2 × uN = uN 2ε0 ε0
(17.7)
estando dirigido del plano positivo hacia el negativo (fig. 17.9).
Fig. 17.9. Campo eléctrico creado por dos planos cargados (condensador plano). Al sumar el campo creado por el plano positivo y el negativo los campos se cancelan en el exterior y se suman en el interior, resultando un campo eléctrico uniforme dirigido del plano positivo al negativo.
17.4 Campos eléctricos en la materia. Polarización 17.4.1 Polarización inducida Hemos dicho con anterioridad que la mayoría de las moléculas presentan un carácter dipolar, debido a la falta de simetría en la distribución de carga. Este carácter dipolar lo adquieren también las moléculas e incluso los átomos no polares cuando se encuentran en un campo eléctrico (polarización inducida). Si consideramos un átomo como un núcleo positivo rodeado por una nube electrónica, con simetría esférica en torno al núcleo, el centro de ambas cargas coincide (fig. 17.10.a). Sin embargo, en presencia de un campo eléctrico externo, el centro de ambas cargas no coincidirá: el campo ejerce una fuerza sobre el núcleo cargado positivamente en la dirección del campo, mientras la nube electrónica, cargada negativamente, experimenta una fuerza en dirección opuesta. Las cargas positiva y negativa son separadas hasta que la fuerza atractiva entre ellas compensa la fuerza del campo eléctrico externo. Al separase las cargas, el átomo (o molécula) se ha convertido en un dipolo eléctrico inducido por el campo externo (fig. 17.10.b).
Fuerzas, campos y potenciales eléctricos
13
Fig. 17.10. (a) En un átomo, en ausencia de campo externo, el centro de las cargas positiva y negativa coincide. (b) Un campo externo separa ambas cargas, dando lugar a un dipolo eléctrico inducido.
Orientación de dipolos en un campo eléctrico La materia, en presencia de un campo eléctrico externo, se comporta siempre como un conjunto de dipolos, ya sea porque se trate de moléculas polares intrínsecas (como el agua) o moléculas en las que el campo eléctrico ha inducido un cierto momento dipolar. Por tanto, resulta necesario conocer el comportamiento de un dipolo eléctrico en presencia de un campo externo. Teniendo en cuenta que en un campo eléctrico uniforme las cargas positiva y negativa del dipolo experimentan fuerzas iguales en módulo pero dirigidas en direcciones opuestas (fig. 17.11), sobre el dipolo actúa un momento que lo hace girar orientándolo en la dirección del campo ( p ║ E ).
Fig. 17.11. Un dipolo en un campo eléctrico uniforme experimenta un par de fuerzas que tienden a alinearlo paralelamente al campo.
17.4.2 Constante dieléctrica Consideremos el efecto de un campo eléctrico sobre un material no conductor, también llamado dieléctrico, tal como el vidrio, plástico o madera. (Los materiales conductores y la corriente eléctrica serán estudiados en el capítulo 18). Supongamos que dicho material se sitúa en un campo eléctrico uniforme, tal como sucedería al situarlo entre las placas de un condensador plano (fig. 17.12).
14
Fundamentos físicos de los procesos biológicos
En ausencia de campo eléctrico, o bien las moléculas carecen de momento dipolar, o bien, aun teniendo un momento dipolar permanente, estarán orientadas aleatoriamente (fig. 17.12.a). En presencia del campo E0 el material se polariza, ya sea generando un momento dipolar inducido, ya sea orientando los dipolos permanentes, desplazándose las cargas positivas en la dirección del campo y las negativas en dirección opuesta (fig. 17.12.b). En el interior del dieléctrico estos desplazamientos se compensan, pero en los extremos del dieléctrico aparecen sendos excesos de carga +δq y –δq. En consecuencia, el material polarizado crea a su vez un campo E pol que, en el interior del mate rial, lleva la dirección contraria al campo externo y el campo resultante Etot , suma del campo externo y el debido a la polarización, es, por tanto, inferior al campo externo (fig. 17.12.c). La presencia de un dieléctrico reduce el valor del campo eléctrico. = E0 + E pol < E0 Etot
Fig. 17.12. El campo eléctrico en el interior de un medio dieléctrico se reduce por efecto de su polarización.
El factor en que se reduce el campo eléctrico depende de la facilidad de polarización de los átomos o moléculas del material, y se cuantifica por medio de la magnitud denominada constante dieléctrica (κ), definida a partir de la relación: = Etot E0 / κ < E0
de donde se deduce que: κ >1
Para calcular el campo eléctrico creado por una carga Q en el interior de un dieléctrico basta con sustituir el valor de la permitividad dieléctrica del
15
Fuerzas, campos y potenciales eléctricos
vacío (ε0) por la permitividad dieléctrica del material (ε), que se obtiene de multiplicar la permitividad del vacío por la constante dieléctrica. ε= κ × ε 0
(17.8)
Así, el campo eléctrico de un condensador plano con un material dieléctrico en su interior puede calcularse a partir de la ec. (17.7), sustituyendo la permitividad dieléctrica del vacío (ε0) por el valor de la permitividad dieléctrica del dieléctrico (ε): σ 1 1 σ 1 = E = u N u N = ( 4 π K e σ u N ) = E0 ε κ κ ε0 κ
(17.9)
Análogamente, el campo eléctrico creado por una carga puntual Q, en un medio dieléctrico, se obtendría de forma similar, a partir de la ley de Coulomb: = Etot
Q 1 1 Q 1 1 Q 1 = = = Eo 2 4πε r 4π (κε 0 ) r 2 κ 4πε 0 r 2 κ
(17.10)
Tal como hemos indicado anteriormente, el campo eléctrico se reduce en un factor igual a la constante dieléctrica. En la tabla 17.1, se resumen los valores de la constante dieléctrica de algunos materiales de interés. Nótese, en particular, el alto valor de la constante dieléctrica del agua (κ = 80). Esto es debido a su momento dipolar permanente, que, por efecto de un campo eléctrico, da lugar a su orientación produciendo una polarización macroscópica elevada. Esto da lugar a una reducción de la intensidad de las interacciones eléctricas en disolución, que juega un papel muy importante en Química y Biología, ya que apantalla y aísla las cargas, facilitando la disociación de las moléculas. Tabla 17.1. Constante dieléctrica de algunos materiales Material vacío aire papel vidrio plásticos aceite membrana celular agua
Constante dieléctrica (κ) 1 1,00059 ~ 3,5 5-10 2-20 2 7-9 80
16
Fundamentos físicos de los procesos biológicos
17.5 Interacción electrostática y energía 17.5.1 Energía potencial eléctrica Estamos ya familiarizados con los conceptos de trabajo y energía, que se definieron en el capítulo 5, y con las ventajas que ofrece su utilización para describir el movimiento bajo la acción de fuerzas conservativas. Y las fuerzas electrostáticas son conservativas. La fuerza que experimenta una carga q, en presencia de otra carga Q, queda es totalmente expresada por la ley de Coulomb F = ( K e qQ r 2 ) ur , cuya forma análoga a la ley de Newton de interacción gravitatoria F = − ( GmM r 2 ) ur , pudiendo obtenerse una de la otra sin más que intercambiar –GmM por Ke q Q.
(
)
(
)
En consecuencia, podemos aplicar a la interacción electrostática todo lo dicho en el Volumen 1 en relación con el trabajo y energía de las fuerzas gravitatorias. En particular, podemos asegurar que las fuerzas entre cargas eléctricas son fuerzas conservativas. Recordemos que esto significa que cuando una carga q se desplaza en el campo eléctrico creado por la carga Q (fig. 17.13) desde un punto (1) a otro punto (2), el trabajo W realizado por la fuerza eléctrica, sobre la carga q, puede expresarse como la diferencia de energía potencial U entre los dos puntos. Sólo depende, por tanto, de las posiciones inicial y final de la carga y no del camino seguido para pasar de una a otra posición. = W
2
Fdr ∫= 1
U ( r1 ) − U ( r2 )
= W
2
(17.11)
Fdr ∫= 1
U ( r1 ) − U ( r2 )
Fig. 17.13. Las fuerzas eléctricas son conservativas, por lo que el trabajo realizado sobre la carga q, desplazándose desde un punto (1) a otro (2), puede expresarse como la diferencia de energía potencial eléctrica entre los dos puntos.
17
Fuerzas, campos y potenciales eléctricos
La energía potencial electrostática se puede obtener de forma inmediata, a partir de la ec. (17.11) utilizando para la fuerza la ley de Coulomb, ec. (17.1), e integrando, con lo que se obtiene: U (r ) = K e
qQ r
(17.12)
Recordemos que, como se vio en el capítulo 5, la energía potencial está definida salvo una constante, lo que permite elegir el origen de energías. En la expresión (17.12) se ha hecho uso de esto, tomando como origen de energía potencial electrostática la situación en que las cargas se encuentran infinitamente alejadas: U (r → ∞) = 0
La tabla 17.2 resume las analogías entre magnitudes gravitatorias y electrostáticas. Tabla 17.2. Analogías entre magnitudes gravitatorias y electrostáticas Magnitud
Interacción gravitatoria
Interacción electrostática
Fuerza
L. de Newton F = − ( GmM r 2 ) ur
L. de Coulomb F = ( K e qQ r 2 ) ur
Magnitud característica
Masa, m
Carga, q
Energía potencial
U = −G mM r
U = K e qQ r
Potencial
V = −G M r
V = K eQ r
17.5.2 Potencial eléctrico Como hemos visto, la energía potencial de una carga q en un punto es proporcional al valor de dicha carga, es decir, si colocamos en el mismo punto una carga doble tendrá el doble de energía y una carga triple adquirirá un valor triple en su energía. Por ello resulta útil separar este efecto de aquellos otros que dependen exclusivamente del campo (de la carga que lo crea y de la posición), utilizando para ello el concepto de potencial eléctrico (V) o energía potencial por unidad de carga. V (r ) =
U (r ) q
(17.13)
18
Fundamentos físicos de los procesos biológicos
El valor del potencial a una distancia r de una carga puntual Q se obtiene de forma inmediata a partir de la ecuación (17.13): V ( r ) = Ke
Q r
(17.14)
y cuando hay varias cargas basta con sumar el potencial creado por cada una de ellas: V= total ( r )
N
Vi (r ) ∑= 1
N
∑K
e
1
Qi ri
siendo r i la distancia de cada carga al punto donde se calcula el potencial. Conociendo el potencial V(r) se puede determinar inmediatamente (ec. 17.13) la energía potencial U(r) que adquiere una carga cualquiera q en ese punto: U ( r ) = qV ( r )
El trabajo realizado por las fuerzas eléctricas, cuando una carga q se desplaza entre los puntos r1 y r2, vendrá dado por la diferencia de energía potencial entre ellos, que también se puede expresar en función de la dife rencia de potencial: = W
2 = ∫ Fdr U ( r1 ) − U ( r2 ) = q (V ( r1 ) − V ( r2 ) ) 1
(17.15)
que podemos reformular en términos del campo eléctrico Ecuación ( E = F / q ):
∫
2
1
Edr = V ( r1 ) − V ( r2 )
(17.16)
Si consideramos una región del espacio donde haya un campo eléctrico uniforme, como entre las placas de un condensador plano, por ejemplo, y nos desplazamos una distancia ∆r en la dirección del campo, podemos integrar inmediatamente la ecuación anterior obteniendo E ∫= dr E ( r2 − r1 ) = V ( r1 ) − V ( r2 ) = − V ( r2 ) − V ( r1 ) 1 2
es decir: E ∆r = − ∆V
o bien:
(17.17a)
19
Fuerzas, campos y potenciales eléctricos
E= −
∆V ∆r
17.17b)
donde el signo – indica que el campo eléctrico está dirigido hacia poten ciales decrecientes (fig. 17.14).
Fig. 17.14. El campo eléctrico está dirigido siempre hacia potenciales decrecientes.
La expresión (17.16) indica que, al igual que sucede con la energía potencial, son las diferencias de potencial (V(r1) – V(r2)) las que tienen sentido físico, pudiendo elegirse un origen de potenciales arbitrario. En el caso de cargas puntuales (ec. 17.14), se toma el infinito como cero de potenciales, pero no siempre se hace así. Por ejemplo, al estudiar el potencial de membrana (capítulo 19) se adopta habitualmente como origen de potencial el valor del medio extracelular (Ve = 0). La unidad de potencial eléctrico es el voltio (V) y corresponde, como indica la ecuación (17.13), al potencial que existe en un punto donde al situar una carga de un culombio ésta adquiere una energía potencial de un julio. 1 Voltio = 1 Julio / 1 Culombio En el lenguaje habitual se habla de “voltaje” cuando se quiere indicar cuál es la diferencia de potencial entre dos puntos, siendo ésta la forma habitual de describir las características eléctricas en muchas ocasiones cotidianas. Así, se dice que el voltaje en un enchufe es de 220 voltios, con lo que se quiere indicar que entre los dos terminales del mismo existe esa diferencia de potencial. Si ambos se conectan mediante un conductor, la carga se mueve de uno a otro debido a la diferencia energética entre dichos puntos. Si decimos que un dispositivo funciona a 1,5 voltios, queremos decir que ésa es la diferencia de potencial adecuada a la que deben conectarse los terminales correspondientes.
20
Fundamentos físicos de los procesos biológicos
Observación. Electronvoltio (eV). La descripción de los fenómenos atómicos y moleculares se fundamenta en la interacción electrostática entre protones y electrones, mientras que a nivel celular resulta necesario describir el movimiento de iones (Na+, K+, Cl–, Ca2+...). En todos estos casos se trata de describir el comportamiento de partículas con cargas cuya magnitud es del orden de la carga fundamental (e = 1,6 × 1019 C). Cuando una carga igual a la fundamental se mueve entre puntos con una diferencia de potencial de 1 voltio, adquiere una energía que se denomina electronvoltio (eV), y cuya equivalencia en el SI es: 1 eV =
(1, 6 × 10 ) × (1=) −19
1, 6 × 10−19 J
El electronvoltio es una unidad de energía adecuada, por tanto, para muchos procesos atómicos, moleculares y celulares, en los que se estudia el movimiento de cargas de algunos electrones en diferencias de potencial de voltios. Así, la energía del estado fundamental del átomo de hidrógeno es de 13,6 eV, la afinidad electrónica del fluor es de 3,4 eV, la energía de un fotón de luz visible varía entre 1,7 eV y 3,0 eV, la energía liberada en la hidrólisis del ATP es de 0,3 eV/molécula (en condiciones estándar), etc. En otros ámbitos de aplicación, implicando órdenes de magnitud dife rentes, también se expresa la energía en eV o, mejor dicho, sus múltiplos. Por ejemplo, las diferencias de potencial implicadas en los tubos de vacío como los televisores y tubos de rayos catódicos son del orden de kilovoltios (kV), por lo que las energías que alcanzan los electrones allí acelerados se expresan en kiloelectronvoltios (1 keV = 103 eV). De forma similar, las energías implicadas en procesos nucleares se indican en megaelectronvol tios (1 MeV= 106 eV). Observación. Unidades de campo eléctrico. La unidad de campo eléctrico en el SI es el NC1, pero en la práctica se expresa corriente mente en función del potencial, a partir de la ecuación (17.17), con la equivalencia: 1
N V =1 C m
17.5.3 Capacidad En el caso de un condensador plano, el campo eléctrico (E) es uniforme y perpendicular a las placas, pudiendo expresarse en función de la diferencia
21
Fuerzas, campos y potenciales eléctricos
de potencial entre las mismas (V) y su separación (d), a partir de la ecuación (17.17). E = V/d Pero, a su vez, podemos expresarlo en función de la carga de sus placas (ecuación 17.9): σ 1 σ = ε κ ε0
E=
donde σ = Q/S es la densidad superficial de carga y κ la constante dieléctrica del material existente entre las placas (si fuese el vacío o aire, κ ≈ 1). Por tanto, igualando ambas expresiones obtenemos: V σ Q = = d ε εS
o bien: Q=
εS V d
(17.18)
Es decir, existe una proporcionalidad entre la carga Q en las placas de un condensador plano y la diferencia de potencial V entre ellas. El coeficiente de proporcionalidad entre carga y potencial recibe el nombre de capacidad C. Q=C V
(17.19)
Y, por tanto, la capacidad de un condensador plano es: = C
S εS = κ ε0 d d
(17.20)
La capacidad del condensador plano depende de la geometría, concretamente del área de las placas S y de su separación d, así como de las propiedades dieléctricas del material entre las placas, a través de su constante dieléctrica κ. Si almacenamos cargas en un condensador con una geometría diferente, también existe una relación de proporcionalidad entre la carga acumulada y la diferencia de potencial que se genera (ec. 17.19), donde la capacidad tendría otra expresión diferente de la (17.20) aunque dependerá igualmente de la geometría del condensador y de la constante dieléctrica del medio.
22
Fundamentos físicos de los procesos biológicos
La unidad de capacidad en el SI es el faradio (F), que a partir de la expresión (17.19) se define como la capacidad de un condensador cuyas placas tienen una carga de 1 culombio cuando entre sus placas hay una diferencia de potencial de 1 voltio. Es decir: 1F =
1C 1V
El faradio es una unidad muy grande, por lo que en la práctica se utilizan habitualmente sus submúltiplos, tales como el microfaradio 1 µF = 10 –6 F y el picofaradio 1 pF = 10 –12 F. Conexión/asociación de condensadores Los condensadores suelen utilizarse conectados entre sí, existiendo dos formas básicas de hacerlo: en paralelo y en serie. Cuando dos condensadores se conectan tal como aparece en la figura 17.15 se dice que están conectados en paralelo. Las líneas continuas representan conexiones mediante conductores de resistencia despreciable, uniendo puntos que están a un mismo potencial (lo que quedará justificado en el capítulo siguiente), por lo que se puede considerar que ambos condensadores están conectados a puntos comunes A y B, es decir, con la misma diferencia de potencial entre las placas: V = VA – VB. Si las capacidades de los condensadores son C1 y C2, las cargas Q1 y Q2 de cada uno serán: Q1 = C1 V , Q2 = C2 V
La carga total es, por tanto: Q = Q1 += Q2 C1 V + C2= V
( C1 + C2 )V
Es decir, equivale a un único condensador con capacidad equivalente (C) igual a la suma de las capacidades: C = C1 + C2
(17.21)
23
Fuerzas, campos y potenciales eléctricos
Fig. 17.15. Asociación de condensadores en paralelo. Nótese que en los circuitos eléctricos, un condensador se representa por el símbolo , mientras que las líneas continuas representan conexiones mediante conductores de resistencia despreciable. En consecuencia, los condensadores están conectados a la misma diferencia de potencial y tendrán cargas diferentes, dependiendo de su capacidad. Tal como se muestra en la parte inferior de la figura, equivalen a un único condensador de capacidad equivalente C = C1 + C2.
Cuando dos condensadores se conectan tal como aparece en la figura 17.16 se dice que están conectados en serie. Cuando se aplica una diferencia de potencial entre los extremos A y B (V = VA – VB), la carga de ambos condensadores es la misma (el conjunto de la segunda placa del condensador 1 y la primera placa del condensador 2 ha de ser eléctricamente neutro). La diferencia de potencial en los condensadores es: V= VA − Vm = 1
Q Q Vm − VB = , V= 2 C1 C2
Siendo Vm el potencial en un punto intermedio (fig. 17.16). La diferencia de potencial entre los extremos es: V= VA − VB= V1 + V= 2
1 Q Q 1 = + Q + C1 C2 C1 C2
Es decir, el conjunto equivale a un único condensador con capacidad equivalente (C), tal que 1 1 1 = + C C1 C2
(17.22)
24
Fundamentos físicos de los procesos biológicos
Fig. 17.16. Asociación de condensadores en serie. Los condensadores adquieren la misma carga y la diferencia de potencial entre las placas depende de su capacidad. Equivalen a un único condensador de capacidad 1/C = 1/C1 + 1/C2.
17.5.4 Energía del campo eléctrico Al cargar un condensador, separando las cargas positiva y negativa una cierta distancia d, se está realizando un trabajo en contra del campo eléctrico, almacenándose energía que puede utilizarse con posterioridad para producir movimiento de cargas. ¿Cuánto vale la energía almacenada en un conden sador con carga Q y diferencia de potencial V? Teniendo en cuenta que el potencial representa la energía por unidad de carga, podría pensarse que la energía almacenada es: Energía = Q V, pero, en realidad, la energía almacenada en el condensador se genera de forma paulatina. El proceso no se hace desplazando una carga Q contra una diferencia de potencial V constante, sino que la diferencia de potencial cambia de forma simultánea al cambio en la carga almacenada, manteniéndose siempre la proporcionalidad q = C V entre ellas. Para hallar la energía del condensador hay que sumar la energía almacenada por cada incremento de carga dq que se produce. Así, en un estado de carga intermedio se transfiere una carga dq a un potencial V (fig. 17.17.a), con lo que la energía potencial de la carga se incrementa en: d ( Energía = dq ) V=
q dq C
Por tanto, al cargar el condensador desde la carga q = 0 hasta la carga final q = Q, la energía acumulada es: Energía =
Q
V dq ∫= 0
∫0 ( q / C ) dq = Q
1 Q2 2 C
25
Fuerzas, campos y potenciales eléctricos
Y utilizando Q = C V, se obtienen expresiones alternativas: Energía =
1 Q2 1 1 = QV = CV 2 2 C 2 2
(17.23)
Lo que también se puede obtener de forma gráfica, representando el valor delQ potencial en función de la carga (V = q/C), y considerando que la energía ( ∫0 V dq ) equivale al área del triángulo de la figura 17.17.b, es decir, 1 energía = Q × ( Q C ), que coincide con el valor obtenido mediante el cálculo integral. 2
Fig. 17.17. La energía almacenada en un condensador de capacidad C con una carga Q es igual al área bajo la curva:
(q/C) dq = (1/2)Q2/C = (1/2)QV.
17.6 Propiedades eléctricas de la membrana celular Toda célula está rodeada por una membrana (membrana plasmática) que le permite mantener su identidad, aislándola del exterior. El modelo aceptado hoy en día para la membrana celular (mosaico fluido) es común para todos los organismos vivos (animales, plantas y microorganismos) y se presenta de forma simplificada en la figura 17.18. La membrana, de un espesor aproximado entre 8 y 12 nm (1 nm = 10 –9 m), consta de una doble capa lipídica, con los extremos hidrofóbicos hacia el interior y las cabezas hidrofílicas hacia el exterior de la membrana y en contacto con el citosol y el medio extracelular. La membrana celular incorpora también diferentes proteínas, algunas de ellas denominadas de canal, que permiten el intercambio de sustancias entre el citosol y el exterior, lo que resulta imprescindible para el mantenimiento de la actividad celular. La permeabilidad de la membrana resulta ser muy selectiva, permitiendo el paso de determinadas sustancias e impidiendo el paso de otras. Esta selectividad da lugar (capítulo 19) a que la composición iónica del citosol sea notablemente diferente del medio externo, produciéndose un exceso de iones K+ y un defecto de iones Na+ y Cl– respecto a sus concentraciones en el medio extracelular.
26
Fundamentos físicos de los procesos biológicos
Como consecuencia de este desequilibrio iónico, aparece una carga eléctrica neta a ambos lados de la membrana, estando el citosol cargado negativamente respecto al exterior, lo que da lugar a la aparición de un campo eléctrico en la membrana y una diferencia de potencial eléctrico entre el exterior y el citoplasma, denominado potencial de membrana.
Fig. 17.18. (a) La membrana celular es una fina capa (10 –8 m) dieléctrica. (b) Está compuesta por una doble capa lipídica con los extremos hidrofóbicos hacia el interior y las cabezas hidrofílicas hacia el exterior.
Campo eléctrico y potencial en la membrana celular La membrana se puede considerar, desde el punto de vista eléctrico, como un condensador, aproximadamente plano, ya que su espesor es mucho menor que las dimensiones celulares. Por tanto, sus propiedades quedarán descritas por su espesor d, área S y permitividad dieléctrica ε (o la constante dieléctrica κ = ε/ε0) y el valor del campo eléctrico y del potencial de membrana quedan determinados por el valor de la densidad superficial de carga en la membrana. Medidas eléctricas realizadas en membranas demuestran que el campo eléctrico es del orden de: E ≈ 107 N C −1
Podemos calcular también el valor de la diferencia de potencial entre el citosol y el medio extracelular, que, suponiendo de nuevo que se trata de un condensador plano, con campo uniforme en su interior y tomando como valor estándar para el espesor de la membrana d ≈ 10 nm = 10 ‒8 m, será: ∆V = E d ≈ 107 × 10−8 = 0,1 V = 100 mV
Se adopta como convenio tomar el potencial exterior a la célula como cero, por lo que, como el citosol se encuentra negativamente cargado respecto al medio extracelular, el potencial en el interior es del orden de: Vi ≈ −100 mV
27
Fuerzas, campos y potenciales eléctricos
aunque, como veremos en el capítulo 19, este valor puede sufrir variaciones notables debido a cambios en la concentración iónica del citosol, particularmente de iones Na+ y K+, debido a modificaciones en la permeabilidad de la membrana plasmática. Estos cambios de permeabilidad de la membrana pueden ser debidos a diferentes estímulos, tanto químicos como físicos, lo que confiere a la célula propiedades de excitabilidad, es decir, la capacidad de reaccionar ante estímulos externos. Algunas células son particularmente activas desde este punto de vista, tales como las células nerviosas, cuyo estudio abordaremos en el capítulo 19. Extraer un ion positivo desde el interior al exterior de la célula, por ejemplo un ion K+ de carga q = +e, requiere realizar un trabajo: = W q ∆V ≈ (1e ) × ( 0= ,1V ) 0= ,1 eV 1, 6 × 10−19 × 0= ,1 1, 6 × 10−20 J
Por ello, las actividades nerviosa y muscular, que implican el flujo de iones a través de la membrana de las neuronas y células musculares respectivamente, requieren un aporte energético. Capacidad Considerando la geometría de la membrana, su capacidad eléctrica se puede expresar como: C = (κ ε 0 )
S d
Como se verá en el capítulo 19, es habitual utilizar la capacidad específica o capacidad por unidad de área ce como la magnitud adecuada para caracterizar la membrana. c= e
C κ ε0 = S d
Si utilizamos como espesor característico de la membrana d ≈ 10 nm, y un valor de constante dieléctrica κ ≈ 9, se obtendría: ce ≈
9 × 8, 85 × 10−12 ≈ 8 × 10−3 F m −2 = 0, 8 µ F cm −2 10−8
que concuerda razonablemente con el valor obtenido experimentalmente en diferentes tipos de células: ce (experimental) ≈ 1 μF cm–2 = 10 –2 F m–2
28
Fundamentos físicos de los procesos biológicos
Sin embargo, algunas membranas parecen tener capacidades específicas con valores muy inferiores. Nos referimos a las fibras nerviosas con mielina (véase el capítulo 9), donde la capacidad específica se reduce a ce < 0,01 µF/ cm2, lo que tiene importantes efectos en la propagación del impulso nervioso. La razón de esta disminución en la capacidad específica estriba en la naturaleza de estas células. Una fibra nerviosa con mielina, típica de los vertebrados, está envuelta por una capa aislante, correspondiente a un recubrimiento de células especializadas, en una especie de arrollamiento espiral que aumenta el espesor en cerca de un factor 200. Como la capacidad y la capacidad específica son inversamente proporcionales al espesor d, sus valores resultan divididos por ese mismo factor. Como se verá más adelante, esto supone una disminución importante en los tiempos característicos de respuesta de la membrana (capítulos 18 y 19) que se traduce en un aumento en la velocidad de propagación de los impulsos nerviosos. La densidad superficial de carga acumulada a ambos lados de la membrana es: σ=
Q CV = = ce Ed ≈ 10−2 × 107 × 10−8 = 10−3 C m −2 S S
lo que representa una densidad superficial de iones monovalentes: N=
iones iones σ 10−3 = ≈ 6 × 1015 = 6.000 −19 2 e 1, 6 × 10 m µ m2
Esto supone una número de iones pequeño, comparado con las concentraciones habituales en el citoplasma celular, como se comprobará más adelante, equivalente a una fracción de apenas 10 –5 del número total de iones. Por tanto, se puede suponer que la célula mantiene, en términos macroscópicos, la neutralidad de carga. El valor del campo eléctrico en la membrana celular es suficientemente alto como para provocar el flujo de iones entre el citosol y el exterior de la célula, cuando la permeabilidad de la membrana así lo permite. Estos flujos debidos al campo eléctrico (gradiente de potencial) junto a los debidos a gradientes de concentraciones determinan muchas de las propiedades celulares, incluyendo la propagación de impulsos nerviosos, como se verá en el capítulo 19. Observación. Peces eléctricos. Electrorrecepción. Acabamos de ver que todas las células experimentan actividad eléctrica en sus membranas (especialmente las células nerviosas y musculares). En consecuencia,
Fuerzas, campos y potenciales eléctricos
29
todos los organismos generan señales eléctricas que pueden ser detectadas externamente. Algunos peces son electrorreceptivos, es decir, tienen la capacidad de detectar campos eléctricos, lo que a veces ha sido considerado como un “sexto sentido”. Los tiburones son un ejemplo de peces capaces de detectar a sus presas a través del campo eléctrico, lo que les permite su localización incluso si se encuentran enterradas bajo la arena. Pero el nombre de peces eléctricos suele reservarse para aquellos que no solo son capaces de detectar los campos eléctricos, sino que son “electrogénicos”, es decir, ellos mismos son capaces de generar campos eléctricos. Estos peces poseen un órgano eléctrico (OE) especializado, mediante el cual son capaces de generar des cargas eléctricas, en general en forma de pulsos. Los “peces eléctricos débiles” generan descargas débiles (E < 0,5 V/cm) que utilizan para la detección (electrolocalización) y para comunicación entre individuos (electrocomunicación), aunque también existen “peces eléctricos fuertes”, como la anguila eléctrica o el pez torpedo, capaces de generar des cargas suficientemente intensas como para aturdir a sus presas. Muchos de los peces eléctricos habitan en aguas turbias con baja visibi lidad, por lo que el sentido de la electrolocalización aporta ventajas evi dentes en este entorno. La electrolocalización es en cierto modo equivalente a la ecolocalización mediante ondas sonoras, utilizada por los murciélagos en el aire y por los delfines y ballenas en el agua (capítulo 21). Se trata de una localización activa, en la que el individuo detector se encarga también de emitir la señal que, tras rebotar o ser distorsionada por un objeto, se va a emplear para la detección. En el caso de la electrolocalización, el pez pro duce una descarga eléctrica, debido al desplazamiento de cargas que genera en el órgano eléctrico. Este consiste en un apilamiento de células excitables (electrocitos), derivadas de la modificación de células musculares o nerv iosas, cuya disposición les permite producir señales eléctricas intensas, estando localizado en muchas especies (aunque no todas) en la región caudal (fig. 17.19). La separación de cargas que se produce en el órgano eléctrico produce un campo eléctrico de tipo dipolar en torno al animal. El campo eléctrico es detectado por electrorreceptores, localizados principalmente a lo largo de la línea lateral del pez, alcanzando la máxima densidad en la cabeza. Por ejemplo, el Apteronotus albifrons tiene unos 15.000 electrorreceptores, que se extienden a lo largo de todo el cuerpo (12 receptores/mm2) y cuya máxima densidad (1020 receptores/mm2) se sitúa cerca de la boca del animal. Hay dos tipos de órganos electrorreceptores que difieren morfológica
30
Fundamentos físicos de los procesos biológicos
y funcionalmente: los receptores “ampulares” (forma de ampolla) y “tubu lares” (con forma de tubo). Los primeros están presentes en todos los peces electrosensitivos y responden a señales continuas o de baja frecuencia (50 Hz), mientras los segundos, que responden a estímulos de alta frecuencia (hasta 2.000 Hz), son característicos de los peces eléctricos activos. En cuanto al rango de acción de la electrorrecepción, debe tenerse en cuenta (como hemos visto en la sección 3.2) que el campo eléctrico dipolar decae rápidamente con la distancia (E ~ 1/r3), por lo que su utilización tiene un alcance limitado. La electrolocalización no parece ser operativa a distan cias superiores a unos pocos metros.
Fig. 17.19. Localización del órgano eléctrico en algunos de los peces eléctricos (a) pez elefante, (b) raya, (c) anguila.
17.7 Ejercicios propuestos Ejercicio 17.1 En un cristal de cloruro sódico los iones Na+ y Cl– ocupan posiciones correspondientes a una red cúbica, siendo la distancia entre iones más próximos d = 2,82 Å. Calcúlese (a) la fuerza entre dos iones Na+ y Cl adyacentes, (b) la fuerza entre dos iones Na+ (a una distancia 2d). Sol.: (a) 2,9 × 10 ‒9 N (b) 7,2 × 10 ‒10 N Ejercicio 17.2 Tres cargas están alineadas, tal como se indica en la figura 17.20. La carga q1 = +2 C está a una distancia de 1 m de la carga q2 = –1 C, que, a su vez, dista 2 m de la tercera carga q3. Calcúlese el valor de esta última carga para que la fuerza total sobre q2 sea cero. Sol.: q3 = +8 C
Fuerzas, campos y potenciales eléctricos
31
Fig. 17.20.
Ejercicio 17.3 Tres cargas se encuentran situadas como se indica en la figura 17.21. La carga q1 = +4 C está situada en el punto (–2, 0), la carga carga q2 está en el origen de coordenadas y la carga q3 = +1 C, situada en (0, –1). Calcúlese (a) el valor de la fuerza total sobre q2, (b) el módulo de la fuerza si q2 = –2 C.
Fig. 17.21.
= K e × q2 × ( i + j ) N (b) = Sol.: (a) F F 2, 5 × 1010 N
Ejercicio 17.4 Calcúlese la relación entre el valor de las fuerzas eléctrica y gravitatoria entre el protón y electrón en un átomo de hidrógeno. Datos: masas del electrón y del protón. me = 9,11 × 10 31 kg y Mp = 1,67 × 10 27 kg ≈ 1840 me. Sol.: Fe FG ≈ 2 × 1039 Ejercicio 17.5 Al frotar una varilla plástica, ésta se carga eléctricamente y atrae un fragmento de papel, de masa m = 1 mg, que comienza a elevarse cuando la varilla se acerca a una distancia r = 0,5 cm. Si suponemos que esto es debido a que la varilla adquiere una cierta carga positiva +q y, por inducción, el papel adquiere una carga similar y de signo contrario a la varilla ( q), calcúlese (a) el valor de dicha carga q, (b) el número del exceso de electrones en el papel (N =q/e). Sol.: (a) q = 1,6 × 10 ‒10 C (b) N = 109 Ejercicio 17.6 Dos cargas puntuales Q1 = +1 nC y Q2 = –2 nC (1 nC = 10–9 C) se sitúan sobre el eje X, en posiciones x1 = ‒1 m y x2 = +2 m, como indica
32
Fundamentos físicos de los procesos biológicos
la figura 17.22. Calcúlese (a) el campo eléctrico en el origen de coordenadas y (b) la fuerza sobre un ion Cl‒ que se encontrase en dicho punto.
Fig. 17.22.
e−18 Ftot =(a)−2E,16 10 Sol.: NC‒1 (b) Ftot = −2,16 × 10−18 i N = ×13,5 pi N 3 2K r
Ejercicio 17.7 Tres cargas puntuales Q1 = +1 nC, Q2 = –2 nC y Q3 se sitúan sobre el eje X, en posiciones x1 = –1 m, x2 = +1 m y x3 = +2 m, como indica la figura 17.23. ¿Cuál ha de ser el valor de la carga Q3 para que el campo eléctrico en el origen de coordenadas sea nulo?
Fig. 17.23.
Sol.: Q3 = 12 nC Ejercicio 17.8 Dos cargas Q1 = +1 nC y Q2 = –2 nC se sitúan, respec tivamente, en los puntos (2,0) y (0,1), como indica la figura 17.24. ¿Cuál es el módulo del campo eléctrico en el punto (1,1)?
Fig. 17.24.
Sol.: E = 8,6 N/C Ejercicio 17.9 Verifíquese que el campo eléctrico creado por un dipolo, de momento dipolar p = q d , en un punto P del eje del dipolo, 2Ksuficiente 2K =e p/r33e) p ]). mente lejano (r >> d), es el expresado en la ecuación 17.5 [ E ==E(2K 3 er r
33
Fuerzas, campos y potenciales eléctricos
(Orientación: calcúlese el campo como la suma vectorial de los campos creados por cada una de las cargas, y simplifíquese el resultado conside rando que, para puntos alejados, r2 >> d2). Ejercicio 17.10 En la molécula de HCl (fig. 17.25) podemos considerar que el hidrógeno cede un 15 % de su carga electrónica al cloro (δq = 0,15e). Calcúlese el momento dipolar resultante si la distancia entre los centros de las distribuciones de carga es de 1,8 Å .
Fig. 17.25.
Sol.: p = 4,3 × 10
‒30
Cm
Ejercicio 17.11 La figura 17.26 muestra un modelo simplificado de la molécula de agua. Los enlaces oxígeno-hidrógeno tienen una longitud d ≈ 1 Å = 10 10 m y forman entre sí un ángulo α ≈ 104º. Cada átomo de hidrógeno tiene un exceso de carga +δq y el átomo de oxígeno –2 δq. Sabiendo que el módulo del momento dipolar de la molécula es p = 6 × 1030 C m, calcúlese el exceso de carga δq.
Fig. 17.26.
Sol.: δq ≈ 4,9 × 10 ‒20 C ≈ 0,30 e Ejercicio 17.12 El campo eléctrico entre las placas de un condensador plano es de 600 N/C. (a) ¿Cuál es la densidad de carga en las placas? (b) Si las placas del condensador son cuadradas, de lado L = 6 cm, ¿cuál es la carga en cada una de ellas? Sol.: (a) σ = 5,3 × 10 ‒9 C/m2
(b) Q = 1,9 × 10 ‒11 C
34
Fundamentos físicos de los procesos biológicos
Ejercicio 17.13 En una tormenta se produce la descarga de un rayo debido a que la nube está cargada positivamente mientras que la superficie terrestre tiene carga negativa. Si suponemos que el sistema nubeTierra se puede con siderar como un condensador plano, siendo su superficie igual al área de la nube e igual a 1 km2, y el rayo se produce cuando el campo eléctrico en al aire es superior a unos 3.000.000 N/C, ¿cuál es la carga acumulada en la nube? Sol.: Q = 27 C Ejercicio 17.14 La fuerza entre dos iones Na+ y Cl–, a una distancia r, es de 4 pN. Si dichos iones se encuentran a la misma distancia en una disolución acuosa, donde la constante dieléctrica es κ = 80, ¿cuál sería la fuerza entre ellos? Sol.: F = 0,05 pN Ejercicio 17.15 Un protón está inmóvil en el origen de coordenadas y un electrón es acelerado por efecto del campo eléctrico creado por él. Calcúlese (a) el potencial eléctrico V en un punto situado a 2 µm del origen, (b) energía potencial U del electrón en dicho punto. Si el electrón está inicialmente en reposo, hállese (c) la energía cinética Ec y (d) la velocidad v que adquiere el electrón cuando se encuentra a 1 µm del protón. Sol.:
(a) V = 7,2 × 10 ‒4 V (b) U = ‒1,2 × 10 ‒22 J (c) Ec = 5,8 × 10 ‒23 J (d) v = 1,1 × 104 ms‒1
Ejercicio 17.16 En el átomo de hidrógeno, la distancia promedio del elec trón al protón del núcleo (radio de Bohr) es a0 = 0,0529 nm. ¿Cuál es la energía potencial electrostática? Sol.: U = –27,2 eV Ejercicio 17.17 Una carga negativa Q1 = – q está situada en el eje X, a una distancia L del origen, donde se halla una segunda carga positiva, de valor doble Q2 =+2q. Calcúlese en qué posición se anula el potencial eléctrico. Sol.: x = 2/3 L Ejercicio 17.18 Un anillo de radio a está cargado con una carga Q. Calcúlese el potencial en un punto P del eje del anillo a una distancia x del centro (fig. 17.27).
Fuerzas, campos y potenciales eléctricos
35
Fig. 17.27.
Sol.: V ( x ) = K e
Q a2 + x2
Ejercicio 17.19 En una configuración similar a la del problema anterior, la carga total distribuida en el anillo es Q = 4 × 10‒15 C y el radio del anillo a = 1 cm. Un protón se encuentra inicialmente en reposo en x = 1 cm, ale jándose del origen por efecto del campo eléctrico creado por Q. Calcúlese su velocidad en x = 3 cm. Sol.: v ≈ 519 ms‒1 Ejercicio 17.20 Dos placas metálicas, separadas una distancia de 0,1 mm, tienen cargas iguales, y de signo contrario, existiendo una diferencia de potencial entre ellas de 10 V. Calcúlese el campo eléctrico entre las placas. Sol.: 1 × 105 V/m Ejercicio 17.21 Si las placas del problema anterior son cuadradas, de lado l = 10 cm, calcúlese (a) la capacidad C del condensador, (b) la carga total Q en cada placa, (c) la energía almacenada. Sol.: (a) C = 885 ρF (b) Q = 8,85 nC (c) 4,4 × 10 –8 J Ejercicio 17.22 En el interior del tubo de vacío de un televisor, los elec trones son acelerados en un “cañón de electrones”, por medio de una dife
36
Fundamentos físicos de los procesos biológicos
rencia de potencial de 15 kV aplicados entre las placas de un condensador, separadas una distancia d ≈ 3 cm. (a) ¿Cuál es el valor del campo eléctrico aplicado? (b) ¿Cuál es la energía que adquieren los electrones? (c) ¿Cuál es la velocidad final de los electrones, cuya masa es me = 9,11 x 10–31 kg? Sol.: (a) 5 × 105 V/m (b) 2,4 × 10 ‒15 J (c) v = 7,3 × 107 ms‒1 Ejercicio 17.23 Consideremos un condensador plano formado por dos láminas metálicas cuadradas de lado L, separadas por una lámina de papel de 1 mm de espesor, cuya constante dieléctrica es κ = 3,5. ¿Cuáles deben ser sus dimensiones para obtener una capacidad igual a un faradio? Sol.: L = 5,7 km Ejercicio 17.24 Un condensador plano, de 1 cm2 de superficie, tiene una separación entre placas de 1 mm. Calcúlese la capacidad del condensador (a) si entre las placas se hace el vacío, (b) si se llena de agua. Sol.: (a) 0,885 pF (b) 71 pF Ejercicio 17.25 Sabiendo que el campo de ruptura dieléctrica del aire es de 3 × 106 V/m, hágase una estimación (suponiendo que los campos pueden considerarse uniformes) de (a) la distancia mínima de aproximación de dos conductores conectados a la red, (b) la diferencia de potencial nubetierra (distancia aproximada, 500 m) durante la descarga de un rayo. Sol.: (a) 0,1 mm (b) 1,5 × 109 V Ejercicio 17.26 Considerando el sistema de condensadores ilustrado en la figura 17.28, determínese (a) la capacidad total equivalente. Si se conectan los puntos A y B a una diferencia de potencial de 1000 V, hállese (b) la diferencia de potencial entre placas de cada condensador, (c) la carga total almacenada y (d) la carga parcial de cada uno de los condensadores. Sol.: (a) 1,875 μF (b) V1 = 375 V, V2 = V3 = 625 V (c) Qtotal = 1,875 × 10‒3 C (d) Q1 = Qtotal = 1,875 × 10‒3 C, Q2 = 1,25 × 10‒3 C, Q3 = 6,25 × 10‒4 C
Fig. 17.28.
Fuerzas, campos y potenciales eléctricos
37
Ejercicio 17.27 El campo eléctrico en el interior de la membrana celular es E ≈ 107 NC‒1. Calcúlese (a) la fuerza Fe que experimenta un ion Na+ cuando atraviesa la membrana (fig. 17.29), (b) compárese dicha fuerza con el peso P del ion.
Fig. 17.29.
Sol.: (a) Fe = 1,6 × 10
‒12
N (b) Fe / P ≈ 4,3 × 1012
Ejercicio 17.28 La capacidad específica de la membrana celular es ce ≈ μFcm‒2 y la diferencia de potencial entre el citoplasma y el medio extrace lular es Vi ≈ 100 mV. Calcúlese la energía eléctrica almacenada en la mem brana de una célula, de forma esférica, de 100 µm de radio. Sol.: 6,3 × 10 ‒12 J
17.8 Referencias Aguilar Gutiérrez, M. “Bioelectromagnetismo: campos eléctricos y magnéticos y seres vivos”. Colección Textos Universitarios, n.º 32. CSIC, Madrid, 2001. Goodman, S. y Hardin, D. Lightning & Atmospheric Electricity. http://thunder.nsstc.nasa.gov/ Patton, H.D.; Fuchs, A.F.; Hille, B.; Scher, A.M. and Steiner, R. (eds). Textbook of physiology, vol. 1: Excitable cells and Neurophysiology. W.B. Saunders company, 1989. Vázquez, J. Biofísica: Principios fundamentales. EYPASA, 1993. Wilkinson, J. Animal Communication. http://www.life.umd.edu/faculty/ wilkinson/BSCI338/
Capítulo 18. Corriente eléctrica 18.1 Movimiento de cargas: cargas libres, conductores y aislantes En presencia de un campo eléctrico, una partícula cargada experimenta una fuerza que tenderá a desplazarla. Cualquier flujo de carga eléctrica cons tituye lo que se denomina una corriente eléctrica. Pero la movilidad de las cargas, y el tipo de movimiento que experimentan, puede ser muy diferente de unas situaciones a otras. Una primera posibilidad es que nos encontremos con cargas susceptibles de moverse sin ningún impedimento, lo que se conoce como “cargas libres”. Esta es la situación en que se encuentran los iones y partículas cargadas en un acelerador, o los electrones en un tubo de rayos catódicos (como los de algunos televisores) o en el interior de un microscopio electrónico. En estos dispositivos los electrones, partículas e iones se encuentran en un recinto en el que se ha practicado un vacío elevado y en el que pueden desplazarse libremente. Si en este recinto vacío existe una cierta diferencia de potencial entre , y una partícula de E dos regiones del espacio, existirá un campo eléctrico carga q y masa m, experimentará una fuerza F = qE y por tanto se moverá con una aceleración: a = (q m) E
(18.1)
Si el campo eléctrico es uniforme las cargas experimentarán, por tanto, un movimiento uniformemente acelerado, con la consiguiente variación en su velocidad. Si, como hemos dicho, el movimiento se produce en el vacío, en ausencia de cualquier tipo de fuerza disipativa, la energía total de la carga, suma de su energía potencial eléctrica U y de la energía cinética Ecin, se conserva. 1 Etotal= U + E= qV + m v 2 = cons tan te constante cin 2
donde V representa el potencial eléctrico y v la velocidad de las cargas.
39
(18.2)
40
Fundamentos físicos de los procesos biológicos
Sin embargo, la situación anterior no es, ni mucho menos, la más habitual en nuestro entorno. Seguramente estamos acostumbrados a asociar la corriente eléctrica con el funcionamiento de multitud de aparatos “eléctricos” o “electrónicos” que nos acompañan en el día a día: bombillas, electrodomésticos, teléfonos móviles, PC, etc. En ellos, las corrientes eléctricas asociadas a su funcionamiento se producen por el movimiento de electrones en circuitos eléctricos a través de materiales conductores (o semiconductores), que a su vez están recubiertos de algún material aislante, que impide la fuga de la corriente eléctrica fuera del circuito. En estos casos las corrientes eléctricas no se deben al movimiento de cargas libres en el vacío, sino al movimiento de cargas en algún medio material en el que están sometidas a interacciones con el entorno. En algunos materiales las cargas pueden moverse distancias apreciables mientras en otros su movilidad es muy reducida, limitándose a ligeros desplazamientos en torno a su posición de equilibrio. Este último caso corresponde al de los materiales aislantes o dieléctricos, que hemos estudiado en el capítulo anterior al referirnos a la polarización, y donde veíamos que el movimiento de las cargas se limitaba a un desplazamiento de corto alcance. Son buenos aislantes eléctricos, por ejemplo, el vidrio, la mayoría de los plásticos, o el papel y madera, así como los líquidos no-polares (aceites). Por el contrario aquellos materiales donde la carga puede desplazarse con cierta facilidad (aunque como veremos enseguida el movimiento no es libre) reciben el nombre de materiales conductores. Los metales como el oro, la plata, el cobre, etc., son buenos conductores. En ellos la conducción eléctrica se realiza por medio del desplazamiento de electrones (en dirección opuesta al campo eléctrico). Los átomos constituyentes del material se distribuyen en una cierta red cristalina, donde los núcleos y electrones más internos de cada átomo se encuentran localizados en posiciones fijas. Sin embargo, los electrones más externos (electrones de valencia) están débilmente ligados al núcleo y forman una “nube electrónica” con capacidad de movimiento. El ejemplo característico es el cobre, utilizado en la mayoría de los cables utilizados en las aplicaciones de la electricidad en nuestro entorno. El átomo de cobre, con número atómico 29, tiene por tanto 29 protones en el núcleo y 29 electrones a su alrededor, de los que 28 se encuentran fuertemente ligados al núcleo, mientras que el electrón más externo forma parte de la “nube electrónica” susceptible de moverse con cierta facilidad, confiriendo al cobre su característica de buen conductor eléctrico. Otros metales se comportan de forma parecida, cediendo cada átomo del material electrones a la “nube electrónica” responsable de la conductividad del metal.
41
Corriente eléctrica
También son buenos conductores los conductores iónicos, es decir, aquellos donde las especies cargadas móviles son iones en lugar de electrones. En particular el agua, por su capacidad para mantener una gran variedad de iones en disolución (solución electrolítica) que gozan de movilidad apreciable, constituye un medio conductor relevante, especialmente por sus implicaciones biológicas. Así, en el caso de los fluidos fisiológicos, el desplazamiento de iones tales como Na+, K+, Cl– o Ca2+ desempeña un papel fundamental en la fisiología celular. A diferencia del movimiento de cargas en el vacío, tanto los electrones de conducción en un metal como los iones en disolución ya no son libres de moverse sin restricciones, sino que tienen una movilidad limitada. En sus desplazamientos interaccionan fuertemente con el medio en el que se mueven, que opone una cierta resistencia y, debido a ello, ya no se mueven con movimiento uniformemente acelerado, sino que lo hacen con velocidad constante, como analizaremos cuantitativamente en la próxima sección. La situación es similar al movimiento de un móvil en un fluido considerando la existencia de fuerzas de arrastre (capítulos 3 y 14), donde la fricción aumenta hasta igualar la fuerza externa, resultando finalmente un movimiento con velocidad cons tante (velocidad límite) y, por tanto, manteniéndose una energía cinética constante. En ambos casos la energía comunicada al móvil por la fuerza externa se disipa íntegramente en forma de calor. La mayor o menor facilidad de movimiento de una partícula cargada (electrón o ion) en un medio material se cuantifica por medio de su movilidad (µ), definida como la constante de proporcionalidad entre la velocidad (v) que adquiere la partícula cuando se mueve bajo la acción de un campo eléctrico (E): v =µ E
(18.3)
Observación. La movilidad que acabamos de definir relaciona la velocidad que adquiere una partícula cargada por la acción de un campo eléctrico. Sin embargo, en el capítulo 12, al estudiar la difusión con arrastre bajo la acción de una fuerza F cualquiera, se definió la movilidad como “el cociente entre la velocidad y el módulo de la fuerza”, denotándose por K. Obviamente ambas definiciones no son idénticas, ya que en el caso de tratarse de una fuerza v µ= E KF = Kq E , es decir: µ = Kq . eléctrica, tendríamos:= Según el contexto, en Física, se puede hablar de movilidad en uno u otro sentido, por lo que conviene prestar atención al significado que se le asigne a dicho término. En este texto, a fin de evitar confusiones, manten dremos la diferenciación en la notación, designando por K a la movilidad
42
Fundamentos físicos de los procesos biológicos
“generalizada” (velocidad por unidad de fuerza externa) y µ a la movilidad eléctrica (velocidad por unidad de campo eléctrico).
18.2 Intensidad de corriente eléctrica La corriente eléctrica se caracteriza mediante una magnitud denominada intensidad de corriente. Consideremos, por ejemplo, un hilo conductor cilíndrico por el que se mueven una serie de cargas q desplazándose en dirección perpendicular a la sección transversal del conductor S. Si en un cierto intervalo de tiempo ∆t atraviesa la sección transversal del conductor una carga neta ∆q, se define la intensidad de corriente I como la carga que circula por el conductor por unidad de tiempo: I = ∆q/∆t
(18.4a)
Evidentemente, se trata de una intensidad de corriente media en el intervalo de tiempo ∆t . Para definir una intensidad de corriente instantánea basta con reducir el intervalo de tiempo ∆t → dt , con lo que el valor de carga que ha atravesado la superficie se reducirá igualmente ∆q → dq y la intensidad de corriente será: ∆q dq = I lim = ∆t → 0 ∆t dt
(18.4b)
La unidad de corriente eléctrica en el SI es el amperio (A), que corresponde a una corriente eléctrica que transporta un culombio de carga por segundo. 1 A = 1 C/ 1 s Nótese que, tal como se define la intensidad de corriente, ecuación 18.4, la intensidad de corriente se considera positiva en la dirección del movimiento de las cargas positivas. En aquellas situaciones en que la corriente eléctrica corresponde a un flujo de carga negativa, como el movimiento de electrones en un conductor metálico, la intensidad de corriente se toma positiva en la dirección contraria al movimiento real de las cargas.
Fig. 18.1. La intensidad de corriente coincide con la dirección del movimiento de las cargas positivas y es opuesta al movimiento de las cargas negativas.
43
Corriente eléctrica
Podemos relacionar el valor de la intensidad de corriente con la visión microscópica de la corriente eléctrica debida al movimiento de cargas en el conductor (fig. 18.2). Supongamos que las cargas en el conductor se mueven con una velocidad va. En un intervalo de tiempo ∆t habrán atravesado la sección S del conductor todas aquellas cargas que se encuentren a una distancia de la misma ∆l = va ∆t, es decir, las contenidas en el volumen Vol. = S ∆l = S va ∆t. Si el número de cargas por unidad de volumen es nv, el número de cargas contenidas en ese volumen será nv S va ∆t , y si cada carga tiene un valor q, la carga total transportada es ∆q = q nv S va ∆t y por tanto la intensidad será: q n S v ∆t ∆q = I lim = lim v a = q nv S va ∆t → 0 ∆t ∆t → 0 ∆t
(18.5)
Fig. 18.2. Esquema de una corriente eléctrica circulando por un conductor de sección S, en el que hay nv cargas por unidad de volumen, que se mueven con velocidad va. En un intervalo de tiempo Δt la carga que atraviesa la sección S es y la intensidad de corriente es I = dq / dt
18.3 Resistencia. Ley de Ohm Cuando se aplica una diferencia de potencial V entre los extremos de un conductor, las cargas se desplazan dando lugar a una corriente eléctrica de intensidad I. Experimentalmente se observa que, para la mayoría de materiales conductores, la intensidad de corriente y la diferencia de potencial aplicada son directamente proporcionales: V=RI
(18.6)
Esta relación es conocida como ley de Ohm y el coeficiente de proporcionalidad R se denomina resistencia eléctrica, y su unidad en el SI es el ohmio (Ω). 1 Ω = 1 V/ 1 A Sin embargo, el fenómeno de la conductividad eléctrica es muy complejo y no todos los materiales conductores satisfacen este comportamiento tan
44
Fundamentos físicos de los procesos biológicos
simple, sino que la relación entre corriente eléctrica y potencial aplicado puede seguir dependencias mucho más complicadas. Es decir, la ley de Ohm no es una ley estricta, sino más bien un comportamiento particular, aunque, eso sí, seguido por un número amplio de materiales conductores. Se suele expresar diciendo que se trata de un conductor óhmico, lo que puede entenderse también como que la resistencia de dicho material es constante e independiente de la intensidad que circule por él. La resistencia de un conductor depende tanto de su geometría como la movilidad de las cargas, que varía de un material a otro. Para un conductor con forma de alambre de sección uniforme S y longitud l, la resistencia es: R = ρ l/S
(18.7)
donde el coeficiente ρ, que se denomina resistividad, es característico de cada material e independiente de la geometría. Su unidad en el SI es el ohmiometro (Ω⋅m). En algunas ocasiones se expresa la ley de Ohm despejando la intensidad en función de la diferencia de potencial: I = (1/R) V = G V
(18.8)
donde G = 1/R recibe el nombre de conductancia, que se mide en el SI en Ω–1, denominado siemens (S) (y hasta hace no mucho, representado también como mho). A partir de las ecuaciones (18.7) y (18.8) la conductancia se puede expresar como: G = 1/R = (1/ρ) S/ l = σ S/ l
(18.9)
La inversa de la resistividad σ = 1/ ρ recibe el nombre de conductividad, que se mide en el SI en siemens/m (S/m). Es también inmediato relacionar la conductividad de un material con las características microscópicas del movimiento de las cargas, tales como su concentración (nv) y movilidad (µ). En efecto, si la diferencia de potencial V se aplica entre dos regiones separadas una distancia l, el campo aplicado será E = V/ l, y a partir de las ecuaciones (18.3), (18.5) y (18.9) se obtiene que: σ = µ q nv
(18.10a)
En el caso de las soluciones electrolíticas, donde la conducción se realiza por la contribución de diferentes iones, con valores de la carga, signo incluido, y movilidades diferentes, se ha de considerar la contribución de todas ellas:
45
Corriente eléctrica
σ = ∑ µi qi ni
(18.10b)
i
Resistividad y conductividad son magnitudes intrínsecas que sólo dependen de la naturaleza del material conductor y no dependen de su geometría. Sus valores varían en un rango enorme entre los materiales buenos conductores (σ alta, ρ baja) y los buenos aislantes (σ baja, ρ alta), tal como puede verse en la tabla 18.1, donde se recopilan valores de diferentes materiales. Tabla 18.1. Resistividades de diferentes materiales conductores (C), semiconductores (SC), aislantes (A) y conductores iónicos (CI) Tipo
Material
Resistividad (Ωm)
C
Plata
1,5 × 10 –8
C
Cobre
1,7 × 10 –8
C
Aluminio
2,7 × 10 –8
C
Tungsteno
5,3 × 10 –8
C
Hierro
10 × 10 –8
C
Mercurio
100 × 10 –8
SC
Carbono (grafito)
3,5 × 10 –5
SC
Germanio*
1x10 –3-0,5
SC
Silicio*
0,1-6x102
A
Madera
108-1014
A
Vidrio
1010-1014
A
Plásticos
1013-1016
A/CI
Membrana celular
106-109
CI
Axoplasma
2
CI
Agua: ultrapura uso doméstico marina
105 10-102 0,2-1
(*) La resistividad del silicio y germanio, así como la de la mayoría de los semiconduc tores, depende fuertemente de la presencia de impurezas o “dopantes” que se introducen en el material para controlar sus propiedades de conducción de acuerdo con las especifi caciones necesarias para la fabricación de componentes electrónicos.
En el caso de los conductores iónicos, la conductividad suele expresarse como conductividad molar (Λm), dividiendo la conductividad (σ) por la concentración molar (c):
46
Fundamentos físicos de los procesos biológicos
Λm =
σ c
(18.11)
Su valor depende, en general, de la concentración de los electrolitos, designándose con un superíndice (Λ 0m) el valor de la conductividad molar en el límite de baja concentración, denominándose conductividad molar a dilución infinita. En el caso del agua, la conductividad puede variar enormemente dependiendo de las sustancias que incorpore, tal como se refleja en la tabla 18.1, por lo que la medida de conductividad suele utilizarse como método estándar para determinar su pureza. En la tabla 18.2 se incluyen los valores de conductividad molar, en agua, de algunos iones de interés, en el límite de baja concentración. Tabla 18.2. Conductividad molar en agua, de algunos iones de interés biológico (límite de baja concentración) Ion
Conductividad molar (mS m2 mol–1)
H+
34,96
Na
5,01
K
7,35
+
+ 2+
11,90
OH–
19,91
Cl
7,63
Ca
–
La movilidad de las cargas en un medio conductor, ya sean los electrones en un metal o los iones en una solución electrolítica, depende de la temperatura, por lo que la conductividad (o resistividad) es una magnitud física que presenta una clara dependencia con la temperatura. Esta dependencia se puede describir en muchos casos por una simple relación lineal, especificándose la conductividad (resistividad) por su valor a una cierta temperatura de referencia, T0 (usualmente, temperatura ambiente o también 0 ºC) y por un coeficiente (α) que describe el ritmo de variación de la resistividad con la temperatura a partir de la expresión: σ (T) = σ (Τ0) (1 + α (T – T0))
(18.12a)
ρ (T) = ρ (Τ0) (1 + α (T – T0))
(18.12b)
En general, en los metales la resistividad aumenta con la temperatura, mientras en semiconductores y conductores iónicos, al aumentar la temperatura se incrementa la conductividad (disminuye la resistividad).
Corriente eléctrica
47
18.4 Aspectos energéticos. FEM y circuitos 18.4.1 Disipación de energía en una resistencia eléctrica En los apartados anteriores hemos descrito el movimiento de cargas en dos situaciones diferentes: cargas libres (sin interacción con el medio) y cargas en un medio material conductor (susceptibles de moverse pero interaccionando fuertemente con el material). En el primer caso, cuando una carga libre se mueve entre regiones con diferencia de potencial V, el campo eléctrico realiza un trabajo (W = qV) que se emplea en variar la energía cinética de la carga. El balance energético quedaba indicado en la ecuación (18.2), estableciendo la conservación energética como suma de la energía cinética y la energía potencial eléctrica. Sin embargo, al describir la corriente eléctrica en un conductor (sección 18.2) hemos visto que la carga se mueve con velocidad constante, por lo que su energía cinética no varía. ¿Qué ha sido del trabajo realizado por el campo eléctrico? ¿Dónde ha ido a parar dicha energía? Tal vez resulte ilustrativo comparar las situaciones anteriores con dos casos similares cuando el movimiento es debido al campo gravitatorio. Consideremos el caso idealizado de un cuerpo en el vacío, sin rozamiento. El trabajo del campo gravitatorio sobre el cuerpo se traduce en un cambio de su energía cinética. Este caso equivale al movimiento de la carga libre. Sin embargo, si el cuerpo se mueve en el seno de un fluido, con la intervención de fuerzas de arrastre, el cuerpo alcanza una velocidad límite, y a partir de ese momento su energía cinética ya no aumenta. La energía del campo gravitatorio se disipa (en forma de calor) en el medio en que se produce el movimiento. Esta situación equivale al movimiento de cargas en un medio material (con resistencia) donde la energía se disipa en forma de calor. Consideremos un cierto conductor de resistencia R por el que circula una corriente I, cuando entre sus extremos existe una diferencia de potencial V = V1 – V2 (fig. 18.3). Cuando una carga q pasa del punto (1) al (2), su energía cinética no se ha incrementado y su energía potencial ha disminuido en la cantidad q V. Esta energía se disipa en forma de calor en el conductor (en la resistencia) y se dice que la carga ha experimentado una “caída de potencial” (una pérdida energética): V = V1 – V2.
48
Fundamentos físicos de los procesos biológicos
Fig. 18.3. Cuando una carga q se desplaza entre dos puntos con diferencia de potencial V = V1 – V2, en un conductor de resistencia R, su energía cinética no varía y su energía potencial disminuye (ΔU = q V). Cuando circula una intensidad I, en la resistencia se disipa en forma de calor una potencia P = I V = I2 R = V2 / R.
Teniendo en cuenta que durante un intervalo de tiempo ∆t habrá circulado a través de la resistencia una carga ∆q = I ∆t, se habrá producido una pérdida = ∆q × V = I × V × ∆t , y, por tanto, la potencia disipada será: energética ∆U = P
∆U = I ×V ∆t
y haciendo uso de la ley de Ohm (V = I × R), se puede expresar como: I ×V P = I 2 × R V 2 R
(18.13)
expresiones que permiten calcular la potencia disipada en una resistencia R, por la que circula una intensidad I, cuando entre sus extremos existe una diferencia de potencial V, utilizándose una u otra igualdad, de forma alternativa, según sean conocidas unas u otras magnitudes (I, V o R).
18.4.2. Circuitos de corriente y su representación. FEM Considerando la disipación de energía que se produce cuando las cargas circulan por un conductor, el mantenimiento de una corriente eléctrica en un circuito requiere el aporte de la energía necesaria para mantener la circulación de corriente. En los circuitos eléctricos de corriente continua esta energía es suministrada por una batería o generador que se caracterizan por su fuerza electromotriz (FEM = Fuerza Electro-Motriz). La FEM (E ) se define como el
49
Corriente eléctrica
trabajo realizado por unidad de carga por las fuerzas responsables del movimiento de las cargas en el interior de la batería o generador. La unidad de FEM en el SI es por tanto el voltio, la misma unidad que para el potencial eléctrico. Observación. Generadores eléctricos. En muchas aplicaciones la fuente que suministra la energía necesaria para mantener la corriente procede de una batería o pila. En la batería, la fuente de energía primaria es de tipo químico, que se transforma en energía eléctrica. Otra fuente de energía eléctrica es la energía mecánica que se transforma en energía eléctrica en las dinamos o alternadores. Las grandes centrales de “generación de electricidad” utilizan otra fuente primaria de energía, de las que suelen recibir el nombre: las llamadas cen trales hidráulicas utilizan la energía potencial gravitatoria de agua embal sada, las eólicas utilizan la energía cinética del viento, las centrales nucleares la energía procedente de reacciones nucleares que se transforma en energía calorífica y luego en energía mecánica, etc. Esta energía es transformada en energía eléctrica, medio por el cual llega a los lugares de consumo (hogares, industria). La figura 18.4.a ilustra la forma de representar un circuito eléctrico. En este caso el circuito está compuesto por una batería de FEM =E y una resistencia R conectada a dicha batería. Como puede verse, en estos diagramas la y la batería por el símbolo . En resistencia se representa por el símbolo la batería, el trazo más largo corresponde al terminal “positivo” (de potencial más alto) y el más corto al “negativo” (potencial más bajo), circulando la corriente eléctrica en el circuito en el sentido del polo “positivo” al “negativo” y en sentido inverso en el interior de la batería. Las líneas continuas representan conexiones eléctricas mediante conductores de resistencia despreciable y que por tanto conectan puntos a igual potencial. El balance energético en el circuito es el siguiente: la energía es aportada por la batería (FEM = E ), transfiriéndose a las cargas, que incrementan su energía, pasando desde el punto B, de potencial inferior VB, al punto A, de potencial más elevado VA, verificándose que E = VA – VB. Cuando se establece la corriente eléctrica, las cargas pierden su energía en la resistencia R, donde se produce la “caída de potencial” descrita por la ley de Ohm: VC – VD = I R. Los puntos A y C, por un lado, y B y D, por otro, están al mismo potencial, por lo que el balance energético correspondiente al circuito de la figura 18.4.a puede expresarse finalmente como: E = VA – VB = I R
(18.14)
50
Fundamentos físicos de los procesos biológicos
Fig. 18.4. (a) Representación esquemática de un circuito eléctrico ideal constituido por una batería de FEM = E y una resistencia R. La energía aportada por unidad de carga es la fuerza electromotriz (FEM) de la batería. (b) En un circuito real, parte de la energía suministrada por la batería se pierde también en la propia batería, lo que se puede describir mediante una resistencia interna r de la batería.
En una situación más realista, la energía aportada por el generador no se transmite íntegramente a las cargas, sino que hay una cierta pérdida de energía en el propio generador, cuyo efecto se describe mediante una resistencia interna r (fig. 18.4.b). Aunque en el diagrama del circuito se represente como una resistencia r, diferente de la batería, en realidad no es un elemento separado, sino parte de la propia batería, que se comporta como si tuviese dicha resistencia interna. Incluyendo su efecto en el balance energético del circuito, cuando circula una corriente I por el mismo, la diferencia de potencial entre los puntos A y B es VA – VB = E – I r, por lo que puede expresarse de la forma: E – I r = VA – VB = I R
(18.15a)
E = I r + I R = I (R + r)
(18.15b)
o bien como: que permite calcular cuál es la intensidad que circula por un circuito de resistencia R cuando se conecta a una batería de FEM = E y resistencia interna r. Debe notarse que la energía que reciben las cargas, procedente de la batería, se disipa en el circuito (resistencias R y r), recuperando la carga su misma situación energética inicial (potencial) cuando ha completado una vuelta al circuito eléctrico. El aporte energético de la batería se disipa íntegramente en forma de calor en el circuito.
18.5 Circuitos simples 18.5.1 Reglas de Kirchhoff Los circuitos eléctricos engloban, en general, diferentes componentes por los que puede circular la corriente. El número y naturaleza de estos com-
Corriente eléctrica
51
ponentes pueden ser muy variado: bombillas, conductores, baterías, resistencias, chips de ordenador, neuronas, fibras musculares, etc., son ejemplo de la variedad de posibles componentes, que afortunadamente pueden ser descritos en términos de los componentes eléctricos básicos: FEM, resistencias, capacidades y autoinducciones. En algunos circuitos el número de componentes y sus conexiones pueden ser tan elevados y complejos que la comprensión de dichos circuitos quede reservada a los especialistas, pero hay unos cuantos circuitos importantes que pueden ser descritos fácilmente. La descripción de los circuitos de corriente se apoya en dos reglas básicas conocidas como leyes de Kirchhoff, que no hacen sino describir dos principios básicos: (i) Conservación de la energía (ii) Conservación de la carga eléctrica Tal como acabamos de ver en la sección anterior, el balance energético total en un circuito cerrado es cero: la energía aportada por la batería debe ser igual a la energía disipada en las resistencias u otros componentes del circuito. En la práctica este principio se aplica siguiendo la diferencia de potencial a través del circuito y, obviamente, si se aplica a un circuito cerrado, al volver al punto inicial la suma de variaciones de potencial a lo largo del circuito debe ser igual a cero, lo que constituye el enunciado de la primera regla de Kirchhoff. La segunda regla de Kirchhoff, o regla de los nudos, establece la conservación de la carga, y por tanto de la intensidad. Si un circuito se divide en dos (o más) ramas en un punto (figura 18.5), la suma de intensidades de cor riente entrantes debe ser igual a la suma de intensidades salientes.
Fig. 18.5. Segunda regla de Kirchhoff: en un “nudo” la intensidad de corriente entrante debe ser igual a la suma de intensidades salientes.
52
Fundamentos físicos de los procesos biológicos
18.5.2 Resistencias en serie y paralelo Como aplicación inmediata de las reglas de Kirchhoff podemos analizar una primera situación que aparece con frecuencia en los circuitos eléctricos: la conexión de diferentes resistencias. En la mayoría de los casos es conveniente describir las resistencias conectadas entre sí por una resistencia equivalente R E, entendiendo por tal aquella que no afecta a la intensidad de corriente global ni a la diferencia de potencial en sus extremos. Existen dos tipos básicos de conexión de resistencias: en serie y en paralelo. La figura 18.6.a representa dos resistencias R1 y R 2 conectadas en serie. La intensidad I que recorre ambas resistencias es común a ellas y la diferencia de potencial total ha de ser la suma de las diferencias de potencial en cada resistencia. Es decir: V = VA– VB = VA – VM + VM – VB = I R1 + I R 2 = I (R1 + R 2) Siendo V M el potencial en un punto intermedio a ambas resistencias. Si expresamos la misma diferencia de potencial total en función de una única resistencia equivalente R E (fig. 18.6.b) tendríamos: V = I RE con lo que la resistencia equivalente de dos resistencias conectadas en serie es igual a la suma de resistencias. R E = R1 + R 2
(18.16)
Fig. 18.6. (a) Conexión de resistencias en serie y (b) resistencia equivalente.
La figura 18.7 representa (a) dos resistencias R1 y R 2 conectadas en paralelo y (b) su resistencia equivalente R E. Ahora la diferencia de potencial entre los puntos A y B debe ser la misma evaluada a través de la resistencia R1 o a través de R 2. V = VA– VB = I1 R1 = I2 R 2
53
Corriente eléctrica
Por su parte, la carga (intensidad) transportada por el circuito será la suma de la transportada por ambas ramas: I = I1 + I2 Si expresamos de nuevo la misma diferencia de potencial en función de una única resistencia equivalente (R E) tendríamos: V = I RE Y, por tanto, sustituyendo las intensidades a partir de las ecuaciones anteriores, se obtiene: V/ R E = (V/ R1) + (V/ R 2) Y, dividiendo por V, la resistencia equivalente viene dada por la expresión: 1 1 1 = + RE R1 R2
(18.17)
La inversa de la resistencia equivalente de dos resistencias conectadas en paralelo es igual a la suma de las inversas de dichas resistencias.
Fig. 18.7. (a) Conexión de resistencias en paralelo y (b) resistencia equivalente.
Además de la equivalencia correspondiente a una conexión de resistencias en paralelo, es útil también calcular cómo se reparte la intensidad I al llegar a la bifurcación, es decir, cuáles son los valores de las intensidades I1 e I2 que circulan por cada una de ellas (fig. 18.7.a). Eliminando el valor de I2 de las ecuaciones anteriores se obtiene el valor de I1 en función de la intensidad total I y las resistencias R1 y R 2:
54
Fundamentos físicos de los procesos biológicos
R R + R2 I= I1 + I 2= I1 + I1 1 = I1 1 R2 R2
o, de forma similar, eliminando I1 se obtiene una relación equivalente para I2. Despejando los valores de I1 e I2, se obtiene: I1 =
R2 I R1 + R2
, I2 =
R1 I R1 + R2
(18.18)
18.6 Circuitos con resistencia y capacidad (RC) Se denominan circuitos RC aquellos que incorporan resistencias y condensadores. Los condensadores pueden acumular carga que a su vez puede desplazarse a través de los medios conductores. La acumulación y el vaciado de la carga de un condensador no son procesos instantáneos, sino que requieren un cierto tiempo, que como veremos depende de la capacidad del condensador y de la resistencia a través de la cual fluye la carga. Tanto la carga del condensador como la intensidad que circula por el circuito dependen del tiempo, es decir, presentan un comportamiento transitorio, que vamos a caracterizar a continuación. Una aplicación importante de este tipo de fenómenos es la descripción de la propagación de impulsos nerviosos en las neuronas, que estudiaremos en el capítulo 19.
18.6.1 Descarga de un condensador Consideremos en primer lugar el proceso de descarga de un condensador, de capacidad C, previamente cargado con una carga inicial q0, que se conecta mediante un interruptor S a una resistencia R, tal como se muestra en el circuito de la figura 18.8. Cuando el circuito está abierto la diferencia de potencial entre las placas del condensador será: V0 = q0 C
(18.19)
Fig. 18.8. Diagrama que representa un condensador C cargado, que puede descargarse a través de una resistencia R al cerrar el interruptor S (circuito RC).
55
Corriente eléctrica
Al cerrar el interruptor circulará una corriente por el circuito que, de acuerdo con la ley de Ohm, será: = I 0 V= q0 RC 0 R
(18.20)
Pero, a diferencia de lo que ocurría cuando la diferencia de potencial se mantiene constante, por una batería u otro generador, en este caso, a medida que fluye la corriente, el condensador se descarga y la diferencia de potencial entre sus placas disminuye con el tiempo. La ley de Ohm se sigue cumpliendo en cada instante de tiempo: q (t ) C = V (t ) = I (t ) R
(18.21)
siendo V(t) la diferencia de potencial en el instante t, cuando la carga del condensador es q(t), por lo que en ese instante circula por la resistencia una intensidad I(t): I ( t ) = − dq ( t ) dt
(18.22)
(El signo – proviene del hecho de que q representa la carga almacenada en el condensador y dq su variación en un intervalo de tiempo dt. En este caso el condensador se descarga, por lo que dq < 0 y la carga que circula por el circuito en el intervalo dt es –dq). Sustituyendo (18.22) en (18.21) se obtiene q dq +R = 0 ⇔ C dt
dq dt = − q RC
e integrando entre el instante inicial t = 0, en que la carga del condensador es q0, y un instante arbitrario t, se obtiene:
∫
q (t )
q0
dq / q=
t
∫ −dt / RC 0
⇔
ln
q (t ) q0
= −
t RC
o bien: − t / RC = q (t ) q= q0 e − t /τ 0e
(18.23)
donde q0 = CV0 es la carga inicial del condensador (ec. 18.19) y τ = RC es un tiempo característico del sistema. La intensidad se obtiene a partir de: dq (t ) q0 − t / RC q0 − t /τ I (t ) == − = e e = I 0 e − t /τ dt RC RC
(18.24)
donde I0 = q0 / RC (ec. 18.20) es la intensidad que circula en el instante inicial (t = 0).
56
Fundamentos físicos de los procesos biológicos
La figura 18.9 representa la evolución temporal de la carga q(t) e intensidad de corriente I(t) en función del tiempo. Como se sigue de las ecuaciones (18.23) y (18.24), tanto la carga como la intensidad tienen un valor máximo inicial, dado por las expresiones (18.19) y (18.20), disminuyendo exponencialmente con el tiempo. El tiempo característico de esta variación es la cons tante de tiempo (τ = RC), que representa el tiempo necesario para que la intensidad (o la carga del condensador) se reduzcan hasta un valor 1/e = 0,37 = 37 % del valor inicial: = q(τ RC = ) q0 e = 0, 37 q0
= I (τ RC = ) I 0 e = 0, 37 I 0
Como puede verse en la figura, la constante de tiempo τ coincide también con la intersección de la tangente en el origen a las curvas con el eje de abscisas, es decir, equivale al tiempo en que la carga o la intensidad se anularían si su ritmo de variación inicial se mantuviese constante. Este ritmo se ralentiza y la carga e intensidad tienden a cero asintóticamente.
Fig. 18.9. (a) La carga q(t) de un condensador de capacidad C que se descarga a través de una resistencia R disminuye exponencialmente con el tiempo (q(t)= q0 e –t/τ). (b) La intensidad de corriente I(t) que circula por el circuito sigue una dependencia similar (I(t) = I0 e –t/τ). La constante de tiempo τ = RC representa el tiempo en que ambas magnitudes se reducen hasta un valor igual al 37 % (= 1/e) de su valor inicial. Coincide también con el tiempo necesario para anularse si la descarga se realizase a un ritmo constante, igual al inicial (recta de puntos tangente a las curvas en el origen).
57
Corriente eléctrica
Observación. Dimensiones de RC. A primera vista puede parecer sor prendente que el producto de una resistencia por una capacidad, magnitudes que asociamos con fenómenos de tipo eléctrico, corresponda con un tiempo. Esto debe ser así ya que la magnitud t/RC aparece, en las ecuaciones 18.23 y 18.24, como exponente de una función exponencial, que ha de ser adimen sional y por tanto [RC] = [t] = T. Podemos comprobarlo fácilmente recordando las definiciones de las mag nitudes capacidad y resistencia. La capacidad se definió, en el capítulo 17, como la constante de propor cionalidad entre la carga y la diferencia de potencial entre las placas de un condensador (q = CV): [C] = [q/V] = [q] /[V] Por su parte, la resistencia eléctrica aparece en la ley de Ohm como el coeficiente de proporcionalidad entre diferencia de potencial e intensidad de corriente (V = IR), luego: [R] = [V/I] =[V] /[I] Las dimensiones del producto RC son, por tanto:
[ RC ] = [ R ] × [C ] =
[V ] × [ q ] = [ q ] = T [ I ] [V ] [ I ]
18.6.2 Carga de un condensador De forma análoga, el proceso de carga de un condensador tampoco es un fenómeno instantáneo, sino que sigue una dependencia temporal similar a la de su descarga. Consideremos a continuación el circuito mostrado en la figura 18.10, en el que se representa el proceso de carga de un condensador, de capacidad C, por medio de una batería, de FEM E (y resistencia interna despreciable) conectados a través de una resistencia R.
Fig. 18.10. Circuito correspondiente a la carga de un condensador C mediante una batería de FEM E, a través de una resistencia R.
58
Fundamentos físicos de los procesos biológicos
Inicialmente el condensador está descargado. Al cerrar el interruptor del circuito S y conectarlo a la batería, la carga fluye acumulándose en la primera placa del condensador. El campo eléctrico generado en el condensador fuerza el movimiento de las cargas de la otra placa hacia la batería, que completan así el circuito. La acumulación de carga en el condensador continúa, mientras la intensidad disminuye, hasta que la diferencia de potencial entre sus placas iguala a la existente entre los bornes de la batería, momento en el que deja de circular corriente por el circuito. Tenemos de nuevo un proceso transitorio donde la intensidad de corriente, la carga del condensador y la diferencia de potencial entre sus placas varían con el tiempo. Aplicando al circuito de la figura la 1.ª regla de Kirchhoff, la diferencia de potencial entre los bornes de la batería ha de ser igual a la suma de la diferencia de potencial entre los extremos de la resistencia VR y la diferencia de potencial entre las placas del condensador VC. Para un instante t arbitrario obtenemos: E = VR ( t ) + VC ( t ) = I ( t ) R +
q (t ) C
(18.25)
Donde ahora, la relación entre carga e intensidad es: I (t ) = +
dq (t ) dt
(18.26)
ya que durante el proceso de carga la intensidad de corriente implica un aumento de la carga almacenada en el condensador (dq > 0). Se obtiene, por tanto, la ecuación diferencial que describe la carga del condensador: = E R
dq (t ) q (t ) + dt C
(18.27)
cuya solución se demuestra que es: RC q= (t ) qF (1 − e − t /= ) qF (1 − e − t /τ )
(18.28)
siendo qF el valor final de la carga del condensador: qF = CE
(18.29)
Y la intensidad: I (t ) = +
dq (t ) = I 0 e − t /τ dt
donde la intensidad inicial tiene ahora el valor:
(18.30)
59
Corriente eléctrica
I0 = E /R
(18.31)
En la figura 18.11 se representa la dependencia en función del tiempo de la carga q(t) y la intensidad de corriente I(t) durante el proceso de carga del condensador. La carga aumenta asintóticamente hasta el valor final (qF = CE ), mientras la intensidad parte del valor máximo (I0 = E /R) disminuyendo exponencialmente hasta anularse cuando la diferencia de potencial entre las placas del condensador iguala a la FEM (V = E = qF/C). El tiempo característico que regula la variación de ambas magnitudes (valor de la carga y de la corriente) vuelve a ser τ = RC. Transcurrido este tiempo la intensidad se ha reducido hasta: = I (τ RC = ) I 0 e = 0, 37 I 0
mientras la carga se ha incrementado hasta: = q (τ RC = ) qF (1 − e −1 ) = qF (1 − 0, 37) = 0, 63 qF
Fig. 18.11. Variación (a) de la carga q(t) almacenada en el condensador y (b) de la intensidad de corriente I(t) en el circuito durante el proceso de carga de un condensador.
60
Fundamentos físicos de los procesos biológicos
18.6.3 Carga de un condensador con pérdidas En la figura 18.12 se presenta un circuito semejante a los que se acaban de estudiar en la sección precedente, aunque algo más complejo. Como puede observarse, un condensador C se carga a través de una resistencia R1, pero ahora existe una derivación, debida a la resistencia R 2, a través de la cual circula parte de la intensidad que fluye por el circuito. Este circuito, además de representar una descripción más realista de un condensador, ya que normalmente existe una cierta pérdida en todos ellos, reviste especial importancia, ya que se utilizará para describir la conducción del impulso nervioso en los axones de las neuronas, por lo que resulta necesario comprender sus características.
Fig. 18.12. Circuito de carga de un condensador C a través de una resistencia R1 y con resistencia de pérdidas R 2 en paralelo con el condensador. El circuito consta de tres mallas: ABFGA, ABDEFGA y BDEFB.
El circuito que queremos estudiar ahora incluye una bifurcación entre los puntos B y F que no puede simplificarse de forma sencilla sustituyendo la resistencia y el condensador por un único elemento equivalente, como hacíamos con las conexiones de resistencias o condensadores, siendo necesario considerarlas separadamente tal como aparecen en el circuito. Se dice que este circuito consta de varias “mallas”. Por “malla” se entiende cualquiera de los circuitos cerrados parciales que podemos encontrar para recorrer de forma continua el circuito. Así, este circuito incluye tres mallas: la malla ABFGA, que engloba la batería y las resistencias R1 y R 2, la malla ABDEFGA, que engloba la batería, la resistencia R1 y el condensador y, por último, la malla BDEFB, que incluye al condensador y la resistencia R 2. Para analizar este circuito consideremos la intensidad I que circula entre los puntos A y B a través de la resistencia R1. Dicha intensidad se bifurca en dos, al llegar al punto B, dando lugar a las intensidades I1 e I2, tal como se muestra en la figura. Para determinar estas tres intensidades necesitamos tres ecuaciones. La primera de ellas es la relación impuesta por la 2.ª regla de Kirchhoff aplicada al nudo B:
61
Corriente eléctrica
I= I1 + = I2
dq + I2 dt
(18.32)
Las otras dos ecuaciones se obtienen de aplicar la primera regla de Kirchhoff a dos de las tres mallas existentes en el circuito. (La aplicación de esta regla a la tercera malla no aporta nueva información, ya que se trata de una combinación de las otras dos ecuaciones). La malla ABDEFGA es equivalente a la estudiada en la sección anterior, por lo que al aplicar la 1.ª regla de Kirchhoff, obtenemos la misma expresión que entonces, ecuación 18.25, excepto que ahora suprimiremos la dependencia explícita de la carga e intensidad con el tiempo para simplificar la escritura: E = IR1 +
q C
(18.33)
Como segunda malla utilizaremos la BDEFB, en la que se obtiene: q = I 2 R2 C
(18.34)
Sustituyendo (18.32) en (18.33) y seguidamente I2 a partir de (18.34), se obtiene: q dq 1 q q dq + × R1 + = EE + I 2 R1 + = C dt R2 C C dt
(18.35)
Operando y reordenando convenientemente las variables, se obtiene la ecuación diferencial que describe el proceso de carga del condensador: (18.36) Integrando entre el instante inicial t = 0, q = 0 y un instante arbitrario con carga q(t):
se obtiene: (18.37)
62
Fundamentos físicos de los procesos biológicos
donde: R' =
R1 R × R2 = 1 , τ s = R 'C 1 + R1 R2 R1 + R2
(18.38)
por su parte, la diferencia de potencial entre las placas del condensador es: (18.39) Estas ecuaciones se parecen formalmente a las obtenidas en la sección anterior, donde no existía la resistencia de pérdidas R 2. Como puede observarse, la diferencia radica en que ha cambiado la constante de tiempo, así como los valores finales de carga o potencial que se alcanzan. La constante de tiempo que anteriormente veíamos era igual a τ0 = R1C, ahora es: τs = R' C =
(R1 C) =
τ0
(18.40)
y el potencial y carga máximos que se alcanzan (t → ∞) son: (18.41)
(18.42) es decir, tanto la constante de tiempo como el potencial y carga máximos difieren, respecto a lo obtenido antes, en un factor: R '/ R1 =
1 1 + R1 R2
y por tanto si en las ecuaciones actuales tomamos el límite R 2 → ∞ (R1/ R 2 << 1), se obtiene R’/R1 → 1 y se recuperan las ecuaciones obtenidas para el caso en que no hay pérdidas. En la figura 18.13 se representa el cociente R’/R1, expresado en tantos por ciento, en función del cociente R 2/R1. Como puede verse, cuando la resistencia de pérdidas es varios órdenes de magnitud superior a la resistencia de carga (R 2/R1 > 100), su efecto puede despreciarse (R’ ≈ R1), pero para valores inferiores, las correcciones necesarias son importantes.
Corriente eléctrica
63
Fig. 18.13. Correcciones en la resistencia efectiva de carga de un condensador por efecto de la resistencia de pérdidas R 2.
En consecuencia, el potencial final y tiempo de carga cambian también apreciablemente. Esto puede observarse en la figura 18.14, donde se representa el potencial entre las placas del condensador en función del tiempo (ecuación 18.39), calculado para diferentes valores de la resistencia de pérdidas R 2. Mientras para resistencias grandes (R 2 > 100 R1) el efecto es despreciable, si la resistencia de pérdidas es inferior al 10 % de la resistencia de carga R1, el valor del potencial final se reduce también al 10 %. Cuando ambas resistencias son iguales, R1 = R 2, el potencial final alcanza un valor igual a la mitad de la FEM de la batería de carga. Indiquemos finalmente que, una vez cargado el condensador por completo (t → ∞), sólo fluye corriente entre los puntos B y F, con una intensidad:
siendo la diferencia de potencial entre B y F:
es decir, igual a la diferencia de potencial final entre las placas del condensador.
64
Fundamentos físicos de los procesos biológicos
Fig. 18.14. Potencial entre las placas del condensador en función del tiempo, calculado para diferentes valores de la resistencia de pérdidas R 2.
18.7 Apéndice: pilas y baterías. Volta y Galvani Las baterías o “pilas” nos acompañan en multitud de aplicaciones en la vida diaria: la pila del reloj eléctrico, el ordenador, la batería del coche, etc. Curiosamente, el origen histórico de las “pilas” está íntimamente relacionado con la Bioelectricidad y una famosa controversia científica mantenida a finales del siglo XVIII por Galvani y Volta. El médico y anatomista italiano Luigi Galvani (1737-1798) es considerado el padre de la Bioelectricidad. En una serie de experimentos realizados en la Universidad de Bolonia, encontró que era posible activar la contracción muscular usando descargas eléctricas naturales (rayos), observando que también se producían contracciones en su ausencia. Galvani interpretó estos resultados como prueba de que los tejidos de la rana eran capaces de generar “electricidad animal”, tal como describió en De Viribus Electricitatis in Motu Musculari Commentarius publicado en 1791. En la Universidad de Pavía el físico Alessandro Volta (1745-1827) estaba interesado también en fenómenos de bioelectricidad, en particular en las descargas generadas por el pez torpedo (Torpedo torpedo). Repitiendo los experimentos de Galvani obtuvo resultados similares, pero su interpretación fue diferente. Según Volta la electricidad tenía su origen en la utilización de dos metales diferentes a la hora de realizar las conexiones eléctricas. Estos dos metales, unidos por un fluido conductor, daban lugar a la corriente eléctrica. En esta interpretación de los
Corriente eléctrica
65
resultados experimentales, que resulta ser la correcta, la famosa pata de rana actuaba como un simple detector y no como un generador de la corriente eléctrica. Sin embargo, la “electricidad animal” existe, como consecuencia de las propiedades de transporte de la membrana celular y de la diferencia de concentraciones iónicas entre el citoplasma y el medio extracelular, como veremos en el capítulo 19. Pila de Volta Ahondando en las causas de la generación de electricidad por contactos bimetálicos, Volta construyó en 1800 la primera “pila” eléctrica o batería. Una serie de discos metálicos alternados (plata y zinc, por ejemplo) separados por un cartón impregnado en una solución salina, tal como puede verse en la figura 18.15, constituye la “pila” de Volta. El origen del nombre resulta evidente.
Fig. 18.15. Pila de Volta, formada por una serie de discos metálicos alternados (plata y zinc) separados por un cartón impregnado en una solución salina.
El descubrimiento de Volta aportó el primer procedimiento rutinario para la generación de corriente eléctrica, contribuyendo de modo decisivo a todos los desarrollos posteriores. En su honor, la unidad de potencial eléctrico recibe el nombre de voltio. Pilas y baterías Las pilas y baterías actuales han evolucionado sustancialmente en los 200 años que han transcurrido desde Volta, pero continúan siendo “pilas”, es decir, apilamientos semejantes a los presentes en la pila de Volta. Cada uno de los elementos básicos de tales apilamientos es una “célula electroquímica”. En ellas se desarrollan reacciones de oxidación-reducción (redox) que liberan los electrones que circulan por el circuito externo. Este movimiento de cargas se compensa por el movimiento interno de iones en la batería, a través del electrolito. La diferencia de potencial básica de una célula electroquímica depende de las reacciones redox de
66
Fundamentos físicos de los procesos biológicos
sus componentes, estando determinada por su composición. Por ejemplo, en la pila plomo-ácido utilizada comúnmente, este potencial es de 2,04 voltios. La diferencia de potencial (y la “carga”) final de una pila depende de cómo se “apilen”, es decir, conecten, los elementos sucesivos. Electrocitos: las “pilas” de los peces eléctricos Dando cuenta de sus experimentos, Volta describe los efectos de la conexión en serie de varios elementos bimetálicos, tales como los que constituían su “pila”, de la siguiente manera: “… el aparato que he llamado órgano eléctrico artificial, y que siendo en el fondo igual al órgano natural del Torpedo, se asemeja a él también en su forma”. En efecto, como se ha indicado en el capítulo 17, en los peces eléctricos existe un “órgano eléctrico” natural que contiene una serie de “electrocitos”. Los electrocitos son aplanados, con forma de disco, y son esencialmente células musculares que han perdido su capacidad de contracción. En reposo, el interior del electrocito está cargado negativamente respecto al exterior (en el capítulo 19 se detallan los aspectos relacionados con el potencial de membrana en las células excitables) y al ser estimulados, la membrana celular donde se inserta el nervio se despolariza antes que la otra superficie, de tal forma que se genera una diferencia de potencial en la misma dirección en ambas caras, comportándose de forma totalmente análoga a una pequeña batería. En los órganos eléctricos de los peces eléctricos los electrocitos están apilados en columnas (dando lugar a una conexión en serie) de forma que se suman los potenciales generados por cada electrocito. Los peces eléctricos debiles tienen apilamientos reducidos, generando normalmente potenciales bajos (≤ 1 V), aunque suficientes para ser utilizados en electrolocalización. En los peces eléctricos fuertes (anguila eléctrica, rayas, pez torpedo) el órgano eléctrico es mucho mayor, generando potenciales suficientemente elevados como para generar descargas eléctricas con que aturdir presas o ahuyentar predadores. La raya eléctrica, torpedo, tiene 45 columnas, cada una con 700 electrocitos, generando descargas de 50 V y otras especies pueden llegar a generar diferencias de potencial de hasta 600 V.
18.8 Ejercicios propuestos
q 1, 6 × 10−19 C , = m p 1, 67 × 10−27 kg ) es acelerado, en Ejercicio 18.1 Un protón (= el vacío, por una diferencia de potencial de 15 kV. Si su velocidad inicial es de 106 m/s ¿cuál es su velocidad final? v 1, 97 × 106 m / s Sol.:=
67
Corriente eléctrica
Ejercicio 18.2 La movilidad de los iones Na+ en agua es µ = 5×10 8 m2 s1 V1 ¿Cuál es su velocidad de desplazamiento si se mueve bajo la acción de un campo eléctrico E = 20 V/m? Sol.: v = 10-6 m/s = 1 µm/s Ejercicio 18.3 Una bombilla incandescente tiene una resistencia de 440 Ω. Si se conecta a una diferencia de potencial de 220 V. ¿Qué intensidad circula por ella? Sol.: I = 0,5 A ρ 1, 7 × 10−8 Ω m , Ejercicio 18.4 Un alambre de cobre, cuya resistividad es = tiene una longitud de 4 m, siendo su resistencia R = 0, 03 Ω . ¿Cuál es su radio?
Sol.: r = 0,85 mm Ejercicio 18.5 Una fibra nerviosa (axón) se puede considerar como un cil indro conductor de resistividad ρ axón ≈ 2 Ω m . Si su diámetro es de 20 µm y tiene una longitud de 1 m. ¿Cuál es su resistencia? R 6, 4 × 109 Ω Sol.: =
Ejercicio 18.6 Un cable de un cierto metal tiene una resistencia R, siendo su longitud L y su radio r. Debemos sustituir dicho cable por otro del mismo material pero con un radio doble. ¿Qué longitud Lx debemos utilizar para tener la misma resistencia? Sol.: Lx = 4 L Ejercicio 18.7 Para determinar la conductividad de una cierta disolución utilizamos una celda electrolítica con electrodos de área igual a 1 cm2, sepa rados entre sí 1 cm. Al aplicar una diferencia de potencial entre electrodos de 40 V, circula una corriente de 0,8 A. ¿Cuál es la conductividad? Sol.: σ = 2 S/m Ejercicio 18.8 A partir de los datos de tabla 18.2, calcúlese la conductividad (a) del agua pura (pH = 7) y (b) de una solución 0,1 M de cloruro sódico, considerando que éste se halla completamente disociado (electrolito fuerte). Sol.: (a) σ ≈ 0,055 µS/cm (b) σ ≈ 1,26 S/m Ejercicio 18.9 Una bombilla está fabricada mediante un hilo de tungsteno de 0,004 mm de radio y 5 cm de longitud, cuya resistividad a 20 ºC es ρ= 5, 3 × 10−8 Ω m . Si la dependencia de la resistividad con la temperatura 20 puede describirse mediante una dependencia lineal (ecuación 18.12.b), con 1 dρ coeficiente de variación térmica α = = 4, 5 × 10−3 K −1 y la temperatura de ρ 0 dT
68
Fundamentos físicos de los procesos biológicos
trabajo es de 2.000 K, calcúlese (a) la conductividad del filamento a la tem peratura de trabajo, (b) la resistencia de la bombilla encendida. 4, 6 × 10−7 Ω m (b) R = 460Ω Sol.: (a) ρ 2000= K
Ejercicio 18.10 La conductividad de una solución electrolítica a 25 ºC es de 100 µS/cm. Si el coeficiente de variación con la temperatura es α = 0,02 K1, ¿cuál será su conductividad a 15 ºC? Sol.: σ = 80 µS/cm Ejercicio 18.11 Según se indica en la tabla 18.1, la resistividad del agua marina es del orden de 0,2 Ωm. Si esta resistividad fuese debida exclusiva mente a su contenido en cloruro sódico, supuestamente disociado al 100 %, ¿cuál es dicha concentración? Sol.: [NaCl] = 0,4 M Ejercicio 18.12 La conductividad del agua del grifo es del orden de 20 mS/m. Si esta conductividad fuese debida exclusivamente a su contenido en iones de Cl‒, ¿cuál sería su concentración? Sol.: Cl‒ = 2,6 mM Ejercicio 18.13 Hállese la resistencia equivalente del circuito de la figura 18.16.
Fig. 18.16.
Sol.: (11 4 ) R Ejercicio 18.14 Sea el circuito representado en la figura 18.17. ¿Cuál es la intensidad que circula por la resistencia de 1 Ω?
69
Corriente eléctrica
Fig. 18.17.
Sol.: 0,77 A Ejercicio 18.15 Consideremos una batería de FEM = 5 V y resistencia interna r = 0,2 Ω que se conecta a una resistencia R. Calcúlese la intensidad que cir cula por el circuito y la diferencia de potencial entre los bornes de la batería cuando la resistencia externa es: (a) R = 6 Ω, (b) R = 2 Ω. Sol.: (a) I = 0,81 A, V = 4,84 V (96,8 % FEM) (b) I = 2,27 A, V = 4,55 V (90,9 % FEM) Ejercicio 18.16 Un condensador de 5 µF se conecta a una batería de 100 V a través de una resistencia de 0,5 MΩ (figura 18.18). Calcúlese (a) el valor inicial de la corriente eléctrica, I0 , inmediatamente después de cerrar el interruptor, (b) la carga final qF que adquiere el condensador (c) la constante de tiempo τ (d) el tiempo t necesario para que el condensador se cargue hasta la mitad de su valor máximo.
Fig. 18.18.
Sol.: (a) I0 = 0,2 mA (b) qF = 0,5 mC (c) τ = 2,5 s (d) t = 1,73 s Ejercicio 18.17 En el circuito del problema anterior, una vez cargado el con densador, se desconecta la batería y se añade otra resistencia R, en paralelo con la ya existente. ¿Cuál debe ser el valor de R si deseamos que el condensador se descargue con una constante de tiempo igual a una centésima de segundo?
70
Fundamentos físicos de los procesos biológicos
Sol.: R = 10, 2 k Ω Ejercicio 18.18 Un condensador de 2 µF se conecta a una batería de 50 V a través de una resistencia de 1 MΩ, existiendo también una segunda resistencia de 0,6 MΩ conectada en paralelo con el condensador (figura 18.19). Calcúlese (a) el valor inicial de la corriente eléctrica, I0 , inmediatamente después de cerrar el interruptor, (b) el valor final de la corriente eléctrica I(∞) transcurrido un tiempo muy largo después de cerrar el interruptor, (c) la constante de tiempo τs de carga del condensador, (d) el valor máximo del potencial entre las placas del condensador, (e) el tiempo t necesario para que el condensador se cargue hasta alcanzar una diferencia de potencial igual al 10 % de su valor máximo.
Fig. 18.19.
Sol.: (a) I0 = 50 µA (b) I(∞) = 31 µA (c) τs = 0,75 s (d) VMax = 18,75 V (e) t = 0,08 s
18.9 Referencias History of the battery en. wikipedia.org/wiki/History-of/the-battery Goldschmid, A. Madl, P. & Yip, M. Electric organ discharge www.sbg.ac.at/ ipk/avstudio/pierofun/ray/eod.htm Sabbatini, R.M.E. The discovery of bioelectricity. http://www.epub.org.br/cm/ n06/historia/bioelectr_i.htm
Capítulo 19. La membrana celular y el impulso nervioso 19.1 Biopotenciales 19.1.1 Membrana celular e iones Toda célula, desde las bacterias a las células de los animales multicelulares, se mantiene “aislada” del exterior mediante una membrana celular, estructura que aparece con las primeras células procariotas hace unos 3.500 millones de años. La membrana celular (o más precisamente la membrana plasmática, ya que otras membranas delimitan a su vez orgánulos intracelulares como el núcleo, las mitocondrias, etc.) permite el paso de algunas sustancias mientras impide el de otras y como consecuencia la composición iónica del citoplasma es notablemente diferente del medio externo. Ya en las bacterias el citoplasma se constituye como una zona con una concentración elevada de iones K+ (y baja concentración de iones Ca2+) y, en los animales, el líquido extracelular presenta una alta concentración de iones Na+ y Cl–, como en el agua marina. Aunque existen diferencias en los valores precisos de las concentraciones de iones para los distintos tipos de células, en todas ellas se detecta un exceso de iones K+ y un defecto de iones Na+ y Cl– en el citoplasma (fig. 19.1). La electroneutralidad, tanto del citoplasma como del líquido extracelular, está garantizada por la presencia de otros aniones A‒.
Fig. 19.1. El citoplasma celular presenta un exceso de iones K+, mientras el fluido extracelular tiene un exceso de iones Na+ y Cl–.
71
72
Fundamentos físicos de los procesos biológicos
La membrana celular, como frontera con el mundo exterior, además de mantener la “identidad” de la célula constituye también su vía de comunicación con el exterior. En particular, la membrana incorpora diferentes canales iónicos selectivos, que permiten a la célula responder a estímulos haciéndola excitable desde el exterior. La apertura y cierre de estos canales da lugar a la generación de señales eléctricas asociadas con el correspondiente flujo de iones a través de la membrana. Algunas células, como las células nerviosas y musculares, han desarrollado especialmente esta capacidad, pero, en realidad, todas las células hacen uso de ella. Desde un punto de vista evolutivo, la incorporación a la membrana de proteínas de canal aparece ligada a la emergencia de los primeros organismos eucariotas (es decir, con la información genética confinada en un núcleo bien diferenciado), lo que se produce hace unos 1.400 millones de años. El modelo actualmente admitido para la membrana celular (mosaico fluido) es el de una doble capa lipídica, con los extremos hidrófobos enfrentados hacia el interior de la membrana (fig. 19.2), proporcionando un adecuado aislamiento del medio celular de su exterior. A su vez, la membrana celular incorpora diferentes proteínas, alguna de ellas de canal, que permiten el intercambio de sustancias entre el citoplasma y el exterior, obviamente imprescindible para el mantenimiento de la actividad celular, y cuya naturaleza y comportamiento juega un papel primordial en los equilibrios iónicos en la célula. La mayoría de estas proteínas de canal son selectivas, permitiendo el paso de determinadas sustancias de forma específica: Na+, K+, etc. Además, su permeabilidad puede variar bajo diferentes estímulos, tanto químicos como físicos, confiriendo a la célula sus características de excita bilidad, es decir, la capacidad de reaccionar ante estímulos externos.
Fig. 19.2. La membrana celular incorpora diferentes proteínas de canal que permiten el intercambio selectivo de iones y moléculas con el exterior
La membrana celular y el impulso nervioso
73
La selectividad de los canales da lugar a ciertos desequilibrios iónicos y como consecuencia de ello aparece una carga eléctrica neta a ambos lados de la membrana (el citosol está cargado negativamente respecto al exterior), dando lugar a la aparición de un potencial eléctrico, denominado potencial de membrana. Prácticamente la totalidad de las células eucariotas están eléctricamente polarizadas, y este hecho tiene repercusión en multitud de fenómenos básicos para su funcionamiento. Para la comprensión del origen y variables que regulan este potencial resulta imprescindible la descripción de los procesos de transporte a través de la membrana celular, sobre todo de los flujos y gradientes de algunos iones de especial interés biológico (Na+, K+, Cl‒...).
19.1.2 Potencial de membrana. Ecuación de Nernst El primer paso al estudiar los procesos electroquímicos a través de una membrana es comprender cómo una diferencia de concentraciones de una determinada sustancia, inicialmente sin carga neta, puede generar una diferencia de concentraciones iónicas y con ello generar un potencial de membrana. Para ello consideraremos la situación que se ilustra en la figura 19.3, donde un cierto recipiente está separado en dos compartimentos en los que existen soluciones de la misma sustancia (supondremos KCl para fijar ideas) con concentraciones diferentes a ambos lados. Si la membrana que separa ambas disoluciones es semipermeable, permitiendo el paso a una única especie iónica, se establece una cierta diferencia de concentraciones que genera una diferencia de potencial eléctrico en la membrana. Para analizar el proceso consideremos los flujos iónicos a través de la membrana. Supongamos concentraciones iniciales tales que la solución en el lado derecho sea más diluida que la del lado izquierdo y que la membrana es permeable exclusivamente a los iones K+. Si se realiza una medida de la diferencia de potencial entre ambos compartimentos, en esta situación inicial, no se detecta ninguna diferencia de potencial, ya que las dos soluciones son eléctricamente neutras (∆V = 0).
74
Fundamentos físicos de los procesos biológicos
Fig. 19.3. Experimento idealizado de transporte selectivo de iones K+ (círculos blancos) a través de una membrana semipermeable que separa dos disoluciones de concentración diferente. (a) Inicialmente las dos disoluciones son eléctricamente neutras y no se detecta ninguna diferencia de potencial a través de la membrana (ΔV = 0). (b) Al comenzar la difusión de iones K+ se produce un desequilibrio de carga, apareciendo una diferencia de potencial (ΔV ≠ 0) que tiende a frenar la difusión. (c) Finalmente se alcanza una situación de equilibrio, donde el flujo neto de iones K+ a través de la membrana se anula. El potencial eléctrico alcanza también su valor de equilibrio (potencial de Nernst).
Debido a la diferencia de concentraciones, los iones K+ y Cl– tenderían a difundirse hacia el compartimento menos concentrado, pero, tal como hemos supuesto, solo el ion K+ puede atravesar la membrana. Se establece, por tanto, una migración de estos iones, cuyo flujo a través de la membrana viene determinado por la ley de Fick (capítulo 12). J dif = − D
dnv dx
(19.1)
donde Jdif representa el flujo de iones debido a la difusión (número de iones que atraviesan la membrana por unidad de superficie y unidad de tiempo), nv representa la concentración de iones por unidad de volumen, dnv/dx su gradiente a través de la membrana y D el coeficiente de difusión, que depende de la movilidad Κ de los iones y de la temperatura T a partir de la relación de Einstein (capítulo 12): D = K kB T
(19.2)
k B 1, 38 × 10−23 JK −1 es la constante de Boltzmann. donde =
Tan pronto como empieza la difusión se produce un desequilibrio de carga, ya que el compartimento de la derecha se enriquece en iones K+ cargándose positivamente. Esto da lugar a la aparición de una diferencia de potencial (∆V ≠ 0) susceptible de ser medida (fig. 19.3.b) y simultáneamente aparecen un
75
La membrana celular y el impulso nervioso
campo eléctrico y una fuerza electrostática neta sobre los iones K+ que tienden a empujarlos hacia el compartimento de la izquierda. Esta fuerza electrostática da lugar a un flujo de iones (en sentido opuesto) cuya magnitud está relacionada con la velocidad de arrastre va que adquieren los iones por la acción del campo eléctrico: (19.3) Recordando que la movilidad K representa la velocidad que adquieren los iones por unidad de fuerza aplicada (Fel), la velocidad de arrastre se puede expresar como: = va KF = KzeE = − Kze el
dV dx
(19.4)
donde el campo eléctrico E se ha expresado como el gradiente del potencial V a través de la membrana, cambiado de signo. La carga de los iones (q = ze) se ha expresado como el producto de la valencia del ion (z) por la carga elemental (e), para formular las ecuaciones con mayor generalidad, aunque en el caso que estamos considerando, cationes monovalentes, sea z = +1. Por tanto, los flujos iónicos debidos al gradiente de concentraciones (difusión) y al gradiente de potencial (campo eléctrico) pueden expresarse como: J dif = − Kk BT
dnv dx
(19.5)
J el = − Kzenv
dV dx
(19.6)
En ambos casos el signo – indica que el flujo se produce en el sentido opuesto al gradiente, ya sea de concentraciones o de potencial eléctrico. Nos encontramos ahora con dos mecanismos operativos antagónicos: el gradiente de concentraciones tiende a empujar los iones K+ hacia la derecha, mientras el potencial eléctrico tiende a empujarlos hacia la izquierda. A medida que transcurre el tiempo, el gradiente de concentración se va reduciendo mientras el potencial va aumentando, por lo que se llegará a una situación de equilibrio en que los flujos de iones K+ debidos a la difusión se igualan con el flujo impulsado por las fuerzas eléctricas (fig. 19.3.c). En ese punto, se alcanza una cierta diferencia de concentraciones y de potencial que se denomina potencial de equilibrio o potencial de Nernst (para el K+, en este caso).
76
Fundamentos físicos de los procesos biológicos
Para obtener los valores de las concentraciones y potenciales de equilibrio basta igualar a cero el flujo total de iones a través de la membrana: J total = J dif + J el = 0
con lo que se obtiene: − Kk BT
dnv dV = Kzenv dx dx
y despejando: dV = −
k BT dnv ze nv
e integrando entre ambos lados de la membrana, con concentraciones ni y ne y potenciales Vi y Ve, donde los subíndices i y e se refieren al interior y exterior de la célula, se obtiene la ecuación de Nernst: k T n k T n RT ne Vi − Ve = − B ln i = + B ln e = ln ze ne ze ni zF ni
(19.7.a)
donde se ha utilizado la igualdad: k BT RT = ze zF
siendo R = k B NA = 8,314 J/mol, K la constante de los gases ideales y F = e NA = 96.500 C/mol es la constante de Faraday o carga asociada con un mol de iones de valencia unidad. Cuando la ecuación de Nernst se aplica para el cálculo de potenciales de membrana, debe tenerse en cuenta que éstos se definen siempre como el potencial interior (Vi) menos el exterior, que se toma como referencia (Ve = 0). Con este criterio, el potencial de membrana será: Vi = +
k BT ne ln ze ni
(19.7.b)
El gradiente de concentración y la diferencia de potencial de membrana en equilibrio corresponden a la situación en que el flujo neto de iones a través de la membrana se anula, es decir, el flujo debido a la difusión se cancela con el flujo electrostático. En consecuencia, si a ambos lados de una membrana similar a la descrita anteriormente las diferencias de concentraciones y potenciales no concuerdan con la relación de Nernst, se establecerá un flujo de
77
La membrana celular y el impulso nervioso
iones neto hasta restablecer dicho equilibrio. El sentido del flujo podrá ocurrir en una u otra dirección dependiendo de los correspondientes valores de concentración y potencial existentes. Conviene insistir en este resultado, especialmente considerando las concentraciones iónicas existentes en el interior y exterior de una célula y el correspondiente potencial de membrana. Si el potencial es igual al potencial de reposo, no existe flujo neto de iones a través de la membrana, pero si el potencial (o las concentraciones iónicas) se alteran se generará el flujo correspondiente. Estas consideraciones son particularmente importantes en conexión con las células excitables (neuronas y células musculares). Cuando se excita una célula, se produce una alteración del potencial que desencadena una serie de mecanismos que provocan flujos iónicos, alterando los potenciales de la membrana, y dando lugar al proceso del impulso nervioso, en forma de un potencial de acción, que se estudiará en detalle en la sección 19.2. Ejemplo. Potencial de membrana en células musculares de los mamíferos. En la tabla 19.1 y gráficamente en la figura 19.4 se presentan a modo de ejemplo las concentraciones de iones correspondientes a las células musculares de los mamíferos. Tabla 19.1. Concentración de iones en el citoplasma (ni) y externa (ne) para células musculares esqueléticas de mamíferos. Las concentraciones están expresadas en mM (1 mM = 10–3 mol/l = 1 mol/m3) Ion
Conc. Extracelular
Conc. Intracelular
ne/ni
Na+
145
12
12
K
4
155
0,026
Ca2+
1,5
< 10-7
> 15.000
Cl‒
123
4,2
30
Otros aniones (A‒)
29
163
0,17
+
A partir de estas concentraciones se pueden calcular los potenciales de membrana o potenciales de reposo utilizando la ecuación de Nernst (19.7). Considerando la temperatura del organismo igual a 37 ºC, T(K) = 273 + 37 = 310 K y sustituyendo los valores de la constante de Boltzmann y de la carga de los iones (q = ± e = ± 1,60×10‒19 C) se obtiene, para los iones monovalentes:
78
Fundamentos físicos de los procesos biológicos
n Vi = ± 26, 7 × ln e (mV) ni
(19.7.c)
donde el signo + corresponde a los cationes (q = +e) y el signo – a los aniones (q = –e). Los resultados para los diferentes iones (Na+, K+ y Cl‒) se presentan en la tabla 19.2. Tabla 19.2 Potenciales de reposo Ion
ne/ni
ln (ne/ni)
Potencial de reposo (mV)
Na+
12,1
2,49
+67
K
0,0258
–3,66
–98
29,3
3,38
–90
+
Cl
–
Fig. 19.4. Concentración de iones extra e intra-celulares correspondiente a células musculares esqueléticas de mamífero. El citoplasma presenta un exceso de iones K+ mientras el medio externo presenta un exceso de iones Na+ y Cl–.
Ejemplo. Calculemos cuál es la carga (y número de iones) necesaria para establecer el potencial de reposo. Tomemos como ejemplo para el cálculo los iones K+ (Vi = –98 mV). Para generar esta diferencia de potencial es necesario acumular en la membrana una carga: Q = C Vi donde C representa la capacidad de la membrana. La capacidad espe cífica, o capacidad por unidad de superficie, de la membrana celular es
79
La membrana celular y el impulso nervioso
Ce = 1 µF/cm2 = 10–2 F/m2, por lo que será necesaria una densidad superficial de carga: σ=
Q CVi = = C= eVi S S
(1×10 ) × ( −98 × 10 ) = −9, 8 × 10 −2
−3
−4
C / m2
es decir, una densidad superficial de iones igual a: ns =
σ –e
=
–9,8×10 –4 = 6,12 × 1015 iones/m2 ≈ 6.000 iones/μm2 –1,6×10 –19
Si esta densidad de carga se reparte en la membrana de una célula, que consideraremos de forma aproximadamente esférica y radio R ≈ 10 µm, ten dríamos una superficie: 5 S= 4 × π × R 2 = 4 × π × (10−= ) 1, 26 ×10−9 m2 2
y, por tanto una carga Q acumulada en la membrana: Q= σ × S =
( −9, 8 ×10 ) × (1, 26 ×10 ) = −1, 2 ×10 −4
−9
−12
C
donde el signo – indica que se produce una pérdida ∆N de iones K+ en el interior de la célula: ∆N =
Q 1, 2 × 10−12 = = 7, 5 × 106 iones de K + e 1, 6 × 10−19
La concentración en el citoplasma de iones K+ (tabla 19.1) es nK = 155 mM = 155 mol/m3, luego para determinar el número total de iones K+ debemos multiplicar por el número de Avogadro (NA = 6 × 1023 iones/mol) y por el volumen V de la célula: V = ( 4 3) × π × R 3 = ( 4 3) × π × (10−5= ) 4, 2 × 10−15 m3 3
con lo que se obtiene un total de iones potasio en el interior de la célula: N= 155 × 6 × 1023 × 4, 4 × 10−15 = 3, 9 × 1011 iones K
y, por tanto, la fracción relativa de iones K+ necesaria para generar el poten cial de membrana es: ∆N 7, 5 × 106 = ≈ 2 × 10−5 N K 3, 9 × 1011
es decir, se ha producido un desequilibrio neto de iones potasio que repre senta una fracción despreciable respecto a la concentración existente en el
80
Fundamentos físicos de los procesos biológicos
citoplasma (valores consignados en la tabla 19.1), que se puede considerar que mantiene, en términos macroscópicos, su neutralidad eléctrica. El potencial de membrana se genera así debido al flujo de un número pequeño de iones.
19.1.3 Equilibrio de Donnan La ecuación de Nernst corresponde a una situación de equilibrio y puede obtenerse también a partir de consideraciones termodinámicas. En efecto, si en una cierta célula existe una diferencia de potencial entre el interior y el exterior y suponemos, como en la sección anterior, que existe una única especie iónica permeable a través de la membrana, podemos obtener su concentración dentro y fuera de la célula a partir del factor de Boltzmann (capítulo 12), que relaciona la concentración de partículas nv con su energía U, en el equilibrio térmico: U = nv A exp − k BT
Para iones de valencia z, la energía es Ui,e = zeVi,e, donde los subíndices i y e se refieren, como anteriormente, a valores internos o externos a la célula, donde el potencial tiene valores Vi,e. Por tanto, la relación de concentraciones de iones en el exterior e interior de la célula será: zeVe A exp − ze (Vi − Ve ) k BT ne = exp = k BT ni zeVi A exp − k T B
y despejando, se obtiene de nuevo la ecuación de Nernst. k T n Vi − Ve =B ln e ze ni
En esta ocasión esta relación ha sido obtenida sin más que aplicar la existencia de equilibrio térmico, y por tanto permite la generalización para el caso más realista en que tengamos presentes varias especies iónicas, siempre que estén en equilibrio térmico. Si consideramos el caso de interés biológico en que los iones Na+, K+ y Cl‒ son los iones mayoritarios, obtendríamos la misma relación para todas ellas:
81
La membrana celular y el impulso nervioso
[Cl ]i [ Na ]e [ K ]e = = [Cl ]e [ Na ]i [ K ]i
e (Vi − Ve ) = exp k BT
(19.8)
Esta última expresión se conoce como equilibrio de Donnan o de GibbsDonnan. Nótese que se utiliza la notación [X] para indicar la concentración del ion X y que se ha sustituido la valencia correspondiente a cada ion (z(Na+) = z(K+) = ‒ z(Cl‒) = 1). Debido a la valencia negativa del ion cloro y puesto que ln ( x1 x2 ) = − ln ( x2 x1 ), el cociente de concentraciones de los iones Cl‒ aparece invertido respecto al de los iones Na+ y K+. Es evidente, por tanto, que para una situación de equilibrio el potencial de membrana Vm = Vi – Ve debe ser único y la relación de concentraciones iguales para el sodio y el potasio e inversa para el cloro. Los resultados experimentales analizados en el ejemplo anterior y presentados en las tablas 19.1 y 19.2 indican que la célula no se encuentra en equilibrio, ya que cada tipo de ion requería un potencial de membrana diferente, siendo por tanto imposible alcanzar el equilibrio simultáneo para todos los iones con las concentraciones mencionadas. Si consideramos un valor típico del potencial de membrana Vm = Vi – Ve ≈ – 90 mV, las concentraciones de equilibrio de los diferentes iones pueden calcularse inmediatamente a partir de la ecuación de GibbsDonnan.
[Cl ]i [ Na ]e [ K ]e = = [Cl ]e [ Na ]i [ K ]i
eVm 1, 6 × 10−19 × 90 × 10−3 = exp = exp − = 0, 0345 1, 38 × 10−23 × 310 k BT
que podemos comparar con los correspondientes valores experimentales del cociente de concentraciones entre el exterior y el interior de las células musculares esqueléticas de los mamíferos. Tabla 19.3. Cociente de concentraciones [X]e/[X]i de células musculares de mamíferos Ion (X)
Equilibrio (Gibbs-Donnan)
Experimental
Na
0,0345
12,1
K
0,0345
0,0258
Cl–
1/0,0345 ≈ 29
29,3
+
+
Es decir, como puede observarse, las concentraciones de los iones sodio y potasio no corresponden a los valores de equilibrio. En el caso de los iones K+ el valor experimental indica una concentración relativa en el citosol algo superior a dicho valor de equilibrio, pero en el caso de los iones Na+, su concentración no solo difiere, sino que está invertida. El valor de equilibrio de Gibbs-Donnan correspondería a una concentración de Na+ en el citoplasma unas 29 veces superior a la del exterior, mientras el valor experimental resulta
82
Fundamentos físicos de los procesos biológicos
ser de una concentración exterior superior a la del citoplasma en un factor 12. Estos valores solo pueden explicarse teniendo en cuenta la existencia de algún mecanismo que altere las concentraciones de iones, enriqueciendo el citoplasma en iones K+ y el exterior en iones Na+. Este mecanismo corresponde a la acción de la bomba de Na-K que da lugar al transporte activo de iones a través de la membrana y que veremos más adelante.
19.1.4 Potenciales fuera del equilibrio. Permeabilidad y ecuación de Goldman-Hodgkin-Katz (GHK) Revisemos algunos de los hechos experimentales estudiados en las secciones precedentes: Según acabamos de ver, las diferencias de concentraciones de iones entre el citosol y el exterior celular no corresponden a valores de equilibrio. Sin embargo, sus valores sí permanecen estables en el tiempo, es decir, corresponden a una cierta situación estacionaria. Algo similar ocurre con el potencial de membrana. Como se indicó anteriormente, la práctica totalidad de las células están polarizadas. El valor del potencial puede diferir de un tipo de célula a otro, variando típicamente entre –40 mV y –95 mV, y de nuevo nos encontramos ante una magnitud que no corresponde a un valor de equilibrio pero que permanece estacionaria. (Los cambios asociados al impulso nervioso constituyen un fenómeno más complejo, cuyas características se estudiarán más adelante). Y tal como se ha visto, el potencial de membrana y las concentraciones iónicas están íntimamente relacionados entre sí y con los flujos iónicos a través de la membrana. Por tanto, debería ser posible relacionar estas magnitudes, una vez que hemos aceptado que corresponden a una situación estacionaria, aunque no necesariamente a valores de equilibrio. Para ello debemos volver a examinar los flujos iónicos a través de la membrana celular en un caso más general que el abordado anteriormente, incluyendo ahora la posibilidad de difusión de varias especies iónicas (de nuevo Na+, K+ y Cl‒ son los iones relevantes). Al considerar esta nueva situación debemos tener en cuenta también el hecho fundamental de que no todos los iones se difunden con igual facilidad. Ya se expresó el coeficiente de difusión y la velocidad de arrastre en función de la movilidad Κ (ecuaciones 19.2 y 19.4), pero, al considerar la difusión de una única especie, este parámetro se simplificaba en los cálculos, desapareciendo de las expresiones finales.
83
La membrana celular y el impulso nervioso
La movilidad de diferentes sustancias a través de la membrana celular varía en un rango enorme. Mientras moléculas pequeñas no polares (O2, CO2...) se difunden con facilidad, las moléculas polares, incluso de pequeño tamaño, tienen mayores dificultades para atravesar la doble capa lipídica que constituye la membrana celular. El paso a través de la membrana celular de moléculas polares de cierto tamaño o de iones sería despreciable en ausencia de canales específicos (fig. 19.5).
Fig. 19.5. La movilidad de diferentes sustancias a través de la membrana celular varía en un rango enorme dependiendo de su tamaño y polaridad. Las moléculas no polares (O2, CO2...) se difunden con facilidad mientras que las moléculas polares, incluso de pequeño tamaño, tienen grandes dificultades para atravesar la membrana celular. El paso de moléculas de cierto tamaño o de moléculas cargadas sería despreciable en ausencia de canales específicos.
Dada una membrana de espesor ∆x, el coeficiente de difusión puede escribirse como: D = p∆x (19.9) donde p es un parámetro, que depende de la naturaleza del ion y de la membrana pero es independiente de su espesor, que se denomina permeabilidad. Teniendo en cuenta que las dimensiones del coeficiente de difusión (capítulo 12) son: [D] = L2 T‒1, las dimensiones de la permeabilidad son:
[ D] [ p] = = [ ∆x ]
L2T −1 = LT −1 L
84
Fundamentos físicos de los procesos biológicos
es decir, dimensiones de velocidad, midiéndose en ms‒1 en el SI. La permeabilidad de una especie química a través de una membrana es otra forma de describir su movilidad a través de dicha membrana, pudiendo relacionarse ambas magnitudes, de forma inmediata, a partir de la relación de Einstein: D = K kB T = p∆x
(19.10)
En la figura 19.6 se representan las permeabilidades de diferentes tipos de moléculas a través de membranas lipídicas sintéticas.
Fig. 19.6. Permeabilidades de algunas sustancias a través de membranas lipídicas artificiales
El flujo a través de la membrana puede expresarse por tanto en función de la permeabilidad. En efecto, sustituyendo la ecuación 19.9 en la ley de Fick, se obtiene: J dif = − D
∆nv ∆n = −( p∆x) v = − p ∆nv ∆x ∆x
(19.11)
es decir, el flujo es igual al producto de la permeabilidad por la diferencia de concentración. Ejemplo. La permeabilidad del ion K+ a través de la membrana de células musculares es: pK = 2×10 6 cm/s = 2×10 8 m/s
85
La membrana celular y el impulso nervioso
por tanto, una diferencia de concentración: ∆n = 150 mM = 150 mol/m3 pro voca un flujo, por difusión, de: J dif = − p ∆n=
( 2 × 10 ) × (1, 5 ×10 )= −8
2
3 × 10−6 mol × m −2 × s −1
lo que, a través de una superficie de membrana S = 1 µm2, corresponde al paso de un número de moléculas por unidad de tiempo:
i) Potencial de difusión La difusión de sustancias con diferente permeabilidad a través de una membrana genera un potencial estacionario, denominado potencial de difusión, que constituye una generalización del potencial de Nernst. Conviene insistir en que ahora obtenemos una situación estacionaria (sin cambio en el tiempo), pero no de equilibrio. Consideremos un ejemplo similar al planteado en la sección 1.2 al derivar el potencial de Nernst, con dos disoluciones de KCl separadas por una membrana. Sin embargo, a diferencia con aquella sección, supondremos ahora que la membrana es permeable a ambos iones (K+ y Cl‒) siendo sus permeabilidades, en general, diferentes, pK ≠ pCl. El ion más permeable comenzará difundiéndose con mayor rapidez estableciéndose una diferencia de potencial que, por un lado, frena su difusión y, por otro, acelera la difusión del otro ion, de signo contrario. El resultado final es una difusión conjunta, que mantiene una diferencia de potencial estacionaria en la membrana. El flujo a través de la membrana se compone de un término debido a la difusión Jdif, regido por el gradiente de concentraciones, y de un término electrostático Jel debido a la diferencia de potencial entre ambos lados, cuyas expresiones coinciden con las utilizadas en la sección 1.1 (ecuaciones 19.5 y 19.6). Particularizando los correspondientes valores de concentración, valencia y movilidad para ambos iones (ni, zi, Ki con i = K, Cl), los flujos totales de potasio y cloro quedan expresados como: K K J total = J dif + J elK = − K K k BT
Cl Cl J total = J dif + J elCl = − K Cl k BT
dnK dV − K K z K enK dx dx
(19.12.a)
dnCl dV − K Cl zCl enCl dx dx
(19.12.b)
86
Fundamentos físicos de los procesos biológicos
La existencia de un potencial de membrana estacionario supone la ausencia de corriente eléctrica neta a través de la membrana, por lo que debe verificarse: K Cl z K J total + zCl J total = 0
lo que permite despejar el gradiente de potencial eléctrico dV/dx, a partir de las ecuaciones anteriores. k T dV = − B dx e
dnCl dn + zK K K K dx dx zCl2 nCl K Cl + z K2 nK K K
zCl K Cl
Por otra parte, se ha de cumplir la condición de electroneutralidad en cada elemento de membrana dx: nK = nCl = n
(19.13)
por lo que la ecuación anterior puede escribirse como: dV = −
k BT zCl K Cl + z K K K dn e zCl2 K Cl + z K2 K K n
e integrando entre los extremos de la membrana se obtiene el potencial de difusión o diferencia de potencial en la membrana debido a la difusión de dos especies iónicas con permeabilidades diferentes. Vm= Vi − Ve =
k BT zCl K Cl + z K K K e zCl2 K Cl + z K2 K K
ne ln ni
y sustituyendo la valencia correspondiente a cada ion (z(K+) = ‒ z(Cl‒) = 1) se obtiene finalmente: Vm =
k BT K K − K Cl ne ln e K K + K Cl ni
(19.14)
ecuación similar a la ecuación de Nernst, pero que ahora incluye, además de las concentraciones iónicas, la diferencia de movilidades (o permeabilidades) cuyos valores relativos son fundamentales a la hora de determinar el valor del potencial de membrana. En particular, puede comprobarse que la aparición de un potencial de difusión está ligada a la diferencia en los valores de las movilidades (o permeabilidades), ya que si éstas se igualan, Κ K = ΚCl, el potencial se anula. De la misma forma, si ΚCl = 0 y sólo hay transporte de iones K+, la ec. (19.14) se transforma en la ec. de Nernst. Debe subrayarse que el potencial
87
La membrana celular y el impulso nervioso
de difusión es estacionario, pero no de equilibrio, ya que, para tiempos suficientemente largos, los dos iones se habrán difundido completamente, igualándose las concentraciones y desapareciendo la diferencia de potencial. En la célula existen otros mecanismos que se encargan de mantener la diferencia de concentraciones iónicas entre el interior y el exterior de la célula, que a su vez determinan el potencial de membrana. ii) Ecuación de GoldmanHodgkinKatz (GHK) El ejemplo anterior puede generalizarse para el caso en que sean varias las especies difusibles, aunque su desarrollo reviste una dificultad algo mayor, que sobrepasa el objetivo de este texto. Desde el punto de vista conceptual resulta, sin embargo, fácilmente asimilable, ya que implica la aparición de un potencial de membrana relacionado con las concentraciones y las permeabilidades de los iones difusibles, es decir, un resultado muy similar al potencial de difusión que acabamos de considerar. Particularizando a la situación de interés biológico de difusión de iones Na , K+ y Cl‒, se obtiene la ecuación de Goldman-Hodgkin-Katz (GHK): +
Vm =
k BT pK [ K ]e + pNa [ Na ]e + pCl [Cl ]i ln e pK [ K ]i + pNa [ Na ]i + pCl [Cl ]e
(19.15)
que relaciona el potencial de membrana Vm con las concentraciones, expresadas entre corchetes, y permeabilidades px de dichos iones. Nótese que, al igual que sucedía en la relación de equilibrio de Gibbs-Donnan (ecuación 19.4), las concentraciones del anión cloro aparecen invertidas respecto a las de los iones positivos (la concentración de cloro en el numerador corresponde a su valor en el citoplasma). Es inmediato comprobar que se recupera la ecuación de Nernst (ecuación 19.7a) a partir de la ecuación GHK si todas las permeabilidades se anulan excepto la de un único ion. iii) Potencial de reposo del axón A principios del siglo XX se emitió la hipótesis de que el papel fundamental en la polarización de la membrana del axón, y por tanto en la generación de los impulsos nerviosos, viene determinado por la difusión dominante de los iones K+ (J. Bernstein, 1902). Esta hipótesis puede verificarse experimentalmente si se varía la concentración de iones K+ externa y se observa la variación del potencial de reposo del axón (potencial de membrana con el nervio en estado de reposo). La figura 19.7 presenta dichos resultados experimentales, potencial de reposo en función de la concentración externa de iones
88
Fundamentos físicos de los procesos biológicos
K+, obtenidos para el axón del calamar, utilizado con frecuencia en este tipo de experimentos debido a la facilidad de manipulación que ofrece gracias a sus grandes dimensiones.
Fig. 19.7. Dependencia del potencial de membrana del axón gigante del calamar en función de la concentración externa de iones K+ (representada en escala logarítmica). Los datos experimentales (círculos) se ajustan adecuadamente a la ecuación de Nernst (línea recta) a altas concentraciones. A bajas concentraciones es necesario incluir el efecto de la permeabilidad de otros iones por medio de la ecuación de Goldman-Hodgkin-Katz (GHK), representada por la línea curva (con relación de permeabilidades pK:pNa:pCl = 1:0,04:0,05 en este caso). (Datos experimentales de Curtis, H.J. y Cole K.S., “Membrane resting and action potentials from the squid giant axon”, J. Cell. Comp. Physiol., 19, 135-144 [1942]).
Se trata de una representación semilogarítmica, es decir, el eje de abscisas representa en realidad el logaritmo de la concentración. Recuérdese también que entre los logaritmos naturales (neperianos) y en base 10 existe la relación: 2,303 log x = ln x, por lo que la ecuación de Nernst, particularizando para el ion potasio, puede expresarse como: Vm = 2, 303
[ K ]e k BT log [K ] e i
(19.16)
y, por tanto, representando el potencial de reposo en función de x = log [K]e, se debe obtener una dependencia lineal: Vm = A x + B
89
La membrana celular y el impulso nervioso
siendo A = 2, 303
(
k BT k T y B = −2, 303 B log [ K ]i e e
)
Puede observarse que los resultados experimentales concuerdan con las predicciones de la ecuación de Nernst (línea discontinua), pero solo a concentraciones altas de K+. Para concentraciones bajas, hay una clara desviación de las previsiones y el valor del potencial de reposo es menos negativo que dichas predicciones. La razón de esta discrepancia estriba en que la hipótesis de que dicho potencial está determinado por los iones K+ es correcta solo parcialmente. El resto de iones citoplasmáticos, en particular Na+ y Cl‒, también son importantes. Aunque la permeabilidad del K+ es mayor, y por tanto dominante a concentraciones suficientemente altas, a bajas concentraciones de K+, el papel de los otros iones se hace imprescindible para explicar los resultados. Es necesario por tanto utilizar la expresión general de la ecuación de GoldmanHodgkin-Katz (ecuación 19.15), cuyas predicciones se representan por la línea continua en la figura 19.7, tomando una relación de permeabilidades pK:pNa:pCl = 1:0,04:0,05, que se ajusta satisfactoriamente a los valores experimentales en todo el rango de concentraciones. iv) Permeabilidades relativas K/Na Continuando con las predicciones de la ecuación GHK para las propiedades de las células nerviosas, resulta particularmente útil visualizar los cambios en el potencial de membrana cuando se producen variaciones en las permeabilidades de los iones Na+ y K+, lo que resulta fundamental para la comprensión del potencial de acción y la transmisión de los impulsos nerviosos que se estudiarán en la sección 19.2. En dicha situación, la permeabilidad de la membrana celular al ion Cl‒ es muy inferior que a los iones Na+ y K+, y la ecuación GHK puede simplificarse expresando el potencial de membrana en función de la relación de permeabilidades Na-K. Vm =
k BT [ K ]e + ( pNa pK ) [ Na ]e ln e [ K ]i + ( pNa pK ) [ Na ]i
(19.17)
En la figura 19.8 se representa el potencial de reposo en función de la relación de permeabilidades pK /pNa, utilizando los valores de concentraciones iónicas correspondientes a las células musculares de mamífero, que se presentaron en la tabla 19.1. Puede observarse que el potencial de membrana cambia drásticamente en función del valor de la relación de permeabilidades y que cuando domina la permeabilidad de alguno de los iones, el potencial de membrana coincide con el potencial de Nernst para dicho ion. Así, cuando domina la permeabilidad del ion potasio el potencial de
90
Fundamentos físicos de los procesos biológicos
membrana tiende a Vm = ‒98 mV, mientras que al dominar la permeabilidad del sodio el potencial de membrana tiende a Vm = +67 mV, que corresponden a los valores de potencial de reposo respectivos calculados en el ejemplo 1 y resumidos en la tabla 19.2.
Fig. 19.8. Potencial de reposo en función de la relación de permeabilidades pK /pNa. Cuando domina la permeabilidad de alguno de los iones el potencial de membrana coincide con el potencial de Nernst para dicho ion.
19.1.5 La bomba de sodio-potasio Los resultados experimentales obtenidos en diferentes células demuestran que las concentraciones de iones no se corresponden con las calculables para un sistema en equilibrio. En particular la concentración de iones Na+ es mucho menor de la esperada, a pesar de que la membrana celular es parcialmente permeable a dichos iones. Todo indica la existencia de algún mecanismo adicional que extrae sodio del interior de la célula hacia el exterior. Este mecanismo recibe el nombre de bomba Na+K+ , y parece ser básicamente el mismo en todas las células. El nombre de bomba Na+-K+ proviene del hecho de que el transporte de los iones Na+ está acoplado a un transporte simultáneo de iones K+ desde el exterior al interior de la célula. Desde el punto de vista iónico, el balance global de esta “bomba” consiste en extraer tres iones de Na+ e introducir dos iones K+, lo que suele resumirse por medio de la ecuación:
La membrana celular y el impulso nervioso
91 (19.18)
Contrariamente a los fenómenos de transporte considerados en las secciones anteriores, este transporte se realiza en contra de los gradientes y potenciales de equilibrio, por lo que necesita consumir energía. De hecho, si se incorporan a la célula inhibidores metabólicos, el transporte de iones Na+ y K+ se detiene. La energía necesaria para este proceso se obtiene a partir de la oxidación del ATP (adenosín trifosfato). Esta reacción es capaz de aportar 65 kJ/mol, mientras la operación de la bomba de sodio-potasio requiere un aporte de 44 kJ para bombear los tres moles de iones sodio al exterior e introducir dos moles de iones potasio. Por tanto, el aporte energético es suficiente, habién dose verificado la estequiometría 3:2:1 para las proporciones de Na:K:ATP involucrados (fig. 19.9).
Fig. 19.9. La bomba Na+ - K+ provoca el flujo acoplado de iones Na+ del citosol al exterior y de iones K+ en sentido opuesto. El aporte energético necesario se obtiene a partir de ATP. La estequiometría del proceso es Na+:K+:ATP = 3:2:1.
El mantenimiento del gradiente de iones Na+ y K+ es una función esencial para la célula, utilizándose en muchos casos este gradiente para el transporte de otras sustancias a través de la membrana celular o, como veremos en la siguiente sección, para activar señales eléctricas a través del sistema nervioso. Por tanto, no es de extrañar que en el mantenimiento de dicho gradiente (o lo que es lo mismo, en la operación de la bomba Na+-K+) se consuma una fracción importante de todo el metabolismo. En algunos órganos especializados (cerebro, riñones, corazón) el consumo energético para proporcionar ATP suficiente para este fin representa entre el 30 % y el 90 % de todo el metabolismo de estos órganos. Particularmente importante resulta el equilibrio iónico en las células del sistema nervioso. Gracias a él, los organismos son capaces de generar “impulsos nerviosos”, proporcionando un sistema de información rápido para la regulación y coordinación de diferentes actividades, tanto de procesos internos como de respuesta a estímulos externos. Estos objetivos se consiguen gracias a la apertura y cierre de determinados canales iónicos en la membrana de las células nerviosas, cuyo comportamiento pasamos a estudiar en la siguiente sección.
92
Fundamentos físicos de los procesos biológicos
19.2 Conducción nerviosa 19.2.1 Estructura de las células nerviosas. Excitabilidad En la sección anterior se han revisado las características de los flujos iónicos a través de la membrana celular que, bajo las condiciones y mecanismos allí especificados, dan lugar a la existencia de un potencial de membrana estacionario conocido como “potencial de reposo”. Dicho valor “de reposo” puede ser alterado por diferentes excitaciones procedentes del entorno, lo que constituye la base de cualquier sistema sensorial, tanto en organismos unicelulares como en células de organismos pluricelulares. Existen diversos sensores capaces de detectar estímulos diferentes, ya sea de tipo químico, mecánico, térmico o electromagnético, que representan el eslabón primario de los “sentidos”. La activación de los diferentes sensores provoca cambios en el potencial de membrana respecto a su valor de reposo, lo que constituye el mecanismo de excitación celular básico. En los organismos superiores el proceso de excitación es seguido por un proceso de transferencia y procesado de dicha información, altamente sofisticado, gracias a una red de células especializadas que constituyen el sistema nervioso y cuya unidad funcional es la neurona. Una neurona típica (fig. 19.10) está compuesta por un cuerpo celular o soma, que contiene el núcleo y del que irradian unas prolongaciones características, las dendritas y el axón. Las dendritas son en general cortas y están profusamente ramificadas. El axón, generalmente único y de gran longitud, puede estar ramificado en su parte final. Por ejemplo, en el ser humano algunos axones conectan directamente sus extremidades con la médula espinal, con lo que su longitud puede superar el metro. Las dendritas son generalmente los receptores de los estímulos más habituales que llegan a la neurona, dando lugar a cambios del potencial de membrana en los puntos de recepción. Los potenciales generados por diferentes estímulos se propagan hacia la región del soma, sumándose y, eventualmente, generando un “impulso nervioso” que se transmite a través del axón. Este axón establece contactos fisiológicos con otras células ner viosas (o de otro tipo) denominados sinapsis. La comunicación se hace normalmente por medios químicos, gracias a la intermediación de sustancias neurotransmisoras específicas, que salvan el espacio intercelular, denominado hendidura sináptica. En una célula nerviosa típica existen unas 10.000 conexiones, aunque, en algunos casos, como las células de Purkinje en el cerebelo, su número puede ascender a 150.000.
La membrana celular y el impulso nervioso
93
Fig. 19.10. Representación de una célula nerviosa típica mostrando el cuerpo celular con el núcleo, las dendritas y el axón, así como la conexión (sinapsis) con otra célula nerviosa.
El diámetro de los axones depende de su función específica, variando típicamente entre 2 µm y 20 µm, aunque pueden alcanzar valores muy superiores. Así, el axón gigante del calamar (Loligo pealei), que controla el movimiento del manto del animal, llega a tener una longitud de unos 30 cm y un diámetro del orden de 1 mm. Ésto le convierte en sujeto idóneo para la investigación experimental, facilitando la inserción de microelectrodos para la detección de las variaciones de potencial y corriente eléctrica asociadas con los impulsos nerviosos, habiendo sido utilizado en muchos experimentos clave en este campo, en particular en aquellos desarrollados por Hodgkin y Huxley, que condujeron al desarrollo del modelo del potencial de acción en la propagación del impulso nervioso, por el que recibieron el premio Nobel de Fisiología y Medicina en 1963.
94
Fundamentos físicos de los procesos biológicos
Fig. 19.11. El axón gigante del calamar (Loligo pealei), que controla el movimiento del manto del animal, llega a tener una longitud de unos 30 cm y un diámetro del orden de 1 mm, es decir, unas 100 veces superior al diámetro de un axón de mamífero (φ ~ 10 μm).
En los vertebrados, los axones de algunas células nerviosas están recubiertos por una capa aislante, la mielina, que procede de las células gliales: oligodendrocitos en el sistema nervioso central y células de Schwann en el sistema nervioso periférico. Los oligodendrocitos emiten varias prolongaciones, cada una de las cuales envuelve concéntricamente al axón, lo que también hacen, de forma similar, las células de Schwann (fig. 19.12). El recubrimiento de mielina así formado no es continuo a lo largo del axón, sino que está interrumpido por los nodos de Ranvier, cada uno de aproximadamente 1 µm de longitud, donde el axón está en contacto con el medio extracelular. La distancia entre nodos de Ranvier puede oscilar entre 1 y 2 mm dependiendo del tamaño del axón. La vaina de mielina generada por el arrollamiento de las células gliales da lugar a un aumento del espesor del recubrimiento del axoplasma, en torno a un factor 200, respecto al espesor típico de la membrana celular (∼ 10 ‒2 µm). Esto afecta a las propiedades eléctricas del axón, concretamente aumentando su resistencia y reduciendo su capacidad eléctrica en aproximadamente ese mismo factor, lo que repercute en las características de propagación del impulso nervioso, que se diferencia muy notablemente en las fibras nerviosas con recubrimiento de mielina (vertebrados) respecto a aquellas que carecen de este (invertebrados) como veremos más adelante.
La membrana celular y el impulso nervioso
95
Fig. 19.12. Representación de un axón recubierto de mielina. (a) El recubrimiento se interrumpe cada 12 mm en los nodos de Ranvier, donde el axón está en contacto con el fluido extracelular. (b) El recubrimiento procede de las células gliales (oligodendrocitos y células de Schwann) que se arrollan en espiral en torno al axoplasma, aumentando el espesor efectivo de la membrana del axón, con el consiguiente cambio en sus características eléctricas.
19.2.2 El impulso nervioso. Potencial de acción Las células nerviosas se comunican entre sí por medio de impulsos nerviosos, cuyo elemento fundamental lo constituye un breve cambio (del orden de unos milisegundos) en el potencial de membrana del axón, que recibe el nombre de potencial de acción. El estímulo puede producirse, de forma natural, debido a la llegada a las dendritas de señales procedentes de otras neuronas, o mediante estimulación artificial a partir de microelectrodos insertados en el axón. En el caso de excitación natural, las señales recibidas por las dendritas (que pueden ser excitadoras o inhibidoras) son integradas en el cuerpo celular hasta alcanzar la “zona de disparo” (situada en un punto cercano a la unión del axón con el cuerpo de la neurona), donde se genera el impulso que se propaga a través del axón hasta sus ramificaciones finales, donde se produce la conexión sináptica con otras células. Por tanto, en el estudio del impulso nervioso cabe distinguir dos aspectos bien diferenciados: la generación del potencial de acción propiamente dicho
96
Fundamentos físicos de los procesos biológicos
(que estudiaremos en esta sección) y su transmisión a lo largo del axón (que se estudiará en la sección siguiente). Consideremos en primer lugar el desarrollo del potencial de acción como un fenómeno local, es decir, el cambio del potencial de membrana, en función del tiempo, que se desarrolla en aquel punto donde se produce la estimulación del axón. El estímulo consiste en un cambio del potencial de membrana respecto a su valor de reposo (Vreposo). Recordemos que dicho potencial es negativo respecto al fluido extracelular, cuyo valor se toma como cero. Si el estímulo es tal que el potencial de membrana aumenta (se hace menos negativo) se dice que la célula se despolariza, mientras que si el estímulo provoca una disminución del potencial (se hace más negativo) se dice que se produce una hiperpolarización (fig. 19.13). Una primera característica importante en la respuesta de las células nerviosas es la existencia de un potencial umbral para el desarrollo del potencial de acción. Cuando la membrana es despolarizada débilmente, la membrana recobra al poco tiempo el valor del potencial de reposo (zona I de la figura 19.13) por la acción de los flujos iónicos habituales, estudia dos en la sección anterior. Sin embargo, si el estímulo es suficientemente intenso y la despolarización de la membrana sobrepasa un valor umbral (Vumbral), se activa la apertura de canales iónicos en la membrana del axón (implicando fundamentalmente a los iones Na+ y K+), provocando cambios en la permeabilidad que generan variaciones muy notables en el potencial de membrana, tal como se muestra en la zona II de la figura 19.13, que llega a cambiar de polaridad (haciéndose positivo), para retornar posteriormente al valor de reposo al cabo de un intervalo de tiempo típico de algunos milisegundos. Este cambio de potencial de membrana es lo que se conoce como potencial de acción y su propagación a lo largo del axón da lugar al impulso nervioso. El valor máximo del potencial de acción es constante e independiente del valor de la excitación, siempre que ésta haya sobrepasado el valor umbral.
97
La membrana celular y el impulso nervioso
Fig. 19.13. Evolución temporal del potencial de membrana como respuesta a un estímulo débil (I) y a un estímulo que sobrepasa el potencial umbral para el “disparo” del potencial de acción (II).
El desarrollo del potencial de acción y su relación con los flujos iónicos a través de la membrana se detalla en la figura 19.14. En dicha figura se han utilizado valores del potencial de membrana correspondientes al axón gigante del calamar. Los potenciales de membrana para otros axones pueden variar ligeramente, pero el comportamiento cualitativo del potencial de acción es similar. Inicialmente el potencial de membrana del axón corresponde al potencial de reposo cuyo valor se sitúa en torno a unos –65 mV, valor próximo, aunque algo superior, al potencial de Nernst del K+ (VK ≈ –75 mV). Si se produce una excitación que sobrepasa el valor del potencial umbral (Vumbral ~ –55 mV) se activa la apertura de canales de Na+ en la membrana del axón, cuya permeabilidad (conductividad) a estos iones se incrementa en un valor superior a 103 (fig. 19.14.b). Como el potencial de membrana es negativo, se produce un flujo de iones Na+ al interior, favoreciendo aún más el incremento del potencial de membrana, que llega a cambiar de polaridad y tomar valores positivos. El valor máximo alcanzado se encuentra en torno a unos +30 mV, relativamente próximo al potencial de reposo del Na+ (VNa ≈ +67 mV), ya que su permeabilidad es ahora dominante. +
+
Al aproximarse el potencial de membrana al valor del potencial de Nernst del sodio, el flujo de éste disminuye. Simultáneamente, la permeabilidad de
98
Fundamentos físicos de los procesos biológicos
la membrana a este ion recupera los valores habituales (se cierran los canales de Na+), mientras que se incrementa ahora (en un factor del orden de 30) la permeabilidad de la membrana a los iones K+, debido a la apertura de otros canales específicos para este ion. Como el axón está despolarizado (el interior está cargado positivamente), los iones potasio fluyen al exterior (fig.19.14.b) y esto provoca la repolarización de la membrana que recupera un potencial de membrana negativo. De hecho, durante la salida de iones K+ se alcanza un potencial próximo al potencial de Nernst del K+, lo que supone una hiperpo larización, es decir, un potencial de membrana algo más negativo que el de reposo. Esto garantiza un periodo latente, ya que la proteína de canal pasa a un estado “cerrado inactivo” que no permite la generación de un nuevo potencial de acción. Este estado se mantiene hasta que se restablece el potencial de reposo (con la intervención de la bomba Na+-K+), cambiando de nuevo la proteína a una estructura cerrada pero activa, sensible de nuevo a nuevas perturbaciones. Este comportamiento permite la transmisión del impulso en una dirección concreta y evita que el impulso nervioso se propague “hacia atrás”.
Fig. 19.14. Etapas de desarrollo del potencial de acción y su relación con los flujos iónicos a través de la membrana del axón. (Los valores numéricos corresponden al axón gigante del calamar).
Considerando la duración de los distintos procesos que se suceden durante el desarrollo del potencial de acción, podemos ver en la figura 19.14 que el
La membrana celular y el impulso nervioso
99
proceso de activación del potencial de acción propiamente dicho (apertura y cierre de canales Na+-K+) es rápido (en general algo inferior al milisegundo), mientras el periodo latente post-impulso requiere la acción de la bomba Na+-K+ (y el correspondiente consumo energético) demorando más tiempo. Típicamente se produce un periodo latente de unos 3 ms, con lo que no se pueden conducir impulsos a frecuencia superior a 1/ ∆t ≈ 300 Hz (= 300 impulsos por segundo). Conviene subrayar que el potencial máximo que se alcanza durante la despolarización de la membrana tiene un valor constante e independiente de la excitación inicial, una vez que se ha sobrepasado el umbral de excitación, es decir, el potencial de acción es del tipo “todo o nada”. Si la señal es suficiente como para “disparar” el potencial de acción, se produce su “amplificación” hasta un mismo valor. La información transmitida por los impulsos nerviosos no puede estar, por tanto, codificada por medio de variaciones de su intensidad. La exci tación de la neurona produce en general el disparo de un “tren” de pulsos de igual amplitud (fig. 19.15) con una cierta frecuencia que cambia dependiendo de la intensidad de excitación. Los diferentes “mensajes” están codificados por medio de cambios en la frecuencia, algo que recordaría las técnicas de transmisión de información de tipo “digital” y que se utilizan hoy en día en telecomunicaciones o reproducción de señales musicales y de vídeo, por su capacidad para transmitir la información de forma segura y poco sensible a errores.
Fig. 19.15. La excitación de una neurona produce el disparo de un “tren” de pulsos de igual amplitud. Los diferentes “mensajes” del sistema nervioso están codificados por medio de cambios en la frecuencia de estos pulsos, lo que recuerda la transmisión de información de tipo digital.
Observación. Neurotoxinas. Algunas de las sustancias más venenosas que se conocen actúan sobre el sistema nervioso, bloqueando la apertura o cierre de los canales iónicos, impidiendo por tanto el desarrollo del impulso nervioso. Estas sustancias reciben el nombre de neurotoxinas.
100
Fundamentos físicos de los procesos biológicos
Entre estas encontramos la tetrodotoxina, presente en algunos órganos del pez burbuja (tetradontidae: cuatro dientes), considerado un manjar en la gastronomía japonesa (Fugu). La ingestión de esta neurotoxina puede ser letal, por lo que no es de extrañar la existencia de cocineros especializados, específicamente acreditados como expertos capaces de proceder a la sepa ración de los órganos tóxicos y servir las partes del pez burbuja aptas para el consumo. Un efecto similar es producido por la saxitoxina, generada por algunos dinoflagelados presentes en el fitoplancton marino. Su absorción por los moluscos filtradores no provoca ningún tipo de alteración aparente en sus características, aunque pueden ser causantes de graves intoxicaciones al ser consumidos por los seres humanos. El aumento de la concentración del fito plancton suele ir acompañado de cambios de coloración del agua, debido a sus pigmentos fotosintéticos, siendo la más frecuente la coloración rojiza, por lo que se utiliza el término “Marea Roja” para designar esta contaminación. Aparte de sus efectos nocivos, las neurotoxinas se utilizan en el labora torio como método de bloqueo controlado de los canales iónicos y aplicados al estudio de la estructura y funcionamiento de las células nerviosas.
19.2.3 Conducción del impulso nervioso: características generales Hasta ahora hemos considerado tan solo la secuencia temporal del potencial de acción y su desarrollo local en un cierto punto del axón. Pasemos ahora a considerar su propagación a lo largo del axón, es decir, la propagación del impulso nervioso propiamente dicha. El flujo local de iones Na+ al interior del axón durante el desarrollo del potencial de acción da lugar también a su difusión a las zonas adyacentes, donde provoca una despolarización parcial de la membrana, que a su vez genera un flujo de carga en el exterior del axón, dando lugar a circuitos locales de carga, tal como se ilustra en la figura 19.16. Estos flujos van modificando el potencial de membrana del axón, siendo este cambio el que constituye el impulso nervioso propiamente dicho.
La membrana celular y el impulso nervioso
101
Fig. 19.16. Generación de circuitos de corriente locales dando lugar a la propagación (pasiva) de la despolarización de la membrana del axón.
Si en un punto del axón, situado a una cierta distancia del punto de excitación, el valor del potencial de membrana llega a alcanzar el valor del potencial umbral, se volverá a provocar la apertura de los canales de sodio de la membrana, disparándose de nuevo el potencial de acción en ese punto. De esta manera el impulso se propaga, regenerándose a intervalos regulares, con intensidad aproximadamente constante a lo largo del axón. Aunque los circuitos de corriente locales se producen en ambas direcciones del axón, la producción de una hiperpolarización de la membrana y el paso de la proteína de canal al estado “cerrado inactivo” hasta la recuperación del valor del potencial de reposo hacen que en las zonas donde ha pasado el impulso nervioso no se produzca la reexcitación, por lo que el impulso nervioso se propaga en una única dirección. La conducción del impulso nervioso puede estudiarse como un fenómeno de conducción “pasivo”, inductor de la activación de la apertura o cierre de canales iónicos sensibles al voltaje, que den lugar a la regeneración del potencial de acción. El potencial de membrana cambia pero atenuándose a medida que aumenta la distancia al punto de excitación, lo que se denomina “conduc ción electrotónica”. Las propiedades de la conducción pasiva del impulso nervioso, tales como la distancia a la que puede propagarse sin sufrir atenuación apreciable y el tiempo necesario para alcanzar un cierto punto y, por tanto, la velocidad de propagación, varían dependiendo del tipo de axón de que se trate (con y sin mielina) y de sus dimensiones. Por ejemplo, la velocidad de propagación del impulso nervioso para el axón gigante del calamar (sin mielina) es de unos
102
Fundamentos físicos de los procesos biológicos
20 ms–1, mientras para los nervios de mamíferos (con mielina) se han medido velocidades de hasta 120 ms–1. Estas propiedades pueden estudiarse a partir de un modelo sencillo de las características eléctricas del axón (resistencia y capacidad) y su descripción por medio de un circuito eléctrico.
19.2.4 Características eléctricas del axón: circuito equivalente La propagación del potencial de acción puede describirse utilizando un modelo clásico (“teoría del cable”) en el que se asimila al axón con un conductor iónico (el axoplasma) protegido por un aislante que lo recubre (la membrana) y rodeado por otro medio también conductor (el fluido extracelular), tal como se esquematiza en la figura 19.17 donde puede verse una sección transversal del axón y su circuito eléctrico equivalente.
Fig. 19.17. Sección transversal del axón y su circuito eléctrico equivalente. A partir de las características eléctricas asociadas al axón (Raxón, R mem y Cmem) puede calcularse el potencial de membrana V(x,t) en función del tiempo t y de la distancia x al punto de excitación.
Si en un punto del axón (x = 0) se produce un potencial de acción (VPA), esto constituye una alteración local de la carga y del potencial de membrana que puede considerarse, desde el punto de vista eléctrico, como una batería entre cuyos extremos se genera dicha diferencia de potencial (V0 = VPA). (Este valor representa el potencial electrotónico, es decir, diferencias respecto al valor del potencial de reposo). En el interior del axón se produce un flujo de iones, que constituye una corriente eléctrica Iaxón, a la que el axoplasma opone una cierta resistencia Raxón. Como resultado del flujo de iones se va alterando el valor de la carga y del potencial de la membrana del axón V(x,t), que se comporta como un condensador de capacidad Cmem. Se ha de tener en cuenta también que la membrana no es un aislante perfecto, sino que incorpora un cierto número de canales iónicos por los que escapa parte de la carga,
La membrana celular y el impulso nervioso
103
produciéndose una corriente de pérdidas Imem. En el circuito equivalente del axón esto se describe por medio de una resistencia R mem conectada en paralelo con la capacidad Cmem. Por último, la carga retorna al punto de excitación a través del líquido extracelular, cuya resistencia es muy inferior a la de la membrana o a la del axoplasma, pudiendo ignorarse (R FE ≈ 0). En el circuito equivalente se representa por medio de un conductor sin resistencia. Los valores de la capacidad y de las resistencias que intervienen en el circuito equivalente del axón están determinados por las propiedades eléctricas del axón particular que se considere, y dependen de parámetros tales como su diámetro, densidad de canales iónicos en la membrana, presencia o no de envoltura de mielina, etc. El circuito eléctrico equivalente del axón, representado en la figura 19.17, se corresponde con el circuito eléctrico de carga de un condensador con pérdidas, estudiado en la sección 6.3 del capítulo anterior, donde se obtuvo la forma en que varía el potencial en función de las resistencias y capacidad del circuito. Por tanto, dichas ecuaciones permiten calcular el potencial de membrana V(x,t) en función del tiempo t y de la distancia x al punto de excitación a partir de las características eléctricas del axón objeto de estudio. Propiedades eléctricas de los axones. (a) Axón sin mielina Para calcular las características eléctricas del axón (Raxón, R mem y Cmem) supondremos que el axón es cilíndrico, de sección uniforme a lo largo de toda su longitud y, en el caso de axones sin mielina, el espesor de la membrana (e ~ 10 ‒8 m = 10 ‒2 µm) es, en general, muy inferior al radio r del axón (fig. 19.18).
Fig. 19.18. Las características eléctricas del axón se calculan suponiendo que tiene forma cilíndrica, de sección uniforme a lo largo de toda su longitud, siendo su espesor e, en el caso de axones sin mielina, muy inferior al radio r del axón.
La resistencia del axoplasma Raxón de un segmento de axón de longitud x corresponde a la de un conductor cilíndrico y será:
104
Fundamentos físicos de los procesos biológicos
x x = Raxón ρ= ρ axón 2 axón πr S axón
(19.19)
donde ρaxón es la resistividad del axoplasma, de radio r y sección Saxón = πr2. Por lo que se refiere a la membrana del axón, que como se ha dicho es de espesor muy inferior al radio del axón, su superficie Smem equivale a la de un rectángulo (fig. 19.19) y es igual al producto del perímetro del axón (2πr) por la longitud del segmento x, es decir: Smem = 2πrx
(19.20)
Por tanto, cuando la carga escapa al fluido extracelular atravesando la membrana del axón, de espesor e, lo hace a través de una resistencia eléctrica: e e = Rmem ρ= ρ mem mem S mem 2π rx
(19.21)
donde ρmem es la resistividad de la membrana.
Fig. 19.19. La superficie de la membrana del axón equivale a la de un rectángulo y es igual al producto del perímetro del axón por la longitud del segmento (Smem = 2πrx)
Por su parte, la capacidad de la membrana correspondiente a dicho segmento de axón será:
S mem 2π r = Cmem ε= ε mem x mem e e
(19.22)
donde εmem es la permitividad dieléctrica de la membrana, igual al producto de su constante dieléctrica κmem por la permitividad dieléctrica del vacío ε0 = (4πKe)-1 = 8,85 10 –12 N–1 m–2 C2. Como puede verificarse a partir de las ecuaciones (19.19)(19.22) la resis tencia del axoplasma de un segmento de axón crece al aumentar su longitud x, mientras que la resistencia de pérdidas a través de la membrana disminuye,
La membrana celular y el impulso nervioso
105
ya que al aumentar la longitud del segmento de axón aumenta también la superficie de membrana a través de la cual escapa la carga. Este aumento de superficie hace también que la capacidad de la membrana aumente con la longitud x. Propiedades eléctricas de los axones. (b) Axón con mielina El recubrimiento de mielina que poseen los axones de los vertebrados está constituido básicamente por el arrollamiento de una serie de capas de membrana plasmática a partir de las células especializadas (fig. 19.20). El número de capas en torno al axón puede variar entre unas pocas capas hasta varios cientos, ya que el grado de mielinización del axón es en general muy variable. Al no existir apenas contribución del citoplasma de las células gliales, la envoltura de mielina equivale al aumento del espesor de la membrana del axón sin alterar sus propiedades eléctricas intrínsecas (resistividad ρmem y constante dieléctrica εmem). De acuerdo con las expresiones (19.21) y (19.22), esto equivale a un aumento de la resistencia y una disminución de la capacidad eléctrica, proporcionales al espesor de la membrana (e).
Fig. 19.20. La vaina de mielina en torno a los axones está constituida por una serie de capas de membrana plasmática, sin apenas contribución del citoplasma de las células gliales.
El apilamiento de, por ejemplo, 200 capas de membrana plasmática equivale a un aumento del espesor en dicho factor, por lo que la resistencia de la pared del axón con mielina equivaldría a 200 veces la resistencia de una membrana sin mielina y, análogamente, la capacidad equivaldría a una disminución en un factor 200 respecto a la capacidad de la membrana sin mielina. Para obtener de forma analítica los valores de la resistencia y capacidad eléctricas de un axón con mielina podemos utilizar las mismas expresiones que para un axón sin mielina, ecs. (19.19)-(19.22), utilizando ahora un valor medio para el radio de la membrana. Tanto este radio medio (r m) como el espesor de la vaina de mielina (e) pueden expresarse fácilmente en términos del diámetro externo del axón (D) y del diámetro del axoplasma (d) (fig. 19.21.a).
106
Fundamentos físicos de los procesos biológicos
e = D/2 – d/2
(19.23)
r m = d/2 + e/2 = (D + d)/4
(19.24)
obteniéndose: e ρ mem 2( D − d ) = Rmem ρ= mem 2π rm x 2π x D + d
(19.25)
2π rm = Cmem ε= x mem e
(19.26)
( 2πε m x )
D+d 2( D − d )
4x 4x = Raxón ρ= ρ axón axón 2 2 2 πd π D (d D)
(19.27)
Fig. 19.21. La resistencia y capacidad eléctricas de la membrana de un axón con mielina pueden calcularse: (a) de forma aproximada, a partir del valor medio del radio r m de la vaina de mielina en torno al axon o, de forma más precisa, (b) integrando los valores correspondientes a un segmento cilíndrico de radio r y espesor dr.
Estas expresiones, aunque aproximadas, son correctas mientras el espesor de la capa de mielina no sea muy grande (e/D ≤ 0,2), lo que ocurre en la mayor parte de los axones. Para axones fuertemente mielinizados es necesario acudir al cálculo integral para obtener la expresión correcta de la resistencia y capacidad de la membrana. Se demuestra que estos valores son:
107
La membrana celular y el impulso nervioso
ρ Rmem = mem ln (1 y ) 2π x Cmem = ( 2πε mem x )
1 ln (1 y )
(19.28)
(19.29)
donde se han expresado los resultados en función del cociente entre el diámetro del axoplasma y el diámetro externo del axón (y = d/D < 1). Este cociente d/D, o alternativamente e/D = (1 – y)/2, puede utilizarse para caracterizar axones con diferente grado de mielinización. Axones con escasa mielinización corresponden a valores d/D → 1 y e/D → 0, mientras que axones con un gran espesor de mielina y un axoplasma de dimensiones mucho más pequeñas corresponderían a los límites d/D → 0 y e/D → 0,5 (fig. 19.22). Es fácil comprobar que las expresiones correspondientes a la resistencia y capacidad de la membrana del axón con mielina se transforman en las correspondientes a axones sin mielina, si tenemos en cuenta que en estos últimos el espesor de la membrana es muy pequeño. Tomando el límite e → 0, o lo que es lo mismo y → 1, se obtiene: ln (1/y) ≈ e/r, que sustituido en la ecuaciones (19.28) y (19.29) recupera las (19.21) y (19.22).
Fig. 19.22. Representación esquemática de axones con distinto grado de mielinización.
Optimización del espesor de mielina El espesor de la vaina de mielina no es el mismo para todos los axones, sino que depende del diámetro del axón, encontrándose experimentalmente que para la mayoría de los axones existe una relación y = d/D ≈ 0,7 entre el diámetro del axoplasma y el diámetro externo del axón (e/D = (1 – y)/2 ≈ 0,15).
108
Fundamentos físicos de los procesos biológicos
Esta relación puede justificarse, considerando las propiedades eléctricas del axón mielinizado y su variación en función del espesor de la vaina de mielina. Para ello vamos a comparar la variación de la resistencia de la membrana y del axoplasma de un axón, para un axón de diámetro externo fijo D, y diferentes valores del diámetro d del axoplasma o, lo que es lo mismo, diferentes valores del espesor de la vaina de mielina e = (D – d)/2. A partir de las ecuaciones (19.27) y (19.28) la relación entre la resistencia de la membrana R mem y la resistencia del axoplasma Raxón resulta ser: Rmem 1 ρ mem = Raxón 8 ρ axón
D x
2
( y ln (1 y ) ) = A ( y ln (1 y ) ) 2
2
(19.30)
En la figura 19.23 se representa este cociente, normalizado. Se observa que se anula para los valores extremos y = 0 e y = 1, alcanzando un valor máximo para valores intermedios: y = d/D ≈ 0,6, lo que corresponde a un espesor de mielina e = (1 – y) D/2 ≈ 0,2 D, es decir, igual al 20 % del radio externo del axón. La existencia de este máximo, verificable de forma analítica, es com prensible también de forma intuitiva. La resistencia de la membrana tiende a cero cuando el espesor de mielina es pequeño (d/D → 1) y crece al aumentar dicho espesor. Sin embargo, al considerar un axón de diámetro externo fijo D, el incremento del espesor de la vaina de mielina supone, evidentemente, una reducción en la sección del axoplasma, lo que conlleva un aumento de su resistencia. Este efecto resulta dominante cuando el diámetro del axoplasma se hace muy pequeño (d/D → 0), por lo que el cociente R mem/Raxón tiende también a cero, en este caso porque Raxón → ∞. En otras palabras, cuando y → 0 no hay aislamiento y la señal eléctrica no puede ser confinada; cuando y → 1 el aislamiento es perfecto, pero Raxón se hace tan grande que el impulso nervioso no puede propagarse. Resulta por tanto intuitivo que exista una solución de compromiso para la relación d/D que optimiza el aislamiento del axón (resistencia de su pared) sin aumentar en exceso la resistencia a la conducción (resistencia del axoplasma). El valor calculado coincide aproximadamente con el encontrado experimentalmente en la naturaleza (d/D ≈ 0,7).
La membrana celular y el impulso nervioso
109
Fig. 19.23. El cociente entre la resistencia de la membrana y la resistencia del axoplasma, en un axón con mielina, se maximiza cuando la relación de diámetros y = d/D satisface la condición d/dy [y2 ln (1/y)] = 0, cuya solución corresponde a y ≈ 0,61 (e/D ≈ 0,2). Este valor es próximo al observado experimentalmente (yexp ≈ 0,7).
Observación. Propiedades eléctricas específicas. En textos de Fisiología, es corriente la utilización de magnitudes eléctricas específicas, donde las propie dades del axón se refieren a la unidad de área o de longitud. Obviamente se pueden expresar adecuadamente por medio de la resistividad y constante dieléctrica, que son las propiedades características de cada material, junto con los parámetros que describen la geometría del conductor o condensador, tales como las longitudes o superficies, y que deben ser calculadas para cada caso. En el caso de la capacidad asociada a la membrana, hemos visto que ésta es proporcional a su superficie, por lo que suele utilizarse el concepto de capacidad específica cmem como capacidad por unidad de superficie. En el caso de un seg mento de axón de longitud x, a partir de la expresión (19.22) se obtiene: = cmem
Cmem ε mem = S mem e
(19.31)
donde εmem es la permitividad dieléctrica de la membrana, igual al producto de su constante dieléctrica κmem por la permitividad dieléctrica del vacío ε0 = (4πKe)–1 = 8,85×10–12 N–1 m–2 C2.
110
Fundamentos físicos de los procesos biológicos
La capacidad específica de la membrana celular es una magnitud amplia mente utilizada, ya que tiene un valor muy similar para casi todas las células (Ce = 1 µF/ cm2 = 10–2 F/m2). Sin embargo, en el caso de las fibras nerviosas con mielina su espesor es muy superior y presentan capacidades específicas muy inferiores (Ce ≈ 0,005 µF/ cm2). En el caso de la resistencia debida al axoplasma, su valor es proporcional a la longitud del segmento de axón considerado, por lo que en este caso puede definirse una resistencia específica por unidad de longitud raxón: = raxón
Raxón ρ axón = x π r2
(19.32)
Teniendo en cuenta que la resistividad del axoplasma resulta tener un valor bastante constante, independientemente del tipo de axón, ρaxón ≈ 2 Ωm, la resistencia por unidad de longitud resulta ser inversamente proporcional a la sección del axoplasma, es decir, al cuadrado de su radio. En el caso de la resistencia de la membrana del axón, la situación es diferente. Su resistencia (ec. 19.21) es: e e = Rmem ρ= ρ mem mem S mem 2π rx
(19.33)
siendo ρmem la resistividad de la membrana, e su espesor y Smem = 2πrx la superficie correspondiente a un segmento de axón de radio r y longitud x. En este caso la resistencia no es proporcional ni a la longitud del segmento de axón ni a la superficie de membrana, sino inversamente proporcional a ellas. Por tanto, en rigor, no puede definirse una resistencia específica como resistencia por unidad de superficie o de longitud. Si puede, sin embargo, definirse una conductancia específica de la membrana: g= mem
Gmem 1 Rmem 1 = = S mem S mem ρ mem e
(19.34)
A su inversa se le suele denominar “resistencia específica por unidad de área” rmem, aunque, como ya hemos dicho, esta denominación no sea estricta mente rigurosa. = rmem
1 = ρ mem e g mem
(19.35)
Nótese que las dimensiones de esta “resistencia específica” son resis tencia multiplicada por superficie y no resistencia dividida por superficie.
111
La membrana celular y el impulso nervioso
La unidad en el SI sería Ωm2, aunque suele expresarse en kΩ cm2 (1 kΩ cm2 = 0,1 Ωm2). La resistencia de la membrana, expresada en términos de su “resistencia específica” (rmem), será: R= mem
rmem e = ρ mem S mem S mem
(19.36)
La resistividad de la membrana del axón es muy variable dependiendo del tipo de axón y diferente también de otras membranas celulares. Esto se debe a que la resistividad de la membrana está fuertemente afectada por el número de canales iónicos por unidad de área que incorpora, y este número depende del tipo de célula. En particular, las células implicadas en la genera ción de señales eléctricas rápidas e intensas tienen una menor resistencia, asociada con su número elevado de canales iónicos. La densidad de canales puede variar en un rango muy amplio, entre 0,515.000 canales/µm2 y, en consecuencia, las resistividades pueden variar desde valores relativamente bajos (ρm ≈ 106 Ωm) para los nodos de Ranvier, hasta valores ρm ≈ 3×109 Ωm para fibras musculares esqueléticas lentas. En la tabla 19.4 se ha tomado como valor “característico” un valor intermedio ρm ≈ 107 Ωm, que corre sponde al valor de la resistividad de la membrana del axón gigante del cal amar. En cualquier caso, los valores reseñados corresponden a situación de reposo de la membrana. Durante la generación del potencial de acción la resistividad de la membrana disminuye drásticamente debido a la apertura de los canales iónicos. Tabla 19.4. Parámetros eléctricos “característicos” de los axones Axón con Magnitud Axón sin mielina mielina Radio, r (µm)
1-250
1-10
Espesor membrana, e (µm)
10 –2
0,3-3
Resistividad axoplasma, ρax (Ωm)
~2
~2
Resistividad membrana, ρmem (Ωm)
~ 107
~ 107
Capacidad específica, cmem ( Fm–2)
10 –2
~ 5 10 –5
Permitividad dieléctrica, εmem (N–1m–2C2)
10 –10
10 –10
19.2.5 Conducción electrotónica: parámetro espacial Una vez descritas las características eléctricas de los axones podemos ahora abordar el estudio de la propagación del impulso nervioso, que, tal como se indicaba en la sección 19.2.3, puede realizarse considerándolo un fenómeno
112
Fundamentos físicos de los procesos biológicos
de conducción “pasivo”. En principio ignoraremos respuestas “activas” de la membrana, tales como la apertura o cierre de canales iónicos sensibles al voltaje, y atenderemos a la variación del potencial de membrana inducida por una excitación inicial. Para su descripción utilizaremos el “potencial electrotónico” o variación del potencial de membrana respecto a su valor de reposo, conociéndose esta propagación como “conducción electrotónica”. La excitación inicial, que puede ser producida de forma natural o mediante la estimulación artificial, provoca el cambio del potencial de membrana en función del tiempo y de la distancia al punto de excitación. Esto puede ser detectado mediante la inserción de electrodos a diferentes distancias (fig. 19.24.a) y su descripción puede hacerse utilizando el circuito eléctrico equivalente del axón, expresando sus características eléctricas en función de la longitud del segmento de axón (fig. 19.24.b), tal como vimos en la sección anterior.
Fig. 19.24. (a) Excitación del axón y detección del potencial electrotónico mediante la inserción de electrodos a una cierta distancia. (b) Circuito equivalente del axón, donde las magnitudes eléctricas son función de la distancia al punto de excitación
Las características del circuito equivalente se estudiaron en el capítulo 18, verificándose que el potencial en los extremos del condensador varía en función del tiempo V(t). Tanto su valor máximo como el tiempo característico de carga dependen de los valores de las resistencias y de la capacidad, que, como acabamos de ver en la sección anterior, varían con la longitud del segmento de axón considerado, es decir, con la distancia x al punto de excitación. Por tanto, el potencial electrotónico será función del tiempo y de la posición V(x,t). Recordando los resultados de dicho capítulo (sección 6.3), podemos expresar el valor del potencial electrotónico como:
113
La membrana celular y el impulso nervioso
R' −t τ s V ( x, t ) = V0 1− e Raxón
(
)
(19.37)
siendo: R' =
Raxón × Rmem Raxón + Rmem
(19.38)
R' τ s= R '× Cmem = τ 0 Raxón
(19.39)
τ 0 = Raxón Cmem
(19.40)
y donde tanto Raxón como R mem y Cmem, y por tanto R’, τ0 y τs, dependen de la distancia x al punto de excitación. V0 = VPA representa el valor de la excitación inicial, es decir, el valor del potencial de acción, mientras τs representa el tiempo característico de carga de la membrana que tiende a τ0 cuando las pérdidas a través de la membrana son despreciables (R mem → ∞). En la figura 19.25 se representa V(x,t)/V0 en función del tiempo, para diferentes valores de la distancia al punto de excitación, para un axón de 5 µm de radio y cuyos parámetros eléctricos (ρaxón, ρmem y Ce) corresponden a los valores típicos de un axón sin recubrimiento de mielina, recogidos en la tabla 19.4. Como puede verse en dicha figura, el potencial de membrana evoluciona, cualitativamente, de forma similar, pero los valores del potencial son muy diferentes según la distancia x considerada. En particular, se observa claramente que el valor máximo que alcanza el potencial de membrana va disminuyendo al aumentar la distancia al punto de excitación y, para los valores utilizados en la figura (axón sin mielina), su valor decrece rápidamente para distancias del orden de unas pocas décimas de milímetro. Resulta por tanto evidente que no es posible la conducción del impulso nervioso, por medios pasivos, salvo a distancias muy cortas. Para conseguir la conducción a largas distancias será necesario recurrir a la regeneración del impulso, es decir, a la producción de un nuevo potencial de acción en diferentes puntos a lo largo del axón.
114
Fundamentos físicos de los procesos biológicos
Fig. 19.25. V(x,t)/V0 para distancias del punto de excitación x = 0,1-0,5 mm, para un axón sin mielina (cuyas características eléctricas corresponden a los datos de la tabla 19.3).
Además, puede verse en la figura 19.25 que el tiempo característico de carga de la membrana τs depende de la distancia al punto de excitación. Para distancias cortas τs crece a medida que aumenta x, es decir, al alejarnos del punto de excitación no solo disminuye el potencial que puede alcanzar la membrana, sino que aumenta el tiempo necesario para ello. Esto puede explicarse fácilmente mediante el circuito equivalente del axón, ya que el tiempo característico de variación del potencial está determinado por la constante de tiempo τs = R’Cmem (ec. 19.39) que, inicialmente, crece con la distancia x. Por el contrario, cuando la distancia es grande el tiempo de respuesta tiende a un valor constante e independiente de la distancia (τs → ρmem εmem = constante). Aunque las propiedades de los axones con mielina se estudiarán con detalle más adelante, resulta ilustrativo realizar un examen comparativo, aunque sea aproximado, de las propiedades de los axones con y sin mielina. Para esta comparación, podemos considerar que el efecto del recubrimiento de mielina equivale a aumentar el espesor de la membrana celular en un factor de unas 200 veces, lo que supone un aumento de la resistencia eléctrica de la membrana y una disminución en la capacidad eléctrica en ese mismo factor, de acuerdo con las ecuaciones (19.21) y (19.22). Para un axón de estas características se obtiene una dependencia del potencial de membrana tal como se representa en la figura 19.26, calculado (a) para las mismas distancias representadas en la figura 19.25 para el axón sin mielina y (b) a distancias diez veces mayores. Como puede observarse en la figura 19.26.a, para las distancias en las que el potencial de membrana se atenuaba notablemente en axones sin mielina (x = 0,1-0,5 mm), ahora el valor del potencial máximo es prácticamente igual al
La membrana celular y el impulso nervioso
115
valor del potencial de acción. Para axones con mielina la propagación no sufre atenuación en estas distancias, lo que puede entenderse fácilmente como debido al aumento de la resistencia de la membrana que aísla mucho mejor al axoplasma del medio exterior. También se produce una disminución en el tiempo de carga de la membrana, debida a la disminución en el valor de la capacidad de la membrana. Para obtener una dependencia similar a la observada en axones sin mielina debemos considerar distancias de propagación del orden de diez veces superior a las anteriores (x = 15 mm), tal como se puede ver en la figura 19.26.b.
Fig. 19.26. V(x,t)/V0 para un axón con mielina, calculada para (a) distancias x = 0,1-0,5 mm y (b) distancias entre x = 1-5 mm
116
Fundamentos físicos de los procesos biológicos
La variación del valor máximo que alcanza el potencial de membrana a medida que nos alejamos del punto de excitación puede calcularse fácilmente, a partir de la expresión del potencial de membrana (ec. 19.37). Tomando el límite t → ∞ en dicha ecuación, se obtiene: Vmax Rmem R' = = V0 Raxón Raxón + Rmem
(19.41)
Esta dependencia se representa en la figura 19.27, para dos valores de resistencia de membrana, correspondientes a valores típicos de axones con (CM) y sin recubrimiento de mielina (SM). Podemos observar cómo el aumento del aislamiento que proporciona la mielina reduce la atenuación y permite la conducción de la señal eléctrica (impulso nervioso) a distancias mucho mayores.
Fig. 19.27. Potencial de membrana máximo Vmax = V(x, t → ∞) en función de la distancia x al punto de excitación para axones sin (SM) y con (CM) recubrimiento de mielina.
La distancia a la que se igualan la resistencia del axón y la resistencia de pérdidas (Raxón = R mem) se conoce como parámetro espacial (λ) y se toma como estimación de la distancia característica de propagación pasiva de un impulso nervioso. (Es decir, sin regeneración de la señal por la apertura de canales a lo largo del axón que den lugar a “amplificación” de la señal remanente y a un nuevo potencial de acción). De acuerdo con la ecuación (19.41), a una distancia del punto de excitación igual al parámetro espacial el potencial de membrana máximo se reduce hasta la mitad de su valor inicial (Vmax/V0 =1/2).
117
La membrana celular y el impulso nervioso
La expresión analítica del parámetro espacial puede obtenerse igualando las resistencias del axoplasma y de la membrana en x = λ. Utilizando las expresiones (19.19) y (19.21) para los axones sin mielina (SM), se obtiene: ρ axón λ π r 2 = ρ mem e 2π r λ ρ er λSM = mem ρ axón 2
(19.42)
y a partir de las ecs. (19.27) y (19.28), para los axones con mielina (CM):
es decir: ρ D2 2 λCM = mem ( y ln (1 y ) ) ρ axón 8
(19.43)
Ejemplo. Parámetro espacial. Consideremos tres axones diferentes. Dos de ellos con el axoplasma de igual diámetro d = 10 µm, pero uno de ellos con envoltura de mielina y el otro sin ella. En el primer caso tomaremos un espesor de la membrana eSM = 10–8 m = 10–2 µm = 0,01 µm, mientras en el segundo caso supondremos eCM = 3 µm, que corresponde a una relación entre los diámetros interno y externo del axón y = d/D ≈ 0,62. Como tercer caso, consideraremos el axón gigante del calamar, tam bién sin mielina y espesor de membrana eSM = 0,01 µm, pero ahora con un diámetro 100 veces superior al primer axón (d ≈ 1 mm). Utilizando los parámetros característicos especificados en la tabla 19.4 y sustituyendo en las ecuaciones (19.42) y (19.43) se obtiene: Tipo de axón
Diámetro axoplasma
Parámetro espacial (λ)
#1
Sin mielina
10 µm
0,35 mm
#2
Con mielina
10 µm
5,4 mm
#3
Sin mielina (axón gigante)
~ 1 mm
3,5 mm
118
Fundamentos físicos de los procesos biológicos
Para el axón #1 vemos que el parámetro espacial es de unas décimas de milímetro, distancia característica de propagación de forma pasiva para dicho axón sin mielina. Si comparamos esta distancia con la obtenida para el axón gigante (#3) comprobamos que un aumento en el diámetro del axón de un factor 100 supone un aumento de un factor 10 = 100 en el parámetro espacial, de acuerdo con la dependencia prevista por la ecuación (19.42): λSM ∝ r . Sin embargo, el aumento es superior cuando el axón, con axoplasma de igual diámetro, se recubre con la envuelta de mielina (#2), que resulta muy eficiente para evitar la atenuación del potencial electrotónico, sin necesidad de un gran aumento del espesor del axón. Tal como acabamos ver en el ejemplo anterior, la conducción (pasiva) de una señal nerviosa no resulta posible. En un axón sin mielina la señal se atenuaría en menos de 1 mm de distancia e incluso a pesar de la mejora en aislamiento obtenida en los axones con mielina, la atenuación se produciría en unos pocos milímetros. Es por tanto imprescindible el proceso de regeneración del impulso nervioso que tiene lugar en las células nerviosas, con la apertura y cierre de los canales Na+-K+, que dan lugar a la reestimulación del potencial de acción, que puede así propagarse largas distancias. En términos del lenguaje de telecomunicaciones, diríamos que se procede a una “amplificación” de la señal, que como ya dijimos adopta una estructura cuasi-digital (se regeneran pulsos de amplitud constante). Con este proceso de conducción activa, la señal sólo necesita que su intensidad sea lo suficientemente alta como para superar el potencial umbral, y redisparar el potencial de acción. En los axones sin mielina, esto se realiza a lo largo de todo el axón, con el consiguiente coste energético de reponer el equilibrio Na+-K+ del potencial de reposo. En el caso de los axones con mielina, el proceso de amplificación tiene lugar exclusivamente en los nodos de Ranvier, que se encuentran típicamente a una distancia de 1-2 mm , mientras el parámetro espacial en este caso es λCM ≈ 5 mm, es decir, suficiente como para que la señal llegue con amplitud superior al potencial umbral y provoque la amplificación. Observación. Optimización del espesor de mielina (revisitado). Anteriormente hemos visto que el cociente entre la resistencia de la membrana de un axón con mielina de diámetro externo D y la correspondiente al axoplasma, de diámetro d, podía expresarse (ec. 19.30) como:
119
La membrana celular y el impulso nervioso
Rmem 1 ρ mem = Raxón 8 ρ axón
D x
2
( y ln (1 y ) ) = A ( y ln (1 y ) ) 2
2
presentando un máximo para y = d/D ≈ 0,61. El razonamiento intuitivo según el cual este valor representa un valor “óptimo” que favorece la conducción del impulso nervioso puede apoyarse ahora con nuevos argumentos. En efecto, según la ec. 19.41, el valor máximo del potencial de membrana que se puede alcanzar (t → ∞) también se maximiza al maximizar Rmem/Raxón (minimizando por tanto Raxón/Rmem, en el denominador de la ec. (19.41)). También se maximiza el valor del parámetro espacial λ, como podemos comprobar a partir de la ecuación (19.43). Su dependencia con y = d/D se presenta en la figura 19.28, siendo totalmente equivalente a la observada en la figura 19.23, para el cociente Rmem/Raxón, ya que en ambos casos depende de F(y) = y2 ln (1/y), aunque la dependencia del parámetro espacial es ligera mente más achatada debido a la raíz cuadrada que implica la dependencia expresada por la ecuación 19.43. Pero, además, podemos comprobar que se minimiza el tiempo de respuesta de la membrana. En efecto, para distancias cortas al punto de excitación, correspondiente a la situación en que Raxón << Rmem y por tanto R’ ≈ Raxón, a partir de las ecuaciones (19.27) y (19.29) se obtiene: 4x 2π x 1 τ s ≈ Raxón × Cmem = ρ axón × ε mem ∝ 2 2 2 πD y ln (1 y ) y ln (1 y )
que obviamente se hace mínimo para los valores de y que maximizan y2 ln (1/y), lo que aumenta la velocidad de propagación del impulso nervioso, como se verá en la sección 2.6. Es decir, todos estos argumentos conducen a corroborar la optimización en la conducción del impulso nervioso en axones con mielina cuya envoltura satisface la relación y = d/D ≈ 0,61, que, como se ha dicho, es muy próximo al valor encontrado experimentalmente (≈ 0,7).
120
Fundamentos físicos de los procesos biológicos
Fig. 19.28. El parámetro espacial λ, en un axón con mielina, se hace máximo para el mismo valor y ≈ 0,61 del cociente entre el diámetro del axoplasma y el diámetro externo del axón que hace máxima la relación R mem/Raxón (fig. 19.23). (Calculado a partir de la ec. 19.43 con ρmem = 107 Ωm, ρaxón = 2Ωm y D = 10 μm).
Observación. Circuito equivalente del axón. Modelo “continuo”. En un axón real, la membrana deja escapar corriente y se va despolarizando de forma continua en todos sus puntos. El circuito equivalente de la figura 19.24 es, por lo tanto, una aproximación en la que se promedia sobre una cierta longitud x. Una aproximación más cercana a la realidad requeriría dividir el segmento x en elementos diferenciales, para cada uno de los cuales es válido el circuito equivalente (fig. 19.29). Cada elemento se carga a partir del elemento anterior y las pérdidas a través de la membrana se traducen en que el potencial de carga para cada elemento disminuye, por lo que el potencial máximo alcanzado disminuye con la distancia. Tomando el límite en que la longitud de cada elemento tienda a cero se puede calcular la variación del potencial como función de la distancia al punto de despolarización inicial, obteniéndose una expresión del tipo: Vmax (x) = V0 exp (–x/λ)
(19.44)
siendo λ el parámetro espacial que se ha definido y calculado en la sección anterior. Esta dependencia apenas se diferencia, en la práctica, de la depen dencia prevista por la ecuación (19.41), aunque el decaimiento del poten cial de membrana con la distancia previsto mediante el modelo continuo es ligeramente más rápido. En particular, para x = λ se obtiene: Vmax/V0 = 1/e ≈ 0,37, mientras que a partir de la ec. (19.41) se obtiene Vmax/V0 = 1/2 = 0,5.
121
La membrana celular y el impulso nervioso
Fig. 19.29. Circuito equivalente del axón como conexión de circuitos elementales de longitud infinitesimal.
19.2.6 Velocidad de conducción del impulso nervioso Como hemos visto en la sección anterior es necesario considerar la regeneración del impulso nervioso a intervalos regulares, ya que la distancia típica de propagación del potencial de membrana en forma electrotónica (sin activación de canales iónicos), que puede tomarse como igual al parámetro espacial λ, apenas alcanza unos milímetros en el caso más favorable (axones con mielina) y sólo unas décimas de milímetro en el caso de axones sin mielina, distancias obviamente insuficiente para la función del sistema nervioso. Para que dicha regeneración tenga lugar, mediante la activación de un nuevo potencial de acción a una cierta distancia L de la excitación, será necesario que el potencial de membrana alcance el valor del potencial umbral Vumbral que, generalmente, representa una fracción pequeña del potencial máximo (α = Vumbral / V0 ~ 0,1-0,2). Para que el potencial de membrana alcance dicho valor ha de transcurrir un tiempo tumbral(L) tal que: = α
Vumbral R ' = V0 Raxón
tumbral ( L) 1 − exp − τ s ( L)
(19.45)
es decir: R' tumbral ( L) = −τ s ( L ) × ln 1 − Raxón
α
(19.46)
R R τ s ( L= ) R '× Cmem R ' = axón mem Raxón + Rmem
(19.47)
donde:
122
Fundamentos físicos de los procesos biológicos
La velocidad de propagación del impulso nervioso podrá calcularse, por tanto, como cociente entre la distancia L y el tiempo que se ha tardado en alcanzar el valor del potencial umbral: v=
L tumbral ( L)
(19.48)
Ahora bien, los parámetros implicados en las ecuaciones anteriores son diferentes en el caso de axones sin (SM) o con mielina (CM), por lo que ambos tipos de axones serán discutidos separadamente, llegándose a predecir comportamientos también diferentes. (a) Axones sin mielina En el caso de axones sin mielina, hemos visto que la resistencia de la membrana es relativamente baja, atenuándose el potencial electrotónico a distancias muy cortas. Si tomamos el parámetro espacial λ como la distancia característica de propagación, la velocidad de propagación del impulso nervioso será: vSM =
λ tumbral (λ )
(19.49)
y puesto que para x = λ las resistencias del axoplasma y de la membrana son iguales (Raxón = R mem) se obtiene: R' =
Raxón × Rmem 1 1 R' 1 = = Raxón Rmem ⇔ = 2 Raxón + Rmem 2 Raxón 2
y el tiempo característico de carga de la membrana: τ s (λ = Cmem ) R '×=
S mem 1 1 1 e = ρ memε mem Rmem × Cmem = ρ mem × ε mem 2 2 S mem e 2
por lo que tumbral(λ) es: 1 tumbral (λ ) = − ρ memε mem × ln (1 − 2α ) 2
(19.50)
Con lo que sustituyendo este valor, así como el del parámetro espacial (ec. 19.42), en la expresión de la velocidad de conducción del impulso nervioso (ec. 19.49), ésta puede escribirse como:
123
La membrana celular y el impulso nervioso
vSM
ρ mem er 1 ed ρ axón 2 = = K SM (α ) × × ε mem ρ axón ρ mem ρ ε − mem mem × ln (1 − 2α ) 2
(19.51)
con K SM (α ) = −1 ln (1 − 2α ) es decir, la velocidad de propagación del impulso nervioso en axones sin mielina aumenta con la raíz cuadrada del diámetro d del axón. En la figura 19.30, se representan datos experimentales (círculos) de la velocidad de propagación en axones de diferente diámetro, junto con las predicciones teóricas (línea continua) a partir de la ecuación (19.51), para un valor del potencial umbral tal que Vumbral/V0 = α ≈ 0,12, donde puede comprobarse la dependencia de la velocidad de propagación con la raíz cuadrada del diámetro del axón. Sin embargo, también se han observado dependencias con exponentes algo diferentes vSM, experimental ≈ A da
0,5 < a < 1
lo que ha sido interpretado como indicio de que las propiedades específicas del axón cambian al aumentar su diámetro, siendo posible que los axones de menor tamaño tengan menos canales de Na+ por unidad de área que los mayores, lo que no ha sido tenido en cuenta en la ecuación (19.51). En cualquier caso, la velocidad de propagación en fibras sin mielina aumenta con el radio y es muy inferior a la velocidad en fibras con envoltura de mielina (vertebrados), como veremos más adelante.
124
Fundamentos físicos de los procesos biológicos
Díametro axon (μm) Fig. 19.30. Dependencia de la velocidad de propagación del impulso nervioso en función del diámetro de fibras nerviosas sin mielina. Los círculos representan resultados experimentales y la línea continua el ajuste a partir de la ecuación (19.51), con α ≈ 0,12. Como puede verse, la velocidad de propagación se incrementa proporcionalmente a la raíz cuadrada del diámetro del axón. (Datos experimentales de los axones sin mielina de Pumphrey R.J. y Young J.Z., J. Exp. Biol., 15, 453-466 [1938]).
Observación. Soluciones diferentes para aumentar la velocidad. La ecuación (19.51) permite analizar las soluciones “adoptadas” por diferentes organismos ante la necesidad de transmitir información con rapidez a través de las fibras nerviosas. De acuerdo con dicha ecuación el aumento del radio de las fibras propor ciona un aumento de la velocidad de transmisión del impulso nervioso, solu ción que parece haber sido adoptada en los invertebrados, siendo un ejemplo característico el axón gigante del calamar, ya mencionado repetidas veces en este capítulo. Sin embargo, esta solución no parece la óptima en términos de “empaquetamiento”. Si el ser humano hubiese “optado” por esta solución para disponer de un sistema nervioso rápido y eficiente, entonces nuestros nervios periféricos tendrían que ser tan grandes como el axón gigante del calamar, y los troncos nerviosos periféricos (cada uno tiene cientos de fibras nerviosas) serían tan grandes que la forma del cuerpo humano habría tenido que ser diferente para acomodarlos. Tampoco resultaría óptima la solución anterior desde el punto de vista energético, debido al coste de repolarizar de forma continua la membrana. Los vertebrados han adoptado otra estrategia, la envoltura de mielina, que al disminuir la capacidad de la membrana del axón, y con ello el tiempo
125
La membrana celular y el impulso nervioso
de respuesta (τ = RC), aumenta la velocidad de propagación, siendo además energéticamente favorable, ya que la repolarización del axón, que implica la intervención de las bomba de NaK, se limita a los nodos de Ranvier. (b) Axones con mielina: conducción saltatoria Como se ha indicado, en las células nerviosas de los vertebrados los axones están recubiertos por una envoltura de mielina que aumenta la resistencia de la membrana y disminuye su capacidad. Este aislamiento también afecta a la estructura de la conducción, ya que la vaina de mielina impide la regeneración del impulso nervioso, salvo en aquellas zonas donde se interrumpe, es decir, en los nodos de Ranvier. En estos existe una alta densidad de canales específicos de Na+ y se produce la regeneración del potencial de acción, mientras en la región internodal, carente de canales de Na+, la conducción del impulso nervioso se realiza de forma pasiva (electrotónica). La distancia entre nodos de Ranvier L no es la misma para todos los axones, sino que depende linealmente del diámetro del axón D, encontrándose experimentalmente que la distancia internodal resulta ser aproximadamente 100 veces el valor del diámetro (es decir, varía típicamente entre 0,2 mm a 2 mm para axones de 2 µm a 20 µm de diámetro).
Fig. 19.31. La distancia entre nodos de Ranvier L depende linealmente del diámetro del axón D, encontrándose experimentalmente que la distancia internodal es aproximadamente 100 veces el valor del diámetro externo del axón (z = L/D ≈ 100).
A partir de las expresiones (19.27)-(19.29) que describen las características eléctricas de los axones con mielina, podemos expresar el cociente entre la resistencia de la membrana y la resistencia del axoplasma para la región internodal, de longitud L, en función de la relación z = L/D, obteniéndose: ρ mem ln (1 y ) ρ Rmem 2π L = = mem Raxón 4 L ρ axón ρ axón 2 2 πD y
2 y 2 ln (1 y ) 1 z 8
verificándose, para axones con mielina, que:
(19.52)
126
Fundamentos físicos de los procesos biológicos
Rmem >> Raxón
Observación. Factor de seguridad en axones con mielina. Calculemos el cociente Rmem/Raxón para propagación entre dos nodos de Ranvier. A partir de la ecuación anterior y utilizando los datos de la tabla 19.4, junto con los valores experimentales, y = d/D ≈ 0,7 y z = L/D ≈ 100, se obtiene: Rmem ρ mem = Raxón ρ axón
2 y 2 ln (1 y ) 1 107 0,175 −2 2 = (10 ) ≈ 11 8 z 2 8
es decir, se verifica que Rmem >> Raxón. El potencial electrotónico (ec. 19.37), al recorrer la distancia correspon diente a una región internodal, puede alcanzar un valor máximo (t → ∞): Vmax V ( L, t → ∞) R ' Rmem Raxón 11 = = ≈ ≈ 0, 92 = V0 V0 Raxón 1 + Rmem Raxón 12
Es decir, la distancia internodal z = L/D ≈ 100 adoptada por la naturaleza representa una solución altamente conservadora. Dado el excelente ais lamiento proporcionado por la mielina, la atenuación del impulso nervioso en esa distancia resulta ser muy pequeña y el valor del potencial máximo que se podría alcanzar (t → ∞) después de recorrer un internodo es un factor 5 o 6 veces superior al necesario para alcanzar el potencial umbral. Esto proporciona un elevado “ factor de seguridad” garantizando que la conduc ción del impulso nervioso pueda realizarse incluso si algún nodo resulta blo queado. Más grave resulta que la vaina de mielina sufra alguna alteración disminuyendo sus propiedades aislantes, lo que puede acarrear graves con secuencias a la propagación de impulsos nerviosos, como sucede con algunas enfermedades desmielinizantes. Considerando, por tanto, que con buena aproximación podemos tomar el límite R mem >> Raxón, obtenemos: R' =
Raxón × Rmem ≈ Raxón ⇔ Raxón + Rmem
R' ≈1 Raxón
con lo que el tiempo necesario para alcanzar el valor del potencial umbral, ec. (19.46), debido a la propagación a través de un internodo, es: tumbral ( L) = −τ s ( L ) × ln (1 − α )
y el tiempo característico de carga de la membrana:
(19.53)
La membrana celular y el impulso nervioso 4L 2π L 8z 2 τ s ( L= ) R '× Cmem ≈ Raxón × Cmem = ρaxón 2 2 × ε mem = ( ρ axónε mem ) × 2 ln (1 y ) πD y ln 1 y y ( )
127 (19.54)
La velocidad de propagación del impulso nervioso en los axones con mielina, calculada como el cociente entre la distancia entre los nodos de Ranvier y el tiempo necesario para alcanzar el potencial umbral, puede expresarse finalmente como: (19.55) con K CM (α ) = −1 ln (1 − α ) Podemos ver, por tanto, el papel de la envoltura de mielina y, de nuevo, la ventaja de un espesor óptimo de la vaina de mielina e/D ≈ 0,2 (una relación de diámetros y = d/D ≈ 0,61) que maximiza el producto y2 ln (1/y). Al hacerlo, se minimiza el tiempo de carga de la membrana (ec. 19.54) y con ello se maximiza la velocidad de propagación (ec. 19.55). No es este argumento suficiente, sin embargo, para predecir la existencia de una relación internodal constante z = L/D ≈ 100 en los axones con mielina. En efecto, de acuerdo con la expresión (19.55), reducir la distancia internodal (que es lo mismo que reducir z) aumentaría de forma monótona la velocidad de propagación del impulso nervioso. Pero esto se realizaría a costa de acortar el espacio de conducción pasiva, incrementando el consumo energético que supone la regeneración del potencial de acción, por lo que se ha de llegar a un compromiso entre velocidad de propagación y energía consumida. Por lo que se refiere a la dependencia con el diámetro del axón, se predice una dependencia lineal, a diferencia del caso de axones sin mielina, donde la velocidad variaba proporcionalmente a su raíz cuadrada (ec. 19.51). La figura 19.32 muestra los resultados experimentales (círculos) de la variación de la velocidad de propagación del impulso nervioso en función del diámetro del axón, correspondiente a fibras nerviosas con mielina de mamíferos. Como puede verse, la dependencia es lineal con el diámetro, en acuerdo con la ec. (19.55), obteniéndose un buen ajuste experimental (línea continua) utilizando un valor del potencial umbral α = V(L, t umbral)/V0 ≈ 0,17, lo que supone un “factor de seguridad” Vmax /Vumbral entre 5 y 6, tal como se ha comentado anteriormente. Las velocidades para las fibras nerviosas mielinadas son claramente superiores a las correspondientes a fibras carentes de mielina. Por lo que se refiere al aumento de velocidad con el diámetro
128
Fundamentos físicos de los procesos biológicos
(pendiente de la gráfica 19.32), éste corresponde a un incremento de unos 6 ms –1 por cada µm de incremento en el diámetro del axón.
Diámetro axón (μm) Fig. 19.32. Dependencia de la velocidad de propagación del impulso nervioso en función del diámetro de fibras nerviosas con mielina de mamíferos. Los círculos representan resultados experimentales y la línea continua el ajuste a partir de la ecuación (19.55), con α ≈ 0,17. Como puede verse, la velocidad de propagación se incrementa proporcionalmente al diámetro del axón. (Datos experimentales de los axones con mielina, a partir de Patton et al., de Gasser, H.S. Ohio J. Sci., 41, 145-159 (1941)).
Ejemplo. Longitud del pulso nervioso. Calculemos la longitud del pulso nervioso (Λ), definida como la longitud de axón perturbada durante el tiempo de duración del potencial de acción, que puede calcularse, por tanto, como el producto de su duración (τ) por la velocidad de propagación: Λ = τ Vpropagación. Considerando una duración promedio del potencial de acción del orden de τ ≈ 0,5 ms = 5 × 10–4 s y utilizando las velocidades del axón gigante del calamar (vcalamar = 20 ms–1) y de los nervios de mamífero (vmamífero ≈ 100 ms1), correspondientes a axones sin mielina y con mielina, respectivamente, se obtiene una extensión (longitud) de pulso de: Λcalamar ≈ 20 × 5 10 4 = 10–2 m = 10 mm Λmamífero ≈ 100 × 5 10 4 = 5 × 10–2 m = 50 mm Podemos visualizar el impulso como una despolarización de la membrana del axón, abarcando una extensión de varios centímetros, distancia muy superior al parámetro espacial.
La membrana celular y el impulso nervioso
129
En el caso de axones con mielina el proceso de conducción se suele deno minar “conducción saltatoria”, lo que no debe llevar a confusiones. Aunque la amplificación se produce “a saltos” (solo en los nodos de Ranvier), el potencial de acción tiene una extensión de varios centímetros, por lo que alguna decena de nodos de Ranvier participa simultáneamente en alguna de las distintas fases de producción del potencial de acción. Observación. Enfermedades debidas a la desmielinización. Según hemos podido comprobar en las secciones precedentes, la vaina de mielina de los vertebrados proporciona un aislamiento al axón que le permite la conducción rápida y eficiente de los impulsos nerviosos. Aunque la distancia entre nodos de Ranvier es suficientemente pequeña como para obviar algunos posibles problemas, siendo el “ factor de seguridad” alto, el correcto funcionamiento del sistema nervioso depende del buen estado de la capa aislante de mie lina. Si se produce su deterioro la propagación del impulso nervioso corre el riesgo de verse interrumpida, ya que el valor del potencial electrotónico se puede atenuar por debajo del valor umbral de excitación. Existen diversas enfermedades que producen un deterioro específico de la mielina, entre las que podemos citar la esclerosis múltiple. La esclerosis múltiple es una enfermedad del sistema nervioso central en la que la mielina se pierde en múltiples áreas, dejando en ocasiones cicatrices (esclerosis). La pérdida de mielina provoca diversos síntomas (que incluyen la falta de coordinación, problemas de equilibrio, alteraciones visuales y pérdida de memoria) dependiendo de las áreas del sistema nervioso central afectadas. Aunque la causa exacta de la esclerosis múltiple sigue siendo objeto de debate se asocia a una enfermedad de tipo “autoinmune” en que el sistema inmunológico del individuo ataca, de forma anormal, a células de su propio organismo. En muchos casos se considera que este ataque está en realidad propiciado por la reacción contra algún agente patógeno invasor (virus y bacterias). Afortunadamente la lesión de la mielina es en muchas ocasiones rever sible y, gracias a la acción regeneradora de los oligodendrocitos, se recupera el aislamiento del axón y sus propiedades aislantes. Observación. La sinapsis. Gracias a la regeneración periódica que se pro duce en el axón, el impulso nervioso se transmite con intensidad constante, sin verse afectado por su gran longitud. De esta forma llega al final de las múltiples ramificaciones del axón, realizándose la conexión con otra neurona (sinapsis). Aunque hay sinapsis eléctricas (electrotónica) la información se transmite comúnmente mediante sinapsis químicas, a través de la hendidura sináptica
130
Fundamentos físicos de los procesos biológicos
(fig. 19.33). A través de ella y por medio de la intermediación de sustancias neu rotransmisoras (como la acetilcolina o la serotonina), que son liberadas a la lle gada del impulso nervioso, se activan nuevas señales que estimulan la neurona receptora. Esta conexión entre neuronas es unidireccional (excepto en algunos animales inferiores como las medusas o los corales) y cada neurona, en parti cular en el sistema nervioso central, puede recibir señales procedentes de miles de neuronas diferentes. La excitación provocada por los neurotransmisores puede despolarizar la membrana y ser por tanto estimulante de un nuevo impulso, pero también puede ser desencadenante de señales hiperpolarizantes y por tanto inhi bidoras. En cualquier caso, se produce un proceso de integración, reali zado por el cuerpo celular de la neurona receptora, que suma las diferentes señales, proporcionando una “visión de conjunto” de la información global recibida. Esta información llega finalmente a la región en que arranca el axón, que posee un bajo valor del potencial umbral y actúa como zona de disparo. Si la suma de señales despolarizantes menos las hiperpolarizantes supera el potencial umbral se desencadena el correspondiente potencial de acción.
Fig. 19.33. La comunicación entre neuronas se realiza, comúnmente, por la intermediación de sustancias neurotransmisoras que dan lugar a la despolarización de la neurona receptora.
19.3 Apéndice 1: modelo de Hodgkin-Huxley del potencial de acción Volvamos de nuevo a considerar la estructura temporal del potencial de acción, que describimos de forma cualitativa en la sección 2.2. ¿Es posible su reconstrucción cuantitativa a partir de las propiedades eléctricas de la membrana del axón? La respuesta es afirmativa, pero para ello es necesario ser
131
La membrana celular y el impulso nervioso
capaz de describir los flujos iónicos, fundamentalmente de Na+ y K+, en función del tiempo, lo que a su vez depende de la apertura y cierre de canales específicos activados y regulados por el propio potencial de membrana. Este modelo es debido a Hodgkin y Huxley, y está basado en una serie de trabajos realizados en la primera mitad del siglo pasado, cuya formulación ha constituido el modelo estándar de descripción de los procesos iónicos en las células nerviosas y otras células excitables. El modelo utilizado por Hodgkin y Huxley para explicar la secuencia temporal del potencial de acción supone que los flujos de Na+ y K+ están regulados por canales diferentes, cada uno de los cuales incorpora cuatro “compuertas”, sensibles al potencial de membrana, que deben abrirse simultáneamente para permitir el paso de los iones. En el caso del K+ se supone la existencia de cuatro compuertas similares, cuya probabilidad de encontrarse abiertas se designa por n. La conductancia específica de la membrana a los iones K+ se expresaría como: g= GK ⋅ n 4 K
0
(19.56)
siendo GK el valor máximo de la conductancia asociada al potasio. En el caso de los iones Na+ la descripción es más compleja, pues supone la existencia de diferentes compuertas: tres compuertas de activación “rápidas” y una cuarta de desactivación “lenta”, cuyas probabilidades de apertura respectivas se designan por m y h, por lo que la conductividad del Na+ se expresa como: g= GNa ⋅ m3 ⋅ h Na
0 < m, h < 1
(19.57)
siendo GNa el valor máximo de la conductancia asociada al sodio. La dependencia temporal de las conductancias del sodio y potasio se supone controlada por la apertura de las “compuertas” (n para el potasio, m y h para el sodio), lo que se realiza a un ritmo: dx = α x (V ) × (1 − x ) − β x (V ) × x dt
x = n, m, h
(19.58)
donde los coeficientes αx(V) y βx(V) (x = n, m, h) incluyen la dependencia con el potencial de membrana V, ya que los canales de Na+ y K+ se activan, abriéndose o cerrándose, por medio de cambios en dicho potencial, pero son independientes del tiempo. A partir de los resultados experimentales de la forma del potencial de acción es posible obtener la expresión de los parámetros αx(V) y βx(V) (x = n,
132
Fundamentos físicos de los procesos biológicos
m, h) en función del potencial de membrana, y realizar una descripción dinámica adecuada del mismo. Como ejemplo, en la figura 19.34 se representa el resultado de integrar las ecuaciones (19.58), indicando la fracción de canales activados n, m y h. Recuérdese que h representa la probabilidad de que el canal esté en el estado no-inactivador, es decir, abierto. Su reducción indica por tanto la inactivación del flujo de iones Na+, que sólo se recupera lentamente a medida que la membrana se repolariza con la entrada de iones K+.
Fig. 19.34. El flujo de iones K+ y Na+ está regulado por la apertura de diferentes canales. En el caso del K+ se supone la existencia de un único tipo de canal, cuya fracción abierta se designa por n, mientras en el caso de los iones Na+ se supone la existencia de dos tipos diferentes de canal: uno de apertura, “rápido”, y otro de activación y desactivación, “lento”, cuyas fracciones abiertas respectivas se designan por m y h. La Figura representa su evolución temporal de acuerdo con las ecuaciones (19.58).
A partir de los valores de n, m y h es inmediato obtener, a partir de las ecuaciones (19.56) y (19.57), los valores instantáneos de las conductividades de la membrana para los iones Na+ y K+ y, a partir de ello, la evolución del potencial de membrana, tal como se representa en la figura 19.35.
La membrana celular y el impulso nervioso
133
Fig. 19.35. Evolución del potencial de membrana V(t) a partir de los datos de la figura 19.34 y las conductividades de los iones Na+ y K+.
Sin embargo, debe mencionarse que este modelo, aunque proporciona una adecuada descripción cinética, no garantiza que las hipótesis del mismo (por ejemplo, la existencia de una serie de cuatro puertas activadas en serie) tengan una correspondencia absolutamente precisa en la realidad. La naturaleza exacta de los canales iónicos y su secuencia de activación permanece aún sin ser conocida en detalle, constituyendo este tema un área de investigación activa en la actualidad. Como resultado de estos estudios parece confirmarse que los diferentes canales (proteínas de membrana) tienen únicamente dos estados: completamente abiertos o cerrados. Los resultados del modelo de Hodgkin-Huxley, incluyendo una apertura suave y gradual de los canales, deben entenderse por tanto como una descripción basada en el comportamiento de un gran número de ellos, que permite establecer valores promedio. Se admite también que, en general, el estado “cerrado” admite dos variantes: cerrado pero susceptible de apertura (“reposo”) o “inactivado”, que requiere una etapa previa de activación para pasar al estado de “reposo-cerrado”, en que ya es susceptible de apertura ante el estímulo adecuado. En cuanto a la estructura de los canales, se ha podido determinar la de algunos de ellos. Por ejemplo, se ha identificado que los canales de Na+ están formados por dos subunidades (α y β). La mayor de ellas (α), de aproximadamente 260 a 300 kilodalton, parece ser la principal responsable funcional del canal, y su secuencia de aminoácidos ha sido determinada. Cuatro dominios hidrófobos atraviesan la membrana, habilitando un canal central, cuya permeabilidad depende de cambios conformacionales activados por variaciones
134
Fundamentos físicos de los procesos biológicos
en el valor del potencial de membrana. Las características detalladas tanto de los cambios conformacionales que experimentan los canales como de los mecanismos de activación y selectividad de los mismos continúa siendo objeto de estudio en la actualidad.
19.4 Apéndice 2: bases físicas de la electrocardiografía Actividad eléctrica de las células cardíacas El electrocardiograma (ECG) es un registro de la actividad eléctrica del corazón que procede, a su vez, de la actividad eléctrica de las células cardíacas. Dicha actividad es similar a la de las células nerviosas y otras células musculares, ya que tanto unas como otras son células excitables en las que se produce un cambio del potencial de membrana que se propaga en forma de un potencial de acción. En el caso de las células musculares este potencial de acción está asociado con su contracción. Como hemos visto con anterioridad, los potenciales de acción son típicamente del orden de la décima de voltio (0,1 V = 100 mV), valores que corresponden también a las células musculares. Para su detección se puede acceder a la propia célula muscular, mediante electrodos adecuados, y el registro de esas diferencias de potencial constituye un electromiograma (EMG). Sin embargo, las diferencias de potencial de las células excitables y, en particular, los potenciales variables asociados con la actividad de las células musculares cardíacas, se propagan a través de los tejidos orgánicos, pudiendo ser detectados a través de la piel (externamente), aunque se reducen entonces a valores del orden del milivoltio. Su registro externo mediante electrodos adosados a la piel, el electrocardiograma (ECG), constituye por tanto un método no invasivo de examen de la actividad cardíaca, por lo que es utilizado con gran frecuencia en el diagnóstico y estudio de diferentes patologías cardíacas. El músculo cardíaco es estriado, como el músculo esquelético, pero se diferencia de este último en varios aspectos. A diferencia del músculo esquelético, la contracción del músculo cardíaco es involuntaria y la duración del potencial de acción característico es mucho mayor que la de las células nerviosas o las células musculares esqueléticas (del orden de 300 ms frente a unos pocos milisegundos), dando lugar a una contracción muscular prolongada. Además, la actividad eléctrica se propaga a través de todo el músculo cardíaco, dando lugar a una secuencia de activación compleja y característica, que determina las propiedades eléctricas (y mecánicas) globales del corazón.
La membrana celular y el impulso nervioso
135
En la figura 19.36 se representa el potencial de acción típico de una célula muscular del ventrículo cardíaco. En estado de reposo el potencial es de unos –90 mV, es decir, similar al de las células nerviosas, músculos esqueléticos y, en general, al de todas las células corporales. Cuando se activa un potencial de acción, se produce una rápida despolarización de la membrana, que se denomina fase 0, alcanzándose un valor positivo del orden de unos +20 mV. Se inicia a continuación una fase de repolarización (fase 1) que, a diferencia de lo que sucede en las células nerviosas, no se completa de forma inmediata, sino que se alarga dando lugar a una meseta (fase 2), para concluirse al cabo de un cierto tiempo (fase 3), permaneciendo constante (fase 4) hasta una nuevo potencial de acción. Mientras la despolarización inicial (fase 0) se produce rápidamente, en tiempos comparables a los tiempos característicos de otras células excitables, la meseta (fase 2) tiene una duración de unos 0,2 segundos, dando lugar a potenciales de acción unas 100 veces más largos que los correspondientes a las células musculares esqueléticas o nerviosas. Asociada a la activación eléctrica del músculo cardíaco se produce su contracción mecánica, aunque ésta tiene lugar con un cierto retraso temporal.
Fig. 19.36. Potencial de acción de una célula cardíaca ventricular, típico de la llamada “respuesta rápida”.
Desde el punto de vista de los procesos iónicos en la membrana de las células cardíacas, la despolarización rápida, asociada con la fase 0, se atribuye a la apertura de canales rápidos de Na+ (compuertas m), similares a los de otras células excitables. Sin embargo, la meseta característica (fase 2) se asocia
136
Fundamentos físicos de los procesos biológicos
con el flujo de iones Na+ y Ca2+, a través de canales lentos, completamente diferentes de los canales rápidos operativos durante la fase 0. (Los canales rápidos son bloqueados por la tetrodotoxina, mientras los lentos pueden ser bloqueados por otras sustancias que se sabe que impiden el movimiento del Ca2+ dentro de la célula). Marcapasos El comportamiento descrito anteriormente corresponde a la llamada “respuesta rápida”, que se produce en las fibras miocárdicas normales, tanto de las aurículas como de los ventrículos, así como en las fibras de Purkinje (fibras especializadas de conducción que se localizan en los ventrículos). Además de este comportamiento existe otro tipo de respuesta eléctrica, que se denomina “respuesta lenta” y que es característico del nodo sinoauricular (SA) y del nodo auriculoventricular (AV). El primero constituye el marcapasos natural del corazón y el segundo constituye el punto de transición entre aurículas y ventrículos, además de constituir un segundo marcapasos, que puede suplir al nodo sinoauricular en determinadas circunstancias. En los seres humanos, el nodo sinoauricular (SA) es una estructura con forma semilunar, de unos 15 mm de largo, 5 mm de ancho y 2 mm de espesor, localizada en la cara posterior del corazón, próxima a la región en que la vena cava superior se une a la aurícula derecha. El potencial de acción de las células del nodo SA, denominado “de respuesta lenta”, se presenta en la figura 19.40.
Fig. 19.37. Potencial de acción típico del nodo sinoauricular o marcapasos natural del corazón, denominado “de respuesta lenta”.
La membrana celular y el impulso nervioso
137
Como puede observarse, en dicho potencial de acción no se presenta la fase inicial de excitación rápida (fase 0), lo que se atribuye a la ausencia de canales de Na+ rápidos. (De hecho, la tetrodotoxina, que bloquea los canales de Na+ rápidos, no influye sobre el potencial de acción del nodo SA). Sin embargo, la característica distintiva de una fibra marcapaso reside en su automaticidad (capacidad para iniciar su propio latido; el corazón continuará latiendo aunque sea extraído del cuerpo) y ritmicidad (regularidad de esa actividad de marcapaso) características del tejido cardíaco. Esto es debido a la ausencia de una etapa de reposo (fase 4). En las células no automáticas el potencial permanece constante durante esta fase, mientras que en la fibra marcapaso se produce una despolarización lenta (fig. 19.37) hasta que se alcanza el umbral, generándose un nuevo potencial de acción, de forma espontánea. El ritmo natural de activación del nodo sinoauricular es de unos 100 latidos/minuto, aunque este ritmo está regulado por ambas divisiones del sistema nervioso autónomo, siendo acelerado por el sistema nervioso simpático y retrasado por el sistema parasimpático. El predominio de este último hace que el corazón normal en reposo se active al ritmo de unos 60-80 latidos/minuto (fig. 19.38).
Fig. 19.38. La acción combinada del sistema nervioso simpático y parasimpático determina el ritmo de activación del corazón normal en reposo, unos 60-80 latidos/minuto, aunque el ritmo intrínseco de activación del nodo sinoauricular es de unos 100 latidos/minuto.
Desde el punto de vista de la propagación del potencial de acción, la progresión de la excitación del músculo cardíaco es mucho más rápida que su repolarización, debido a la larga duración del potencial de acción. La activación eléctrica del corazón puede visualizarse, por tanto, como el avance de un frente de despolarización, que deja tras de sí una amplia región despolarizada
138
Fundamentos físicos de los procesos biológicos
(fig. 19.39). Sólo pasado un intervalo de tiempo largo (∼ 300 ms), se produce la repolarización del músculo cardíaco, que puede describirse también como un frente de onda diferenciado.
Fig. 19.39. Despolarización de una fibra muscular cardíaca, avanzando como un frente de despolarización dejando atrás una amplia región despolarizada.
Sistema de conducción eléctrica del corazón Desde el punto de vista macroscópico, la propagación de la actividad eléctrica del corazón a través de sus diferentes elementos se representa esquemáticamente en la figura 19.40. En la parte superior izquierda se representa el corazón, con sus elementos más característicos, y en la parte superior derecha, la forma del impulso eléctrico en cada una de las regiones del corazón. El impulso cardíaco se genera en el nodo SA (marcapasos natural) y su forma corresponde a la “respuesta lenta” representada en la curva (a). Desde el nodo SA, el impulso se propaga, radialmente, a lo largo de las aurículas, a una velocidad aproximada de 1 m/s. En el músculo cardíaco de las aurículas el impulso eléctrico tiene la forma de un potencial de acción de “tipo rápido”, como se indica en la curva (b) de la figura. La transmisión del impulso eléctrico hacia los ventrículos se realiza seguidamente a través del nodo auriculoventricular (AV), de unos 22 mm de largo y 10 mm de ancho, localizado en el lado derecho de la separación interauricular, tal como se indica en la figura. El nodo AV consta de varias regiones diferenciadas por el tipo de potencial de acción que allí se desarrolla. En algunos puntos el potencial de acción es de “tipo lento”, mientras en otros
La membrana celular y el impulso nervioso
139
es intermedio, dando lugar a una respuesta eléctrica de tipo mixto (curva c). La disminución en la velocidad de conducción que se produce en el nodo AV (0,05 m/s) provoca una cierta demora en la transmisión del impulso desde las aurículas a los ventrículos y, por tanto, entre los comienzos de las sístoles auriculares y ventriculares (y entre el comienzo de la zona P y el complejo QRS en el electrocardiograma, como veremos posteriormente). Este retraso permite un adecuado acompasamiento entre aurículas y ventrículos, facilitando el llenado de estos de forma completa con anterioridad a su sístole.
Fig. 19.40. Representación esquemática de la anatomía del corazón (parte superior izquierda) y forma del impulso eléctrico en sus diferentes regiones (parte superior derecha). En la parte inferior se representa un electrocardiograma escalar típico y su relación con la actividad eléctrica cardíaca. La actividad se inicia en el marcapasos natural (nodo SA) apareciendo en primer lugar la denominada onda P, asociada a la onda de despolarización de las aurículas. La etapa de baja actividad que le sigue está asociada con el paso lento de la excitación a través del nodo auriculoventricular (AV), seguida por el complejo QRS, asociado con la intensa activación de los ventrículos. La onda T posterior, corresponde a la repolarización ventricular. (Redibujado de Malvivuo J. y Plonsey R., “Bioelectromagnetism: principles and applications of bioelectric and biomagnetic fields”, http://butler.cc.tut.fi/~malmivuo/bem/bembook/).
A partir del nodo AV, la señal eléctrica se propaga, en los ventrículos, a través de un sistema especializado, cuya parte superior se denomina haz de His, que se escinde en dos ramas: derecha e izquierda. La rama izquierda se
140
Fundamentos físicos de los procesos biológicos
divide a su vez en una subrama anterior y otra posterior y, finalmente, todas ellas se subdividen en una compleja red de fibras de conducción, llamadas fibras de Purkinje, que se ramifican sobre las superficies subendocárdicas de ambos ventrículos. Los potenciales de acción que se producen en este sistema de transmisión son potenciales “rápidos” (curvas d, e, y f). La velocidad de conducción del potencial de acción en las fibras de Purkinje se estima entre 1 m/s a 4 m/s, la mayor entre los diferente tejidos cardíacos, lo que permite una rápida activación de la zona endocárdica de los ventrículos. La despolarización de los ventrículos, propagándose desde el endocardio hacia el epicardio (a una velocidad de unos 0,4 m/s), se produce también en forma de potenciales “rápidos” (curvas g, h). Los procesos eléctricos que se producen durante la excitación del corazón dan lugar a variaciones en el potencial eléctrico externo, como veremos más adelante, cuyo registro constituye el electrocardiograma. En la parte inferior de la figura 19.40 se representa un electrocardiograma escalar típico y su conexión con la conducción de las señales eléctricas que acabamos de describir. La despolarización auricular da lugar a la onda P, mientras la despolarización ventricular da lugar al complejo QRS. El intervalo PR es una medida del tiempo entre ambas despolarizaciones y está relacionado con el tránsito de la señal eléctrica a través del nodo AV. La onda T, que aparece con posterioridad, está relacionada con la repolarización ventricular, mientras la repolarización auricular queda enmascarada bajo el complejo QRS. La diferencia de la velocidad de conducción del impulso nervioso entre unas u otras regiones del corazón está relacionada con las características del potencial de acción, concretamente con la velocidad de cambio del potencial de membrana dVm/dt durante la fase 0. En efecto, dicha velocidad indica el ritmo de apertura de los canales iónicos y a su vez, la magnitud de las corrientes locales en la región de transición entre las porciones de fibra muscular despolarizada y polarizada (fig. 19.39). Si la porción activa de la fibra se despolariza gradualmente, las corrientes serán pequeñas y la región en reposo adyacente a la zona activa se despolarizará muy lentamente, requiriendo más tiempo para alcanzar el umbral que si la despolarización es rápida y las corrientes locales intensas. Al haber diferencias en la velocidad de respuesta de las distintas células del corazón (respuestas “rápidas” y “lentas”), la excitación eléctrica viaja con velocidades características diferentes según se trate de las aurículas, las fibras de Purkinje o los ventrículos. Bases de la electrocardiografía: dipolo cardíaco Los sucesos de activación cardíaca discutidos anteriormente pueden ser detectados mediante la inserción de microelectrodos en las diferentes células cardíacas, pero el electrocardiograma propiamente dicho constituye un registro
La membrana celular y el impulso nervioso
141
de las diferencias de potencial generadas por la actividad cardíaca en la superficie del cuerpo humano. Aunque en cualquier instante del proceso de activación existe un patrón complejo de cargas eléctricas a través de las múltiples células de los distintos tejidos cardíacos, dicha actividad puede ser descrita con bastante aproximación suponiendo que puede considerarse producida por un dipolo eléctrico equivalente, conocido como vector cardíaco resultante. La magnitud y orientación de dicho dipolo eléctrico cambian con el tiempo, por lo que el potencial eléctrico generado por el dipolo (véase el capítulo 17) cambia también con el tiempo y de su registro (ECG), en varios lugares de la superficie corporal, puede extraerse información sobre el dipolo cardíaco y, a partir de él, sobre la actividad eléctrica del corazón. Si se registra la variación del vector cardíaco resultante se obtiene el denominado vectorcardiograma, mientras que si se obtienen los valores de las diferencias de potencial (escalar) entre algunos puntos característicos, se obtiene un electrocardiograma escalar. Por supuesto, el potencial detectado depende del punto de medida por lo que, en la práctica, se utilizan las conexiones estándar, que derivan de las adoptadas por W. Einthoven (18601927). Siguiendo dichas convenciones, se considera que el vector cardíaco resultante se localiza en el centro de un triángulo equilátero (denominado triángulo de Einthoven) orientado en el plano frontal y formado por los brazos izquierdo y derecho y la pierna izquierda, tal como se representan en la figura 19.41.
Fig. 19.41. Triángulo de Einthoven.
142
Fundamentos físicos de los procesos biológicos
Según las convenciones anteriores, se definen las diferencias de potencial conocidas como derivaciones bipolares estándar (VI ,VII ,VIII ) como: = VI V ( BI ) − V ( BD)
(19.59.a)
= VII V ( PI ) − V ( BD)
(19.59.b)
= VIII V ( PI ) − V ( BI )
(19.59.c)
donde V(BD), V(BI) y V(PI) representan los valores del potencial eléctrico, generados por el vector dipolar cardíaco, en el brazo derecho, brazo izquierdo y pierna izquierda respectivamente. Estas diferencias de potencial se pueden relacionar fácilmente con la magnitud y orientación del dipolo cardíaco. En efecto, el potencial eléctrico creado por un dipolo, en un punto P cualquiera, se puede expresar (sección 17.3.3) como: p ⋅ ur V ( P) = K e 2 r siendo p = q d el momento dipolar y ur un vector unitario dirigido desde el
dipolo hacia el punto P, situado a una distancia r.
Fig. 19.42. Vectores unitarios uri dirigidos desde el centro del triángulo de Einthoven en la dirección de los puntos BI (brazo izquierdo), BD (brazo derecho) y PI (pierna izquierda).
Considerando el dipolo cardíaco situado en el centro del triángulo de Einthoven, los vectores unitarios en la dirección de los puntos BI, BD y PI (fig. 19.42) son: u BI = + cos 30º j + sen30º k = + 3 2 j + (1 2 ) k
(19.60.a)
u BD = − cos 30º j + sen30º k = − 3 2 j + (1 2 ) k
(19.60.b)
(
(
)
)
143
La membrana celular y el impulso nervioso
u PI = u PI − k =
−k
(19.60.c)
Y los potenciales estándar se pueden expresar como: = VI V ( BI ) − V = ( BD) A p ( u BI − u BD )
(19.61.a)
= VII V ( PI ) − V = ( BD) A p ( u PI − u BD )
(19.61.b)
VIII = V ( PI ) − V ( BI ) = A p ( u PI − u BI )
(19.61.c)
donde A = K e r 2 es constante, ya que las distancias entre el dipolo y los puntos BI, BD y PI son las mismas. Por su parte, las diferencias entre los vectores unitarios que aparecen en las expresiones anteriores son: 3j
(19.62.a)
( uPI − uBD ) = (
3 2 j − (3 2) k
(19.62.b)
(−
3 2 j − (3 2) k
(19.62.c)
( uBI − uBD ) =
( uPI − uBI ) =
)
)
estando dirigidos en las direcciones paralelas a los lados del triángulo de Einthoven, tal como se muestra en la figura 19.43, y siendo sus módulos: u BI − u BD =− u PI u BD = u PI − u BI = 3
(19.63)
por lo que pueden expresarse en función de los vectores unitarios en dichas direcciones (fig. 19.43): = CI = C II = C III
( uPI − uBD )
( uPI − uBI )
( uBI − uBD )
3 = (1 2 ) j − 3=
(
( −1 2 ) j − (
3=j
(19.64.a)
3 2= k 0, 5 j − 0, 866 k
(19.64.b)
)
3 2 k = −0, 5 j − 0, 866 k (19.64.c)
)
144
Fundamentos físicos de los procesos biológicos
( ( ) () ( ) ( ) ()
)
VI =unitarios VI A= 3VAI = p3CA p yA() p y3dirigidos Fig. 19.43. Los vectores , =C3IIIA=yp 3CAIIII(=3están ) ( p y ) en la dirección de los lados IIp del triángulo de Einthoven.
Por tanto, los potenciales estándar Vi (i = I, II, III) se pueden expresar finalmente como: VI = A 3 p CI = A 3
(
VII = A 3 p CII VIII
( ) = ( A 3) pC
III
) ( )( p ) = ( A 3 ) ( +0, 5 p − 0, 866 p ) = ( A 3 ) ( −0, 5 p − 0, 866 p ) y
y
y
z
z
(19.65.a) (19.65.b) (19.65.c)
es decir, son proporcionales al producto escalar del vector dipolar cardíaco y los vectores unitarios Ci y, por tanto, proporcionales a las componentes del vector cardíaco paralelas a los lados del triángulo de Einthoven (fig. 19.44). Los potenciales estándar son positivos cuando la componente del vector cardíaco coincide con la dirección de Ci y negativos si la dirección es la opuesta. Así, en la figura 19.44.a todos ellos son positivos, mientras en la figura 19.44.b, con el vector cardíaco orientado de forma diferente, el potencial VI es negativo, manteniéndose VII y VIII positivos.
145
La membrana celular y el impulso nervioso
Fig. 19.44. Los potenciales estándar Vi (i = I, II, III) representan magnitudes proporcionales a las componentes del vector cardíaco paralelas a los lados del triángulo de Einthoven, siendo positivos o negativos dependiendo de si coinciden o no con el sentido deVlos A 3 p CIi. =EnAla 3 I = vectores orientación (a) todos ellos son positivos, mientras en (b) el potencial VI es negativo.
(
)
(
Electrocardiograma Como se ha indicado anteriormente, la actividad eléctrica del corazón depende de la propagación del potencial de acción a través de los distintos elementos del corazón, cuyas características quedan reflejadas en el ECG. Es habitual la detección y registro de las tres derivaciones estándar en función del tiempo, aunque es inmediato verificar que sólo dos valores resultan independientes, quedando el tercero de ellos unívocamente determinado, ya que: VI + VIII = VII
(19.66)
En la parte inferior de la figura 19.40 se representó la dependencia temporal típica de uno de estos potenciales y su relación con el desarrollo de la activación eléctrica del corazón. La actividad se inicia en el marcapasos (nodo SA), apareciendo en primer lugar la denominada onda P, que corresponde básicamente a la onda de despolarización asociada a las aurículas. Finalizada ésta, se produce una etapa de baja actividad, asociada con el paso lento de la excitación a través del septum de separación entre aurículas y ventrículos. Seguidamente, el complejo QRS se asocia con la intensa activación de los ventrículos (y enmascara a su vez la onda de repolarización de las aurículas). Por último, la onda T corresponde a la repolarización ventricular. La información contenida en el ECG permite al especialista inferir una amplia serie de características del funcionamiento del corazón que cubren aspectos variados como la orientación del corazón, el tamaño de sus diferentes regiones, posibles desórdenes en la secuencia de activación, etc.
)( p ) y
146
Fundamentos físicos de los procesos biológicos
Fig. 19.45. La curva (a) representa el ECG de un corazón normal sano, mientras las curvas (b)-(c) representan el ECG característico de diferentes anomalías. La curva (b) representa un ECG característico de una taquicardia (intervalo PP más corto). La curva (c) corresponde a un bloqueo AV de primer grado, apareciendo un retardo entre la onda P y el complejo QRS. La curva (d) corresponde a un bloqueo AV de segundo grado, en el que la señal eléctrica procedente de las aurículas no siempre estimula los ventrículos, por lo que no siempre aparece el complejo QRS. La curva (e) muestra un ECG característico de la fibrilación ventricular, en la que las contracciones bruscas y descoordinadas del corazón resultan inoperantes para bombear la sangre. (Redibujado de Malvivuo J. y Plonsey R., “Bioelectromagnetism: principles and applications of bioelectric and biomagnetic fields”, http://butler.cc.tut.fi/~malmivuo/bem/bembook/).
Como ejemplo, en la figura 19.45 se representan distintos electrocardiogramas, característicos de algunas anomalías comunes. La curva (a) representa un ECG normal, activado desde el marcapasos natural (nodo SA) y observándose la onda P, seguida del complejo QRS y la onda T, con frecuencia
147
La membrana celular y el impulso nervioso
e intervalos característicos de un corazón normal sano. La curva (b) representa un ECG parecido, con la secuencia P-QRS-T de igual forma que en el ECG normal, pero en el que el ritmo de producción de dicha secuencia (intervalo PP) se ha incrementado (> 100/min), lo que constituye una taquicardia. Esta aceleración puede ser producida por causas normales (como el ejercicio físico), o bien ser indicativa de alguna anomalía. Las curvas (c) y (d) representan ejemplos de anomalías en la transmisión del impulso eléctrico a través del tejido auriculoventricular, lo que se conoce como bloqueo. La curva (c) corresponde a un bloqueo AV de primer grado, apareciendo un retardo entre la onda P y el complejo QRS, es decir, un intervalo PR superior al del ECG normal. Cuando este intervalo es superior a 0,2 s se considera habitualmente como anormal. La curva (d) corresponde a un bloqueo AV de segundo grado, en el que la señal eléctrica procedente de las aurículas no siempre estimula los ventrículos, por lo que no todas las ondas P son seguidas por el complejo QRS. Por último, la curva (e) muestra un ECG característico de una taquicardia paroxística ventricular, en que la despolarización ventricular es activada caóticamente a partir de focos ectópicos (otros puntos diferentes del marcapasos natural). Suele estar relacionada directamente con la fibrilación ventricular, en la que las contracciones bruscas y descoordinadas del corazón resultan inoperantes para bombear la sangre, provocando la muerte del individuo. Además de las anteriores, otras muchas patologías cardíacas dejan también su impronta en el ECG, pudiendo ser identificadas por el especialista. La evolución de la actividad cardíaca puede describirse también mediante una representación vectorial donde se puede seguir el cambio en la dirección y magnitud del vector cardíaco. En particular, conocidos los potenciales estándar, pueden calcularse de forma inmediata las componentes del vector cardíaco (en el plano frontal), que son: p y = VI
( A 3)
V + VIII pz = − II 1, 732
( A 3)
(19.67.a) (19.67.b)
148
Fundamentos físicos de los procesos biológicos
En la figura 19.46 se representa esquemáticamente la forma característica de los tres potenciales estándar y la reconstrucción, a partir de ellos, de la trayectoria seguida por el vector cardíaco. En la figura 19.46.a se representa el desarrollo de la despolarización auricular, que da lugar a la onda P. El vector dipolar cardíaco cambia su magnitud y orientación, de forma que su extremo describe un pequeño bucle como el indicado en la figura por medio de la línea de puntos.
Fig. 19.46. Representación de la trayectoria seguida por el vector cardíaco (vectorcardiograma) (a) durante la despolarización auricular (b) durante la despolarización ventricular y (c) una vez finalizada la repolarización ventricular. En la parte derecha se representa también la evolución de los potenciales estándar (VI,VII y VIII). (Redibujado de Malvivuo J. y Plonsey R., “Bioelectromagnetism: principles and applications of bioelectric and biomagnetic fields”, http://butler.cc.tut.fi/~malmivuo/bem/bembook/).
149
La membrana celular y el impulso nervioso
La despolarización ventricular, que origina el complejo QRS, se representa en la figura 19.46.b. Las variaciones en la magnitud del vector dipolar cardíaco son ahora mayores, describiendo su extremo un bucle amplio. Nótese que el vector se orienta inicialmente hacia el lado izquierdo de la figura (lado derecho del corazón) siendo negativos los potenciales VI y VII mientras que VIII es positivo. Como puede verse también en la figura 19.46.b, el potencial VIII cambia su signo (cambia la dirección de la componente del vector cardíaco) aproximadamente cuando el módulo del vector cardíaco es máximo, coincidiendo con valores próximos al máximo de VI y VII. Por último, el vector cardíaco describe un tercer bucle (fig. 19.46.c) asociado con la repolarización ventricular (onda T). La descripción realizada más arriba sólo ha tenido en cuenta medidas de potencial en el plano frontal, mientras que, en general, el dipolo cardíaco puede tener también componentes en otras direcciones. Para obtener información sobre dichas componentes es necesario medir el potencial eléctrico no sólo en el plano frontal, sino también fuera de él, las llamadas derivaciones precordiales. Para ello se utilizan electrodos adicionales sobre el pecho del sujeto paciente, situados habitualmente entre el cuarto y quinto espacio intercostal y distribuidos entre el esternón y el costado izquierdo. Digamos finalmente que, en realidad, la descripción de la actividad eléctrica del corazón por medio de un modelo dipolar es tan solo aproximada (aunque satisfactoria en muchos casos). Una explicación completa requiere considerar otras contribuciones al potencial eléctrico, por lo que, en las exploraciones clínicas detalladas, suelen registrarse no sólo los potenciales de las tres derivaciones estándar, sino un número mucho mayor de derivaciones (doce, típicamente) que arrojan una información más completa de la actividad eléctrica del corazón y sus posibles anomalías.
19.5 Ejercicios propuestos Ejercicio 19.1 Hallar el potencial de Nernst a 37 ºC para el axón gigante del calamar. Las concentraciones iónicas (mM) son: Ion
ne
ni
Na
460
50
K
10
400
10
10 –4
540
60
+
+
Ca
2+
Cl–
150
Fundamentos físicos de los procesos biológicos
Sol.: Ion
Vi (mV)
Na
+ 58
K
–80
+
+
Ca
2+
Cl
–
+ 154 –90
Ejercicio 19.2 Se extraen células del axón gigante y se sumergen en plasma sanguíneo humano. El potencial de reposo del K+, medido a 20 ºC, resulta ser ahora: Vi = –116 mV. ¿Cuál es la concentración de K+ en el plasma? Sol.: 4 mM Ejercicio 19.3 Si el potencial de reposo experimental del axón gigante, en sus condiciones naturales indicadas en el problema 1, es Vi = –75 mV y se puede suponer que es debido solamente al flujo de iones Na+ y K+. (a) ¿Cuál es la relación de permeabilidades pNa+ / pK+? (b) Si la permeabilidad del Na+ se triplica, ¿cuál es el nuevo potencial de reposo? Sol.: (a) pNa+/ pK+ = 0,03 (b) Vi ≈ –55 mV Ejercicio 19.4 (a) Calcúlese la resistencia, para conducción a lo largo del axoplasma, de un segmento de axón, de 1 mm de longitud, siendo el radio r ≈ 5 µm y resistividad del axoplasma: ρaxón ≈ 2 Ωm (b). ¿Cuál ha de ser la longitud, L, de un hilo de cobre (ρcobre = 1,7 × 10 8 Ωm), del mismo radio, para iguales la resistencia del axón? Sol.: (a) Raxón = 2,5 × 107 Ω (b) L = 120 km Ejercicio 19.5 Calcúlese la resistencia, a través de la membrana, de un axón de las mismas dimensiones que en el ejercicio anterior, es decir, de 1 mm de lon gitud y radio r ≈ 5 µm, siendo la resistividad de la membrana: ρmem ≈ 107 Ωm, (a) para un axón sin mielina de espesor e(SM) ≈ 10 nm y (b) para un axón con mielina de espesor e’(CM) ≈ 200 e(SM). Sol.: (a) Rmem (SM) = 3,2 × 106 Ω < Raxón (b) Rmem (CM) = 6,4 × 108 Ω > Raxón Ejercicio 19.6 Un axón sin mielina tiene una membrana de 5 nm de espesor, cuya constante dieléctrica es κ = 8. Calcúlese la capacidad específica de la membrana. Sol.: cmem = 0,014 F/ m2 Ejercicio 19.7 Un axón sin mielina, cuya membrana tiene las características del problema anterior, tiene un radio de 4 µm. La resistencia específica del axoplasma es raxón = 5 × 109 Ω m −1 y la conductancia específica de la membrana
151
La membrana celular y el impulso nervioso
es g mem = 10 Ω −1 m −2 . Calcúlese: (a) la resistividad del axoplasma, (b) la resis tividad de la membrana, (c) el parámetro espacial λ. λ 8, 9 × 10−4 m Sol.: (a) ρ axón = 0, 25 Ω m (b) ρ mem = 2 × 107 Ω m (c) =
Ejercicio 19.8 Un axón con mielina tiene los mismos valores de resistividad (axoplasma y membrana) y de constante dieléctrica que el axón del problema anterior. También tiene el mismo radio del axoplasma (4 µm), pero ahora el espesor de la membrana es de 1 µm. Calcúlese: (a) la capacidad especí fica de la membrana, (b) la conductancia específica de la membrana, (c) el parámetro espacial λ, (d) ¿cuál debería ser el espesor de la membrana para optimizar el parámetro espacial? (e) ¿En qué proporción habría aumentado este? = 7,1 × 10−5 F m −2 (b) g mem = 0, 05 Ω −1 m −2 (c) = λ 4, 2 × 10−3 m Sol.: (a) cmem (d) 2 µm (e) 13 %
Ejercicio 19.9 Utilizando los datos de axones sin y con mielina de los pro blemas 4 y 5, calcúlese la velocidad de propagación del impulso nervioso en ambos casos. Sol.: vSM = 4, 8 ms −1 , vCM = 30, 6 ms −1 Ejercicio 19.10 La concentración de iones Na+ y K+ de las células cardíacas es: Ion Na+ K
+
ne
ni
145
20
4
150
(a) Calcúlese el potencial de Nernst para ambos iones. Si el potencial de membrana es debido exclusivamente al flujo de estos iones, calcúlese el cociente de permeabilidades pNa+/ pK+ (b) en estado de reposo, en que Vi = –90 mV, (c) en el máximo del desarrollo del potencial de acción, en que Vi = +20 mV. (Supóngase temperatura fisiológica de 37 ºC). Sol.: (a) Ion
Vi (mV)
Na
+53
K
–97
+
+
(b) pNa+ / pK+ ≈ 0,008 (c) pNa+ / pK+ ≈ 3
152
Fundamentos físicos de los procesos biológicos
19.6 Referencias Berne, R.M. y Levy, M.N. Fisiología. Ed. Médica Panamericana, 1986. Curtis, H.J. y Cole, K.S. “Membrane resting and action potentials from the squid giant axon”. J. Cell. Comp. Physiol., 19, 135-144 (1942) Edmonds, B. W. Channels, Ions and Excitable Membranes: a historical pers pective of the biophysics of excitability in neurons. http://apu.sfn.org/wrensite/ projects/patch_clamp/index.htm Malvivuo, J. y Plonsey, R. Bioelectromagnetism: principles and applications of bioelectric and biomagnetic fields. http://butler.cc.tut.fi/~malmivuo/bem/ bembook/ Mathews, Van Holde y Ahern. Bioquímica. AddisonWesley, 2002. Patton, H.D.; Fuchs, A.F.; Hille, B.; Scher, A.M. and Steiner, R. (eds). Textbook of physiology. W.B. Saunders company, 1989. Vázquez, J. Biofísica: Principios fundamentales. EYPASA, 1993. GoldmanHodkinKatz equations. www.bme.jhu.edu/courses/ The Fugu Genomics Project. http://fugu.hgmp.mrc.ac.uk/
Capítulo 20. Magnetismo y campos electromagnéticos 20.1 Introducción Nuestro primer conocimiento de las propiedades magnéticas proviene de los imanes naturales. La capacidad para atraer objetos de hierro o el hecho de atraer o repeler a otros imanes se manifiesta en algunos materiales presentes en la naturaleza, como la magnetita (una variedad de óxido de hierro, Fe3O4), y sus propiedades características eran ya conocidas por los chinos y los griegos hace muchos siglos. También se conoce desde antiguo el hecho de que la Tierra se comporta como un imán, provocando la orientación de objetos imantados, lo que ha permitido el uso de la brújula como instrumento de orientación. Los primeros intentos de cuantificar y describir las propiedades de los imanes se basaron en el estudio de la interacción entre imanes naturales, expresándose, de forma similar a la interacción electrostática, como resultado de un “campo magnético” existente en aquellas regiones del espacio donde se manifiestan fuerzas magnéticas. Su visualización experimental resulta relativamente sencilla observando la orientación de pequeñas agujas (limaduras) de hierro por efecto del campo, poniendo de manifiesto la dirección de las líneas de fuerza del campo magnético. Sin embargo, la comprensión del origen de los fenómenos magnéticos no comenzó realmente hasta que en 1820 Oersted (1777-1851) descubrió que una corriente eléctrica desviaba la aguja de una brújula. Posteriormente, avances desarrollados durante los siglos XIX y XX han permitido la comprensión unificada de los fenómenos eléctricos y magnéticos, como resultado de la interacción entre cargas, bien en reposo, o bien en movimiento. Estos avances se han realizado gracias a las aportaciones de diversos investigadores, entre los que destacan Faraday, Ampère, Gauss, Biot, Savart y por último Maxwell, quien consiguió sintetizar las ecuaciones fundamentales del electromagnetismo, en las cuatro ecuaciones que llevan su nombre. 153
154
Fundamentos físicos de los procesos biológicos
20.2 Fuerza magnética sobre cargas en movimiento 20.2.1 Fuerza sobre una carga en movimiento
El campo magnético, que llamaremos B , es una magnitud vectorial, como los campos eléctrico y gravitatorio, cuyas líneas de campo se ponen de manifiesto en los experimentos con limaduras de hierro a que hemos hecho referencia antes u otros similares. Si situamos una carga eléctrica q en una región donde existe un campo magnético (que inicialmente podemos suponer generado por imanes naturales), se observa experimentalmente que, cuando está en reposo, no se ejerce fuerza alguna sobre ella. Por el contrario, cuando la carga se mueve, el campo ejerce una fuerza cuyo módulo es proporcional al módulo de la velocidad. La fuerza es también proporcional a la carga y a la intensidad del campo. Por último, resulta que la fuerza tiene una dirección perpendicular al plano que forman la velocidad y el campo magnético. Todas estas propiedades pueden sintetizarse en una expresión compacta: F = qv × B
donde v × B es el producto vectorial de ambos vectores.
(20.1)
Según la definición de producto vectorial, su sentido coincide con la dirección de avance de un sacacorchos (o un tornillo) que gire llevando el vector velocidad hacia el campo magnético, por el camino más corto. Si la carga q es positiva, la fuerza magnética coincide con el producto vectorial, mientras que será de sentido contrario en el caso de tratarse de una carga negativa (fig. 20.1). De acuerdo con las propiedades del producto vectorial, el módulo de la fuerza es: F = q v B senθ
(20.2)
siendo θ el ángulo formado por la velocidad y el campo magnético. En consecuencia, la fuerza se anula si la carga se mueve en la dirección del campo magnético y es máxima cuando se mueve perpendicularmente a él: θ =0 ⇒ F =0
(20.3)
F F= q vB θ = π 2 ⇒= max
(20.4)
Magnetismo y campos electromagnéticos
155
A partir de la ecuación 20.4 podemos definir la unidad de campo mag nético, que en el SI es el tesla (T), y corresponde al campo magnético que ejerce una fuerza de un newton sobre una carga de un culombio que se mueve con una velocidad de un metro por segundo perpendicularmente al campo. 1 T = 1 NC–1 m–1 s El tesla es una unidad muy grande para las aplicaciones ordinarias. Por ello suelen usarse unidades menores, como el gauss (1 G = 10 –4 T) o submúltiplos tales como el microtesla (1 µT = 10 –6 T), que coinciden con el orden de magnitud de los campos más habituales (el campo magnético terrestre es de unos 5 × 10 –5 T = 0,5 G). Indiquemos también que entre los campos magnéticos más intensos utilizados habitualmente, en volúmenes macroscópicos, se encuentran los correspondientes a equipos de Resonancia Magnética Nuclear (RMN), que son de algunos teslas. Los campos más intensos alcanzados hoy en día llegan a valores de unas decenas de teslas. Trayectoria de una partícula cargada en un campo magnético uniforme Una disposición espacial frecuente en muchas aplicaciones corresponde al movimiento de cargas eléctricas desplazándose en dirección perpendicular a un campo magnético uniforme. Consideremos (fig. 20.2) una carga positiva +q que se mueve hacia la derecha en un campo magnético uniforme dirigido perpendicularmente al plano del papel, de arriba hacia abajo.
156
Fundamentos físicos de los procesos biológicos
Fig. 20.2. Fuerza ejercida sobre una carga eléctrica +q desplazándose en dirección perpendicular a un campo magnético uniforme, dando como resultado una trayectoria circular, en un plano perpendicular al campo.
La dirección de la fuerza es perpendicular a v y B , por lo que está contenida en el plano del papel, siendo perpendicular a la velocidad. Para determinar el sentido de la fuerza hay que tener en cuenta tanto la dirección del producto vectorial v × B como el signo de la carga. La dirección del producto vectorial v × B está dirigida hacia la parte de arriba del papel y, al tratarse de una carga positiva, el sentido de la fuerza coincide con dicha dirección. Si la carga hubiese sido negativa el sentido habría sido el opuesto. En cuanto al módulo de la fuerza, al ser la velocidad perpendicular al campo (θ = π/2), será: F = q v B sen (π 2 ) = q v B
y como el campo es uniforme, la fuerza tiene módulo constante. En consecuencia, la fuerza magnética carece de componente tangencial (at = dv/dt = 0) y la carga experimenta una aceleración perpendicular a la velocidad, de módulo constante. Esto implica que la carga se moverá siguiendo un movimiento circular uniforme, es decir, el campo magnético provoca el cambio en la dirección del movimiento pero no cambia el módulo de la velocidad. Por tanto, no cambia tampoco la energía cinética y el trabajo realizado por las fuerzas magnéticas es igual a cero. El radio de la trayectoria (R) se obtendrá igualando la aceleración debida a la fuerza magnética a = F/m a la expresión de la aceleración normal: = a
q vB v2 = aN = m R
157
Magnetismo y campos electromagnéticos
es decir, R=
mv qB
(20.5)
El periodo de revolución en la trayectoria circular será el cociente entre el espacio recorrido en una vuelta y la velocidad: = T
2π R 2π m = v qB
(20.6)
y la frecuencia (número de vueltas por unidad de tiempo): f=
qB 1 = T 2π m
(20.7)
Nótese que el periodo y la frecuencia son independientes de la velocidad que lleve la carga, es decir, de su energía cinética, lo que tiene aplicación en el funcionamiento del ciclotrón, dispositivo que permite la aceleración de partículas cargadas mientras son confinadas en un campo magnético uniforme. Si una partícula cargada se mueve en un campo magnético uniforme, pero su velocidad no es perpendicular al campo, podemos descomponer el vector velocidad en sus componentes paralela v|| y perpendicular v⊥. La componente paralela no se ve afectada por el campo, permaneciendo constante, mientras que la perpendicular dará lugar al movimiento circular que acabamos de estudiar. Por tanto, la superposición de ambos movimientos dará como resultado un movimiento helicoidal, con el eje de la hélice paralelo al campo magnético (fig. 20.3). Si el campo magnético no es uniforme, el radio de giro de las partículas cargadas tampoco permanece constante, sino que, de acuerdo con la ecuación (20.5), es mayor en las zonas de campo débil que en las de campo intenso. Un cálculo detallado demuestra que la componente paralela al campo tampoco permanece constante, sino que disminuye al moverse hacia las regiones de campo más intenso, llegando a anularse e invertir su dirección. Esto permite utilizar campos magnéticos no uniformes como “botellas magnéticas” donde confinar partículas cargadas (“plasma”), tal como se hace en experimentos sobre fusión nuclear.
158
Fundamentos físicos de los procesos biológicos
20.2.2 Fuerza sobre una corriente Cuando un alambre conductor ordinario se encuentra en un campo magnético, experimenta una fuerza como consecuencia de las que se ejercen sobre cada una de las cargas móviles en su interior. Como se describió en el capítulo 18, una corriente eléctrica consiste en un flujo de carga, transportada por los “portadores de carga” (electrones en los conductores metálicos) que se La mueven con una velocidad de arrastre promedio va a lo largo del conductor. fuerza sobre un segmento de longitud l, debida al campo magnético B , será el producto de la fuerza ejercida sobre cada carga por el número de cargas N en dicho segmento. Si el conductor es de sección S y tiene nv cargas por unidad de volumen, el número de cargas en un segmento de longitud l será N = nv S l y la fuerza resultante será: = F N= q va × B nv S l q va × B
(
)
(
)
y recordando (ec. 18.5) que la intensidad de corriente se puede expresar como: I = q nv S va , la fuerza puede expresarse finalmente como: = F I l ×B
(20.8)
donde l es un vector de módulo igual a la longitud del conductor y que se orienta en la dirección y sentido de la corriente. Es decir, la fuerza es proporcional tanto al campo magnético como a la intensidad de corriente que circula por el conductor; siendo su dirección perpendicular a la corriente (fig. 20.4).
Magnetismo y campos electromagnéticos
159
Fig. 20.4. Fuerza magnética sobre un segmento de conductor.
20.2.3 Momento sobre una espira Según acabamos de ver, la fuerza que un campo magnético ejerce sobre una corriente eléctrica depende de la orientación del conductor l respecto al campo magnético B. En un circuito cerrado, cada segmento de conductor tiene una orientación diferente, y el resultado de sumar todas las fuerzas que actúan sobre el circuito se traduce en un par de fuerzas que tiende a orientar el circuito perpendicularmente al campo magnético. Para simplificar, consideremos el circuito formado por una espira rectangular, de lados L1 y L2, situada en un campo magnético B uniforme, tal como muestra la figura 20.5.
Fig. 20.5. (a) Fuerzas magnéticas sobre una espira rectangular. (b) Vista superior de la espira, mostrando el par de fuerzas resultante.
160
Fundamentos físicos de los procesos biológicos
Analizando las fuerzas que se ejercen sobre cada uno de los lados de la espira, podemos ver que las fuerzas sobre los segmentos superior e inferior (AB y CD en la figura) son iguales en módulo (FAB = FCD = I L1 B) y están dirigidas verticalmente (fig. 20.5.a), aunque con sentidos opuestos. Por tanto, se cancelan entre sí y no hay ningún efecto (siempre que la espira no sea deformable). Por su parte, las fuerzas sobre los segmentos BC y DA también son iguales en módulo (FBC = FDA = I L2 B) y llevan sentidos opuestos, pero sus líneas de acción son diferentes, por lo que constituyen un par de fuerzas que tiende a orientar la espira perpendicularmente al campo. El valor del momento de las fuerzas es: Γ =BA × FDA
cuyo módulo es: Γ =( L1 ) × ( I L2 B ) × senθ = I LL11 LL22 Bsen senθ θ
pero S = L1 L2 es el área de la espira, y el ángulo θ es igual al ángulo entre el campo y la perpendicular a la superficie de la espira (fig. 20.5.b), por lo que el momento sobre la espira puede escribirse como: Γ =I S × B
(20.9)
donde se ha utilizado un vector superficie S de módulo igual a la superficie
de la espira, dirigido perpendicularmente a ella y orientado de forma que su sentido coincide con el sentido de avance de un tornillo que girase siguiendo la dirección de la corriente (fig. 20.5.b). S = S uN
(20.10)
El producto del vector superficie por la intensidad de corriente recibe el nombre de momento (dipolar) magnético de la espira. µ=IS
(20.11)
y el momento sobre la espira de corriente se puede expresar finalmente como: (20.12) Γ =µ × B El efecto de un campo magnético B sobre una espira de momento magné tico µ es, por tanto, un par de fuerzas que tiende a orientar la espira perpen-
dicularmente al campo, de forma que la dirección del momento magnético sea paralela al campo. Aunque deducido para una espira de forma rectangular, este resultado es válido para espiras planas de forma arbitraria, cuyo momento magnético se
Magnetismo y campos electromagnéticos
161
calcula también a partir de las ecuaciones (20.10) y (20.11). El resultado es similar a la orientación de un dipolo eléctrico en un campo eléctrico, por lo que una espira por la que circula una corriente eléctrica se denomina, en muchas ocasiones, dipolo magnético. Observación. La brújula. Las brújulas están construidas, generalmente, mediante una pequeña aguja imantada que puede girar libremente en el plano horizontal. La aguja, como cualquier imán, se comporta como un dipolo magnético que tiende a orientarse paralelamente al campo, en este caso al campo magnético terrestre. El parecido entre un imán permanente y una espira tiene su origen en las corrientes eléctricas microscópicas, debidas al movimiento de los electrones en los átomos. En algunos materiales estos pequeños dipolos magnéticos atómicos se alinean entre sí de forma espon tánea, dando lugar a un momento magnético macroscópico neto, que les con fiere sus particulares propiedades. Cuando la espira gira un ángulo dθ respecto a su eje central (fig. 20.6), las componentes del par de fuerzas que actúan sobre la espira realizan un trabajo: dW dW = = = = 22FF⋅⋅dr dr 22= Fdr = Fdrcos cosφφ 22Fdr Fdrcos cos((ππ 22−−θθ))==22Fdrsen Fdrsenθθ siendo el módulo de la fuerza: = F F= FDA = I L2 B BC
y el desplazamiento: dr = −( L1 2) dθ
donde el signo menos indica que el campo magnético tiende a orientar la espira de forma que el vector superficie sea paralelo al campo, disminuyendo el ángulo, por lo que dθ < 0. Por tanto, el trabajo realizado se puede expresar como: = dW 2= Fdrsenθ 2 × ( IL2 B ) × ( − L1dθ / 2 ) × senθ = − µ B senθ dθ
donde se ha sustituido el módulo del momento magnético de la espira: µ = IL1 L2 . Igualando este trabajo a la variación de energía potencial (dU = –dW) e integrando: U − U0 = ∫ µ Bsenθ dθ = −µ B cosθ
y tomando como origen de energía potencial la orientación perpendicular al campo (U0 = U(θ = π/2) = 0) se obtiene:
162
Fundamentos físicos de los procesos biológicos
U = − µ B cos θ = − µ ⋅ B
(20.13)
µ que representa la energía potencial de un dipolo magnético en un campo magnético B , siendo θ el ángulo entre ellos.
20.2.4 Fuerzas en campos eléctricos y magnéticos Obviamente, las cargas en movimiento son susceptibles de ser desviadas tanto por los campos magnéticos como por campos eléctricos. En una región del espacio donde existan a la vez estos dos campos, la fuerza total sobre las cargas se puede expresar como la suma de las fuerzas eléctricas y magnéticas, lo que se conoce como fuerza de Lorentz: = F q E+v×B
(
)
(20.14)
Las direcciones de los campos eléctrico y magnético, y la dirección del movimiento de la carga, se pueden elegir adecuadamente para obtener fuerzas con direcciones diversas, lo que se aprovecha para algunas aplicaciones importantes. Consideraremos un par de ejemplos a continuación:
163
Magnetismo y campos electromagnéticos
– Selector de velocidades. Medida de la razón carga/masa La razón (cociente) carga/masa es una cantidad característica de cualquier partícula elemental, por lo que puede ser usada para su identificación. Su determinación puede hacerse mediante la aplicación de campos eléctricos y magnéticos con la geometría que se muestra en la figura 20.7.
Fig. 20.7. Campos eléctricos y magnéticos, perpendiculares entre sí. La partícula cargada es acelerada por una diferencia de potencial V y los campos eléctrico y magnético se regulan para anular su desviación, observada en una pantalla fluorescente, lo que se satisface para aquellas partículas cuya velocidad sea v = E/B.
La partícula de masa m y carga q se acelera, partiendo del reposo (v0 = 0), mediante una diferencia de potencial V, adquiriendo una energía cinética: 1 2 mv = qV 2
(20.15)
Seguidamente la partícula entra en una región del espacio donde coexisten campos eléctricos y magnéticos perpendiculares entre sí, de forma que las fuerzas eléctrica y magnética son de direcciones opuestas y perpendiculares a la velocidad (fig. 20.7). Regulando la intensidad de los campos se consigue que la magnitud de las fuerzas sea igual pero de sentido opuesto, en cuyo caso: qv B = q E
Lo que se satisfará para aquellas partículas que lleven la velocidad: v=E B
(20.16)
que, por tanto, no sufren desviación alguna. Esta disposición de campos eléctricos y magnéticos cruzados que se ha descrito puede utilizarse, por tanto, como un selector de velocidades, ya que las partículas que lleven una velocidad diferente a la expresada por la ec. (20.16) serán desviadas de su trayectoria.
164
Fundamentos físicos de los procesos biológicos
Conocidos los campos E y B se calcula el valor de la velocidad y, a partir de la ec. (20.15), la relación carga/masa. q v2 = = m 2V
( E B)
2
2V
(20.17)
Observación. Rayos catódicos. La descarga eléctrica entre dos electrodos se produce a distancias más largas en un tubo con aire enrarecido que a presión atmosférica, hecho conocido desde los inicios del siglo XVIII, y que motivó el interés de diferentes investigadores. En el curso de los estudios desarrollados sobre descargas en “tubos de vacío”, se detectó la producción de un arco luminoso, de origen desconocido, y que se atribuyó a los “rayos catódicos” debido a su procedencia del cátodo (electrodo negativo). Aplicando campos eléctricos y magnéticos perpendiculares, tal como se acaba de describir en la sección anterior, J.J. Thomson midió la relación carga/masa de las partículas que forman los rayos catódicos, publicando dichos trabajos en 1897, con el resultado q m ≈ 0, 8 × 1011 C / kg . Hoy sabemos que esas partículas son electrones y el valor del cociente q/m es: e 1, 6 × 10−19 = = 1, 7 × 1011 C / kg me 9,1 × 10−31
del orden de la cifra publicada por Thomson. Aunque entonces se desconocían los valores de la carga y masa del electrón, lo que sí resultaba patente era que el valor q/m obtenido era muy superior al determinado para iones de hidró geno, lo que indicaba que, o bien la carga implicada era mucho mayor, o bien la masa era mucho menor que en el caso del hidrógeno. Estos resultados llevaron a Thomson a considerar la existencia de partículas de tamaño mucho menor al atómico y, como consecuencia, a pensar que los átomos eran divisibles y cons tituidos por partículas cargadas de menor tamaño, derivando en el conocido modelo de Thomson del átomo como aglomerado, más o menos uniforme, de dichas partículas (que sería posteriormente revisado tras los experimentos de Rutherford). – Espectrómetro de masas Un espectrómetro de masas consiste, básicamente, en un selector de velocidades, tal como el que acabamos de describir, seguido por una región donde existe un campo magnético uniforme. Las partículas cargadas entran perpendicularmente a dicho campo magnético uniforme, por lo que describirán una trayectoria semicircular (fig. 20.8).
Magnetismo y campos electromagnéticos
165
Fig. 20.8. Esquema de un espectrómetro de masas. Tras un “selector de velocidades” el radio de la trayectoria en un campo magnético uniforme permite la determinación de la relación q/m.
De acuerdo con la ecuación (20.5), el radio de la semicircunferencia descrita por la partícula depende de sus características intrínsecas: la carga y la masa, cuyo cociente se puede expresar como: q v = m RB
(20.18)
Por tanto, si la velocidad de la partícula se mide en el selector de velocidades, el radio R se mide experimentalmente a partir del punto de impacto en la pantalla y B es conocido (ajustable) por el experimentador, se puede obtener la relación q/m y, a partir de ella, proceder a la identificación de las partículas. Desde el punto de vista histórico (F.W. Aston, 1919), el espectrómetro de masas fue fundamental para la identificación de isótopos, es decir, elementos de igual número atómico y, por tanto, con igual número de protones y electrones (y propiedades químicas prácticamente iguales), aunque con diferente número de neutrones, y, por tanto, masas diferentes. Observación. Aplicaciones de la determinación de isótopos del carbono. Isótopos estables (C13/C12). Muchos elementos de interés biológico (C, H, O, N) tienen dos o más isótopos estables. En el caso del carbono, estos dos isótopos son el C12 y el C13 con una proporción relativa del 98,89 % y el 1,11 % respectivamente.
166
Fundamentos físicos de los procesos biológicos
Aunque los diferentes isótopos de un mismo elemento toman parte en las mismas reacciones químicas, debido a la diferencia de masa, reaccionan con velocidades diferentes y esto provoca una incorporación diferenciada en los seres vivos (fraccionamiento isotópico). Procesos físicos como la evapora ción o la difusión afectan también a la incorporación diferencial de los dife rentes isótopos. Un ejemplo importante lo constituye la incorporación del CO2 atmosférico por las plantas. Esta incorporación se realiza mediante dos series diferentes de reacciones fotosintéticas: el ciclo CalvinBenson (plantas C3) o el ciclo HatchSlack (plantas C4), resultando una notable diferencia en el fracciona miento isotópico del carbono dependiendo del proceso fotosintético seguido. La mayoría de las plantas son tipo C3, incluyendo el trigo, arroz, frutas y tubérculos cultivados. Las plantas C4 están constituidas predominante mente por los vegetales tropicales, tales como, por ejemplo, el maíz o la caña de azúcar. La relación isotópica C13/C12 en la planta se transmite a sus con sumidores, primero a los herbívoros y a partir de ellos a los carnívoros, lo que puede utilizarse como método para determinar la evolución de las dietas de animales y poblaciones humanas. Mediante este método ha sido posible, por ejemplo, estudiar la incorporación del maíz a la dieta de los nativos americanos. El método del carbono 14 Como se ha dicho anteriormente, los principales isótopos del carbono son C12 y C13. Existe un tercer isótopo, el C14, radiactivo, que existe en la naturaleza en una proporción del 0,00000000010 %, es decir, un átomo de C14 por cada 1012 átomos de C12 . El C14 se forma en la alta atmósfera, entre la estratosfera y la troposfera a unos 12 km sobre la superficie terrestre, debido al efecto de los neutrones de los rayos cósmicos sobre el N14 (N14 + n → C14 + p). El C14 así formado se oxida con rapidez, pasando en forma de CO2 a la atmósfera y a la cadena fotosintética y alimenticia. Las plantas y animales incorporan el C14 en una proporción determinada, correspondiente a su valor de equilibrio respecto al C12 y C13, modificada por el fraccionamiento selectivo en la incorporación a los seres vivos de dicho isótopo. Cuando la planta o el animal muere, se interrumpen las fun ciones metabólicas y cesa la incorporación de C14, cuya proporción comienza a decaer debido a su naturaleza radioactiva. Determinando la fracción de C14 remanente y conociendo su vida media de desintegración (véase el capí tulo 23), es posible establecer el tiempo transcurrido desde la muerte de la planta o el animal, lo que puede utilizarse para datar restos orgánicos. Este
167
Magnetismo y campos electromagnéticos
método fue desarrollado por W.F. Libby, recibiendo por ello el premio Nobel de Química en 1960. En la actualidad, los sistemas de espectrometría de masas, con aceleraciones de MV, permiten la detección de isótopos C14 con una sensibilidad de 1 × 10 ‒14.
20.3 Campos magnéticos creados por corrientes 20.3.1 Ley de Biot-Savart Como se ha indicado en la introducción, Oersted demostró en 1820 que el origen de los campos magnéticos son las corrientes eléctricas. La ley básica que permite el cálculo del valor del campo magnético creado por una corriente eléctrica cualquiera fue obtenida poco después por J.B. Biot y F. Savart. Dicha ley, conocida como ley de Biot-Savart, se expresa de la siguiente forma:
El campo magnético dB producido por un elemento de corriente de lon gitud dl en un punto P situado a la distancia r (fig. 20.9) viene dado por la expresión: µ0 Idl × ur dB = r2 4π
(20.19)
donde I es la intensidad de la corriente eléctrica y ur es un vector unitario en la dirección de r . La constante µ0, denominada permeabilidad magnética del vacío, tiene el valor: −1 µ= 4π × 10−7 T m A= 4π × 10−7 N A−2 0
(20.20)
está relacionado con la unidad de corriente en el SI (el amperio), que se define de forma rigurosa en la sección 4.
La ley de Biot-Savart es equivalente, para el campo magnético, a la ley de Coulomb para el campo eléctrico, ya que relaciona el campo con sus fuentes (corrientes eléctricas) y permite, en principio, calcular el campo magnético creado por cualquier disposición de corrientes. Indica, en particular, una dependencia de la intensidad del campo inversamente proporcional al cuadrado de la distancia a las corrientes origen del campo, dependencia análoga
168
Fundamentos físicos de los procesos biológicos
a la de la ley de Coulomb. Sin embargo, su aplicación es algo más compleja, incluso para distribuciones de corriente sencillas, por lo que describiremos tan solo los resultados correspondientes a las geometrías más sencillas y útiles, como son las corrientes rectilínea y circular.
20.3.2 Corriente rectilínea La figura 20.10 representa el campo magnético creado por un conductor rectilíneo, de gran longitud, por el que circula una corriente I. A partir de la ley de Biot-Savart se demuestra que el campo magnético está contenido en el plano perpendicular al conductor, siendo las líneas de campo circunferencias concéntricas con el alambre y el campo magnético tangente a la circunferencia en cada punto. La orientación del campo puede obtenerse aplicando la “regla del sacacorchos”: la dirección del campo coincide con la del sentido de giro de un sacacorchos (o un tornillo) para que avance en la dirección de la corriente. El módulo del campo magnético, a una distancia R de la corriente, es igual a: = B
µ0 I µ0 = 2π R 4π
2I R
(20.21)
Fig. 20.10. Campo magnético creado por un conductor rectilíneo.
20.3.3 Espira circular La figura 20.11 representa el campo magnético creado por una espira circular. Como puede verse, el campo magnético recuerda al campo eléctrico
169
Magnetismo y campos electromagnéticos
creado por un dipolo. Las líneas de campo son cerradas, saliendo por una de las caras de la espira y entrando por la otra, sin que se pueda separar un “polo magnético” del otro. La dirección del campo magnético puede obtenerse de nuevo por medio de la “regla del sacacorchos”: si giramos un sacacorchos siguiendo la dirección de la corriente, su sentido de avance coincide con la dirección del campo.
Fig. 20.11. Campo magnético creado por una espira circular o “dipolo magnético”.
Aunque el cálculo del campo magnético para una posición del espacio arbitraria es complicado, resulta más sencillo para puntos situados en el eje de la espira. En ellos el campo está dirigido según el eje y el valor del campo, a una distancia x de la espira, es igual a: µ B( x) = 0 4π
2 IS 2 3/ 2 ( x + R2 )
(20.22)
donde I es la intensidad que circula por la espira y R es el radio, siendo S = πR 2 su área. En el centro de la espira (x = 0) el campo resulta simplemente: Bx =
µ0 I 2R
(20.23)
mientras que a distancias grandes de la espira, comparadas con su radio (x >> R), podemos aproximar:
(R y por tanto:
2
+ x2 )
32
≈ x
3
170
Fundamentos físicos de los procesos biológicos
= Bx
µ0 IR 2 µ0 2 µ = 4π 3 3 x 2x
(20.24)
donde µ= IS= I π R 2 es el momento magnético de la espira. Como vemos, el campo magnético decrece con el cubo de la distancia a la espira, es decir, mucho más rápidamente que en el caso de corrientes lineales donde la dependencia era inversamente proporcional a la distancia (ec. 20.21). La dependencia inversamente proporcional a la tercera potencia de la distancia coincide con la del campo eléctrico creado por un dipolo eléctrico (capítulo 17).
20.3.4 Solenoide Un solenoide es un arrollamiento coaxial de espiras de igual radio por las que circula la misma intensidad, como se muestra en la figura 20.12. El campo magnético del solenoide se obtendría sumando el campo creado por todas las espiras y su valor, en un punto sobre el eje del solenoide, resulta ser: = B
µ0 IN ( cosθ 2 − cosθ1 ) 2L
(20.25)
donde L es la longitud total del solenoide, formado por el arrollamiento de N espiras por las que circula una intensidad I, siendo θ1 y θ2 los ángulos subtendidos por los extremos del solenoide desde el punto donde se evalúa el campo (fig. 20.12.b).
Fig. 20.12. (a) Solenoide y (b) parámetros que intervienen en el cálculo del campo magnético.
Para un solenoide de radio pequeño comparado con su longitud (R << L) y para puntos en su interior, lejos de los extremos, se verifica que θ1 ≈ π y θ2 ≈ 0, con lo que: cos θ2 ‒ cos θ1 ≈ 2 y por tanto
171
Magnetismo y campos electromagnéticos
(interior del solenoide) B =
µ0 IN L
(20.26)
Como se ha dicho, este valor permanece aproximadamente constante en una amplia zona del interior del solenoide, mientras que en los extremos del solenoide se verifica bien que θ1 ≈ π/2 y θ2 ≈ 0, o bien θ1 ≈ π y θ2 ≈ π/2, con lo que en ambos casos: cos θ2 ‒ cos θ1 ≈ 1, es decir, el campo se ha reducido a la mitad del valor en el interior. (extremos del solenoide) B =
µ0 IN 2L
(20.27)
La forma general del campo magnético, en función de la distancia x al centro del solenoide, puede verse en la figura 20.13, para dos solenoides de igual longitud L y diferente radio R. La línea continua corresponde a un radio pequeño (R/L = 0,01) y la línea discontinua a un radio algo mayor (R/L = 0,1). Puede verificarse la constancia del campo magnético en el interior del solenoide y cómo su valor se reduce rápidamente al salir del solenoide. En los extremos del solenoide (x/L = ±0,5) el valor del campo es exactamente la mitad del valor en el centro, tal como acabamos de calcular. Debido a este comportamiento, el solenoide es un procedimiento experimental utilizado habitualmente cuando se requiere obtener un campo magnético uniforme (B0 = µ0NI/L) en una cierta región del espacio.
Fig. 20.13. Campo magnético (normalizado) producido por dos solenoides de igual longitud L y diferente radio R: línea continua R/L = 0,01 y línea discontinua R/L = 0,1. Los límites del solenoide corresponden a los valores x/L = ±0,5.
172
Fundamentos físicos de los procesos biológicos
20.4 Fuerzas entre corrientes: definición de amperio Consideremos dos conductores rectilíneos paralelos, tal como muestra la figura 20.14. Teniendo en cuenta que un conductor rectilíneo crea un campo magnético (sección 3.2) y un campo magnético ejerce una fuerza sobre una corriente (sección 2.2), existirá una fuerza entre ambos conductores. El campo magnético creado por el conductor (1) está contenido en el plano perpendicular al conductor y será, por tanto, perpendicular al segundo conductor.
Fig. 20.14. Fuerzas magnéticas entre dos conductores rectilíneos paralelos.
Si los conductores están a una distancia R, el módulo del campo magnético creado por el conductor (1) a la distancia donde se encuentra el conductor (2), de acuerdo con la ec. (20.21), es: B1 =
µ0 I1 2π R
La fuerza que se ejerce sobre el segmento dl2, de acuerdo con la ecuación (20.13), es: = dF2 I 2 dl2 × B1
173
Magnetismo y campos electromagnéticos
y puesto que B1 y dl2 son perpendiculares, el módulo de la fuerza será: dF2 = I 2 dl2 B1
Por tanto, la fuerza por unidad de longitud que el conductor (1) ejerce sobre el conductor (2) es, en módulo: µ0 I1 I 2 dF2 = I= 2 B1 dl2 2π R
(20.28.a)
Procediendo de forma análoga, se obtendría la misma expresión para la fuerza que el conductor (2) ejerce sobre el (1). µ0 I1 I 2 dF1 = I= 1 B2 dl1 2π R
(20.28.b)
En cuanto a la dirección de las fuerzas, tal como puede verse la figura en 20.14, si las corrientes son del mismo sentido el producto dl2 × B1 va en la dirección del conductor (1) y el producto dl1 × B2 va en la dirección del conductor (2), es decir, las fuerzas resultantes son de atracción. Es inmediato verificar que si las corrientes fuesen de sentido contrario (antiparalelas) la fuerza resultante sería de repulsión. Definición: el amperio En el electromagnetismo, cuyo desarrollo comenzamos en el capítulo 17, hemos introducido dos magnitudes físicas nuevas: la carga eléctrica y la intensidad de corriente. Ambas magnitudes aparecen en las expresiones que describen la fuerza que ejercen entre sí cargas y corrientes, es decir, la ley de Coulomb para las cargas eléctricas y la expresión (20.28) para las corrientes, cuyos módulos respectivos son: F = Ke
q1q2 r2
dF µ0 2 I1 I 2 = dl 4π R
(20.29)
El valor de las unidades de carga e intensidad de corriente eléctrica puede definirse a partir de estas expresiones, estando relacionadas, por tanto, con el valor de las constantes Ke y µ0. Pero carga y corriente eléctrica no son magnitudes independientes, sino que están relacionadas entre sí (I = dq/dt), por lo que existe una única magnitud fundamental independiente que, añadida al metro, kilogramo y segundo, completa las cuatro unidades fundamentales de la mecánica y electromagnetismo del Sistema Internacional de unidades (SI). Como solo hay una nueva magnitud física fundamental, aunque en las
174
Fundamentos físicos de los procesos biológicos
ecuaciones (20.29) aparezcan dos constantes (Ke y µ0), sólo podemos elegir el valor de una de ellas y utilizarlo para definir una de las unidades (carga o corriente). La otra constante, y el valor de la unidad de la magnitud restante, quedan automáticamente determinadas. La Conferencia General de Pesas y Medidas, en su novena reunión celebrada en 1948, decidió adoptar la intensidad de corriente eléctrica como magnitud fundamental, adoptando la siguiente definición: “El amperio es la intensidad de corriente eléctrica que, si se mantiene constante en dos conductores rectilíneos paralelos de longitud infinita, de sección transversal despreciable, y colocados a una distancia de 1 metro en el vacío, produciría entre estos conductores una fuerza por unidad de longitud de 2 × 10 –7 N”. Es evidente, a partir de la segunda de las ecuaciones (20.29), que esta definición equivale a adoptar para la permeabilidad magnética del vacío el valor exacto: μ0 = 4π × 10 –7 N A–2 Una vez definido el amperio, la unidad de carga, el culombio, se define como la carga que fluye, en un segundo, por un conductor por el que circula la corriente de un amperio. La constante Ke, que aparece en la ley de Coulomb, se determina experimentalmente obteniéndose el valor: K e ≈ 8, 987551788 × 10−9 N m 2 C −2 ≈ 9 × 10−9 N m 2 C −2
Aunque esta determinación experimental se podría realizar, a partir de la ley de Coulomb, midiendo la fuerza entre dos cargas de valor conocido, su valor se obtiene a partir de la velocidad de la luz c, con la que las constantes Ke y µ0 están directamente relacionadas, como veremos más adelante, al hablar de las ondas electromagnéticas.
20.5 El magnetismo en la materia Siendo las cargas eléctricas en movimiento las fuentes del campo magnético, no debe resultarnos sorprendente la existencia de materiales que generen campos magnéticos de forma espontánea (imanes permanentes). Partiendo del modelo clásico planetario, hemos visualizado al átomo como un conjunto de electrones girando en torno a un núcleo positivo, por lo que podemos asociar al átomo un cierto momento magnético. Si consideramos una partícula, de carga q y masa m, moviéndose con velocidad v en una órbita circular de radio r (fig. 20.15), la magnitud del momento
175
Magnetismo y campos electromagnéticos
magnético será igual al producto de la corriente I generada por la carga en su movimiento por el área de la órbita (S = πr2). Por su parte, la intensidad de corriente I se puede estimar como el cociente entre la carga q y el tiempo T que tarda en completar una vuelta, de longitud 2πr, es decir: q q 1 q µ= I × S= = ×S ×= π r2 = qvr L 2 2m T 2π r v
(20.30)
donde L = r × mv representa el momento angular de la carga en su trayectoria circular.
Fig. 20.15. Una partícula de carga q y masa m moviéndose con velocidad v en una trayectoria circular tiene un momento angular L = rmv y un momento magnético μ = (q/2m)L.
En realidad el cálculo del momento magnético de un átomo es complicado y sólo puede ser descrito adecuadamente por medio de la mecánica cuántica, demostrándose que el momento angular está cuantizado, es decir, no puede tomar valores continuos, sino únicamente múltiplos enteros de un valor elemental que, de acuerdo con la hipótesis de Bohr (capítulo 23), resulta ser igual a ħ = h/2π, siendo h la constante de Planck (ħ = 1,055 × 10 ‒34 J s): L = l
l= 0, ± 1, ± 2,...
y, en consecuencia, el momento magnético también está cuantizado, pudiendo escribirse la ec. (20.30) como: = µ
q q = L l 2m 2m
l= 0, ± 1, ± 2,...
(20.31)
Para el electrón, q = e = 1,6 × 10 –19 C y m = me = 9,1 × 10 –31 kg, resultando para la unidad cuántica de momento magnético, que se denomina magnetón de Bohr:
176
Fundamentos físicos de los procesos biológicos
µB =
e 1, 6 × 10−19 × 1, 05 × 10−34 = = 9, 27 × 10−24 Am 2 2me 2 × 9,1 × 10−31
(20.32)
Sería necesario considerar, además, otras contribuciones al momento magnético debidas al momento angular intrínseco o spin, pero, sin necesidad de entrar en una descripción rigurosa que sobrepasa los objetivos de este texto, podemos considerar que el valor del momento magnético típico de un átomo es del orden del magnetón de Bohr. El hecho experimental de que la materia no presenta (salvo los imanes permanentes) un momento magnético macroscópico, se debe simplemente al hecho de que los momentos magnéticos de las órbitas electrónicas se hallan normalmente orientados aleatoriamente, cancelándose al sumarlos. Esto hace que el momento magnético atómico de la mayoría de las sustancias sea nulo. Sin embargo, si consideramos los efectos de un campo magnético externo sobre los átomos, deberíamos considerar la distorsión que se produce en el movimiento de los electrones debido a las fuerzas magnéticas. Se puede demostrar que este efecto provoca una cierta imanación macroscópica del material, que resulta ser de sentido opuesto al campo aplicado. Este fenómeno se conoce como diamagnetismo y la imanación provocada es, en general, muy débil. Como se ha indicado, la mayoría de las sustancias tienen un momento magnético atómico nulo, siendo por tanto diamagnéticas. Sin embargo, algunas sustancias presentan un momento magnético atómico no nulo, comportándose de forma diferente a las diamagnéticas. En presencia de un campo magnético externo, éste tiende a orientar los momentos magnéticos permanentes paralelamente al campo, tal como hemos visto en la sección 2.3, originándose así una magnetización macroscópica que produce un campo magnético adicional que se suma al externo. Este comportamiento se denomina paramagnetismo. Por último, existe una tercera clase de comportamiento magnético, el ferro magnetismo, característico de aquellas sustancias que exhiben una magnetización permanente. Su origen procede de la interacción entre los momentos magnéticos de sus átomos que favorece una alineación de los mismos, sin necesidad de la aplicación de un campo externo. Si un fragmento de material ferromagnético tiene N átomos y todos ellos estuvieran orientados de forma que sus momentos magnéticos se sumasen en la misma dirección, el valor del momento magnético total de dicho fragmento de material (por ejemplo, una barra de magnetita) sería: µtotal = N µ
(20.33)
177
Magnetismo y campos electromagnéticos
Obviamente se trata de una magnitud extensiva, de forma que un fragmento de tamaño doble tendría doble número de átomos, por lo que para caracterizar a un material magnético se utiliza una magnitud intensiva, independiente de la cantidad de material: la imanación M o momento magnético por unidad de volumen. = M
µtotal = nv µ V
(20.34)
donde nv = N/V representa el número de átomos por unidad de volumen. En la práctica, los materiales ferromagnéticos no alcanzan su valor de saturación, sino que existe en ellos un cierto desorden que disminuye el valor de la imanación. En general, los momentos magnéticos se orientan paralelamente entre sí en regiones microscópicas, denominadas dominios ferromagnéticos, pero los diferentes dominios suelen estar orientados en direcciones diferentes, cancelándose el valor del momento magnético en términos macroscópicos. Si los dominios están, a su vez, orientados paralelamente entre sí (lo que puede conseguirse mediante la aplicación de un campo magnético externo) el material ferromagnético constituye un imán.
20.6 Biomagnetismo 20.6.1 Campo magnético terrestre Aunque la utilización de la brújula se remonta hasta hace más de 22 siglos, los estudios sistemáticos del campo magnético terrestre no se consolidan hasta 1600, cuando William Gilbert publicó una recopilación de los conocimientos existentes sobre el tema en el libro De Magnete, es decir, Sobre los imanes. Desde entonces, se vienen trazando mapas que indican la dirección y la fuerza del campo magnético en los distintos puntos de la superficie terrestre para ser empleados en la navegación marítima, datos que en la actualidad se han visto complementados con prospecciones realizadas desde el espacio (por ejemplo, el satélite MAGSAT, lanzado al espacio en 1980, o los más recientemente lanzados Oersted (1999), CHAMP y SAC-C (2000), que han permitido la recopilación de gran cantidad de información). El campo magnético terrestre puede considerarse, de forma aproximada, como un campo magnético de tipo dipolar, es decir, sería similar al campo creado por una barra imantada o por un conductor eléctrico en forma de espira, situado en el plano del ecuador y orientado aproximadamente según el eje nortesur (fig. 20.16), aunque, en realidad, el campo magnético terrestre es más complejo: su dirección está inclinada unos δ ≈ 11 grados respecto al eje
178
Fundamentos físicos de los procesos biológicos
de rotación terrestre, y no tiene exactamente la forma del campo creado por un dipolo perfecto. Como consecuencia de la estructura aproximadamente dipolar, el campo magnético en la superficie de la Tierra tiene dos componentes: una horizontal, que hace girar la brújula, aproximadamente, hacia el polo norte geográfico (polo sur magnético) y otra componente vertical (fig. 20.16). La componente horizontal es máxima en el ecuador, siendo de unos 33 µT y cero en los polos magnéticos, mientras la componente vertical se anula en el ecuador y es máxima en los polos, con un valor de unos 67 µT. Esta intensidad del campo magnético terrestre es extremadamente débil, siendo centenares de veces más débil que el campo entre los polos de un pequeño imán permanente común.
Fig. 20.16. El campo magnético de la Tierra es aproximadamente dipolar dando lugar a variaciones de sus componentes horizontal y vertical en función de la latitud.
El modelo aceptado hoy día para el origen del campo magnético terrestre se denomina de la “dinamo automantenida”. Una dinamo es una máquina que convierte energía mecánica en energía eléctrica y, en este caso, la energía procedería de las fuerzas gravitatorias y de la rotación terrestre. La Tierra, de 6.370 kilómetros de radio, tiene en su interior un núcleo de unos 3.500 kilómetros de radio que constituye aproximadamente la sexta parte del volumen y la tercera parte de la masa de la Tierra. Excepto en su parte más interna, donde se sitúa un núcleo interno sólido, de unos 1.200 kilómetros de radio, el núcleo es fluido, con una viscosidad probablemente parecida a la del agua y siendo un excelente conductor de la electricidad (mejor que el cobre). En dicho núcleo exterior, la acción combinada de las fuerzas gravitatorias y de la rotación daría lugar a un flujo convectivo de materia que generaría corrientes eléctricas que, a su vez, darían lugar al campo magnético de la Tierra.
Magnetismo y campos electromagnéticos
179
Los registros detallados del campo magnético terrestre, realizados durante los últimos años, revelan que el campo dista mucho de ser totalmente estable. Además de un lento cambio en la orientación de su eje, ha sido detectado un descenso sistemático del valor de la intensidad del campo dipolar. Las observaciones realizadas en el último siglo indican que si el debilitamiento del campo magnético terrestre continuase al ritmo actual, el campo se anularía en tan sólo unos pocos miles de años (entre 1.500 y 3.000). Es posible obtener información de cómo han evolucionado tanto la fuerza como la dirección del campo magnético terrestre a partir de las rocas de la corteza terrestre, lo que se conoce como Paleomagnetismo. Gracias a ello, se sabe que la Tierra ha poseído un campo magnético desde hace, por lo menos, 2.700 millones de años (estimándose la existencia de la Tierra en unos 4.600 millones de años). En dicho tiempo ha fluctuado en intensidad y ha invertido su dirección en repetidas ocasiones. La existencia de rocas en las que se detecta un magnetismo remanente se conoce desde hace tiempo, pero los principales avances proceden de la década de los años 60, en los que se generalizaron las prospecciones geofísicas a los fondos oceánicos. Las exploraciones oceanográficas permitieron descubrir una serie de estructuras magnéticas en las rocas de los fondos marinos, en particular, relacionadas con la dorsal volcánica Atlántica, situada a mitad de camino entre Europa-África y América, y orientada aproximadamente en dirección norte-sur. Al estudiar las rocas de los fondos oceánicos, se obtiene la siguiente información: 1. Cerca de la dorsal oceánica las rocas son jóvenes y se hacen progresivamente más antiguas al alejarse de la cresta. 2. Las rocas jóvenes, en la cresta de la dorsal, siempre tienen la orientación correspondiente al campo magnético actual (polaridad normal). 3. Al alejarse, aparecen bandas paralelas en las que se observan alternancias de polaridad. La distribución aparece, además, simétrica a ambos lados de la dorsal. Si aparece una franja de cierta polaridad al este, su imagen especular aparece al oeste. La explicación a estos hechos, propuesta en 1962, es la siguiente: el suelo del fondo marino, en movimiento constante, se aleja de la dorsal a una velocidad de unos 2 o 3 cm/año. A medida que las placas continentales se alejan, emerge magma de las capas profundas que contiene material ferromagnético. En estado líquido, es susceptible de orientarse según el campo magnético
180
Fundamentos físicos de los procesos biológicos
existente, mientras que al solidificarse pierde su capacidad de orientación y no puede ser modificado por los cambios posteriores del campo magnético, por lo que las rocas mantienen “memoria” del campo magnético existente en el momento de su formación. Estas rocas siguen desplazándose, dejando paso a nuevos flujos de magma, y las diferentes bandas de polaridad alternada constituyen un archivo paleomagnético: el antiguo magnetismo “congelado” en las rocas y registrado a lo largo del tiempo (fig. 20.17). Su alternancia en polaridad no es otra cosa que el registro de los cambios de polaridad sufridos por el campo magnético terrestre en el transcurso del tiempo.
Fig. 20.17. El magma que emerge de las capas profundas se solidifica reteniendo la orientación magnética del campo magnético existente en dicho momento. Las rocas así formadas se desplazan, debido a la deriva de las placas continentales, dejando paso a nuevos flujos de magma que van formando diferentes bandas que constituyen un archivo paleomagnético.
El registro magnético revela la existencia de cambios en la orientación del campo magnético, que permanece estable durante periodos relativamente largos, aunque salpicados por “episodios” de corta duración, en los que se producen inversiones adicionales. Durante los últimos diez millones de años, el campo magnético terrestre ha cambiado de polaridad aproximadamente cada 500.000 años y durante los últimos 90 millones de años, la frecuencia de las inversiones ha ido aumentando progresivamente. Los estudios de lavas, cuyas edades se determinaron por métodos radiométricos, han dado por resultado una clasificación cronológica y catalogación de los cambios de polaridad ocurridos en el pasado, que permiten su utilización para la datación precisa de fenómenos coetáneos (datación geomagnética) (fig. 20.18). Aunque no se puede predecir exactamente cuándo ocurrirá la siguiente inversión, las mediciones recientes indican una reducción de más del 5 % en la intensidad del campo magnético en los últimos años. Si este
Magnetismo y campos electromagnéticos
181
ritmo de cambio se mantuviese es muy posible un cambio de polaridad en menos de 2.000 años.
Fig. 20.18. Clasificación de inversiones magnéticas ocurridas en los últimos 3 millones de años. Los periodos de polaridad “constante” (Brunhes, Matuyama, Gauss, etc) están salpicados por “eventos” de corta duración, en los que se producen inversiones adicionales.
20.6.2 Navegación magnética Hoy se conoce que muchos animales utilizan el campo magnético terrestre como medio de guía para sus desplazamientos: desde bacterias a mamíferos (delfines), pasando por gusanos, insectos (abejas) y peces (atunes, tiburones) parecen utilizar este recurso. Quizás el ejemplo más llamativo lo constituyan algunas bacterias anaerobias, que habitan en el fango, y que son magnetotácticas. Estas bacterias se desplazan hacia arriba o abajo utilizando como medio de orientación el campo magnético terrestre, habiéndose demostrado que pueden ser inducidas a confusión si se aplican campos magnéticos externos. También se ha comprobado que bacterias del hemisferio sur cambian su dirección de desplazamiento si son trasladadas al hemisferio norte, donde el campo magnético terrestre ha cambiado de dirección.
182
Fundamentos físicos de los procesos biológicos
Las bacterias magnetotácticas incorporan en su citoplasma cristales de magnetita (Fe3O4), material ferromagnético susceptible de orientarse por la acción del campo magnético. Los cristales de magnetita, de unos 50 nm de tamaño (1 nm = 10 ‒9 m), se hallan envueltos en una membrana biológica, constituyendo un auténtico “órgano” sensorial, que se denomina magneto soma (fig. 20.19). En muchos casos los organismos incorporan una alineación de magnetosomas, lo que incrementa el momento magnético total. Indiquemos por último que aunque la mayoría de animales magnetotácticos incorporan a sus organismos cristales de magnetita, existe también la posibilidad de utilizar un método de orientación indirecto, asociado con la detección de corrientes. Puesto que las corrientes eléctricas son afectadas por los campos magnéticos, la detección de corrientes es un método alternativo de detección de campos magnéticos. Este método indirecto parece ser utilizado por algunos de los peces electrosensitivos (capítulo 17), como los tiburones.
Fig. 20.19. Las bacterias magnetotácticas incorporan cristales de magnetita, en los magnetosomas, permitiéndoles orientarse en el campo magnético terrestre.
20.6.3 Efectos biológicos de los campos magnéticos Hasta hace relativamente poco tiempo, los seres humanos (y el resto de los seres vivos) solo han estado sometidos a los campos magnéticos naturales, cuyo principal exponente es el campo magnético terrestre. La aparición en nuestro entorno de múltiples dispositivos eléctricos ha traído consigo la generación de campos magnéticos artificiales cuyos efectos biológicos plantean, especialmente en los últimos tiempos, interrogantes acerca de su posible incidencia y conexión con el desarrollo de algunas enfermedades.
183
Magnetismo y campos electromagnéticos
Para evaluar los posibles efectos de los campos magnéticos de origen antropogénico debemos recordar que, tal como hemos visto en este capítulo, las fuerzas magnéticas sobre partículas cargadas son proporcionales a la intensidad de los campos, y que ésta tiene una dependencia con la distancia diferente según la geometría de la corriente que genera el campo. Dos geometrías típicas corresponden a la de un conductor rectilíneo, tal como los hilos conductores de distribución eléctrica, y a la de espiras (o solenoides) presentes en la mayoría de máquinas con motores eléctricos, como ocurre en la mayoría de electrodomésticos. Ambas geometrías han sido cuantificadas en las secciones anteriores. A partir de dichas ecuaciones podemos hacer alguna estimación de los campos producidos y de su magnitud comparada con el campo magnético terrestre, campo al que los seres vivos han estado permanentemente sometidos (aunque con fluctuaciones) y que es sensato pensar que constituye un límite de seguridad razonable. La geometría de tipo rectilíneo correspondería a los tendidos eléctricos, y su dependencia con la distancia sería la correspondiente a la ecuación (20.21) donde sustituyendo el valor de µ0, se obtendría: B fuente líneal = 2 × 10−7 ×
I R
(20.35)
donde B vendría expresado en teslas cuando I se exprese en amperios y R en metros. En realidad esta ecuación nos conduciría a sobrestimar el valor del campo, ya que supone la existencia de un conductor único, mientras en la práctica siempre existe más de uno. Normalmente, además del hilo transportador de la corriente siempre existe el correspondiente “cable de retorno” por el que circula la misma corriente pero de sentido contrario. El campo magnético creado por la corriente de retorno es de sentido opuesto al primero, por lo que el campo magnético total resulta ser notablemente inferior. Consideremos, de forma simplificada, dos conductores rectilíneos por los que circulan corrientes iguales y de sentido opuesto, separados una distancia d. El campo magnético en un punto P, situado a una distancia r1 del primer conductor y r2 = r1 + d del segundo (fig. 20.20). Los campos magnéticos gene rados por cada conductor tienen aproximadamente la misma dirección (para d << r1 ≈ r2 ≈ r) y sentidos opuestos, por lo que el campo resultante será la diferencia de ambos:
184
Fundamentos físicos de los procesos biológicos
1 µ0 I d µ I 1 1 µ I 1 B = B1 − B2 = 0 − = 0 − ≈ 2 2π r1 r2 2π r1 r1 + d 2π r
(20.36)
Como vemos, el campo magnético se ha reducido en un factor d/r, resultando además en una más rápida disminución de su valor con la distancia a los conductores, que pasa de ser una dependencia inversamente proporcional a la distancia a otra inversamente proporcional al cuadrado de la misma.
Fig. 20.20. Campo magnético creado por dos corrientes paralelas próximas (d << r i), de igual intensidad pero de sentido contrario.
Las máquinas eléctricas, y los electrodomésticos en particular, incorporan espiras y solenoides, por lo que el campo magnético decrece más rápidamente con la distancia. De acuerdo con la ecuación (20.24), el campo magnético de una espira circular depende con la distancia como: Bespiras ∝
1 x3
En la figura 20.21 se representan los campos magnéticos debidos a algunas corrientes eléctricas habituales en nuestro entorno, incluyendo los creados por líneas de distribución eléctrica de alta y media tensión. Se incluyen, como valores de referencia, el valor del campo magnético terrestre (Bterrestre ≈ 50 μT), así como el campo de fondo promedio debido al cableado doméstico, Bfondo ≈ 0,05 μT. Puede verse que, excepto a distancias muy cortas, los campos magnéticos de origen antropogénico son de valores inferiores al
Magnetismo y campos electromagnéticos
185
campo magnético terrestre, al que los seres vivos se encuentran expuestos permanentemente de forma natural. (Aunque no se ha tenido en cuenta el carácter variable de los campos, ya que tanto las corrientes como los campos generados no son continuos, sino alternos. Para una discusión más detallada, el lector interesado puede consultar el texto de M. Aguilar incluido en la bibliografía).
Fig. 20.21. Dependencia con la distancia de algunos campos magnéticos de origen antropogénico, tales como los debidos a bombillas y fluorescentes, o los debidos a líneas de distribución eléctrica de alta y media tensión. Se incluyen, como valores de referencia, el valor del campo magnético terrestre (Bterrestre ≈ 50 μT), así como el campo de fondo promedio debido al cableado doméstico, Bfondo ≈ 0,05 μT.
Observación. Campos magnéticos biogénicos. Puesto que los organismos vivos producen corrientes eléctricas no cabe duda de que también producen los campos magnéticos asociados a ellas. Sin embargo, dada la pequeñez de las corrientes orgánicas, los campos magnéticos son enormemente pequeños. Los campos magnéticos biogénicos en el hombre, asociados a las corrientes nerviosas, son del orden de femtoteslas (1 fT = 10–15 T) y los más intensos detectados, asociados a la actividad cardiaca, son de picoteslas (1 pT = 10-12 T). Estos campos han permanecido hasta hace poco por debajo de los umbrales susceptibles de ser medidos experimentalmente. Solo en los últimos años ha sido posible acceder a la detección de estos campos, gracias a la aparición de nuevas técnicas de medida, como el SQUID (= Superconducting Quantum Interference Device), basado en efectos cuán ticos en materiales superconductores.
186
Fundamentos físicos de los procesos biológicos
Con estas nuevas técnicas ha sido posible detectar el campo magnético asociado a un impulso nervioso y se ha comenzado a estudiar de forma sis temática la distribución de campos magnéticos en el cerebro y su relación con la actividad cerebral y la naturaleza de los estímulos recibidos, lo que se conoce como magnetoencefalografía.
20.7 Campos electromagnéticos dependientes del tiempo Hemos visto que las cargas eléctricas crean campos eléctricos y, si están en movimiento, también crean campos magnéticos. Estos campos, eléctrico y magnético, ¿tienen alguna relación directa entre sí o debemos tratarlos de forma independiente, tal como hemos hecho hasta el momento? Como veremos a continuación, la relación entre campos eléctricos y magnéticos es muy estrecha, hasta el punto de que lo adecuado es hablar de campos electro magnéticos. Aunque hasta ahora se ha abordado su estudio separadamente, esto ha sido posible por tratarse de campos estáticos, es decir, independientes del tiempo. Sin embargo, cuando se consideran campos eléctricos y magnéticos dependientes del tiempo la conexión entre ellos surge inmediatamente, ya que un campo magnético variable genera un campo eléctrico y un campo eléctrico variable induce también un campo magnético. La descripción de estos nuevos fenómenos se condensa en dos nuevas leyes: la ley de Faraday y la ley de Ampère-Maxwell. Como consecuencia directa de estas leyes, las ecuaciones del electromagnetismo predicen la existencia de campos eléctricos y magnéticos que se propagan conjuntamente en el espacio: son las ondas electromagnéticas, que incluyen ejemplos tan conocidos como las ondas de radio y televisión o la luz.
20.7.1 Inducción electromagnética Flujo magnético El flujo del campo magnético, ΦΒ, a través de una superficie S plana, se define como el producto escalar del vector campo mgnético B por el vector superficie S . Φ B= B ⋅ S = B S cos θ
(20.37)
donde el vector S = SuN es un vector de módulo igual a la superficie y dirección perpendicular a ella, siendo θ el ángulo que forma con el campo magnético B (fig. 20.22.a). Si la superficie es curva, es necesario dividirla en porciones infinitesimales, que son aproximadamente planas, y sumar (integrar) el flujo
Magnetismo y campos electromagnéticos
187
a través de toda la superficie (fig. 20.22.b), tanto si ésta es abierta como si se trata de una superficie cerrada. En este último caso el vector superficie se orienta hacia el exterior del volumen limitado por la superficie. dΦE d = Id Φ ε= ε0 0B = ∫Superficie E dS dt dt
(20.38)
La unidad de flujo magnético en el SI es el tesla multiplicado por metro cuadrado, que recibe el nombre de weber (Wb). 1 Wb = 1 T × m2
Fig. 20.22. Flujo magnético a través de una superficie (a) plana, (b) curva.
Para una superficie abierta el flujo magnético a través de ella puede tomar, en general, cualquier valor, pero cuando se trata de una superficie cerrada, el flujo del campo magnético es igual a cero. En efecto, las líneas de campo magnético son cerradas y el “flujo saliente” es igual al “flujo entrante” (salen de la superficie el mismo número de líneas de campo que entran), por lo que el flujo total a través de la superficie cerrada es nulo. En el caso del campo magnético no existe el equivalente a las cargas eléctricas donde las líneas de campo nacen o terminan, siendo las líneas de campo siempre cerradas, sin que se pueda separar un “polo magnético” del otro. Por tanto, puede enunciarse la ley de Gauss para el campo magnético indicando que: el flujo de campo magnético a través de cualquier superficie cerrada es igual a cero.
188
Fundamentos físicos de los procesos biológicos
ΦBB== BBd⋅⋅SS ===BB0SScos cosθθ ΦB = ∫Superficie Φ cerrada
(20.39)
Ley de Faraday La conexión entre los campos eléctrico y magnético fue establecida por vez primera por Michael Faraday (1791-1867) al demostrar que un campo magnético variable genera una corriente eléctrica en un conductor próximo. Este resultado es de fácil verificación experimental, sin más que acercar un imán a un circuito conectado a un medidor de corriente (fig. 20.23). Si el imán está en reposo el detector no señala paso de corriente, pero al acercar o alejar el imán se produce una corriente eléctrica en el circuito, lo que indica la aparición (inducción) de una fuerza electromotriz E, y por tanto de un campo eléctrico.
Fig. 20.23. Demostración experimental de la inducción magnética. Al acercar o alejar el imán se induce una corriente eléctrica en el circuito.
Los estudios detallados del experimento anterior, y de otros similares, demuestran que la magnitud de la fuerza electromotriz inducida es proporcional a la variación del flujo magnético a través de la superficie limitada por el circuito y, más concretamente, a la rapidez de la variación del flujo: E ∝
dΦB dt
(20.40)
La variación del flujo magnético puede obtenerse de muchas maneras: puede variarse la magnitud del campo magnético, su dirección, la orientación del circuito o incluso su geometría. En todos los casos, independientemente del procedimiento utilizado, se verifica que la magnitud de la fuerza electromotriz inducida es proporcional a la velocidad de la variación del flujo, tal como expresa la ley de Faraday.
189
Magnetismo y campos electromagnéticos
Ley de Lenz El sentido de la fuerza electromotriz inducida puede obtenerse a partir de la ley enunciada por H.F.E. Lenz (1804-1865), según la cual la fuerza electromotriz y la corriente inducidas son tales que sus efectos se oponen a la variación de flujo que las origina. Incorporando la indicación del sentido de la fuerza electromotriz inducida (ley de Lenz), la ley de Faraday puede expresarse como: E =−
dΦB dt
(20.41)
donde el signo menos en la expresión anterior indica que la FEM inducida tiene el sentido adecuado para generar una corriente eléctrica cuyo campo magnético se opone a la variación de flujo magnético. Consideremos por ejemplo la situación que se ilustra en la figura 20.24, donde una espira conductora, cuyo plano coincide con el del papel, se encuentra en una región del espacio donde existe un campo magnético B, perpendicular a la espira, y dirigido hacia el lector. Si la magnitud del campo magnético aumenta, incrementando el flujo a través de la espira, la fuerza electromotriz inducida es tal que la corriente eléctrica que produce tiene la dirección indicada en la figura 20.24 (recorriendo el circuito en sentido horario). De esta forma el campo magnético que genera dicha corriente, según vimos en el capítulo anterior, se dirige hacia el interior del papel, oponiéndose por tanto a la variación inicial (aumento) del flujo a través de la espira.
Fig. 20.24. Ley de Faraday-Lenz: si el campo magnético aumenta, la fuerza electromotriz inducida en el circuito da lugar a una corriente eléctrica I cuyo sentido es tal que el campo magnético generado por ella se opone a la variación (aumento) de flujo inicial.
Observación. Generadores eléctricos. Una de las principales aplicaciones de los fenómenos de inducción electromagnética es la producción de corriente
190
Fundamentos físicos de los procesos biológicos
(alterna) como la que tiene lugar en las centrales de generación de energía eléctrica que posteriormente abastecen nuestros hogares e industrias. Una versión de dicho procedimiento, extremadamente simplificada, se ilustra en la figura 20.25.a. Consideremos una espira girando, con velocidad angular ω, en un campo magnético uniforme. Debido al giro, el ángulo entre la espira y el campo magnético varían con el tiempo (θ = ω t) y en conse cuencia también lo hace el flujo magnético: Φ B= B ⋅ S = B S cos (ω t )
(20.42)
por tanto, de acuerdo con la ley de Faraday, en la espira aparecerá una FEM que valdrá: E= −
dΦB t) = ω B S sen (ω t ) = E00sen sen(ω (ωt) dt
(20.43)
Fig. 20.25. (a) Esquema del funcionamiento de un generador de corriente alterna y (b) FEM inducida.
El sentido de la FEM varía periódicamente, de forma sinusoidal, dando lugar a una corriente alterna en la espira, como puede verse en la figura 20.25.b. La conexión al circuito exterior se realiza mediante dos anillos metá licos (A1 y A2) que permiten el giro de la espira manteniendo el contacto eléctrico. Aunque los generadores de las centrales eléctricas son más complejos, la idea básica de su funcionamiento queda reflejada en el sistema simplificado que acabamos de describir. El giro de la espira se produciría a partir de una fuente de energía primaria (por ejemplo, mediante vapor producido a partir de un combustible fósil), que se transforma así en energía eléctrica. La corriente eléctrica generada es transportada por las líneas de distribución y
191
Magnetismo y campos electromagnéticos
utilizada en una gran diversidad de dispositivos y máquinas eléctricas, dise ñadas para la utilización de corriente alterna.
20.7.2 Ley de Ampère-Maxwell En las secciones anteriores hemos constatado que las corrientes eléctricas constituyen el origen de los campos magnéticos. En particular, veíamos como una corriente rectilínea de gran longitud genera a su alrededor un campo magnético de módulo: B=
µ0 I 2π r
(20.44)
que constituye una forma de expresar la relación entre corrientes eléctricas y campos magnéticos (ley de Ampére). Sin embargo, la expresión anterior es incompleta, ya que existen otras fuentes de campo magnético, además de las corrientes eléctricas. En efecto, del mismo modo que los campos magnéticos variables dan lugar a corrientes eléctricas (según acabamos de ver), los campos eléctricos variables también generan campos magnéticos. En el siglo XIX, el físico escocés J.C. Maxwell (1831-1879) completó la ecuación (20.44) al considerar que los campos eléctricos dependientes del tiempo juegan un papel similar a las corrientes eléctricas, dando lugar a la aparición de campos magnéticos. En particular, demostró que se debía modificar la ley de Ampère, considerando como fuentes del campo magnético no sólo las corrientes eléctricas propiamente dichas, sino también una “corriente de desplazamiento” Id asociada con las variaciones del flujo de d Φ E con el tiempo: d campo eléctrico = I d ε= E dS ε 0 0 dt ∫Superficie dt dΦE d = I d ε= E dS ε 0 0 ∫ dt Superficie dt
(20.45)
Expresión que, como puede comprobarse, tiene una gran similitud formal con la ley de Faraday (ecuación 20.41). Observación. Corriente de desplazamiento de Maxwell. La corriente de desplazamiento de Maxwell puede utilizarse para visualizar los fenómenos de conducción eléctrica en circuitos que incorporan un condensador. Consideremos un condensador plano (fig. 20.26) con una separación pequeña entre sus placas, de forma que el campo eléctrico se puede considerar uni forme entre ellas y nulo en el exterior. Como se indicaba en el capítulo 18 al describir el proceso de carga y descarga de un condensador, en una de las
192
Fundamentos físicos de los procesos biológicos
placas tiene lugar la acumulación de carga positiva Q(t), relacionada con la intensidad que circula por el circuito en cada instante: I (t ) =
dQ ( t ) dt
El campo eléctrico entre las placas del condensador será: E (t ) =
Q (t ) S
ε0
donde S es el área de las placas y ε0 la permitividad dieléctrica del vacío (capí tulo 18). Al variar la carga del condensador en función del tiempo Q(t), el flujo del campo eléctrico entre las placas también será dependiente del tiempo: Q (t ) Φ E (t ) = E (t ) ⋅ S = ε0
y, por tanto, la corriente de desplazamiento entre las placas, definida por la ec. (20.45), es: d Φ E dQ ( t ) = I d ε= =I 0 dt dt
es decir, aunque entre las placas del condensador no hay movimiento de cargas, hay un campo eléctrico que varía en función del tiempo y la “corriente eléctrica de desplazamiento” Id , definida por la ecuación (20.45), es igual a la corriente eléctrica I (desplazamiento de carga) que circula por el circuito.
Fig. 20.26. Corriente de desplazamiento de Maxwell.
193
Magnetismo y campos electromagnéticos
20.8 Ondas electromagnéticas A partir de las ecuaciones del electromagnetismo, incluyendo las modificaciones derivadas de las leyes de Faraday y AmpèreMaxwell, es posible derivar una ecuación de ondas, que admite como solución campos eléctricos y magnéticos interrelacionados, que se propagan conjuntamente en el espacio, es decir, de ondas electromagnéticas (fig. 20.27).
Fig. 20.27. Onda electromagnética en que se propagan campos eléctricos y magnéticos conjuntamente.
A partir de las ecuaciones del electromagnetismo se demuestra también que la velocidad de propagación de estas ondas, en el vacío, es: c=
1
(20.46)
ε 0 µ0
donde ε0 y μ0 son, respectivamente, la permitividad dieléctrica y la permeabilidad magnética del vacío ya introducidas en los capítulos anteriores. Teniendo en cuenta sus valores respectivos: µ= 4π × 10−7 NA−2 0
1 = K e ≈ 9 × 109 N m 2 A−2 s −2 4πε 0
se obtiene para la velocidad de propagación de las ondas electromagnéticas el valor: = c
1 = ε 0 µ0
4π K e 9 × 109 ≈ = µ0 10−7
9 × 1016 = 3 × 108 ms −1
que coincide con el valor de la velocidad de propagación de la luz en el vacío.
194
Fundamentos físicos de los procesos biológicos
Desde el punto de vista histórico, la comprobación de la existencia de ondas electromagnéticas (Hertz, 1888), y la determinación de su velocidad de propagación, coincidente con la de propagación de la luz, permitió identificar a ésta como ondas electromagnéticas de un cierto rango de frecuencias. De hecho, como veremos en detalle en el capítulo 21, los campos eléctrico y magnético de las ondas electromagnéticas pueden oscilar a frecuencias muy variadas, lo que se conoce como el espectro electromagnético, siendo la luz visible una pequeña parte de dicho espectro. La ecuación 20.46, que relaciona la velocidad de la luz con las constantes fundamentales del electromagnetismo (ε0 y μ0), permite la determinación del valor de la permitividad dieléctrica ε 0 (y de la constante Ke introducida en la ley de Coulomb) a partir de la velocidad de la luz. En efecto, la permeabilidad magnética del vacío, tal como se indicó en la sección 3, se toma por convenio igual a: µ= 4π × 10−7 NA−2 0
y la velocidad de la luz en el vacío: = c 2, 99792458 × 108 ms −1
con lo que el valor preciso de la permitividad dieléctrica del vacío ε0 resulta ser: = ε0
1 1 = ≈ 8, 854 ⋅⋅⋅×10−12 N −1m −2 A2 s 2 2 − 7 8 2 µ0 c 4π × 10 × ( 2, 99792458 × 10 )
y, por tanto, la constante de la ley de Coulomb: = Ke
1 = 10−7 c 2 = 8, 98755 ⋅⋅⋅×109 Nm 2 A−2 s −2 ≈ 9 × 109 Nm 2 A−2 s −2 4πε 0
con lo que quedan finalmente justificados los valores utilizados para estas constantes en el capítulo 18. Observación. Sistema internacional de unidades. Con definiciones inde pendientes de la unidad de longitud, metro, y la unidad de tiempo, segundo, la velocidad de la luz debe determinarse experimentalmente. Sin embargo, en la actualidad se toma por convenio para la velocidad de la luz en el vacío el valor= exacto c 2, 99792458 × 108 ms −1 y, a partir de este valor, se define el metro como la longitud que recorre la luz en el vacío en 1/(2,99792458×108) segundos, tal como vimos en el capítulo 1.
195
Magnetismo y campos electromagnéticos
20.9 Ejercicios propuestos Ejercicio 20.1 Un protón ( q = += e 1, 6 × 10−19C ) se mueve en un campo mag nético uniforme con velocidad v = 104 ms −1 i . Hallar la fuerza que se ejerce sobre el protón si el campo magnético es:
(a) B = 0,1 T i (b) B = 0, 2 T j
(c) B = 0, 3 T k
= B 0, 4 T j − 0, 4 T k (d)
Sol.: (a) 0 (b) = F 0, 32 × 10−15 N k
(c) F = − 0, 48 × 10−15 N j
F 0, 64 × 10−15 N ( j + k ). (d)=
Ejercicio 20.2 Un protón se mueve en una órbita circular de radio R = 43 cm en un campo magnético uniforme de módulo B = 0,2 T. Hallar (a) la energía del protón, (b) ¿cuál sería el radio de giro para un electrón con la misma energía? E 5, 67 × 10−14 J (b) R = 1 cm Sol.: (a) =
Ejercicio 20.3 Un electrón, con una energía cinética de 100 keV, se encuentra atrapado en el cinturón de radiación de Van Allen, en una región del espacio con un campo magnético B = 10 ‒5 T, describiendo una trayectoria helicoidal. Si la velocidad del electrón forma un ángulo de 45º con el campo magnético, (a) ¿cuánto valen las componentes de la velocidad paralela v|| y perpendicular v⊥ al campo magnético? (b) ¿Cuál es el radio R de la hélice? (c) ¿Qué tiempo T tarda en completar una vuelta en su trayectoria “circular”? (d) ¿Cuál es la separación, L, entre cada vuelta? Sol.: (a) v|| = v⊥ = 1,41 × 108 ms‒1 (b) R = 80 m (c) T = 3,55 × 10 ‒6 s (d) L = 500 m Ejercicio 20.4 En un microscopio electrónico se lanza verticalmente, hacia abajo, un haz de electrones acelerados con una diferencia de potencial V = 5 kV. La distancia entre el “cañón de electrones” y el blanco es de 10 cm. Si consideramos que la componente horizontal del campo magnético terrestre es BH = 1 × 10 ‒5 T y la componente vertical Bv = 3 × 10 ‒5 T, determínese (a) la velocidad inicial de los electrones, (b) la aceleración de los electrones debida al campo magnético, (c) el radio de curvatura de la trayectoria, (d) la desvia ción horizontal d que sufren los electrones en el punto de impacto. Sol.: (a) v = 4,2 × 107 ms‒1 (b) a = 7,4 × 1013 ms‒2 (c) R = 24 m (d) d ≈ 0,21 mm
196
Fundamentos físicos de los procesos biológicos
Ejercicio 20.5 Un sistema experimental de resonancia magnética utiliza electroimanes que generan un campo magnético uniforme (entre las piezas polares del imán) de 1 T. Los electrones y protones de los átomos del aire, que a temperatura ambiente se mueven con una velocidad promedio v = 2.000 ms–1, experimentan una fuerza magnética igual y de sentido opuesto, que tendería a separarlos. Compárese dicha fuerza con la fuerza electrostática (atractiva) suponiendo una separación r ≈ 10–10 m entre el electrón y el núcleo (de carga efectiva +e). Sol.:
Fmagnética Felectrostática = 1, 39 × 10−8
Ejercicio 20.6 Un cable conductor, por el que circula una corriente I = 2 A, está situado verticalmente en una región donde existe un campo magné tico de componentes horizontal BH ≈ 1 × 10−5 T y vertical BV ≈ 3 × 10−5 T (que corresponden aproximadamente con valores propios del campo magnético terrestre). Calcúlese la fuerza por unidad de longitud que experimenta dicho cable, debida a cada una de las componentes del campo magnético. Sol.: (a) FBH = 2x10 –5 N (b) FBV = 0 Ejercicio 20.7 Una espira de 5 cm de radio, por la que circula una corriente de 1 A, se sitúa verticalmente, de forma que su momento magnético es hori zontal, formando un ángulo de 45º con la componente horizontal del campo magnético terrestre ( BH ≈ 1 × 10−5 T ). Calcúlese (a) el momento magnético de la espira. (b) El módulo del momento del par que actúa sobre ella. Sol.: (a) = µ 7, 85 × 10−3 Am −2
(b) Γ =5, 55 × 10−8 Nm
Ejercicio 20.8 Consideremos un selector de velocidades en el que existe un campo magnético de 0,5 T y un campo eléctrico perpendicular, debido a la diferencia de potencial V que se aplica entre dos placas paralelas, separadas una distancia d = 2 mm. Calcúlese la diferencia de potencial necesaria para seleccionar partículas moviéndose con una velocidad v = 105 ms-1. Sol.: V = 100 V Ejercicio 20.9 Se utiliza el selector de velocidades del ejercicio anterior como parte de un espectrómetro de masas para seleccionar una mezcla de cationes monovalentes (q = +e) de CO2 , formados a partir de los isótopos estables del carbono (C12 y C13) y el isótopo radiactivo C14. Tras el selector, la mezcla de iones llega a una región donde se aplica un campo magnético B’= 0,1 T, perpendicularmente a su velocidad (fig. 20.8), que les hace describir una tra yectoria semicircular e impactar sobre una pantalla. ¿Cuál es la separación ∆ entre los puntos de impacto de los diferentes isótopos?
Magnetismo y campos electromagnéticos
197
Datos: Pa (O) ≈ 16, 1 u.m.a. ≈ 1, 66 × 10−27 kg Sol.: ∆13-12 ≈ 2,1 cm, ∆14-12 ≈ 4,2 cm Ejercicio 20.10 Aunque los fenómenos eléctricos atmosféricos son de gran com plejidad, y no comprendidos aún en su totalidad, podemos describir un rayo nubetierra como una descarga eléctrica transitoria debida a la diferencia de carga entre la parte inferior de la nube, cargada negativamente, y la tierra, cargada positivamente. Dicha descarga se puede asimilar a una corriente eléc trica lineal entre la nube y la tierra, que se realiza en un tiempo típico de unos 50 ms, y tiene una intensidad de corriente de pico de unos 20 kA. Calcúlese: (a) La dirección del campo magnético creado. (b) El módulo del campo magnético máximo generado a una distancia de 8 m del punto de impacto. (c) La distancia a la descarga, r, a la que el campo magnético se reduce a un valor comparable al campo magnético terrestre ( BH ≈ 1 × 10−5 T ). Sol.: (a) Las líneas de fuerza se pueden aproximar por circunferencias horizontales, siendo por tanto la dirección del campo horizontal. (b) B= 5 × 10−4 T (c) r ≈ 400 m Ejercicio 20.11 Suponiendo que un axón se puede considerar como un con ductor rectilíneo, de gran longitud comparada con su diámetro, por el que circula una intensidad I ≈ 5 µA, ¿cuál es la magnitud del campo magnético creado a 1 cm de distancia? Sol.: B = 10 ‒10 T Ejercicio 20.12 Calcúlese el campo magnético creado a 1 m de distancia de un conductor de uso doméstico, por el que circule una corriente I ≈ 1 A. Sol.: B = 2×10 –7 T Ejercicio 20.13 Calcúlese el campo magnético creado a una distancia de 10 m por una línea de alta tensión, por la que circulen 1.000 A. Sol.: B = 2×10 –5 T Ejercicio 20.14 Calcúlese el campo magnético en puntos situados sobre el eje de una espira, de radio R = 2 cm, por la que circula una corriente I = 3 A: (a) en el centro de la espira. (b) A una distancia del centro igual al radio de la espira. Sol.: (a) B (0) = 9,42 × 10 –5 T (b) B (R) = 3,33 × 10 –5 T = 0,35 B (0) Ejercicio 20.15 Si suponemos que el campo magnético terrestre es debido a la corriente de una “espira equivalente”, contenida en el plano del ecuador y cuyo radio es igual al radio del núcleo (RN = 3.500 km) (a) ¿Cuál debe ser
198
Fundamentos físicos de los procesos biológicos
el valor de la corriente, sabiendo que el campo magnético en el polo (RT = 6.370 km) es de 70 µT? (b) ¿Cuál es el valor del campo magnético en el centro de la Tierra? I 3, 53 × 109 A Sol.: (a)=
B 6, 34 × 10−4 T (b) =
Ejercicio 20.16 Dos espiras de radio R = 1 m están separadas una distancia igual a su radio, paralelas entre sí, y por ellas circula la misma corriente I = 1 A. ¿Cuál es el valor del campo magnético en el punto medio entre las dos espiras? Sol.: B ≈ 9 x 10 –6 T Ejercicio 20.17 Se construye un solenoide arroyando 1000 vueltas de hilo de cobre en un tubo cilíndrico de longitud L = 20 cm, haciéndose circular por el solenoide una corriente de 1,5 A. Calcúlese el campo magnético en el extremo Bextremo y en el centro Bcentro del solenoide cuando su radio R es: (a) R << L, (b) R = 1 cm, (c) R = 4 cm. Sol.: (a) Bextremo = 3,14 × 10 ‒5 T = B0 , Bcentro = 2B0 (b) Bextremo ≈ 0, 999 B0 , Bcentro ≈ 1, 99 B0 (c) Bextremo ≈ 0, 981 B0 , Bcentro ≈ 1, 72 B0 Ejercicio 20.18 La figura 20.28 muestra un circuito por el que circula una corriente I = 30 A. El tramo AB, de gran longitud, se sitúa horizontalmente y sobre él se aproxima el tramo EF, que puede deslizar verticalmente. La corriente que circula por ambos es igual pero de sentido contrario, por lo que el tramo EF experimenta una fuerza magnética repulsiva. Si el conductor es una varilla cilíndrica de aluminio, de sección S = 1 mm3, longitud l = 1 m y densidad ρAl = 2,7 × 103 kg/m3, calcúlese la altura h sobre la que “ flota” el segmento EF.
Fig. 20.28.
Magnetismo y campos electromagnéticos
199
Sol.: h = 6,8 mm Ejercicio 20.19 Si en un circuito como el del ejercicio anterior, se alejan todos los conductores lo suficiente como para despreciar su campo magné tico, dejando el tramo EF móvil (figura 20.29), ¿cuál debe ser la corriente mínima que circule para conseguir mantener equilibrado dicho segmento horizontal por la fuerza magnética debida al campo magnético terrestre, cuyas componentes horizontal y vertical son: BH ≈ 10 ‒5 T y BV ≈ 3 × 10 ‒5 T respectivamente.
Fig. 20.29.
Sol.: I ≈ 2.560 A Ejercicio 20.20 El protón tiene un momento magnético debido al spin que se puede expresar como: μp = γ μN , donde µN =
µ e ≈ B ≈ 5, 04 × 10−27 Am 2 2m p 1840
es el “magnetón nuclear”, y donde γ ≈ 2,79 para el protón. Calcúlese: (a) El valor del momento magnético del protón. (b) La diferencia de energía ΔE entre un protón orientado paralelamente o antiparalelamente a un campo magnético B = 1,5 T. (c) Si dicha energía se suministra mediante fotones de energía E = hf (véase el capítulo 21), ¿cuál es la frecuencia f de resonancia? (Nota: El cuerpo humano está constituido en gran parte por agua y grasa, teniendo ambos un contenido elevado de átomos de hidrógeno. En conjunto, más del 60 % de los átomos del cuerpo humano son átomos de hidrógeno. Tal como se indica en este ejercicio, los núcleos de hidrógeno pueden ser orien tados en un campo magnético, y forzados a cambiar de orientación mediante la absorción de ondas de radiofrecuencia f ≈ 108 Hz (véase el capítulo 22). Éste es el fundamento físico de las técnicas de resonancia magnética nuclear, utilizadas como método de análisis físico y químico. Estas técnicas, poten ciadas con la capacidad actual de tratamiento digital de datos, permiten la reconstrucción de imágenes del cuerpo humano, con múltiples aplicaciones en medicina, lo que se denomina “Imagen por Resonancia Magnética” o IRM. Por razones más sociológicas que científicas, se tiende a eliminar la utilización del término “nuclear”, procedente tan solo del hecho de utilizar las propiedades magnéticas del núcleo (de los átomos de hidrógeno, y de
200
Fundamentos físicos de los procesos biológicos
algunos otros átomos). El premio Nobel de Fisiología y Medicina del año 2003 ha sido concedido a Paul C. Lauterburg y Peter Mansfield por sus apor taciones al desarrollo de la IRM). Sol.: (a) µ p ≈ 1, 41 × 10−26 Am 2 (b) ∆E ≈ 4, 22 × 10−26 J (c) f ≈ 6, 4 × 107 Hz Ejercicio 20.21 Una espira cuadrada, de lado L = 2 m, se encuentra en una región del espacio donde hay un campo magnético uniforme, dirigido según el eje y: B = 0, 5T j (fig. 20.30). Calcúlese el flujo magnético a través de la espira cuando: (a) La espira se sitúa en el plano XY. (b) La espira se sitúa en el plano XZ. (c) La espira se sitúa en el plano YZ. (d) La espira es perpendicular al plano XY, formando un ángulo φ = 30º con el eje Z. (e) La espira es perpendicular al plano XY, formando un ángulo φ = 60º con el eje Z.
Fig. 20.30.
Sol.: (a) ΦB = 0 Wb (b) ΦB = 2 Wb (c) ΦB = 0 Wb (d) ΦB = 1,73 Wb (e) ΦB = 1 Wb
Magnetismo y campos electromagnéticos
201
Ejercicio 20.22 Por un conductor rectilíneo indefinido circula una corriente I = 1 A, generando un campo magnético a su alrededor. Calcúlese el flujo magnético a través de una espira circular de radio R = 0,1 m, situada en el plano perpendicular al conductor (a) con su centro en el conductor, (b) con el centro a 0,2 m del conductor (fig. 20.31)
Fig. 20.31.
Sol.: (a) ΦB = 0 Wb (b) ΦB = 0 Wb Ejercicio 20.23 Por un conductor rectilíneo indefinido circula una corriente I = 2 A. Una espira rectangular ABCD, de lados L1 y L2, se sitúa a una distancia x del conductor, con dos de sus lados paralelos a él, tal como se muestra en la figura 20.32. Calcúlese: (a) la expresión del flujo magnético a través de la espira, en función de la distancia x, si L2 es de longitud infinitesimal L2 = dx, (b) el valor del flujo si la distancia x = 1 cm, siendo L1 = 10 cm y L2 = 2 cm.
Fig. 20.32.
Sol.: (a) Φ B =
µ0 IL1 dx 2π x
(b) Φ= 4, 4 × 10−8 Wb B
202
Fundamentos físicos de los procesos biológicos
Ejercicio 20.24 Una espira circular de radio R = 0,1 m tiene una resis tencia de 2 Ω. La espira se encuentra en el plano del papel, perpendicular a un campo magnético uniforme que se dirige hacia el lector. Inicialmente el módulo del campo magnético es B = 5 × 10 ‒2 T y decrece con el tiempo a ritmo constante de 10 ‒3 T/s. Calcúlese: a) El flujo del campo magnético en el instante inicial b) La FEM inducida c) La corriente que circula por la espira d) El sentido de la corriente E 3,14 × 10−5 V Sol.: (a) ΦB = 1,57 × 10 ‒4 Wb (b) =
I 1, 57 × 10−5 A (c) =
(d) Antihorario Ejercicio 20.25 Una espira rectangular de lados a = 2 cm y b = 10 cm se mueve con velocidad uniforme v = 2 ms–1, penetrando en una región donde existe un campo magnético uniforme, perpendicular al papel y dirigido hacia el lector, de módulo B = 1,5 T (fig. 20.33). Calcúlese (a) la expresión del flujo a través de la espira en función de la distancia x y del tiempo t (para 0 < x < b), (b) la FEM inducida, (c) la intensidad que circula por la espira si su resistencia es de 0,3 Ω, (d) el sentido de la corriente.
Fig. 20.33.
= Bax = Bavt (b) E = 6 × 10−2 V Sol.: (a) Φ B
(c) I = 0, 2 A (d) Horario
Ejercicio 20.26 Un generador de corriente alterna, tal como el esquemati zado en la figura 20.25, consta de N espiras, cada una de ellas con un área S = 0,5 m2. Las espiras giran en un campo magnético uniforme de módulo B = 1 × 10 ‒2 T, con un periodo T = 0,1 s, generándose una FEM alterna de 220 V. Calcúlese el número de espiras.
Magnetismo y campos electromagnéticos
203
Sol.: N = 700
20.10 Referencias Aguilar Gutiérrez, M. “Bioelectromagnetismo: campos eléctricos y magnéticos y seres vivos”. Colección Textos Universitarios, n.º 32. CSIC, Madrid, 2001. Creagh, D.C. y Bradley, D.A. Radiation in art and archeometry. Elsevier, 2000. Grupo Pandora S.A. Campos eléctricos y magnéticos de 50 Hz. UNESA, 1998. National Institute of Standards and Technology (NIST). http://physics.nist. gov/cuu/Units/index.html Salisbury, F.B. y Ross, C.W. Fisiología de las plantas 2. Bioquímica vegetal. Ed. Paraninfo, 2000. Stern, D.P. “A Millennium of Geomagnetism”. Reviews of Geophysics, 40 (3), 1-30, 2002.
Capítulo 21. Ondas: luz y sonido 21.1 Introducción: propagación Si una piedra cae al agua y provoca el desplazamiento de las moléculas de su superficie, este desplazamiento se transmite a las moléculas vecinas, produciendo ondulaciones que se propagan por la superficie; si ocurren desplazamientos en las capas internas de la Tierra, éstos se propagan, alcanzando la superficie, que se ve sacudida por un terremoto; si encendemos una lámpara, la luz generada en el filamento alcanza los objetos a su alrededor y una vez reflejada por ellos llega a nuestros ojos; si leemos estas líneas en voz alta, nuestros vecinos se darán cuenta de que estamos estudiando la propagación de ondas. Y con esas ondas se acompaña información, ya sea referida a su emisor o al medio por el que han viajado, por lo que constituyen el vehículo principal para la comunicación entre los seres vivos. En el ámbito técnico pensaríamos inmediatamente en las ondas de radio y TV, utilizadas por los “medios de comunicación”, mientras que en la naturaleza hay dos tipos de ondas, en particular, que constituyen los canales de información sobre el mundo externo a los que los seres vivos son sensibles de forma prácticamente universal: la luz y el sonido. Sería difícil pensar en un organismo capaz de sobrevivir sin utilizar estos recursos cuando sus competidores (presas o predadores) lo hacen eficientemente, habiendo desarrollado órganos especializados para captar y procesar dicha información. Los procesos antes mencionados se llevan a cabo siempre gracias a unas mismas etapas básicas: producción o emisión, transmisión y recepción de ondas, que se resumen en la figura 22.1. La propagación es lo que confiere muchas de las características propias de las ondas y a esta etapa está dedicado principalmente el capítulo. Por supuesto, debemos comenzar con una fuente o mecanismo que genere algún tipo de señal (luz, sonido...) y terminar con un punto receptor donde se detecta (detector) para su posterior procesado. La generación y recepción de luz y sonido serán también tratadas en éste y en el capítulo siguiente. 205
206
Fundamentos físicos de los procesos biológicos
Fig. 21.1. Producción (fuente), transmisión (medio de propagación) y recepción (detector) de ondas.
21.2 Tipos de ondas Existen muchos tipos de ondas, que pueden clasificarse atendiendo a criterios diferentes. En esta sección veremos las diferencias debidas a la naturaleza física del proceso que se propaga (sección 2.1) y a la dirección de la perturbación en relación con la dirección de propagación (sección 2.2). Las ondas también pueden clasificarse atendiendo a la forma que adoptan durante su propagación en el espacio, lo que abordaremos en la sección 3.4.
21.2.1 Ondas mecánicas y electromagnéticas El proceso físico que da lugar a la existencia de una onda puede ser muy variado. Hemos mencionado sonido y luz, que constituyen dos ejemplos característicos de los dos tipos de ondas más habituales: ondas mecánicas y ondas electromagnéticas. En las ondas mecánicas la perturbación corresponde a algún tipo de movimiento o vibración. Además del sonido, son ejemplos bien conocidos las ondas en cuerdas o muelles (figs. 21.2 y 21.3), las ondas en la superficie de un líquido, las ondas sísmicas, etc. En el caso de las ondas electromagnéticas, la perturbación que se transmite son campos eléctricos y magnéticos. Además de la luz, son ondas electromagnéticas las ondas de radio y TV, las radiaciones ultravioleta e infrarroja, los rayos X, etc.
21.2.2 Ondas transversales y longitudinales Un ejemplo de onda, fácil de visualizar, corresponde a la onda unidimensional que se propaga en una cuerda tensa (fig. 21.2). Podemos generar oscilaciones en el extremo de la cuerda, haciéndola subir y bajar verticalmente a lo largo del eje Y. Esta perturbación, obviamente, no queda localizada, sino que se propaga a lo largo de la cuerda, en la dirección del eje X.
Ondas: luz y sonido
207
Fig. 21.2. Onda unidimensional debida a la oscilación de una cuerda en la dirección del eje Y que se propaga según el eje X.
La situación representada en la figura 21.2 es característica: la perturbación (es decir, el movimiento de la mano) es periódica y en su propagación se genera una “onda”, por lo que se habla de movimiento ondulatorio. Es importante distinguir entre la dirección de propagación (eje X en la figura) y la dirección de la perturbación, es decir, de la oscilación de la cuerda (eje Y en la figura). El ejemplo de la figura 21.2 es una onda transversal, en la que la dirección de la perturbación es perpendicular a la dirección de propagación. La luz es también una onda transversal, ya que los campos eléctricos y magnéticos que se propagan son perpendiculares a la dirección de propagación. En el caso de ondas transversales, la dirección de oscilación, perpendicular a la dirección de propagación, determina la polarización de la onda, lo que se verá con más detalle al hablar de la luz en la sección 4.2. La figura 21.3 ilustra una onda longitudinal. La perturbación en este caso son compresiones y expansiones de un muelle que se producen en la misma dirección en que se propaga la onda. El sonido es otro ejemplo de onda longitudinal, muy similar al caso del muelle, donde lo que se propaga son compresiones y expansiones (rarefacciones) del aire (sección 4.1), provocadas por algún objeto vibrante, como un diapasón o la membrana de un altavoz.
Fig. 21.3. Onda longitudinal debida a la propagación de compresiones y expansiones en un muelle.
208
Fundamentos físicos de los procesos biológicos
En un fluido (gas o líquido) las vibraciones sólo pueden transmitirse longitudinalmente, pero en un sólido (como en la cuerda de la figura 21.2) también se pueden propagar ondas mecánicas transversales. Un caso bien conocido, en que la perturbación inicial se propaga tanto por ondas transversales como longitudinales es el de las ondas sísmicas. Las ondas sísmicas longitudinales se propagan a mayor velocidad (v = 14 km/s) que las transversales (v = 3,5 km/s), denominándose ondas primarias y ondas secundarias respectivamente (por su orden de llegada al receptor). Observación. En una onda, lo que se propaga es la perturbación. No hay trans porte de materia, aunque sí de energía y momento. En el ejemplo de la figura 21.2, lo que se propaga (según la dirección X) no es la cuerda, sino su estado de movimiento (a lo largo del eje Y). En el ejemplo de la figura 21.3, lo que se pro paga son las compresiones y dilataciones del muelle, ahora ambas en la misma dirección X, pero el muelle no se desplaza en su conjunto. Cuando en un estadio los espectadores hacen “la ola”, cada uno de ellos permanece en su posición mientras la ola se propaga recorriendo las gradas.
21.3 Ondas: características generales 21.3.1 Ondas armónicas Si en el ejemplo representado en la figura 21.2, el extremo de la cuerda se desplaza siguiendo un movimiento armónico simple (capítulo 5), la onda que se genera recibe el nombre de onda armónica. El desplazamiento de la cuerda respecto a la posición de equilibrio y(x,t) puede expresarse en este caso como: (21.1) donde A representa la amplitud y φ (x, t) = (k x – ω t) representa la fase. Las magnitudes k y ω se denominan número de onda y frecuencia angular (o pul sación), respectivamente. La fase, que puede variar entre 0 y 2π, determina si la onda está en un máximo, mínimo o cualquier otra situación intermedia, es decir, caracteriza su estado de vibración, cambiando de una posición a otra y de un instante a otro (φ (x, t)). Nótese que en el movimiento de la cuerda, representado en la figura 21.2, y(x,t) representa su desplazamiento respecto a la posición de equilibrio en la dirección del eje Y. Pero de igual forma, la ecuación 21.1 puede utilizarse para describir ondas armónicas longitudinales en un muelle, como las representadas en la figura 21.3. En dicho caso, y(x,t) representaría también los desplazamientos respecto a las posiciones de equilibrio, que ahora se realizan en la dirección del eje X.
209
Ondas: luz y sonido
La ecuación (21.1), que describe una onda armónica, se parece a la que describe el movimiento armónico simple, pero hay que distinguirlas. La ecuación (21.1) corresponde a la descripción de la propagación de una onda y depende explícitamente de dos variables: el tiempo (t) y la posición (x). El nombre de onda armónica proviene de que la dependencia con las variables espacio y tiempo es una función armónica, es decir, de tipo sinusoidal. Como ya se estudió en el capítulo 5, se puede utilizar igualmente la función cos φ (x,t) o, en general, una función de la forma sen (φ (x, t) + φ0), donde el uso de una fase inicial (φ0) solo representa la elección de un origen de tiempo o espacio distintos de cero. La onda armónica simple representa, por tanto, una doble variación periódica en el espacio y en el tiempo. Podemos fijarnos en una posición particular x0, y considerar el desplazamiento que tiene lugar en función del tiempo: y ( x0 , t ) (fig. 21.4.a). O, alternativamente, podríamos haber “tomado una fotografía”, congelando el estado de movimiento en un tiempo fijo t0, y observar el desplazamiento como función de la posición: y ( x, t0 ) (fig. 21.4.b). Ambas representaciones nos conducen a observar, de forma alternativa, la variación periódica en el tiempo o en el espacio de la onda armónica. Para que una ecuación como la (21.1) represente una onda, debe verificarse que las variables posición y tiempo estén relacionadas entre sí, en la fase, por una función lineal φ (x, φ ( xt) = , t )= ( k x ± ω t ) . El signo “–”, en la fase, corresponde a una onda que se propaga en la dirección positiva del eje X, mientras que el signo “+” correspondería a una onda propagándose en el sentido contrario: = y ( x, t ) A sen ( k x + ω t )
Fig. 21.4. Onda armónica como: (a) variación periódica en función del tiempo para una posición fija x0, (b) variación periódica en función de la posición en un instante t0 determinado.
210
Fundamentos físicos de los procesos biológicos
21.3.2 Características de una onda armónica: frecuencia, velocidad de propagación y longitud de onda Para caracterizar la periodicidad de una onda debe tenerse en cuenta la existencia de dos variables y, por tanto, la existencia de una doble periodicidad: hay una periodicidad en el tiempo y una periodicidad en el espacio. La magnitud que caracteriza la periodicidad en el tiempo se denomina periodo, T, mientras la periodicidad asociada a las variaciones espaciales es lo que se conoce como longitud de onda, λ. Para calcular el periodo o la longitud de onda basta imponer la condición de que una onda armónica se repite cuando la fase cambia en 2π. Consideremos en primer lugar la variación de la fase en función de la distancia (fig. 21.4.b), en un instante t0, observando dos puntos x1 y x2, en idéntico estado de vibración, cuya distancia corresponde, por tanto, a la periodicidad espacial o longitud de onda λ: x2 − x1 = λ
Particularizando dicha igualdad, y (x1, t0) = y (x2, t0), para el caso de una onda armónica: A sen ( k= x1 − ω t0 ) A sen ( k x2 − ω t0 )
y puesto que la función seno es periódica con periodo 2π: k x2 − ω t0 =− k x1 ω t0 + 2π
→
k ( x2 − x1 ) = 2π
es decir: λ= x2 − x1 =
2π k
↔
k=
2π λ
(21.2)
Razonando de forma análoga, atendiendo ahora a la periodicidad temporal, se obtendría la correspondiente expresión del periodo: T=
2π ω
(21.3)
cuya inversa representa el número de oscilaciones por unidad de tiempo, es decir, la frecuencia f: f=
1 ω = T 2π
(21.4)
Las ecuaciones (21.2)(21.4) nos indican el significado tanto del número de onda, k, como de la frecuencia angular, ω, y su relación con la longitud de onda y periodo o frecuencia.
211
Ondas: luz y sonido
Por otra parte, el tiempo que la perturbación tarda en desplazarse desde un máximo hasta otro máximo, lo que corresponde a un desplazamiento igual a la longitud de onda λ, es precisamente un tiempo igual al periodo T, por lo que la velocidad v de propagación de la onda es: v=
λ 2π ω = λ f = T k 2π
ω = k
(21.5)
Utilizando las ecuaciones anteriores, una onda armónica puede expresarse también como: x t = y ( x, t ) A sen 2π − λ T = y ( x, t ) A sen k ( x − v t )
(21.6) (21.7)
donde longitud de onda, periodo o velocidad de propagación aparecen ahora de forma explícita.
21.3.3 Características de una onda y su relación con la fuente emisora y el medio de propagación Reinterpretemos de nuevo el ciclo generación-transmisión-recepción de ondas y consideremos ahora las magnitudes características de las ondas, definidas en la sección anterior, y su relación con estas etapas (fig. 21.5). La fre cuencia (o el periodo) de una onda es una magnitud fundamental, cuyo valor queda determinado por la fuente origen de las ondas. Si nos referimos al ejemplo de la figura 21.2, la oscilación de la onda que se transmite a lo largo de la cuerda tiene una frecuencia igual a la frecuencia de la mano al oscilar. Análogamente, si hacemos vibrar un altavoz, la frecuencia de la onda sonora que se transmite corresponde con la frecuencia de oscilación de la membrana del altavoz. También la amplitud depende de las características de la fuente emisora de la onda. Siguiendo con el ejemplo de la figura 21.2, la amplitud de la onda está determinada por la amplitud del movimiento de la mano y, en el caso de las ondas sonoras generadas por un altavoz, por la amplitud de la oscilación de la membrana del altavoz. Esta amplitud está directamente relacionada con la energía que transporta la onda, como veremos más adelante. A partir de la perturbación generada por la fuente se produce la transmisión propiamente dicha. Esta transmisión depende del tipo de onda y de las propiedades del medio en que se realiza, y determina la velocidad de propa gación de la onda:
212
Fundamentos físicos de los procesos biológicos
v = v (tipo de onda, medio de propagación) Los distintos tipos de ondas (mecánicas, electromagnéticas) involucran procesos muy diferentes en su transmisión, a lo que hay que añadir que cada medio tiene, en general, propiedades específicas. Todo ello se traduce consecuentemente en cambios en la velocidad de propagación. El sonido no se propaga a la misma velocidad en el aire (vsonido, aire ≈ 340 ms–1) que en el agua (vsonido, agua ≈ 1.500 ms–1) y estas velocidades son completamente diferentes de la velocidad de propagación de la luz, tanto en el aire (vluz, aire ≈ vluz, vacío ≈ 300.000 km s–1) como en el agua (vluz, agua ≈ 225.000 km s–1). La longitud de onda está determinada por la frecuencia y la velocidad de propagación: λ = v/ f. Cuando una onda atraviesa la frontera entre dos medios diferentes, como veremos en la sección 21.5, la frecuencia de la onda se conserva, pero cambia la velocidad de propagación y con ello la longitud de onda. Por último, en relación con el esquema de la figura 21.5, nos queda por considerar la etapa de detección. Mencionaremos aquí sólo el caso de la luz y el sonido, que son los dos tipos de ondas que más nos interesan y que se tratarán con detalle más adelante. Su detección se hace por órganos especializados (ojos y oídos). En ellos, cada frecuencia (o grupo de frecuencias) da lugar a una sensación fisiológica característica: el color en el caso de la luz, y el tono (grave o agudo) para el sonido. La intensidad con que se perciben estas sensaciones está relacionada con la energía aportada por la onda, que, como ya hemos indicado, está relacionada con su amplitud.
Fig. 21.5. La frecuencia y amplitud de una onda están determinadas por su fuente, mientras la velocidad (y longitud de onda) dependen a su vez del medio de propagación. En el caso de la luz y el sonido, en la detección se genera una cierta sensación fisiológica asociada a cada frecuencia: el color en el caso de la luz, y el tono (grave o agudo) para el sonido.
21.3.4 Energía y su propagación: intensidad Como hemos indicado anteriormente, una onda transporta energía: las ondas electromagnéticas (luz) procedentes del Sol proporcionan la energía necesaria para la fotosíntesis sobre la Tierra, mientras que un sonido muy intenso puede provocar la rotura de una copa de vidrio. La energía de la onda procede de la fuente emisora que consume energía y la irradia con la onda a un cierto ritmo. En el caso de la luz solar, son las reacciones nucleares que allí ocurren (véase
213
Ondas: luz y sonido
el capítulo 23) las que aportan dicha energía, mientras en el caso del sonido es también el emisor, ya sea un altavoz o el aparato fonador humano, quien realiza el aporte energético. Esta energía se transmite con la onda, propagándose con una cierta velocidad y con una cierta distribución espacial. La magnitud utilizada para caracterizar la energía asociada a una onda es la intensidad o energía que atraviesa la unidad de área perpendicular a la dirección de propagación por unidad de tiempo. (21.8)
Por tanto, la intensidad de una onda se mide en unidades de potencia por unidad de superficie, es decir, en W/m2 en el SI. Nótese que la intensidad se mide por unidad de superficie perpendicular a la dirección de propagación. Cuando una onda, de una cierta intensidad, incide sobre superficies con diferente orientación, éstas reciben la misma energía total pero distribuida sobre áreas diferentes. La energía por unidad de tiempo y superficie recibe el nombre de irradiancia (W/m2), mientras que la energía por unidad de área (es decir, irradiancia multiplicada por tiempo) recibe el nombre de irradiación (J/m2). Energía y amplitud En una onda armónica la oscilación de la fuente corresponde a un movimiento armónico simple y sabemos (capítulo 5) que su energía E es proporcional al cuadrado de la amplitud de dicho movimiento:
Esta energía se transmite con la onda, por lo que, para una onda armónica, la intensidad resulta ser proporcional al cuadrado de la amplitud: I ∝ ( Amplitud )
2
(21.9)
Ondas tridimensionales En las ondas en cuerdas y muelles, descritas con anterioridad, la perturbación estaba localizada en la propia cuerda o muelle, propagándose en una única dirección: se trataba de ondas unidimensionales. De modo más general, las ondas pueden propagarse en dos y tres dimensiones. El primer caso correspondería, por ejemplo, a las ondas en la superficie
214
Fundamentos físicos de los procesos biológicos
de un líquido, y la propagación en tres dimensiones corresponde al caso de la propagación habitual de luz y sonido en el espacio real. Consideremos, por ejemplo, la imagen familiar de las ondas que se propagan en la superficie del agua tras haber arrojado un objeto. Los puntos del espacio que, en un instante determinado, tienen el mismo estado de vibración constituyen lo que se denomina un frente de ondas. En la superficie del agua las crestas de la ola, por ejemplo, constituyen un frente de ondas, que corresponde a los puntos de máximo desplazamiento. La onda se propaga por igual en todos los puntos (medio homogéneo) y en todas las direcciones (medio isótropo) y los frentes de ondas adoptan forma circular (fig. 21.6.a), siempre que la fuente de las ondas pueda considerarse “puntual”. El equivalente para la propagación en el espacio tridimensional da lugar a frentes de onda en forma de esferas, por lo que estas ondas reciben el nombre de ondas esféricas. Si consideramos un punto suficientemente alejado de la fuente y las variaciones en distancia son pequeñas, la curvatura de los frentes de ondas esféricos se hace despreciable y pueden considerarse planos. Decimos entonces que se trata de una onda plana, ya que los frentes de onda derivan en planos perpendiculares a la dirección de propagación (fig. 21.6.b).
Fig. 21.6. Representación del frente de ondas (línea continua) y de los rayos (línea discontinua) para la propagación de ondas (a) esféricas y (b) planas.
En la figura 21.6 se representan de forma esquemática ondas: (a) esféricas y (b) planas. Las líneas continuas indican los frentes de onda, es decir, puntos del espacio con igual estado de vibración y por tanto la misma fase. Las líneas de trazos con flechas representan los rayos que, tal como se observa en la figura, son perpendiculares a los frentes de onda y coinciden con la dirección de propagación del frente de ondas y de la energía. En muchas ocasiones los rayos se utilizan como única representación de la propagación de una onda,
215
Ondas: luz y sonido
prescindiéndose de los frentes de onda que se sabe que son perpendiculares a dichos rayos. En medios homogéneos e isótropos los rayos son líneas rectas, lo que se asocia familiarmente con la “propagación en línea recta”, por ejemplo de la luz, cuyos “rayos” se identifican con un delgado pincel que atraviese un orificio en un objeto opaco. El concepto de rayo se utilizará para estudiar los fenómenos de reflexión y refracción que se producen cuando una onda incide sobre la frontera entre dos medios diferentes (sección 21.5), así como las propiedades básicas de los instrumentos ópticos (capítulo 22). Sin embargo, cuando la onda encuentra en su camino obstáculos de tamaño comparable a la longitud de onda, el carácter ondulatorio se manifiesta en la capacidad de la onda para “bordear” los mismos, fenómeno conocido como difracción, que será objeto de estudio en la última sección de este capítulo. La onda plana se parece a las ondas unidimensionales, ya que sus características sólo dependen de una variable espacial: la distancia recorrida en la dirección de propagación, y la fase se mantiene constante en los planos perpendiculares a dicha dirección. Por tanto, las ondas armónicas planas pueden expresarse de forma similar a las unidimensionales, si tomamos como eje X la dirección de propagación: = U ( x, t ) A sen ( kx − ωt )
(21.10)
donde A, k y ω son la amplitud, número de onda y pulsación, respectivamente. Para las ondas armónicas planas la amplitud es constante y la intensidad de la onda permanece también constante. I ≈ I0
(21.11)
Sin embargo, esta situación es diferente para las ondas esféricas. En efecto, la energía suministrada por la fuente se propaga con el frente de onda, por lo que, a medida que la onda se aleja del emisor, el frente de onda aumenta de tamaño y la energía se reparte en un área cada vez mayor y, por tanto, la intensidad disminuye al aumentar la distancia al emisor (fig. 21.7). La superficie del frente de ondas aumenta con la distancia r como S = 4πr2, de forma que si comparamos la intensidad I a una distancia cualquiera r con su valor I0 a una distancia de referencia r0, se verifica: I × 4π r 2 = I 0 × 4 π r02
y, por tanto:
216
Fundamentos físicos de los procesos biológicos
2
1 r = I I0 × 0 ∝ 2 r r
(21.12)
es decir, la intensidad de una onda esférica disminuye con el cuadrado de la distancia al punto emisor, lo que se conoce como “ley del cuadrado de la distancia”. Nótese que esta disminución de la intensidad no supone pérdida alguna de energía, sino un reparto de la misma energía en una superficie esférica cada vez mayor, ya que el producto de la intensidad por la superficie permanece constante.
Fig. 21.7. En una onda esférica la energía se reparte en una superficie cada vez mayor a medida que aumenta la distancia a la fuente, es decir, el radio r del frente de onda. En consecuencia, la intensidad es inversamente proporcional al cuadrado de r. La energía total, producto de la intensidad por la superficie, permanece constante.
Como consecuencia, la amplitud de las ondas esféricas no es constante. Para garantizar que se conserve la energía total, a pesar del aumento de la superficie del frente de onda, teniendo en cuenta las ecuaciones (21.9) y (21.12), se ha de verificar que: I ∝ ( Amplitud ) ∝ 2
1 r2
(21.13)
es decir: Amplitud ∝
1 r
(21.14)
por lo que la expresión para una onda esférica U(r, t) adopta la forma: A U ( r , t ) = sen ( k r − ω t ) r
(21.15)
siendo r la distancia del frente de onda al punto emisor. Las magnitudes ω y k tienen el significado habitual.
217
Ondas: luz y sonido
La expresión de las ondas tridimensionales esféricas y planas, junto a la expresión de su intensidad, se resumen en la tabla 21.1. Tabla 21.1 Ondas esféricas y planas Tipo
Onda
Intensidad
Esférica
A U ( r , t ) = sen ( k r − ω t ) r
1 r = I I0 × 0 ∝ 2 r r
Plana
= U ( x, t ) Asen ( kx − ωt )
I = I0
2
Atenuación: absorción y dispersión La experiencia nos demuestra que cualquier onda sufre atenuación en su propagación, es decir, su intensidad disminuye a medida que nos alejamos de la fuente. No se escucha igual la radio cerca que lejos del altavoz, ni una bombilla ilumina igual cerca o lejos de ella. En muchos casos, esta atenuación está motivada simplemente por el aumento del área del frente de onda, tal como acabamos de ver en la sección anterior (ley del cuadrado de la distancia), sin que suponga ninguna pérdida de energía global. A distancias grandes de la fuente los frentes de onda se pueden considerar planos y la intensidad permanece aproximadamente constante. Sin embargo, existen muchos casos en los que la onda se atenúa debido a una pérdida neta de energía. En este caso, hay que distinguir dos procesos diferentes: absorción y dispersión. Por absorción se entiende la cesión neta de energía de la onda al medio en el que se propaga, donde se disipa, generalmente en forma de calor. Por dispersión (scattering) se entiende una redistribución direccional de la energía de la onda incidente, que se redirige (se dispersa) a ondas secundarias que se propagan en otras direcciones diferentes a la de la onda incidente. Un observador que recibe la onda inicial detecta también la disminución de energía en la onda incidente debida a dicho proceso de dispersión. Independientemente del origen del proceso de atenuación (absorción o dispersión), la disminución de la intensidad de la onda I se puede describir adecuadamente por una expresión exponencial decreciente en función de la distancia x recorrida a través del medio, absorbente o dispersor (fig. 21.8): = I ( x ) I 0 exp ( −α x )
(21.16)
218
Fundamentos físicos de los procesos biológicos
conocida como ley de BeerLambert, donde α recibe el nombre de coeficiente de extinción, que puede tener su origen tanto en fenómenos de absorción como de dispersión, y sus dimensiones son:
[α] = L–1 Es evidente, de la ecuación (21.16), que la inversa del coeficiente de extinción α representa la distancia que ha de recorrer la onda para que su intensidad se atenúe hasta un valor igual a 1/e ≈ 0,37 del valor inicial I0.
Fig. 21.8. Cuando una onda se propaga en un medio absorbente se atenúa, exponencialmente, con la distancia recorrida.
La absorción (o la dispersión) tiene un origen microscópico relacionado con las características de la interacción entre la onda incidente y los constituyentes (átomos y moléculas) del medio de propagación, por lo que el coeficiente de absorción (extinción) es proporcional a la concentración de elementos absorbentes (dispersores). α =σ n
(21.17)
donde n representa el número de centros absorbentes (dispersores) por unidad de volumen y σ una magnitud característica de la eficiencia del proceso microscópico que origina la absorción (dispersión), con dimensiones de superficie, que se denomina sección eficaz.
[σ ] =
[α=] [n]
L−1 = L2 L−3
Tanto la absorción como la dispersión son, en general, fuertemente dependientes de la frecuencia (longitud de onda): α = α (ν), σ = σ (ν). La absorción de luz, en particular, está relacionada con transiciones electrónicas en los átomos y moléculas del medio de propagación, dando lugar a “bandas de absorción” características. La figura 21.9 muestra la sección eficaz de absorción de
Ondas: luz y sonido
219
ondas electromagnéticas por la molécula de ozono, que presenta un máximo pronunciado para valores de longitud de onda comprendidos entre 200 nm y 300 nm, correspondiente a la región ultravioleta. De ahí que la presencia de dichas moléculas en la atmósfera terrestre dé lugar a la absorción de la mayor parte de la fracción de luz solar emitida en este rango espectral, llegando muy atenuada a la superficie terrestre.
Fig. 21.9. Sección eficaz de absorción del ozono en función de la longitud de onda.
En el caso particular de la luz solar, además de esta intensa absorción debida al ozono, otras moléculas presentes en la atmósfera dan lugar a absorciones en diferentes regiones del espectro visible, con lo que el espectro solar en la superficie terrestre, comparado con el espectro solar medido fuera de la atmósfera, muestra una pérdida de energía en dichas longitudes de onda (fig. 21.10).
Fig. 21.10. Espectro solar, antes y después de atravesar la atmósfera. Este último presenta varias “bandas de absorción” características de diferentes componentes atmosféricos.
220
Fundamentos físicos de los procesos biológicos
Observación. Cielo azul, atardecer rojo y nubes blancas. Además de los procesos de absorción, la dispersión de la luz solar en la atmósfera da lugar a distintos fenómenos, con una notable gama de colores. La luz dispersada por la atmósfera aparece azul durante el día, mientras que los atardeceres adquieren coloración rojiza. Por su parte, las nubes aparecen blancas. Toda esta variedad de colores puede ser comprendida considerando la depen dencia de la sección eficaz de dispersión de la luz solar con la frecuencia (longitud de onda). Cuando se observa el cielo, y su coloración azul, se está viendo la luz solar dispersada por los componentes atmosféricos, moléculas de nitró geno y oxígeno principalmente, que son de menor tamaño que la longitud de onda promedio de la luz (<λ> ≈ 0,5 μm). (Una interpretación más rigu rosa de los fenómenos de la dispersión atmosférica considera como cen tros de dispersión pequeñas fluctuaciones de densidad en la atmósfera, en lugar de las moléculas individuales). Este proceso se denomina “disper sión Rayleigh” y se caracteriza por una dirección de dispersión aproxi madamente isótropa (fig. 21.11) y una fuerte dependencia de la intensidad dispersada IRayleigh con la longitud de onda (inversamente proporcional a su cuarta potencia): I Rayleigh ∝
1 λ4
(21.18)
Como el azul corresponde a la región de longitud de onda corta del espectro visible (λ ≈ 0,4 μm), su dispersión resulta mucho más eficiente que la de la luz roja, correspondiente a longitudes de onda más largas (λ ≈ 0,7 μm): I Rayleigh ( azul ) I Rayleigh ( rojo )
(1 λazul ) =
(1 λ ) rojo
4 4
4
0, 7 = = 9, 4 0, 4
Es decir, la eficiencia de la dispersión Rayleigh es casi un factor 10 más efectiva para la luz azul que para la luz roja y, por ello, la luz dispersada, que es la que observamos cuando miramos “el cielo”, se percibe enriquecida en componentes azules. A su vez, cuando se observa luz que ha atravesado un espesor grande de aire, como sucede en los atardeceres, la luz que atraviesa la atmósfera se ve “enrojecida”, por la desaparición de las componentes azules. Sin embargo, cuando las partículas dispersoras son de tamaño superior al de la longitud de onda de la luz, el proceso de dispersión es diferente, conociéndose como “dispersión Mie”. Su eficiencia resulta ser básicamente
Ondas: luz y sonido
221
independiente de la longitud de onda, y la luz dispersada lo hace prefe rentemente hacia adelante (fig. 21.11). Ésta es la situación que se produce cuando la luz es dispersada por partículas de tamaño relativamente grande, tales como pequeñas gotas de agua (nubes o niebla), y por tanto su colora ción es blanca.
Fig. 21.11. Las características de la dispersión de la luz solar dependen del tamaño de los centros dispersores, dando lugar a diferentes coloraciones.
Observación. Absorción de los mares: efecto sobre la fotosíntesis. Cuando la luz solar atraviesa la atmósfera y llega a la superficie terrestre, se encuentra principalmente agua, ya que aproximadamente el 70 % de la superficie terrestre está cubierta por los mares. Y aunque uno tendería a pensar que el agua es transparente, la presencia de multitud de compo nentes disueltos o en suspensión provoca una fuerte atenuación de la luz solar, que apenas alcanza una mínima fracción del espesor (profundidad) de los mares. La figura 22.12 presenta la profundidad de penetración de la luz solar en función de la longitud de onda, entendiéndose por tal la profundidad donde la intensidad es igual al 1 % de la intensidad en la superficie. La curva inferior corresponde a aguas claras del océano Atlántico, mientras la curva superior corresponde a aguas costeras, donde existe una mayor atenuación. La profundidad de penetración define aproximadamente la zona en que es posible mantener la fotosíntesis (zona fotópica) y que, como puede verse, apenas supera el centenar de metros.
222
Fundamentos físicos de los procesos biológicos
Fig. 21.12. Profundidad de penetración de la luz solar en aguas oceánicas, en función de la longitud de onda. La curva inferior corresponde a aguas claras, alejadas de la costa, mientras la curva superior corresponde a aguas costeras, donde existe una mayor atenuación. La profundidad de penetración define aproximadamente la zona en que es posible mantener la fotosíntesis y que, como puede verse, apenas alcanza el centenar de metros.
21.3.5 Ondas no armónicas: análisis de Fourier Las ondas armónicas son un caso particularmente sencillo de ondas, pero, en general, las ondas que se encuentran habitualmente a nuestro alrededor no son ondas armónicas. Así, la figura 21.13 representa una serie de ondas de presión. Concretamente, corresponden a las ondas asociadas con la nota “la” central emitida por dos instrumentos musicales diferentes. Como puede observarse, ambos casos corresponden a la propagación de una onda periódica, de periodo T = 2,27 ms, lo que corresponde a una frecuencia f = 440 Hz. Sin embargo, a pesar de tener la misma frecuencia, la forma de las ondas emitidas por los distintos instrumentos es completamente diferente y ninguna de ellas armónica.
223
Ondas: luz y sonido
Fig. 21.13. Ondas acústicas no armónicas, correspondientes a las ondas asociadas con la nota “la” central, emitidas por diferentes instrumentos musicales. El periodo es T = 2,27 ms, que corresponde a una frecuencia f = 440 Hz.
Sin embargo, a pesar de su complejidad, estas ondas pueden ser descritas como suma de funciones armónicas, eligiendo convenientemente su frecuencia, amplitud y fase. Este hecho es la base del llamado análisis de Fourier, debido al matemático y físico francés J. Fourier (1768-1830), según el cual si y(t) es una función periódica de periodo T (y frecuencia f = 1/T), puede expresarse como suma de funciones armónicas: (21.19) siendo la primera componente de frecuencia igual a la frecuencia característica de la función, ω (frecuencia fundamental): ω1= ω= 2π f =
2π T
(21.20)
y las restantes componentes, que se denominan armónicos, tienen la frecuencia múltiplo entero de la fundamental: ωn = nω
(21.21)
La amplitud An y fase φn de cada armónico pueden ser calculadas, para cualquier función periódica y(t), mediante las técnicas matemáticas conocidas como análisis de Fourier, que pueden encontrarse en textos de Física o Matemáticas más avanzados. Aquí nos limitaremos a ilustrar este procedimiento, de forma gráfica, para un ejemplo concreto.
224
Fundamentos físicos de los procesos biológicos
En la figura 21.14 se muestra cómo al sumar un cierto número de armónicos se puede obtener una función aproximadamente cuadrada, de frecuencia ω (parte superior de la figura). En la figura se han sumado solo cuatro armónicos: el fundamental (frecuencia ω1 = ω) y los tres primeros armónicos de orden impar: ωn = 3ω, 5ω y 7ω, cada uno con amplitud diferente, con los que ya se obtiene una aproximación aceptable, aunque, de acuerdo con la ecuación (21.19), cuantos más armónicos se incluyan en la suma indicada, más se aproximará el resultado a la forma de la función deseada.
Fig. 21.14. Primeros armónicos del análisis de Fourier de una onda cuadrada. En la figura se representan los cuatro primeros armónicos de orden impar: ωn = ω, 3ω, 5ω y 7ω, cuya suma (parte superior) proporciona ya una aproximación aceptable a la “onda cuadrada”.
Si se realizase el análisis de Fourier correspondiente a las ondas acústicas representadas en la figura 21.13 (lo que excede los objetivos de este texto), se podría comprobar que las amplitudes y fases que se deberían sumar para cada instrumento serían diferentes. Aunque la nota interpretada por todos los instrumentos tiene el mismo tono (frecuencia fundamental), la diferente mezcla de armónicos, con diferentes amplitudes (energías) en cada uno de ellos, hace que los instrumentos suenen con diferente cualidad de sonido o timbre. En el ejemplo anterior se ha utilizado una función de una sola variable, pero el procedimiento se generaliza fácilmente al caso de ondas cualesquiera
Ondas: luz y sonido
225
(funciones del tiempo y de la posición), expresando el teorema de Fourier como suma de ondas armónicas: (21.22) donde kn= 2π/λn = ωn/v, siendo v la velocidad de propagación de las ondas. Indiquemos por último que, aunque más difícil matemáticamente, también puede utilizarse el método de Fourier para describir la propagación de ondas más complejas, incluyendo ondas no-periódicas, como por ejemplo la propagación de un único pulso, aunque en este caso la suma indicada por la ecuación (21.22) debe transformarse en una integral, extendida a un conjunto de frecuencias continuas, denominada integral de Fourier.
21.4 Luz y sonido Entre la enorme variedad de fenómenos ondulatorios que tienen lugar en la naturaleza hay dos con los que estamos familiarizados, ya que tenemos órganos específicos para su recepción. Nos referimos a la luz y al sonido. Comenzaremos con una primera descripción sobre su naturaleza y características para poder apoyarnos en ellos en nuestro análisis posterior de propiedades específicas de algunos fenómenos ondulatorios, tales como la reflexión y refracción o la interferencia y difracción. Luz y sonido se distinguen no solo por el proceso físico involucrado (campos electromagnéticos o presión del aire), sino también por la magnitud de parámetros tales como la frecuencia, velocidad de propagación y, consecuentemente, longitud de onda, que, como veremos, son muy diferentes. Esto hace que las propiedades de la luz y el sonido parezcan, en algunas ocasiones, muy diferentes, aunque, en realidad, existan muchas similitudes debido a su común carácter ondulatorio.
21.4.1 Sonido Naturaleza del sonido Cuando un cuerpo vibra (la membrana de un altavoz, la cuerda de una guitarra) produce el desplazamiento de las moléculas de aire próximas a él, que a su vez chocan con las moléculas vecinas y éstas con las suyas. Esto provoca cambios en la densidad y presión del aire, que se propagan como una onda longitudinal que constituye una onda acústica (fig. 21.15).
226
Fundamentos físicos de los procesos biológicos
Fig. 21.15. El desplazamiento de las moléculas respecto a sus posiciones de equilibrio da lugar a compresiones y rarefacciones del aire, provocando cambios de densidad y presión, cuya propagación constituye una onda acústica.
Frecuencias características El sonido propiamente dicho es la sensación fisiológica que producen las ondas acústicas. Esta sensación se percibe cuando las ondas acústicas tienen frecuencias dentro de un cierto rango, que se extiende entre 20 Hz y 20.000 Hz aproximadamente. Ondas de presión similares, pero de frecuencias superiores reciben la denominación de ultrasonidos, mientras que aquellas de frecuencias inferiores se denominan infrasonidos. Ésta es una clasificación totalmente antropocéntrica, ya que muchos animales son capaces de percibir ultrasonidos (fig. 21.16). Incluso a escala humana hay diferencias notables de percepción acústica entre distintos individuos. Así, el rango de frecuencias audibles se reduce con la edad, afectando principalmente al límite superior de frecuencias: un niño puede alcanzar el límite de los 20.000 Hz pero a los 20 años el límite superior de frecuencias audibles puede haber caído hasta los 16.000 Hz, reduciéndose hasta los 8.000 Hz a los 60 años. Esta reducción en el límite de frecuencias audibles con la edad suele estar acompañada de una reducción de la sensibilidad a todas las frecuencias.
227
Ondas: luz y sonido
Fig. 21.16. Frecuencias máximas audibles por el hombre y algunos animales.
Intensidad: sensibilidad y nivel de intensidad sonora Como hemos indicado, el sonido corresponde a una onda de presión que supondremos, para simplificar, armónica. = p ( x, t ) p0 sen ( k x − ω t )
(21.23)
pudiendo demostrarse que la amplitud es: p0 = ρ ω v ∆x0
(21.24)
siendo ρ la densidad del aire, v la velocidad de propagación y ∆x0 la amplitud máxima del desplazamiento de las moléculas del aire. La intensidad de una onda acústica está relacionada con dicha presión máxima p0, con la densidad del medio ρ y con la velocidad de propagación v, pudiendo demostrarse que la intensidad es: I=
1 p02 2 ρv
(21.25)
El oído humano es capaz de responder a ondas acústicas con un amplísimo rango de valores de intensidad I (o presión po), que pueden variar en 12 órdenes de magnitud, lo que da lugar a la adopción de un sistema de unidades de tipo logarítmico (decibelios), como veremos más adelante. El valor de la intensidad umbral de audición, o intensidad mínima para ser percibida, depende fuertemente de la frecuencia, tal como puede verse en la figura 21.17. El umbral mínimo se produce para frecuencias entre 2 y 4 kHz, para las que el oído es especialmente sensible, incrementándose tanto hacia
228
Fundamentos físicos de los procesos biológicos
altas como hacia bajas frecuencias. Puede comprobarse en la figura que para que un sonido de 100 Hz sea detectado ha de tener una intensidad 1.000 veces superior aproximadamente que si su frecuencia fuese de 1.000 Hz.
Fig. 21.17. El rango de frecuencias audibles por el hombre se extiende típicamente entre 20 Hz y 20 kHz. La sensibilidad es máxima para sonidos de frecuencia en torno a 2-4 kHz, donde se detectan variaciones de presión inferiores a 20 μPa o intensidades de 10 –12 W m–2, que se toma como referencia para la escala de sonoridad (dB).
Aunque nuestra descripción intenta dar cuenta de las propiedades físicas subyacentes, es hora de recordar que el sonido corresponde a una percepción y por tanto depende de la “interpretación” que el cerebro hace de las ondas acústicas. Por ello se utiliza el concepto de sensación sonora o sonoridad β para describir la sensación psicológica de nivel de intensidad sonora. Aunque hay una relación directa entre la intensidad del sonido y la percepción de sonoridad, esta relación no es lineal, sino que el incremento de la sensación sonora ∆β es proporcional al incremento relativo de la intensidad, es decir, considerando incrementos infinitesimales: dβ =
dI I
y por lo tanto: I β = k log I0
donde k es una constante de proporcionalidad e I0 una intensidad de referencia. Se conviene en tomar como intensidad de referencia I0 un valor igual al umbral de audición (I0 = 10 –12 W m–2) y adoptar el valor k = 10, con lo que el nivel de sonoridad (β) de una onda acústica de intensidad I se expresa en decibelios (dB) como:
229
Ondas: luz y sonido
I β ( dB= ) 10 × log I0
(21.26)
lo que equivale a fijar el cero en la escala de sonoridad a la intensidad de una onda acústica coincidente con el valor umbral de audición (I0 = 10 –12 W m–2): βua= 10 × log ( I 0 I 0 = ) 10 × log (1) = 0 dB
Observación. Umbral de audición y umbral de dolor. La máxima sensibi lidad define el umbral de audición o intensidad mínima para ser percibida, lo que en el ser humano se produce para frecuencias entre 2 y 4 kHz, siendo el oído capaz de detectar intensidades del orden de I0 = 10–12 W m–2, que, como se ha dicho, se toma como intensidad de referencia. Veamos cuál es el valor de las variaciones de presión correspondiente a esta intensidad sonora. Teniendo en cuenta que la densidad y la velocidad de propagación del sonido (véase sección siguiente) en aire son ρ ≈ 1,3 kg m–3 y v ≈ 340 m s–1, sustituyendo en la ecuación (21.25), se obtiene: = p0
= 2I ρ v
2 × 10−12 × 1, 3 × 340 ≈ 3 × 10−5 Pa
Nótese que esta presión, que representa las compresiones y rarefacciones del aire, se superpone a la presión atmosférica: 1 atm = 101 kPa, es decir, el oído es capaz de discriminar variaciones relativas de: p0 3 × 10−5 ≈ ≈ 3 × 10−10 1 atm 101 × 103
También podemos calcular, a partir de la ecuación (21.24), la amplitud de los desplazamientos asociados a esta variación de presión: ∆x0 =
p0 3 × 10−5 = ≈ 7 × 10−12 m ρ ω v 1 × 2π × 2.000 × 340
es decir, se trata de desplazamientos del orden de las dimensiones atómicas. A partir de una cierta intensidad las ondas sonoras dan lugar a una sensa ción dolorosa. Dicha intensidad, conocida como umbral de dolor, es aproxi madamente independiente de la frecuencia y tiene un valor de I ≈ 1 W m–2. En este caso, las variaciones de presión tienen un valor:
( p= 0 ) dolor
= 2I ρ v
2 × 1 × 1 × 340 ≈ 26 Pa
valores que, de nuevo, se superponen a la presión atmosférica.
230
Fundamentos físicos de los procesos biológicos
Por su parte, la sonoridad correspondiente al umbral de dolor βud resulta ser: 1 12 βud= 10 × log −12 = 10 × log (10 ) = 120 dB 10
La tabla 21.2 indica diferentes niveles de sonoridad y su relación con fenómenos cotidianos. Tabla 21.2 Sonoridades en la vida cotidiana β (dB) –20 0 10 20 30 40 50 60 70 80 90 100 110 120
Fuente Movimiento browniano del aire (sin viento) Umbral de audición Respiración normal Rumor de hojas Cuchicheo Voz normal Ventilador Conversación normal Tráfico denso Radio/TV volumen alto Motocicleta Concierto rock Sirena de ambulancia Umbral de dolor
Velocidad de propagación del sonido Como hemos indicado, las ondas acústicas están relacionadas con los cambios de densidad y presión que se producen en el medio transmisor, debido a la vibración de sus moléculas. Por tanto, su velocidad de propagación ha de depender de las propiedades del medio, tanto de su densidad como de la relación entre las variaciones de presión y densidad (o volumen). Esta última está descrita por el módulo de compresibilidad (en el caso de fluidos) o el módulo de Young (para sólidos), tal como se ha visto en el capítulo 16. De hecho, se puede demostrar que la velocidad de propagación de las ondas acústicas es: v=
B ρ
(21.27)
donde ρ es la densidad y B representaría el módulo de compresibilidad, en el caso de los fluidos, y el módulo de Young, para los materiales sólidos.
231
Ondas: luz y sonido
i) Aire En el caso del sonido propiamente dicho, la propagación se produce en el aire, que puede ser tratado adecuadamente como un gas ideal, y utilizar para su descripción las ecuaciones estudiadas en los capítulos 8 y 9. En particular, las compresiones y dilataciones que se producen durante la propagación del sonido son suficientemente rápidas como para que no se produzca transfe rencia de calor y, por tanto, su descripción puede hacerse a partir de las ecuaciones correspondientes a las transformaciones adiabáticas allí estudiadas. A partir de ellas, se demuestra que la velocidad del sonido en el aire es: v= sonido
Bad = ρ
γ RT 1, 4 × 8, 314 × T = ≈ 20, 05 T M 28, 95 × 10−3
(21.28)
donde γ = C p CV es el coeficiente adiabático, R = 8, 314 J mol −1 K −1 la constante de los gases y M la masa molecular del gas, cuyos valores se han sustituido considerando el aire como un gas ideal diatómico (γ = 1,4), de masa molecular promedio M ≈ 28,95 × 10 –3 kg/mol. A temperatura ambiente (T ≈ 20 ºC = 293 K) se obtiene: vsonido ≈ 20, 05 × 293 ≈ 340 ms −1
ii) Agua Las ondas acústicas se propagan también en los líquidos y en particular en el agua. Teniendo en cuenta que los seres vivos están constituidos en una gran parte por agua, la velocidad de propagación de ondas acústicas a través de tejidos orgánicos (con importantes aplicaciones en medicina, como veremos más adelante) viene determinada por las propiedades de propagación “en agua”. Por otra parte, son muchos los animales que viven en un medio acuoso, donde las ondas acústicas proporcionan información totalmente similar a la que el sonido proporciona a los animales terrestres. Sustituyendo, en la ecuación 21.27, las magnitudes físicas del agua, cuya densidad y módulo de compresibilidad son ρ agua = 103 kg m −3 y= B 2, 25 × 109 N m −2, se obtiene: vsonido =
B = ρ
2, 25 × 109 = 1.500 ms −1 3 10
es decir, cerca de 5 veces la velocidad en aire. En la sangre y tejidos orgánicos blandos, la densidad y módulo de compresibilidad son muy parecidos, siendo la velocidad de propagación del sonido solo ligeramente superior: vsonido ≈ 1.570 ms −1.
232
Fundamentos físicos de los procesos biológicos
iii) Sólidos Debido a la mayor fuerza de ligadura entre sus moléculas, la propagación de las ondas acústicas se realiza con mayor facilidad en sólidos que en líquidos o gases. No sólo lo hacen con menor atenuación, sino que la velocidad de propagación es claramente superior. En la tabla 21.3 se resumen los valores correspondientes a algunos materiales sólidos Tabla 21.3 Velocidad del sonido en algunos materiales sólidos Material
Densidad, ρ (ms –1)
Aluminio Hierro Hueso
2,7 × 103 7,9 × 103 1,9 × 103
Módulo de Young, E (Nm–2) 7 × 1010 20 × 1010 2 × 1010
Velocidad (ms –1) 5.092 5.032 3.200
Sin embargo, la descripción anterior es solo aproximada. En un sólido cristalino las propiedades elásticas dependen de la dirección cristalográfica, y, por tanto, también la velocidad de propagación de las ondas acústicas depende de la dirección. En un material macroscópico, formado en general por muestras policristalinas, la velocidad medida es un promedio de las que corresponden a las diferentes orientaciones. Además, como se ha indicado con anterioridad (sección 21.2) y a diferencia de con los fluidos, en los materiales sólidos pueden transmitirse también ondas transversales. La velocidad de propagación de las ondas transversales vT es inferior a la velocidad de las ondas longitudinales vL, como puede comprobarse con algunos valores experimentales recogidos en la tabla 21.4. Tabla 21.4 Comparación entre las velocidades de propagación de ondas acústicas longitudinales vL y transversales vT en algunos sólidos Material
Ondas longitudinales vL (ms –1)
Ondas transversales vT (ms –1)
Aluminio Hierro Corteza terrestre (ondas sísmicas)
6.420 5.790 3.500
3.040 3.100 1.400
Observación. Sonidos de origen fisiológico: aplicación en medicina. Muchas de las actividades del cuerpo humano producen ondas acústicas, en su mayor parte de baja frecuencia, que transmiten información sobre los pro cesos y órganos que originan dichas ondas. La auscultación o escucha de los sonidos de origen fisiológico constituye un método de diagnóstico utilizado habitualmente y el estetoscopio, que actúa como amplificador de las ondas acústicas y es utilizado para facilitar la auscultación, constituye probable mente el icono más emblemático de la medicina.
233
Ondas: luz y sonido
La mayoría de los sonidos fisiológicos producidos por nuestro propio cuerpo se transmiten al oído a través de los huesos y del resto del organismo, lo que hace que se detecten con poca eficiencia, ya que el oído está optimizado para la detección de sonidos por cambios de presión en el tímpano. Hace falta un sonido unos 40 dB más intenso para ser detectado por transmisión a través del cuerpo que para su detección cuando llega por el aire. Además, la frecuencia de estas ondas se encuentra en el margen más bajo dentro de las frecuencias audibles por el ser humano. Los sonidos producidos por el corazón suelen ser de frecuencia inferior a los 100 Hz, y los asociados con los pulmones (para cuya detección se emplea habitualmente el estetoscopio) corresponden a frecuencias comprendidas entre 100 Hz y 1.000 Hz, siempre por debajo de las frecuencias de máxima sensibilidad del oído humano. Si el oído fuese tan sensible a bajas frecuencias como lo es a 3.000 Hz, percibiríamos seguramente muchos ruidos fisiológicos, que nos indicarían la incesante actividad de nuestro organismo, asociados a fenómenos tales como el flujo de la sangre en las arterias, la aper tura y cierre de las válvulas cardiacas, el movimiento de las articulaciones o la entrada de aire a los pulmones. Observación. Ultrasonidos. Aparte de los sonidos naturales, también se uti lizan en medicina técnicas de diagnóstico basadas en ultrasonidos. Como hemos dicho anteriormente, los ultrasonidos corresponden a ondas acústicas de frecuencia superior al valor máximo audible por los seres humanos: f > 20.000 Hz. Pueden ser producidos por transductores piezoeléctricos (mate riales donde un campo eléctrico variable provoca la oscilación del material, lo que da lugar a una onda acústica), generándose con facilidad ultrasonidos de frecuencias del orden de los MHz. Los ultrasonidos se propagan con relativa facilidad a través de los dife rentes tejidos orgánicos, aunque su intensidad disminuye exponencialmente con la distancia recorrida (ec. 21.16), siendo el coeficiente de absorción, α, diferente para cada tipo de tejido, tal como se puede observar en la tabla 21.5. Tabla 21.5 Propiedades acústicas de algunos tejidos orgánicos a frecuencias ultrasónicas (f ≈ 1 MHz) Material Aire Agua Cerebro Músculo Grasa Hueso
Densidad ρ(kg m–3) 1,3 1 × 103 1,02 × 103 1,04 × 103 0,92 × 103 1,9 × 103
Velocidad de propagación v(m s –1) 330 1.480 1.530 1.580 1.450 4.000
Coeficiente de absorción α (cm–1) ≈0 5 × 10 ‒4 0,2 0,26 0,1 2,6
234
Fundamentos físicos de los procesos biológicos
Como cualquier onda (véase la sección 21.5), los ultrasonidos se reflejan parcialmente al cambiar de un medio de propagación a otro. Por tanto, si se envía un pulso ultrasónico a través del organismo, sufrirá una reflexión parcial al pasar de un tejido a otro, dando lugar a un “eco” que puede ser detectado externamente por medio de otro detector piezoacústico (donde, ahora, la onda acústica genera una señal eléctrica, que se envía a un osci loscopio u otro medio de registro). Mediante dicho procedimiento se puede obtener información de los tejidos por los que han pasado los ultrasonidos y, a partir de ella, reconstruir una imagen del organismo, lo que constituye una ecografía (fig. 21.18). En las aplicaciones típicas, la energía utilizada es muy baja (valores medios de unos pocos mW/cm2), lo que resulta inocuo para el organismo, permitiendo incluso el examen del feto durante la etapa de gesta ción, en la que el uso de técnicas basadas en rayos X resultaría peligroso. Aparte de las aplicaciones en técnicas conducentes a la obtención de imá genes (ecografías), los ultrasonidos pueden utilizarse también, aumentando su energía, para proporcionar calor (energía) a los tejidos absorbentes (por ejemplo, huesos y articulaciones, donde el coeficiente de absorción es ele vado) o incluso para provocar la ruptura mecánica y la destrucción selectiva de algunas estructuras o tejidos orgánicos, para lo que se utilizan densidades de potencia del orden de 103 W/cm2. Adicionalmente a las aplicaciones médicas, las técnicas de tipo “eco gráfico” son utilizadas para la localización por algunos animales (murcié lagos, delfines) o, artificialmente, por el hombre, mediante el SONAR (SOund NAvigation and Ranging) o localización y navegación mediante el sonido. Como se verá en la sección 21.7, el tamaño menor de un objeto localizable mediante una onda (acústica u óptica) no puede ser inferior a su longitud de onda: λ = ν/f. Para aumentar la resolución se ha de disminuir λ, por lo que interesa uti lizar frecuencias lo más altas que sea posible, en el caso acústico, ultrasonidos. Los murciélagos, por ejemplo, son capaces de emitir sonidos de frecuencia f ≈ 120 kHz, que corresponde a una longitud de onda λ = 340/1,2 × 105 ≈ 3 mm, que constituye, por tanto, el límite de tamaño accesible para su resolución.
Ondas: luz y sonido
235
Fig. 21.18. Ecografía de: 1.-Hígado (lóbulo hepático derecho) y riñón derecho normales 2.- Hígado (lóbulo hepático izquierdo). Páncreas. Vena esplénica. Arteria mesentérica superior (corte transversal). Aorta y vena cava (corte transversal) 3.- Hígado (lóbulo hepático derecho). Vesícula biliar. Vena porta. Vena cava inferior. 4.- Bazo y riñón izquierdo (Imágenes cortesía de los doctores José María Segura y José Manuel Suárez de Parga, del Hospital Universitario La Paz, UAM).
21.4.2 Luz Naturaleza Como indicamos en el capítulo 20, las leyes del electromagnetismo conducen a una interrelación estrecha entre campos eléctricos y magnéticos, siendo una de las consecuencias más importantes de esta relación la existencia de ondas electromagnéticas. Las ondas electromagnéticas se producen cuando se aceleran cargas eléctricas, o se tienen intensidades de corriente variables en el tiempo, por ejemplo a partir del campo creado por un dipolo eléctrico oscilante (fig. 21.19).
236
Fundamentos físicos de los procesos biológicos
Fig. 21.19. Representación esquemática de las líneas de campo eléctrico correspondientes a la radiación de un dipolo oscilante.
Un dipolo eléctrico estático crea un campo eléctrico como el de la figura 21.19.a. Las líneas de campo salen de la carga positiva y entran hacia la carga negativa, dando lugar a una distribución de campo bien conocida (capítulo 18). Si el dipolo no permanece estático, sino que las cargas oscilan, juntándose y separándose, la forma de las líneas de campo ha de cambiar para adaptarse a la posición de las cargas en cada instante (figura 21.19 b y c). Es decir, se produce un campo eléctrico variable, dando lugar a oscilaciones (máximos y mínimos) en el tiempo. Tal como hemos visto en el capítulo 20, un campo eléctrico variable implica la existencia de un campo magnético asociado, variable también en el tiempo. Ambos campos se propagan en el espacio constituyendo una onda electromagnética (fig. 21.19.d). Este tipo de emisión se produce, por ejemplo, en las antenas, donde, mediante un circuito eléctrico adecuado, se consigue la oscilación de cargas entre sus extremos, dando lugar a un dipolo eléctrico oscilante. Velocidad de propagación A partir de las ecuaciones del electromagnetismo (capítulo 20) se demuestra que la velocidad de propagación de la luz (de las ondas electromagnéticas, en general), en el vacío, es: = c
1 = 2, 99792458 × 108 ms −1 ≈ 3 × 108 ms −1 ε 0 µ0
(21.29)
donde ε0 y µ0 son la permitividad dieléctrica y la permeabilidad magnética del vacío.
237
Ondas: luz y sonido
Si las ondas electromagnéticas se propagan en un medio diferente del vacío, la velocidad de propagación puede obtenerse sustituyendo los valores de la permitividad dieléctrica y permeabilidad magnética del vacío por los correspondientes al material en que se propague la luz. v=
1
(21.30)
εµ
El cociente entre la velocidad de propagación en el vacío y en dicho medio recibe el nombre de índice de refracción (n), que, a partir de la ecs. (21.29) y (21.30), se puede expresar como: n=
c 1 ε 0 µ0 = = v 1 εµ
ε µ ε ≈ = κ ε 0 µ0 ε0
(21.31)
donde se ha hecho uso del hecho de que la permeabilidad magnética de casi todos los materiales tiene valores muy parecidos a la del vacío (µ/µ0 ≈ 1) y donde κ = ε ε 0 representa la constante dieléctrica del medio en que se propaga la luz. Teniendo en cuenta que la constante dieléctrica κ de cualquier material es siempre superior a la unidad (capítulo 17), el índice de refracción es siempre mayor que la unidad y la velocidad de propagación de la luz en un medio material diferente del vacío es siempre inferior a c. En la tabla 21.6 se presentan los valores del índice de refracción y la velocidad de propagación en el material en algunos materiales transparentes. Tabla 21.6 Índice de refracción y velocidad de propagación de las ondas electromagnéticas en algunos materiales transparentes Material
Índice de refracción
Vacío Aire Agua Vidrio Diamante
1 1,0003 1,33 ≈ 1,5 2,4
Velocidad de propagación, v = c/n (km/s) ≈ 300.000 ≈ 300.000 ≈ 225.000 ≈ 200.000 ≈ 125.000
La constante dieléctrica de un material está relacionada con su respuesta a un campo eléctrico (capítulo 17) y, en el caso de las ondas electromagnéticas, donde los campos son variables en el tiempo, depende de cuál sea la frecuencia de la onda: κ = κ ( f ). En consecuencia, la velocidad de propagación de la luz en un medio material y el índice de refracción dependen de la frecuencia, lo que da lugar al fenómeno de la dispersión, del que volveremos a hablar al estudiar la refracción de la luz.
238
Fundamentos físicos de los procesos biológicos
Si la velocidad de propagación de una onda depende del material también lo hace la longitud de onda (no la frecuencia, que es una magnitud que depende de las características del emisor), siendo necesario distinguir entre la longitud de onda en el vacío λ0 y la longitud de onda λ en el material. Ambas están relacionadas por: λ=
v c n c f λ0 = = = n n f f
(21.32)
es decir, la longitud de onda en un medio de índice de refracción n es igual al cociente entre el valor de la longitud de onda en el vacío y el índice de refracción del medio. Por tanto, es siempre inferior a su valor en el vacío. Intensidad de las ondas electromagnéticas El dipolo oscilante (y cualquier carga acelerada) irradia energía que es transportada por la onda electromagnética. Al igual que sucede con otras ondas, la energía de la onda está relacionada con la amplitud, en este caso con las amplitudes de los campos eléctrico y magnético de la onda. A partir de las ecuaciones del electromagnetismo se demuestra que la intensidad (energía por unidad de tiempo y unidad de área perpendicular a la dirección de propagación) es proporcional al cuadrado de la amplitud del campo eléctrico E0: I = α c ε 0 E02
(21.33)
donde c representa la velocidad de la luz, ε0 la permitividad dieléctrica del vacío y α un coeficiente, del orden de la unidad, que depende del estado de polarización de la luz (α = ½ para luz linealmente polarizada y α = 1 para luz circularmente polarizada o para luz natural no-polarizada). Se asocian la energía y los efectos que la luz tiene sobre muchas sustancias, tales como las reacciones fotoquímicas que provoca (fotosíntesis, eritema o enrojecimiento de la piel, activación de los fotopigmentos de la retina, etc.), con la energía del campo eléctrico de la onda. Sin embargo, como se verá en el capítulo 23, la descripción de la interacción de las ondas electromagnéticas con la materia necesita, en la mayoría de los casos, acudir a una descripción basada en la mecánica cuántica donde se pone de manifiesto el carácter discreto (cuantificado) de la energía de las ondas. Según esta descripción, las ondas electromagnéticas equivaldrían a un flujo de fotones o “cuantos” de energía. La energía E de cada fotón es proporcional a la frecuencia f de la onda: = E h= f
hc λ
(21.34)
Ondas: luz y sonido
239
siendo la constante de proporcionalidad: h = 6,63 × 10 ‒34 J s (constante de Planck). Espectro electromagnético La frecuencia de oscilación de las cargas determina la frecuencia de la onda electromagnética, que puede tomar valores con un rango de variación enorme, lo que constituye el espectro electromagnético. En la figura 21.20 se esquematiza este espectro electromagnético, indicando los diferentes grupos de ondas electromagnéticas en que se clasifica, dependiendo del intervalo de frecuencias, así como la longitud de onda y la energía de los fotones correspondientes. También se incluye una indicación del proceso físico implicado en su generación y detección.
Fig. 21.20. Espectro electromagnético, indicando los diferentes rangos en que se clasifica, dependiendo del intervalo de frecuencias o longitudes de onda. También se incluye una indicación del proceso físico implicado en su generación y detección.
Como puede verse en la figura, la frecuencia f de las ondas electromagnéticas puede variar desde unos pocos hercios hasta frecuencias tan altas como 1022 Hz (rayos γ). El rango de variación en frecuencias se traduce automáticamente en un rango igual de amplio para las longitudes de onda (λ = c/ f), que varían desde dimensiones del orden del núcleo atómico para rayos γ, hasta longitudes
240
Fundamentos físicos de los procesos biológicos
de cientos de kilómetros, para las ondas de radio, y mayores aún para las frecuencias más bajas. Estas diferencias en longitud de onda tienen importancia decisiva en las propiedades de propagación, en relación con la existencia (o no) de fenómenos de difracción (que estudiaremos en la sección 21.7) que se producen cuando las ondas encuentran obstáculos de dimensiones comparables a su longitud de onda. Las ondas electromagnéticas se clasifican, tal como se especifica en la figura 21.20, en intervalos de frecuencias que se denominan, de menor a mayor frecuencia: radiofrecuencia, microondas, infrarrojo, visible, ultravioleta, rayos X y rayos γ, cuyas características revisamos seguidamente. Radiofrecuencia Las ondas de radiofrecuencia ocupan el rango de frecuencias más bajas, extendiéndose hasta aproximadamente 1 GHz = 109 Hz. Son las utilizadas para transmitir información por las emisoras de radio y TV, y son producidas (y detectadas) por circuitos eléctricos macroscópicos, como las antenas. Dentro de las emisiones de TV podemos mencionar las realizadas en UHF (Ultra High Frequency) de frecuencia comprendida entre 300 MHz y 3 GHz (0,1 m < λ < 1 m) y en VHF (Very High Frequency), cuya frecuencia se encuentra entre 30 MHz y 300 MHz (1 m < λ < 10 m). Por lo que se refiere a las radiofrecuencias utilizadas en la radio, las emisiones en AM (modulación de amplitud) se realizan con frecuencias entre 0,5 MHz y 1 MHz (300 m < λ < 600 m), mientras las utilizadas para las emisiones de radio FM (frecuencia modulada) se hacen a frecuencias próximas a 100 MHz (λ ≈ 3 m). Microondas Las microondas son ondas electromagnéticas de longitud de onda desde décimas de milímetro hasta unos pocos centímetros. En esta región se encuentran las ondas de RADAR (RAdio Detection And Ranging), cuya utilización viene favorecida por el hecho de que la troposfera es transparente a las ondas electromagnéticas de esta longitud de onda, que no se ven afectadas apenas por la niebla o lluvia, y permiten la exploración y comunicación a través de la misma. Aunque las microondas se producen habitualmente por medio de dispositivos de tipo eléctrico, también se producen en algunos procesos atómicos, tales como los que generan las emisiones de los átomos de cesio que se utilizan actualmente para definir el patrón de tiempo, que corresponden a una frecuencia = f 9,19263177 × 109 Hz. También pertenecen al rango espectral de las microondas las ondas electromagnéticas usadas en los hornos del mismo nombre. Muchos de ellos
241
Ondas: luz y sonido
utilizan ondas cuya frecuencia característica es f ≈ 2, 5 GHz = 2, 5 × 109 Hz que, por tanto, tienen una longitud de onda: λ=
c 3 × 108 = ≈ 12 cm f 2, 5 × 109
Su utilización se basa en el hecho de que las ondas electromagnéticas de esta longitud de onda son absorbidas por el agua (y por las grasas y azúcares) contenida en los alimentos, pero no por la mayoría de sustancias utilizadas como contenedores, tales como vidrio o plásticos. Por ello, la energía aportada por las microondas calienta los alimentos pero no los recipientes. Infrarrojo Las emisiones infrarrojas (IR) se extienden en el margen espectral comprendido entre las microondas y la radiación visible, es decir, con longitudes de onda entre unas 0,8 µm y 500 µm aproximadamente. Este rango se subdivide, atendiendo a su proximidad a la región visible, en IR-cercano (0,8 µm < λ < 3 µm), IRintermedio (3 µm < λ < 30 µm) e IRlejano (λ > 30 µm), aunque no existe unanimidad en los límites de estas denominaciones. La región infrarroja de onda larga es producida por las vibraciones de los átomos y moléculas, como consecuencia de su movimiento térmico a temperatura ambiente. Recíprocamente, las ondas IR inducen vibraciones de los átomos y moléculas de los materiales, provocando su calentamiento, y a ellas se debe la sensación de calor que nos proporciona la luz solar o una bombilla incandescente. La temperatura absoluta de un cuerpo T está relacionada con la longitud de onda λ a la que éste emite, por la ley del desplazamiento de Wien (capítulo 8): λ= T 2, 9 × 10−3
donde λ, que corresponde al máximo de la emisión, está expresada en metros y T en kelvin. El Sol, por ejemplo, con una temperatura de unos 6.000 K, tiene su máximo de emisión a: λ=
2, 9 × 10−3 ≈ 0, 5 µ m 6.000
es decir, en el rango visible del espectro. Sin embargo, un cuerpo a temperatura ambiente (T = 300 K) tiene su máximo de emisión a: λ=
2, 9 × 10−3 ≈ 10 µ m 300
242
Fundamentos físicos de los procesos biológicos
es decir, justamente en la zona IR del espectro electromagnético. Esta radiación de origen térmico puede registrarse mediante cámaras fotográficas sensibles a esta región espectral para detectar las zonas más calientes (o que más emiten) de algún cuerpo, con importantes aplicaciones técnicas y en medicina. Algunos animales, como las serpientes, disponen de sensores de IR que les permiten detectar el calor emitido por sus presas potenciales. También pertenecen a la región del IR las ondas utilizadas para la comunicación a distancia entre los múltiples aparatos de uso doméstico que incorporan sistemas de control remoto (televisores, vídeos, equipos de audio, ordenadores). Normalmente operan mediante señales emitidas por medio de diodos electroluminiscentes (LED) que emiten en la región del IR cercano, con longitud de onda próxima a 1 µm. Luz visible En sentido estricto, la luz es lo único que vemos. Es decir, adoptando un punto de vista antropomórfico, seleccionamos el estrecho rango de ondas electromagnéticas al que es sensible el ojo humano y lo designamos como luz, aunque, desde el punto de vista estrictamente físico, no haya ninguna diferencia importante con otras ondas electromagnéticas, especialmente las más próximas en frecuencia, como el infrarrojo o ultravioleta. El ojo humano es sensible a las ondas electromagnéticas cuya frecuencia varía entre 3,8 × 1014 Hz y 7,7 × 1014 Hz, que se corresponde con longitudes de onda comprendidas entre 0,39 µm y 0,78 µm. Si sobre el ojo humano incide luz monocromática de distintas zonas del espectro visible, produce diferentes sensaciones de color, correspondiendo el rojo a la región de longitud de onda larga (baja energía) y el violeta a la región de longitud de onda corta (alta energía). La energía de los fotones de la luz visible está en el rango de unos pocos eV (1,6 eV < hν < 3,2 eV), valores que coinciden con las energías típicas de ligadura de los electrones en átomos y moléculas. De hecho, la radiación visible está provocada por la emisión asociada con transiciones electrónicas de átomos y moléculas. De forma inversa, la radiación visible puede ser absorbida selectivamente por los mismos átomos y moléculas, resultando en la coloración exhibida por los diferentes cuerpos. Ultravioleta (UV) En el límite de alta energía de la luz visible nos encontramos con la radiación ultravioleta, que se extiende desde longitudes de onda de 3, 8 × 10−7 m hasta 6 × 10 ‒10 m. La energía de los fotones varía entre 3 eV y 2 × 103 eV aproximadamente. Justamente en esta región espectral la radiación electromagnética
Ondas: luz y sonido
243
comienza a ser ionizante, dando lugar a diversas reacciones de tipo fotoquímico (como el cambio de color de la piel cuando nos exponemos a la luz solar), utilizándose incluso como medio de esterilización. La radiación UV se suele subdividir también en UV-cercano, UV-medio y UV-lejano en relación con su proximidad o lejanía con el rango visible. La radiación UV proveniente del Sol está filtrada fuertemente por la atmósfera terrestre, particularmente por el ozono, que absorbe la radiación incidente con longitudes de onda entre 0,2 µm y 0,3 µm (fig. 21.19). La reducción del contenido de ozono atmosférico (agujero de ozono) provocada por la presencia de determinados compuestos de origen antrópico ha dado lugar a episodios de alta irradiación UV, especialmente en la Antártida y Sudamérica, alertando a la sociedad sobre el posible efecto de la contaminación atmosférica. La visión de algunas especies animales es sensible a la radiación UV (en el hombre la retina también sería sensible a esta radiación, pero es absorbida por el cristalino y el resto de los tejidos oculares antes de alcanzar la retina). Algunas plantas, por ejemplo, despliegan motivos solo visibles bajo luz UV, que parecerían estar destinados a insectos sensibles a este rango espectral. Rayos X Al adentrarnos en el rango espectral de los rayos X nos encontramos con radiación de longitud de onda comparable con las dimensiones atómicas. Fueron descubiertos accidentalmente por W. C. Röntgen (18451923) al observar que alguna radiación de naturaleza desconocida (origen del término “rayos X”) era capaz de impresionar una película fotográfica a pesar de estar protegida de la luz por una envoltura opaca. Las energías asociadas a los fotones de rayos X se corresponden con las energías de enlace de los electrones más internos de los átomos, del orden de varios keV. En la práctica son generados por los llamados “tubos de rayos X”, que aceleran electrones con potenciales eléctricos de varios kV, que son enviados contra un blanco metálico. En la colisión los electrones son frenados bruscamente, emitiendo la llamada “radiación de frenado”, cuya energía corresponde al rango de los rayos X. Es de todos conocida la aplicación médica de los rayos X, basada en su poder de penetración a través de los tejidos orgánicos y su absorción diferencial, ya que los tejidos blandos son más transparentes que los huesos, lo que permite distinguirlos en las imágenes obtenidas sobre película fotográfica (“radiografías”).
244
Fundamentos físicos de los procesos biológicos
Fig. 21.21. El poder de penetración a través de los tejidos orgánicos permite la utilización de los rayos X para la obtención de imágenes (radiografías) distinguiendo los materiales más absorbentes, como huesos o implantes, de los tejidos blandos menos absorbentes. (Imágenes cortesía de los doctores Fernández Baíllo y Munuera. Servicio de Traumatología. Hospital Universitario La Paz, UAM).
Rayos γ Por último, los rayos γ tienen la menor longitud de onda (λ ≤ 10−12 m ) y la mayor energía (E = hf > MeV) del espectro electromagnético, coincidentes con las dimensiones y energías propias de los núcleos atómicos, ya que se originan en procesos nucleares. Los efectos biológicos de la radiación γ se verán en el capítulo 23. Ondas electromagnéticas monocromáticas planas El caso más sencillo de ondas electromagnéticas son las ondas monocromáticas planas, es decir, campos eléctricos y magnéticos que varían como ondas armónicas con frecuencia bien definida: = E ( x, t ) = B ( x, t )
E0 sen ( k x − ω t ) B0 sen ( k x − ω t )
(21.35a) (21.35b)
donde se ha supuesto propagación en la dirección del eje X, tal como se representa en la figura 21.22. Como en toda onda armónica, el estado de oscilación de los campos está determinado por la fase: φ (x, t) = (kx ‒ ωt), donde = ω 2= π f 2π T y k = 2π λ , siendo T el periodo y λ la longitud de onda. E0 y B0 son las amplitudes correspondientes a los campos eléctrico y magnético respectivamente.
245
Ondas: luz y sonido
A partir de las leyes del electromagnetismo se pueden demostrar algunas propiedades importantes de estas ondas, que enumeramos a continuación, y que han sido utilizadas para dibujar la figura 21.22:
1. Los campos E y B son perpendiculares entre sí y perpendiculares a la dirección de propagación, es decir, se trata de ondas transversales. Su orientación relativa es tal que el vector E × B determina la dirección y sentido de propagación. 2. Los campos E y B no oscilan de forma independiente, sino que están en fase entre sí, es decir, los máximos y mínimos coinciden. 3. Las amplitudes de los campos son proporcionales entre sí: E0 = cB0
(21.36)
siendo la constante de proporcionalidad igual a la velocidad de propagación de la luz. Polarización Ya hemos indicado que la transversalidad es una de las propiedades fun y damentales de las ondas electromagnéticas, es decir, el que los campos E B son perpendiculares a la dirección de propagación. Pero manteniendo esta condición, los campos pueden estar orientados en diferentes direcciones en el espacio, lo que determina la polarización de la onda. Dado que en las ondas electromagnéticas tenemos dos campos mutuamente perpendiculares entre sí, se adopta, por convenio, como dirección de polarización la correspon diente al vector campo eléctrico.
246
Fundamentos físicos de los procesos biológicos
En el ejemplo presentado en la figura 21.22, el campo eléctrico está siempre contenido en el plano XY. Si se observa el campo eléctrico en un punto fijo x0, oscilará cambiando su magnitud y sentido, pero estará siempre dirigido a lo largo del eje Y. Esta onda recibe el nombre de planopolarizada o lineal mente polarizada (según el eje Y). El campo eléctrico de una onda electromagnética no tiene por qué permanecer siempre confinado en un plano. Puede ocurrir que el campo eléctrico, sin cambiar de módulo, cambie su orientación rotando con velocidad angular constante ω, describiendo su extremo una trayectoria circular, tal como se indica en la figura 21.23.a. El campo magnético, no representado, gira también en fase manteniéndose la perpendicularidad entre ambos campos. Esta onda se denomina circularmente polarizada. En el ejemplo representado en la figura 21.23.a, un observador hacia el que se dirigiese la onda vería el campo eléctrico rotar en el sentido de las agujas del reloj, denominándose polarización circular a derechas o dextrógira. En el caso de una onda en que el campo eléctrico gire en el sentido opuesto, se denominaría polariza ción levógira (o a izquierdas). Si el campo eléctrico, además de rotar, varía en amplitud (fig. 21.23.b), el extremo del campo parece describir una elipse, por lo que esta situación se denomina luz elípticamente polarizada, que también podrá ser dextrógira o levógira.
Fig. 21.23. (a) Rotación del campo eléctrico de una onda circularmente polarizada dextrógira o a derechas (se supone que la onda viaja hacia el lector). (b) Si el campo eléctrico, además de rotar, varía en amplitud, parece describir una elipse, por lo que la onda se denomina elípticamente polarizada.
La luz natural, en general, no está polarizada. La orientación del campo eléctrico no sigue un patrón regular, sino que varía de forma aleatoria tan rápidamente que no es posible distinguir su polarización, lo que se suele denominar como luz natural o luz no polarizada. Sin embargo, es posible
247
Ondas: luz y sonido
obtener luz polarizada transformando la luz natural por medio de diferentes procedimientos. Aunque existen varias posibilidades, solo mencionaremos los polarizadores tipo dicroico. Por dicroísmo se entiende la absorción diferencial de luz, dependiente de la orientación del campo eléctrico. Si se hace incidir luz no polarizada y, por tanto, con componentes de campo eléctrico oscilando en todas direcciones, sobre un material dicroico, éste absorbe las componentes de campo orientadas en una cierta dirección, sin afectar apenas a las componentes perpendiculares, por lo que, tras atravesar el material, la luz emerge con el campo eléctrico oscilando en una única dirección: se ha obtenido luz linealmente polarizada. En consecuencia, a este dispositivo se le denomina polarizador lineal y a la dirección de campo eléctrico permitida, eje óptico o eje de polarización. Un ejemplo de material dicroico son las láminas Polaroid, constituidas por macromoléculas con una orientación preferencial, que provocan una absorción muy diferente de la luz dependiendo de la dirección del campo eléctrico incidente. Digamos finalmente que existen también procedimientos sencillos para generar los otros tipos de luz polarizada (circular o elíptica) que el lector interesado puede encontrar en textos especializados de óptica. Análisis de la luz polarizada Si se interpone un polarizador en el camino de la luz polarizada (lineal, circular o elíptica), éste dejará pasar más o menos luz según la orientación relativa del eje del polarizador y la dirección del campo eléctrico de la luz. Rotando el eje del polarizador y registrando la variación de la intensidad de luz transmitida, se puede obtener, por tanto, la información sobre la orientación espacial del campo, es decir, el tipo de polarización de la luz. Un polarizador utilizado para este propósito se denomina, por razones obvias, analizador. Así, si se utiliza primero un polarizador para generar luz linealmente polarizada (fig. 21.24) y seguidamente un segundo polarizador (analizador), cuando el eje del analizador forme un ángulo θ con el eje del polarizador, el campo eléctrico E2 transmitido por el analizador será: E2 = E1 cos θ
y, teniendo en cuenta que la intensidad de una onda electromagnética es proporcional al cuadrado del campo eléctrico (ec. 22.31), la intensidad registrada por el detector será: I = I 0 cos 2 θ
(21.37)
248
Fundamentos físicos de los procesos biológicos
que se conoce como ley de Malus, y es característica de la luz polarizada lineal. Otros tipos de polarización dan lugar a diferentes variaciones angulares de la intensidad registrada tras el analizador, que permiten su identificación. Nótese que, en el caso particular de la luz linealmente polarizada, cuando el eje del analizador es paralelo a la dirección de polarización (θ = 0º), la intensidad detectada es máxima (I = I0), mientras que si el eje del analizador es perpendicular a la dirección de polarización (θ = 90º), la luz transmitida se anula: I = I0 cos2 90 = 0.
Fig. 21.24. Esquema de un sistema experimental para análisis de luz polarizada, mediante dos polarizadores (polarizador y analizador), cuyos ejes de polarización forman un ángulo θ.
Observación. Actividad óptica. Una propiedad importante asociada con la polarización de la luz es la actividad óptica. Algunas sustancias, denomi nadas ópticamente activas, producen una desviación del plano de polariza ción de la luz que pasa a través de ellas. Si el plano se desvía en la dirección de las agujas del reloj se denominan dextrógiras, y en el caso opuesto, levó giras, adoptando el punto de vista de un observador que viese acercarse hacia él las ondas. Aunque el fenómeno de la actividad óptica es complejo, y su explicación excede los objetivos de este texto, sí se puede indicar que está relacionado con la existencia de moléculas, o agregados más complejos, con alguna asimetría intrínseca, presentando dos estructuras idénticas que sólo se diferencian en que una es la imagen especular de la otra (“enantiómeros”). La mayoría de estas sustancias se encuentran en la naturaleza mezcladas, con proporciones iguales del compuesto dextrógiro y levógiro, dando lugar a mezclas ópti camente inactivas (“mezcla racémica”). Sin embargo, los organismos vivos sintetizan, en algunos casos, una de las posibles orientaciones de alguno
Ondas: luz y sonido
249
de estos compuestos y no la otra. Mencionemos únicamente la glucosa, es decir, el azúcar fundamental en el metabolismo humano, que corresponde a la variedad dextrógira o dglucosa, también denominada dextrosa, en refe rencia a sus características de actividad óptica. El análisis de la actividad óptica se realiza mediante los denominados “polarímetros”, que, en esencia, son montajes experimentales adecuados para el análisis de luz polarizada, muy similares al que se representa en la figura 21.24 y que se acaba de describir. Observación. Luz polarizada en la naturaleza. El ojo humano no es sensible a la polarización de la luz, reaccionando exactamente igual si la luz que le llega está polarizada o no. Sin embargo, la utilización de un polarizador, de forma similar a como se utiliza el segundo polarizador (analizador) en la figura 21.24, permite percibir efectos debidos a la polarización de la luz a simple vista. Esto permite verificar que son varios los fenómenos físicos cotidianos que dan lugar a la polarización de la luz natural. Por ejemplo, es fácil comprobar que la luz reflejada por un material cualquiera está parcialmente polarizada. De hecho, algunas gafas “de sol” incorporan una lámina polarizadora para eliminar eficientemente los reflejos. También la dispersión (scattering) de la luz produce luz polarizada, siendo la luz solar dispersada por la atmósfera un buen ejemplo. De nuevo, mediante un polarizador podemos verificar este fenómeno. Y, de hecho, las abejas y otros insectos son capaces de percibirlo y utilizarlo como medio de orienta ción respecto al sol.
21.5 Fronteras: reflexión y refracción 21.5.1 Plano de incidencia La propagación de cualquier onda, ya sea mecánica o electromagnética, depende de las propiedades del medio, por lo que cuando una onda llega a la frontera entre dos medios materiales es previsible que sucedan cambios. En la superficie de separación entre dos medios diferentes las ondas experimentan los fenómenos de reflexión y refracción: la onda incidente se transmite solo parcialmente, cambiando en general de dirección y, al tiempo, una parte de ella se refleja hacia el primer medio.
250
Fundamentos físicos de los procesos biológicos
El análisis de estos fenómenos supone, por tanto, conocer las dos nuevas ondas generadas: en primer lugar, cuál es la dirección de las ondas reflejadas y transmitidas y, en segundo lugar, en qué proporción se reparte la energía incidente entre ellas. Para ello, como hemos indicado con anterioridad, describiremos la onda mediante rayos, que indican la dirección de propagación de la energía y son perpendiculares a los frentes de onda. Consideremos (fig. 21.25) una onda plana que incide sobre una superficie (también plana) que separa dos medios (1) y (2). El rayo incidente y la normal a la superficie de separación determinan un plano que recibe el nombre de plano de incidencia. Una primera propiedad importante en los procesos de reflexión y refracción de ondas (tanto acústicas como electromagnéticas) es que los rayos reflejado y transmitido están contenidos también en el plano de incidencia (fig. 21.25.a). Para indicar su dirección se utilizan los ángulos de incidencia, reflexión y refracción, que son los ángulos formados por dichos rayos con la normal a la superficie de discontinuidad, tal como se representa en la figura 21.15.b.
Ondas: luz y sonido
251
Fig. 21.25. (a) El plano de incidencia, definido por el rayo incidente y la normal a la superficie de separación entre dos medios de propagación diferentes, contiene también los rayos reflejado y transmitido. (b) La dirección de propagación de los diferentes rayos se define por medio de los ángulos que forman con la normal a la superficie frontera entre ambos medios: los ángulos de incidencia θi, reflexión θr y refracción θt
21.5.2 Reflexión La dirección de las ondas reflejadas en una superficie plana está indicada por la llamada ley de la reflexión: El ángulo de reflexión θr es igual al ángulo de incidencia θi. θi = θr (21.38) En esta igualdad los ángulos se toman en valor absoluto, estando los rayos incidente y reflejado en lados opuestos de la normal, tal como se han representado en la figura 21.25.b.
21.5.3 Refracción de la luz Ley de Snell Cuando una onda cambia de un medio de propagación a otro, cambian las propiedades del medio y con ello la velocidad de propagación. Ello implica que los rayos sufren una cierta desviación, siendo el ángulo de refracción diferente del de incidencia. En el caso de la refracción de la luz, la velocidad de propagación en los diferentes medios depende del valor del índice de refracción (n = c/ v) y la dirección del rayo refractado viene descrita por la ley de Snell (1591-1626), según la cual el producto del índice de refracción por el
252
Fundamentos físicos de los procesos biológicos
seno del ángulo que forma el rayo con la normal a la superficie de separación entre ambos medios permanece constante: n1 sen θi = n2 sen θt
(21.39)
donde n1 y n2 son los índices de refracción de los medios inicial y final y θi y θt son los ángulos de incidencia y de refracción (transmitido), respectivamente. La ley de Snell puede escribirse alternativamente, en función de las velocidades de propagación en los dos medios, v1 y v2, como: sen θi sen θt = v1 v2
(21.40)
Resulta evidente, a partir de la ley de Snell, que cuando el rayo incide perpendicularmente a la superficie de separación entre los dos medios, el rayo no sufre desviación alguna, es decir, en este caso: θi = 0
⇔
θt = 0
Para cualquier otro valor del ángulo de incidencia, el rayo transmitido se desvía respecto a la dirección de incidencia. Es fácil ver, a partir de la ley de Snell, que cuando la luz pasa de un medio de índice de refracción n1 a otro medio con índice de refracción mayor (n2 > n1), el rayo se acerca a la normal (θt < θi) (fig. 21.26.a). Éste sería el caso habitual de un rayo que incida, procedente del aire, sobre otro medio diferente. En el aire la velocidad de propagación es muy próxima al valor del vacío y el índice de refracción es, por tanto, muy próximo a la unidad (n1 = naire ≈ 1), mientras que para cualquier otro medio el índice de refracción es superior a la unidad. Por el contrario, cuando la luz pasa desde un medio a otro con índice de refracción inferior (n2 < n1) el rayo se aleja de la normal (θt > θi) (fig. 21.26.b).
Fig. 21.26. Refracción de la luz: (a) cuando la luz pasa de un medio de índice de refracción n1 a otro medio con índice de refracción mayor (n 2 > n1) el rayo se acerca a la normal (θt < θi), (b) cuando la luz pasa desde un medio a otro con índice de refracción inferior (n2 < n1) el rayo se aleja de la normal (θt > θi).
253
Ondas: luz y sonido
Refracción en medios dispersivos Como se indicaba en la sección 21.4.2, la velocidad de la luz en los medios materiales, y por tanto el índice de refracción, depende de la frecuencia (o de la longitud de onda). En el rango espectral de la luz visible, esta dependencia puede expresarse por la llamada relación de Cauchy: n ( λ0 )= A +
B λ02
(21.41)
donde A y B son parámetros característicos de cada material y λ0 la longitud de onda de la luz (en el vacío). El índice de refracción es mayor para las longitudes de onda más cortas, lo que corresponde a la región azul del espectro, siendo de valor inferior para longitudes de onda correspondientes al rojo. Esto da lugar a efectos cromáticos asociados con la refracción de la luz blanca por un material transparente, como por ejemplo un prisma, es decir, un medio transparente, de índice de refracción n(λ), limitado por dos superficies planas formando un cierto ángulo α (fig. 21.27). La luz blanca es una superposición de longitudes de onda que abarcan de forma continua todo el espectro visible y, al atravesar el prisma, la luz sufre dos refracciones. En la primera refracción (cara de entrada) los rayos se acercan a la normal, mientras en la cara de salida se alejan de la normal, por lo que la desviación del rayo respecto a la dirección de incidencia se incrementa. De acuerdo con la variación característica del índice de refracción en función de la longitud de onda, indicada por la relación de Cauchy, el rojo resulta ser el color menos desviado, mientras el violeta es el que más se desvía, produciéndose la característica separación angular de los diferentes colores, fácilmente observable a simple vista.
Fig. 21.27. Refracción en un prisma. Debido a la dependencia del índice de refracción con la longitud de onda, al incidir luz blanca sobre el prisma, se produce una separación angular de los diferentes colores, fácilmente observable a simple vista. El rojo resulta ser el color menos desviado, mientras el violeta es el que más se desvía.
254
Fundamentos físicos de los procesos biológicos
También es la dispersión de la luz la responsable de la formación del arco iris. En las gotas de lluvia, la luz se refracta al entrar, sufre una reflexión en la parte posterior de la gota y reemerge hacia delante (formando un ángulo de aproximadamente 42º con la dirección inicial). Los efectos dispersivos en las sucesivas refracciones (fig. 21.28) dan lugar a la separación angular de los colores, que conocemos.
Fig. 21.28. En las gotas de lluvia, la luz se refracta al entrar, sufre una reflexión en la parte posterior de la gota y reemerge hacia delante, formando un ángulo de aproximadamente 42º con la dirección inicial. Los efectos dispersivos en las sucesivas refracciones dan lugar a la separación angular de los colores que vemos en el arco iris.
La dispersión resulta perjudicial cuando ocurre en lentes e instrumentos ópticos, ya que da lugar a la formación de imágenes ligeramente diferentes para cada color, lo que se denomina “aberración cromática”, y en los instrumentos ópticos de precisión debe ser cuidadosamente corregida utilizando combinaciones adecuadas de lentes. Reflexión total interna Como hemos visto más arriba, cuando la luz pasa a un segundo medio de índice de refracción inferior al del primero, el rayo se aleja de la normal. Cuanto mayor es el ángulo de incidencia mayor es el ángulo de refracción y existe un cierto ángulo para el que el rayo “refractado” es paralelo a la superficie de separación (fig. 21.29). Este ángulo recibe el nombre de ángulo límite de reflexión total (θL) y para ángulos mayores no existe rayo transmitido, sino únicamente reflejado, ya que la ley de Snell carece de solución, puesto que la función seno no puede tomar valores mayores que uno.
255
Ondas: luz y sonido
Fig. 21.29. Cuando la luz pasa a un segundo medio de índice de refracción inferior al del primero, n 2 < n1, el rayo se aleja de la normal (a), aumentando el ángulo de refracción al aumentar el ángulo de incidencia (b). Existe un cierto ángulo de incidencia, llamado ángulo límite de reflexión total (θL), para el que el rayo “refractado” es paralelo a la superficie de separación (c). Para ángulos de incidencia mayores (d) no existe rayo transmitido, sino únicamente reflejado.
Para calcular el ángulo límite de reflexión total basta aplicar la ley de Snell, imponiendo la condición que acabamos de indicar: θi = θ L
⇔
θt = 90º
⇒
n n sen θ L = 2 sen θt = 2 n1 n1
sen θt = 1
(21.42)
En la reflexión total se consigue un 100 % de luz reflejada, por lo que este fenómeno se aprovecha en los prismas de reflexión total, utilizados para desviar la trayectoria de la luz sin introducir pérdidas de intensidad, superando lo que se puede alcanzar con los mejores espejos, Otro ejemplo de reflexión total lo constituyen las fibras ópticas. Una fibra óptica se puede describir de un modo simplificado como una fibra muy delgada (10100 µm), flexible, fabricada de un material altamente transparente (vidrio o plástico), que actúa como medio transmisor de luz que se acopla en uno de sus extremos y se guía hasta el extremo opuesto. La luz en el interior de la fibra sufre reflexión total, propagándose sin pérdidas a lo largo de grandes distancias. De hecho, en la actualidad se fabrican fibras con atenuación inferior a 1 dB/km, lo que permite su aplicación para comunicaciones ópticas, transmitiéndose información por medio de la luz a distancias de cientos de kilómetros. Las fibras ópticas se utilizan también en aplicaciones biomédicas, ya que se pueden utilizar para enviar luz a órganos internos (sistema digestivo,
256
Fundamentos físicos de los procesos biológicos
respiratorio, circulatorio), recogiendo la luz reflejada por medio de la misma fibra para su observación (endoscopia). La flexibilidad de las fibras permite observar regiones del organismo que no serían accesibles mediante sistemas rígidos. Observación. La reflexión total de la luz en la naturaleza. El proceso de reflexión total de la luz se da también de forma natural en diversas situa ciones. Un caso bien conocido es el de los espejismos, que se producen en los desiertos o, en general, en aquellas situaciones en que el aire, en con tacto con una superficie caliente, se calienta también, disminuyendo el valor del índice de refracción, mientras en las capas superiores, más frías, tiene un valor más alto. En consecuencia, los rayos de luz sufren una “reflexión total”, pareciendo que provienen de una reflexión en una superfice de agua, que no existe realmente (fig. 21.30). Existen también estructuras biológicas que guían la luz por medio de la reflexión total interna. Tanto los conos, en la retina, como el rabdoma, en los ojos compuestos de los insectos, actúan de forma similar a una guía de onda debido a su forma de varilla y a que su índice de refracción es ligera mente superior al del medio circundante, ayudando a dirigir la radiación incidente adecuadamente. En el caso de los conos se ha observado incluso un cierto fototropismo, que da lugar a la orientación de sus ejes, favoreciendo la captación de los rayos de luz que pasan al ojo por el centro de la pupila, ayudando a eliminar luz difusa. Mencionemos por último el efecto de guía de onda que se produce en el pelo del oso polar, que le permite captar radiación solar difusa, ayudando a incrementar la temperatura de la piel propiamente dicha (cuyo color es negro, para facilitar la absorción).
257
Ondas: luz y sonido
Fig. 21.30. El aire en contacto con una superficie caliente tiene un índice de refracción inferior al aire de las capas superiores más frías. En consecuencia, los rayos de luz sufren una “reflexión total”, pareciendo que proceden de una reflexión en una superficie de agua inexistente.
21.5.4 Refracción del sonido Como hemos visto en la sección 21.4.1, la velocidad de propagación de una onda acústica depende de las propiedades elásticas del medio (módulo de compresibilidad en un fluido o módulo de Young en un sólido) y de su densidad. Cuando una onda acústica incide sobre una superficie de separación entre dos medios diferentes, la velocidad de propagación cambia y, al igual que sucede con la luz, la onda sufre refracción. La dirección de la onda refractada se obtiene a partir de la ley de Snell, que expresada en función de la velocidad de propagación de las ondas en cada medio resulta: sen θi sen θt = v1 v2
⇒
v sen θt = 2 v1
sen θi
(21.43)
258
Fundamentos físicos de los procesos biológicos
donde θi y θt son los ángulos de incidencia y refracción y v1 y v2 las velocidades de propagación en ambos medios. En particular, si la onda incide desde un medio a otro con una velocidad de propagación más alta (v2 > v1), existirá también el fenómeno de reflexión total, análogo al de la luz, para ángulos de incidencia tales que: v2 sen θi > v1. Propagación del sonido en los océanos En la sección 21.4.1 se calculó la velocidad de propagación del sonido en el agua, resultando un valor del orden de los 1.500 ms–1. Sin embargo, al considerar la propagación de las ondas acústicas en los océanos, hay que tener en cuenta que en ellos se producen importantes variaciones de temperatura, presión y salinidad con la profundidad. Estas variables afectan a los valores de la densidad y módulo de compresibilidad, dando lugar a un cambio apreciable en la velocidad de propagación del sonido con la profundidad (fig. 21.31). En la superficie tiene un valor en torno a vsonido ≈ 1.350 ms‒1, disminuyendo después progresivamente, a medida que disminuye la temperatura del agua, alcanzándose un mínimo, del orden de vsonido ≈ 1.490 ms‒1, en profundidades de unos 1.000 m. A partir de esa profundidad la temperatura se mantiene aproximadamente constante y la variable más importante es el aumento progresivo de la presión con la profundidad, lo que provoca un nuevo aumento de la velocidad de propagación. Este perfil de velocidad da lugar a un fenómeno de reflexión total y a la existencia de una guía de onda acústica, localizada en torno al kilómetro de profundidad, donde la velocidad de propagación es mínima. El efecto puede comprenderse por su analogía con las fibras ópticas, en las que la luz queda confinada en su interior, donde el índice de refracción es más alto, es decir, donde la velocidad de propagación es más baja. Este mismo fenómeno ocurre aunque el cambio en velocidad de propagación no sea brusco sino gradual, produciéndose un confinamiento de las ondas en las regiones donde la velocidad de propagación sea más baja. Esto da lugar a la existencia de un “canal acústico” oceánico donde se produce una localización y guía del sonido con baja atenuación. El canal de propagación del sonido, en torno al kilómetro de profundidad, se conoce como canal SOFAR (de las siglas inglesas SOund Fixing And Ranging), utilizándose para la detección de distintas señales: las emitidas por los grandes cetáceos, las originadas por movimientos sísmicos o las emitidas por los motores de propulsión de submarinos.
259
Ondas: luz y sonido
Fig. 21.31. Dependencia de la velocidad de propagación de las ondas acústicas en el océano en función de la profundidad. La disminución inicial se debe principalmente al descenso de temperatura del agua, mientras el aumento, a partir de los 1.000 m de profundidad, se debe al aumento de la presión.
21.5.5 Energía: reflectancia y transmitancia En la sección anterior se ha dado cuenta de las direcciones de las ondas reflejadas y transmitidas en la frontera entre dos medios de propagación dife rentes. Como resultado de la aparición de estas dos ondas, la energía de la onda incidente se divide entre las ondas reflejada y transmitida en una cierta proporción, que depende de las características de los dos medios y del ángulo de incidencia. Para su descripción se utilizan las magnitudes denominadas reflectancia y transmitancia. La fracción de energía (intensidad) incidente que resulta reflejada se denomina reflectancia (R) y la fracción transmitida se denomina transmitancia (T). R=
T=
I reflejada I incidente I transmitida I incidente
(21.44)
(21.45)
260
Fundamentos físicos de los procesos biológicos
Como las intensidades reflejada y transmitida han de ser menores que la intensidad incidente, los valores de la reflectancia y de la transmitancia están comprendidos entre cero y uno: 0 ≤ R, T ≤ 1
y la energía total debe conservarse: I reflejada + I transmitida = I incidente
por lo que, dividiendo por la intensidad incidente, se obtiene una relación básica entre reflectancia y transmitancia: su suma ha de ser igual a la unidad. R+T=1
(21.46)
Ondas electromagnéticas Como se ha indicado, los valores de la reflectancia y transmitancia dependen del ángulo de incidencia y de las propiedades de los dos medios que, para el caso de ondas electromagnéticas, quedan descritas por los índices de refracción. A partir de las ecuaciones del electromagnetismo se pueden obtener las expresiones explícitas para la reflectancia y transmitancia, que el lector interesado puede encontrar en textos de óptica. A modo ilustrativo, en la figura 21.32 se presenta su dependencia en función del ángulo de incidencia, para un ejemplo típico correspondiente a una superficie de separación entre aire y vidrio (nvidrio ≈ 1,5). Se han representado los resultados correspondientes a ondas linealmente polarizadas con el campo eléctrico contenido en el plano de incidencia () o perpendicular a él (⊥), para mostrar que transmitancia y reflectancia dependen de la dirección de polari zación de las ondas, aunque la diferencia no es muy grande. Para luz incidente perpendicular a la superficie de separación entre los dos medios (θi = 0) no hay diferencia entre las dos polarizaciones y se demuestra que la reflectancia es: n −n R= 1 2 n1 + n2
2
(21.47)
y a partir de ella, se obtiene inmediatamente la transmitancia: T = 1 – R. La reflectancia a incidencia normal (ec. 21.47) crece al aumentar la dife rencia de índice de refracción entre los dos medios. Si ésta es pequeña, la reflectancia es baja y casi toda la luz se transmite al segundo medio, pero si aumenta la diferencia de índices, la fracción reflejada se incrementa. En el
Ondas: luz y sonido
261
ejemplo representado en la figura 21.32 (nvidrio ≈ 1,5) la reflectancia a incidencia normal es de apenas un 4 %. Si lo comparamos con la reflexión de un diamante, cuyo índice de refracción es elevado (ndiamante ≈ 2,4), se obtiene ahora R ≈ 17 %, lo que constituye una de sus cualidades apreciadas y que se intenta potenciar con la talla adecuada para maximizar el brillo. Considerando la dependencia con el ángulo de incidencia, puede verse en la figura que la reflectancia mantiene un valor bajo hasta ángulos de incidencia de unos 30º-40º, aumentando luego progresivamente al aumentar el ángulo de incidencia, hasta alcanzar un valor R = 1 (100 % de luz reflejada) para θi = 90º. Este fenómeno es bien conocido al observar la elevada reflexión de la luz solar en al agua, o en el vidrio de una ventana, para incidencia rasante. Puede verse también en la figura que existe un ángulo de incidencia, llamado ángulo de polarización o de Brewster, para el que la luz polarizada paralela al plano de incidencia no se refleja (R|| = 0), por lo que la luz reflejada resulta polarizada, con el campo eléctrico perpendicular al plano de incidencia. Digamos finalmente que, en el caso de los metales, la luz refractada es absorbida en un espesor de unas pocas micras, por lo que resultan opacos excepto si se trata de películas extremadamente delgadas y la reflectancia es muy alta incluso para ángulos pequeños.
Fig. 21.32. Reflectancia y transmitancia de la luz, en función del ángulo de incidencia, en una frontera entre aire y vidrio. Para incidencia perpendicular sobre la superficie (θi = 0º), la reflectancia es baja (R ≈ 4 %), aumentando con el ángulo hasta alcanzar valores altos (R ≈ 100 %) a incidencia rasante (θi ≈ 90º). Existe un ángulo, llamado ángulo de Brewster, para el que la luz polarizada paralela al plano de incidencia no se refleja (R││ = 0), por lo que la luz reflejada está polarizada con el campo eléctrico perpendicular al plano de incidencia.
262
Fundamentos físicos de los procesos biológicos
Ondas acústicas En el caso de las ondas acústicas, la magnitud que determina el valor de las intensidades reflejada y transmitida es la impedancia acústica Z, definida como el producto de la densidad del material ρ por la velocidad de propagación de las ondas v. Z=ρV (21.48) La reflectancia en la frontera entre dos materiales se expresaría ahora en función de la impedancia acústica de los dos medios (Z1, Z2). Para incidencia normal se obtiene una relación semejante al caso de ondas electromagnéticas: Z − Z2 R= 1 Z1 + Z 2
2
(21.49)
y la transmitancia, por conservación de la energía: T = 1 – R. De nuevo, cuanto mayor sea la diferencia entre los dos medios (entre sus impedancias), mayor es la energía reflejada. Si consideramos el caso importante de la reflectancia y transmitancia, a incidencia normal, para una superficie de separación entre aire y agua, cuyas densidades y velocidades de propagación son: ρaire ≈ 1,3 kg m‒3, ρagua ≈ 1 × 103 kg m‒3, vaire ≈ 340 m s‒1 y vagua ≈ 1.500 m s‒1, obtenemos para las impedancias acústicas respectivas los valores: Z aire ≈ (1, 3) × ( 340 ) = 442 kg m −2 s −1 Z agua ≈ (1 × 103 ) × (1.500= ) 1, 5 × 106 kg m−2 s −1
Es decir, hay un gran cambio en las impedancia acústicas, por lo que la reflectancia es muy alta: 2
2
2
Z − Z 2 442 − 1, 5 ×106 −1, 499558 × 106 2 R= 1 = = ( 0, 999411) = 0, 9988 = 6 6 Z + Z + × , 442 1 , 5 10 1 500442 × 10 2 1
El sonido procedente del aire se propaga muy mal hacia el agua, reflejándose prácticamente la totalidad de la energía (99,88 %), como hemos comprobado todos cuando sumergimos la cabeza al bucear y dejamos de percibir los sonidos exteriores. Observación. Ecolocalización y ecografía. Dos importantes aplicaciones de la reflexión de ondas acústicas son la ecolocalización y la ecografía. En
263
Ondas: luz y sonido
ambos casos se suelen utilizar ultrasonidos, ya que su longitud de onda es inferior a la del sonido y ello permite una mayor resolución. Para analizar la ecografía, veamos cuál es la magnitud de la reflectancia en la superficie de separación entre dos tejidos diferentes. Puede suponerse que la velocidad de propagación es aproximadamente la misma en ambos tejidos y que el cambio más relevante se produce en la densidad, por lo que obtendríamos: 2
Z − Z 2 ρ1 − ρ 2 R= 1 ≈ Z1 + Z 2 ρ1 + ρ 2
2
Tomando variaciones de densidad del orden de un 10 %, por ejemplo: ρ1 = 1,1 × 103 kg m‒3 y ρ2 = 1 × 103 kg m‒3 , obtendríamos: ρ1 − ρ 2 (1,1 − 1) × 103 0,1 2 = ( 0, 05 ) = 0, 0025 R= = = 3 ρ1 + ρ 2 (1,1 + 1) ×10 2,1 2
2
2
A pesar de ser relativamente baja (R ≈ 0,25 %), la intensidad acústica reflejada es suficiente como para ser detectada. En la tabla 21.7 se incluyen las características acústicas de algunos tejidos orgánicos. A fin de aumentar la intensidad de las ondas que, procedentes del trans ductor de ultrasonidos, penetran en el organismo, es necesario reducir la reflectancia de la superficie del cuerpo (que se supone con buena aproxima ción una interfase aireagua) y que, como se ha visto más arriba, es del 99,88 %. Por ello se utilizan líquidos de acoplo entre la fuente de ultrasonidos y el cuerpo para conseguir “acoplo de impedancias” y reducir la reflectancia. Valores de reflectancia similares a los anteriores son los que permiten la ecolocalización practicada por algunos animales, ya sea en aire, tal como realizan los murciélagos, o en medio acuático, como hacen los delfines. Como hemos visto, en el primer caso la reflectancia es muy superior, ya que correspondería básicamente a una frontera aireagua. Tabla 21.7 Características acústicas de algunos tejidos orgánicos Tejido Grasa Cerebro Músculo Hígado Huesos
Densidad ρ (103 kg m–3)
Velocidad v (m s –1)
0,97 1,02 1,04 1,06 1,7
1.470 1.530 1.586 1.540 3.600
264
Fundamentos físicos de los procesos biológicos
21.6 Interferencia 21.6.1 Principio de superposición. Condiciones generales de interferencia Las interferencias constituyen una característica fundamental de los procesos físicos de tipo ondulatorio, que se producen cuando dos o más ondas coinciden en el mismo punto. Si consideramos, por ejemplo, la conocida imagen de las ondas superficiales en un líquido, cuando en la misma superficie se generan varias ondas (por ejemplo, arrojando dos objetos sobre un estanque tranquilo) sabemos que en la región donde coinciden ambas ondas se produce el fenómeno de interferencia: la perturbación resultante es la suma de las perturbaciones producidas por cada una de ellas. Consideremos en primer lugar la superposición de dos ondas armónicas de la misma frecuencia propagándose en la misma dirección. Si las ondas que se superponen están en fase (fig. 21.33.a), la perturbación resultante se refuerza, sumándose las amplitudes: se produce una interferencia constructiva. Si, por el contrario, las ondas individuales actúan desfasadas en un ángulo π (fig. 21.33.b), la perturbación resultante disminuye, la amplitud resultante es la diferencia de amplitudes de las ondas individuales y se dice entonces que se ha producido interferencia destructiva. En el caso particular de que las dos ondas tuviesen la misma amplitud, la amplitud resultante sería exactamente igual a cero. La interferencia entre dos ondas no se produce, en general, ni exactamente en fase ni con un desfase de π, sino con una diferencia de fase δ intermedia, dando lugar a una situación interferencial también intermedia.
Fig. 21.33. Representación cualitativa de la interferencia de dos ondas armónicas, dependiendo de la diferencia de fase. (a) Ondas en fase: interferencia constructiva. (b) Ondas desfasadas en π: interferencia destructiva.
Para expresar las ideas anteriores de forma cuantitativa consideremos dos ondas y1 (x, t) e y2 (x, t), armónicas de igual frecuencia y longitud de onda, propagándose en la misma dirección:
265
Ondas: luz y sonido
y1 (x, t) A sen φ1 (x, t) = A sen (k x ‒ ωt)
(21.50.a)
y2 (x, t) A sen φ2 (x, t) = A sen (k x ‒ ωt + δ)
(21.50.b)
donde la diferencia de fase entre las dos ondas es δ = φ2 − φ1. Se ha supuesto que las dos ondas tienen la misma amplitud, lo que simplifica los cálculos sin afectar a la interpretación del fenómeno. Al superponerse las dos ondas, la perturbación resultante será: = y ( x, t ) y1 ( x, t ) += y2 ( x, t ) A sen ( k x − ω t ) + A sen ( k x − ω t + δ )
α −β
y teniendo en cuenta que sen α + senβ = 2 cos 2 sarse como:
sen
α +β , puede expre2
δ y ( x, t ) = 2 A cos sen ( k x − = ω t + δ 2 ) AT sen ( k x − ω t + δ 2 ) 2
(21.51)
es decir, se obtiene una onda, también armónica, con la misma frecuencia que las ondas que se superponen, pero con una amplitud (AT) que depende de la diferencia de fase δ: δ AT = 2 A cos 2
(21.52)
Esta amplitud puede tomar cualquier valor entre 0 y 2A, dependiendo del valor de δ, tal como avanzábamos en las líneas iniciales de esta sección. La amplitud máxima (2A) se obtiene cuando las ondas están en fase. δ δ cos = ±1 ⇒ = mπ ⇒ δ = 2π m con m= 0, ± 1, ± 2, 2 2
(21.53)
Por el contrario, la amplitud de la onda resultante se hace mínima (0) cuando la diferencia de fase entre las ondas es un múltiplo impar de π. δ δ cos = 0 ⇒ = 2 2
( 2m + 1)
π δ ⇒= 2
( 2m + 1) π
(21.54)
El desfase δ entre las dos ondas puede ser debido a un desfase espacial (las ondas no se originan en el mismo punto) o a un desfase temporal (no comienzan en el mismo instante), por lo que es conveniente expresar también las condiciones interferenciales en términos de estos desfases espacial ( ∆x = δ k ) o temporal ( ∆t = δ ω ), resultando:
266 Máximos: ( AT = 2 A )
Mínimos: ( AT = 0 )
Fundamentos físicos de los procesos biológicos
∆x = m λ ∆t = mT ∆x = = ∆t
λ 2 T ( 2m + 1) 2
( 2m + 1)
m= 0, ± 1, ± 2,
m= 0, ± 1, ± 2,
(21.55)
(21.56)
Para valores intermedios del desfase, la amplitud tiene un valor intermedio, tal como se ilustra en la figura 21.34.
Fase φ (x, t) = (kx ‒ ωt + δ) Fig. 21.34. Interferencia de dos ondas armónicas de igual frecuencia y amplitud. De acuerdo con las ecuaciones 22.57-58, se obtiene una onda armónica de igual frecuencia que las ondas que se superponen y una amplitud AT, comprendida entre 0 ≤ AT ≤ 2A, dependiendo de la diferencia de fase. En la figura se representan dos ondas con un desfase δ = π/4, con lo que AT = 2A cos (π/8) ≈ 1,85 A.
21.6.2 Ondas tridimensionales Si, en lugar de ondas unidimensionales, consideramos ondas tridimensionales, la superposición de ondas procedentes de dos fuentes A y B en un punto P dará lugar a una situación interferencial que dependerá de la diferencia de fase con que se superpongan las ondas y que depende, a su vez, de la diferencia de caminos (r2-r1) que hayan tenido que recorrer (fig. 21.35).
267
Ondas: luz y sonido
Fig. 21.35. La diferencia de fase con que las ondas generadas por dos fuentes puntuales A y B llegan a un punto P depende de las distancias entre las fuentes y dicho punto.
El resultado es totalmente análogo al detallado anteriormente y las condiciones de interferencia, constructiva o destructiva, se pueden reescribir en función de esta diferencia de caminos: Máximos: r2 − r1 = mλ
m= 0, ± 1, ± 2, λ
Mínimos: r2 − r1 = ( 2m + 1) 2
m= 0, ± 1, ± 2,
(21.57) (21.58)
Por tanto, en la región del espacio donde se produce la superposición de ondas, tiene lugar una distribución espacial de interferencias, dependiente de la diferencia de fase existente en cada punto, que viene determinada por la diferencia de caminos a las fuentes y que, en general, puede ser complicada. Esta distribución espacial de amplitudes (e intensidades) es característica fundamental de los fenómenos interferenciales. Nótese que, de acuerdo con las ecuaciones (21.57-58), la variación en la diferencia de caminos entre máximos (o mínimos) sucesivos es igual a la longitud de onda: ∆rm +1 − ∆rm = λ (21.59) Por tanto, la distribución espacial de máximos y mínimos en un proceso interferencial proporciona información sobre cuál es el valor de la longitud de onda. Conocida la geometría de las fuentes y los puntos de observación se puede calcular, en general, la forma precisa de la dependencia anterior y, a partir de ella, medir longitudes de onda.
21.6.3 Interferencias con luz. Coherencia. El láser Los fenómenos interferenciales se producen también para las ondas electromagnéticas y en particular para la luz. Sin embargo, hay algunas
268
Fundamentos físicos de los procesos biológicos
diferencias importantes que hacen que estas interferencias no se observen en las situaciones comunes. De hecho, si en una habitación se encienden dos bombillas, lo que se observa es la suma de sus intensidades en lugar de una distribución de máximos y mínimos, como cabría esperar de un proceso interferencial. ¿Cuál es la razón de que ocurra esto? Para comprender las interferencias con luz debemos tener en cuenta, en primer lugar, que en el rango visible, la frecuencia de la luz es del orden de f ~ 1014 Hz y la longitud de onda del orden de λ ~ 0,5 µm. Esto significa que en un segundo se han producido 1014 oscilaciones. A estas frecuencias tan elevadas, no pueden percibirse las oscilaciones individuales de las ondas, a diferencia de la familiar observación de los máximos y mínimos de las ondas en la superficie de un líquido. En el caso de la luz, lo que se detecta son valores promedio de la intensidad resultante, y sólo se observarán fenómenos interferenciales si el patrón resultante de la interferencia permanece estable y sin alterarse durante un tiempo suficientemente largo. Para ello es necesario utilizar fuentes luminosas cuya fase permanezca estable durante un tiempo suficientemente largo, lo que no ocurre en ninguna fuente de luz convencional. El grado en que la fase de una onda luminosa permanece estable en el tiempo se denomina coherencia. Se puede demostrar que esta característica está relacionada con la monocromaticidad de la fuente. Las fuentes de luz habituales emiten no una única frecuencia, sino un cierto intervalo de frecuencias ∆f, que puede ser muy grande, como en el caso del Sol, cuya emisión se extiende desde el ultravioleta al infrarrojo. Su coherencia es baja. Si se desea una fuente de luz de gran monocromaticidad y coherencia, se ha de utilizar un láser. La palabra láser es el acrónimo de la expresión inglesa “Light Amplification by Stimulated Emission of Radiation”, es decir, amplificación de luz por emisión estimulada de radiación. La “emisión estimulada” constituye un mecanismo particular de emisión de luz, propuesto por Einstein en 1917 y demostrado experimentalmente en 1960 por Maiman mediante el láser de rubí, cuya comprensión requiere utilizar el marco de la mecánica cuántica y rebasa los objetivos de este texto. Podemos indicar, sin entrar en detalles, que la emisión de un láser se caracteriza por ser muy monocromática, es decir, con una frecuencia y longitud de onda fijas, y manteniendo una fase estable. Se dice que se trata de una fuente de luz coherente. Esta característica también está relacionada con la direccionalidad de la emisión. La emisión de luz por un láser se realiza en una dirección bien determinada, dando lugar a un haz cuya sección se conserva al propagarse, sin aumentar de área y manteniendo, por tanto, su intensidad a lo largo de grandes distancias.
Ondas: luz y sonido
269
Utilizando luz láser sí es posible la observación de patrones interferenciales estables. De hecho, ese es un procedimiento (denominado interferometría) que se utiliza tanto para medir la longitud de onda de la luz como para medir distancias del orden de la longitud de onda de la luz (λ ≈ 500 nm). En Biología y Medicina los láseres se utilizan con frecuencia como medio para suministrar energía que, absorbida por algún tejido, se transforma en calor. Utilizado con alta potencia y focalizado, el calor liberado causa un aumento rápido de temperatura, destruyendo el tejido iluminado. Un láser puede ser utilizado como “bisturí autocoagulante”, ya que, además de cortar el tejido, provoca la coagulación en los puntos adyacentes al corte, evitando la pérdida de sangre. Hoy en día existen diferentes láseres, que emiten en longitudes de onda desde el ultravioleta hasta el infrarrojo, por lo que se puede elegir la longitud de onda adecuada en función de la absorción de los diferentes tejidos y la aplicación deseada. Digamos, por último, que el láser no es una fuente de energía, sino que transforma en emisión de luz coherente la energía que le ha sido suministrada previamente (en forma de corriente eléctrica, por ejemplo) por alguna fuente externa. En esto, el láser es exactamente igual a una bombilla. Observación. Frecuencias de fusión. El ojo humano no es capaz de percibir como distintas la sucesión de imágenes discretas que nos ofrece la TV o el cine. Si se disminuyese su frecuencia, el ojo sí sería capaz de distinguir que se trata de una sucesión de fotogramas. El límite para distinguir o no dicha superposición se conoce como frecuencia de fusión (o parpadeo), y en el caso del ser humano es de unos 60 Hz en luz brillante y 40 Hz con intensidades bajas. Algunos animales parecen ser capaces de percibir variaciones más rápidas, por ejemplo la mosca, que tiene una frecuencia de fusión mucho más alta (300 Hz). Pero, aun así, éstas son frecuencias incomparablemente más bajas que las frecuencias características de la luz visible (1014 Hz). El ojo detecta un valor promedio de intensidad, y solo se detectarán fenómenos interferenciales si el patrón resultante es estable, es decir, invariable en el tiempo. Observación. Interferencias en películas delgadas. Colores interferenciales. Otro posible procedimiento para obtener dos fuentes luminosas coherentes y, por tanto, observar efectos interferenciales es la llamada división de amplitud. Si un haz de luz incide sobre una lámina de material transparente, de índice de refracción n, se producen transmisiones y reflexiones parciales en sus dos caras, debido al cambio de índice de refracción respecto al aire, tal como estu diamos en la sección 21.5. Esto genera una serie de ondas, por reflexiones
270
Fundamentos físicos de los procesos biológicos
múltiples que, si el espesor de la lámina es suficientemente pequeño (una pelí cula delgada), son coherentes, dando lugar a la observación de fenómenos interferenciales. El desfase relativo de las ondas que interfieren depende del espesor (d) e índice de refracción (n) de la lámina, del ángulo de incidencia θ y de la longitud de onda de la luz λ. δ = δ ( d , n, θ , λ )
Cuando se ilumina con luz blanca, las condiciones interferenciales difieren para los distintos colores, que a su vez cambian dependiendo del ángulo de observación. Esto da lugar a los efectos de color de tipo iridiscente, que se observan en muchas ocasiones en la naturaleza. Son bien conocidos los observados en la coloración en las pompas de jabón, pero podemos añadir los colores observables en las iridiscencias nacaradas de muchas conchas de moluscos, que se deben también a fenómenos de tipo interferencial y no a pigmentos absorbentes.
21.7 Difracción Cuando hemos descrito la propagación de una onda en el espacio libre (sección 21.3), hemos utilizado de forma complementaria la doble representación de dicha onda como un conjunto de frentes de onda y de rayos. Sin embargo, cuando una onda encuentra un obstáculo en su camino, estas dos descripciones no son equivalentes. Los rayos (propagación rectilínea) deberían ser detenidos por el obstáculo, mientras que las ondas tienen la posibilidad de bordearlo (propagación no rectilínea). Cuando una onda se aparta de la propagación rectilínea al encontrarse con un obstáculo y tiende a rodearlo, decimos que se produce difracción. Aunque este fenómeno ocurre siempre, su magnitud depende de la relación entre la longitud de onda y el obstáculo, por lo que luz y sonido parecen comportarse de forma diferente. Si colocamos nuestra mano delante de la boca (sin taparla por completo, digamos que a unos 10 cm delante de ella), esto no impide que el sonido llegue a nuestros interlocutores. Sin embargo, si se procede de forma similar, tapando la parte frontal del haz luminoso procedente de una linterna, impediremos que su luz se propague. La razón de estas diferencias estriba en las diferencias en longitud de onda. Como las longitudes de onda del sonido están comprendidas entre algunos centímetros hasta varios metros, resultan comparables con el tamaño de los obstáculos (la mano del ejemplo anterior, puertas, ventanas, etc.) y la difracción del sonido es un fenómeno común en nuestra vida diaria. En cambio, la longitud de onda de la luz visible es del orden de 5 × 10 ‒7 m, es decir, mucho
Ondas: luz y sonido
271
más pequeña que los obstáculos habituales y la difracción de la luz no aparece en la experiencia cotidiana, sino que la “propagación rectilínea” y la existencia de sombras bien definidas constituye la imagen habitual. Sin embargo, para ondas electromagnéticas de otro rango espectral, los efectos sí son claramente perceptibles. Por ejemplo, las ondas de radiofrecuencia, con longitudes de onda del orden de kilómetros, pueden alcanzar las antenas receptoras de nuestros aparatos de radio y televisión, aunque para ello deban “bordear” los edificios que se interponen en su camino desde la estación emisora.
21.7.1 Difracción de la luz por una abertura circular Como ya hemos indicado, en la mayoría de las ocasiones la longitud de onda de la luz es mucho menor que los obstáculos que suele encontrar en su propagación, por lo que, aparentemente, una fuente puntual produce sombras bien definidas. Sin embargo, un examen detallado nos revelaría que las sombras en realidad no están perfectamente definidas, sino que bordeando los límites de la sombra aparece una sucesión de franjas brillantes y oscuras, similares a las producidas por fenómenos interferenciales, y características también de los fenómenos difraccionales. La descripción rigurosa de la difracción es un problema de gran complejidad que, incluso en los textos de óptica especializados, sólo se aborda para algunas aberturas u obstáculos de geometría sencilla, sobrepasando con creces los objetivos de este libro. Consideraremos únicamente el caso de difracción de la luz producido al atravesar una abertura circular, ya que ésta es la forma de las aberturas que atraviesa la luz en multitud de ocasiones: desde la pupila del ojo a las lentes utilizadas en los diferentes instrumentos ópticos, tales como cámaras fotográficas, microscopios, etc. En estos instrumentos, al formarse una imagen, cada punto del objeto O da lugar a un punto imagen O’ cuyo conjunto nos da la imagen fidedigna del objeto. Esto es así siempre que el tamaño de las aberturas que atraviesa la luz en el instrumento (lentes, diafragmas...) sea grande, comparado con la longitud de onda de la luz, ya que entonces los efectos debidos a la difracción son irrelevantes. Sin embargo, si el tamaño de las aberturas se reduce hasta que sus dimensiones sean comparables a la longitud de onda, se produce un efecto sorprendente, apareciendo en la imagen una serie de anillos, tales como los que representan en la figura 21.36, correspondiente al diagrama de difracción producida por un orificio circular de pequeño tamaño (diámetro D ≈ 0,4 mm) cuando se ilumina con la luz azul de un láser de Ar (λ = 488,0 nm). Como
272
Fundamentos físicos de los procesos biológicos
puede verse, consta de un anillo central principal y una serie de anillos secundarios de intensidad decreciente.
Fig. 21.36. Figura de difracción producida por un orificio circular de 0,4 mm de diámetro, cuando se ilumina con la luz azul de un láser de Ar (λ = 488,0 nm). Como puede verse, consta de un anillo central principal y una serie de anillos secundarios de intensidad decreciente. (Imagen cortesía de Eugenio Cantelar, Departamento de Física de Materiales, UAM).
El cálculo detallado de la distribución de intensidad en la imagen es posible en este caso, gracias a la geometría sencilla del problema, demostrándose que tiene la forma representada en la figura 21.37, donde se representa la intensidad en función de la variable u = k R senθ , siendo k = 2π λ el número de onda, R el radio de la abertura circular y θ el ángulo con el eje. Esta función se denomina función de Airy en honor del astrónomo británico Sir G.B. Airy (1801-1892), quien fue el primero en calcularla.
Fig. 21.37. Geometría y variables de interés en la difracción por una abertura circular de radio R. La distribución de intensidad consiste en una serie de anillos, cuya intensidad varía en función del ángulo θ. A la derecha se representa la distribución de intensidad (función de Airy). El radio angular del disco central corresponde a u = 3,83, es decir: θ ≈ 1,22 λ/D.
273
Ondas: luz y sonido
Como puede verse, la intensidad resultante es una serie de máximos y mínimos, siendo la intensidad del máximo central muy superior a la de los demás, cuyo valor decrece al alejarnos del centro de la imagen. De hecho, la intensidad se concentra fundamentalmente en el máximo central, que supone el 84 % de la intensidad total. De las propiedades de la función de Airy se puede calcular la extensión del máximo central, ya que el primer cero de la distribución angular corresponde a: = u k= R sen θ 3, 83
y, por tanto, el radio angular del disco central es: 3, 83 3, 83 λ λ θ ≈ senθ == = 1, 22 kR π 2 R D
(21.60)
siendo D = 2R el diámetro de la abertura. Aplicando la expresión anterior a las condiciones en que se obtuvo la figura de difracción representada en la figura 21.36, D ≈ 0,4 mm y λ ≈ 488 nm, se obtiene: θ ≈ 1, 22
λ 488 × 10−9 −3 = 1, 22 ≈ 1, 5 × 10= rad 0, 085º ≈ 5 ' 4 × 10−4 D
En la fotografía de la figura, el disco central de difracción tiene un radio de unos 6 mm, habiendo sido obtenido sobre una pantalla situada a unos 4 m de distancia de la abertura difractora, por lo que el radio angular experimental es: 6 × 10−3 θ ≈ tgθ = = 1, 5 × 10−3 rad 4
es decir, coincidente con las predicciones de la ecuación (21.60). Como se ha indicado más arriba, a pesar del esparcimiento lateral de la luz debido a la difracción, la mayor intensidad se concentra en el máximo central, por lo que podemos considerar que el resultado principal de los efectos de la difracción es el hecho de que la imagen de un punto no es otro punto sino una imagen circular, de tamaño finito. El radio angular resulta ser: θ ≈ 1,22 λ/D. Como habíamos indicado al inicio de esta sección, la magnitud de los efectos difraccionales depende de la relación entre la longitud de onda y las dimensiones de las aberturas (u obstáculos). Si la abertura es grande (D >> λ), la figura de difracción se estrecha (θ → 0), dando lugar a una imagen de la rendija bien definida y localizada. Por el contrario, cuando la rendija tiene dimensiones comparables a la longitud de onda, la mancha de difracción se
274
Fundamentos físicos de los procesos biológicos
ensancha, limitando la capacidad de los instrumentos ópticos, como vemos a continuación.
21.7.2 Poder de resolución de los instrumentos ópticos. Criterio de Rayleigh La difracción es fundamental para determinar la capacidad de formar imágenes en los instrumentos ópticos. Para comprender esto examinemos la formación de la imagen de un objeto por una lente simple L. Sin entrar en detalles, que veremos en el próximo capítulo, basta considerar que por cada punto del objeto Oi la lente forma una imagen puntual O’i cuyo conjunto nos da la imagen fidedigna del objeto (fig. 21.38.a). Pero debido al tamaño finito de las lentes, aparecen efectos de difracción y, por tanto, la imagen de un punto ya no es otro punto, sino una mancha circular cuya distribución de intensidades viene dada por la función de Airy. Cuando las aberturas son grandes comparadas con la longitud de onda (λ/ D << 1), el radio angular es despreciable y la imagen es aproximadamente puntual. Sin embargo, para aberturas menores el tamaño finito de la imagen se hace apreciable. En consecuencia, si tenemos dos objetos O1 y O2 (estrellas, detalles de un microorganismo, etc.) que se observan con cierto instrumento óptico (telescopio, microscopio...), sus imágenes O’1 y O’2 estarán formadas por las dos manchas de Airy respectivas (fig. 21.38.b). Si aparecen suficientemente separadas, seremos capaces de identificar cada uno de los objetos, pero si los “discos de Airy” se superponen, las imágenes se confunden. Es evidente que no sirve de nada tener dos imágenes confundidas una con otra, aunque sean de gran tamaño. Lo que interesa, en cualquier instrumento óptico, es que las imágenes (las dos manchas de Airy) estén suficientemente separadas como para distinguirlas, es decir, el poder de resolución del instrumento y no tanto sus aumentos.
Ondas: luz y sonido
275
Fig. 21.38. (a) Si se desprecian los efectos difraccionales, dos objetos puntuales O1 y O2 dan lugar a dos imágenes también puntuales O’1 y O’2. (b) Considerando los efectos difraccionales, las imágenes son en realidad dos “manchas de Airy” que se percibirán separadas o no dependiendo de su tamaño (radio del primer máximo de difracción) y de la separación angular θ con que se observen.
Para caracterizar el poder de resolución de los instrumentos ópticos se suele adoptar el llamado criterio de Rayleigh, según el cual dos imágenes se consideran suficientemente resueltas cuando el máximo principal de una de ellas no se superpone al de la otra, es decir, cuando está a una distancia superior al primer mínimo de difracción de la otra imagen. La separación angular mínima para resolver ambas imágenes coincide por tanto con el radio angular del disco central de Airy, dado por la ecuación (21.60): θmínimo ≈ 1,22 λ/D. Para separaciones angulares menores, las imágenes se confunden (fig. 21.39.a), mientras que para separaciones iguales o mayores, las imágenes estarán resueltas (fig. 21.39.b).
276
Fundamentos físicos de los procesos biológicos
Fig. 21.39. Superposición de las imágenes (manchas de Airy) de dos objetos puntuales: (a) Si la separación angular es pequeña las dos imágenes aparecen confundidas. (b) La separación angular mínima para considerar dos imágenes suficientemente separadas es aquella en la que el máximo de una de ellas coincide con el primer mínimo del patrón de difracción de la otra imagen (criterio de Rayleigh). Esta separación angular es, por tanto, u = 3,83 o θ ≈ 1,22 λ/D.
Observación. Difracción de la luz por estructuras periódicas (redes de difracción): cristales y estructuras biológicas. Existen en la naturaleza muchas situaciones en las que se produce difracción por estructuras que se repiten con una cierta periodicidad, como por ejemplo los átomos o molé culas ordenados espacialmente formando las diferentes estructuras crista linas. Estas estructuras periódicas constituyen lo que se denomina una red de difracción. Cuando iluminamos una red de difracción (léase, una estructura perió dica), con luz monocromática de longitud de onda λ, se observa que aparecen haces de luz difractada preferentemente en determinadas direcciones. Esto es debido a que, en esas direcciones particulares, las ondas procedentes de las distintas aberturas se superponen en fase, dando lugar a un máximo de intensidad. Aunque la forma precisa de la distribución de intensidades de la luz difractada depende de diferentes características de la red (dimensiones
277
Ondas: luz y sonido
de las aberturas, número de ellas, etc.), las direcciones en que se observan los máximos de intensidad están determinadas por la periodicidad de la red d (y la longitud de onda λ de la luz), a partir de la que se conoce como ecuación de la red: d sen θ m = m λ
m= 0, ± 1, ± 2,
(21.61a)
es decir, un conjunto de direcciones discretas, donde se concentra la luz: λ θ m ≈ sen θ m = m d
(21.61b)
Igual que sucedía con los fenómenos interferenciales (sección 21.6), las direcciones en que se observan los máximos de difracción dependen de la longitud de onda de la luz, lo que implica que al iluminar con luz blanca se producen efectos cromáticos, fácilmente observables. Un ejemplo al alcance de todos es la reflexión de luz que se produce en los discos compactos (CD). El disco compacto está grabado con una serie de surcos y muescas distri buidos con una cierta periodicidad, sobre una superficie reflectante, por lo que funciona como una red de difracción por reflexión. Al iluminar con luz blanca, los diferentes colores (diferentes longitudes de onda) son difrac tados con ángulos diferentes y, por tanto, separados angularmente, lo que se observa fácilmente a simple vista. Otro ejemplo donde los efectos difraccionales se hacen patentes lo cons tituyen los ordenamientos regulares de átomos y moléculas en las estructuras cristalinas. En este caso, sin embargo, la separación típica de los planos ató micos, que determina la periodicidad de la estructura causante de la difrac ción, es del orden de unos cuantos angstrom (1 Å = 10–8 cm = 10–10 m). Por tanto, la longitud de onda de la luz visible es superior a esta separación (λ/d > 1) y sólo se produce el orden cero de difracción, ya que no existe ningún ángulo θm (m ≠ 0) que satisfaga la ecuación de la red: λ λ sen θ m= m × ≥ > 1 d d
En consecuencia, para observar la difracción por cristales es necesario utilizar ondas electromagnéticas cuya longitud de onda sea comparable al espaciado entre planos cristalinos (d ∼ Å), es decir, rayos X. Por otra parte, a partir de una misma estructura cristalina se pueden derivar distintas direc ciones en las que se producen ordenamientos atómicos regulares, con dife rente espaciado, y un mismo cristal da lugar a múltiples periodicidades (d). Al hacer incidir sobre un cristal un haz de rayos X, con varias longitudes de onda, se produce difracción en múltiples direcciones. El registro de estas
278
Fundamentos físicos de los procesos biológicos
direcciones sobre una pantalla o sobre una película fotográfica da lugar a un conjunto de puntos que constituye lo que se denomina un diagrama de difracción de Laue, como el que se muestra en la figura 21.40, del que puede extraerse información sobre la estructura del cristal de partida. La difracción de rayos X se utiliza también en aquellos compuestos biológicos susceptibles de cristalizar, y entre sus aplicaciones en Biología cabe recordar los estudios realizados por F.H.C. Crick, J.D. Watson y M.H.F. Wilkins (premios Nobel de Fisiología y Medicina en 1962) que per mitieron desvelar la estructura helicoidal del ADN, o la determinación de la estructura de la GFP (Green Fluorescent Protein) por O. Shimomura (premio Nobel de Química en 2008), de gran utilidad como marcador luminiscente.
Fig. 21.40. Diagrama de difracción de Laue de un cristal de LiNbO3, crecido de forma artificial en los laboratorios de la Universidad Autónoma de Madrid para su aplicación en dispositivos fotónicos.
Observación. Colores estructurales. Mencionábamos anteriormente la aparición, en la naturaleza, de colores de tipo interferencial, ligados a fenó menos de reflexiones múltiples en láminas transparentes, dando lugar a iri discencias características. A esos fenómenos podemos añadir ahora efectos similares debidos a la existencia de “redes de difracción” naturales tales como las alas de muchas mariposas, los élitros de algunos escarabajos o el plumaje del pavo real y algunas otras aves, donde aparecen estructuras periódicas bien diferenciadas. Los brillantes efectos de coloración que producen no tienen que ver con ningún tipo de pigmento (absorbentes de luz), sino con los efectos de interfe rencia y difracción selectiva para las diferentes longitudes de onda. Este tipo de coloración, en su conjunto, recibe el nombre de colores estructurales.
Ondas: luz y sonido
279
21.7.3 Difracción del sonido La difracción del sonido es un fenómeno que se produce de forma habitual en nuestra experiencia diaria. Recordemos que el rango de audición humano se extiende a ondas sonoras de frecuencias comprendidas entre 20 Hz y 20 kHz, es decir, longitudes de onda entre 17 m y 17 mm (sección 4.1). Por tanto, las ondas sonoras encuentran normalmente en su propagación obstáculos de tamaño comparable a su longitud de onda, lo que da lugar a la manifestación de los efectos difraccionales. Estos efectos también se producen por reflexión, como hemos indicado al considerar las redes de difracción. Si los objetos reflectantes son mucho mayores que la longitud de onda, la reflexión es nítida y con “sombras” definidas, delimitando de forma precisa los bordes del objeto, mientras que si el objeto es de dimensiones comparables a la longitud de onda, éstas bordean el objeto, reduciendo la eficiencia de la reflexión y, además, las ondas reflejadas se distribuyen en varias direcciones, reduciendo aún más su intensidad (fig. 21.41). Es explicable, por tanto, que aquellos animales que utilizan las ondas sonoras para explorar activamente su entorno (ecolocalización) recurran a ondas ultrasónicas, con frecuencias elevadas y longitudes de onda cortas, que les permiten detectar objetos de menor tamaño. Como indicábamos en la sección.4.1, los murciélagos emiten y perciben ultrasonidos de frecuencias f ≈ 120 kHz, lo que hace posible que detecten objetos de tamaño comparable a la longitud de onda asociada, es decir, de unos pocos milímetros. En el caso de los delfines, que emiten y detectan ultrasonidos de frecuencia f ≈ 150 kHz, la longitud de onda asociada es: λ = 1,5 × 103 / 1,5 × 105 = 10 ‒2 m = 1 cm, donde se ha tenido en cuenta ahora que la propagación de las ondas se realiza en el agua, a una velocidad de 1.500 ms–1 aproximadamente. Por la misma razón, en las aplicaciones médicas donde se utilizan las ondas acústicas como sonda para detectar objetos y formar imágenes (ecografía), se usan también ultrasonidos.
280
Fundamentos físicos de los procesos biológicos
Fig. 21.41. Reflexión de ondas sonoras incluyendo efectos difraccionales. (a) Para objetos de tamaño superior a la longitud de onda se produce una reflexión nítida, mientras que (b) para objetos de tamaño comparable a la longitud de onda, la luz se difracta sin definir “sombras” nítidas.
Localización acústica La localización de la dirección de procedencia de una onda sonora es algo que realizamos de forma inconsciente pero, en realidad, se trata de un fenómeno complejo donde intervienen diversos factores, entre ellos efectos difraccionales. El proceso de localización es biaural, es decir, en él intervienen simultáneamente ambos oídos, de forma que, debido a su separación espacial, existen diferencias en la percepción de cada uno de ellos que permiten determinar la dirección de procedencia del sonido. La posición de la fuente sonora afecta a dos magnitudes: el tiempo de llegada y la intensidad de la onda en cada oído. Cuando llega una onda sonora, procedente de una fuente que forma un ángulo θ respecto a la dirección frontal (fig. 21.42), existe una cierta dife rencia de camino hasta alcanzar cada oído y, por tanto, una diferencia de tiempo en su percepción. Si el sonido procede de la derecha llegará antes al oído derecho, mientras que si procede del lado izquierdo será dicho oído quien lo reciba en primer lugar. Por otra parte, la intensidad también depende de la dirección de procedencia del sonido, siendo mayor en el oído más cercano a la fuente.
Ondas: luz y sonido
281
Fig. 21.42. La dirección de procedencia de una onda acústica da lugar a diferencias en la percepción de cada oído, tanto en la intensidad como en la fase de la onda.
Examinemos en primer lugar los efectos debidos a la diferencia de intensidades con que el sonido llega a cada oído, denominada diferencia de intensidad interaural (DII). Cuando nos llega una onda acústica, la intensidad percibida por uno u otro oído está afectada por la sombra que proyecta nuestra propia cabeza. Los resultados experimentales indican que la diferencia de intensidad puede variar entre 0 dB y 20 dB, existiendo una clara dependencia con la frecuencia (fig. 21.43).
Fig. 21.43. Diferencia de intensidad percibida por cada oído o diferencia de intensidad interaural (DII), debida a la sombra proyectada por la cabeza, en función del ángulo de procedencia del sonido. A alta frecuencia, la diferencia de intensidades puede llegar a ser de ±20 dB, mientras que a baja frecuencia las diferencias desaparecen, debido a efectos difraccionales.
282
Fundamentos físicos de los procesos biológicos
Esto es debido a que las sombras sobre los oídos serán definidas únicamente cuando podamos despreciar los efectos difraccionales, de forma que a frecuencias altas se producen las mencionadas variaciones de ±20 dB. A medida que disminuye la frecuencia, es decir, aumenta la longitud de onda, aumenta la difracción y las ondas acústicas “bordean” la cabeza sin que se detecten apenas diferencias de intensidad en ambos oídos. En consecuencia, este procedimiento de identificación de la dirección de procedencia del sonido se puede considerar efectivo mientras la longitud de onda sea inferior a las dimensiones de la cabeza, cuyo diámetro d es de unos 20 cm, lo que resulta en un valor mínimo para la frecuencia del sonido cuya dirección podemos identificar a través de la DII. λ=
v
⇒
f >
v 340 ≈ ≈ 1.700 Hz d 0, 2
Para frecuencias inferiores (longitudes de onda más largas) la localización de una fuente sonora se realiza a partir de la diferencia de tiempo con que el sonido llega a cada oído, denominada diferencia de tiempo interaural (DTI). Si la distancia entre oídos es d (≈ 20 cm en el ser humano) y el sonido procede de una fuente en la dirección θ (figura 22.72), la diferencia de tiempos ∆t en alcanzar los oídos es: ∆t ≈
AB d senθ = v v
siendo nula para un objeto situado frontalmente (θ = 0º) y máxima para loca lización lateral (θ = 90º), siendo en este caso: = ∆t
d senθ 0, 2 × 1 = ≈ 600 µ s v 340
Es decir, cuando el sonido procede de la derecha, el oído derecho lo percibe unos 600 µs antes que el oído izquierdo, y viceversa. Las diferencias perceptibles son, por tanto, inferiores a ±600 µs (fig. 21.44), pequeñas pero suficientes para su procesado por nuestro sistema sensorial.
283
Ondas: luz y sonido
Fig. 21.44. Diferencia del tiempo de llegada del sonido a cada oído o diferencia de tiempo interaural (DTI), en función de la orientación de la fuente sonora.
La diferencia en los tiempos de llegada implica una diferencia de fase ∆ϕ entre las ondas que llegan a los dos oídos, de forma que en uno de ellos se puede percibir un máximo de presión y en el otro un mínimo. La relación entre la diferencia de fase ∆ϕ y el retraso ∆t entre la llegada a ambos oídos es: Δφ = ω × Δt = 2π f Δt siendo f la frecuencia de la onda sonora. Si imponemos la condición de que el desfase sea inferior a 2π, para evitar ambigüedades, esto marca un límite en el rango de frecuencias en el que nuestro sistema sensorial puede utilizar este procedimiento de localización del origen de la fuente sonora. En efecto, Δφ = 2π f Δt < 2π lo que implica: f<
1 ∆t
y haciendo uso del retraso máximo calculado anteriormente ( ∆t ≈ 600 µ s ), se obtiene: f <
1 ≈ 1.600 Hz 600 × 10−6
En resumen, aunque estos cálculos sean únicamente orientativos, podemos considerar que existen dos procesos diferentes para la identificación de la dirección de procedencia de un sonido, que operan alternativamente dependiendo del rango de frecuencias de las ondas acústicas: las diferencias de intensidad (DII) y las diferencias de tiempo interaurales (DTI). Para ondas
284
Fundamentos físicos de los procesos biológicos
con longitud de onda inferior a las dimensiones de la cabeza se produce un efecto de sombra, que tiende a disminuir la intensidad de la señal detectada por el oído que quede oculto por la cabeza. Este es el procedimiento operativo para frecuencias por encima de unos 1.700 Hz. Alternativamente, para frecuencias inferiores, son las diferencias de tiempo (fase) las que permiten localizar el origen del sonido. Se ha encontrado una correlación entre los límites (superior e inferior) de frecuencias de audición y la localización auditiva, a través de la distancia entre los oídos. En efecto, se observa experimentalmente que los mamíferos con una separación grande entre oídos tienen un dominio auditivo desplazado hacia las bajas frecuencias. Así, el elefante percibe frecuencias desde 10 Hz hasta unos 10.000 Hz, es decir, límites auditivos aproximadamente iguales a la mitad de los típicos en el hombre. Por el contrario, animales más pequeños que el hombre alcanzan límites de frecuencia superiores, tal como se mostraba en la figura 21.16. Nótese que, en el caso de los animales marinos, habría que utilizar como longitud característica la longitud de onda en el agua, es decir: = λagua v= agua f
(v
agua
vaire ) λaire ≈ 4, 4 λaire
21.8 Efecto Doppler Todos hemos percibido alguna vez el cambio de tono del sonido emitido por un vehículo al acercarse o alejarse de nosotros. El zumbido de una motocicleta o el pitido de un tren cambian de tono de forma perceptible: cuando el móvil se acerca el sonido se percibe como más agudo y cuando se aleja, como más grave. El fenómeno es similar si somos nosotros quienes nos acercamos o alejamos de una fuente sonora en reposo. En cualquier caso, el sonido parece más agudo cuando la fuente y el receptor se acercan y más grave cuando se alejan. Este cambio en la frecuencia que percibe un observador cuando existe movimiento relativo entre el emisor y el receptor de ondas recibe el nombre de efecto Doppler. Consideremos, para su visualización, un emisor que produce ondas en la superficie de un líquido, con una cierta frecuencia f. En la figura 21.45 se representa el instante en que un frente de ondas (1) llega al receptor, mientras que el frente de ondas siguiente (2), emitido un tiempo T= 1/f después del primero, se encuentra a una distancia igual a la longitud de onda λ = vT, siendo v la velocidad de propagación de las ondas. Si el emisor y el receptor están en reposo, este segundo frente llegará a él al cabo de un tiempo T y la frecuencia percibida por el receptor es f R = 1/T = f, es decir, igual a la frecuencia de emisión.
285
Ondas: luz y sonido
Fig. 21.45. Dos frentes de onda sucesivos están a una distancia λ y llegan al receptor con un intervalo de tiempo T, cuando el emisor y el receptor están en reposo.
Sin embargo, cuando el receptor y el emisor están en movimiento relativo, aparecen diferencias entre la frecuencia de emisión y la percibida por el receptor. Supongamos en primer lugar que el receptor permanece en reposo y el emisor está en movimiento, con velocidad vE. La frecuencia percibida por el receptor cambia respecto a la percibida en estado de reposo, ya que los frentes de onda sucesivos son emitidos desde posiciones diferentes: más próximas si el receptor se acerca y más separadas si se aleja, tal como se representa en la figura 21.46. Si el receptor está a la izquierda de la figura (R1) percibirá una longitud de onda menor λ1, mientras que si está a la derecha (R 2) la longitud de onda percibida λ2 será mayor. El frente de ondas (1), emitido por el emisor a una cierta distancia D del receptor, tardará en alcanzarle un tiempo t1 = D/v. El frente (2) se emitirá al cabo de un tiempo T, en el que el emisor habrá recorrido una distancia vET, por lo que la distancia que ha de recorrer hasta alcanzar al receptor será: D ± vET, donde el signo “+” es el adecuado cuando el emisor se aleja y el signo “–” cuando se acerca. Por tanto, el tiempo transcurrido hasta que el segundo frente alcanza al receptor será: t2 = T+ (D ± vET)/v. El periodo T’ que percibe el receptor será la diferencia entre la llegada de los dos frentes de onda, es decir: D ± vE T T =' t2 −= t1 T + v
y la frecuencia percibida:
v v±v D T ± E T =E T − = v v v
286
Fundamentos físicos de los procesos biológicos
f= R
1 v 1 v = = f T ' v ± vE T v ± vE
(21.62)
Cuando el emisor se acerca, debemos utilizar el signo “–” y, por tanto, T’
f, es decir, el sonido parece más agudo. Por el contrario, si el receptor se aleja, debemos utilizar el signo “+” y entonces T’>T y f R < f, por lo que el sonido parece más grave.
Fig. 21.46. Si el emisor está en movimiento, la frecuencia percibida por el receptor cambia respecto al valor en reposo. Cuando el emisor se acerca, la longitud de onda disminuye, es decir, la frecuencia aumenta y el sonido parece más agudo. Por el contrario, si el receptor se aleja, la longitud de onda aumenta, la frecuencia disminuye y el sonido parece más grave.
De forma similar se puede analizar el fenómeno cuando el emisor está en reposo y es el receptor quien está en movimiento, con velocidad vR. Sin detallar el cálculo, se demuestra que la frecuencia percibida por el receptor es: v ± vR fR = f v
(21.63)
donde el signo “+” corresponde a la situación en que el receptor se acerca al emisor y el signo “–” cuando se aleja. Combinando las ecuaciones (22.62-63), la frecuencia percibida por el receptor, en cualquiera de los casos anteriores, se puede expresar de forma compacta: v ± vR fR = f v ± vE
(21.64)
donde los signos “+” o “–” se deben utilizar con los criterios establecidos con anterioridad. En cualquier caso, debe recordarse que cuando el emisor y el receptor se acercan la frecuencia que éste percibe es mayor que la fre cuencia emitida por el emisor, y viceversa.
287
Ondas: luz y sonido
Si, como ocurre en muchas ocasiones, la velocidad de la onda es muy superior a las velocidades del emisor y receptor (v >> vE, vR), el cambio en frecuencia, respecto a la frecuencia de emisión, puede expresarse como: v ∆f= f R − f ≈ − E , R f v
(21.65)
donde vE,R es la velocidad relativa del emisor respecto al receptor: positiva cuando ambos se alejan (∆f < 0) y negativa cuando se aproximan ((∆f > 0). En medicina, el efecto Doppler se utiliza para obtener información sobre la velocidad de fluidos orgánicos, como el flujo sanguíneo. Si se envía una onda (ultrasonidos, por ejemplo) y se detecta la onda reflejada, el cambio de frecuencia proporciona información sobre su estado de movimiento. Combinado con técnicas digitales es posible transformar esta información en imágenes, permitiendo visualizar y diferenciar flujos laminares o turbulentos en dife rentes vasos sanguíneos o el corazón, lo que permite diagnosticar posibles anomalías circulatorias.
21.9 Apéndice: el oído humano La detección del sonido se realiza por medio del oído, donde las señales acústicas en forma de ondas de presión son transformadas en señales eléctricas, que son seguidamente transportadas por el sistema nervioso para su procesamiento por el cerebro. Aunque en sentido amplio el sistema sensorial acústico incluye todos los elementos anteriores, en esta sección analizaremos únicamente la primera etapa, es decir, básicamente el oído como receptor y conversor de las ondas de presión en señales nerviosas. Recordemos que este “sensor” es capaz de detectar sonidos cuyas frecuencias varían en un factor 103, desde 20 Hz a 20 kHz, e intensidades con variaciones de 120 dB (es decir, un factor 1012). El oído humano, cuya anatomía se ha visto ya en el capítulo 1, representado en las figuras 1.2728, se considera dividido en tres regiones: oído externo, oído medio y oído interno. El oído externo comprende el pabellón y el conducto auditivo, limitado éste en su extremo interno por el tímpano. El pabellón auditivo ayuda en las funciones de captación y participa en los mecanismos de localización de la procedencia del sonido, principalmente en la distinción entre sonidos de procedencia frontal o dorsal. El canal auditivo, de unos 3 cm de longitud y 0,7 cm de diámetro, actúa como cavidad resonante, facilitando la detección del sonido en aquellas frecuencias donde se produce la resonancia. Esto sucede,
288
Fundamentos físicos de los procesos biológicos
aproximadamente, para sonidos cuya longitud de onda λ es igual a cuatro veces la longitud L del canal auditivo, es decir: f=
v v 340 = ≈ ≈ 3 × 103 Hz = 3 kHz λ 4 L 4 × 3 × 10−2
coincidente con la región de frecuencias de máxima sensibilidad del oído, como vimos en la sección 4.1. El tímpano es una membrana elástica que realiza la conversión de las ondas de presión del aire en vibraciones mecánicas, que se transmiten a los huesecillos del oído medio, con los que está conectada por su cara interior. Está formado por varias capas, siendo su estructura fibrosa interna la que le confiere elasticidad y resistencia. El oído medio realiza el acoplo entre el tímpano y el oído interno y, en dicho cometido, realiza dos funciones importantes: (1) proporciona un factor de amplificación entre la presión recibida por el tímpano y la transmitida al oído interno y (2) actúa como mecanismo de protección para evitar daños ante la llegada de sonidos excesivamente intensos. Está constituido por una cavidad llena de aire, dentro de la cual se encuentran tres huesecillos: martillo, yunque y estribo. El martillo está adherido al tímpano por uno de sus extremos, articulándose con el yunque por el otro (fig. 21.47). El yunque a su vez está unido al estribo, cuya base está ligada a la ventana oval de la cóclea (oído interno), a la que transmite las vibraciones mecánicas finales. La cavidad del oído medio se mantiene a presión atmosférica gracias a su contacto con el exterior a través de la trompa de Eustaquio.
Fig. 21.47. Los huesecillos del oído medio: martillo, yunque y estribo conectan, de forma articulada, el tímpano con la cóclea (oído interno).
En su conjunto, el sistema martillo-yunque-estribo actúa como un sistema de palancas que permiten el acoplamiento mecánico entre las oscilaciones acústicas en el aire, procedentes del oído externo, y las ondas en los fluidos contenidos en el oído interno. En este acoplamiento se produce una
289
Ondas: luz y sonido
amplificación de la presión existente en el tímpano respecto a la transmitida a la cóclea, debido, por una parte, al diferente brazo de palanca entre martillo y yunque y, por otra, a la diferencia de áreas entre la membrana timpánica y la base del estribo, tal como se representa esquemáticamente en la figura 21.48.
Fig. 21.48. Diagrama simplificado de los huesos del oído medio. La relación de fuerzas y brazos de palanca entre el tímpano (1) y el oído interno (2) incrementa la presión en éste en un factor cercano a 20.
Por un lado, la relación de brazos de palanca entre yunque y estribo incrementa la fuerza, en la base del estribo, en un factor: F2 =
L1 F1 L2
por otro lado, las presiones pi dependen de las superficies Si sobre las que actúa cada fuerza: pi =
Fi Si
por lo que la relación entre la presión transmitida al oído interno p2, frente a la presión en el oído externo p1, es: p2 F2 S 2 F2 S1 L1 S1 = = × =× p1 F1 S1 F1 S 2 L2 S 2
El área de la membrana timpánica humana es unas 15 veces superior al área de la base del estribo, lo que combinado con las diferencias del brazo de palanca, que proporcionan un factor adicional L1/L2 ≈ 1,3, resulta en una ganancia total de presión del orden de: pcóclea ≈ 20 ptímpano
290
Fundamentos físicos de los procesos biológicos
La segunda función característica del oído medio es la protección del oído interno ante sonidos de intensidad excesiva. En efecto, existen conexiones musculares que se activan de forma automática ante cualquier sonido de sonoridad superior a unos 80-90 dB, lo que se denomina reflejo timpánico, modificando la respuesta de la cadena osicular y reduciendo la eficiencia con que se transmiten las vibraciones al oído interno, protegiéndolo así de sobrecargas. El reflejo timpánico no es instantáneo, sino que tarda en producirse unos 100 ms, por lo que sonidos intensos súbitos pueden dañar gravemente el oído. El oído interno representa el destino final de las señales acústicas donde son procesadas, en parte, y transformadas en señales eléctricas en el sistema nervioso. Esta etapa final tiene lugar en la cóclea o caracol, consistente en un conducto tubular de unos 35 mm de longitud, enrollado en forma de espiral de unas 3 vueltas. La parte en contacto con el oído medio, donde se ubica la ventana oval y la inserción del estribo, recibe el nombre de base, mientras el extremo opuesto, final del arrollamiento, se denomina apex. Una sección transversal de la cóclea (fig. 21.49) revela que se encuentra dividida en tres compartimentos por dos membranas: la membrana basilar y la membrana de Reissner. Los compartimentos externos, llamados scala vestibuli y scala tympani, contienen un fluido llamado perilinfa. El tercero, la scala media, localizado entre ambas membranas, contiene un fluido diferente (endolinfa). La scala vestibuli y la scala tympani están conectadas entre sí a través de un pequeño orificio (helicotrema) localizado en el apex.
Fig. 21.49. Sección transversal de la cóclea, mostrando las membranas basilar y de Reissner, que la dividen en tres compartimentos o scala. En el interior de la scala media, sobre la membrana basilar, se localiza el órgano de Corti.
291
Ondas: luz y sonido
Las vibraciones generadas por las ondas acústicas se transmiten al interior de la cóclea a través de la ventana oval, donde se aloja el estribo, y desplazan la perilinfa en el interior de las scala, lo que, a su vez, da lugar a deformaciones en las membranas internas, en forma de ondas que viajan desde la base hacia el apex. Aunque la anatomía del oído se conocía desde mucho tiempo antes, la comprensión del procesamiento de las señales acústicas en el oído interno, que se realiza en la membrana basilar, no se produjo hasta los trabajos de G. von Békésy (1899-1972), por los que fue galardonado con el premio Nobel de Fisiología y Medicina en 1961. Para ilustrar el modo en que se lleva a cabo el análisis de las frecuencias de los distintos sonidos examinemos la forma de la membrana basilar, realizando un “estiramiento” de la cóclea, tal como se muestra en la figura 21.50.
Fig. 21.50. Cóclea y membrana basilar estirada.
Como puede verse en la figura, la forma de la membrana basilar depende de su posición a lo largo de la cóclea. Cerca de la base, extremo próximo al oído medio, la membrana basilar es a la vez estrecha y delgada, engrosando y ensanchando hacia el apex. Esta geometría hace que la respuesta de la membrana a lo largo de la cóclea sea diferente dependiendo de la frecuencia de excitación. Los experimentos de von Békésy demostraron que, ante la excitación mediante vibraciones armónicas de diferente frecuencia, se producían deformaciones de la membrana basilar cuyo máximo desplazamiento cambiaba de posición al cambiar la frecuencia. Los sonidos de alta frecuencia provocaban respuesta máxima en la zona estrecha de la membrana (la base), mientras los sonidos de baja frecuencia tenían su máxima respuesta en el apex, donde la membrana es más ancha y gruesa (fig. 21.51). Aunque, en este caso, la geometría de la membrana es compleja, este hecho es consistente con la correlación verificada en casos más sencillos a lo largo de este capítulo,
292
Fundamentos físicos de los procesos biológicos
según la cual objetos de dimensión pequeña están asociados con frecuencias altas de resonancia, y viceversa.
Fig. 21.51. Los desplazamientos de la membrana basilar, como respuesta a la excitación por ondas de diferente frecuencia, dan lugar a máximos en posiciones diferentes. La posición del máximo desplazamiento (medida desde el apex) es proporcional al logaritmo de la frecuencia de la excitación.
En consecuencia, podemos decir que el oído interno realiza una conversión frecuenciaposición, localizando las respuestas más eficientes para cada frecuencia en un punto diferente de la cóclea. Cada fragmento de la membrana basilar resuena a una frecuencia distinta de excitación externa, oscilando cada punto de forma significativa sólo en respuesta a una frecuencia bien definida. Los experimentos demuestran, además, una respuesta logarítmica, es decir, la posición del máximo desplazamiento (medida desde el apex) es proporcional al logaritmo de la frecuencia, tal como se ilustra en la figura 21.51. El meca nismo de discriminación es tan eficiente que permite al oído distinguir diferencias de frecuencia del 0,3 %, es decir, diferenciar entre sonidos de 1.003 Hz y 1.000 Hz de frecuencia. Los desplazamientos de la membrana basilar son finalmente transformados en impulsos nerviosos por el órgano de Corti. Este órgano, que constituye el transductor final de las ondas de presión, está localizado en el interior de la scala media, sobre la membrana basilar, cubriendo toda la sección transversal a lo largo de la cóclea (fig. 21.52). En la figura pueden apreciarse las células
Ondas: luz y sonido
293
ciliadas, en torno a 20.000 en total, y sobre ellas la membrana tectorial. Las vibraciones de la membrana basilar provocan un desplazamiento lateral entre las células ciliadas y la membrana tectorial que flexiona los cilios. La activación de las células ciliadas genera a continuación los impulsos nerviosos que son finalmente conducidos al cerebro por el nervio auditivo.
Fig. 21.52. Esquema del órgano de Corti, mostrando las células ciliadas y la membrana tectorial, cuyo desplazamiento relativo activa las células ciliadas generando las señales nerviosas auditivas.
21.10 Ejercicios propuestos Ejercicio 21.1 Una onda transversal en una cuerda está descrita por la ecuación: = y ( x, t ) 0, 05 sen (π x − 2π t ) , donde las diferentes magnitudes están expresadas en sus correspondientes unidades en el SI. Calcúlense las siguientes magnitudes características de la onda: (a) la amplitud A, (b) el número de onda k, (c) la frecuencia angular ω, (d) la longitud de onda λ, (e) la frecuencia f, (f) el periodo T y (g) la velocidad de propagación v. Sol.: (a) A = 0,05 m (b) k = π m‒1 (c) ω = 2π rad s‒1 (d) λ = 2m (e) f = 1 Hz (f) T = 1 s (g) v = 2 ms‒1 Ejercicio 21.2 Un fragmento de madera que flota en el mar oscila vertical mente, debido a las olas, completando 10 oscilaciones en 50 s, siendo la dis tancia entre el punto más alto y el más bajo de 2 m. Por otro lado, observando las crestas de las olas, se puede estimar que la distancia entre ellas es de 10 m. Calcúlese: (a) el periodo T, (b) la longitud de onda λ, (c) la amplitud A, (d) la frecuencia f, (e) la velocidad de propagación v; (f) escríbase la ecuación que describe el movimiento ondulatorio y(x,t). Sol.: (a) T = 5 s (b) λ = 10 m (c) A = 1 m (d) f = 0,2 Hz (e) v = 2 ms–1
294
Fundamentos físicos de los procesos biológicos
x t − 10 5
= y ( x, t ) sen 2 π (d)
Ejercicio 21.3 El oído humano puede percibir ondas acústicas de frecuen cias comprendidas entre f1 = 20 Hz y f 2 = 20.000 Hz, con un máximo de sensibilidad en torno a f0 = 3.000 Hz, cuya velocidad de propagación es de aproximadamente vs = 340 ms1. Calcúlense las longitudes de onda corres pondientes a dichas frecuencias. Sol.: λ1 = 17 m, λ2 = 17 mm, λ0 = 11 cm Ejercicio 21.4 El ojo humano percibe ondas electromagnéticas (luz) de fre cuencias comprendidas entre f1 = 3,8 × 1014 Hz (rojo) y f 2 = 7,7 × 1014 Hz (azul), con un máximo de sensibilidad en torno a f 0 = 5,4 × 1014 Hz (verde). Sabiendo que la velocidad de propagación de la luz en el aire es de aproxi madamente 300.000 km s–1, calcúlense las longitudes de onda correspon dientes a dichas frecuencias. Sol.: λrojo = 0,39 μm, λverde = 0,55 μm, λazul = 0,79 μm Ejercicio 21.5 ¿Cuál es la relación entre las longitudes de onda caracterís ticas del sonido y la luz? Sol.: λsonido/ λluz ≈ 2 × 105 Ejercicio 21.6 La telefonía móvil GSM y UMTS utiliza ondas electromag néticas de frecuencia 900 MHz y 2 GHz, respectivamente. Calcúlense las longitudes de onda correspondientes. Sol.: λGSM = 1/3 m ≈ 33 cm , λUMTS = 0,15 m = 15 cm Ejercicio 21.7 El láser de Ar emite ondas electromagnéticas de longitud de onda: λ Ar = 488,0 nm y el láser de He-Ne: λHeNe = 632,8 nm. Calcúlense sus frecuencias de emisión en el vacío. Sol.: fAr = 6,143 × 1014 Hz, f He ‒ Ne = 4,738 × 1014 Hz Ejercicio 21.8 La intensidad de la luz solar en la Tierra, antes de atravesar la atmósfera, es aproximadamente 1,3 kW/m2, reduciéndose a 1 kW/m2 en la superficie. ¿Cuál es la energía solar total recibida por la superficie terrestre en un día? (Radio de la Tierra, R≈ 6.370 km). Sol.: 1,1 × 1022 J
Ondas: luz y sonido
295
Ejercicio 21.9 Tomando la intensidad de la luz solar en la superficie terrestre igual a 1 kW/m2. ¿Cuál es la irradiancia (a) en el ecuador, (b) en los polos y (c) en una latitud intermedia (L ≈ 45º)? Sol.: (a) 1 kW/m2 (b) 0 kW/m2 (c) 0,71 kW/m2 Ejercicio 21.10 La intensidad de la luz solar en la superficie terrestre es I ≈ 1 kW/m2. En una vivienda situada en una región de latitud L = 45º, se desea uti lizar la radiación solar como fuente energética, por medio de células solares fotovoltaicas de eficiencia η = 10 %, necesitándose obtener una potencia de 3 kW. Calcúlese: (a) La potencia de luz solar necesaria, (b) la superficie hori zontal que se debe cubrir con las células solares. Sol.: (a) 30 kW (b) 42 m2 Ejercicio 21.11 En la misma región del problema anterior, se utiliza una lupa de 10 cm de diámetro, en posición horizontal, para focalizar la luz solar sobre un área circular de 0,5 cm de diámetro. Calcúlese (a) la potencia captada por la lupa, (b) la irradiancia sobre la zona de focalización. Sol.: (a) 5,6 W (b) 2,8 kW/m2 Ejercicio 21.12 Sabiendo que los radios de las órbitas de Venus, la Tierra y Marte son: RVenus = 1,1 × 108 km, RTierra = 1,5 × 108 km y R Marte = 2,3 × 108 km, y que la intensidad de la luz solar en la Tierra (fuera de la atmósfera) es: ITierra = 1,3 kW/m2, calcúlese el valor de la intensidad de la luz solar en los otros planetas. Sol.: IVenus ≈ 2,4 kW/m2 , IMarte ≈ 0,55 kW/m2 Ejercicio 21.13 El coeficiente de absorción de la luz visible (λ ≈ 0,5 µm) en el agua de mar es α = 0,05 m–1. Determínese (a) la fracción de luz solar que llega a una profundidad de 10 m, (b) la profundidad a la que la frac ción de luz transmitida se ha reducido al 1 % de la incidente (longitud de penetración). Sol.: (a) 61 % (b) 92 m Ejercicio 21.14 El oído humano es capaz de percibir una diferencia de sono ridad entre dos sonidos igual a 1 dB. Calcúlese la relación de intensidades de dichos sonidos. Sol.: I2 / I1 ≈ 1,26 Ejercicio 21.15 Si se duplica la intensidad de una onda sonora. ¿Cuál ha sido el cambio de sonoridad? Sol.: 3 dB
296
Fundamentos físicos de los procesos biológicos
Ejercicio 21.16 La sonoridad de un concierto de rock, a 20 m del escenario, es de 100 dB. Calcúlese (a) la intensidad de las ondas acústicas a esa distancia, (b) la potencia total emitida, suponiendo que las ondas fuesen esféricas. (c) Si se desea utilizar dicha energía (total) para calentar una taza de café (m ≈ 250 g) desde 20 ºC a 40 ºC, ¿durante cuánto tiempo debe seguir tocando la banda de rock? Sol.: (a) 10 ‒2 W m‒2 (b) 1,26 × 10 ‒9 W (c) 1,65 × 1013 s ≈ 0,5 × 106 años Ejercicio 21.17 Las ondas sonoras se expresan con cierta frecuencia en términos de su presión, en lugar de utilizar la intensidad. Si la rela ción de presiones entre dos ondas acústicas es 2, ¿cuál es la relación de intensidades? Sol.: I2 / I1 = 4 (Nota: A veces se utiliza la presión como referencia para la determinación de la sonoridad, que también se puede expresar en dB, como: β ≈ 20 × log (p/pref). En estos casos, la presión de referencia es pref = 20 µPa). Ejercicio 21.18 El vidrio común contiene impurezas de Fe que absorben la radiación solar, principalmente en la región roja del espectro, por lo que aparece de color verdoso si el espesor es grande. Observando un vidrio de ventana, por un canto, se determina que se ha absorbido el 70 % de la radia ción incidente, siendo la longitud del vidrio x = 1 m. Calcúlese (a) el coefi ciente de absorción α, (b) qué fracción de luz atraviesa el vidrio cuando incide sobre sus caras, de espesor d = 5 mm. Sol.: (a) α = 1,2 m–1 (b) 99,4 % Ejercicio 21.19 Una forma alternativa de expresar la absorción de un mate rial es la magnitud denominada densidad óptica D.O., que se define como: D.O. = log (I0/I) siendo I0 la intensidad de luz incidente e I la que emerge después de atravesar un espesor x de material. Obténgase la relación entre densidad óptica y coeficiente de absorción α. Sol.: α ≈
2, 3 × D.O. x
Ejercicio 21.20 (a) Demuéstrese que la variación de la velocidad del sonido con la temperatura se puede expresar como: vsonido ≈ 331 + 0,6 × tC siendo tC la temperatura en grados centígrados. (b) Calcúlese la diferencia de veloci dades entre 0 ºC y 40 ºC. Sol.: (b) ∆v = 12 ms–1
Ondas: luz y sonido
297
Ejercicio 21.21 En un lugar a 100 km de la costa se produce un movimiento sísmico, que se propaga a través de la corteza terrestre con una velocidad vondas sísmicas ≈ 5.000 ms‒1. Simultáneamente se genera un maremoto, que se propaga en el agua con velocidad vmaremoto ≈ 1.500 ms‒1. Calcúlese el tiempo que transcurre entre la detección de las ondas sísmicas y la llegada del mare moto al litoral. Sol.: ∆t ≈ 47 s ≈ ¾ min Ejercicio 21.22 La intensidad de luz solar en la superficie terrestre es del orden de 1 kW/m2. Estímese el valor de las amplitudes de los campos eléctrico E0 y magnético B0 asociados a dicha onda electromagnética. Sol.: (a) E0 ≈ 600 V/m (b) B0 ≈ 2 µT Ejercicio 21.23 Focalizando, mediante una lente, un haz de luz láser pul sado, se consigue provocar la ruptura dieléctrica del aire. Si se focaliza sobre una superficie circular de 2 mm de radio y la duración de los pulsos de luz es de 10 ns, calcúlese la energía de cada pulso, sabiendo que el campo de ruptura dieléctrica del aire es E0 = 3 × 106 V/m. (Supóngase luz linealmente polarizada). Sol.: 1,5 mJ Ejercicio 21.24 La dependencia del índice de refracción con la longitud de onda puede expresarse mediante la “relación de Cauchy”: n(λ) = A + B/λ2, donde A y B son parámetros característicos de cada material. Sabiendo que el índice de refracción de un vidrio para luz de longitud de onda λ1 = 0,4 µm es n1 = 1,502, mientras que para luz de longitud de onda λ2 = 0,7 µm es n2 = 1,468. Calcúlese el valor del índice de refracción para luz de longitud de onda λ = 0,5 µm. Sol.: n = 1,484 Ejercicio 21.25 Si un haz de luz blanca incide desde el aire con un ángulo de 60º sobre una lámina de vidrio cuyo índice de refracción corresponde al estudiado en el problema anterior, determínense los ángulos de refracción para la luz azul (λ1 = 0,4 µm) y la luz roja (λ2 = 0,7 µm). Sol.: θ1 = 35,21º, θ2 = 36,15º Ejercicio 21.26 Compárese el ángulo de refracción de un rayo de luz que incide, desde el aire, con un ángulo de incidencia 45º (a) sobre vidrio y (b) sobre agua, cuyos índices de refracción son respectivamente: nvidrio ≈ 1,5 y nagua ≈ 1,33. Sol.: (a) θvidrio = 28,1º (b) θagua = 32,1º
298
Fundamentos físicos de los procesos biológicos
Ejercicio 21.27 Cuando un rayo de luz atraviesa una lámina transparente de caras paralelas experimenta dos refracciones sucesivas, una en cada cara. Demuéstrese (a) que el ángulo de salida es igual al de incidencia y (b) que el rayo sufre un desplazamiento lateral (t) respecto a la dirección de incidencia igual a: t = d
sen (θi − θ r ) cos θ r
, donde d es el espesor de la lámina, θi es el ángulo
de incidencia y θr el de refracción (sobre la primera cara de la lámina). Ejercicio 21.28 Calcúlese el ángulo límite de reflexión total (θL ) para luz que pase del agua (n = 1,33) al aire. Sol.: θL = 48,75º Ejercicio 21.29 En un sistema de comunicaciones ópticas se utiliza una fibra óptica para enviar una señal a 3 km de distancia. Si a la entrada en la fibra óptica la potencia de la señal es igual a 100 mW, y la atenuación de la fibra es de 0,5 dB/km, ¿qué intensidad Ie de luz emerge al otro extremo de la fibra? Sol.: Ie = 71 mW Ejercicio 21.30 ¿Cuál es la reflectancia y transmitancia para una superficie aire-vidrio a incidencia normal (θi = 0)? Tómense los valores de índice de refracción correspondientes al aire (n1 ≈ 1) y vidrio (n2 ≈ 1,5). Sol.: R = 4 %, T = 96 % Ejercicio 21.31 La separación angular entre los colores azul (λ1 = 0,4 µm) y rojo (λ2 = 0,7 µm) de un haz de luz solar difractado, a primer orden, por un CD es de 10º, calcúlese la separación d entre los surcos del CD. Sol.: d ≈ 1,7 µm Ejercicio 21.32 Un vehículo que circula a 90 km/h se cruza con un coche de policía, que viaja en sentido contrario a 120 km/h. Si la frecuencia de la sirena del coche de policía es f = 500 Hz, ¿qué frecuencia percibe el con ductor del vehículo (a) cuando se aproxima y (b) cuando se aleja, después de cruzarse con el coche de policía? (Vsonido = 340 m/s). Sol.: (a) faprox = 595,1 Hz (b) falej = 421,9 Hz
21.11 Referencias Berne, R.M. y Levy, M.N. Fisiología. Ed. Médica Panamericana, 1986. Cameron, J.R. y Skofronic, J.G. Medical Physics. John Wiliey and Sons, 1978.
Ondas: luz y sonido
299
Chaplin, M. Water structure and behaviour. http://www.lsbu.ac.uk/water/ Hecht, E. y Zajac, A. Optica. AddisonWesley Iberoamericana, 1988. Hofer, H. y Williams, D.R. “The eye’s mechanism for autocalibration”. Optics & Photonics news, 1, 34-39 (2002). Howard, D.M. y Angus, J. “Acoustics and psychoacoustics”. Focal Press. Reed Elsevier plc (1996). Jaque Rechea, F. y Aguirre de Cárcer, I. Bases de la Física medioambiental. Ariel Ciencia, 2002. Molina, L.T. y Molina, M.J. “Absolute absorption cross sections of ozone in the 185 to 350 nm wavelength range”. J. Geophys. Res., 91, 14501-14508 (1986). NASA. The electromagnetic spectrum. (http://imagers.gsfc.nasa.gov) NATO SACLANT Undersea Research Centre Sound, Ocean and Living Marine Resources. (http://solmar.saclantc.nato.int/index.html) National Oceanic and Atmospheric Administration, NOAA. U.S. Department of Commerce. http://oceanexplorer.noaa.gov/explorations/sound01/background/ acoustics/acoustics.html Patton, H.D.; Fuchs, A.F.; Hille, B.; Scher, A.M. y Steiner, R. (eds.). Textbook of physiology, vol. 1: Excitable cells and Neurophysiology. W.B. Saunders company, 1989. Tribustsh, H.; Goslowsky, H.; Küppers, U. y Wetzel, H. “Light collection and solar sensing through the polar bear pelt”. Solar energy materials, 21, 219-236 (1990) Polarized Light in Nature and Technology. http://polarization.com/index-net/ index.html
Capítulo 22. La visión y los instrumentos ópticos 22.1 Introducción: el ojo y la visión en los animales La vida sobre la Tierra no podría concebirse sin la presencia del Sol y la luz que nos llega desde él. Esta luz no sólo es la fuente primaria de energía que posibilita la vida, sino que también proporciona el mecanismo de información principal para la mayoría de las especies animales, dando lugar al desarrollo de los mecanismos y órganos que hacen factible la visión. En la mayoría de animales se puede encontrar algún tipo de “órgano fotorreceptor”, es decir, un “ojo” en el sentido amplio de la palabra. Inicialmente, un simple conjunto de células fotorreceptoras puede ya funcionar como sensor de luz, y su agrupación y disposición en pequeños orgánulos protegidos por alguna estructura que los encapsula (fig. 22.1) aparece como un primer ojo incipiente (mancha ocular). Aunque primitivos, estos ojos proporcionan información útil acerca del entorno, aunque no sean capaces de hacerlo con suficiente resolución como para desarrollar actividades superiores tales como el reconocimiento de formas, necesario para la detección de presas y predadores o el control de la locomoción.
Fig. 22.1. Ojo primitivo formado por un cierto número de células fotorreceptoras protegidas por una cápsula protectora. Estos orgánulos han evolucionado de forma independiente al menos 40 veces en los diferentes Fila.
301
302
Fundamentos físicos de los procesos biológicos
La versatilidad e importancia de la visión se demuestra por el hecho de su omnipresencia en el mundo animal. Actualmente se considera que estos orgánulos han evolucionado de forma independiente al menos 40 veces y tal vez más de 65 veces. Sin embargo, la realización de funciones más complejas que la simple detección de luz, requiere una cierta resolución y la formación de un sistema óptico más complejo. Este sistema más preciso (un ojo, propiamente dicho) se ha desarrollado en un número limitado de especies (6 de los 33 Fila de animales metazoos: Cnidarios, Moluscos, Anélidos, Onicóforos, Artrópodos y Cordados). Claro que estos Fila contribuyen al 96 % de las especies conocidas. Tal vez el éxito evolutivo de las mismas tenga que ver con el éxito en el desarrollo de su sistema visual. Es interesante contrastar este punto de vista actual con el expresado por Charles Darwin al presentar su teoría de la evolución (1859), quien se preparaba para afrontar fuertes críticas, en particular por la posibilidad de que los ojos “órganos de perfección y complicación extremas...” hubieran surgido por un mecanismo de selección natural; lo que expresaba de forma explicita: “Parece completamente absurdo, lo confieso francamente, suponer que el ojo, con todas sus inimitables disposiciones para acomodar el foco a diferentes distancias, para admitir cantidades de luz, y para la corrección de las aberraciones esférica y cromática, pueda haberse formado por selección natural”. Hoy la evolución del sistema ocular no parece una alternativa absurda o improbable, sino plausible, a la vista de los datos obtenidos. Entre los animales con un sistema ocular más evolucionado pueden encontrarse soluciones muy diversas, encontrándose hasta una decena de posibles respuestas al problema de como formar imágenes fidedignas del mundo exterior. No sólo el “ojo con lente” típico de los vertebrados (el hombre entre ellos) permite realizar esta tarea convenientemente, sino que en la naturaleza existen otras muchas variantes. Examinando el funcionamiento de los diferentes ojos existentes en el reino animal, nos encontramos con estructuras que recuerdan desde la cámara fotográfica al microscopio, pasando por las lentes de índice de refracción variable o las guías de onda. (Algunas de estas opciones han sido redescubiertas por el hombre para diferentes aplicaciones tecnológicas). En casi todos los casos las estructuras biológicas desarrolladas se caracterizan por tener dimensiones netamente superiores a la longitud de onda de la luz visible, que se sitúa entre 0,35 µm y 0,75 µm (capítulo 21), por lo que para describir de forma razonablemente completa su funcionamiento, tal y como veremos, se puede acudir a descripciones relativamente sencillas
La visión y los instrumentos ópticos
303
basadas en el tratamiento de la luz por medio de “rayos”, lo que se conoce como óptica geométrica. Las correcciones asociadas con la naturaleza ondulatoria de la luz, importantes para matizar conceptos tales como el poder de resolución final de cualquier instrumento óptico, serán consideradas al final de este capítulo.
22.2 Imágenes sin lentes: la cámara oscura y el ojo del Nautilus Existe una manera de mejorar la resolución de las manchas oculares mencionadas anteriormente, y conseguir la formación de una imagen nítida sobre el conjunto de células fotosensibles, es decir, “la retina”. Si la cápsula del ojo aumenta de tamaño y se reduce la abertura de entrada, la luz procedente de cada punto del objeto emisor define un estrecho pincel de luz que activa de forma selectiva regiones diferentes de los fotorreceptores de la retina, permitiendo distinguir la dirección de procedencia y formando la imagen correspondiente (fig. 22.2). Obviamente, para definir de forma precisa la imagen es necesario reducir la abertura de entrada, ya que en caso contrario los haces procedentes de puntos objeto próximos se solapan difuminando la imagen.
Fig. 22.2. Ojo tipo “cámara oscura” (Nautilus). Al reducir la abertura de entrada, los rayos procedentes de los distintos puntos del objeto inciden separadamente sobre la retina, formando en ella una imagen del objeto.
Esta sencilla solución (tipo “cámara oscura”) ha sido desarrollada en diversos organismos (algunos organismos inferiores con tamaños de ojo pequeños, típicamente del orden de los 100 mm), destacando el caso del Nautilus, en el que el ojo tiene casi 1 cm de diámetro y la abertura de entrada es variable, pudiendo cambiarse a voluntad, desde 0,4 a 2,8 mm. Al reducirse la abertura en comparación con el diámetro del ojo, la definición en la retina mejora, pudiendo distinguirse (resolverse) objetos con una separación angular del orden de 10º. Aun así, esta resolución es pobre comparada con la que se alcanza introduciendo algún tipo de lente. El principal problema de la solución tipo “cámara oscura” es que al reducir el diámetro de la abertura para mejorar la resolución se pierde intensidad de iluminación, ya que la intensidad que se recibe es proporcional al área de
304
Fundamentos físicos de los procesos biológicos
entrada. Incluso con la abertura máxima del Nautilus (2,8 mm) la imagen es 6 veces más oscura que en los ojos con lentes, como en los ojos de los peces o los pulpos. Teniendo en cuenta que la activación de los fotorreceptores requiere de una cierta intensidad luminosa, el diámetro de la abertura no puede reducirse excesivamente, lo que implica que la capacidad de defini ción de las imágenes por este tipo de ojos no es demasiado buena. De hecho, algunos autores se sorprenden de encontrar este ojo tan poco desarrollado, cuando en multitud de especies se ha producido la evolución hacia formas más complejas que incorporan algún tipo de lente. La “cámara oscura” o “cámara de agujero” es, por otra parte, un dispositivo que puede construirse fácilmente (por ejemplo, con una caja ennegrecida en su interior y una película fotográfica en el fondo) y utilizarse para realizar fotografías. Para obtener definición adecuada es necesario reducir mucho la abertura (diámetro inferior a 1 mm) reduciendo en consecuencia la iluminación de la película, por lo que es necesario utilizar tiempos de exposición notablemente largos. La cámara no sirve para captar imágenes en movimiento, pero sí puede utilizarse para fotografiar objetos estáticos. Existe, sin embargo, una ventaja en este tipo de cámara, ya que, al no utilizar ninguna lente, todo el campo visual está enfocado, desde los objetos más alejados a los más cercanos. Si, a pesar de la reducción en la intensidad, se procede a reducir el tamaño de la abertura a fin de aumentar la resolución, este proceso no se puede continuar de forma ilimitada, ya que a partir de un cierto tamaño, los efectos debidos a la difracción de la luz no pueden ignorarse, y la resolución se pierde, tal como se comentará al final del capítulo. Existe por tanto un tamaño de abertura óptimo (del orden de 0,5 mm) que maximiza la resolución.
22.3 Uso de la refracción. El ojo con lente 22.3.1 El dioptrio esférico. Aproximación paraxial Existe una alternativa a la solución “cámara oscura” que permite la formación de imágenes con alta resolución y a la vez con alta intensidad de iluminación. Esta solución se basa en el uso de la refracción, mediante la que se modifica la trayectoria de los rayos, y ha sido adoptada por diversos animales (incluyendo al hombre). Las leyes que rigen el paso de la luz a través de la frontera entre dos medios de índice de refracción diferente fueron estudiadas en el capítulo 21. Recordemos que la propagación de los rayos de luz en un medio homogéneo e
La visión y los instrumentos ópticos
305
isótropo es rectilínea y que, al llegar a la frontera entre dos medios, una parte se refleja y otra se transmite. La dirección del rayo transmitido viene determinada por la ley de Snell: n sen θ = n' sen θ', donde n y n’ son los índices de refracción del primer y segundo medio, respectivamente, y θ y θ' los ángulos de incidencia y refracción. Recordemos (sección 21.5.3) que, cuando la luz pasa a un medio con índice de refracción más elevado (n’ > n), el rayo se acerca a la normal (y viceversa), y que cuanto mayor es el cambio de índice entre los dos medios, mayor es la desviación que experimenta el rayo respecto a su dirección inicial. Considerando esto se puede conseguir, en principio, que todos los rayos que salen de un punto objeto O, en el medio de índice n, se refracten en la superficie de separación con el medio de índice n’, y converjan para dar un punto imagen O’ (fig. 22.3).
Fig. 22.3. Objeto como conjunto de “puntos emisores” e imagen como conjunto de “puntos imagen” donde confluyen los rayos procedentes del objeto, una vez refractados por el sistema óptico.
Si la superficie de separación entre los dos medios tiene forma esférica (dioptrio esférico) y los rayos que inciden sobre ella forman ángulos pequeños con el eje óptico (aproximación paraxial), entonces los ángulos de incidencia y refracción son también pequeños y se puede demostrar que, en efecto, todos los rayos que salen del objeto y se refractan en el dioptrio se cortan en el mismo punto O’, que constituye, por tanto, la imagen del punto O. En la figura 22.4 se representa un corte transversal de la superficie esférica, que pasa por el centro de curvatura C y por un punto objeto O. La línea OC, que es un eje de simetría del sistema, se denomina eje óptico y el punto de intersección S se denomina vértice del dioptrio.
306
Fundamentos físicos de los procesos biológicos
Un rayo OS que, procedente del objeto, sigue la dirección del eje óptico incide perpendicularmente sobre la superficie de separación, por lo que no sufre desviación (θ = θ' = 0). Un segundo rayo OIO’ que sale del objeto O se refracta al llegar a la superficie en I y corta al primer rayo en O’. La dirección normal a la superficie de separación, en el punto I, es la línea CI que une dicho punto con el centro de curvatura de la superficie esférica. Los ángulos de incidencia θ y refracción θ', formados entre el rayo OO’ y la normal, se representan en la figura.
Fig. 22.4. Dos medios transparentes de índices de refracción n y n’, separados entre sí por una superficie esférica, se denominan dioptrio esférico. El punto objeto O tiene su imagen en el punto O’, donde se produce la intersección de los rayos refractados por el dioptrio. Para obtener, analíticamente, la posición de la imagen se utiliza como sistema de referencia un sistema cartesiano con origen en el vértice del dioptrio S.
La posición del punto O’, correspondiente al punto de corte del rayo refractado con el eje, se puede determinar a partir de la ley de Snell en el punto I y de las relaciones trigonométricas de la figura 22.4 y la posición de la imagen queda determinada por la relación: 1 1 1 1 n −= n ' − r a' r a
(22.1a)
denominada invariante de Abbe, que se puede expresar también como: n ' n n '− n − = a' a r
(22.1b)
Para obtener estas ecuaciones se utiliza el criterio de signos derivado de adoptar como sistema de referencia un sistema cartesiano con origen en el vértice del dioptrio S. En consecuencia, en la figura 22.4, el valor de la abscisa (a) que determina la posición del objeto es negativa por encontrarse a la
307
La visión y los instrumentos ópticos
izquierda del origen; mientras que el valor de la abscisa (a’) de la imagen es positiva. El radio de curvatura del dioptrio (r = SC) se mide desde el mismo origen S por lo que, en el caso representado en la figura 22.4, tiene un valor positivo. Como puede comprobarse, la posición de la imagen, a’, depende de las características del dioptrio (índices de refracción n y n’ y radio de curvatura r) y de la posición, a, del objeto. Si el objeto está muy alejado del dioptrio (a → –∞) la imagen se forma en un punto F’, que se denomina foco imagen, cuya posición (f’) es: 1 n '− n 1 = × f' n' r
(22.2)
y si el primer medio es aire (n = 1) se obtiene: f '=
n' ×r n '− 1
(22.3)
22.3.2 El ojo humano El ojo humano es un sistema óptico que produce imágenes del mundo exterior sobre una superficie fotosensible (retina) que posteriormente es transformada en señales nerviosas y procesadas por el cerebro. El sistema visual comprende estas tres etapas: formación de la imagen, generación de impulsos nerviosos y procesamiento de estos, aunque en el presente capítulo examinaremos únicamente la primera, es decir, el ojo como sistema óptico. Modelo simplificado En una primera descripción, simplificada, el ojo puede considerarse como una esfera, de unos 2,5 cm de diámetro, con su parte anterior, la córnea, de curvatura algo mayor, es decir, radio algo menor (r ≈ 0,7 cm). La retina, que incorpora las células fotosensibles, se sitúa en la superficie posterior del globo ocular, donde se forma la imagen de objetos alejados (es decir, el foco del dioptrio). Esto corresponde, de acuerdo con la ec. 22.3, a un valor efectivo del índice de refracción efectivo del ojo: nefectivo ≈ 1,389. Para visualizar la formación de la imagen de un objeto es conveniente utilizar un rayo que penetre perpendicularmente a la córnea, ya que entonces no sufre refracción (θi = θr = 0). Este rayo pasará, por tanto, por el centro de curvatura de la córnea (C), situado a unos 0,7 cm de la córnea,
308
Fundamentos físicos de los procesos biológicos
y su prolongación hasta la retina define la posición de la imagen del objeto (fig. 22.5).
Fig. 22.5. El ojo humano, como sistema óptico simplificado, se puede asimilar a un dioptrio esférico de 2,5 cm de diámetro. La refracción se produce principalmente en la interfase aire-córnea. Un rayo que penetre perpendicularmente a la córnea no sufre refracción, pasando por su centro de curvatura (C), situado a unos 7 mm de la córnea, y su prolongación hasta la retina define la imagen del objeto.
Estructura del ojo humano La figura 22.6 presenta un esquema más realista del ojo humano, donde se detallan los distintos medios y superficies que lo componen, en lugar de simplificarlo como un único dioptrio. Su forma es, en efecto, aproximadamente esférica, de unos 25 mm de diámetro. La capa más externa (esclerótica) es una cubierta protectora. Su parte anterior, la córnea, es transparente y su radio de curvatura algo menor (r >> 7 mm), siendo su índice de refracción nc ≈ 1,376. El interior de la esclerótica está recubierto por una membrana oscura, la coroides, que actúa tanto como absorbente de la luz difundida (no focalizada) como de refrigerante, absorbiendo el calor depositado por la radiación en el ojo y liberándolo al exterior a través del flujo sanguíneo, gracias a su alta vascularización. La cantidad de luz que entra al interior del ojo está regulada por el iris, estructura muscular que define la pupila de entrada, y cuyo diámetro puede variar entre 2 mm, en condiciones de alta iluminación, a unos 8 mm en condiciones de baja iluminación. La capa más interna del globo ocular está constituida por la retina, quien incorpora las células fotosensibles (conos y bastones). La luz que atraviesa la córnea pasa a través de un fluido transparente llamado humor acuoso (nha ≈ 1,336), que llena el espacio entre la córnea y el cristalino, estructura en forma de lente a la que nos referiremos más adelante. Por
309
La visión y los instrumentos ópticos
último, se encuentra el humor vítreo (nhv ≈ 1,337), que llena el espacio interior entre el cristalino y la retina. En la retina se encuentran los fotorreceptores, que tienen una disposición irregular sobre ella. En particular, cerca del centro de la retina hay una pequeña depresión, conocida como la mancha amarilla o mácula, en la que hay una región, de alrededor de 0,3 mm de diámetro, llamada fóvea centralis, con alta concentración de conos, constituyendo la zona de alta resolución de detección. La señal óptica es finalmente transformada en impulsos nerviosos, que son transportados hasta el nervio óptico. El punto de salida del nervio óptico no contiene fotorreceptores, por lo que es un área insensible a la luz que recibe el nombre de punto ciego.
Fig. 22.6. Esquema de la estructura del ojo humano.
Las principales características del ojo normal (emétrope) como sistema óptico se resumen en la tabla 22.1, donde las posiciones de los distintos elementos se refieren a la córnea. Tabla 22.1 Características del ojo como sistema óptico Elemento
Posición (mm)
Índice de refracción
Radio curvatura (mm)
Córnea
0
1,376
7
Humor acuoso
0,5-3,6
1,336
Cristalino
Cara anterior: 3,6 Cara posterior: 7,2
Exterior: 1,386 Núcleo: 1,406
Humor vítreo
7,2-25
1,336
Retina
25
Centro de curvatura de la córnea
7
Foco Imagen (F’)
25
Anterior: 10 Posterior: –6
310
Fundamentos físicos de los procesos biológicos
El ojo como sistema óptico. Acomodación. Defectos visuales El ojo, en estado relajado, forma la imagen de un objeto lejano sobre la retina. La luz, al penetrar en el ojo, se encuentra en primer lugar con la córnea, que actúa como el primer y más fuerte elemento refractor. Los saltos de índice de refracción posteriores: córnea-humor acuoso, humor acuoso-cristalino y cristalino-humor vítreo son notablemente menores y pueden ignorarse en una primera aproximación, tal como hacíamos en el modelo simplificado. Esto es característico de los animales terrestres, ya que el medio que rodea al individuo es el aire (naire = 1) y en consecuencia el cambio de índice de refracción es muy notable. Por el contrario, para animales acuáticos (nagua = 1,33) el cambio de índice en la córnea (y por tanto la refracción) es mucho menor. Mención especial merece el cristalino. El cristalino es un cuerpo elástico, transparente, con forma de lente biconvexa asimétrica (figs 22.56). Está constituido por múltiples capas (como una cebolla) y su índice de refracción cambia de unas a otras. En el núcleo su valor llega a nnúcleo ≈ 1,406, mientras en el exterior se reduce hasta next ≈ 1,386. El cristalino es el responsable del mecanismo fino de enfoque y en particular de la “acomodación” para la observación de objetos cercanos. El cristalino, por su propia constitución, tendería a adoptar una forma más o menos esférica. Sin embargo, está unido a la coroides por un conjunto de fibras radiales que ejercen una cierta tensión tirando del cristalino y aplanándolo. En esta configuración aplanada, la potencia del cristalino es baja, apenas contribuye a la refracción de los rayos, y la imagen de objetos alejados se forma sobre la retina (fig. 22.7.a). Si el objeto se acerca, la imagen se formaría ahora más lejos de la retina, por lo que el cristalino cambia su curvatura (se abomba), aumentando su potencia, para conseguir que la imagen se forme de nuevo sobre la retina (fig. 22.7.b). Este proceso, acomodación, se realiza de forma refleja, controlado por el sistema parasimpático. La capacidad de acomodación tiene un límite, y si el objeto se acerca demasiado al ojo, ya no es posible y la imagen no puede focalizarse sobre la retina. El punto próximo, hasta el que es posible acomodar la imagen, varía de un individuo a otro, siendo su valor promedio una distancia de 25 cm (fig. 22.7.c). La capacidad de acomodación depende de la elasticidad del cristalino, que se ve afectada por la edad (presbicia o vista cansada), haciéndose patente a partir de los 40-50 años. La falta de convergencia puede corregirse mediante algún elemento externo, tal como unas lentes convergentes que proporcionen la convergencia que le falta al ojo.
La visión y los instrumentos ópticos
311
Independientemente de la capacidad de acomodación, también puede ocurrir que el ojo, ya de por sí, presente desviaciones respecto a su curvatura normal, causando problemas de convergencia, bien por que ésta sea excesiva (ojo miope), o insuficiente (ojo hipermétrope). En ambos casos se presentan defectos en la imagen que se pueden corregir con lentes que añadan o resten la convergencia adecuada (fig. 22.7.dg). El cristalino es una estructura que crece durante la vida del individuo. En su interior se encuentran células formadas desde el estadio de embrión, mientras que las capas exteriores son más recientes. Las proteínas que forman el cristalino pueden degradarse con el tiempo, ya sea por efectos térmicos, efecto de la radiación ultravioleta u otras causas, llegando a provocar la opacidad del cristalino, patología que recibe el nombre de cataratas. La solución a este problema pasa por la extirpación del cristalino afectado y su sustitución por una lente artificial. Al hacer esto obviamente el ojo pierde la capacidad de acomodación, ya que las lentes sintéticas, a diferencia del cristalino, no pueden cambiar el valor de su distancia focal.
312
Fundamentos físicos de los procesos biológicos
Fig. 22.7. Ojo normal y acomodación (a)-(c) y defectos visuales y su corrección (d)-(g).
Los fotorreceptores de la retina La detección de la luz y su transformación en impulso nervioso se realiza en la capa más interna del ojo, la retina. Su estructura es compleja y consta de varias subcapas con diferentes células especializadas (fig. 22.8). La retina de los vertebrados (y de algunos moluscos y arácnidos) está en disposición invertida, ya que las células sensoras primarias se encuentran en dirección opuesta a la de la luz incidente. La disposición contraria es la disposición más común en los invertebrados. Una consecuencia de la disposición de retina invertida es que la luz debe atravesar el resto de los componentes (esencialmente células nerviosas) de la retina antes de incidir sobre las células fotosensibles y, en
La visión y los instrumentos ópticos
313
consecuencia, el nervio óptico, que colecta finalmente las señales nerviosas, debe salir al exterior atravesando la retina, lo que provoca la existencia de una zona sin fotorreceptores (punto ciego).
Fig. 22.8. Representación esquemática de la retina.
El ojo humano contiene dos tipos de células fotorreceptoras: conos y bastones, cuya distribución en la retina tiene la forma que se presenta en la figura 22.9. Los conos se concentran, con altísima densidad (> 150.000/mm 2), en la fóvea, que constituye el área de detección de alta resolución. De hecho, el ojo se mueve para llevar a dicha zona la imagen de aquellos objetos que suponen la atención central del observador. Los conos proporcionan la capacidad de percepción del color, distinguiéndose tres tipos de conos (rojos, verdes y azules) según su rango espectral de respuesta. Necesitan alta intensidad de luz para activarse, siendo responsables de la visión diurna, pero inactivos (insensibles) para la visión nocturna. Los bastones son mucho más sensibles, activándose con intensidades luminosas mucho menores que los conos, y son utilizados para la visión nocturna.
314
Fundamentos físicos de los procesos biológicos
No distinguen, sin embargo, el color y las imágenes que proporcionan no están bien definidas, aunque son adecuados para la detección de objetos en movimiento. Su distribución se extiende a lo largo de la retina, presentando un máximo algunos grados fuera de la posición de la fóvea. Como se ha indicado, la percepción del color se debe a la existencia de tres tipos diferentes de conos, que en conjunto responden desde el azul al rojo. En realidad, la respuesta de la retina abarca una zona del espectro luminoso más amplia, pero la luz ultravioleta se absorbe por la córnea y cristalino antes de llegar a ella. También se absorbe parte del azul por la presencia de xantofila en la mácula amarilla.
Fig. 22.9. Distribución de conos y bastones en la retina.
La complejidad del sistema visual humano implica no solo a los receptores primarios, sino al posterior conexionado y “procesado” de la señal nerviosa. Los fotorreceptores transmiten el impulso nervioso a las células bipolares, y éstas a las células ganglionares, cuyos axones dan lugar al nervio óptico. Los conos en la fóvea están conectados individualmente a las células bipolares, lo que proporciona alta resolución espacial. Por el contrario, una célula bipolar puede estar conectada a varios bastones (fig. 22.8), lo que proporciona alta sensibilidad de respuesta, pero con baja resolución espacial. Las células bipolares están a su vez conectadas entre sí por las denominadas células horizontales, que proporcionan un mecanismo de control sobre la señal activadora de las células ganglionares, para conseguir una respuesta selectiva dotada de alta resolución. La importancia de las células ganglionares como último eslabón
La visión y los instrumentos ópticos
315
en la respuesta visual llega a traducirse en la aparición de diferenciaciones en su distribución en la retina, mimetizando la disposición espacial de cada nicho ecológico. Así, animales con hábitats en espacio abierto (guepardos, canguros) presentan alta densidad de células ganglionares con distribución horizontal, mientras especies arbóreas, con visión lateral limitada, presentan una distribución aproximadamente radial. Materiales orgánicos: lentes y espejos (i) Lentes Las lentes fabricadas por el hombre pueden ser de materiales variados, dependiendo de sus aplicaciones específicas. La gran mayoría está fabricada con vidrios, aprovechando su transparencia y sus propiedades mecánicas (estabilidad y dureza). Se utilizan diferentes composiciones en el vidrio, con lo que puede variar algo el índice de refracción, desde 1,5 (Crown de borosilicato) hasta 1,7 (Flint extradenso). También pueden fabricarse lentes de material plástico que, aunque de menor dureza que el vidrio, presenta ventajas en cuanto a su densidad y flexibilidad. Es utilizado, por tanto, para las lentes artificiales implantadas intraocularmente en aquellas personas a quienes se extirpa el cristalino afectado por cataratas. Inicialmente se fabricaban en PMMA (polimetil metacrilato) (lentes rígidas), pero después se han adoptado otros plásticos acrílicos flexibles, que permiten plegar la lente y así reducir el tamaño de la incisión necesaria para su implantación. (El cristalino dañado puede extraerse por succión a través de la misma incisión, desmenuzándolo previamente mediante ultrasonidos). Las lentes que forman los sistemas visuales de los vertebrados están formadas a partir de células epiteliales modificadas, que contienen concentraciones altas de proteínas hidrosolubles, denominadas cristalinas. Estas proteínas derivan de otras proteínas y enzimas con funciones variadas. Esta readaptación de variantes de moléculas con funciones específicas para su incorporación en la formación de lentes orgánicas presenta similitudes entre pájaros, reptiles anfibios y moluscos (cefalópodos), es decir, el parecido entre los ojos de los vertebrados y los cefalópodos (a nivel de órgano) se extiende al nivel molecular, lo que parece implicar también una convergencia a nivel genético. Respecto a las propiedades físicas de estas proteínas es de destacar principalmente su flexibilidad, que hace posible la variación de forma de las lentes orgánicas, utilizada para la acomodación. El índice de refracción de las lentes depende de la concentración de proteína incorporada. Por tanto, en las lentes orgánicas es esperable un índice de
316
Fundamentos físicos de los procesos biológicos
refracción comprendido entre el del agua (nagua = 1,33) y el correspondiente al límite biológico de máxima concentración de proteínas compatible con la transparencia y flexibilidad mecánica, que alcanza un valor n máx ≈ 1,52. Este valor es suficientemente elevado como para provocar una refracción ade cuada, pero, además, la estructura en capas (lentes inhomogéneas de índice de refracción variable) presenta ventajas especiales que se detallan en el punto siguiente. (ii) Espejos Algunos animales incorporan también procesos de reflexión (espejos) en sus sistemas visuales. Resulta particularmente familiar el brillo de los ojos de un gato en la oscuridad. Ello es debido a la existencia de una capa reflectante en la coroides, denominada tapetum lucidum, que duplica el paso de la luz a través de la retina, incrementando la sensitividad. Esta capa reflectante está formada, en muchos casos, por la incorporación de cristales de guanina. La alternancia de diferentes capas de índice de refracción alto (nguanina ≈ 1,83) y bajo (ncitopl. ≈ 1,34) da lugar a fenómenos de tipo interferencial (capítulo 21) con propiedades reflectantes que alcanzan un 100 % de eficiencia. Algunos animales utilizan sus “espejos” no solo como un mero mecanismo para duplicar el camino recorrido por la luz, sino como un elemento focalizador. Las vieiras Pecten tienen un centenar de ojos (de 1 mm de tamaño) alrededor del manto, que incorporan un espejo cóncavo reflectante, con unas 30 capas alternadas de guanina, como elemento focalizador.
22.3.3 Animales acuáticos. La regla de Matthiessen En los animales acuáticos, al ser agua el medio externo al ojo (nagua = 1,33), el cambio de índice en la córnea (y por tanto la refracción) es mucho menor que en los animales terrestres, y la refracción en el cristalino adquiere un papel mucho más relevante. La mayoría de animales acuáticos dotados de ojos simples utilizan una lente esférica, situada en el centro de curvatura de la retina, lo que les proporciona un campo visual próximo a 180º. Aplicando las leyes de la óptica geométrica a una lente esférica, y considerando la refracción en ambas caras de la esfera, se demuestra que, para un objeto alejado, la imagen (foco imagen) se obtendría a una distancia del centro de la lente (distancia focal imagen): f '=
nrel r 2 (nrel − 1)
(22.4)
La visión y los instrumentos ópticos
317
siendo r el radio de la lente y nrel el índice de refracción relativo de la lente al agua (nrel = nlente / nagua). En el cálculo se ha utilizado el hecho de que el índice de refracción interno del ojo es muy similar al agua (nint = nagua). A finales del siglo XIX (1886), Matthiesen observó que las lentes de los ojos de los peces mantenían una relación constante entre su distancia focal (f’) y su radio (r). f' = 2, 55 (regla de Matthiessen) r
Este valor resulta sorprendentemente pequeño, ya que el cociente f '/r puede ser calculado a partir de la ec. (22.4), y para que dicho valor sea igual a 2,55 sería necesario un valor para el índice de refracción de la lente n ≈ 1,66, muy por encima del límite biológico n ≈ 1,52. La solución de este problema no se encontró hasta comprobar que la lente de los peces no es uniforme, sino que presenta un gradiente de índice de refracción. Es decir, dicha lente está formada por una serie de capas sucesivas (como una cebolla) de forma que el índice de refracción varía de una capa a la siguiente, partiendo de un valor periférico de 1,34 e incrementándose hacia el interior hasta alcanzar en el núcleo el valor n ≈ 1,52 (límite biológico). La ventaja de estas estructuras es que la refracción de luz sucede de forma continua en cada una de las capas y su eficiencia refractora es superior a la de las lentes homogéneas. También es posible predecir teóricamente el funcionamiento de estas lentes y calcular el perfil de índice de refracción óptimo, tal que permite la focalización sin aberraciones (aunque esto excede el objetivo de este texto). El resultado es que, para una lente de estas características, con índice de refracción interno n = 1,52 y externo n = 1,34, se obtiene exactamente el valor de la relación de Matthiessen ( f ' r = 2, 55). El cociente f '/r es una magnitud fácil de medir e inequívoca en cuanto a su interpretación. Si su valor es 2,55 no cabe duda de que se trata de una lente de índice de refracción variable, ya que una lente homogénea con el índice de refracción más elevado (n= 1,52) daría una relación f '/r = 4. La lente de índice de refracción variable ha evolucionado de forma independiente al menos en ocho ocasiones. No solo está presente en peces y cefalópodos, sino que también se encuentra en crustáceos, anélidos y en diversos moluscos gasterópodos. La convergencia no puede comprenderse sino como resultado de la física subyacente a los mecanismos de la formación de imágenes, y los valores del índice de refracción de los materiales biológicos.
318
Fundamentos físicos de los procesos biológicos
22.3.4 La evolución del ojo Si retomamos las palabras de Darwin, citadas al comienzo de este capítulo, respecto a la improbabilidad de que el ojo hubiese aparecido por evolución natural, podemos concentrar las dificultades en dos aspectos diferentes: (1) La primera de ellas es una objeción típica antievolucionista: ¿cómo evoluciona un órgano, sin pasar por estadios intermedios menos eficientes? (2) La segunda es más cuantitativa. Aceptando la posible evolución, ¿cuánto tiempo haría falta para que un órgano de la complejidad del ojo haya podido evolucionar? Ambas cuestiones han sido respondidas hace una decena de años en lo referente al caso particular de los ojos de los vertebrados. En efecto, es posible una evolución continua desde un simple conjunto de células fotosensibles hasta una estructura similar al ojo de los vertebrados (fig. 22.10). Utilizando el poder de resolución como parámetro de calidad, se puede trazar una línea de evolución progresiva que a partir de una simple estructura plana de fotorreceptores (a) se curva primeramente (b), cerrando seguidamente la abertura de entrada (c), e incorporando posteriormente una lente esférica (d). Esta evolución no sólo resulta ser progresiva en la mejora de la resolución óptica de los distintos tipos de ojos, sino que las diferentes etapas intermedias pueden encontrarse materializadas en distintos animales.
La visión y los instrumentos ópticos
319
Fig. 22.10. Modelo simplificado de la secuencia de evolución del ojo desde un conjunto de células fotosensibles (a) hasta un ojo con lente (d).
La segunda dificultad, el tiempo de evolución necesario, queda también resuelta satisfactoriamente. En primer lugar, se puede calcular el número de pasos necesarios para provocar un determinado cambio estructural, considerando que cada “paso” supone un cambio del 1 %. (Por ejemplo, para duplicar una cierta longitud en pasos de 1 % harían falta 70 pasos, ya que 1,0170 ~ 2). A través de los diferentes cambios estructurales propuestos, la evolución del ojo requeriría unos 1.830 pasos. La estimación del número de generaciones necesarias para hacer posible estos cambios, incluso basada en un escenario desfavorable, arrojaría una cifra de unas 364.000 generaciones. Suponiendo un lapso de tiempo del orden de un año para cada generación, se llega finalmente a la conclusión de que la evolución completa del ojo, desde un simple conjunto de células fotosensibles hasta un ojo plenamente desarrollado, puede producirse en un periodo de tiempo de unos 364.000 años. La primera evidencia fósil de animales con ojos se remonta al Cámbrico, hace unos 550 millones de años, por lo que parece que el ojo ha tenido tiempo para evolucionar, no una, sino unas 1.500 veces. O dicho de otra forma, en palabras
320
Fundamentos físicos de los procesos biológicos
de Richard Dawkins, la evolución del ojo se ha podido producir, a escala geológica, “en un abrir y cerrar de ojos”.
22.4 Instrumentos ópticos 22.4.1 Lentes La mayoría de los instrumentos ópticos utilizan lentes. Una lente está formada por un material transparente de índice de refracción (n), habitualmente superior al del exterior (ne), con caras normalmente esféricas de centros C1 y C2 y radios de curvatura r1 y r2 respectivamente (fig. 22.11). Es decir, se puede considerar como dos dioptrios esféricos sucesivos. La imagen se puede obtener, por tanto, aplicando la ley de Snell a las dos caras (dioptrios) de la lente. Si el espesor de la lente es pequeño comparado con los radios de curvatura de sus caras, se puede utilizar como sistema de referencia un sistema cartesiano con origen en el centro de la lente O, que podemos suponer que coincide con los vértices de ambos dioptrios (fig. 22.11). Gracias a estas aproximaciones, las ecuaciones que describen la formación de imágenes con lentes delgadas resultan particularmente sencillas. Aplicando la ley de Snell, con el convenio de signos mencionado, se obtiene: 1 1 n 1 1 − = − 1 − a ' a ne r1 r2
(22.5)
El significado de las diferentes magnitudes se detalla en la figura 22.11.
Fig. 22.11. En una lente delgada, cuyo espesor es pequeño comparado con los radios de curvatura, se utiliza como sistema de referencia un sistema cartesiano con origen en el centro de la lente.
321
La visión y los instrumentos ópticos
Si sobre la lente inciden rayos paralelos al eje óptico, estos forman la imagen en un punto llamado foco imagen (F’). Existe también un punto (foco objeto, F) tal que los rayos que pasan por él emergen del sistema óptico paralelos al eje óptico. Las distancias desde el centro de la lente (O) a los focos objeto (OF) e imagen (OF’) se llaman distancia focal objeto (f) e imagen (f’), respectivamente. Cuando a ambos lados de la lente hay índices de refracción iguales, se verifica que ambas distancias son iguales pero de signos contrarios: f = −f '
Si un haz de rayos incidente, paralelo al eje, converge realmente en el foco imagen, se dice que la lente es convergente (fig. 22.12.a). Puede ocurrir, sin embargo, que a la salida de la lente los rayos sean divergentes, siendo su prolongación la que se corta en el foco (fig. 22.12.b). En ese caso, el foco se denomina virtual y la lente se denomina divergente. (Nótese que un observador situado a la derecha de la lente vería los rayos como procedentes del foco virtual).
Fig. 22.12. Si un haz de rayos incidente, paralelo al eje, converge realmente en el foco imagen, se dice que la lente es convergente. (a) Si a la salida de la lente los rayos son divergentes, siendo su prolongación la que se corta en el foco, éste se denomina virtual y la lente se denomina divergente. (Nótese que un observador, a la derecha de la lente, vería los rayos como procedentes del foco virtual).
La inversa de la distancia focal imagen se llama potencia de la lente (ϕ'), y es una medida de su poder refractor. Cuando la distancia focal se mide en metros, la potencia se mide en m-1 o dioptrías, que es la unidad utilizada habitualmente para indicar las características ópticas de las lentes (por ejemplo, en las gafas). Así, si unas gafas utilizan lentes de potencia ϕ' = 0,5 dioptrías, esto significa que:
322
Fundamentos físicos de los procesos biológicos
1 = 0, 5 dioptrías = 0, 5 m −1 f'
φ= φ''
y, por tanto, la distancia focal imagen de las lentes es: = f'
1 = 2m 0, 5
La potencia de una lente puede obtenerse, analíticamente, teniendo en cuenta que un objeto muy alejado (a → –∞ ) da lugar a un haz de rayos paralelos al eje óptico que, por tanto, se cortarán en el foco imagen. A partir de la ec. (22.5) se obtiene: φ'' φ=
1 n 1 1 = − 1 − f ' ne r1 r2
(22.6.a)
ecuación que se conoce como “ecuación del constructor de lentes”. En el caso más habitual en que el medio externo es aire (ne ≈ 1), la ecuación anterior queda de la forma: φ= φ''
1 = f'
1 1 − r1 r2
( n − 1)
(22.6.b)
Combinando las ecuaciones (22.5) y (22.6) se obtiene la llamada ecuación de las lentes delgadas: 1 1 1 − = a' a f '
(22.7)
que permite determinar fácilmente, de forma analítica, la posición de la imagen (a’) conocida la posición del objeto (a) una vez conocida la potencia de la lente. La obtención de la imagen de un objeto puede hacerse también gráficamente haciendo uso de las propiedades de los focos. Si consideramos (fig. 22.13) un objeto MN, perpendicular al eje, para obtener su imagen bastará con obtener la imagen N’ del extremo del objeto N, ya que la imagen de la base M’ estará a la misma distancia que N’, sobre el eje óptico. Tracemos un primer rayo (1) que, partiendo de N, sea paralelo al eje óptico y que, por la definición de foco imagen, saldrá de la lente en dirección a dicho foco F’. Tracemos un segundo rayo (2) que pase por el foco objeto F, el cual saldrá de la lente paralelo al eje óptico. El punto de corte entre ambos rayos nos da la posición de
323
La visión y los instrumentos ópticos
la imagen N’. Alternativamente podríamos haber utilizado un tercer rayo (3) que pase por el centro de la lente, el cual se puede demostrar que no cambia de dirección y confluye igualmente en la imagen N’. Vemos, por tanto, que, conocidos los focos de una lente, es inmediata la obtención de la imagen de un objeto cualquiera, tanto analítica como gráficamente.
Fig. 22.13. Obtención gráfica de la imagen formada por una lente delgada.
El cociente entre el tamaño de la imagen (y’) y el del objeto (y) se llama aumento lateral (β' = y'/ y), estando determinado por las características de la lente y por la posición del objeto (e imagen), pudiendo calcularse a partir de los triángulos MNO y M'N'O de la figura 22.13. Dichos triángulos son semejantes, por ser rectángulos y opuestos por el vértice en O, siendo por tanto los tres ángulos iguales. De la relación de semejanza se obtiene: β='
y' a' = y a
(22.8)
Para la medida de distancias verticales se utiliza el mismo sistema de referencia que para determinar las posiciones sobre el eje, es decir, un sistema cartesiano centrado en O. Por tanto, en la figura 22.13, el tamaño del objeto y es positivo, mientras el de la imagen y’, que aparece invertida, es negativo. Un inconveniente de la utilización de lentes radica en que si tenemos varios objetos, situados a distancias diferentes, y queremos formar su imagen en una determinada posición, sólo uno de ellos podrá estar perfectamente enfocado, quedando el resto más o menos desenfocados. Esto es consecuencia inevitable de la ecuación de las lentes (ec. 22.7), ya que a cada posición del objeto le corresponde una posición diferente para la imagen. Para objetos lejanos el efecto no es muy grande en general, siendo más importante para distancias cortas.
324
Fundamentos físicos de los procesos biológicos
Este problema se resuelve mediante el enfoque del sistema óptico para conseguir llevar la imagen del objeto a la posición del fotorreceptor, ya sea este la retina, una película fotográfica o una pantalla. Así, muchas cámaras fotográficas disponen de una lente móvil de forma que, para fotografiar objetos cercanos, dicha lente se acerca al objeto, permitiendo que la imagen se forme sobre la película. Actualmente, muchas cámaras realizan este enfoque de forma automática. Otra solución, más sofisticada, consiste en variar la potencia del sistema óptico. Esta solución es la que se incorpora en los objetivos “zoom”, formados por varias lentes que se desplazan cambiando su distancia relativa y con ello cambian también la potencia global del sistema. Otra alternativa consistiría en cambiar la forma de la lente. Es evidente, a partir de la ec. del constructor de lentes (ec. 22.6), que si aplanamos una lente (aumentamos r) su potencia disminuye, mientras que si aumentamos su curvatura (disminuimos r) la potencia crece. Esta solución es la adoptada en los sistemas visuales de muchos animales poseedores de ojos con lentes. Aprovechando la flexibilidad de las lentes orgánicas, su forma puede cambiarse por la acción de músculos especializados, que de esta forma cambian la curvatura y, por tanto, la potencia y permiten la acomodación de la visión para enfocar sobre la retina objetos situados a diferentes distancias.
22.4.2 Microscopio Lupa o microscopio simple El tamaño aparente de un objeto, observado a simple vista, viene determinado por el tamaño de la imagen formada en la retina. Por ello, cuando deseamos mejorar nuestra visión de un objeto, lo acercamos a nosotros a fin de ampliar dicha imagen (fig. 22.14). Sin embargo, ya se ha comentado que tenemos un límite para ello, debido a que a partir de cierta distancia no es posible acomodar la vista para enfocar un objeto excesivamente cercano, encontrándose el punto próximo a unos 25 cm, para el ojo normal. Esto limita automáticamente nuestra capacidad de distinguir los detalles de un objeto.
325
La visión y los instrumentos ópticos
Fig. 22.14. El tamaño de la imagen formada en la retina depende de la posición del objeto. El punto próximo (│a│≈ 25 cm) es la mínima distancia a la que el ojo puede acomodarse formando una imagen nítida sobre la retina.
La forma más sencilla de mejorar nuestra observación es la utilización de una lupa o microscopio simple (fig. 22.15). Para ello, lo que hacemos es situar el objeto aproximadamente en el foco objeto de una lente positiva de distancia focal corta. Al colocar el objeto en el foco, los rayos que salen de la lente son paralelos, y pueden ser focalizados por el ojo como si se tratase de un objeto lejano. De esta forma las limitaciones impuestas por el punto próximo desaparecen.
Fig. 22.15. Esquema del funcionamiento de una lupa, con el objeto en su foco.
El tamaño de la imagen, y tamaño aparente del objeto, viene ahora determinado por el ángulo: θ≈
y y' ≈ f ' ( 2, 5 − 0, 7 ) cm
(22.9)
y haciendo la distancia focal pequeña, este ángulo puede ser grande. La lupa se suele caracterizar por su aumento angular M, que compara el ángulo anterior con el ángulo con que se vería el objeto situado en el punto próximo (figs. 22.14-15).
326
Fundamentos físicos de los procesos biológicos
M =
y f' 25 θ ≈ ≈ θ 0 y 25 cm f '(cm)
(22.10)
Por ejemplo, para una lupa que incorpora una lente de potencia ϕ’ = 10 dioptrías = 10 m–1, su distancia focal es: = f'
1 = m 10 cm 10
y por tanto el aumento es: M≈
25 = 2, 5 10
que suele expresarse como x 2,5. La imagen en la retina es unas 2,5 veces más grande vista a través de la lupa que con el ojo desnudo. El aumento angular normal para una lupa simple, de tamaño razonable, es x 2 – x 3, aunque con diseños más complejos pueden alcanzarse aumentos de x 10 e incluso x 20. Para sobrepasar este límite es necesario acudir al microscopio propiamente dicho, o microscopio compuesto. Microscopio compuesto La figura 22.16 muestra un esquema simplificado de un microscopio. Está formado por un objetivo (parte cercana al objeto) y un ocular (parte cercana al ojo). En la figura se han representado como si ambos fuesen lentes delgadas simples, aunque en los microscopios habituales, tanto uno como otro están formados por conjuntos de varias lentes, cuidadosamente diseñadas para evitar aberraciones. El objetivo del microscopio forma una primera imagen intermedia (y’i en la figura), actuando seguidamente el ocular como una lupa, utilizando como objeto la imagen intermedia. Tal como indicábamos en el apartado anterior, para que la observación ocular se realice adecuadamente la posición de la imagen intermedia debe coincidir con el foco objeto del ocular. El microscopio se construye de forma que la distancia t entre el foco imagen del objetivo (F’ob) y el foco objeto del ocular (Foc) (llamada longitud del tubo) permanezca fija. El mecanismo de enfoque consiste en acercar o alejar el conjunto hasta que la imagen intermedia se forme en el foco del ocular, momento en que se observará correctamente.
327
La visión y los instrumentos ópticos
Fig. 22.16. Esquema simplificado de un microscopio.
El aumento angular total del microscopio (Γ') se define de forma análoga al caso de la lupa, es decir, es el cociente entre el ángulo θ’ bajo el que se observa el objeto con el microscopio y el ángulo θ0 con que se vería el objeto, a simple vista, situado en el punto próximo, es decir, a 25 cm del ojo. A partir de la figura 22.16 se puede expresar, por tanto: Γ='
y ' f 'oc y ' 25 cm t θ' = = × = β 'ob ⋅ Γ 'oc = − θ 0 y 25 cm y f 'oc f 'ob
25 cm × f 'oc
(22.11)
es decir, el aumento angular del microscopio es igual al producto del aumento lateral del objetivo (β'ob = y’/y) por el aumento angular del ocular (Γ'oc). Estas dos magnitudes suelen aparecer grabadas en objetivos y oculares, para su fácil identificación. Por ejemplo, si se observa un insecto de 5 mm de longitud con un microscopio, utilizando un objetivo x 5 y un ocular x 10, el tamaño aparente del insecto será: Γ ' = ( 5 ) × (10 ) = 50, es decir, la imagen en la retina es 50 veces mayor que observando el insecto a simple vista desde el punto próximo (25 cm). Otra característica importante del microscopio es la cantidad de luz que capta el objetivo, lo que se cuantifica mediante la apertura numérica (AN), que se define como: AN = n sen θ max
(22.12)
donde n es el índice de refracción del medio externo y θmax, el semiángulo del cono formado por los rayos de luz que partiendo del objeto son captados por el objetivo (fig. 22.17). Está relacionada tanto con la luminosidad de la imagen como con su resolución, como se verá más adelante, y su valor suele aparecer grabado en los objetivos.
328
Fundamentos físicos de los procesos biológicos
Si el objeto está en aire, como n = 1 y sen θmax ≤ 1, se tiene que AN ≤ 1, pero se pueden utilizar objetivos de inmersión, con un medio externo de índice de refracción n superior a la unidad, en cuyo caso la apertura numérica puede ser también superior a la unidad.
Fig. 22.17. La apertura numérica (AN) de un objetivo de microscopio se define como el producto del índice de refracción del medio externo n por el seno del semiángulo del cono formado por los rayos de luz que partiendo del objeto son captados por el objetivo.
22.4.3 Efecto de la difracción. Límite de resolución El análisis desarrollado en la primera parte de este capítulo se ha realizado a partir de la idea de rayo luminoso y las leyes de la óptica geométrica, entre ellas la propagación rectilínea en medios homogéneos. Sin embargo, algunos aspectos relacionados con los instrumento ópticos no pueden comprenderse sin tener en cuenta aspectos típicamente ondulatorios, cuyos principios básicos se estudiaron en el capítulo anterior. Desde la aparición de los primeros microscopios se pensó que su calidad dependía exclusivamente de la capacidad de diseñar y fabricar lentes de la mejor calidad y libres de defectos, encaminándose en esa dirección todos los intentos de optimización. Pero, a finales del siglo XIX, se comprendió finalmente que el carácter ondulatorio de la luz implica la aparición de fenómenos de difracción, que necesariamente imponen limitaciones en la resolución de cualquier instrumento óptico. Límite de resolución del ojo La luz que entra en el ojo está limitada por el iris, que con buena iluminación se cierra hasta un diámetro de aproximadamente 2 mm. La luz visible, podemos considerarla de longitud de onda promedio λ0 ≈ 0,5 µm. En el interior del ojo, el índice de refracción es n ≈ 1,34 y por tanto la longitud de onda será: λ = λ0 / n ≈ 0, 4 µm.
La visión y los instrumentos ópticos
329
En consecuencia, el poder de resolución angular del ojo, de acuerdo con el criterio de Rayleigh, ecuación (21.60), será: θ ≈ 1, 22
λ 0, 4 × 10−6 ≈ 1, 22 ≈ 2, 4 × 10−4 rad ≈ 0, 014 º ≈ 0, 84 ' D 2 × 10−3
es decir, del orden de 1 minuto de arco. Según lo anterior, si consideramos para el tamaño del ojo L ≈ 2,5 cm, dos objetos cuya separación coincida con el límite de resolución darán imágenes con una separación en la retina (fig. 22.18) igual a: ∆s ≈ L × θ ≈ 2, 5 × 10−2 × 2, 4 × 10−4 ≈ 6 × 10−6 m = 6 µ m
Lo que concuerda básicamente con los datos anatómicos señalados en la sección 3.6, ya que la fóvea presenta una densidad superficial de fotorreceptores (conos) de σconos ≈ 150.000/mm2 ≈ (400/mm)2, es decir, una separación promedio entre los conos: < d > ≈ 1/400 mm ≈ 2,5 μm.
Fig. 22.18. Poder de resolución del ojo.
Límite de resolución del microscopio Consideremos ahora la situación del microscopio, en el que la limitación de abertura y, por tanto, el factor que determina los efectos difraccionales es el tamaño (diámetro) del objetivo (fig. 22.19).
330
Fundamentos físicos de los procesos biológicos
Fig. 22.19. Cálculo del poder de resolución del microscopio.
La percepción de objetos de tamaño y = PQ equivale a decir que somos capaces de distinguir la imagen (sus extremos P’Q’) como “resueltos”; lo que sucederá si los máximos de difracción de sus imágenes están separadas un ángulo θ ' ≈ 1, 22 λ D . El tamaño de la imagen más pequeña resoluble por el microscopio es: y ' ≈ a ' θ ' ≈ 1, 22
a ' λ0 n'D
(22.13)
siendo n’ el índice de refracción del espacio imagen y λ0 = n’λ la longitud de onda utilizada. Como, en general, el diámetro del objetivo del microscopio es pequeño y la imagen del objeto se forma relativamente alejada, se puede considerar D << a', pudiendo expresarse D/2 sen σ ' ≈ tg σ ' = a'
siendo σ’ el ángulo formado por el eje óptico y el rayo que llega al pie de la imagen procedente del borde del objetivo (fig. 22.19). Sustituyendo, a partir de esta expresión, el valor de a’/D en (22.13), el tamaño de la menor imagen resoluble resulta ser: y ' ≈ 0, 61
λ0 n ' sen σ '
(22.14)
Pero para que un sistema óptico esté exento de aberraciones, se demuestra que debe verificar la denominada condición del seno de Abbe: n y sen σ = n ' y ' sen σ ' , con lo que el tamaño mínimo del objeto puede expresarse finalmente como:
331
La visión y los instrumentos ópticos
ymin =
λ0 λ n ' y ' sen σ ' ≈ 0, 61 = 0, 61 0 n sen σ n sen σ AN
(22.15)
Es decir, el tamaño mínimo resoluble por un microscopio está determinado por la longitud de onda de la luz (λ0) y por la apertura numérica (AN = n sen σ) del objetivo. Como en aire la apertura numérica ha de ser menor que la unidad, el menor objeto resoluble con un microscopio es ymin ≥ 0,61 λ0, del orden de una semilongitud de onda de la luz utilizada, lo que para el visible (λ0 ≈ 0,5 µm) supone: ymin ≈ 0,3 µm El microscopio óptico permite, por tanto, ver alguno de los orgánulos subcelulares (núcleo, mitocondria), pero no acceder a su estructura. Utilizando un objetivo de inmersión, diseñado para “sumergir” el objeto en un material de índice de refracción elevado (por ejemplo, aceite de cedro con n ≈ 1,52), se aumenta algo la apertura numérica y la resolución, alcanzándose hasta ymin ≈ 0,2 µm. Acabamos de calcular el tamaño mínimo de un objeto para ser resuelto por un microscopio óptico. Pero según la ecuación (22.11), que expresaba los aumentos del microscopio, el aumento de un objetivo, y por tanto del microscopio, podría incrementarse sin límite reduciendo la focal del objetivo y aumentando la distancia del tubo. Sin embargo, esta argumentación se basaba únicamente en consideraciones de óptica geométrica, sin tener en cuenta los efectos ondulatorios de la luz, que son los que producen imágenes extensas de objetos puntuales. Teniendo en cuenta los fenómenos de difracción resulta que al incrementar los aumentos del microscopio, actuando sobre sus características geométricas (distancia focal y longitud del tubo), se aumenta también el tamaño de las manchas de Airy, lo que imposibilita mejorar la resolución del microscopio. El aumento máximo razonable de un microscopio óptico es aquel que permite la observación de un objeto del tamaño mínimo resoluble (ymin ≈ 0,2 µm – 0,3 µm). Para que la observación sea cómoda, se supone que la imagen final debe subtender un ángulo θ ≈ 3' ≈ 9 × 10 ‒4 rad, algo superior al poder de resolución experimental del ojo, θexp ≈ 5 × 10 ‒4 rad. El objeto y dará una imagen intermedia de tamaño: t = y ' β= ' y − f' obj
y
(22.16)
332
Fundamentos físicos de los procesos biológicos
que se verá con un ángulo: = θ'
y' = f 'oc
β' t y = y ' ' ' f f f obj oc oc
(22.17)
Para y ≈ ymin ≈ 0,2 µm y θ' ≈ 3 '≈ 9 × 10 –4 rad, se obtiene: β' θ' 9 × 10−4 4, 5 × 103 m −1 ≈ ≈ = −6 f y ' 0 , 2 10 × min oc
y los aumentos del microscopio: β' −2 3 3 Γ ' = ( 25 cm ) × ≈ ( 25 × 10 ) × ( 4, 5 × 10 ) ≈ 10 f ' oc
Es decir, el microscopio óptico alcanza como máximo unos 1.000 aumentos y un poder de resolución de 0,2-0,3 µm. Más allá del límite de resolución por difracción El límite de las 0,2 µm para el microscopio óptico deja fuera de su alcance la observación de las estructuras subcelulares (núcleo, mitocondrias, etc.). La única forma de superar los límites calculados en la sección precedente (ymin ≈ 0,61 λ0/AN) es utilizar luz con una menor longitud de onda que la luz visible. Si utilizamos luz ultravioleta (λ0 ≈ 0,35 µm), el factor en el tamaño mínimo de un objeto resoluble que se consigue es de aproximadamente un factor λUV/ λvis = 35/50 = 0,7. Como inconvenientes deberíamos mencionar que las lentes utilizadas no pueden ser de vidrio (que absorbe el UV), sino de cuarzo. Además, el UV debe detectarse mediante vídeos o CCD sensibles al UV y no a simple vista. Todo ello supone un encarecimiento del equipo, a cambio de una mejora limitada en la resolución. El principal cambio en este sentido, tanto cualitativo como cuantitativo, se consigue con el microscopio electrónico. Como veremos en el capítulo siguiente, la aparición de la Física Cuántica puso de manifiesto que todos los corpúsculos con dimensiones subatómicas están caracterizados también por propiedades ondulatorias. La luz, que en Física clásica se describía como una onda electromagnética, en determinados casos se comporta como partículas (fotones) y a su vez, las partículas (electrones, por ejemplo) se comportan como ondas cuya longitud de onda depende de su momento lineal (p = mv) o, lo que es igual, de su energía (E = p2/2m). Dicha dependencia se expresa a través de la relación de Broglie:
333
La visión y los instrumentos ópticos
= λ h= p h
2mE
(22.18)
donde h = 6,63 × 10 ‒34 J s es la constante de Planck. Si consideramos electrones con una energía de 50 keV, la longitud de onda , es decir, cien mil veces asociada resulta ser: ), lo que, inferior a la de la luz visible ( en principio, permitiría alcanzar una mejora en la resolución igual a dicho factor. El microscopio electrónico funciona, por tanto, utilizando una fuente de electrones como “iluminación”. Los electrones son acelerados por una cierta diferencia de potencial (entre 40 kV y 100 kV), siendo desviados y focalizados utilizando lentes magnéticas, que los dirigen a la muestra y, tras atravesarla, forman la imagen del objeto sobre una pantalla. Los electrones no son visibles directamente, sino que la pantalla sobre la que se forma la imagen es fosforescente, emitiendo luz cuando inciden los electrones, con lo que la imagen se hace visible. Desafortunadamente, las lentes magnéticas no tienen la “calidad” de las lentes ópticas, y por tanto la capacidad de formar imágenes está muy limitada, no pudiendo alcanzarse el límite teórico de resolución. En la práctica, los microscopios electrónicos son capaces de resolver hasta 0,2 nm = 2 × 10 ‒10 m, es decir, objetos de tamaño unas 1.000 veces inferior a los observables utilizando el microscopio óptico. Hay que indicar también que los electrones tienen un bajo poder de penetración en la materia. El agua es particularmente absorbente y el aire también los atenúa. Por ello, los microscopios electrónicos deben trabajar en vacío (p ∼ 10 ‒5-10 ‒8 torr), y las muestras deben prepararse adecuadamente para su observación, lo que supone una parte importante de las técnicas asociadas a la utilización del microscopio electrónico en biología y una dificultad añadida.
334
Fundamentos físicos de los procesos biológicos
Fig. 22.20. Imagen de microscopía electrónica de transmisión (TEM) de células de un fibrosarcoma mostrando el núcleo en su parte central, siendo visible también el nucleolo. (Imágenes cortesía de Ángeles Villanueva, Departamento de Biología, UAM).
Microscopio de campo cercano (SNOM) Otra alternativa para mejorar el límite de resolución de los microscopios ópticos procede de un examen crítico del criterio de Rayleigh, que se ha considerado como el límite fundamental durante los últimos 100 años. Este análisis descansa en el hecho de que el límite de Rayleigh es válido cuando la difracción responde a las condiciones habituales, donde las distancias entre la fuente de iluminación y el objeto, así como entre objeto y punto de observación son grandes comparadas con la longitud de onda (d >> λ); lo que también se conoce como difracción de Fraunhofer. Sin embargo, fuera de estas condiciones, es decir, en condiciones de campo cercano (d << λ), desaparece el límite de Rayleigh. Esta idea, sin embargo, no fue de utilidad alguna hasta que no se desarrollaron medios que hacen posible situar la fuente de iluminación y la muestra a distancias nanométricas y con resolución lateral comparable. Estas técnicas surgieron de la mano de otro tipo de microscopías, tales como el microscopio de efecto túnel (STM = Scanning Tunnel Microscope) o el microscopio de fuerzas atómicas (SFM = Scanning Force Microscope).
La visión y los instrumentos ópticos
335
A partir de estos avances se desarrolló el microscopio óptico de campo cercano, también conocido como SNOM (Scanning Nearfield Optical Microscope), cuyo esquema se presenta en la figura 22.21. La iluminación es llevada a las proximidades de la muestra (d << λ) por una fibra óptica, cuyo extremo ha sido afilado y metalizado (dejando una abertura de unos 50100 nm) y cuya posición está controlada por posicionadores piezoeléctricos, con precisión nanométrica. La captación de la luz debe realizarse también en campo cercano, lo que puede hacerse por reflexión usando la misma fibra o por transmisión. El SNOM permite también utilizar la mayoría de técnicas de contraste convencionales (absorción, polarización, fluorescencia) y su aplicación se encuentra en estos momentos en pleno desarrollo, habiéndose alcanzado ya resoluciones de λ/20, es decir, unos 25 nm. Por último, la figura 22.22 presenta un resumen con el rango de aplicación de las diferentes técnicas de microscopía.
Fig. 22.21. Esquema del microscopio óptico de campo cercano (SNOM).
336
Fundamentos físicos de los procesos biológicos
Fig. 22.22. Rango de utilización de las diferentes técnicas de microscopía.
Microscopios de fluorescencia y de contraste de fase. La observación de un objeto, ya sea a simple vista o mediante un microscopio, requiere la existencia de contraste, es decir, de variación de la intensidad luminosa que llega al ojo procedente de las diferentes partes del objeto. En el mundo macroscópico esto sucede, en general, sin que el observador tenga que realizar ningún preparativo especial, ya que los objetos absorben parcialmente la luz que les llega, haciéndolos visibles. Sin embargo, cuando se trata de observar al microscopio especímenes biológicos, en muchos casos lo que uno quiere observar es básicamente un objeto transparente y, por tanto, sin apenas contraste entre la luz procedente de las diferentes partes del objeto y del entorno. Para observar estos objetos transparentes hay una primera solución, utilizada por biólogos e histólogos desde los inicios de la microscopía, consistente en teñir el objeto. Si se incorporan colorantes que sean absorbidos de forma preferente en algunas partes del objeto, se habrá dotado a éste del contraste necesario para su observación. Otro proceso alternativo consiste en conseguir que el objeto a observar se convierta en emisor de luz, lo que se consigue y utiliza en la microscopía de fluorescencia. La fluorescencia es la emisión de luz por una sustancia después de haber sido previamente excitada por luz de otra longitud de onda. La luz de excitación tiene más energía (menor longitud de onda)
La visión y los instrumentos ópticos
337
que la luz emitida posteriormente, ya que parte de la energía de excitación se cede en forma de calor, por lo que la fluorescencia puede ser seleccionada para su observación mediante el uso de filtros adecuados. A fin de aislar mejor la fluorescencia de la luz de excitación, suele adoptarse una configuración experimental como la mostrada en la figura 22.23, denominada epifluorescencia. La luz de excitación se desvía mediante un espejo selectivo que refleja únicamente esa longitud de onda (espejo dicroico), enviándose a la muestra a través del objetivo. La luminiscencia se recoge también con el objetivo, atraviesa el espejo (que no refleja a esta longitud de onda, diferente de la de excitación), se hace pasar por un filtro que selecciona el rango de emisión y finalmente se hace llegar al ocular para su observación o se registra mediante algún otro medio.
Fig. 22.23. Esquema de un sistema experimental de microscopía de epifluorescencia. La luz de excitación se desvía mediante un espejo selectivo que refleja únicamente esa longitud de onda (espejo dicroico), enviándose a la muestra a través del objetivo. La luminiscencia se recoge también con el objetivo, haciéndose pasar por un filtro que selecciona su rango de emisión y finalmente se hace llegar al ocular para su observación o se registra mediante algún otro medio.
Algunas moléculas biológicas (la clorofila, por ejemplo) son autofluorescentes, es decir, emiten luz ellas mismas al ser excitadas (usualmente por luz UV); pero en general para observar una cierta estructura es necesario proceder al uso de marcadores fluorescentes. Al igual que sucede con los
338
Fundamentos físicos de los procesos biológicos
tintes ordinarios, los numerosos marcadores fluorescentes existentes pueden seleccionarse por su fijación específica a determinadas estructuras celulares o tejidos. Sin embargo, estas técnicas no siempre son utilizables por el biólogo o el médico, ya que los colorantes y marcadores son, en muchos casos, letales y no es posible la observación de organismos vivos, siendo necesario el uso de otras técnicas. Microscopía de contraste de fase Las técnicas de contraste de fase utilizan los cambios de fase en la luz que atraviesa el objeto, para transformarlos en cambios de intensidad o, lo que es lo mismo, en contraste, por medio de un procedimiento de tipo interferencial. Consideremos el ejemplo sencillo esquematizado en la parte superior de la figura 22.24, donde se representa el paso de luz a través de un objeto transparente, de índice de refracción n diferente del medio externo. Esto quiere decir que la luz, al atravesar el objeto, lo hace con una velocidad diferente (v = c/n), por lo que se provocará un desfase en la onda (que no cambia en intensidad) dependiente del espesor del material atravesado. Si hacemos interferir dichas ondas, se producirá un cambio de intensidad que depende del desfase que lleven las ondas, tal como se ha estudiado en el capítulo anterior. Algo similar sucede si tenemos un objeto, por ejemplo una célula, que presenta variaciones de índice de refracción entre sus diferentes componentes, ya que la luz que la atraviesa se desfasa más o menos en función del índice de refracción. Por tanto, la onda procedente del objeto (la célula) contiene información sobre el mismo, no en su intensidad, que es la misma suponiendo que el objeto es básicamente transparente, sino en la fase. El proceso interferencial traduce esta información “de fase” en una información “de intensidad”, que podemos observar. Las técnicas de contraste de fase actúan así sobre la luz difractada por el objeto, pero no sobre el objeto mismo. Por ello, es una técnica especialmente adecuada para la observación de organismos vivos, tal como se presenta en la parte inferior de la figura 22.24. El primer microscopio de contrate de fase fue debido a Frits Zernike (Ámsterdam, 1888-1966), que recibió el premio Nobel de Física en 1953.
La visión y los instrumentos ópticos
339
Fig. 22.24. (Arriba) Esquema simplificado de la técnica de contraste de fase: cuando la luz atraviesa un objeto, transparente, pero de índice de refracción n ≠ 1, las ondas sufren un desfase que, por métodos interferenciales, se puede transformar en diferencias de intensidad, fácilmente observables. (Abajo) Microfotografías de contraste de fase de células HeLa vivas (Imágen cortesía de Magdalena Cañete, Departamento de Biología, UAM).
22.5 Ejercicios propuestos Ejercicio 22.1 El radio óptimo de la abertura de entrada en una “cámara oscura” se obtiene cuando el radio de la imagen geométrica coincide con el radio del disco de Airy. (a) Demuéstrese que para un objeto muy alejado esto corresponde = a R 0, 61 × λ × L , siendo λ la longitud de onda de la luz y L
340
Fundamentos físicos de los procesos biológicos
la profundidad de la cámara oscura. (b) Calcúlese el radio óptimo para una cámara de 1 m de profundidad, utilizando luz visible (λ ≈ 0,5 µm). Sol.: (b) R ≈ 0,55 mm Ejercicio 22.2 Considérese un dioptrio esférico formado por una varilla de vidrio, de índice de refracción n = 1,5 y radio de curvatura r = 0,5 m, siendo el medio externo aire (n = 1). Calcúlese (a) el valor de la distancia focal imagen, (b) la posición de la imagen de un objeto situado a 2 m de distancia a la izquierda de la superficie, (c) la posición de la imagen de un objeto situado a 1,5 m de distancia a la izquierda de la superficie, (d) posición del objeto para que la imagen se forme en el infinito ( foco objeto). Sol.: (a) 1,5 m (b) 3 m (c) 4,5 m (d) f = -1 m Ejercicio 22.3 Calcúlese el índice de refracción de un dioptrio esférico para que su foco imagen sea igual a su diámetro, es decir, para que la imagen de un objeto muy alejado se forme en la cara posterior de la esfera. Sol.: n = 2 Ejercicio 22.4 Verifíquese, de acuerdo con lo indicado en la sección 3.2, que el índice de refracción efectivo del ojo, considerado como un dioptrio esfé rico de radio r ≈ 0,7 cm y distancia focal f’ ≈ 2,5 cm, tiene un valor nefectivo ≈1,389. Ejercicio 22.5 Considerándose ahora valores más realistas que en el ejer cicio anterior, el ojo de una persona operada de cataratas, a la que se le ha extirpado el cristalino, puede considerarse como un dioptrio esférico de índice de refracción n’ ≈ 1,35 y radio de curvatura r ≈ 8 mm. Calcúlese (a) la distancia focal, (b) a qué distancia de la retina se forma la imagen de un objeto lejano. Sol.: (a) 3,1 cm (b) 0,6 cm detrás de la retina (por lo que la imagen está desenfocada) Ejercicio 22.6 Calcúlese el radio de curvatura, r, necesario para fabricar una lente biconvexa, de potencia igual a 0,5 dioptrías, con vidrio de índice de refracción: n = 1,5. Sol.: r = 2 m Ejercicio 22.7 Se construye una lente con vidrio de índice de refracción n = 1,5 con forma de menisco convergente, de radios r1 = 1 m y r2 = 2 m. Calcúlese (a) la potencia y (b) la distancia focal imagen. Sol.: (a) ϕ’ = 0,25 dioptrías (b) f’ = 4 m
341
La visión y los instrumentos ópticos
Ejercicio 22.8 ¿Cuáles serían la potencia y distancia focal de la lente del problema anterior si se sumerge en agua? Sol.: (a) ϕ’ = 0,0625 dioptrías (b) f’ = 16 m Ejercicio 22.9 Se desea construir una lente plano-convexa cuya potencia sea igual a la de otra lente, biconvexa de radios r1 = ‒r2 = r, utilizando el mismo tipo de vidrio. ¿Cuál debe ser el radio de curvatura de las caras? Sol.: r1 = ∞ , r2 = r/2 Ejercicio 22.10 Mediante una lente de distancia focal f’ = 0,2 m se obtiene la imagen de un objeto de 30 cm de alto situado a 4 m de la lente. Calcúlese (a) la posición de la imagen, (b) el aumento lateral, (c) el tamaño de la imagen, indicando si está derecha o invertida. Sol.: (a) a’ = 21 cm (b) β’ = –0,053 (c) y’ = –1,58 , es decir, invertida Ejercicio 22.11 Mediante una lente de potencia igual a 3 dioptrías se obtiene la imagen de un objeto en una pantalla que dista 2,4 m del objeto. Obténgase (a) la posición a que se ha de situar la lente respecto al objeto y (b) calcúlese el aumento lateral. Sol.: (a) d1 = 2 m y d 2 = 0,4 m (b) β’1 = –0,2 y β’2 = –5 Ejercicio 22.12 Una cámara fotográfica utiliza una lente de potencia igual a 10 dioptrías. Calcúlese (a) el tamaño máximo del objeto que se puede fotogra fiar a 2 m de distancia, suponiendo que el tamaño del fotograma es de 4 × 4 cm2. (b) La cámara tiene un mecanismo automático que puede desplazar la lente, para focalizar la imagen sobre la película. ¿Cuál es el desplazamiento necesario para fotografiar un objeto situado a 1 m de distancia? Sol.: (a) 76 cm (b) 1,25 cm Ejercicio 22.13 Calcúlese, analítica y gráficamente, la posición a’ y el aumento lateral β’ de la imagen formada por una lente de distancia focal imagen f’, cuando el objeto se encuentra a una distancia de la lente: (a) a1 = –5 f’, (b) a2 = –2 f’ y (c) a3 = –1,5 f’. Sol.: a/f’
a’/f’
β’= y’/y = a’/a
–∞
1
0
–5
1,25
–0,25
–2
2
–1
–1,5
3
–2
–1
∞
∞
342
Fundamentos físicos de los procesos biológicos
Ejercicio 22.14 La persona operada de cataratas, a que se hacía referencia en el ejercicio 5, utiliza lentes para corregir su hipermetropía. ¿Qué lentes debe utilizar para focalizar un objeto muy alejado? Supóngase que las lentes se sitúan a 10 cm de la córnea. Sol.: ϕ’ = 9,3 dioptrías Ejercicio 22.15 Un microscopio utiliza un objetivo × 20 y un ocular de dis tancia focal f’oc = 2,5 cm, siendo la longitud del tubo t = 20 cm. Calcúlese (a) la distancia focal del objetivo, (b) el aumento angular del ocular, (c) el aumento angular total del microscopio. Sol.: (a) f’obj ≈ 1 cm (b) Γ’oc = 10 (c) Γ’ = 200 Ejercicio 22.16 Un microscopio cuya longitud de tubo es t = 160 mm se utiliza con un objetivo × 20 de 4 mm de diámetro. Calcúlese la apertura numérica. Sol.: AN = 0,25 Ejercicio 22.17 Teniendo en cuenta que el límite de resolución del ojo es: θ ≈ 1' ≈ 3 × 10−4 rad , calcúlese la distancia mínima entre dos objetos y = O1-O2 para que sean resueltos a simple vista. Sol.: y ≈ 0,1 mm
22.6 Referencias Berne, R.M. y Levy, M.N. Fisiología. Ed. Médica Panamericana, 1986. Darwin, Ch. El origen de las especies ilustrado. Ediciones del Serbal, S.A., 1983. Dawkins, R. “The eye in a twinkling”. Nature, 368, 690-691 (1994). Doolittle, R.F. “More molecular opportunism”. Nature, 336, 18 (1988). Fernald, R.D. “The Evolution of Eyes”. http://www.karger.com/gazette/64/fernald/ Gordon, J. M. Spherical gradient-index lenses as perfect imaging and maximum power transfer devices”. Appl. Optics 39, 3825 –3832 (2000). Land, M. F. “Visual acuity in insects”. Annu. Rev. Entomol. 42, 147-177 (1997). Land, M.F. y Fernald, R.D. “The evolution of eyes”. Annu. Rev. Neurosci. 15, 1-29 (1992). Nilsson, D.E. “From cornea to retinal image in invertebrate eyes”. Trends in Neuroscience, 13, 55-64 (1990).
La visión y los instrumentos ópticos
343
Nilsson, D.E. y Pelger, S. “A pesimistic estimate of the time required for an eye to evolve”. Proc. R. Soc. Lond., B256, 53–58 (1994). Patton, H.D.; Fuchs, A.F.; Hille, B.; Scher, A.M. y Steiner, R. (eds.). Textbook of physiology vol. 1. Excitable cells and Neurophysiology. W.B. Saunders company, 1989. Wistow, G. y Kim, H. “Lens Protein Expresión in Mammals: Taxonspecificity and the Recruitment of Crystallins”. J. Mol. Evol. 32, 262-269 (1991). Polarized Light in Nature and Technology. http://www.polarization.com/index-net
Capítulo 23. Átomos, núcleos y radiactividad Hasta este momento, todo lo expuesto cae dentro del marco de la llamada Física Clásica, cuyas bases conceptuales son la Mecánica de Newton y el Electromagnetismo. Casi todos los fenómenos a escala macroscópica (muy superior al tamaño de los átomos) pueden entenderse en este contexto clásico, pero lo que ocurre a escala molecular, atómica o inferior necesita de un nuevo tratamiento, la llamada Física Cuántica. La misma estabilidad de los átomos o la existencia del enlace químico son fenómenos incomprensibles desde el punto de vista clásico, así como muchos otros fenómenos relacionados con los átomos o los núcleos.
23.1 Los fundamentos de la Física Cuántica En la última década del siglo XIX se produjeron algunos de los descubrimientos experimentales cuya explicación necesitó ir más allá de la física conocida hasta entonces. Los rayos X, más tarde reconocidos como un tipo de radiación electromagnética, aunque con una longitud de onda menor (y una frecuencia mayor y un poder de penetración también mayor) que el visible o la radiación ultravioleta, se descubrieron en 1895, la radiactividad natural, en 1896 y el electrón, en 1897. Estos dos últimos hallazgos tendrían, como veremos en lo sucesivo, una importancia notable en el nacimiento de la nueva ciencia. La composición atómica de la materia había sido puesta de manifiesto en el siglo XIX principalmente por la Química, pero la existencia real de los átomos todavía sería discutida hasta principios del siglo XX. Hoy, los átomos pueden verse individualmente y hasta manipularse, pero en aquella época resultaba un misterio su estructura y también los mecanismos por los que interaccionaban con la radiación electromagnética. Justamente, de los intentos de desentrañar ambos aspectos surgió la Física Cuántica.
345
346
Fundamentos físicos de los procesos biológicos
Fig. 23.1. Superficie de un cristal de rutenio en la que los átomos forman una estructura ordenada con simetría hexagonal. La imagen ha sido obtenida con un microscopio de efecto túnel (Cortesía de R. Miranda, Departamento de Física de la Materia Condensada, UAM).
23.1.1 La naturaleza de la luz Cuando un cuerpo está en equilibrio a una cierta temperatura en presencia de radiación electromagnética, se producen procesos de emisión y absorción que, en el equilibrio, se mantienen estacionarios. Como ya vimos en el capítulo 8, para un cuerpo negro, la composición de la radiación que está en equilibrio con el cuerpo depende únicamente de la temperatura, tanto en cantidad total de energía radiante como en la distribución en frecuencias. Así, cuanto más caliente está el cuerpo en cuestión, mayor es la cantidad de radiación emitida y, además, ésta tiene una frecuencia cada vez más alta.
Fig. 23.2. Diagrama logarítmico en el que se representa la longitud de onda de la radiación cuya intensidad es máxima en función de la temperatura del cuerpo radiante.
Átomos, núcleos y radiactividad
347
Así, un hierro al rojo emite, sobre todo, radiación en la zona del espectro del infrarrojo, aunque también emite en el visible, sobre todo en la región del rojo. Si la temperatura aumenta, la radiación dominante se va despla zando hacia frecuencias más elevadas y va tomando un color más amarillento y hasta azulado. La superficie del Sol está a unos 6.000 K y la radiación emitida a esa temperatura está predominantemente en la región del visible; de ahí su color amarillento. Una estrella cuya superficie esté a 20.000 K emitirá una luz más energética, en la región del azul, como es el caso de las gigantes azules, mientras que la superficie de una enana roja está a unos 3.000 K de temperatura y la luz emitida es rojiza.
Fig. 23.3. Radiación emitida por un cuerpo a 5.000 K, 6.000 K y 7.000 K. Nótese que la intensidad luminosa total (igual a la superficie debajo de cada curva) crece fuertemente con la temperatura. El máximo de la radiación emitida se encuentra, en los tres casos, en la zona del visible, pero situada en el rojo para los 5.000 K y en el azul-violeta para los 7.000 K. La superficie del Sol se encuentra a unos 6.000 K.
348
Fundamentos físicos de los procesos biológicos
En cambio, la radiación cosmológica de fondo que baña el conjunto del Universo está en el rango de las microondas y corresponde a una temperatura de 2,73 K, que es lo que se suele considerar como temperatura actual del Universo. Todos los animales, por su parte, tienen una temperatura corporal tal que emiten en el rango de la radiación infrarroja. Observación. Los instrumentos ópticos para ver por la noche están basados en la detección de la frecuencia e intensidad.de la radiación infrarroja emi tida por los cuerpos en función de su temperatura. Así, estos instrumentos incorporan dispositivos sensibles a la radiación infrarroja en lugar de a la luz visible como en el caso de los instrumentos ópticos. Por otra parte, en la literatura esotérica se menciona a veces el llamado “halo” o “aura” de las personas, una especie de emanación misteriosa de cada individuo capaz, al parecer, de contener datos sobre la personalidad del emisor, su pasado y hasta su futuro. Semejante dislate se apoya, a veces, en la exhibición de placas en las que, supuestamente, se ha conseguido captar el “aura” como una especie de luz que surge de la piel de las personas. Pues bien, se trata sencillamente de placas sensibles a la radiación infrarroja que, efectivamente, detectan este tipo de radiación: una radiación que es emitida por cualquier objeto a la temperatura del cuerpo humano y que tiene el mismo origen, y no más misterio, que la luz emitida por el filamento incandescente de una bombilla. La estructura de la radiación emitida por los cuerpos en equilibrio térmico era inexplicable en términos de la Física Clásica. Para explicarla, Max Planck introdujo en 1900 la idea de que los intercambios de energía entre materia y radiación debían estar cuantificados, es decir, consistir en un número entero de cuantos indivisibles, cada uno de ellos de una minúscula cantidad de energía dependiente de la frecuencia de la radiación involucrada en el intercambio. Esta hipótesis, que permitía explicar perfectamente los datos experimentales, era por completo extraña a los principios de la Física Clásica y se consideró, durante muchos años, incluso por el propio Planck, provisional y carente de cualquier significado profundo acerca de las propiedades de la materia a escala atómica. En realidad, sin que Planck y otros científicos de la época fueran conscientes de ello, estaba iniciándose una verdadera revolución científica: el nacimiento de la Física Cuántica. Más tarde, en 1905, Einstein sugirió que la hipótesis de Planck podía responder a que la propia radiación estaba cuantificada, es decir, constituida por un flujo enorme de “corpúsculos” de luz, más tarde llamados fotones, dotado cada uno de ellos de una energía dependiente de la frecuencia de la radiación. Así, los intercambios de energía con la materia consistirían en la
349
Átomos, núcleos y radiactividad
absorción o emisión de un cierto número de fotones y, por lo tanto, la energía intercambiada tendría que ser un múltiplo entero de la energía de cada fotón. Ésta sería de la forma: Eγ = hf
(23.1)
c , siendo c la λ velocidad de propagación y λ su longitud de onda. Por su parte, h es una constante, la llamada constante de Planck, con dimensiones de energía multiplicado por tiempo (que son las dimensiones del momento angular). Su valor se extrajo de los datos experimentales existentes sobre la radiación del cuerpo negro y el llamado efecto fotoeléctrico, que es el fenómeno cuyas propiedades explicó Einstein con ayuda de su hipótesis corpuscular: donde Eγ es la energía de un fotón de luz de frecuencia f =
h 6, 63 ×10−34 J ⋅ s La expresión (23.1) se conoce como relación de Planck-Einstein. Ejemplo. Tomemos el caso de luz visible de una longitud de onda de unos 6.000 Å. Su frecuencia será: 3 ×108 f = = 0,5 ×1015 Hz −7 6 ×10 La energía de cada corpúsculo de luz de esta longitud de onda, es decir, de cada fotón, será: Ev = hf = 6,63 × 10 ‒34 × 0,5 × 1015 J = 3,3 × 10 ‒19 J ≈ 2 eV Una bombilla de 100 W emite energía luminosa a un ritmo de 100 julios por segundo. Por lo tanto, emite: 100 fotones por segundo 3 ×1020 fotonesporsegundo 3,3 ×10−19 La pequeñez de la constante de Planck hace que en cualquier fenómeno macroscópico intervenga una cantidad tan gigantesca de fotones que el carácter corpuscular de la luz no se manifiesta de forma aparente. No obs tante lo cual hoy pueden observarse fotones individuales con ayuda de ins trumentos de laboratorio.
350
Fundamentos físicos de los procesos biológicos
Pero los fotones deben desplazarse a la velocidad de la luz, lo cual implica, en el contexto de la Relatividad Especial de Einstein, que la magnitud que hemos llamado masa inercial en el capítulo 2 (también llamada masa en reposo) es cero y que su velocidad no puede ser alterada. Una partícula de estas características tiene también un momento lineal p cuyo módulo está relacionado con la energía a través de la siguiente expresión: pγ =
Eγ c
=
hf h = c λ
(23.2)
Así, los fotones están caracterizados por magnitudes mecánicas propias de cualquier corpúsculo: energía y momento. Más tarde, durante el primer cuarto del siglo XX, se demostró que, efectivamente, la radiación electromagnética estaba formada por corpúsculos, los fotones, cuyo comportamiento mecánico es idéntico al de partículas como los electrones o los protones con la particularidad de tener una masa igual a cero. El problema es que la naturaleza corpuscular de la luz, sugerida por Newton y posteriormente abandonada, es contradictoria con sus propiedades ondulatorias manifestadas espectacularmente en los fenómenos de difracción e interferencias. No es posible asignar un carácter corpuscular, discontinuo, a la luz sin resolver al mismo tiempo esta contradicción, tarea que requiere la introducción del nuevo marco conceptual de la Física Cuántica.
23.1.2 La estructura del átomo El electrón resultó ser una partícula con carga eléctrica que se podía arrancar de los átomos en ciertas condiciones experimentales. Dado que los átomos son neutros, la existencia en su interior de electrones, cuya carga se conviene en considerar negativa, implica que debe haber otros componentes del átomo con carga positiva. Se avanzaron en esa época modelos atómicos compatibles con el electromagnetismo clásico, como el modelo de Thomson, que visualiza los átomos como porciones de materia cargada positivamente ocupando todo el volumen atómico de forma homogénea e incluyendo a los electrones como pequeños corpúsculos embebidos en esa materia, de la misma forma que un bollo contiene pasas en su interior. Pero en 1911 Rutherford descubrió que la práctica totalidad de la masa de un átomo está contenida en un volumen mucho más pequeño que el volumen atómico, en lo que se llamó el núcleo atómico, cuyo diámetro es del orden de 100.000 veces más pequeño que el diámetro atómico. Así, si un átomo tiene un radio del orden de 1 angstrom (10 ‒10 m), el núcleo tiene
351
Átomos, núcleos y radiactividad
un radio del orden de 1 fermi (10 ‒15 m). El núcleo debe estar cargado, por lo tanto, positivamente y los electrones parecen estar orbitando alrededor del núcleo de la misma forma que los planetas alrededor del Sol, sólo que la interacción responsable de la fuerza atractiva no es la gravitación sino el electromagnetismo. Más adelante se descubrió que el núcleo no es un sistema simple, sino que está compuesto por la agregación de partículas de dos clases: protones y neutrones. Los protones tienen una masa igual a unas 1.840 veces la masa del electrón y una carga igual y de signo contrario a la del electrón, mientras que los neutrones no tienen carga y son ligeramente más pesados que los protones. Así, puesto que el átomo es eléctricamente neutro, el número de protones en el núcleo determina el número de electrones de la corteza, su número atómico y, en consecuencia, las propiedades químicas del átomo, mientras que la suma de neutrones y protones, el llamado número másico, determina la masa total del átomo. Se llama nucleones a los protones y neutrones indistintamente, dado que sus propiedades, excepto la carga eléctrica, son muy parecidas. Así, el número másico es igual al número de nucleones en el núcleo.
Fig.23.4. Núcleo atómico formado de protones y neutrones.
Tabla 23.1 Propiedades de las partículas que forman los átomos Partícula
Masa
Carga
Electrón
9,11 × 10 –31 kg = 0,51 MeV/c2
−e = −1, 60 ×10−19 C
Protón
1,673 × 10 –27 kg = 0,939 GeV/c2
+e = +1, 60 ×10−19 C
Neutrón
1,675 × 10 –27 kg = 0,941 GeV/c2
0
Observación. Las masas de las partículas subatómicas se suelen expresar en electronvoltios dividido por la velocidad de la luz al cuadrado (eV/c2). De acuerdo con la fórmula de Einstein, la energía asociada a la masa m de una partícula en reposo es: E = mc 2 y, por lo tanto, se puede expresar la masa en unidades de energía dividida por la velocidad de la luz al cuadrado. Para magnitudes atómicas, la unidad de energía básica es el electronvoltio:
352
Fundamentos físicos de los procesos biológicos
1 eV = 1, 60 ×10−19 J 1 MeV = 106 eV = 1, 60 ×10−13 J por lo que: 1 eV / c 2
1, 60 ×10−19 J
(3 ×10 ) ( m / s ) 8 2
2
≈ 0,18 × 10−35 kg
1 kg = 5, 6 ×1035 eV / c 2 5, 6 ×1029 MeV / c 2 De ahí que la masa del electrón, por ejemplo, sea igual a 9,11 × 10 ‒31 kg × 5,6 × 1029 (MeV / c2) / kg = 0,51 MeV / c2 El descubrimiento de un núcleo de dimensiones mucho más pequeñas que las del átomo, en el que se concentra la práctica totalidad de la masa, presenta varios problemas en el contexto de la Física Clásica. El primero es que un electrón moviéndose con un movimiento acelerado (como es el de la órbita alrededor de una carga positiva) emitiría, según el electromagnetismo clásico, radiación e iría cayendo hacia el núcleo en una trayectoria espiral hasta colisionar con él en una minúscula fracción de segundo. Es decir, los átomos serían inestables, en completa contradicción con la experiencia del mundo físico en el que no colapsan, sino que mantienen su estructura y sus dimensiones. El segundo problema es que en los átomos con más de un protón en el núcleo (todos menos el hidrógeno) éste se mantiene estable a pesar de que los protones, cargados positivamente, se repelen electrostáticamente. Esta última observación sugiere la existencia de un tipo de interacción nueva, desconocida hasta el siglo XX, no observable a escala macroscópica, ni siquiera a escala atómica, pero más potente que la electromagnética, puesto que contrarresta la repulsión entre los protones. Esta interacción recibe el nombre de interac ción nuclear fuerte y sólo actúa a distancias del orden del tamaño de un núcleo, que es el mismo orden de magnitud que el de un protón, ya que los nucleones se encuentran empaquetados en el núcleo sin dejar prácticamente espacios libres entre ellos. Si se extrajera un protón del interior del núcleo y se le colocara a una cierta distancia del mismo, la interacción fuerte dejaría de actuar, manifestándose entonces la repulsión electrostática que separa el protón del núcleo.
353
Átomos, núcleos y radiactividad
Por otro lado, era ya conocida en ese tiempo la estructura de los espectros atómicos, es decir, la composición de la radiación electromagnética emitida por los distintos elementos químicos cuando son excitados térmica, óptica o eléctricamente. Cuando se analiza la radiación emitida no surge un espectro continuo, sino que aparecen una serie de emisiones discontinuas corres pondientes a longitudes de onda bien definidas, es decir, una superposición de ondas monocromáticas muy difícil de entender e interpretar según las teorías clásicas, pero con regularidades que fueron encontradas empíricamente.
Longitud de onda (en angstrom) Fig.23.5. Serie de Balmer de líneas espectrales del hidrógeno. Las cuatro primeras líneas están en el visible, la quinta en la frontera entre el violeta y el ultravioleta y el resto dentro del ultravioleta.
Para el átomo de hidrógeno, por ejemplo, Balmer encontró en 1885 que las líneas del espectro que aparecían al analizar la luz emitida se ajustaban a la expresión: 1 4 1 1 = − λ λ0 4 n 2 donde n = 3, 4, 5... y λ0 es la longitud de onda que se obtiene en el límite cuando n → ∞ Balmer encontró cuatro líneas en el rango del visible, corres pondientes a n = 3, 4, 5, 6, con lo que pudo encontrar el valor de λ0:
λ0 ≈ 3.650 Å que está en el ultravioleta. Si calculamos las longitudes de onda correspondientes a esas cuatro primeras líneas veremos que sus valores son λ ≈ 6.560 Å, 4.860 Å, 4.330 Å, 4.100 Å, respectivamente, que se sitúan entre el rojo y el violeta. Posteriormente pudo explorarse el espectro electromagnético en el ultravioleta y se observaron las rayas correspondientes a valores sucesivos de n. También se encontraron otras series de rayas, siempre de la forma:
354
Fundamentos físicos de los procesos biológicos
1 n12 1 1 = − λ λ0 n12 n22 con n1, n2 enteros positivos y n1 < n2, que se describen en los ejercicios 7 y 8 de este capítulo, así como series similares para otros átomos. Esta estructura en forma de emisiones discretas no tiene explicación en el marco de la Física Clásica.
23.1.3 El modelo de Bohr El modelo propuesto por Niels Bohr en 1913 proporciona una explicación para la estructura del átomo de hidrógeno y de los espectros atómicos compatible con los datos experimentales. El modelo se inspiraba en las ideas de cuantificación de PlanckEinstein y extrapolaba algunas de sus hipótesis al caso de los electrones. Para una órbita circular de radio R, la fuerza centrípeta será la atracción culombiana entre el electrón y el protón, es decir: v2 e2 m = Ke 2 R R
(23.3)
1 (ver el capítulo 17). De la ecuación (23.3) se puede despejar 4πε 0 v2 y sustituirlo en la expresión de la energía total:
donde K e =
E=
1 2 e2 1 e2 e2 1 e2 mv − K e = K e − K e = − K e 2 R 2 R R 2 R
(23.4)
Por otra parte, la hipótesis de Bohr es que el electrón gira alrededor del núcleo de forma estable, sin emitir energía electromagnética, cuando se mueve en órbitas llamadas estacionarias, caracterizadas por la propiedad h , siendo h la de que su momento angular es un múltiplo entero de = 2π constante de Planck ( = 1, 055 ×10−34 JJ ·⋅ s): L = pR = mvR = n
(23.5)
con n igual a un número entero positivo. De este postulado y de la igualdad entre fuerza centrípeta y culombiana deducimos que:
355
Átomos, núcleos y radiactividad
2
Ke
v 2 m n n2 2 e2 = m = = R2 R R mR mR 3
de donde podemos despejar R: R=
2 n2 2 mK e e
y sustituir en la expresión (23.4), que nos da la energía total: E=−
mK e2 e 4 1 2 2 n 2
(23.6)
La hipótesis de cuantificación de Bohr implica que sólo un conjunto discreto de órbitas están permitidas, con energías que son iguales a una constante dividida por n2, y los radios de esas órbitas también están cuantificados variando proporcionalmente al cuadrado de ese mismo número n. Se llama nivel fundamental a aquel que tiene la energía más pequeña (más nega tiva) y corresponde, por tanto, al valor n = 1. En este nivel, el radio de la órbita es también el mínimo posible. Llamando RB (radio de Bohr) y E0 al radio y la energía del estado fundamental, respectivamente, podemos encontrar los valores numéricos predichos:
(1, 055 ×10−34 ) 2 = 21, 7 ×10−19 JJ == 13,6 E0 = = 13, 6eV 2 2 31 10 − − 2mRB 2 × 9,11×10 × ( 0,53 × 10 ) 2
y los radios y las energías de todas las órbitas posibles serán: Rn = RB n 2 En = − E0
1 n2
(23.7)
El modelo de Bohr predice, así, que el diámetro de un átomo de hidró geno es del orden de 10 ‒10 m, mucho mayor que el del núcleo, y la energía de ligadura del estado fundamental es de 13,6 eV. Nótese que ambos
356
Fundamentos físicos de los procesos biológicos
valores, de longitud y masa, aparecen en una combinación especial de constantes clásicas más la constante de Planck y resultan ser correctos y verificados experimentalmente. Las órbitas que cumplen la condición de cuantificación son estacionarias, pero es posible que se den saltos entre ellas absorbiendo energía el electrón (cuando se desplaza a una órbita más externa) o emitiéndola (cuando se desplaza a una más interna). La primera consecuencia es que el estado funda mental es absolutamente estable al no existir ninguna órbita más interna a la que saltar. La segunda se refiere a los espectros atómicos. Cuando los átomos son excitados, térmica, óptica o eléctricamente, el electrón de algunos de ellos puede absorber energía y saltar a órbitas más externas para posteriormente desexcitarse volviendo a las órbitas más internas. Al saltar de una órbita caracterizada por un número n2 a otra, de menor radio, caracterizada por n1, el electrón emite energía en forma de un fotón. Teniendo en cuenta la relación de Planck-Einstein y la expresión (23.7) para la energía de los distintos niveles, la frecuencia de la luz emitida dependerá de la energía del fotón emitido: 1 1 Eγ = hf = En − En = E0 2 − 2 2 1 n1 n2 es decir: 1 f E0 1 1 = = − λ c hc n12 n22 que es la expresión de las series de emisiones en el espectro electromagnético del hidrógeno. En particular, las transiciones entre las órbitas con n = 3, 4, 5... y n = 2 dan lugar a la serie de Balmer: 1
λBalmer
=
E0 1 1 4 1 1 − = − hc 4 n22 λ0 4 n22
de donde podemos deducir el valor de la longitud de onda λ0:
que es, precisamente, el valor encontrado empíricamente al que ya nos hemos referido antes.
357
Átomos, núcleos y radiactividad
El modelo de Bohr tiene un enorme poder predictivo. Posteriormente, este modelo se completó con el tratamiento de órbitas no sólo circulares, sino también elípticas, lo que lleva a introducir un nuevo número cuántico l, independiente de n, que permite explicar otras características del espectro del átomo de hidrógeno. Sin embargo, este modelo tiene algunos inconvenientes graves: 1) No puede ser generalizado a otro tipo de átomos con más de un electrón. 2) Su fundamentación teórica es endeble y su hipótesis de partida arbitraria. Ambos inconvenientes encontrarán remedio en la formulación más general de la Física Cuántica.
23.1.4 La relación de de Broglie Es conveniente observar, en el contexto del modelo de Bohr, que la condición de cuantificación para las órbitas permitidas equivale a la de existencia de ondas estacionarias en dichas órbitas suponiendo que el electrón tenga propiedades ondulatorias además de las propias de un corpúsculo. Para que aparezcan ondas estacionarias a lo largo de una circunferencia, es necesario que se repita la forma de la onda cuando se da una vuelta completa, lo que implica que la longitud de la circunferencia debe ser un múltiplo entero de la longitud de onda: 2π R = nλ R=n
λ 2π
(23.8)
y de la condición de cuantificación de Bohr (23.5): −34 1 (1,h055 ×10 ) 2 R= ==n = 21, 7 ×10−19 J = E0n= 2 2 31 10 − − p 2π p 2mRB 2 × 9,11×10 × ( 0,53 × 10 ) 2
se sigue que las eventuales propiedades ondulatorias de un electrón están caracterizadas por una longitud de onda ligada al momento lineal a través de la relación: h p= (23.9) λ similar a la que ya encontramos para el caso del fotón.
358
Fundamentos físicos de los procesos biológicos
A partir de los resultados obtenidos para la luz (poniendo de manifiesto su carácter cuántico o corpuscular) y para los electrones (poniendo también de manifiesto su carácter cuántico y ondulatorio) Louis de Broglie, en 1923, concluyó que toda partícula subatómica posee ambos caracteres y que la ecuación (23.9) expresa de forma universal la relación entre el momento, que es una magnitud propia de los corpúsculos en movimiento, y la longitud de onda, que es propia de la propagación de las ondas, conocida desde entonces como relación de de Broglie. Más tarde, fue posible detectar directamente el carácter ondulatorio de los electrones haciendo incidir un haz de estas partículas sobre la superficie de un sólido cristalino que actúa como una red de difracción, observándose las bandas de interferencia propias de la superposición de ondas. La longitud de onda extraída del análisis de las figuras de difracción resulta ser justamente la predicha por la relación de de Broglie en función del momento de los electrones incidentes.
Fig. 23.6. (a) Difracción de rayos X por una muestra de silicio policristalino. (Cortesía de Ramón Fernández Ruiz, SIDI, UAM). (b) Difracción de electrones por una muestra de Cu1,75S, a la izquierda y Cu2S, a la derecha. (Cortesía de Eduardo Elizalde, Departamento de Física Aplicada, UAM). Ambas figuras, junto con la 21.36 realizada a partir de luz visible de 488 nm de longitud de onda (azul), tienen esencialmente la misma estructura.
Todas las partículas, por lo tanto, tienen un doble carácter, lo que se ha dado en llamar dualidad ondacorpúsculo, de forma inseparable, aunque, en función de la situación experimental, se pone de manifiesto uno u otro perfil. Debe entenderse que cualquier partícula, ya sea microscópica o macroscópica, tiene ese doble carácter de onda y partícula, pero en general sólo se traduce en fenómenos observables cuando las magnitudes que entran en el problema son del orden de la constante de Planck. Ejemplo. Un electrón situado en el nivel fundamental del átomo de hidró geno tiene un momento: p = mv =
RB
por lo que la longitud de onda asociada será:
359
Átomos, núcleos y radiactividad
λ=
h = 2π RB ≈ 3,3 Å p
que es del orden de magnitud de la distancia entre átomos en un sólido. El carácter ondulatorio de las partículas es la causa de que, cuando están confinadas, no puedan encontrarse en cualquiera de los estados posibles clásicamente, sino sólo en aquellos para los que la onda asociada es estacionaria. Para el movimiento en una caja unidimensional de longitud L, también llamada pozo de potencial infinito en una dimensión, la partícula no puede traspasar los límites de la caja, por lo que la onda asociada debe anularse en los dos extremos y dicha condición implica que la longitud de la caja debe ser un múltiplo entero de la semilongitud de onda:
λ 2 lo que implica para los valores posibles del momento y la energía: L=n
pn = En =
h h = n λ 2L
pn2 h2 2 = n 2m 8mL2
(23.10)
La expresión precedente traduce una consecuencia muy general. Los estados ligados (confinados en un espacio finito debido a la existencia de barreras de energía potencial) están siempre cuantificados y los valores de las energías y momentos son discretos. Por otra parte, la separación entre niveles de energía es inversamente proporcional al cuadrado de la dimensión de confinamiento, de forma que cuando ésta se hace muy grande (en relación, como se ve en el caso de la expresión (23.10), con una magnitud que contiene a la constante de Planck), lo que ocurre en el límite clásico, los intervalos tienden a cero y el espectro discontinuo se hace continuo. En todos los casos de confinamiento se produce el fenómeno de la cuantificación de los estados y niveles de energía, es decir, la dependencia de un número entero, pero la forma concreta de esa dependencia varía según el tipo de interacción responsable del confinamiento.
360
Fundamentos físicos de los procesos biológicos
Fig. 23.7. Estructura de los niveles de energía de un electrón confinado en una caja unidimensional de 1 angstrom de anchura, a la izquierda, y en un átomo de hidrógeno, a la derecha.
Ejemplo. Si un electrón está confinado en un volumen cuya dimensión lineal es el diámetro de un átomo, es decir, 1 Å, la energía típica EA (estado fundamental, n = 1) será, de acuerdo con la expresión (23.10):
( 6, 63 ×10 ) = 8 × 9,1×10 × (10 ) −34 2
EA
−31
−10 2
= 0, 6 ×10−17 J ≈ 37 eV
Este valor no coincide con la energía del estado fundamental del átomo de hidrógeno (13,6 eV) porque es la atracción culombiana la que mantiene al elec trón ligado y no la existencia de “paredes” rígidas, pero sí que nos da su orden de magnitud. De ahí que pueda esperarse que los fotones emitidos por desexcita ción de electrones atómicos tengan energías del orden de electronvoltios. Si ahora consideramos un nucleón (protón o neutrón), la energía típica EN de enlace en un núcleo atómico del tamaño de 2 fermi (2 × 10‒15 m) puede cal cularse a partir de la anterior: EN = E A
me L2at 1 = E A ≈ 1, 4 ×106 E A 2 2 mN Lnucl 1.800 × ( 2 ×10−5 )
Es decir, que si las energías típcas de los electrones en los átomos son del orden de electronvoltios, las de los nucleones en el núcleo son del orden de millones de electronvoltios (MeV) debido a la pequeña dimensión del confinamiento. Así,
Átomos, núcleos y radiactividad
361
los fotones procedentes de núcleos excitados tienen energías en el rango de los MeV, lo que da longitudes de onda: hc 6, 63 ×10−34 × 3 × 108 ≈ 1, 2 × 10−12 m = 0, 012 Å λ= = 6 −19 E 10 × 1, 6 × 10 muy pequeñas en comparación con las de la luz visible e incluso las de la radia ción ultravioleta y rayos X. Se trata de fotones muy energéticos conocidos como rayos gamma.
23.1.5 La dualidad onda-corpúsculo Así, la conclusión a la que se llega a partir de los resultados experimentales y de los modelos teóricos construidos para explicarlos es que toda partícula caracterizada por magnitudes atómicas o subatómicas tiene propiedades, a la vez, de onda y de corpúsculo y la conexión entre ambos aspectos viene dada por la relación de de Broglie. Para ver claramente cómo se complementan ambos aspectos, es útil analizar el experimento de Young en el que se producen interferencias cuando se hace incidir luz a través de dos rendijas. Ya sabemos que, al poseer la luz un carácter ondulatorio, las ondas procedentes de las dos rendijas se superponen y generan una onda cuya amplitud varía en función de la diferencia de distancias recorridas (capítulo 22), con el resultado de que aparecen máximos y mínimos sobre la pantalla, las llamadas bandas de interferencia. Lo que está claro de este experimento es que la intensidad luminosa en la pantalla no es la suma de las intensidades asociadas al paso de la luz por cada una de las rendijas con la otra tapada, como sería el caso si en lugar de hacer incidir luz hubiéramos utilizado partículas macroscópicas. Pero ya sabemos que la luz está constituida por un conjunto de corpúsculos llamados fotones. Así que podemos reducir la intensidad del haz incidente hasta un punto en el que los fotones vayan incidiendo de uno en uno, con una separación suficiente como para que cuando uno llegue a las rendijas el precedente haya sido ya absorbido en la pantalla, lo que demuestra que las franjas no pueden ser el resultado de la interacción entre ellos. Cada fotón se manifiesta en la pantalla como un corpúsculo compacto, produciendo una señal puntual; su carácter de partícula es indudable. El sitio en el que incide es, en principio, impredecible: hasta donde cubre el frente de la onda clásica asociada al haz luminoso puede aparecer un fotón e interaccionar con la pantalla. Pero según van llegando los fotones se van acumulando en los máximos de las bandas de interferencia asociadas a la onda. Se depositan muchos en los máximos y muy pocos en los mínimos, de forma que cuando el número
362
Fundamentos físicos de los procesos biológicos
de fotones es muy elevado, como ocurre en los fenómenos luminosos clásicos, la distribución de los mismos sobre la pantalla se ajusta exactamente a la estructura en franjas. La intensidad luminosa en una región del espacio es, por lo tanto, pro porcional a la densidad de fotones en esa región, mientras que la onda clásica parece determinar la probabilidad de que cada fotón aparezca en un punto e interaccione con la pantalla. Clásicamente, la radiación electromagnética puede describirse a través del valor del campo eléctrico oscilante, y la intensidad luminosa es proporcional al cuadrado del valor medio de la onda que describe al campo. Pero el experimento que estamos describiendo muestra que la onda en cuestión no es una distribución continua de materia o energía, como en la interpretación clásica, sino una onda de probabilidad. Y, como la intensidad luminosa es proporcional al número de fotones, resulta que la probabilidad de que uno de estos fotones esté en un punto será proporcional al cuadrado del módulo de la onda asociada. Como ya hemos dicho antes, para un número gigantesco de fotones, la interpretación corpuscular-probabilística es indistinguible de la clásica. Lo interesante es que lo dicho para fotones se aplica exactamente igual al caso de los electrones, con la única condición de que la distancia entre las rendijas sea comparable con el orden de magnitud de la longitud de onda asociada, que, como hemos visto, es del orden del angstrom. Ahora bien, los átomos de una superficie cristalina se encuentran dispuestos ordenadamente a distancias justamente de ese orden de magnitud, así que las redes de difracción para electrones son las estructuras creadas por el ordenamiento de los átomos en los cristales. Si hacemos incidir un haz de electrones sobre una superficie cristalina y estudiamos su distribución sobre una pantalla, una vez han interaccionado con la superficie, encontramos las mismas figuras de difracción e interferencias que en el caso de luz. Pero en este caso no hay onda clásica alguna asociada al movimiento de los electrones, aunque sí una onda de probabilidad de forma idéntica al caso de los fotones. Del estudio detallado de las propiedades complementarias de onda y corpúsculo de las partículas atómicas o subatómicas, se sigue que, en realidad, en el mundo microscópico (de dimensiones atómicas o menores) no puede man tenerse la noción de trayectoria ya que la descripción del movimiento es probabilística, a través de una onda que caracteriza el estado de cada par tícula. Los conceptos básicos en la Física Cuántica son los estados y las ondas, o funciones de onda, que caracterizan sus propiedades, no las trayectorias. Un electrón en un átomo no se mueve en órbitas circulares como pretendía el modelo
Átomos, núcleos y radiactividad
363
de Bohr, sino que, en el estado fundamentel, existe una probabilidad significativa de que se encuentre en cualquier punto del volumen atómico y prácticamente cero de que esté fuera, aunque el borde no es nítido sino algo borroso. Para estados excitados, asociados a órbitas más alejadas del núcleo, la probabilidad de presencia del electrón es sólo significativamente distinta de cero para una región situada alrededor de la órbita estacionaria asociada a dicho estado. Lo que sí está definido es un conjunto de magnitudes como la energía o el momento angular, pero no la posición o la velocidad. Si intentamos detectar la posición de un electrón en un átomo con un instrumento de medida, la observación resultante es que el electrón se localiza en un punto, de forma análoga a como lo haría un corpúsculo clásico, pero entonces dejará de estar en el estado estacionario de energía bien definida en el que se encontraba de forma estable. Efecto túnel De las propiedades generales que tienen los sistemas subatómicos de comportarse como corpúsculos y como ondas, se deriva otro hecho de importancia capital: la capacidad que tienen las partículas microscópicas de atravesar barreras de potencial que clásicamente serían infranqueables. Es el llamado efecto túnel, que aparece cuando una partícula se mueve con una energía potencial del tipo de la que se muestra en la figura 23.8.a, que se conoce con el nombre de barrera de potencial.
Fig.23.8. (a) Clásicamente, una partícula que incide sobre la barrera de potencial desde la izquierda con una energía E < U0 rebota y acaba moviéndose en dirección contraria con la misma energía cinética. Cuánticamente, debido a las propiedades ondulatorias de la partícula, existe una probabilidad no nula de que aparezca al otro lado de la barrera y se mueva hacia la derecha. La probabilidad disminuye exponencialmente con la anchura de la barrera. (b) Densidad de probabilidad de presencia de una partícula que incide sobre la barrera de potencial desde la izquierda con una energía E < U0. Nótese que es distinta de cero al otro lado de la barrera. Cuanto más ancha sea ésta, mayor será el decrecimiento exponencial y menor será el valor de la probabilidad de que la partícula la atraviese.
364
Fundamentos físicos de los procesos biológicos
Si consideramos una partícula incidente desde la izquierda con una energía insuficiente para superar la barrera de potencial, entonces clásicamente rebotaría en ella y se movería hacia la izquierda con la misma velocidad incidente pero cambiada de signo. Pues bien, se puede demostrar que la onda que describe el movimiento de la partícula es siempre distinta de cero al otro lado de la barrera. Si la partícula está en un estado caracterizado por tener un momento bien definido, el módulo al cuadrado de la función de onda tiene la forma que muestra la figura 23.8.b. Por lo tanto, hay una cierta probabilidad no nula de encontrar la partícula al otro lado de la barrera. Una probabilidad que disminuye exponencialmente con la anchura de la barrera y con la diferencia entre su altura y la energía de la partícula incidente, pero observable en muchos casos. Así, es esta cualidad de los corpúsculos microscópicos la que hace posible fenómenos como el enlace químico o la radiactividad. En la desintegración alfa, una partícula alfa formada por dos protones y dos neutrones se mantiene ligada a un núcleo pesado gracias a la interacción nuclear fuerte, que es atractiva, pero, si se coloca a una distancia superior al tamaño del núcleo, experimenta la repulsión electrostática debida a que su carga, igual que la del resto del núcleo, es positiva. La energía potencial de la que deriva la fuerza que actúa sobre la partícula α es como la de la figura 23.9. Las partículas alfa que se forman en el interior de los núcleos con un número de protones superior a 83 se mueven con una energía total positiva, aunque menor que el máximo de la curva de la energía potencial. Clásicamente no podrían nunca escapar a la atracción del núcleo, pero gracias a sus propiedades cuánticas, hay una pequeña probabilidad de que atraviesen la barrera y se alejen indefinidamente del núcleo. Ésta es la razón de que todos esos núcleos se desintegren emitiendo una partícula α. La teoría cuántica permite calcular la probabilidad de pasar la barrera y de ahí su vida media, que varía desde menos de una millonésima de segundo para el polonio 212, Po84212, a millones de años para el uranio 238, U 92238 .
Átomos, núcleos y radiactividad
365
Fig. 23.9. Energía potencial de una partícula alfa en un núcleo pesado en función de la distancia r a su centro. Para distancias menores que el radio nuclear R, la interacción es atractiva debido a la existencia de la interacción nuclear fuerte. Para distancias superiores a R, la interacción es repulsiva debido a la repulsión electrostática. En el U238 uno de los niveles de energía de la partícula alfa es de 4,2 MeV.
Veamos ahora cómo puede explicarse la existencia de una molécula de hidrógeno. Un átomo de hidrógeno es un electrón que se mantiene ligado a un protón por efecto de la interacción electrostática. Si un segundo protón se acerca, la curva de la energía potencial se modifica, de forma que hay ahora dos mínimos, uno en las cercanías de cada protón. Pero el electrón que forma parte del átomo alrededor del protón número 1 no puede nunca moverse hasta las cercanías del protón 2 porque hay una barrera de potencial, como la que se muestra en la figura 23.10, que se lo impide. Cuánticamente, sin embargo, hay una cierta probabilidad de que el electrón atraviese la barrera y se localice en las cercanías del segundo protón. En realidad, existe un estado, en el que el electrón tiene la misma probabilidad de estar en cada uno de los dos sitios (está deslocalizado), cuya energía es menor que si permanece formando un átomo con uno de los protones, es decir, es un estado más estable. Cuando la distancia entre los protones es suficientemente pequeña como para que la probabilidad de atravesar la barrera sea significativa, el electrón se deslocaliza y se forma una molécula de hidrógeno (ionizada si sólo hay un electrón), más estable que los dos átomos separados. Éste es el origen del enlace químico, un fenómeno inexplicable en el marco de la Física Clásica.
366
Fundamentos físicos de los procesos biológicos
Un dispositivo llamado microscopio de efecto túnel se basa en que la probabilidad que tiene un corpúsculo cuántico de atravesar una barrera de potencial varía enormemente con la anchura de la barrera. En esencia, el dispositivo mide la cantidad de electrones que pasan, por efecto túnel, entre una punta metálica y el sustrato que se quiere explorar. Dicha cantidad depende de la distancia entre ambos y permite reconstruir el relieve del sustrato con una precisión tal que se pueden identificar los átomos individuales. La figura 23.1, en la que pueden distinguirse los átomos de forma individual, se ha obtenido precisamente con uno de estos dispositivos.
23.1.6 Energía de enlace Antes hemos estimado cualitativamente las energías de un electrón confinado en el volumen de un átomo y de un nucleón en el volumen de un núcleo, aunque también pueden calcularse exactamente. Ahora bien, la fórmula de Einstein establece una relación general entre masa y energía. Por tanto, para un sistema compuesto, como es un átomo o un núcleo, las variaciones en la energía de interacción entre sus componentes se reflejan en la masa total del sistema. Si consideramos un electrón alejado de un protón y ambos en reposo, la masa total del sistema formado por ambas partículas será la suma de sus
367
Átomos, núcleos y radiactividad
masas. Y, en consecuencia, la energía total concentrada en ese sistema de dos cuerpos alejados será: E = me c 2 + m p c 2 donde me y mp son, respectivamente, la masa del electrón y la del protón. Si ahora el electrón es atraído por el protón hasta situarse en el estado estacionario de energía más baja posible, ha debido ir emitiendo fotones según ha ido saltando niveles hasta llegar al fundamental. Ahora tiene una energía igual a ‒13,6 eV y la suma de las energías de los fotones emitidos por el electrón según se aproxima al estado fundamental es igual también a 13,6 eV. La energía contenida en el nuevo sistema constituido por un electrón y un protón formando un átomo de hidrógeno será: E = me c 2 + m p c 2 − U enlace siendo Uenlace el valor absoluto de la energía potencial de interacción entre el electrón y el protón. Por eso, el sistema formado por un protón y un electrón ligados en un átomo de hidrógeno es más estable que el formado por ambas partículas separadas. La masa del átomo, mH, será: mH =
U E = me + m p − enlace 2 c c2
menor que la suma de las masas de electrón y protón libres. Para romperlo, para ionizarlo y expulsar al electrón del átomo, hay que darle a éste una energía mayor o igual a la de enlace. En el caso de los electrones en los átomos, el término de corrección debido a la energía de enlace en comparación con las masas de electrones y núcleos es muy pequeño, por ejemplo para el átomo de hidrógeno, Uenlace = 13,6 eV, y comparando con la masa del protón, mp = 1,67262 × 10 ‒27 kg = 938,27 MeV/c2, resulta que: U enlace 13, 6 = 1, 45 ×10−8 = 2 938, 27 ×106 mpc Pero no ocurre lo mismo con los núcleos, ya que la energía de interacción entre los nucleones es mucho mayor, de forma que la masa del núcleo es perceptiblemente menor que la suma de las de los nucleones que lo componen. Así, la masa del núcleo de helio, mα, formado por dos protones y dos neutrones, es: mα = 3.727,4 MeV/c2
368
Fundamentos físicos de los procesos biológicos
mientras que la suma de los nucleones es: 2mp + 2 mn = 2 × 938,27 + 2 × 939,56 = 3.755,7 MeV/c2 donde mn es la masa del neutrón, mn = 1,67492 ×10 ‒27 kg = 939,56 MeV/c2. La energía de enlace será: 28,33MeV MeV U enlace = mα − ( 2m p + 2mn ) × c 2 = 3.755, 7 − 3.727, 4 = 28, que es una fracción ya importante de la masa del núcleo, del orden del 0,76 %. La energía de enlace por nucleón será, para este caso: ′n = U enlace / nucleo nucleón =
28,3 7,1Mev MeV 4
Este valor representa la energía que hay que gastar para extraer un nucleón del núcleo de helio. Las masas de los núcleos no son, por lo tanto, un múltiplo exacto de la masa del protón, debido, por una parte, a la pequeña diferencia de masa entre protón y neutrón y, por otra, a la energía de enlace. Para comparar las masas de los átomos entre sí, teniendo en cuenta estos efectos, se define la llamada unidad de masa atómica, u.m.a., como la doceava parte de la masa de un átomo de carbono 12. Es decir, por definición, este átomo tiene una masa igual a 12 u.m.a. A partir de la masa del átomo de carbono 12 se puede calcular la equivalencia de una u.m.a. en términos de otras unidades. Según el National Institute of Standards and Technology, esta equivalencia es: 1 u.m.a. = 1,66054 × 10–27 kg = 931,49 MeV/c2 de donde se sigue que un núcleo de helio 4 tiene una masa igual a 3.727, 4 = 4, 0015 u.m.a. u.m.a. La masa del átomo de helio, mHe, será igual a la 931, 49 suma de la masa del núcleo, mα, más la de los dos electrones que lo forman, menos la energía de enlace de éstos, que, como sabemos, es por completo despreciable frente a la masa del átomo. Por lo tanto:
369
Átomos, núcleos y radiactividad
23.2 El núcleo atómico 23.2.1 Componentes del núcleo Como ya sabemos, los núcleos atómicos están formados por dos clases de nucleones, protones y neutrones, ligados por la interacción nuclear fuerte. Ambas partículas son muy parecidas excepto en la carga eléctrica y en que el neutrón es ligeramente más pesado que el protón. El número de protones, Z, es igual a su carga positiva y, por lo tanto, igual al número de electrones en la corteza electrónica. Como las propiedades químicas dependen únicamente de dicha envoltura electrónica, el número Z, llamado número atómico, es el que las determina. Así, un átomo de oxígeno se comporta como tal si tiene 8 electrones, es decir, 8 protones en el núcleo (Z = 8), independientemente del número de neutrones. El número total de protones y neutrones, A, recibe el nombre de número másico y determina la masa del núcleo. El número de neutrones N está ligado a los números atómico y másico a través de la expresión: A= Z +N Un nucleido es una especie nuclear caracterizada por un par de números A y Z, mientras que llamamos isótopos a los átomos cuyo núcleo tiene el mismo número de protones (número atómico), lo que garantiza que sus propiedades químicas son idénticas, pero difieren en el número de neutrones (y, por lo tanto, en el número másico), que hace que su masa sea diferente. Los distintos átomos existentes se designan con un símbolo que indica su naturaleza química y un número que indica su número másico. Así, hay dos isótopos estables del carbono, ambos con 6 protones pero con 6 y 7 neutrones: C12 con una abundancia del 98,9 % C13 con una abundancia del 11,1 % El símbolo C, de carbono, indica que se trata de un núcleo con seis protones y su átomo asociado tiene seis electrones, mientras que el superíndice indica el número total de nucleones. Conviene advertir que, en la mayoría de los textos, el número másico es un superíndice que se coloca a la izquierda del símbolo del elemento y no a la derecha, como lo haremos en lo que sigue para que la lectura sea más fácil. El sodio, por su parte, tiene únicamente un isótopo estable, el Na23, con 11 protones y 12 neutrones, mientras que el hierro, con número atómico igual a 26, tiene cuatro isótopos estables:
370
Fundamentos físicos de los procesos biológicos
Fe54 con una abundancia del 5,8 % Fe56 con una abundancia del 91,7 % Fe57 con una abundancia del 12,2 % Fe58 con una abundancia del 10,3 % A veces, para facilitar toda la información sobre un nucleido, se especifica como subíndice el número atómico, aunque el símbolo químico lleve 56 , siendo equivalentes implícito este dato. Así, puede escribirse Fe56 o Fe26 ambas notaciones. En la tabla 23.2 se recogen las propiedades de algunos isótopos. Como ya hemos visto, la repulsión eléctrica entre protones debe estar compensada por una fuerza más intensa pero de muy corto alcance, la fuerza nuclear fuerte. En particular, para dos nucleones esta fuerza es atractiva para distancias comprendidas entre algo más de medio fermi (recuérdese que un fermi es igual a 10 ‒15 m) y algo más de un fermi, pero es prácticamente nula para distancias superiores. Es también muy parecida cualquiera que sea el par de nucleones considerado, pero es más intensa para el caso protón-neutrón. Por otra parte, a la interacción protón-protón hay que añadirle la repulsión eléctrica. El hecho de que en la interacción protón-neutrón sea la más intensa y no haya repulsión explica que los únicos isótopos estables del hidrógeno tengan un núcleo consistente en un solo protón, para la variedad más abundante, y en un protón y un neutrón para el llamado deuterio, que pesa el doble y existe en la naturaleza en una proporción del 0,015 %. Por esta razón, el agua cuyas moléculas tienen uno o dos átomos de deuterio se llama agua pesada y tiene un peso molecular de 19 y 20, respectivamente, frente a 18 de la variedad común. Al deuterio se le representa, por lo tanto, con el símbolo H 2, mientras que el hidrógeno ordinario es H 1. Para átomos ligeros, los núcleos estables tienen aproximadamente el mismo número de protones y de neutrones, de acuerdo con el hecho de que la interacción más intensa es la protón-neutrón. Pero cuando aumenta el número atómico, empieza a ser importante la repulsión entre protones y la estabilidad se consigue con un número superior de neutrones. Así, el O16 tiene 8 protones y 8 neutrones, pero el isótopo más abundante del plomo, el Pb208, tiene 82 protones y 126 neutrones.
371
Átomos, núcleos y radiactividad
Tabla 23.2 Características de algunos isótopos significativos Átomo o partícula n p H1 H2 H3 He3 He4 Li7 Be9 C12 C13 C14 N13 N14 O16 O17 O18 Si28 P31 S32 Cl35 K39 K40 Ca 40 Fe56 Co59 Co60 Sr88 Sr90 Sr95 Tc99,m Tc99 Xe139 Pb206 Pb207 Pb208 Pcn222 Th232 U235 U238 U239 Pu239
Z 0 1 1 1 1 2 2 3 4 6 6 6 7 7 8 8 8 14 15 16 17 19 19 20 26 27 27 38 38 38 43 43 54 82 82 82 86 90 92 92 92 94
N 1 0 0 1 2 1 2 4 5 6 7 8 6 7 8 9 10 14 16 16 18 20 21 20 30 32 33 50 52 57 56 56 85 124 125 126 136 142 143 146 147 145
Masa 1,00866 1,00728 1,00783 2,01410 3,01605 3,01603 4,00260 7,01600 9,01218 12,00000 13,00335 14,00324 13,00335 14,00307 15,99491 16,99913 17,99916 27,97693 30,97376 31,97207 34,96885 38,96371 39,96400 39,96259 55,93494 58,93320 59,93381 87,90561 89,90775 94,91936 98,90625 98,90625 138,91879 205,97445 206,97588 207,97664 222,01757 232,03805 235,04392 238,05078 239,05430 239,05216
Semivida Abundancia (%) 14,8 min E(*) E 99,988 E 0,012 12,3 años E 10 –4 E 100 E 92,4 E 100 E 98,9 E 1,1 5.730 años 10 min E 99,6 E 99,76 E 0,04 E 0,20 E 92,2 E 100 E 94,9 E 75,8 E 93,26 1,28 × 109 años 0,01 E 96,9 E 91,8 E 100 5,26 años E 82,6 28,1 años 23,9 s 6,0 horas 2,12 × 105 años 39,7 s E 24,1 E 22,1 E 52,4 3,8 días 1,4 × 1010 años 100 7,1 × 108 años 0,72 4,5 × 109 años 99,28 23,5 min 2,4 × 104 años -
Desintegración e–
e–
e– e+
e –, e+
e– e– e– γ e– e–
α α α α e– α
La masa se expresa en u.m.a. (*) E significa estable. Podría ocurrir que el protón no fuera estable, aunque, de no serlo, su semivida sería superior a 1033 años y, por lo tanto, puede considerarse estable a todos los efectos prácticos. Datos del National Institute of Standards and Technology.
372
Fundamentos físicos de los procesos biológicos
Para Z > 83 no hay nucleidos estables, ya que incluso los isótopos más estables de estos elementos pesados se desintegran emitiendo una partícula α, aunque algunos tienen una vida media muy larga y por eso existen en la naturaleza. Los núcleos inestables acaban por desintegrarse en otros distintos que pueden ser, a su vez, inestables, en cuyo caso continúa la cadena de desintegraciones hasta llegar a un conjunto de núcleos finales estables. A los isótopos inestables se les llama también radiactivos, y a los nucleidos inestables se les llama radionucleidos, porque, en su desintegración, emiten distintas clases de partículas o radiación electromagnética.
23.2.2 Fusión nuclear Extraer un nucleón requiere darle una energía igual o superior a su energía de enlace en dicho núcleo. Este parámetro, la energía de enlace media por nucleón (como la calculada más arriba para el caso del helio) es importante para saber si la ruptura de un núcleo desprende o absorbe energía. Recordemos que cuanto más grande es esta energía, más fuerte es la ligadura de los nucleones en el núcleo.
Fig.23.11. Energía de ligadura por nucleón en función del número másico.
Puede verse en la figura 23.11 que la energía de enlace aumenta con el número másico hasta que éste toma un valor del orden de 56, que es el del hierro, para el que alcanza el valor de 8,8 MeV por nucleón, para luego ir disminuyendo lentamente hasta tomar un valor del orden de 7,6 MeV por nucleón para el uranio. Ahora bien, la masa de un núcleo es igual a la suma de las masas de los nucleones que lo componen menos la energía de enlace total,
Átomos, núcleos y radiactividad
373
que es igual a la energía de enlace por nucleón multiplicada por el número de nucleones. Esto quiere decir que si unimos dos núcleos ligeros para formar uno más pesado, pero siempre por debajo del hierro, el nuevo núcleo tendrá una masa inferior a la suma de las masas de partida, y el exceso se desprenderá en forma de energía. Este proceso, conocido como fusión nuclear, genera energía siempre que nos mantengamos en números másicos por debajo del máximo de energía de enlace por nucleón y es el responsable de la generación de energía en las estrellas y de las bombas termonucleares. Y es el tipo de generación de energía que se pretende dominar para usos pacíficos en la Tierra, a partir de los átomos de hidrógeno y deuterio presentes en el agua, mediante un complejo y costoso programa de investigación que tiene ya cerca de medio siglo de vida y uno de cuyos pasos previstos en la época en que se escribió este libro es la construcción y puesta en marcha del ITER (International Thermonuclear Experimental Reactor). Este procedimiento de obtener energía tiene enormes dificultades debido a que es preciso acercar los núcleos hasta que prácticamente se toquen para que empiece a actuar la interacción nuclear fuerte, que es la que mantiene ligados a los nucleones en el núcleo. Pero los núcleos se resisten a acercarse entre sí porque están cargados positivamente y se repelen. Una de las formas de vencer la repulsión electrostática es acelerándolos para que adquieran una energía cinética lo suficientemente grande como para vencer la barrera culombiana, por ejemplo calentándolos a enormes temperaturas. Cuanto menor es la carga de los núcleos, menor es la repulsión y menos difícil será conseguir la fusión. Así, normalmente se parte de gas hidrógeno o deuterio y se calienta. A partir de unos pocos miles de grados, las colisiones entre los átomos son tan violentas que éstos se rompen, dando lugar a un medio formado por núcleos y electrones llamado plasma. Tenemos que calentar todavía más, hasta llegar a las decenas de millones de grados para conseguir que los choques entre núcleos consigan aproximarlos tanto como para activar la interacción nuclear fuerte y se queden pegados formando un núcleo más pesado. Se comprende, de lo dicho, la dificultad para generar, contener y controlar un plasma de estas características. Pero lo que resulta complicado en un laboratorio terrestre es factible en el corazón de una estrella. En efecto, las estrellas son enormes aglomeraciones de gas que se comprime por su propia gravedad. En las estrellas de primera generación (formadas únicamente a partir de la materia primordial del Universo) el gas es una mezcla de aproximadamente un 75 % de hidrógeno y un 25 % de helio, que son los elementos que se formaron en los primeros
374
Fundamentos físicos de los procesos biológicos
minutos tras el big bang. La compresión gravitatoria calienta el gas hasta que en su centro se llega a temperaturas superiores a los diez millones de grados y empiezan a producirse reacciones de fusión nuclear que generan energía radiante. La radiación emitida desde el centro de la estrella, convertida en un enorme reactor de fusión, tiende a expandir las capas externas, llegándose al equilibrio cuando esta presión de la radiación hacia fuera compensa exactamente la tendencia a seguir comprimiéndose por gravedad. En ese estado está nuestro Sol desde hace unos 4.500 a millones de años y se mantendrá en él durante otros 5.000 millones de años, por lo menos. La reacción de fusión básica en el Sol, y en la mayoría de las estrellas, es la conversión de hidrógeno en helio a través de una serie de pasos intermedios. El resultado final es la transformación: 4 × H1 → He4 + Energía
(23.11)
En realidad, cuatro núcleos de hidrógeno (cuatro protones) se convierten en un núcleo de helio más dos positrones (antipartículas de los electrones, con su misma masa y con carga positiva) y dos neutrinos: 4 p → Núcleo de Helio + 2e+ + 2ve Los dos positrones interaccionan con dos electrones aniquilándose y convirtiendo la masa de estas cuatro partículas en energía radiante, y los neutrinos, que tienen una masa inapreciable, escapan llevándose, en forma de energía cinética, una parte de la energía generada. En total es como si cuatro átomos de hidrógeno, contando sus electrones, se hubieran transformado en un átomo de helio, que tiene sólo dos electrones, debiéndose toda la energía producida (radiación y neutrinos) a la diferencia de masa entre el átomo final y los átomos inciales: ∆m = 4m
H1
−m
He4
= 4 ×1, 00783 − 4, 00260 = 0, 02872uu.m.a.= .m.a. = 26, 26,7 7 MeV MeV/c / c2 2
La energía desprendida será, por tanto: ΔE = 26,7 MeV
(23.12)
que es aproximadamente un 0,7 % de la masa del átomo de helio. Así, en la fusión de un gramo de hidrógeno en helio, la energía desprendida será: kWh
Átomos, núcleos y radiactividad
375
Si consideramos un gasto promedio por hogar de unos 500 kWh por mes, la energía generada en la fusión de un gramo de hidrógeno serviría para satisfacer las necesidades energéticas de un hogar medio durante cerca de 30 años. La fusión nuclear desprende energía cuando se funden núcleos ligeros para dar lugar a núcleos más pesados, siempre que nos encontremos a la izquierda del máximo de la figura 23.11. Por el contrario, cuando se trata de sintetizar núcleos más pesados que el hierro, es preciso aportar energía porque la masa del núcleo final es superior a la suma de las masas de los núcleos iniciales. Por esta razón, incluso en las estrellas más masivas, los procesos de fusión que generan energía y las mantienen como astros radiantes llegan sólo hasta la síntesis del hierro. Así, cuando una de estas estrellas llega al final de su vida contiene únicamente hierro y elementos más ligeros. Pero en el momento de su explosión como supernova, cuando se ponen en juego energías gigantescas, se producen algunas reacciones de fusión entre núcleos pesados, que consumen energía en lugar de liberarla, y pueden sintetizar el resto de los elementos de la tabla periódica. Todo el plomo, la plata, el cobre o el uranio existentes se han sintetizado en esos momentos catastróficos del final de estrellas mucho más masivas que el Sol. Por su parte, las estrellas de masa comparable a la del Sol sólo fabrican helio a partir del hidrógeno y no explosionan en forma de supernovas, por lo que no contribuyen a “enriquecer” la composición química del Universo.
23.2.3 Fisión nuclear Si se rompe un núcleo pesado en dos o más fragmentos, como la energía de enlace por nucleón de estos últimos es mayor, resulta que la masa del núcleo inicial es superior a la de los fragmentos en los que se rompe y la diferencia de masa se transforma en energía. Este es el principio de la fisión nuclear, en el que se basan todas las centrales nucleares. No obstante, como veremos, el balance energético de la fisión es menos eficiente que en el caso de la fusión debido a que la curva de energías de enlace por nucleón de la figura 23.11, aunque descendente a partir del hierro, tiene una pendiente muy pequeña, lo que se traduce en que las diferencias de masas iniciales y finales son también muy pequeñas. Conseguir que un núcleo pesado se rompa (fisione) no es fácil. Hay, primero, que desestabilizarlo mediante la absorción de otro núcleo o partícula para que, después, se rompa y desprenda energía en forma de radiación o de energía cinética de los fragmentos. Lo más fácil es bombardear un núcleo fisionable con un neutrón, que no tiene carga y no es repelido.
376
Fundamentos físicos de los procesos biológicos
En la naturaleza sólo existen con cierta abundancia dos elementos inestables, que son el uranio y el torio. El primero tiene un número atómico 92 y su isótopo más abundante, el U238, tiene una vida media del orden de la vida de la Tierra, unos 4.500 millones de años, mientras que el segundo, con un número atómico 90, está presente con un único isótopo, el Th232, que tiene una vida media del orden de la vida del Universo, unos 14.000 millones de años. Debido a sus largas vidas medias, sigue habiendo átomos de uranio y de torio sin desintegrarse todavía, procedentes de la nube de gas y polvo que dio lugar al Sistema Solar. Hay, además, muchos otros núcleos radiactivos que proceden de las desintegraciones de estos dos, pero son poco abundantes y tienen una vida media más corta, por lo que acaban transformándose en núcleos estables al cabo de cierto tiempo. A éstos hay que añadir algunos isótopos inestables de elementos menos pesados, con una vida media también muy grande, de forma que todavía están presentes en los minerales terrestres, como, por ejemplo, el potasio 40 (K40), con una vida media de 1.300 millones de años, o el rubidio 87 (Rb87), con una vida media de 47.000 millones de años, ambos muy utilizados en dataciones geológicas. Los dos nucleidos U238 y Th232, así como otros isótopos del uranio y de otros elementos pesados inestables creados artificialmente a partir de ellos, como el plutonio o el protactinio, son fisionables haciendo incidir sobre ellos neutrones rápidos, pero hay un sólo isótopo presente en la naturaleza que es fisionable con neutrones llamados térmicos, es decir, neutrones que poseen la energía cinética media asociada a la temperatura ambiente. Este isótopo es el U235, que supone tan sólo un 0,72 % del uranio natural. Por esta razón, es el elemento básico en cualquier reactor nuclear y el uranio natural debe ser enriquecido (aumentada su proporción en U235 hasta aproximadamente un 4 % mediante la separación de ambos isótopos) previamente a su uso como combustible nuclear. El uranio sobrante de los procesos de enriquecimiento tiene una proporción menor de U235 y por eso se dice que está empobrecido. Cuando un núcleo fisionable absorbe un neutrón, puede fragmentarse de muchas formas. Normalmente se rompe en dos núcleos cuyos números másicos son del orden de 90 y 140 y algunos neutrones. Los núcleos “hijos” tienen un exceso de neutrones respecto de los que son estables en esa zona de números másicos, por lo que se desintegran en pasos sucesivos hasta dar lugar a núcleos estables. Justamente algunos de estos fragmentos de fisión intermedios son muy radiactivos y, por lo tanto, peligrosos desde el punto de vista sanitario y medioambiental, y pueden llegar a tener una vida media desde horas a centenares de miles de años.
377
Átomos, núcleos y radiactividad
Los neutrones producidos en las fisiones pueden perderse o pueden colisionar con otros núcleos fisionables generando nuevas fisiones. Cuando la abundancia relativa de núcleos fisionables y la producción de neutrones por reacción es suficientemente grande, se produce una secuencia de fisiones automantenidas, lo que se llama una reacción en cadena.
Fig. 23.12. Reacción de fisión en la que un neutrón induce la ruptura de un núcleo pesado en dos fragmentos de tamaño intermedio y algunos neutrones.
Teniendo en cuenta que los núcleos de U235 pueden romperse de muchas formas distintas, y la variedad de nucleidos producidos en las distintas cadenas de desintegración de los fragmentos radiactivos, pueden encontrarse del orden de 200 nucleidos diferentes en la fisión del uranio, casi todos radiactivos, y, entre ellos, algunos elementos no existentes en la naturaleza, como ocurre con el tecnecio (Z = 43), que no tiene ningún isótopo estable. Desde el punto de vista de su composición atómica, el objeto más complejo que existe sobre la Tierra es, probablemente, una barra de combustible nuclear usado. Una reacción típica de fisión es la siguiente: 139 + 2n U 92235 + n → Sr3895 + Xe54
Los fragmentos de fisión son el estroncio 95 (número atómico igual a 38) y el xenón 139 (número atómico 54), ambos radiactivos. Puede verificarse que se conserva la carga eléctrica, 92 = 38 + 54, y el número de nucleones, 235 + 1 = 95 + 139 + 2. La energía que se desprende en una reacción de este tipo se puede calcular fácilmente a partir de los valores de las masas en la tabla 23.2: ∆m = m
U 235
+ mn − m
Sr 95
−m
Xe139
− 2mn
∆m = 235, 04392 + 1, 00866 − 94,91936 − 138,91879 − 2 ×1, 00866 = 0,197uu.m.a. .m.a.
E = ∆m × c 2 = 184 MeV MeV Puede estimarse, de forma general, que las reacciones de fisión liberan siempre unos 200 MeV por núcleo fragmentado. En efecto, la energía de
378
Fundamentos físicos de los procesos biológicos
enlace por nucleón en el uranio es del orden de 7,6 MeV, mientras que en los núcleos cuyo número másico se sitúa alrededor de 100 es del orden de 8,5 MeV, así que cuando un nucleón pasa de estar ligado en un núcleo 8,4 0,8 0,9 0,9 MeV. Como de uranio a estarlo en uno de masa intermedia libera 0,8 0,8 0,9 esto ocurre para 235 nucleones o cifra similar, la energía total generada es 211 MeV. (0,8 ‒ 0,9) × 235 = 188 0,8 0,9 200 ×100 ) de la 219.000 masa del núcleo inicial de U235. Es, por lo tanto, una forma menos eficiente de obtener energía que la fusión nuclear, cuyo rendimiento era de un 0,7 % en masa. La fisión de un gramo de U235 produce así la octava parte de la energía generada en la fusión de un gramo de helio, es decir, unos 22.000 kWh. Como el U235 representa únicamente un 0,7 % del uranio natural, un gramo de este metal generaría por fisión alrededor de 155 kWh si todo su contenido en U235 hubiera fisionado. Normalmente queda en el combustible usado una cuarta parte, aproximadamente, de este isótopo sin fisionar, por lo que la energía efectiva es del orden de 120 kWh por gramo de uranio natural. Esta energía supone aproximadamente un 0,09 % (
Observación. Puede compararse esta cifra de 120 kWh por gramo de uranio natural con la equivalente para los combustibles convencionales: 0,013 kWh por gramo de petróleo, 0,011 kWh por gramo de gas natural y entre 0,004 kWh y 0,008 kWh por gramo de carbón. Nótese que cuando un núcleo de U235 se rompe, la energía que libera es la que se acumuló en el momento de su formación como consecuencia de la explosión de una estrella muy masiva al final de su vida como astro radiante. En la mayoría de los reactores nucleares, el material moderador, que absorbe la energía de los neutrones rápidos emitidos en las fisiones, es agua. También el refrigerante es agua. La energía cinética de los fragmentos de fisión se transforma en calor en el combustible y en el agua. Este calor puede ser extraído del reactor y convertido en otras formas de energía, en particular en electricidad, mediante intercambiadores, turbinas y demás dispositivos similares a los que existen en una central térmica ordinaria. A partir de la conversión de la energía cinética de neutrones y fragmentos de fisión en calor, un reactor nuclear se comporta como una máquina térmica de las estudiadas en el capítulo 10.
Átomos, núcleos y radiactividad
379
23.3 Radiactividad Se conocen miles de nucleidos, en su gran mayoría inestables, con vidas medias que oscilan entre minúsculas fracciones de segundo hasta miles de millones de años. Sólo existen de forma permanente en la naturaleza unos pocos centenares que son estables, más dos isótopos del uranio, uno del torio y algunos otros de elementos menos pesados, que tienen vidas medias de magnitud astronómica. En las cadenas de desintegración natural de los nucleidos inestables y en los procesos de fisión inducida aparecen isótopos de vida corta que se van desintegrando hasta llegar a nucleidos estables. La acción de los rayos cósmicos sobre la superficie terrestre crea también algunos nucleidos inestables. Todos ellos emiten partículas o energía, siendo la radiactividad el resultado de estas emisiones. Atendiendo a su naturaleza, la radiactividad puede clasificarse en tres grandes grupos que reciben el nombre de alfa, beta y gamma.
23.3.1 Radiactividad alfa En los núcleos muy pesados se forman agrupaciones de nucleones que poseen una gran estabilidad, especialmente en forma de núcleos de helio 4 o partículas alfa, formadas por dos protones y dos neutrones. Una partícula alfa puede considerarse cono un sistema estable que interacciona con el resto del núcleo, teniendo la energía potencial de interacción la forma de la figura 23.9. A distancias menores o del orden del tamaño del núcleo, la interacción predominante es la nuclear fuerte, por lo tanto, atractiva, pero a distancias mayores lo que experimenta la partícula alfa es la repulsión electrostática del resto del núcleo. Ahora bien, según hemos visto en la primera parte de este capítulo, los efectos cuánticos permiten que las partículas subatómicas atraviesen barreras de potencial superiores a su propia energía, siendo la probabilidad de que lo hagan función de la anchura y la altura de la barrera. Como puede verse en la figura 23.9, una partícula alfa con una energía positiva pero inferior a la altura de la barrera permanecería clásicamente en el interior del núcleo de forma indefinida, pero el hecho de que su dinámica esté determinada por las leyes de la Física Cuántica implica que existe una probabilidad distinta de cero de que atraviese la barrera y sea repelida por el resto del núcleo. Esto es lo que ocurre con los núcleos que tienen un número atómico superior o igual a 84. Muchos de ellos serían estables de no ser porque de vez en cuando una partícula alfa escapa del núcleo. Justamente, la radiactividad alfa está asociada a la desintegración de ciertos núcleos pesados que emiten una partícula de este tipo. En el caso, por ejemplo, del uranio y del torio la
380
Fundamentos físicos de los procesos biológicos
probabilidad de que emitan una partícula alfa es tan pequeña que sus vidas medias son de miles de millones de años. En el caso del isótopo más estable del uranio, su desintegración es: U 92238 → Th90234 + α Como se ve, la diferencia entre el núcleo padre y el hijo debe ser de 4 unidades en el número másico y de 2 unidades en la carga. La diferencia de masas entre el núcleo inicial y los productos de su desintegración se convierte esencialmente en energía cinética de la partícula alfa emitida.
23.3.2 Radiactividad beta Los nucleidos con un exceso de neutrones tienden a convertirse en núcleos más estables aumentando el número de protones y disminuyendo el de neutrones. Este proceso se conoce como desintegración beta y tiene la forma general: Z A → ( Z + 1) A + e − +ν
(23.13)
Es decir, un núcleo con Z protones y A ‒ Z neutrones se convierte en otro con Z + 1 protones y A ‒ Z ‒ 1 neutrones emitiendo un electrón y un neutrino (en realidad un antineutrino, pero a los efectos que estamos aquí considerando su naturaleza es indiferente). Un ejemplo es: C14 → N 14 + e − +ν El carbono 14 es un isótopo inestable con 6 protones (por eso es carbono) y 8 neutrones, importante para la datación de restos arqueológicos. Este radionucleido, con un exceso de neutrones respecto de los que debería tener para ser estable, se desintegra en el isótopo más abundante del nitrógeno, con 7 protones y 7 neutrones, junto con un electrón y un antineutrino. La diferencia de masas entre el núcleo inicial y las partículas finales se convierte en energía cinética que se reparten el antineutrino y el electrón. A los electrones se les llamó radiación beta cuando fueron descubiertos y de ahí que a este tipo de radiactividad se la conozca con ese nombre. Nótese que en este tipo de desintegración el número de nucleones de los nucleidos “padre” e “hijo” permanece constante, pero la carga de este último aumenta en una unidad para compensar la carga negativa del elec trón emitido. En realidad, todo este tipo de desintegraciones puede considerarse como el resultado de la desintegración de uno de los neutrones del núcleo que corresponde al proceso general (23.13), con Z = 0 y A = 1:
381
Átomos, núcleos y radiactividad
n → p + e− +ν De manera análoga, cuando el nucleido inicial tiene un defecto de neutrones respecto de la zona de estabilidad, puede transformar un protón en un neutrón, en lo que se conoce como desintegración beta inversa, mediante la emisión de un positrón o antielectrón: Z A → ( Z − 1) + e + +ν A
que es lo que ocurre en la desintegración del nitrógeno 13: N 13 → C13 + e + +ν
23.3.3 Radiactividad gamma A veces, los núcleos “hijos”, creados en procesos de fusión o de fisión, tienen la distribución de protones y neutrones de un nucleido estable, por ejemplo en la fusión del carbono y el helio para dar oxígeno, pero se encuentran en un estado excitado. El exceso de energía se libera, entonces, mediante la emisión de un fotón que posee una energía igual a la diferencia entre el nivel excitado y el estable, que, como sabemos, es del orden de varios MeV para el núcleo atómico. Los fotones así emitidos son muy energéticos y reciben el nombre de rayos gamma. Este es el origen de este tipo de radiactividad.
23.3.4 Semiperiodo A partir de las leyes de la Física Cuántica es imposible predecir cuándo un núcleo radiactivo va a desintegrarse. Lo único que puede saberse es la probabilidad de que lo haga, lo que se traduce, para un conjunto de muchos núcleos, en que una cierta fracción de ellos se habrá desintegrado en un cierto periodo de tiempo. Esta fracción es constante, independiente del número de núcleos que se han desintegrado anteriormente, de forma que si llamamos N (t) al número de núcleos de una cierta especie radiactiva en el instante t, su variación dN será proporcional a la probabilidad, λ, de que uno de ellos se desintegre en la unidad de tiempo, al número de núcleos de partida y al intervalo de tiempo transcurrido: dN = −λ N (t )dt
382
Fundamentos físicos de los procesos biológicos
donde el signo menos indica que el número de núcleos disminuye al desintegrarse algunos de ellos, por lo que dN es una cantidad negativa. La solución de la ecuación anterior es inmediata: N ( t ) = N 0 e − λt
(23.14)
siendo N0 el número de núcleos en el tiempo. El número de núcleos radiactivos disminuye, por tanto, exponencialmente, dependiendo la rapidez de esa disminución del parámetro λ presente en el exponente de (23.14). Llamamos semiperiodo, semivida o vida media de un nucleido al tiempo que debe transcurrir para que se haya desintegrado la mitad de los núcleos de una muestra. Es decir, llamando τ a dicho parámetro, tendremos: N0 = N 0 e − λτ 2 de donde:
λ=
ln 2 0, 693 τ τ
N ( t ) = N0e
t −0,693 τ
t
1 τ = N0 2
Ejemplo. El tritio (H3) tiene una semivida de 12,3 años. En los ensayos de explosiones nucleares en la atmósfera se liberó una cierta cantidad de este isótopo. Si el último de estos ensayos tuvo lugar en 1969, podemos calcular la fracción de tritio que aún quedará de la última explosión 40 años después, es decir, en 2009: 40
−0,693 N 1 12,3 =e = N0 2
3,25
= 0,105
383
Átomos, núcleos y radiactividad
Fig. 23.13. Curva de desintegración de un conjunto de núcleos radiactivos con semiperiodo τ. Nótese que a partir de cualquier instante la relación entre el número de núcleos supervivientes y el de núcleos iniciales se ajusta a la misma ecuación.
Se llama actividad de una muestra radiactiva al número de desinte graciones por unidad de tiempo: A=−
dN dt
(23.15)
y a partir de la expresión (23.14): t t −0,693 −0,693 dN 0, 693 0, 693 τ τ A=− = λN = N= N0e = A0 e dt τ τ
(23.16)
donde: A0 =
0, 693 N0 τ
(23.17)
es la actividad inicial en el tiempo t = 0. La actividad de una muestra radiactiva decrece exponencialmente debido a que disminuye el número de núcleos presentes. La unidad de actividad es el becquerelio (Bq), siendo un becquerelio igual a una desintegración por segundo. Otra forma de comparar la actividad de materiales radiactivos distintos es a través de la unidad llamada curio (Ci), que es la masa de material radiactivo que tiene una actividad igual a la de un , puro: 3,7 × 1010 Bq, es decir, 3,7 × 1010 desintegraciones gramo de radio, por segundo. Así, cuanto más grande es la semivida de un isótopo, menor será su actividad, según muestra la ecuación (23.17), y más grande tendrá que ser
384
Fundamentos físicos de los procesos biológicos
la masa de dicho isótopo para llegar a un curio. En 238 gramos de U238, que es un mol de esta sustancia, hay un número de átomos igual al número de Avogadro. Por lo tanto, un gramo de U238, cuya semivida es de 4.500 millones de años, tiene una actividad: 0, 693 6, 02 × 1023 A= = 1, 24 × 104 Bq 9 4,5 × 10 × 365 × 24 × 3.600 238 que equivalen a 1,24 × 104 / 3,7 × 106 = 0,33 × 10 ‒6 curios, por lo tanto, son necesarias tres toneladas de uranio 238 para tener la misma actividad que un gramo de radio. Datación por medio de isótopos radiactivos Hay isótopos radiactivos de vida corta y media que se están produciendo continuamente por efecto de los rayos cósmicos. El ejemplo más sobresaliente es el carbono 14, producto de la interacción de un neutrón con un núcleo de nitrógeno de la atmósfera: N 14 + n → C14 + p El carbono 14 se combina rápidamente con el oxígeno para dar dióxido de carbono, que permanece en la atmósfera y entra en la cadena biológica a través de la fotosíntesis. Su vida media es de 5.730 años y se va desintegrando al tiempo que se regenera por la acción del flujo constante de rayos cósmicos sobre la Tierra. El equilibrio se alcanza cuando se desintegran en un segundo la misma cantidad de núcleos que se generan, lo que ocurre con una proporción de C14 sobre C12 igual a 1,3 × 10 ‒12, que es la que se observa en el carbono atmosférico. Ahora bien, las plantas incorporan el dióxido de carbono y lo utilizan en la síntesis de las moléculas orgánicas que luego entran en toda la cadena trófica, por lo que el isótopo de carbono así creado se difunde con gran rapidez por toda la biosfera. La actividad metabólica procesa y degrada la materia orgánica, de forma que el carbono que contiene vuelve a la atmósfera y se recicla continuamente. Como todos estos intercambios ocurren en periodos de tiempo mucho menores que la semivida del C14, resulta que la proporción de este isótopo en los seres vivos es aproximadamente la misma que en la atmósfera. Pero cuando un organismo muere deja de renovar el carbono de sus moléculas y la cantidad de carbono 14 que contiene empieza a disminuir a medida que pasa el tiempo y se desintegra.
385
Átomos, núcleos y radiactividad
Si ahora analizamos una muestra orgánica, por ejemplo un caparazón, un hueso o un trozo de madera o de tejido, podemos medir la proporción de este isótopo a través de su actividad radiactiva. Un núcleo de C14 es radiactivo beta y se desintegra de la siguiente forma: C614 → N 714 + e − +ν El electrón posee, por término medio, una energía cinética de 160 keV y es la detección de estos electrones de alta energía, característicos de la desintegración del C14, la que sirve para estimar la actividad y, de ahí, el número de núcleos de este isótopo presentes en la muestra. Comparando ahora la proporción de C14 medida con la de equilibrio en la atmósfera se puede calcular el tiempo que ha pasado desde que ese material estaba en un ser vivo hasta ahora. De la expresión (23.16) podemos despejar el tiempo transcurrido para que una muestra que contenía N0 átomos radiactivos tenga una actividad A: t=
0, 693 × N 0 τ ln 0, 693 A ×τ
Si referimos la actividad A a un mol del elemento que estemos considerando y f es la proporción de isótopo radiactivo de ese elemento en la atmósfera, entonces, N0 = NA × f, donde NA es el número de Avogadro. Así:
t=
0, 693 × N A × f τ ln 0, 693 A ×τ
(23.18)
Ahora bien, el semiperiodo del C14 es, expresado en segundos:
τ = 5.730 × 365 × 24 × 3.600 1,81×1011 s y f = 1,3 × 10 ‒12, por lo que: t=
τ τ 0, 693 × 6, 02 ×1023 ×1,3 ×10−12 3 3 (23.19) ln = ln 8.270 × ln anos 11 A ×1,81×10 0, 693 0, 693 A A
Ejemplo. Si un fragmento de madera de un sarcófago egipcio presenta una actividad de 9 desintegraciones por minuto y por gramo de carbono, norma lizando a un mol y a desintegraciones por segundo, tendremos: A=
9 desintegraciones por segundo y por mol ×12 = 1,8desintegracionesporsegundoypormol 60
386
Fundamentos físicos de los procesos biológicos
y el tiempo transcurrido desde que se cortó el árbol del que se extrajo la madera es, de acuerdo con la expresión (23.19): t = 8.270 × ln
3 3 = 8.270 × ln 4.200 anos A 1,8
Este procedimiento de datación sólo es aplicable en la práctica para periodos de tiempo que no sean superiores a diez veces la semivida del C14, es decir, hasta unos 50.000 años, ya que al cabo de ese lapso de tiempo, la actividad ha disminuido en un factor 210 = 1.024 y es prácticamente imperceptible.
Fig. 23.14. Diagrama en el que se representa la actividad específica del carbono 14 de una muestra en función del tiempo transcurrido desde que la muestra pertenecía a un ser vivo. Las muestras de la figura provienen de restos arqueológicos del antiguo Egipto cuya edad se conoce por otros métodos. La curva es la predicción calculada a partir de la actividad del carbono 14 de una muestra orgánica actual (t = 0) y una semivida del carbono 14 de 5.720 años. Arnold y Libby (1949).
Para periodos de tiempo más largos pueden usarse otros isótopos radiactivos de vida media más larga. Lo que se mide normalmente, en este caso, es la concentración de algunos de los núcleos “hijo” procedentes de la cadena de desintregraciones de los nucleidos iniciales y poco frecuentes de forma natural. Así, el producto final de la desintegración del U238 es el Pb206, y el del
Átomos, núcleos y radiactividad
387
U235 es el Pb207. Estos isótopos generados en la desintegración se acumulan a medida que el tiempo pasa y su medida en relación con la concentración de los nucleidos “padre” es una medida del tiempo transcurrido desde que se formó la roca en la que se encuentran. En el caso del potasio 40, el elemento final es el isótopo común del argón, extremadamente raro en el interior de algunas rocas que, sin embargo, presentan intrusiones de este gas inerte debidas a su aparición como subproductos de la desintegración del potasio 40. En todos los casos, el análisis se complica porque hay que tener en cuenta las pérdidas o los aportes que se hayan podido producir de forma natural y que suponen una corrección a los tiempos estimados directamente.
23.4 Efectos biológicos de la radiación ionizante 23.4.1 Propiedades generales Alcance Las radiaciones α, β y γ procedentes de desintegraciones nucleares, más los rayos X y los protones y los neutrones emitidos como productos secundarios de su interacción con la materia tienen energía suficiente como para arrancar electrones de los átomos con los que colisionan, desplazar núcleos y romper enlaces químicos. De ahí que reciban el nombre genérico de radia ciones ionizantes, por contraposición con la radiación electromagnética de frecuencia inferior o igual al ultravioleta, que no tiene esa capacidad ionizadora. Este tipo de radiación puede dañar gravemente a las células, tanto germinales como somáticas, por lo que representan un peligro para la salud pero también una posibilidad de destruir tumores. Las partículas alfa tienen una masa enorme, del orden de 7.000 veces la masa del electrón, de forma que pueden desplazar electrones de la corteza de los átomos con suma facilidad, perdiendo muy poca energía en cada colisión. Así, una sola partícula alfa es capaz de ionizar decenas de miles de átomos a lo largo de su trayectoria en un material antes de detenerse. Debido a su masa y a su carga, tienen una probabilidad muy grande de interaccionar con todos los átomos que encuentran a su paso, por lo que la cantidad de energía que depositan por unidad de longitud recorrida es muy grande (lo que se llama transferencia lineal de energía o LET), y su alcance muy pequeño. En la tabla 23.3 se da el alcance, definido como la distancia recorrida antes de detenerse, para distintas radiaciones y energías, y se ve que las partículas alfa apenas pueden penetrar una o dos décimas de milímetro en el tejido corporal. Incluso en el aire, el alcance de una partícula α es de tan sólo unos pocos centímetros.
388
Fundamentos físicos de los procesos biológicos
Tabla 23.3. Alcance de la radiación (en cm) Tipo de partícula y energía
Aire
Tejido corporal
E = 1, 0 MeV
0,55
0,0033
E = 2, 0 MeV
1,04
0,0063
E = 3, 0 MeV
1,67
0,0100
E = 4, 0 MeV
2,58
0, 0155
E = 5, 0 MeV
3,50
0, 0210
E = 0, 01 MeV
0, 23
0, 00027
E = 0,10 MeV
12, 0
0, 0151
E = 0,50 MeV
150
0,18
E = 1, 0 MeV
420
0,50
E = 2, 0 MeV
840
1, 00
E = 3, 0 MeV
1.260
1,50
Partículas alfa
Partículas beta
Si la irradiación proviene del exterior, el daño que puede producir la radiación alfa se concentra en la piel, pero es fácilmente evitable con una lámina delgada, la ropa o unos guantes. Por el contrario, si se ingiere material radiactivo alfa, por ejemplo uranio o plutonio, el efecto puede ser muy dañino porque afectará a los tejidos con los que esté en contacto, y si se acumula en algún órgano, el efecto será duradero. La radiación beta también ioniza directamente al estar formada por electrones. La probabilidad de que éstos interaccionen con los electrones de las cortezas atómicas es menor que en el caso de las partículas alfa, por lo que su transferencia lineal de energía es pequeña. Por esta misma razón su alcance es mucho mayor, llegando a ser del orden de centímetros en el tejido corporal. La protección tiene, por lo tanto, que ser más gruesa, pero los daños causados a lo largo del recorrido son menores que los de la radiación alfa.
389
Átomos, núcleos y radiactividad
Un fotón de alta energía (perteneciente a un haz de rayos gamma o de rayos X) puede perder completamente su energía al ser absorbido por un solo electrón, puede perderla parcialmente en un choque elástico con un electrón o, si tiene suficiente energía, puede convertirse en un par electrónantielectrón. Los electrones activados por estos fotones pueden ionizar, a su vez, los átomos con los que interaccionan. En todo caso, la radiación gamma no se detiene como en los casos anteriores y no puede definirse el alcance de la misma forma. No obstante, se define la longitud de semiatenuación como la distancia que recorre un haz de fotones en un medio para que su intensidad se reduzca a la mitad. Es decir, a lo largo de la longitud de semiatenuación, la mitad de los fotones es absorbida por el medio y la otra mitad lo atraviesa. Si I0 es la intensidad inicial, la intensidad I tras haber atravesado un espesor de material será:
donde λ1/2 es la longitud de semiatenuación. Al cabo de diez longitudes de semiatenuación, por ejemplo, la intensidad del haz incidente se ha reducido en un factor (1/2)10 = 1/1024. Tabla 23.4. Longitud de semiatenuación λ1/2 de los rayos X y gamma Energía (MeV)
Tejido corporal
Plomo
0,01
0,13 cm
0,00076 cm
0,05
3,1 cm
0,0072 cm
0,10
4,1 cm
0,012 cm
0,50
7,2 cm
0,42 cm
1,0
9,8 cm
0,85 cm
5,0
23 cm
1,3 cm
Como se ve en la figura 23.15, los rayos gamma de alta energía son muy penetrantes en el tejido corporal, mientras que el plomo es un material protector eficaz. Este hecho no es una sorpresa, ya que sabemos que los rayos X, de menor energía, tienen poder de penetración suficiente como para atravesar los tejidos y los órganos con una atenuación que depende de su densidad; de ahí que sirvan para conocer la estructura interna del cuerpo. Los efectos de la radiación gamma son similares a los de la radiación beta, puesto que su capacidad ionizadora se produce a través de los electrones a los que transfiere energía.
390
Fundamentos físicos de los procesos biológicos
Fig. 23.15. Poder de penetración de los diferentes tipos de radiación.
Los neutrones, por su parte, van perdiendo energía al cederla a los núcleos con los que se encuentran. Si estos núcleos son ligeros, por ejemplo los protones del hidrógeno del agua o de la materia orgánica, se produce una transferencia casi total de energía, siendo altamente ionizantes los núcleos ligeros así acelerados. Por esta razón, los neutrones tienen efectos similares a los protones, o superiores cuando tienen una energía capaz de activar a varios protones. Por otra parte, como los neutrones no tienen carga eléctrica, son muy penetrantes, incluso en plomo, por lo que hay que interceptarlos con blindajes de hormigón, ricos en núcleos ligeros que, al interaccionar con los neutrones, hacen que éstos pierdan energía eficazmente. Los neutrones pueden también activar los materiales en los que penetran, induciendo la formación de núcleos radiactivos que recuperan la estabilidad emitiendo fotones de alta energía. Las sustancias radiactivas pueden entrar en la biosfera de forma aislada o formando compuestos con otras sustancias. Pueden afectar a los organismos desde fuera, a través de la radiación ionizante que emiten, o bien desde dentro, una vez incorporados al cuerpo a través de la respiración, la ingesta, el agua, etc. Este último caso es el más peligroso debido a la cercanía a los tejidos sensibles y la duración de su permanencia en el organismo, que puede ser de horas, días o toda la vida si se fijan en los huesos o en tejidos con escaso o nulo ritmo de reemplazamiento. Por esta razón, en medicina y biología, los elementos que sirven como trazadores se eligen entre aquellos que son expulsados del cuerpo rápidamente.
391
Átomos, núcleos y radiactividad
Energía depositada La actividad de un material radiactivo, tal y como la definimos en la sección 3.4 de este capítulo, es una característica intrínseca, independiente de sus efectos sobre el cuerpo irradiado. Estos efectos, por su parte, dependen de la energía depositada por la radiación durante su permanencia en el organismo. La unidad de medida de energía depositada por la radiación ionizante en las múltiples interacciones con los átomos del cuerpo sobre el que incide es el rad (radiation absorbed dose) y equivale a 10 ‒2 julios por kilogramo de material absorbente. Se trata de energía neta depositada, de forma que en el caso de los rayos gamma o de los rayos X cuenta únicamente la parte de radiación que no atraviesa el cuerpo. Un múltiplo de esta unidad es el gray (Gy), equivalente a 100 rad y, por lo tanto, a 1 julio por kilogramo de material absorbente. Los efectos biológicos de la radiación dependen, desde luego, de la energía depositada, pero también del tipo de radiación absorbida. Como ya hemos visto, cada uno de ellos actúa de forma distinta, por lo que se les asigna un parámetro llamado eficacia biológica relativa (EBR) o factor de ponderación wR, que sirve para comparar los distintos efectos que producen cantidades idénticas de energía absorbida según el tipo de radiación. La EBR depende de la energía de las partículas incidentes y de la transferencia lineal de energía, que, como sabemos, es muy grande para partículas alfa, algo menor para neutrones y protones y mucho menor para electrones y fotones. La EBR de un tipo de radiación se define como el cociente entre la dosis, expresada en rad, de rayos X (de 250 keV de energía) y la de la radiación del tipo considerado que produzca el mismo efecto biológico. De la definición se sigue que la EBR de los rayos X, rayos gamma o electrones de 250 keV es 1, y su valor prácticamente no varía con la energía. En la tabla 23.5 pueden verse los valores de wR asociados a los distintos tipos de radiación. Tabla 23.5. Eficacia biológica relativa de la radiación ionizante Tipo de radiación ionizante Fotones (rayos X y rayos gamma)
EBR (factor de ponderación ωR) 1
Electrones y muomes
1
Neutrones con energía entre 10 keV y 20 MeV
10 a 20
Neutrones con otras energías
5
Protones
5
Partículas alfa, fragmentos de fisión o núcleos pesados
20
392
Fundamentos físicos de los procesos biológicos
La unidad biológica de dosis equivalente o eficaz, D, es el rem (roentgen equivalent man), que se define de la siguiente forma: D(rem) = wR × d (rad ) donde d es la dosis física expresada en rad. Así, 1 rad de radiación gamma o X equivale a una dosis equivalente de rem, mientras que la misma cantidad absorbida de 1 rad de radiación alfa equivale a 20 rem. El daño biológico es, por lo tanto, proporcional a la dosis equivalente expresada en rem. Otra unidad de dosis biológica muy utilizada en estudios radioambientales es el sievert (Sv), igual a 100 rem o, lo que es lo mismo, igual a la dosis absorbida expresada en gray y multiplicada por la EBR. Un rem es, por lo tanto, igual a 10 milisievert (mSv). Tabla 23.6. Unidades en que se miden las dosis radiológicas absorbidas Dosis física, d
Dosis equivalente, D (D = ωR × d)
1 rad = 10 J/kg
1 rem = 1 × 1 rad
–2
1 Gray (Gy) = 100 rad = 1 J/kg
1 Sievert (Sv) = 100 rem
Cuando un organismo está sujeto a la acción conjunta de diferentes radiaciones ionizantes, hay que considerar la suma de las dosis equivalentes asociadas a cada tipo de radiación. La dosis equivalente total absorbida por un órgano o tejido, DT se define, por tanto, de la siguiente forma: DTD(en enrad radoGy o Gy) ) rem ooSv Sv)) = ∑wR × dT , R ((en T (enrem
(23.20)
R
donde dT, R es la dosis física de radiación del tipo R absorbida en el tejido T. Los efectos de los radioelementos en los tejidos dependen también de su capacidad para fijarse en ellos. Por ejemplo, el plutonio y el radio tienden a fijarse en el hueso, pero el plutonio permanece concentrado sobre la superficie ósea emitiendo una dosis intensa de radiación alfa hacia las células próximas, mientras que el radio se difunde homogéneamente y produce menos daños al no emitir dosis tan concentradas. Así, la extrema toxicidad del plutonio no se debe tanto a su intensidad radiante, que es escasa, sino a su facilidad para mantenerse concentrado y fijado al hueso durante largos periodos de tiempo. Los elementos que se alojan en otros tejidos se eliminan de forma más rápida; por ejemplo, el cesio radiactivo que se aloja en los músculos es eliminado completamente en dos años. El uranio, por su parte, se almacena principalmente en el hígado y los riñones. Es también importante, en lo que al daño biológico se refiere, la velocidad con la que se incorporan las dosis radiológicas en el organismo. Dicha variable
Átomos, núcleos y radiactividad
393
recibe el nombre de tasa de dosis y es igual a la cantidad de dosis radiológica absorbida por unidad de tiempo. Normalmente se expresa en milisievert por año (mSv/a) o microsievert por hora (μSv/h).
23.4.2 Las fuentes de radiación ionizante Fuentes naturales Las fuentes más importantes de radiación ionizante de origen natural son los rayos cósmicos, la radiactividad natural de rocas y alimentos y el gas radón. Los rayos cósmicos son partículas de alta energía que proceden del Sol o de otros astros. Los de origen solar dependen de la actividad del Sol y su flujo es especialmente intenso cuando se alcanzan los máximos del ciclo de 11 años de duración asociados a la aparición de un gran número de manchas solares. Los de origen extrasolar proceden de explosiones de supernovas y otros fenómenos astronómicos capaces de acelerar partículas a gran energía. Los rayos cósmicos son, en su gran mayoría, protones y partículas alfa. Antes de llegar a la superficie, los rayos cósmicos deben atravesar el campo magnético terrestre, que tiende a modificar su trayectoria. Las partículas que consiguen llegar a la Tierra se mueven espiralizando alrededor de las líneas de su campo magnético, tal y como ya se vio en el capítulo 20, lo que implica que, debido a la estructura de éste, son más abundantes cerca de los polos que en el ecuador. Así, la radiación cósmica es más intensa según nos aproxi mamos a los polos. Los rayos cósmicos interaccionan también con las capas altas de la atmósfera, generando cascadas de otras partículas secundarias de menor energía, algunas de las cuales son absorbidas en la misma atmósfera, mientras que otras, especialmente neutrones, electrones, rayos gamma y una clase especial de partículas parecidas a los electrones, llamadas muones, llegan a la superficie con mucha facilidad. Así la radiación cósmica se amortigua según penetra en el aire, por lo que es más intensa cuanto mayor es la altura sobre la superficie terrestre.
394
Fundamentos físicos de los procesos biológicos
Fig. 23.16. Dosis equivalente de radiación por unidad de tiempo en función de la altura para distintos tipos de radiación cósmica.
A unos 10 km sobre la superficie, que es la altura de crucero de un avión de línea, la radiación cósmica es entre 50 y 100 veces superior a la registrada al nivel del mar, y aumenta en un factor 2 suplementario para aviones supersónicos que vuelen a unos 18 km de altura. La tasa de dosis media de radiación a nivel del mar debida a los rayos cósmicos es del orden de 0,4 mSv/a, equivalente a 0,05 μSv/h. Para absorber esta dosis anual en superficie es suficiente con unos cuatro a siete días de vuelo en un avión de línea y del orden de un día en la Estación Espacial Internacional, que orbita a unos 400 km de altura. Otra fuente natural de radiación ionizante es la que procede de los materiales radiactivos. Algunos de ellos están en las rocas, especialmente en el granito, pero otros están presentes en la comida que ingerimos y, por lo tanto, en nuestro cuerpo. Una persona de 70 kg de peso, por ejemplo, contiene unos 14 mg de un isótopo radiactivo del potasio, el K40, que es el que más contribuye a este tipo de radiactividad. Así, el fondo radiactivo natural aumenta cuando nos situamos cerca de masas graníticas y en medio de una multitud. La suma de las emisiones procedentes de los materiales naturales radiactivos produce una tasa de dosis media del orden de 0,5 mSv/a. El tercer componente de la radiactividad natural es la progenie del gas radón. El isótopo Rn222 de este gas noble aparece en la cadena de desintegraciones del U238, como puede verse en el apéndice de este capítulo, a partir de la
Átomos, núcleos y radiactividad
395
desintegración alfa del Ra226, y tiene un semiperiodo de 3,8 días. Al ser un gas, se difunde por la atmósfera y puede desplazarse a grandes distancias antes de desintegrarse en otros elementos radiactivos sólidos, tal y como puede verse en ese mismo apéndice. Éstos se depositan en las partículas en suspensión en el aire, el suelo y las plantas, y pueden ser inhalados o ingeridos. El propio gas respirado da lugar en los pulmones a algunos de estos isótopos sólidos, que pasan a la sangre y pueden alojarse en los tejidos. La tasa de dosis media 1,00 mSv mSv/a / ay está muy por persona debida al gas radón es del orden de 0, 6 1, concentrada en los pulmones. En total, la tasa de dosis absorbida por persona debida a estas tres fuentes naturales es del orden de 1,5 mSv/a (o, lo que es lo mismo, 0,17 μSv/h), con variaciones considerables entre localizaciones que difieren en altitud y composición química del terreno. Fuentes artificiales Las fuentes artificiales son de tres clases: de origen médico, militar e industrial. Desde que se generalizaron la radioterapia, las exploraciones con rayos X y los isótopos radiactivos como trazadores para diagnosis, existe una cierta dosis de radiación procedente de estas fuentes, muy variable según el uso o la cercanía a estos instrumentos. La tasa de dosis promediada sobre la población de los países occidentales es del orden de 0,5 mSv/a, pero simplemente tres o cuatro radiografías de pecho suponen una dosis equivalente a 1 mSv. Las explosiones nucleares en la atmósfera, aunque cesaron a partir de finales de los años setenta, han dejado un resto de polvo radiactivo en suspensión que supone hoy unos 0,005 mSv/a por persona, mientras que el conjunto de las centrales nucleares en funcionamiento añaden una cantidad imperceptible, del orden de 0,0002 mSv/a. El accidente de Chernóbil, ocurrido en 1986, supone una tasa de dosis, promediada para el conjunto de la población, de 0,002 mSv/a. En consecuencia, la tasa de dosis equivalente total supone, en promedio, unos 2 mSv/a por persona, unos 2,4 mSv/a (unos 0,27 μSv/h) en Europa occidental, la mayoría procedente de fuentes naturales y aplicaciones médicas. En las zonas más contaminadas por el accidente de Chernóbil de Rusia, Bielorrusia y Ucrania, la radiación ambiente media asciende a unos 6 mSv a 11 mSv por persona y año. La radiación absorbida en los tratamientos de radioterapia contra el cáncer es muy superior, de centenares de mSv por sesión, con efectos sobre los tumores que se pretende destruir y también con efectos secundarios visibles en forma de cambios en la sangre, vómitos, pérdidas de pelo y otros. Una Sv es letal, aunque no lo es si se dosis instantánea por encima de los 5 6 Sv reparte en el tiempo y se dirige hacia una parte específica del organismo, como ocurre en los tratamientos contra el cáncer.
396
Fundamentos físicos de los procesos biológicos
23.4.3 Los efectos sobre los organismos La acción más directa de la radiación ionizante sobre el material celular es la ruptura o modificación de moléculas importantes, como el ADN, proteínas, enzimas o componentes de la membrana celular, del núcleo y de otros orgánulos celulares. Si los daños a nivel subcelular son grandes, puede producirse la muerte celular, o bien la pérdida de su capacidad de división o de algunas de sus funciones básicas, o su transformación en célula cancerosa. Además de la acción ionizadora directa sobre las moléculas orgánicas, es importante la que se produce de forma indirecta sobre moléculas del medio celular generando radicales libres y compuestos intermedios que actúan sobre las moléculas orgánicas, incluso después de que haya cesado la radiación. El agua es, en particular, un medio que, al absorber radiación ionizante, da lugar a iones H+y OH‒, electrones libres y H2O2 con gran poder reactivo sobre las moléculas orgánicas, alterándolas o rompiendo sus enlaces. De todos los compuestos básicos para la vida de los organismos, los más sensibles a la radiación son los ácidos nucleicos debido a que la modificación permanente de un solo par de bases en la secuencia del ADN puede ser catastrófica. La sensibilidad del ADN a la radiación aumenta especialmente en la fase de división celular. De ahí que los tumores cancerosos, con células replicándose de forma muy activa, sean más vulnerables que el entorno a la acción de la radiación ionizante, razón por la que ésta se utiliza como terapia contra el cáncer. Así, la mayor parte de los efectos biológicos de la radiación son la con secuencia de su interacción directa o indirecta con la dotación de ADN presente en los núcleos celulares. En las células somáticas, el daño sobre el ADN puede alterar la producción de moléculas necesarias para la vida de la célula o del organismo, o suprimir su capacidad de replicación, lo que se llama muerte proliferativa de la célula. En las células germinales, los daños pueden generar cambios en la dotación genética que se transmiten a los descendientes. La radiación ionizante es, por lo tanto, un agente mutagénico. Las células tienen, por su parte, mecanismos de reparación de los daños causados a las moléculas de ADN que actúan de forma permanente, con especial intensidad si se produce la acción de un agente externo como es la radiación. Si la intensidad es pequeña, entonces estos mecanismos pueden restaurar la integridad de las moléculas dañadas, pero si el daño es grande o daños menores se suceden rápidamente, de forma que no hay tiempo para repararlos, entonces se puede producir una lesión permanente que conduce a la muerte celular, a la muerte proliferativa de la célula o a la consolidación de errores transmisibles en el caso de que se trate de células germinales.
Átomos, núcleos y radiactividad
397
Aparte de la muerte celular, que puede ocurrir en cualquier tipo de célula, un daño comparable en las células germinales es la llamada muerte mitótica, que sobreviene cuando la célula pierde capacidad de replicación aun cuando sus funciones vitales y su aspecto morfológico no sufran alteraciones visibles. Para el caso de células somáticas diferenciadas no proliferativas, como las nerviosas, musculares o secretoras, se generaliza la noción de muerte celular a la pérdida de una función específica, que es la que justifica la actividad de esa célula en el organismo, mientras que en el caso de las células proliferativas, como las hematopoyéticas, las linfoides o las cancerosas, se considera muerte celular la pérdida de su capacidad proliferativa. Hay moléculas en la célula que son claves porque su alteración o destrucción implica la muerte celular en alguno de los sentidos especificados en el párrafo anterior. Un impacto de una partícula ionizante sobre estas moléculas podría ser suficiente para inactivar la célula. Cuando la cantidad de radiación aumenta, aumenta también la cantidad de moléculas dañadas, pero una parte de la radiación incide sobre moléculas ya inactivadas, de forma que siempre queda una parte intacta, aunque, como es lógico, disminuye con la cantidad de radiación absorbida. En la mayoría de los casos, las funciones vitales de la célula dependen de más de una molécula y es preciso que se acumulen un cierto número de daños para producir la muerte celular. A dosis bajas, es probable que no se lleguen a acumular los daños requeridos para inactivar a la célula y, en ese caso, ésta puede seguir desempeñando sus funciones aunque contenga algunas moléculas con defectos. Cuando son necesarios más de un impacto acumulado para inactivar la célula, se dice que estamos en el caso de múltiple impacto. Si el número de impactos necesarios para inactivar una célula es muy grande, la supervivencia es prácticamente total a pequeñas dosis. Y la razón es que es muy improbable que una misma molécula sufra un número suficiente de impactos para ser inactivada. De ahí que sean muy inseguras las extrapolaciones lineales de los efectos de grandes dosis de radiación (por ejemplo en humanos que han sufrido los efectos de las explosiones nucleares de Hiroshima y Nagasaki o de accidentes como el de Chernóbil) para conocer los que producen las pequeñas dosis. Clasificación de los efectos biológicos de la radiación Atendiendo a su transmisibilidad, los efectos de la radiación pueden ser hereditarios, cuando afectan a células germinales, de forma que pueden transmitir las mutaciones inducidas a la progenie, y somáticos cuando afectan a
398
Fundamentos físicos de los procesos biológicos
otras células y, por lo tanto, los eventuales cambios no se transmiten a los descendientes. Atendiendo a la relación entre dosis y daño causado, los efectos pueden ser deterministas o estocásticos. Los efectos deterministas (no estocásticos) están asociados a lesiones que necesitan que se haya producido la muerte o la inactivación celular en un conjunto grande de células. En este caso existe una relación lineal entre la dosis de radiación y los efectos desencadenados, así como una dosis umbral por debajo de la cual éstos son inapreciables. Los efectos deterministas, que afectan a un número sustancial de células, son necesariamente somáticos, por ejemplo anemias, esterilidad o caída del cabello. Los efectos estocásticos, por su parte, están asociados a mutaciones cromosómicas que se producen en una o unas pocas células, con consecuencias potencialmente graves para el organismo afectado o para los descendientes. No existe, por lo tanto, una dosis umbral por debajo de la cual el efecto no aparezca, y la gravedad del daño es independiente de la dosis, aunque la probabilidad de que aparezca sí es proporcional a la intensidad de la radiación absorbida. Un ejemplo de efecto estocástico en las células somáticas es la carcinogénesis, mientras que cuando daña a una célula germinal lo que produce son anomalías herditarias. Efectos deterministas La sensibilidad celular a este tipo de efectos depende mucho del tipo de célula. Las no diferenciadas son mucho más vulnerables que las células somáticas diferenciadas, hasta el punto de que para producir el mismo efecto en sistemas celulares diferenciados, no proliferativos, es necesaria una dosis del orden de 100 veces superior a la que basta para producir esos mismos efectos en sistemas proliferativos. Así, cuanto más dependiente sea un tejido de la reposición de sus células, más vulnerable será a la acción de la radiación ionizante, que destruye, en primer lugar, a las células a partir de las cuales se reponen las diferenciadas. Los efectos sobre el organismo se manifestarán tras un periodo de latencia que depende de la duración de las células maduras y el tiempo que puedan seguir ejerciendo su función antes de ser reemplazadas a partir de las células que han sido dañadas, es decir, dependerá de la cinética celular en cada órgano o tejido. Repasaremos ahora brevemente algunos de los tejidos más sensibles a la radiación. En el sistema hematopoyético, el eslabón más débil a la radiación ionizante son las células madre pluripotentes que se encuentran en la médula ósea y que, a pesar de su número reducido, generan mediante replicación y diferenciación todas las líneas de células maduras: eritrocitos, linfocitos,
Átomos, núcleos y radiactividad
399
plaquetas y otras. La inhibición proliferativa de las células madre y de todos los precursores intermedios bloquea la hematopoyesis medular e interrumpe la reposición de las células maduras, que disminuyen su número a medida que son eliminadas del sistema y no son reemplazadas por otras nuevas. Un eritrocito puede permanecer en la sangre hasta 180 días, pero hay otras células que permanecen intervalos de tiempo mucho más cortos, actuando en todo momento el sistema hematopoyético con una intensidad que pone de manifiesto el hecho de que reemplaza cada día unos mil millones de células. Por encima de los 50 rad los primeros efectos inhibidores de la radiación aparecen al cabo de pocas semanas. De las células maduras, los linfocitos T y B son especialmente sensibles a la radiación y mueren por apoptosis con dosis absorbidas relativamente bajas. Con 70 rad el número de células supervivientes es un factor del orden de e‒1 = 0,368 de las células iniciales. En el epitelio intestinal, las células superficiales se reponen a partir de las células situadas en las criptas de las vellosidades intestinales. La radiación ionizante inhibe la reposición de las células epiteliales, perdiendo las vellosidades relieve y poder absortivo, lo que produce deshidratación, pérdida de electrolitos e infecciones bacterianas que atraviesan la pared intestinal debilitada. La epidermis está continuamente renovando las células más externas a partir de células proliferativas que se encuentran en su capa basal, siendo estas últimas las más afectadas por la radiación. Los folículos pilosos, al ser también tejido en crecimiento continuo, se ven afectados por la radiación ionizante, produciendo la caída temporal o permanente del cabello con dosis próximas a los 1.000 rad, letales en una sola exposición, pero que son administradas de forma progresiva en los tratamientos de radioterapia contra el cáncer. En los órganos reproductivos, los espermatozoides y los folículos maduros de los ovarios son radiorresistentes, pero no ocurre lo mismo con las espermatogonias, precursoras de los espermatozoides, y los folículos intermedios. La destrucción de estos tejidos puede producir esterilización temporal para dosis a partir de los 20 rad y permanente para dosis entre 300 y 600 rad. En el embrión, la fase de preimplantación está caracterizada por una intensa actividad replicativa, por lo que es vulnerable a la radiación y la probabilidad de que muera en un entorno radiactivo es muy alta, mientras que cuando está implantado es más resistente y son más probables las anomalías estructurales o las deformidades. Como vemos, el conjunto del sistema hematopoyético es el que se ve afectado por dosis más bajas de radiación, hasta unos 500 rad, siendo
400
Fundamentos físicos de los procesos biológicos
visibles sus efectos al cabo de uno o dos meses. A dosis más altas, desde los 500 rad a los 1.500 rad, se añaden los daños producidos en la mucosa intestinal apareciendo sus efectos más rápidamente, al cabo de 10 a 20 días. Para dosis todavía más altas, resulta afectado también el sistema nervioso central y sus efectos aparecen en tan solo 1 a 5 días. En todo caso, una dosis del orden 500 rad en ausencia de cuidados médicos produce ya la muerte del 50 % de los afectados. Efectos estocásticos Como ya hemos visto, estos efectos aparecen cuando se daña algún punto esencial en las cadenas de ADN de una o unas pocas células. Su manifestación clínica son los cánceres o las anomalías hereditarias, dependiendo de que se trate de células somáticas o germinales. La probabilidad de que se produzcan este tipo de efectos depende de la dosis absorbida, pero no la gravedad de las patologías, que pueden derivarse de un daño puntual generado por una dosis ínfima de radiación. Dado que hay un fondo natural de radiación y mutaciones que se producen fortuitamente o debidas a otro tipo de causas, es imposible en cada caso particular distinguir los cánceres o anomalías hereditarias causados por la radiación ionizante de los que aparecen por la acción de otros agentes mutagénicos o de forma espontánea. De ahí que sólo sea posible establecer estadísticamente la correlación causaefecto analizando el exceso de pato logías aparecidas en una población cuando está sometida a una cierta dosis de radiación superior a la natural. La carcinogénesis se inicia siempre a partir de un conjunto de mutaciones del genoma celular que trastornan su ciclo normal e inducen su crecimiento y proliferación desordenada. Las mutaciones deben, en particular, afectar a ciertas clases de genes, llamados proto-oncogenes, que, al ser activados, se convierten en oncogenes, y a otros llamados anti-oncogenes o supresores de tumores, que deben ser inactivados. Estas mutaciones pueden aparecer de forma espontánea, o bien inducidas por agentes químicos, virus u otras causas, entre las que se encuentran las radiaciones ionizantes. El periodo de latencia típico de la inducción de una leucemia por efecto de la radiación ionizante es de unos 8 años, y en ningún caso menor de 2 años. Para tumores sólidos, tanto el periodo de latencia promedio como el mínimo es del orden de 2 a 3 veces superior al de las leucemias. La probabilidad de que aparezcan tumores depende de la dosis absorbida y también de la EBR, por lo que el parámetro relevante es la dosis equivalente, medida en rem o en Sievert. Además de la naturaleza de la radiación, es también relevante el tipo de tejido, no contribuyendo todos ellos por igual
401
Átomos, núcleos y radiactividad
a la probabilidad de que aparezcan cánceres. Aquellos en los que con más facilidad se desencadenan procesos cancerosos debido a la radiación ionizante son las gónadas, que contribuyen con un 20 % al total, siendo los menos proclives el hueso y la piel, que contribuyen con un 1 % cada uno. En la tabla 23.7 se dan los factores de ponderación, wT, de los distintos tejidos. Tabla 23.7. Factor de ponderación, wT , de los distintos tejidos Tejido u órgano
Factor de ponderación wT
Gónadas Médula ósea Colon Pulmón Estómago Vejiga Mama Hígado Esófago Tiroides Piel Superficie de los huesos Resto
0,20 0,12 0,12 0,12 0,12 0,05 0,05 0,05 0,05 0,05 0,01 0,01 0,05
La dosis equivalente de radiación para un organismo completo, D, será, por consiguiente, igual a la suma de las dosis equivalentes absorbidas por todos sus órganos y tejidos: D(enrem Sv)== ∑wT × DT D (en rem ooSv) T
y, sustituyendo DT por su expresión en términos de las dosis físicas de distintas radiaciones absorbidas, según la ecuación (23.20), resulta: (enrem enrad ) radoGy o Gy) DD (en rem ooSv Sv)) = ∑wT × ∑wR × dT , R ((en T
R
Los efectos probables para la salud que resultan de una exposición a la radiación ionizante son, en función de la dosis absorbida por todo el cuerpo, los siguientes: De cero a 250 mSv (0 a 25 rem) no se observa ninguna respuesta clínica. Hasta los 500 mSv (50 rem) no se registra ningún efecto inmediato, pero sí diferido, en forma de algún riesgo de exceso de tumores o alteraciones
402
Fundamentos físicos de los procesos biológicos
genéticas y una disminución transitoria del sistema inmune debido a la pérdida de linfocitos y neutrófilos. Entre los 500 mSv y los 2,5 Sv aparecen progresivamente náuseas, vómitos, diarreas y quemaduras en la piel, junto con abortos espontáneos en las mujeres embarazadas, mientras a largo plazo aumenta el daño sobre el sistema inmune, facilitando las infecciones, y cambia la composición de la sangre, al tiempo que aumenta el riesgo de desarrollar tumores o alteraciones genéticas. A partir de los 2,5 Sv (250 rem) los efectos inmediatos son más graves, añadiéndose la pérdida de pelo, hemorragias internas y daños graves en la médula ósea, el sistema linfático, los genitales, etc. Más del 50 % de los afectados por dosis entre 2,5 y 6,0 Sv (250 a 600 rem) mueren en un plazo de 3 a 5 semanas después de la exposición a la radiación. Los supervivientes tienen una gran probabilidad de desarrollar cánceres y trastornos psiconeurológicos y glandulares. Para dosis superiores a 6 Sv la muerte sobreviene en un plazo de unos diez días o menos. Debe advertirse que los efectos son distintos dependiendo de la mayor o menor concentración en un órgano. Las cifras del párrafo precedente se refieren a una irradiación global del cuerpo, mientras que sus consecuencias serían menos graves si se concentraran en una parte del mismo, como ocurre, por ejemplo, en los tratamientos de radioterapia. Pueden absorberse, por ejemplo, 5 Sv en varias sesiones de tratamiento sobre un tumor, mientras que esa dosis sería letal administrada en una sola sesión a todo el cuerpo. Una persona que hubiera permanecido dos minutos en el edificio de contención del reactor nuclear de Three Mile Island, en el momento del accidente que tuvo lugar en 1979, habría recibido una dosis letal de unos 10 Sv. Los 134 liquidadores que afrontaron las labores de limpieza en los primeros días del accidente de Chernóbil recibieron una dosis de entre 0,7 y 13 Sv, otras 30.000 personas que participaron en tareas de limpieza y evacuación recibieron más de 0,5 Sv y en el pueblo de Pripyat, el más cercano a la central nuclear, se registró tan sólo el primer día una dosis media por habitante de unos 0,14 Sv. En una radiografía de pecho actual se absorben 0,3 mSv (0,03 rem), mientras que antes de 1970 la dosis podía llegar a ser 100 veces superior. El procedimiento para establecer los límites de radiación ambiente tolerables para la salud humana consiste en determinar las dosis máximas para las que no aparece ningún efecto de toxicidad en un adulto promedio y luego dividir por un factor del orden de 10 para estar seguros de cubrir la variabilidad individual en sensibilidad a la radiación. Además, se distingue entre
Átomos, núcleos y radiactividad
403
el público en general y las personas que trabajan en actividades relacionadas con materiales radiantes. De acuerdo con las normas de Euratom (Comunidad Europea de la Energía Atómica), el límite de dosis equivalente para trabajadores expuestos en razón de su actividad laboral es de 100 mSv (10 rem) durante un periodo de cinco años consecutivos, sin superar nunca los 50 mSv por año. Para el público en general, el límite es de 1 mSv por año. En todos estos límites se excluye la radiación ionizante de origen natural y la que se absorbe en tratamientos médicos, que, como sabemos, es, en promedio, algo superior a los 2 mSv por año al nivel del mar. En la normativa vigente se contemplan casos especiales de exposiciones cortas en circunstancias excepcionales y una especial protección para las mujeres embarazadas. También se especifican distintos límites para ciertos tejidos, como el cristalino o la piel, especialmente expuestos a la radiación externa.
23.4.4 Medicina nuclear Terapia La hipersensibilidad de las células proliferativas a la radiación hace que ésta sea un instrumento terapéutico contra los tumores, ya que las células cancerosas se caracterizan por dividirse con gran rapidez. Así, se utilizan isótopos radiactivos para destruir las células tumorales. Uno de los más frecuentes es el cobalto 60, que, tras una transición beta, se convierte en un estado excitado del níquel 60 que inmediatamente emite dos fotones de alta energía, de 1,17 MeV y 1,33 MeV. El cobalto radiactivo se conserva en una caja de gruesas paredes de plomo que no deja salir la radiación al exterior, pero cuando hay que tratar a un paciente, se abre un pequeño orificio orientado a la parte del cuerpo donde se encuentra el tumor a fin de que la radiación gamma emitida destruya las células cancerosas. Ejemplo Si, por ejemplo, en la caja hay una muestra de 10 gramos de Co60, que tiene una vida media de 5,26 años, la actividad será, de acuerdo con la expresión (23.17): 10 × 6, 02 ×1023 60 = 4, 2 ×1014 Bq A= 5, 26 × 365 × 24 × 3.600 0, 693 ×
Cada desintegración da lugar a dos fotones pero sobre un paciente sólo incide la parte que sale a través del orificio, cuya superficie podemos estimar como del orden del 1 % de la superficie total de la caja. Según puede comprobarse en la tabla 23.4, la longitud de semiatenuación de fotones de esta
404
Fundamentos físicos de los procesos biológicos
energía en tejido corporal es de unos 10 cm, por lo que a esta profundidad serán absorbidos por el cuerpo del paciente aproximadamente la mitad de los incidentes. La energía total depositada será igual al producto del número de desintegraciones por unidad de tiempo (actividad) por el número de fotones emitidos en cada desintegración (2 en este caso), por la energía media por fotón, por el factor que nos da la cantidad de energía de estos fotones depositada en el cuerpo (1/2 en este caso), por la fracción que representa la superficie del orificio en comparación con la superficie total de la caja (un 1 % en este caso). Teniendo en cuenta que la energía media de cada fotón es de 1,25 MeV, resulta: 2×
1 1 × × 4, 2 ×1014 ×1, 25 = 5, 25 ×1012 MeV 0,84J/s J /s MeV/s/ s==0,84 100 2
Si el paciente pesa 70 kg, la tasa de la dosis absorbida será de: 0,84 1 −‒1 = 0, 012 JJ ⋅·kg 2 rad ss 1 == 1, kg−‒1 1,2 rad/s/ s 70 Teniendo en cuenta que los rayos gamma tienen una EBR igual a 1, en una exposición de 30 segundos, el paciente recibe una dosis equivalente: D = 30 × 1,2 = 36 rem = 360 mSv Diagnóstico La utilización más antigua y extendida de la radiación ionizante son los rayos X, conocidos desde 1895, cuyo poder de penetración depende de la densidad de los tejidos que atraviesa. Los huesos absorben la radiación más eficazmente que los tejidos blandos, por lo que, si registramos la intensidad de un haz de rayos X tras atravesar un cuerpo en una placa sensible a este tipo de radiación, la señal que ésta deja permite visualizar las zonas del organismo con densidades distintas, en particular los huesos. Se han producido muchos perfeccionamientos de esta técnica con objeto de aumentar el contraste de órganos y tumores sólidos, y también la reconstrucción tridimensional de éstos utilizando ordenadores para integrar los resultados de una serie de tomas desde distintos puntos de vista. En la técnica llamada Tomografía Axial Computerizada (TAC), un fino haz de rayos X gira alrededor del eje del cuerpo explorando una “rodaja” y dejando los resultados registrados en la memoria de un ordenador. La superposición de sucesivas “rodajas” permite obtener una imagen tridimensional del órgano explorado.
Átomos, núcleos y radiactividad
405
Fig. 23.17. (a) La imagen clásica de una radiografía es la proyección sobre un plano de la distribución interna de los tejidos de distinta densidad. (b) En la tomografía axial computerizada (TAC) se exploran “rodajas” de una parte del cuerpo mediante un fino haz de rayos X que gira alrededor del eje del cuerpo en la zona que se pretende explorar. El sistema informático reconstruye la imagen tridimensional.
Muchos isótopos radiactivos son aborbidos por el organismo e incorporados a las distintas moléculas orgánicas como si fueran isótopos estables, dado que las propiedades químicas son idénticas. Pero su desintegración deja un rastro que puede seguirse con instrumentos de detección adecuados. Así, el Fe59 se incorpora a la hemoglobina como si fuera hierro común, pero analizando la radiación emitida por la sangre en distintos instantes de tiempo y en diferentes lugares del cuerpo puede seguirse el ciclo de renovación de los glóbulos rojos y la circulación del hierro por el organismo. Su semivida es de 44,5 días, por lo que permanece con una actividad detectable durante un año aproximadamente, equivalente a unas 8 semividas. Hay otros isótopos que son absorbidos por el tejido tumoral, mientras que no lo son, o muy poco, por el tejido circundante. La radiación emitida por el isótopo sirve, así, para señalar la presencia de un tumor que no se vería con facilidad en una radiografía. El elemento químico más usado es el tecnecio 99 en un estado metaestable cuya semivida es de 6 horas. El tecnecio, de número atómico 43 y el promecio, de número atómico 61, son los únicos elementos de la tabla periódica con un número atómico menor de 84 que no tienen ningún isótopo estable. Sus casillas han permanecido vacías, por tanto, durante muchas décadas, hasta su producción artificial como fragmentos de fisión en los reactores nucleares. , en particular, tiene una semivida de unos 200.000 años, siendo la El pequeñez de este valor en comparación con la edad de la Tierra (unos 4.500 millones de años) la razón de que no exista en la naturaleza. Existe un estado excitado de este núcleo que tarda del orden de 6 horas en desexcitarse hasta el estado fundamental emitiendo un fotón de alta energía, en contraste con la inmensa mayoría de los núcleos, cuyo tiempo de desexcitación es inferior
406
Fundamentos físicos de los procesos biológicos
a la millónesima de segundo. Este estado excitado de gran estabilidad se llama tecnecio 99 metaestable y es el que sirve como trazador de tumores. En efecto, su larga vida media hace que dé tiempo a que sea ingerido y se fije en los tejidos del organismo, con una fuerte tendencia a concentrarse en el tejido tumoral. Así, examinando la radiación gamma que emite para volver a su estado fundamental, se puede localizar y analizar un tumor. Dicho estado fundamental es, a su vez, inestable (con una semivida de años, tal como ya se ha mencionado) y emite radiación beta para acabar transformándose en rutenio pero su larga vida media en comparación con el ritmo de los procesos biológicos permite que sea eliminado del organismo cuando apenas se han desintegrado algunos de sus núcleos.
23.5 Apéndice. La cadena de desintegración del U238 Las cadenas de desintegración se representan en un diagrama en el que la abscisa es el número atómico y la ordenada el número másico. En una transición alfa, el nucleido resultante tiene un número másico inferior en cuatro unidades y un número atómico inferior en dos unidades. Se representa por una flecha que va del nucleido “padre” al “hijo”, del tipo de la figura 23.18.a. En una transición beta, el número másico permanece constante, mientras que el número atómico aumenta en una unidad, por lo que la flecha que la representa es como la de la figura 23.18.b. La transición beta inversa se representa por una flecha en sentido contrario a la anterior, del tipo de la figura 23.18.c. Finalmente, en una transición gamma no hay cambio de núclido sino sólo una desexcitación a partir del estado excitado en que se encuentra el núcleo que emite este tipo de radiación: no hay, por tanto, movimiento en el diagrama y no la representamos.
Fig. 23.18. Transiciones alfa y beta.
Átomos, núcleos y radiactividad
407
Fig. 23.19. Cadena de desintegraciones del U238. Las semividas están expresadas en años (a), días (d), minutos (m) y segundos (s).
23.6 Ejercicios propuestos Ejercicio 23.1 Un aparato de rayos X acelera electrones por medio de una diferencia de potencial de 5.000 V. Para el caso extremo en que un electrón emita un fotón al que cede toda su energía, ¿cuál es la longitud de onda del fotón? Sol.: λ = 2,5 Å Ejercicio 23.2 Considérese una gota de agua de 1 mm de diámetro cayendo a la velocidad de 2 m/s. Calcular la longitud de onda asociada a su onda de probabilidad. Sol.: que es una longitud de onda mucho menor que cualquier longitud física observable (el núcleo atómico tiene un diámetro de unos 10 ‒5 Å) y, por lo tanto, irrelevante.
408
Fundamentos físicos de los procesos biológicos
Ejercicio 23.3 ¿Cuál es la longitud de onda asociada a un electrón y a un protón que se mueven con una velocidad igual a la décima parte de la velocidad de la luz? Sol.: λe = 0,24 Å; λp = 0,00013 Å Ejercicio 23.4 Sea un conjunto de electrones libres en equilibrio a la tem peratura ambiente (T = 300 K). Calcular el momento promedio y la longitud de onda asociada. Sol.: p = 1, 06 ×10−25 kg ⋅ m ⋅ s −1 ;
λe = 62 ÅA
Ejercicio 23.5 Un átomo de helio a la temperatura ambiente tiene, en promedio, una energía cinética igual a la del electrón del ejemplo, pero su momento es distinto porque su masa es aproximadamente 4 × 1840 veces mayor. Calcular la longitud de onda asociada. Å Sol.: λHe = 0, 72 A Ejercicio 23.6 ¿Cuál es el valor medio de la velocidad del electrón en el estado fundamental del átomo de hidrógeno? Sol.: v = 2, 2 ×106 m / s Ejercicio 23.7 Las transiciones que van desde cualquier nivel del átomo de hidrógeno al nivel fundamental forman una secuencia espectral llamada serie de Lyman. Calcular la expresión general de la secuencia y los valores máximo y mínimo de las longitudes de onda que la forman. ¿En qué zona del espectro electromagnético se sitúan? Sol.:
1 1 1 = 1 − 2 m −1 ; λ2 = 1.200 Å; A λ∞ = 910 ÅA (Ultravioleta) −8 λn 9,1×10 n
Ejercicio 23.8 Las transiciones que van desde cualquier nivel del átomo de hidrógeno al nivel n = 3 forman una secuencia espectral llamada serie de Paschen. Calcular la expresión general de la secuencia y los valores máximo y mínimo de las longitudes de onda que la forman. ¿En qué zona del espectro electromagnético se sitúan? Sol.:
1 1 9 = 1 − 2 m −1; λ4 = 19.000 Å A; λ∞ = 8.200 ÅA (Infrarrojo) −7 λn 8, 2 ×10 n
Átomos, núcleos y radiactividad
409
Ejercicio 23.9 Calcular, a partir de las masas de la tabla 23.2, la energía de enlace por nucleón del núcleo del átomo de plomo 208. Sol.: Uenlace = 7,87 MeV Ejercicio 23.10 El radio de un núcleo varía con el número másico según la expresión R = 1,3 × 10 ‒15 × A1/3 m. Calcular la densidad de la materia nuclear y mostrar que es constante, independientemente del número másico A. (Considerar iguales la masa del protón y la del neutrón). Sol.: ρ = 1,8 ×1017 = 1,8 ×1014 × ρ agua Ejercicio 23.11 El sodio 24, Na24, tiene un semiperiodo de 951 días. Calcular la actividad de un gramo de ese isótopo. Sol.: A = 2,1×1014 Bq = 5.700 Ci Ejercicio 23.12 A partir de la definición de curio, calcular el semiperiodo del Ra226. Sol.: t = 1.600 años Ejercicio 23.13 Un emisor β‒ de un curio se encuentra a 2 m de distancia de una persona. ¿Cuántos electrones por segundo y por centímetro cuadrado inciden sobre su piel? Sol.: 74.000 e‒ / (s × cm2) Ejercicio 23.14 Una reacción importante en el interior de estrellas muy masivas es la síntesis de núcleos de oxígeno a partir de núcleos de carbono y de helio: C12 + He4 → O16 + Energía Calcular la producción de energía por núcleo de oxígeno sintetizado. Sol.: ΔE = 7,2 MeV Ejercicio 23.15 El semiperiodo del U235 es de unos 700 millones de años. Calcúlese la fracción de este isótopo que ha sobrevivido en nuestro planeta desde el nacimiento de la Tierra. Por su parte, el U238 tiene una semivida de 4.500 millones de años, igual a la vida de la Tierra, por lo que en ese mismo periodo de tiempo ha disminuido en un factor 2. Sabiendo que la proporción actual del isótopo 235 es un 0,72% por ciento, y llamando X235 y X238 a las can tidades de ambos isótopos presentes en la nube de gas y polvo de la que nació nuestro planeta, calcular la relación entre X235 y X238 , es decir, la proporción de átomos de U235 respecto de U238 en la nube primigenia.
410
Sol.:
Fundamentos físicos de los procesos biológicos
X 235 1 N (235) = 0, 012 ; = N 0 (235) X 238 3
Ejercicio 23.16 Encontrar el nucleido X en las siguientes reacciones nucleares: 1. He 4 + X → C12 + n 2. He 4 + X → P1530 + n 3. p + Li 6 → He 4 + X 64 4. n + Zn30 →X+p
5. U 92239 → X + e − +ν 6. Ra88226 → X + He 4 64 239 Sol.: 1) Be49 ; 2) Al1327 ; 3) He3 ; 4) Cu29 ; 5) Np93 ; 6) Rn86222
Ejercicio 23.17 Calcular, a partir de las longitudes de semiatenuación de la tabla 23.4, el espesor que debe tener una protección de plomo para detener el 99 % de un haz de rayos gamma de 0,5 MeV de energía. Sol.: espesor = 2,8 cm Ejercicio 23.18 La intensidad de un haz de rayos gamma se atenúa hasta quedar reducida a un 25 % de la inicial al atravesar una lámina de plomo de 1,7 cm de espesor. Calcular la energía de los rayos gamma. Sol.: E = 1 MeV Ejercicio 23.19 Para hacer una radiografía de tórax se utilizan rayos X de 50 keV de energía. ¿Qué fracción de la intensidad incidente llega a la espalda después de atravesar el cuerpo del paciente? (Supóngase que el espesor del tórax es de 15 cm). Sol.: 3,5 % Ejercicio 23.20 Se inyecta a un paciente 4 cm3 de sangre marcada con Cr que presenta una actividad de 50.000 desintegraciones por minuto. Si la semivida del Cr51 es muy larga en comparación con la duración del experi mento, ¿cuál será la actividad de un volumen igual de sangre cuando, unos 51
Átomos, núcleos y radiactividad
411
minutos después, la muestra inicial se haya extendido por todo el torrente sanguíneo? Sol.: A = 40 desintegraciones por minuto Ejercicio 23.21 Se administra una dosis de 200 rad a un conjunto de células para las que el parámetro D0 en la ecuación que da la fracción de supervi vencia es D0 = 100 rad. Calcúlese la fracción de supervivencia en el caso de que sean necesarios 1, 2 o 3 impactos para causar la muerte celular. Sol.: FS (n = 1) = 0,135 ; FS (n = 2) = 0, 252 ; FS (n = 3) = 0,353
23.7 Referencias Arnold, J. R. & Libby, W. F. “Age determinations by radiocarbon content: Checks with samples of known age”. Science, 110 (1949) 678. Bertell, R. “No Inmediate Danger?, Prognosis for a Radioactive Earth”. The Book Publishing Company, 1990. Canada’s National Laboratory for Particle and Nuclear Pyhsics (TRIUMF): http://www.triumf.ca Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas (CIEMAT). “Efectos Biológicos de las radiaciones ionizantes y protección radiológica”. Octubre de 2000 Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas (CIEMAT). “Efectos Biológicos de las radiaciones ionizantes: daños moleculares y celulares”. Comunidad Europea de la Energía Atómica (EURATOM). Directiva 96/29 Eisberg, R. & Resnick, R. Física Cuántica. Limusa Noriega Editores, 1999 Glashow, S. L. From Alchemy to Quarks. Brooks/Cole Publishing Company, 1994 Kaplan, I.: Nuclear Physics. Addison Wesley, 1972. De Marcillac, P. et al. “Experimental detection of -particles from the radioactive decay of natural bismuth”. Nature, 422 (2003) 876. National Institute of Standards and Technology (NIST): http://physics.nist. gov Sievert: http://www.sievert-system.org
Glosario Abbe, Invariante, 306 Abertura o apertura numérica, 327 Abertura circular, difracción, 271 Absorción, Coeficiente de, 217 Acomodación, 310 Actividad de una muestra radiactiva, 382 Actividad óptica, 248 ADN, 396 Afinidad electrónica Agua Constante dieléctrica del, 15 Índice de refracción, 237 Momento dipolar de la molécula, 33 Velocidad del sonido en, 231 Aire Constante dieléctrica del, 15 Permitividad dieléctrica del, 15 Velocidad del sonido en, 231 Airy, Función de, 272 Aislante, 40, 45 Alcance de la radiación ionizante, 387 Ampère, Ley de, 191 Amperio (Unidad), 42, 172 Amplitud, 208, 215 Anchura angular, difracción, 273 Análisis de Fourier, 222 Angstrom (Unidad) 2, 350 Ángulo de Brewster, 261 de incidencia, 253 de reflexión, 250 413
414
Fundamentos físicos de los procesos biológicos
de reflexión total, 254 de refracción, 252 Aproximación paraxial, 305 Arco iris, 254 Argón, Láser de, 272 Armónicos, 223 Atenuación, 217, 389 Atmósfera, 219, 221, 393 Átomo, 1, 350 ATP, 91 Audición Frecuencias de, 227 Umbral de, 227 Aumentos angular, lateral, 323, 327 de la lupa, 326 del microscopio, 332 Aurícula, 136 Axón Capacidad eléctrica del, 27 Circuito equivalente del, 102 con mielina, 105 gigante del calamar, 94 Resistencia eléctrica del, 111 Axoplasma Resistividad, 45 Bacteria magnetotáctica, 182 Balmer, Serie de, 353 Banda de absorción, 218 Bastones, 312 Batería, 49, 64 Becquerel (Unidad), 383 Big Bang, 373 Biomagnetismo, 177 Biopotenciales, 25, 73 Biot-Savart, Ley de, 167 Bloqueo AV, 146 Bohr Átomo de, 354
Glosario
Magnetón de, 175 Modelo de, 354 Radio de, 355 Bomba de sodio-potasio, 90 Brazo de palanca en el oído medio, 289 Brewster, Ángulo de, 261 Brújula, 161 Calor, Disipación en una resistencia, 48 Cámara fotográfica, 324 oscura o de agujero, 303 Campo eléctrico carga puntual, 6 dipolo, 8 Líneas de, 7 uniforme, 11, 18 Campo magnético de un solenoide, 170 de una corriente rectilínea, 168 de una espira circular, 169 Efectos biológicos, 182 Fuerza sobre carga en movimiento, 154 Líneas de, 169, 187 terrestre, 177 Campos eléctrico y magnético, 193 Canal auditivo, 287 Capacidad eléctrica de un condensador plano, 21 específica membrana, 27, 111 Unidad de, 22 Capacidad equivalente condensadores en paralelo y en serie, 23 Carbono Isótopos del, 165, 383 Masa del átomo, 368 Carcinogénesis, 397 Carga eléctrica, 1 del electrón, 1, 5
415
416
Fundamentos físicos de los procesos biológicos
de un condensador, 21 en un campo magnético, 154 Cauchy, Relación de, 253, 297 Células bipolares, 313 cardíacas, 134 ciliadas, 293 de la retina, 313 de Purkinje, 136, 140 de Schwann, 94, 105 ganglionares, 313 gliales, 105 horizontales, 314 musculares cardíacas, 134 musculares esqueléticas, 77 nerviosas, 92 Circuito eléctrico RC, 54 RC con pérdidas, 60 Cobalto, 403 Cóclea, 290 Coherencia de ondas armónicas, 267 Coeficiente de absorción, 217 Color, Percepción del, 312 Colores estructurales, 278 Complejo QRS, 139 Compuertas iónicas, 131 Concentración iónica en el citoplasma, 71, 77 Condensador Capacidad de un, 21 Carga y descarga de un, 54 Combinaciones serie y paralelo, 22 Energía, 24 Conducción del impulso nervioso electrotónica, 111 saltatoria, 125 Conductancia, 44 Conductividad, 44 Conductor eléctrico
Glosario
óhmico, 43 Fuerza magnética sobre un, 158 Fuerza entre, 172 Confinamiento cuántico, 359 Conos, 312 Constante de Coulomb, 4, 194 de tiempo, 55, 381 de Planck, 349 dieléctrica, 14 dieléctrica de diversos materiales, 15 Contraste de fase, Microscopio de, 338 Corazón, Propiedades eléctricas del, 134 Córnea, 308 Corriente eléctrica alterna, 190 de desplazamiento, 192 Definición, 92 inducida, 188 Unidad de, 42 Corti, Órgano de, 292 Coulomb Ley de, 3 Crick, F.H.C., 278 Cristalino, 308, 315 Criterio de Rayleigh, resolución, 274 de signos, óptica geométrica, 306, 320 Culombio (Unidad) 4, 174 Curio (Unidad), 383 Darwin, Charles, 302 Datación magnética, 180 por carbono radiactivo, 383 por isótopos radiactivos, 383 Dawkins, Richard, 320 de Broglie, Relación de, 357 Decibelio, 228 Densidad, 92
417
418
Fundamentos físicos de los procesos biológicos
de fotorreceptores, 313 Desintegración alfa, 379 beta, 379 gamma, 381 Detección de la luz, 301, 307 del sonido, 229, 287 Dextrosa, 299 Deuterio, 371 Diamagnetismo, 176 Dieléctrico Material, 13 Polarización de un, 14 Diferencia de intensidad interaural (DII), 281 Diferencia de tiempo interaural (DTI), 283 Diferencia de potencial, 18, 49 Difracción de rayos X, 276 por cristales, 276 por una abertura circular, 271 Dioptría, 321 Dioptrio esférico, 304 Dipolo cardíaco, 141 electrico, 8 magnético, 160 Dispersión del índice de refracción, 253 Mie, 221 Rayleigh, 221 Distancia focal, 321 Dominios magnéticos, 177 Donnan, Equilibrio de, 80 Dosis de radiación, 391 efectos biológicos, 396 equivalente, 391 Dualidad onda-corpúsculo, 358 ECG (Ver, electrocardiograma)
Glosario
Ecografía, 235, 262 Ecolocalización, 262 Ecuación de las lentes delgadas, 322 de Einstein, 351 de Goldman-Hodgkin-Katz, 82 de Nernst, 73 EEG (ver electroencefalograma) Efecto Doppler, 284 fotoeléctrico, 349 túnel, 363 Eficacia biológica relativa (EBR), 391 Einstein fórmula de, 351 Teoría corpuscular de la luz, 348 Electrocardiograma, 134 Electroencefalograma, 185 Electrolocalización, 28 Electrón carga del, 1, 5 relación q/m del, 164 Electronvoltio (Unidad), 20 Electrotónica, Conducción, 111 Enantiómero, 248 Energía almacenada en un condensador, 24 de enlace en los átomos, 354 de enlace en los núcleos, 366 de las ondas acústicas, 227 de las ondas electromagnéticas, 238 de una espira, 162 de una onda armónica, 212 del fotón, 239, 349 depositada por la radiación, 391 Energía potencial electrostática, 16 Enfermedades debidas a desmielinización, 129 Equilibrio de Donnan, 80 Potencial de, 73
419
420
Fundamentos físicos de los procesos biológicos
Esclerosis múltiple, 129 Esclerótica, 308 Espectro atómico, 353 electromagnético, 239 visible, 242 Espectrómetro de masas, 164 Espejismo, 256 Espejos orgánicos, 316 Espesor de mielina, Optimización del, 107, 118 Espira Campo magnético de, 168 Momento magnético de una, 159 Estrella, 373 Experimento de Oersted, 153 Faraday, Ley de, 188 Faradio (Unidad), 22 Fase, 208 Contraste de, 338 FEM (ver fuerza electromotriz) Fermi (Unidad), 351 Ferromagnetismo, 176 Fibra óptica, 255 Fibrilación ventricular, 146 Física cuántica, 345 Fisión nuclear, 375 Flujo de campo magnético, 186 iónico, 74 Foco objeto, 321 imagen, 307, 321 Fórmula de Einstein, 351 Fotón, 238, 348 Fotorreceptores, 312 Fourier, Análisis de, 222 Fóvea, 309 Fracción de supervivencia, 402
Glosario
Fragmento de fisión, 376 Frecuencia de fusión, 269 de onda, 210 de ondas electromagnéticas, 239 de la luz visible, 292 del sonido, 228 Frente de ondas, 214 Fuerza electromotriz, 48 Fuerza eléctrica sobre una carga puntual, 3 sobre un dipolo, 13 Fuerza magnética entre corrientes, 172 sobre una carga puntual, 154 sobre una espira, 159 Fugu, 100 Fusión nuclear, 372 Gauss Ley de, 187 (Unidad), 155 Gilbert, William, 177 Goldman-Hodgkin-Katz, 82 Gradiente de concentración, 79 Helio Átomo de, 368 Isótopos del, 370 Hidrógeno Átomo de, 353 Isótopos del, 370 Hierro, isótopos del, 370 Hipermétrope, 312 Hiperpolarización, 98 Hodgkin-Huxley, Modelo de, 130 Imagen Resonancia Magnética (IRM), 200
421
422
Fundamentos físicos de los procesos biológicos
Posición de la, 322 Tamaño de la, 323 Imán, 174 Imanación, 177 Impedancia acústica, 262 Impulso nervioso, 95 Índice de refracción Dependencia con la frecuencia, 253 Límite biológico del, 316 Infrarrojo, 241 Instrumentos ópticos, 320 Intensidad de corriente eléctrica, 42 Intensidad de una onda, 212 electromagnética, 238 sonora, 227 Interferencia Condiciones generales de, 264 por reflexiones múltiples, 269 Invariante de Abbe, 306 Iridiscencia, 269 Irradiación, 213 Irradiancia, 213 Isótopos, para diagnosis, 404 ITER, 372 Kirchhoff, Leyes de, 50 Láser, 267 Lentes, 320 de índice de refracción variable, 317 delgadas, ecuación de las, 322 Ley de Ampère, 191 Ampère-Maxwell, 191 Beer-Lambert, 217 Biot-Savart, 167 Coulomb, 3 del cuadrado de la distancia, 216
Glosario
Faraday, 188 Gauss, 187 Lenz, 189 Malus, 247 Ohm, 43 Snell, 252 Límite de radiación ambiente, 403 de resolución, 328 Líneas de campo, 8 Localización acústica, 280 Loligo pealei, 94 Longitud de onda, 210 de ondas electromagnéticas, 239 de semiatenuación, 390 del sonido, 294 Lorentz, Fuerza de, 162 Lupa Aumento angular, 324 Lyman, Serie de, 408 Magnetón de Bohr, 175 Malus, Ley de, 248 Marcadores fluorescentes, 278, 336 Marcapasos, 136 Matthiessen, Regla de, 316 Mezcla racémica, 248 Mho (unidad), 44 Microscopio compuesto, 326 simple, 324 Microscopio de campo cercano (SNOM), 334 de contraste de fase, 338 de efecto túnel, 366 de fluorescencia, 336 electrónico, 332 Mielina, 24, 105 Miope, 312
423
424
Fundamentos físicos de los procesos biológicos
Modelo atómico, 350 Momento dipolar eléctrico, 9 dipolar magnético, 160, 175 Monocromaticidad, 267 Movilidad, 41 Nautilus, 303 Nernst Potencial de, 73 Neurotoxinas, 99 Neurotransmisores, 130 Neutrón, 351 Nodo auriculoventricular (AV), 136 de Ranvier, 91, 125 sinoauricular (SA), 136 Núcleo atómico, 351, 369 radiactivo, 375 Nucleido, 369 Nucleón, 369 Número atómico, 369 másico, 369 Objetivo de microscopio, 326 de inmersión, 331 Ocular, 326 Oersted, H.C., 153 Ohm, Ley de, 43 Ohmio (Unidad), 43 Oído humano, 287 Ondas, 205 Óptica geométrica Criterio de signos en, 306 Órgano de Corti, 292 Ozono, 219
Glosario
Paleomagnetismo, 180 Par de fuerzas sobre una espira, 158 Paramagnetismo, 176 Parámetro espacial, 111 Paraxial, aproximación, 305 Partícula alfa, 379, 387 Paschen, Serie de, 408 Peces eléctricos, 28 Percepción del color, 312 Permeabilidad magnética del vacío, 167, 193 Permeabilidad iónica, 82 Periodo, 210 Permitividad dieléctrica del vacío, 4, 194 Planck Constante de, 238, 349 Planck-Einstein, Relación de, 349 Plano de incidencia, 250 Plantas C-3 y C-4, 166 Polarímetro, 249 Polarización, 245 Polarizador, 298 Poder de resolución Criterio de Rayleigh, 274 del microscopio, 329 del ojo, 328 Potasio Bomba de sodio-potasio, 90 Canales de, 130 Permeabilidad de la membrana, 89 Potencial de reposo, 77 Potencia de una lente, 321 Potencial eléctrico, 17 electrotónico, 112 de acción, 95 de Nernst, 75 de reposo, 87
425
426 umbral de disparo, 96 Potenciales estándar, 192 Presión Onda de, 226 Principio de superposición, 264 Prisma, 253 Propagación de ondas, 205 Propiedades eléctricas del axón con mielina, 105 sin mielina, 103 Protón, 351 Punto ciego, 309 próximo, 310 Pupila, 308 Rad (Unidad), 391 Radiación cosmológica de fondo, 348 de frenado, 243 electromagnética, 235 ionizante, 387 Radioactividad alfa, 379 artificial, 395 beta, 379 gamma, 381 natural, 393 Radioterapia, 403 Radón, 394 Ranvier, Nodo de 94, 125 Rayleigh Dispersión, 221 Criterio de, 274 Rayo y frente de ondas, 214 Reacción en cadena, 376 Reactor nuclear, 378 Red de difracción, 276
Fundamentos físicos de los procesos biológicos
Glosario
Reflexión Ángulo de, 250 total, 254 Reflectancia, 259 Refracción, 249 Regla de Matthiessen, 316 Relación de de Broglie, 357 de Planck-Einstein, 349 Rem (Unidad), 391 Resistencia eléctrica, 43 de un conductor cilíndrico, 44 del axón, 104 equivalente de combinación en serie, 52 en paralelo, 53 interna de una batería, 50 Resistividad Dependencia con la temperatura, 46 Modelo microscópico de la, 43 Resolución del ojo, 328 del microscopio, 329 Resonancia magnética nuclear (RMN), 200 Retina, 312 Rutherford, E., 350 Scattering, 217 Sección eficaz de absorción, 218 Selector de velocidades, 163 Semiconductor, 45 Semivida, 381 Siemens (Unidad), 44 Sievert (Unidad), 392 Sinapsis, 129 Sistema Internacional de Unidades, 194 Snell, Ley de, 251 Sodio Bomba de sodio-potasio, 90
427
428
Fundamentos físicos de los procesos biológicos
Canales de, 130 Permeabilidad de la membrana, 84 Potencial de reposo, 77 Solenoide, 170 SOFAR, 258 SONAR, 234 Sonido, 225 Espectro, 226 Intensidad, 227 Naturaleza, 226 Velocidad, 230 Sonoridad, 228 SQUID, 185 Supernova, 374 Superposición, Principio de, 264 Tapetum lucidum, 316 Taquicardia, 146 Tesla (Unidad), 155 Tetradontidae, 100 Tetrodotoxina, 100 Thomson J.J. Modelo atómico de, 350 Tiempo, Constante de, 55, 381 Tierra, Campo magnético, 177 Tomografía Axial Computerizada (TAC), 404 Transferencia lineal de energía (LET), 387 Transmitancia, 259 Triángulo de Einthoven, 141 Ultrasonidos, 226, 233 Umbral de audición, 229 de dolor, 229 Ultravioleta (UV), 242 Unidad de masa atómica (u.m.a.), 368 Uranio cadena de desintegración, 406 enriquecido, 376 isótopos, 370, 375
Glosario
Velocidad de propagación de una onda, 210 de propagación del impulso nervioso, 121 de la luz, 193, 236 del sonido, 230 Vieira Pecten, 316 Visión diurna y nocturna, 313 Volta Alessandro, 64 Voltio (Unidad), 19 Von Békésy G., 291 Watson J.D., 278 Weber (Unidad), 187 Wilkins M.H.F., 278 Zernike, Frits, 338
429