mint primerek és az első primerhármas egyes tagjai mint tesztfények között (Wandell 1995). Mit is jelent ez? Legyenek a T első oszlopában szereplő intenzitásértékek i, j, k. T olyan, hogy ekkor ip\ + jp’2 + kp’3 színben egyezni fogpt-gyel. Hasonlóképpen, T második oszlopának értékei egyezést érnek el p2 és
között, stb. A csapok érzékenységi görbéi maguk is egyetlen lineáris transzformációval átalakítha- tóak színegyezési függvényekké. Baylor, Nunn és Schnapf (1987) makákómajmok egyedi csapjainak érzékenységét mérték in vitro mikroelektródás módszerrel, és a kapott görbéket a humán kísérletekből származó színegyezési függvényekkel megegyezőnek találták.
2.2. Fizikai színkeverés A színek keverésének megértéséhez szét kell választani egyrészt a fizikai ingerek keverését (fizikai színkeverés), másrészt az észlelési mechanizmusunk működéséből következő színkeveredési jelenségeket (ezt
74 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
szokták pszichológiai színkeverésnek is hívni). Itt most a fizikai színkeverés két altípusát ismertetjük röviden. A pszichológiai szint megértéséhez azonban először meg kell ismernünk a színek természetét és a színelméleteket. A fizikai színkeverés és jó néhány további jelenség megértéséhez be kell vezetnünk még egy fogalmat: ez a felületi visszaverődés (reflektancia). A legtöbb tárgy nem bocsát ki fényt, mégis van színük; ez annak köszönhető, hogy a beeső fényt sajátos, szelektív módon verik vissza. Azok a tárgyak, melyeket normál megvilágítás mellett pirosnak látunk, a 600 és 700 nm közötti tartományban a beeső fény nagy részét visszaverik, míg 400 és 600 nm között szinte a teljes beeső fénymennyiséget elnyelik. A sárga tárgyak nagyjából 500 és 700 nm között vernek vissza sok fényt, alatta alig valamit. A kék felületek 400 és 500 nm között verik vissza a legtöbb fényt, 500 nm fölött már ennek csak töredékét. A 4.6. ábra néhány jellegzetes felület visszaverődési, azaz reflektanciajellemzőit szemlélteti. A felületi reflektanciát a hullámhossz függvényében százalékban (a beeső fénymennyiség százalékában) szokás kifejezni.
4.6. ábra. Felületi reflektanciagörbék A fizikai színkeverésnek két fajtája van: az additív és a szubtraktív keverés. Az additív (összeadó) keverés fényforrások fényének összeadódása. Ha például egy fehér vetítővászonra (mely minden beeső hullámhosszat közel száz százalékban visszaver) egy vetítőből piros fény vetül, egy másikból pedig ugyanoda zöld fény, akkor a két egymásra vetülő fényt sárgának fogjuk látni. Ez azért van, mert a zöld fények spektrális energiaeloszlásának csúcsa 500 és 600 nm között van, míg a piros fényeké 600 nm körül vagy a fölött. Vetítővásznunk tehát egyszerre fogja e két tartományt visszaverni, s az eredmény sárga színű összetett fény lesz. Matematikailag ezt a két spektrális energiaeloszlás összegeként fejezzük ki, innen az additív jelző. Ha egy harmadik vetítőből kék fényt is vetítünk a vászonra, az eredmény fehérnek fog látszani (a kék fények energiaeloszlásának csúcsa 400 és 500 nm között van). Szubtraktív (kivonó) színkeverés festékek keverésekor, illetve színszűrők kombinálásakor áll elő. A festékek, illetve színszűrők, mint láttuk, szelektíven verik vissza, illetve eresztik át a fényt. A színszűrés miatt bekövetkező szubtraktív színkeverés egyik gyakorlati példája akár veszélyforrás is lehet. Az autók szélvédőjének felső sávjában elhelyezett zöld színszűrő sávon átnézve a magasan elhelyezett közlekedési lámpa piros színét sötétnek, csaknem feketének látjuk. A szubtraktív színkeverés egy másik, mindenki számára jól ismert esete a kék és sárga festékek összekeverése, ami gyakran zöld színt eredményez. Mint az előbb láttuk, kék és sárga fények additív keverése fehér színt ad (illetve a keverési arányoktól függően halványabb kéket vagy sárgát), de zöldet sohasem. A 4.7. ábra segít megérteni e jelenséget.
75 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
4.7. ábra. Kék és sárga festékek keverése zöld színt eredményez, s ennek a felületi reflektanciagörbék módosulása az alapja A festékek, akárcsak a színes üvegek (színszűrők), egymást szűrik. A 4.7. ábrán látható, hogy a sárga felszín fölül áteresztő szűrőként kb. 500 nm-es vágási szinttel működik, a kék festék pedig alul áteresztő szűrőként, 540 nm körüli vágási szinttel. Ha a két szűrési hatást kombináljuk, a kék szűrő a spektrum felső végén, a sárga pedig az alsó, rövid hullámú tartományban nyeli el a beeső fényt. Középen marad azonban egy sáv, melyben mindkettő viszonylag sok fényt ver vissza. Így a zöld színre jellemző felületi reflektancia áll elő. E szubtraktív mechanizmus matematikailag a két szűrőhatás szorzásával fejezhető ki, ahol a felületi reflektanciát a [0-1] tartományban skálázzuk. Ez azonban még nem egészen pontos megfogalmazás. Van ugyanis egy lényeges különbség a színes üvegek, illetve festékek kombinálása között. Ha egy sárga és egy kék üveglapot helyezünk egymás mögé, akkor az eredmény zöld lesz, de sokkal sötétebb zöld, mint amikor üveglapjainknak megfelelő színű sárga és zöld festéket keverünk egymással. Ennek az az oka, hogy keveréskor a festékek kölcsönösen hígítják egymást; ezt úgy modellezhetjük, hogy mindkettő felületi reflektanciája minden ponton kicsit közelebb kerül az 1-hez (100 százalék). E hígítási tényezőt figyelembe véve kell ezután összeszorozni a komponensek (festékek) reflektan- ciáit. Színes üveglapok esetében a kölcsönös hígítás jelenségét úgy idézhetjük elő, hogy egymás mögé helyezés előtt az üveglapok mindegyikét vékonyabbra csiszoljuk. (Gondoljunk a vörösbor esetére: vékony rétege egy karcsú talpas pohárban rózsaszínű, míg egy ötliteres üvegdemizsonban a színe igen közel áll a feketéhez – lényegében semmi fényt nem ereszt át.)
4.8. ábra. A színtévesztés típusai. a) Protanomália: 1. gyengébb piros-zöld megkülönböztetés, 2. kisebb érzékenység a vörös tartományra. b) Deuteranomália: 1. gyengébb piros-zöld megkülönböztetés, 2. kisebb érzékenység a zöld tartományra. c) Tritanomália: 1. a sárga-kék megkülönböztetés csökkent, 2. a rövid hullámhossztartományra való érzékenység is csökkent
2.3. Az átlagtól eltérő színlátás: színtévesztés, illetve tetrakromázia A színtévesztés és az átlagosnál jobb színlátás (ezen most az úgynevezett tetrakromát színlátást értjük, lásd alább) hátterében egyaránt a csappigmentek érzékenységi görbéinek örökletes egyéni változásai állnak. A színlátás sérülése lehetséges normál csappigmentek mellett is. Ennek olyan, az idegrendszer magasabb szintjein keresendő okai vannak, amelyekről később ejtünk majd szót. Tetrakromát színlátás viszont nem lehetséges a megfelelő érzékenységet megalapozó csappigmentek nélkül. Színtévesztés esetén a különböző csappigmentek 76 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
érzékenységi tartományai a normálisnál jobban átfednek, közelebb vannak egymáshoz. A humán tetrakromát színlátás viszonylag ritka eseteiben viszont megjelenik egy olyan negyedik típus is, amelynek érzékenysége legtöbbször csak minimális mértékben különbözik a H vagy a K csapétól. Először a színtévesztés jelenségét tekintjük röviden át. A színtévesztés eseteit aszerint csoportosítjuk, hogy mely csappigment érintett bennük. Protán zavarról beszélünk akkor, ha a H csapok érzékenysége a rövidebb hullámhosszak felé, a zöld csappigmentéhez közelebb „csúszott” (4.8. ábra). Ha a H és K pigmentgörbe mindazonáltal nem esik teljesen egybe, akkor az összecsúszás mértékétől függő súlyos- ságú protanomáliáról beszélünk. Ennek határesete, ha a két görbe gyakorlatilag egybeesik, ezt protanópiának nevezik. Deután zavar akkor áll elő, ha a K csappigment érzékenységi görbéje csúszik el a hosszabb hullámtartomány, tehát a H pigment érzékenysége felé. Ezt deuteranomáliának nevezik, illetve a teljes egybeesést deuteranópiának. Pro- tán és deután zavar esetén egyaránt leromlik a megkülönböztetés a pirosak, illetve a zöldek között, azonban a protán zavarok esetében ez a hosszú hullámú fények észlelési küszöbének emelkedésével jár együtt, míg a deutánok épp a spektrum közepe tájára eső hullámhosszakat látják gyengébben. A színtévesztés harmadik csoportja úgy áll elő, hogy az R csapok érzékenysége csúszik fölfelé, a másik két csoporthoz közelebb. Ezt tritán zavarnak hívjuk, s ez is öltheti a tritanomália, illetve – az R csapok hiánya esetén – a tritanópia formáját. A színtévesztés vizsgálata többféle módszerrel történhet. A legismertebbek ezek közül az úgynevezett pszeudoizokromatikus táblák (4.9. ábra). Egy ilyen tesztet tartalmaz magyar kísérőszöveggel Velhagen és Broschmann (1992) könyve. E módszer lényege, hogy változó világosságú és színű pöttyök alkotnak egy figura-háttér egységet (a figura rendszerint egy betű, számjegy vagy ezek kombinációja). A pöttyök világosságeloszlása azonos a figurában és a háttérben, téri elrendeződésük pedig random. Így a figurát és a hátteret csak színárnyalatuk különíti el egymástól. Az árnyalatkülönbség fennállhat a kék-sárga vagy pedig a zöld-piros dimenzió mentén. Tritán személyek ennek megfelelően a kék-sárga kontrasztú figurákat nem látják, míg protán és deután személyek a zöld-piros kontrasztot. A zöld-piros színtévesztő csoporton belül a szürkés háttéren pirosas pöttyökből álló ábra inkább a protánoknak jelent problémát. A deutánokat ez kevésbé zavarja, mivel utóbbiak a vöröses árnyalatot a szürkétől jobban el tudják különíteni (hiszen vörösérzékenységük jobban megtartott). Ugyanakkor a halványzöld háttéren rózsaszín pöttyökből álló ábrákat a deutánok látják gyengébben, s a protánok valamivel jobban, mivel ez esetben a protánok inkább képesek a háttér zöldes színe alapján felismerni a figurát, míg a deutánok számára ez a kritikus színtartomány (enyhe piros-zöld kontraszt), ahol a leginkább leromlott a színmegkülönböztető képességük.
4.9. ábra. Egy színlátást vizsgáló teszttábla (pszeudo-izokromatikus tábla), ahogy a normál színlátók látják (a), és ahogy egy zöld-piros színtévesztõ látja (b) A színtévesztés pontos diagnózisát azonban több módszer együttes alkalmazására lehet csak alapozni. Több más teszt mellett erre a célra az anomaloszkóp elnevezésű műszert használják. Ennek használatakor a személy vörös, illetve zöld primer fényekből kever ki egy sárga tesztfényt. Az egyezési tartomány tulajdonságaiból (elhelyezkedés, szélesség, a sárga tesztfény intenzitása egyezéskor) lehet következtetni a színtétesztés típusára. A színtévesztéssel szemben a tetrakromázia az átlagosnál kismértékben jobb színlátást eredményez, noha a kétféle állapot genetikai eredete közös. Az H és K csapok génje egyaránt nemhez kötötten öröklődik, tehát az Xkromoszómán találhatók. (Az R csapok ezzel szemben autoszomálisan öröklődnek.) Ezért nőknél, ahol két Xkromoszóma van, ritkább a színtévesztés, mint férfiaknál, ahol csak egy. Ha ugyanis az egyik X-kromoszóma a normálistól eltérő érzékenységű H vagy K csappigmentet kódol, a másik viszont a megfelelőt, akkor még mindig előállhat – és legtöbbször elő is áll – a megfelelő színdiszkriminációs képesség. Férfiaknál viszont, ha az egyetlen H vagy K gén nem az optimális érzékenységet kódolja, már biztosan megjelenik a színtévesztés. Általánosságban, ha egy nő heterozigóta mondjuk a H csappigment génjére, akkor a retinafejlődés embrionális 77 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
(anyaméhen belüli) szakaszában legtöbbször az egyik génváltozat (allél) kifejeződése gátlódik, és tri- kromát színlátás alakul ki. Időnként azonban előfordul, hogy a gátlódás mozaikszerű: a retina egyes foltjain a normál, másokon pedig egy kissé eltérő érzékenységű pigmentvariáns jelenik meg, s így a retina egészében már négyféle csappigment található (4.10. ábra; Jordan-Mollon 1993). A négyféle csappigment megléte mellett kérdés az is, hogy vajon látórendszerünk képes-e mind a négy csaposztály válaszait megkülönböztetni egymástól. Ha ugyanis nem, akkor sok előny nem származik a megkettőződött csappigmentből. Egyes vizsgálatok eredményei alapján (Jordan-Mollon 1993, Nagy et al. 1981) mégis érdemes megkülönböztetni kétféle tetrakromát színlátást. Rejtett tetrakromázia esetén, bár jelen van a négyféle csaposztály, a látórendszer a két leghasonlóbbat nem különbözteti meg. Ez az eset, úgy tűnik, mégiscsak felismerhető, méghozzá az alapján, hogy a színingerek szuperpozíciója nem áll fenn ilyen személyeknél (Nagy et al. 1981). Allen Nagy és munkatársai zöld-piros színtévesztő férfiak anyáit vizsgálták (ők biztosan hete- rozigóták vagy a H, vagy a K génre). A személyeknek egy sárga tesztfény és egy zöld-piros primerkeverék között kellett egyezést beállítaniuk. Ezután mindkét oldalhoz hozzákevertek egy háttérfényt (kéket vagy pirosat – mindkét oldalhoz ugyanazt), és ekkor kellett megismételniük az egyezés beállítását. Az additivitás (szuperpozíció) fennállásakor a háttér nem változtathatja meg a keverési arányokat. Valamennyi férfi kísérleti személy és 21-ből 17 nő ilyen eredményt adott. Négy heterozigóta személynél azonban a háttér hozzáadása más keverési arányokat eredményezett, rejtett tetrakromáziát jelezve.
4.10. ábra. Egy jellegzetes tetrakromát csapérzékenységi mintázat, mely a H csapok két variánsának jelenlétét mutatja. Látható, hogy a két H variáns fotopigment-érzékenysége közötti különbség igen kicsi Kifejezett tetrakromázia esetén agyunk képes feldolgozni mind a négy csaposztály jelének különbségeit. Ez az állapot már megmutatkozhat a trikromát színegyezések elutasításában, illetve a személy gazdagabb színkategória-rendszerében is. Mindazonáltal ezek a személyek sem különböznek feltűnő mértékben a trikromátoktól. Mint Jameson és munkatársai (2001) megjegyzik, a legvalószínűbb az, hogy a negyedik fotopigment – még ha jeleit el is különíti az idegrendszer a másik hárométól – nem okoz alapvető változást színlátásunk dimenzióiban. Valószínűbb, hogy összetett színes ábráknál, kontextushatások megléte esetén a negyedik receptorosztály jelei növelik a diszkriminációs képességet, a színkontrasztok észlelési hatékonyságát, noha a színlátás ugyanazon alapvető kategóriákban mozog, mint a trikromátoké. A tetrakromát színlátás számos alapvető kérdése ma még vizsgálatra vár, és gyanítható az is, hogy a kifejezett tetrakromát személyek, noha nincsenek sokan, mégis nagy egyéni eltéréseket mutatnak, tehát nehéz lesz általánosításokat megfogalmazni erre a csoportra nézve.
3. A színek észlelése: az ellenszínelmélet A színlátásról eddig leírtak különös vonása, hogy az agyról, a látórendszerről, az idegi feldolgozásról nincs bennük szó (vagy csak az említés szintjén). A szuperpozíció, színegyezés, fizikai színkeverés és az átlagtól eltérő színlátás esetei mind olyan jelenségek, melyeket alapvetően fotoreceptoraink fényérzékenysége határoz meg. A továbbiakban viszont már a színlátás agyi mechanizmusait, valamint a látott színek észlelési struktúráját tárgyaljuk.
3.1. A színek észlelésével kapcsolatos alapvető jelenségek Az emberi színlátásnak számos olyan vonása van, amely független annak háromszín-jel- legétől, nem következik abból. Sőt ezek a vonások olyanok, hogy legtöbbjüket egy laikus, de elmélyült megfigyelő is felismerheti. A látott színek vagy színélmények szerveződése már az idegrendszer működésén alapul (nem 78 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
csupán a csapok érzékenységén), és olyanperceptuális struktúrákat eredményez, amelyek magyarázata a látáskutatás legnagyobbjainak is sokáig fejtörést okozott. A következő jelenségekről van szó. Az észlelt színeket általában három dimenzió mentén jellemezzük: ezek a színárnyalat, a telítettség és a világosság. A tiszta ég színe telítetlen és világoskék; a hagyományos írótinta színe viszont telített sötétkék. Hasonló a különbség az éretlen, illetve az érett cseresznye piros színe között. E három dimenzió segítségével már jellemezni lehet az úgynevezett színhasonlósági teret, amely a látott színek perceptuális szerveződését írja le. A három dimenzió a naiv megfigyelők számára is jól felismerhető, megérthető. Sőt az ezen dimenziókat alkalmazó kísérleti helyzetekben az ugyancsak naiv személyek megbízhatóan osztályozzák a látott színeket. Erre alapozható a színhasonlósági tér empirikus vizsgálata (4.11. ábra; Sternheim-Boynton 1966, Izmailov-Sokolov 1991, Sivik 1997).
5.2. táblázat A SZÍNTÉVESZTÉS KORREKCIÓJA Az utóbbi években a színtévesztés számos esete vált szemüveg segítségével javíthatóvá. A többféle módszer közül talán legeredményesebb a Wenzel Klára és Abrahám György által kifejlesztett szűrőrendszer (Wenzel et al. 2000). Ezzel a módszerrel a protanomália és a deuteranomália esetei kezelhetők, amelyek az összes színtévesztés túlnyomó többségét teszik ki. A módszer lényege olyan áteresztési profilú szűrők alkalmazása, melyek az egymáshoz túl közel lévő H és K érzékenységi görbéket távolítják egymástól. Az eljárás részleteit az ábra szemlélteti. Ha ismert egy normál és egy anomáliás fotopigment érzékenységi görbéje is (jelöljük ezeket n-nel, illetve a-val), akkor a normál görbe (n) értékeit minden egyes hullámhosszon elosztva az anomáliás görbe (a) megfelelő értékeivel, kapunk egy harmadik görbét (legyen ez a h görbe). Ha ezután olyan szűrőt készítünk, amelynek áteresztőképessége épp ezzel a h görbével jellemezhető, és ezt szemüvegként alkalmazzuk egy olyan személynél, akinek éppen az a-val jellemezhető anomáliás fotopigmentje van, akkor ez a szemüveg tökéletesen korrigálni fogja ennek a fotopigmentnek az érzékenységét. (Ha n/a = h, akkor a x h = n, minden egyes hullámhosszra.) Eddig rendben is van, hiszen mind a normál, mind az anomáliás fotopigmentek elnyelési görbéiről rendelkezünk adatokkal (pl. Stockman et al. 1993, Wyszecki-Stiles 2000, DeMarco et al. 1992). Megjegyzendő, hogy ha a hányados (h) görbe 1-nél nagyobb értékeket tartalmaz, akkor 1-re kell normálni, hiszen olyan szűrőt, ami a beesőnél több fényt ereszt át egy adott hullámhosszon, nem lehet készíteni. A normálással olyan h' görbét kapunk, amellyel transzformálva az a görbét, nem pont az n görbét kapjuk vissza, hanem annak egy 1-gyel kisebb számmal való szorzatát. Ez azonban nem gond, mert a látórendszer kitűnően adaptálódik egy ilyen, kissé csökkent érzékenységhez (mindhárom csaposztállyal ez történik, amikor fölteszünk egy napszemüveget).
Ezzel azonban még nem oldottuk meg a színtévesztés korrekcióját, hiszen a h' szűrő a retinában lévő másik két fotopigment fényelnyelését is befolyásolni fogja, méghozzá eddig ellenőrizetlen módon. Olyan szűrőt kell tehát konstruálnunk, amely – mint az ábra mutatja – a H csap érzékenységét kissé fölfelé, a K csapét pedig lefelé (a rövidebb hullámhosszak irányába) tolja el, az R csapokat pedig lényegében nem befolyásolja. Wenzel Klára és Abrahám György szűrőkészlete éppen ezeket a feltételeket teljesíti, s ezáltal alkalmas a zöld-piros színtévesztés különböző típusainak korrekciójára. Egy tipikus szűrőprofil látható az ábra jobb oldali grafikonján. A 79 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
készletből megfelelően választott szemüveggel a színtévesztők 72 százaléka legalább tíz táblával többet tud elolvasni a pszeudoizokromatikus teszteken, mint szemüveg nélkül (e tesztek mintegy húsz táblát tartalmaznak). A kezelt személyek 65 százaléka szemüveggel normál teljesítményt nyújt a pszeudoizokromatikus táblákon. Egy érdekes, az észlelési élmény szintjén megragadható hozama a korrekciónak, hogy a szemüveget viselő személyek ténylegesen úgy érezték, hogy a világ szebb, színekben gazdagabb lett. A három dimenzió közül a telítettség és a világosság lineárisak: a színhasonlósági tér világosságtengelye a fehértől a szürke árnyalatokon át a feketéig terjed, míg a telítettség minden színárnyalat esetén egy maximumértéktől a szürke valamely árnyalatáig (nulla telítettség) változik. A spektrális (monokromatikus) fények színe a legtelítettebb (ilyen például egy vörös lézer), a kevert, szélesebb spektrumú fények színe már kevésbé. Ha egy adott színű, például piros festékhez fokozatosan egyre több fehéret adunk, akkor egyre telítetlenebb világos színeket kapunk (ezeket pasztellszíneknek is nevezik). Ha piros festékünket egyre növekvő mennyiségű szürkével (vagy feketével) keverjük, az eredmény egyre telítetlenebb sötét színek sorozata lesz. (A szürke árnyalatait, valamint a fehéret és a feketét együtt szokás akromatikus színeknek is nevezni, a többi árnyalatot pedig összefoglaló névvel kromatikus színeknek.)
4.11. ábra. A színhasonlósági tér egyik sztenderd változata (az ún. CI ELA B tér) diagramja A harmadik, az árnyalatdimenzió azonban nem lineáris, hanem körkörös. A színkör színárnyalatainak azért nincs értelmezhető minimuma és maximuma, mert a látható spektrum két végének színe, az ibolya és a vörös meglehetősen hasonlóak, de legalábbis hasonlóbbnak tűnnek egymáshoz, mint a spektrum középső részének színeihez (a kékeszöld, zöld, sárgászöld, sárga és a narancs árnyalataihoz ). Azok a színek pedig, amelyek monokromatikus fényekkel nem állíthatóak elő (ilyen a lila színek tartománya), átvezetést képeznek a látható spektrum két végének színe között. A lila színek az ibolyánál vörösesebbek, a pirosnál/vörösnél pedig kékesebbek. összességében tehát a színhasonlósági tér jól jellemezhető két lineáris és egy körkörös (polár-) dimenzióval. További komplikációt jelent azonban a látható színek ellenszín-szerveződése. A színárnyalatok egyes párjai olyanok, hogy a megfelelő arányban keverve őket, kioltják egymás kromatikus összetevőjét, s az eredmény valamely szürke árnyalat lesz. A vörös és a zöld ilyen ellenszínpárok, ugyanígy a kék és a sárga is. Minden kromatikus színnek van ellen- színpárja: a narancsszíneké a kékeszöld tartományba, a liláké a sárgászöld tartományba esik. A színhasonlósági tér alapvető tulajdonsága a tiszta színek, illetve a keverék színek elkülönülése is. Más néven ez a pszichológiai színkeverés jelensége, amely tehát a fizikai színkeveréstől különbözik. Négy olyan kromatikus árnyalat van, amelyek nem tűnnek számunkra más kromatikus árnyalatok keverékének: ezek a piros, a zöld, a sárga és a kék. A többi kromatikus árnyalat e négy alapszínből kettő valamiféle keverékének tűnik. A narancssárga színek egyszerre kissé vörösesek és sárgásak is; a lilák egyszerre kékesek és vörösesek. A sárgászöld tartomány neve is jelzi, hogy ezek a színek egyszerre „rokonai” a sárgának és a zöldnek is; hasonló a helyzet a kékeszöld tartománnyal. Az eddigiekből következik, hogy a tiszta ellenszínek – piros és zöld, illetve sárga és kék – nem alkotnak keverék színeket, pszichológiai szinten nem keverednek egymással. Soha nem látunk vöröseszöld vagy kékessárga színeket. Erre valaki azt az ellenérvet hozhatná föl, hogy dehogynem, hiszen a zöld például a kék és a sárga 80 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
keveréke, esetleg a kékessárga szín nem más, mint a zöld. (S eszerint akkor csak három tiszta szín lenne.) E kérdés megválaszolásához alapos empirikus vizsgálatok adatai segítenek hozzá, melyek cáfolni látszanak ezt az ellenvetést. Sternheim és Boynton (1966), Miller (1997) és mások eredményei szerint a személyek például akkor tudják jól leírni, megfelelően megnevezni; valamennyi kromatikus színt, ha a négy kromatikus alapszín nevét használhatják. Ha e négyből valamelyiket letiltották, akkor a kísérleti személyek nem tudtak minden bemutatott színt megfelelően leírni. Más szóval, a színmegnevezési vizsgálatokból kitűnt egy aszimmetria: a narancssárga például jól leírható a személyek számára vörösessárgaként (vagy sárgásvörösként), a vörös viszont nem írható le mondjuk narancssárgás lilaként. Bizonyos narancssárga és lila fényeketfizikailag keverve ugyan kaphatunk vöröset (amely sem nem kékes, sem nem sárgás), mégis, pszichológiai szinten a vörös észlelete nem keveréke a narancssárgának és a lilának. E megfigyelések arra utalnak, hogy a zöld, ugyanúgy, mint a piros, a kék és a sárga, alapszín (tiszta szín). Ezt támasztja alá az a megfigyelés is, hogy kék és sárga festéket fizikailag keverve az arányoktól függően létrehozható sárgászöld (sok sárga és kevés kék festék eredményeként), kékeszöld (sok kék, kevés sárga), valamint olyan zöld is, amely sem nem kékes, sem nem sárgás, hanem csak zöld. A zöld tehát csak fizikai szinten keveréke a kéknek és a sárgának, pszichológiai szinten azonban független tőlük.
3.2. Az ellenszínelmélet Az ellenszínek jelenségét, illetve a színek pszichológiai keveredését először Ewald Hering írta le a 19. században (Hurvich 1969). Ugyanakkor magyarázatuk a kor legnagyobbjainak is gondot okozott (Young 1802, Helmholtz 1911). Ezek a magyarázati próbálkozások számos ponton nem voltak kielégítőek (Hurvich 1981). Az ellenszínelmélet mai formáját Dorothea Jameson és Leo Hurvich dolgozta ki (Hurvich-Jameson 1955, JamesonHurvich 1 955, 1 968). E modell és to vábbf elj le szte tt változatai (pl. Werner-Wooten 1979, Hunt 1982) már számot adnak a fent leírt jelenségekről. E modellt más tankönyvekhez hasonlóan itt is egyszerűsített formában mutatjuk be, elhagyva bizonyos matematikai részleteket. A 4.12. ábra az egyszerűsített ellenszínelmélet szerkezetét mutatja be. A modell feltevése szerint a látórendszer a csapok kimeneteiből különbségeket számolva hozza létre a színhasonlósági tér dimenzióit. A H és K csapok jelének különbsége (ezt H – K-val jelöljük) adja a piros-zöld jelet. ha a H csapok kimenete a retina adott pontján nagyobb, mint a K csapoké (azaz H – K > 0), a piros érzéklet jön létre. A H – K < 0 viszont a zöld érzékletéhez vezet. A H = K esetében sem piros, sem zöld érzéklet nem származik a retina adott pontjáról. Ebből rögtön következik, hogy zöldespiros érzéklet nem állhat elő, s mint láttuk, ez így is van. A sárga-kék érzékletpár viszont az R – (H + K) receptor- válasz-kombinációból áll elő. Ha H + K = R, akkor sárga színérzéklet keletkezik, míg ha H + K < R, akkor kék érzéklet. H + K = R esetén sem sárgás, sem kékes nem lesz az eredő érzéklet. Ebből az is következik, hogy a modell nem engedi a sárga és a kék érzékletek keveredését. A harmadik lineáris kombináció, amit a látórendszer a csapválaszokból képez, a H és K csapok jelének összege (H + K). Ez a színérzéklet világosságának felel meg. A 4.13. ábra a színhasonlósági tér eme „újradimenzionált” változatát mutatja be. A körkörös színárnyalat-dimenziót most a két opponens kromatikus dimenzióval helyettesítettük; a világosságdimenzió maradt, és a telítettség is, noha itt nincs nyíltan megnevezve. Az ábrán középen látható színkörön a periféria felé találjuk a legtelítettebb színeket, s a középpont (a világosságtengely) felé pedig az egyre kevésbé telítetteket (lásd a 4.11. ábrát is). Ez a viszonylag egyszerű modell, ha végiggondoljuk, valamennyi fönt leírt jelenséget magyarázni képes. Ha H = K és H + K = R, akkor akromatikus (fehér, szürke vagy fekete) színérzet keletkezik, a H + K értéktől függően. Ha a két egyensúlyból csak az egyik áll fenn, akkor tiszta szín érzéklete keletkezik, ha mindkét kromatikus dimenzió értéke eltér a nullától, akkor kevert szín érzéklete jön létre. Utóbbiaknak négy nagy csoportjuk van: a narancssárgák (vörösessárga), a lilák (kékesvörös), illetve a sárgászöldek s a kékeszöldek csoportja. Mindegyik ilyen csoportba számtalan árnyalat tartozik, a két kromatikus komponens, illetve a telítettség fokától függően. Ha például a retina egy pontján keletkező csapválaszok alapján H – K erősen pozitív (piros érzet), H + K is nagy (világos színérzet), valamint R – (H + K) « H – K, tehát nagyjából ugyanolyan erős a kék komponens is, mint a piros, akkor a bíborszín érzéklete az eredő – bíborszínnek a nagyjából azonos mértékben kékes és vöröses, ugyanakkor telített színeket hívjuk. Ugyanakkor, ha H + K nagy (világos színérzet), ám (H – K)/(H + K) egy kisebb pozitív érték (azaz egy gyengébb piros jel áll fenn), s ehhez egy még gyengébb kék jel társul (R – H – K)/(H + K) < (H – K)/(H + K), akkor rózsaszín érzéklet az eredő (telítetlen, világos, enyhén kékesvörös).
81 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
4.12. ábra. Az egyszerûsített ellenszínelmélet
4.13. ábra. A színhasonlósági tér az ellenszín-dimenziókkal reprezentálva Amellett, hogy ez a modell számos jelenséget megmagyaráz, egy fejlődőben lévő elmélet is egyben, mely számos kérdést vet föl a kutatás számára. Lezárásképpen néhány ilyen alapkérdést ismertetünk.
3.2.1. A kontrasztszínek problémája A két legjellegzetesebb kontrasztszín a barna és a fekete. A barna szín igen különbözőnek tűnik az eddig említett színkategóriáktól, s még az sem világos, hogy vajon tiszta színnek vagy keverék színnek kell-e tekinteni. Józan ésszel meggondolva akár alapszín is lehetne, mivel meglehetősen egységesnek tűnik: például a Túró Rudi csokibevonatának jellegzetes színe nem igazán emlékeztet két másik színárnyalatra úgy, ahogyan mondjuk egy zöldessárga szövet színe egyszerre tűnik számunkra zöldesnek és sárgásnak. A barna szín ennél sokkal egységesebb. De akkor hol helyezkedik el a színhasonlósági térben? E fenomenológiai (élményszintű) probléma megválaszolásához hozzásegíthet egy mindenki által kivitelezhető kísérlet. Készítsünk egy kb. 1-1,5 centiméter átmérőjű, 10-15 centiméter hosz- szú papírcsövet, melynek a belső oldalát előzőleg sűrű fekete temperával befestettük, vagy egy darab fekete bársonnyal vontuk be. Ezután egyik szemünkkel nézzünk bele a csőbe úgy, hogy a másik végén egy tábla csoki felületének részletét lássuk, melyet erős fénnyel (például egy olvasólámpával) világítunk meg. Szemünk és a cső szemünkhöz közeli vége legyen sötétben – például csövünket dugjuk át egy darab fekete kartonon. Ha így nézünk rá a csokira – tehát lényegében kiemeljük más kromatikus színek kontextusából -, nem barnának, hanem élénk narancssárgának fogjuk látni. Ez a némiképp meglepő eredmény megmutatja, hogy a barna szín jellegében a narancssárgához áll közel. S valóban, a barna árnyalatait különböző telítettségű narancssárgák fokozatos besötétítése útján kapjuk. Bár a két színkategória, barna és narancs, elsőre nem tűnnek rokon színeknek, mégiscsak azok. Ennek megfelelően a színhasonlósági térben a barna árnyalatok a színkör narancssárga tartománya alatt, a feketék irányában helyezkednek el (lásd a 4.11. ábrát). Ezek szerint viszont a barnának összetett színnek kellene lennie az észlelés szintjén, s ennek ellenére mégiscsak egységesnek látjuk. Egyes kutatók véleménye szerint kísérleti körülmények között
82 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
kimutatható, hogy a barna mégiscsak összetett szín (Quinn et al. 1988). E megál-lapítás azonban továbbra is ellentmond a hétköznapi szemléletnek: alapesetben nem észleljük keveréknek a barna színeket. A barnát tehát azért nevezzük kontrasztszínnek, mert csakis más színek kontextusában látunk barnát, izoláltan sohasem. A hétköznapi szemlélet számára ez például abban az ismeretünkben jelenik meg, hogy „barna színű fény nincs”. Ez azonban csak annyit jelent, hogy egy koromsötét környezetben lévő egyetlen kis fényforrás fényét sohasem látjuk barnának (legfeljebb narancssárgának). Érdekes módon sokak szerint a fekete is kontrasztszín, mely csak más színek hátterében észlelhető. Ennek egy szép példája a televízió képernyője. Kikapcsolt állapotban a képernyő szürke színű, határozottan nem fekete. Azonban a bekapcsolt képernyőn minden további nélkül láthatunk feketét. Gondoljunk bele, hogy ekkor a feketének látszó felület nem tud kevesebb fényt kibocsátani, mint kikapcsolt állapotban, mégis söté- tebbnek (ti. feketének) látszik. Ennek oka a környezetében lévő sokkal élénkebb színekkel való élesebb kontraszt (Hardin 1995). Ha viszont nap süt a bekapcsolt tévé képernyőjére, a képernyő kibocsátott színei rögtön kifakulnak, s a feketék kiszürkülnek, mivel ekkor a képernyő által visszavert igen erős fény befolyásolja a kibocsátott színek megjelenését. összefoglalva, a kontrasztszínek jelenségének igen fontos üzenete az, hogy a színhasonlósági tér struktúrája, az észlelhető színek tulajdonságai nem származhatnak pusztán a föntebb leírt lineáris kombinációkból (H – K, H + K – R stb.), hanem más, ennél jóval bonyolultabb feldolgozási folyamatok is meghatározóak a színhasonlósági tér struktúrájára nézve.
3.2.2. A részletes ellenszínelmélet A fönt leírt ellenszínelmélet lényeges egyszerűsítéseket tartalmaz. Így például kérdés az is, hogy a színhasonlósági tér dimenziói valóban megkaphatóak-e a csapválaszok lineáris transzformációiból, vagy bonyolultabb az összefüggés. A pontos összefüggés bonyolultabb, és lényeges egyéni különbségeket is mutat normál színlátók között (Werner-Wooten 1979). Elsősorban a kék-sárga színdimenzió tér el a linearitástól. Ez azt jelenti, hogy a csapválaszok értékeit nemlineáris transzformációnak kell alávetni ahhoz (Werner és Wo- oten hatványfüggvényt javasolnak), hogy az észlelt kékség-sárgaság mértéke legalább egyszerű észlelési helyzetekben jósolható legyen.
3.2.3. Átfogó kritikák Az ellenszínmodellt elsősorban a négy alapszín fogalma miatt érik kemény kritikák: a kutatók egy része úgy látja, hogy az alapszín – keverék szín elkülönítés az észlelés szintjén meglehetősen ellentmondásos (JamesonD’Andrade 1997, Mollon-Jordan 1997). A színhasonlósági tér szerkezete, mint láttuk, empirikus vizsgálatokkal tárható fel, melyekben különböző módszerekkel ítéltetik meg a személyekkel a színek hasonlósági viszonyait. (Például színpárokat mutatnak, és szubjektív skálázással, mondjuk hétfokú skálán kell megítélni a hasonlóságot; vagy különbségi küszöbök segítségével skálázzák ugyancsak a hasonlóságot.) Az ilyen vizsgálatokból nemegyszer az jön ki, hogy a piros és a zöld nem foglalnak el pontosan opponens pozíciót a színtérben (a piroszöld dimenzió nem teljesen egyenes), s ugyanez igaz a sárga-kék dimenzióra. A lineáris kombináció elve abban az értelemben is sérül a színtérben, hogy két olyan fényt keverve, melyek egyike sem vált ki kékes vagy sárgás észleletet (tehát tisztán pirosak, illetve zöldek), kapható sárgás szín észlelete (Wandell 1995). Mint láttuk, a színegyezés szintjén viszonylag tág határok között fennáll a linearitás, éppen azért, mert a színegyezést a csapérzékenységi görbék határozzák meg. A színészleletek kialakulása viszont, melyben már a receptorokon túli idegrendszeri mechanizmusok játsszák az alapvető szerepet, sokkal bonyolultabb, és részben nemlineáris folyamatokon alapul.
3.3. Kromatikus válaszfüggvények és a színlátás idegrendszeri alapjai Az ellenszínelmélet empirikus kiindulópontját a színkioltás jelenségének kísérleti vizsgálata adta (JamesonHurvich 1955). Ha egy kísérleti személynek mutatunk egy fényingert, melynek színe bizonyos fokig vöröses (pl. lila, narancssárga vagy piros), akkor e vöröses összetevő kioltható zöld színű fény hozzáadásával. Személyünket tehát megkérhetjük, hogy egy szabályzóval úgy állítsa be a zöld fény erősségét, hogy az eredetileg vöröses árnyalatú fényből a vörös összetevő eltűnjön. Ekkor a keletkező fény lehet kékes, sárgás vagy fehér. (Túl kevés zöld fény hozzáadása esetén az eredmény vöröses marad, ha túl sok zöldet adunk, akkor zöldes fény lesz az eredmény.) A kioltáshoz szükséges zöld fény erősségéből következtetni lehet a vöröses árnyalatot létrehozó idegrendszeri válasz erősségére az eredeti (keverés előtti) inger esetén. Zöldes árnyalat vörös fénnyel, kékes sárgával, sárgás pedig kékkel oltható ki. Természetesen most is végigvizsgálhatjuk a teljes spektrumot abból a szempontból, hogy adott hullámhosszú fény kromatikus árnyalat-ösz- szetevői milyen színű és erejű fényekkel 83 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
olthatók ki. Például egy 590 nm-es narancssárga fénynek, mint láttuk, két kromatikus árnyalatösszetevője van: piros és sárga, s az előbbi zöld, az utóbbi pedig kék fénnyel oltható ki. A teljes spektrumot hullámhosszanként végigvizsgálva a kioltó fények színe és erőssége szerint, az úgynevezett kromatikus válaszfüggvényeket kapjuk (4.14. ábra). Vegyük észre, hogy e görbékből is egyértelműen látszik a színek opponens szerveződése: bármely hullámhossz legfeljebb két kromatikus árnyalat-összetevőt tartalmaz: a piros-zöld pár egyikét, illetve a sárgakék pár egyikétt.
4.14. ábra. A kromatikus válaszfüggvények A színkioltási kísérletek eredményei szép összhangot mutatnak bizonyos színmegnevezési kísérletek eredményeivel (Sternheim-Boynton 1966, Werner-Wooten 1979). Utóbbi kísérletekben a személyeket arra kérték, hogy százalékskálán becsüljék meg a bemutatott színingerek árnyalat-összetevőit. Például a tipikus narancssárga színeket „50 százalék piros, 50 százalék sárga” ítélettel jellemezték sokan, míg az érett citroméhoz hasonló tiszta sárga színt nagyjából 100 százalékban sárgának, és 0 százalékban zöldesnek, illetve vörösesnek írták le. Bár első hallásra e módszer kicsit furcsának tűnhet, az empirikus vizsgálatok mégis igazolták: a kísérleti személyek értették a feladatot, és egyazon személyek időben stabil, különböző személyek pedig egymáshoz hasonló válaszokat adtak. Mi több, a kromatikus válaszfüggvények előre jelezték a verbális válaszokat. Ha egy ingernél például erősebb zöld fény kellett a vörös összetevő kioltásához, akkor ugyanazon személy ugyanazt az ingert nagyobb százalékban jellemezte vörös árnyalat-összetevővel. A vizsgálatok harmadik szintje azt mutatta ki, hogy majmokban a talamusz oldalsó térdestesteinek (corpus geniculatum laterale – CGL) egyes sejtjei olyan színopponens válaszokat adnak, melyekből a kromatikus válaszfüggvényekhez hasonló görbék rajzolódnak ki (DeValois-DeValois 1997). A színlátás idegi alapjainak vizsgálataiból a következő képet kapjuk. Az opponens kódolás idegi alapja a csaptípuspárok kimenetének összehasonlítása, melyet a retina ganglionsejtjei, illetve a CGL különböző sejttípusai végeznek el. A dikromát emlősök esetében a törzsfejlődésileg ősibb „kék-sárga” opponens rendszer a látható spektrum rövid, illetve hosszú hullámú végét, vagyis a H, illetve R csapok válaszait hasonlítja össze. E rendszer kiindulópontját a ganglionsejtek egy csoportja, az úgynevezett nem-M-nem-P típusú ganglionsejtek és ezek receptív mezői képezik (small bist- ratified ganglion cells: Mollon 2000, Fonyó 1999). E ganglionsejtek a cGL egyik (ún. koniocelluláris) sejtrétegével kapcsolódnak, majd onnan az elsődleges látókéregbe (V1) jutnak ingerületeik. A törzsfejlődésileg újabb zöld-piros rendszer a közepes, illetve hosszú fényhullámok jelenlétét (tehát a H, illetve K csapok kimenetét) hasonlítja össze a retina adott pontját érő fényingerben. Ennek kiindulópontját a ganglionsejtek egy másik típusa a p típusú ganglionsejtek, midget ganglion cells), illetve ezek receptív mezői jelentik. A P sejtek a cGL egy másik rétegébe (kissejtes, parvocelluláris réteg) küldik axonjaikat, onnan pedig a V1-be. A retina receptív mezői között szép számmal vannak spektrális szempontból opponens szerveződésűek: olyanok, melyek bizonyos hullámhosszakra fokozott aktivitást mutatnak, másokra viszont gátlódnak. csaknem mindegyik spektrálisan opponens sejt receptív mezeje ugyanakkor térileg opponens szerveződést is mutat. Ha például a centrum egy vagy néhány H csapból áll, míg a periféria túlnyomórészt K csapokból, akkor a receptív mező ganglionsejtje a centrumba eső vörös fényre válaszolhat aktivitásnövekedéssel (BE központ), míg a perifériára eső zöld fényre a legerősebb aktivitáscsökkenéssel (KI környék) A magasabb szintek felé haladva a színekkel kapcsolatos specificitás is növekszik: míg a CGL spektrálisan opponens sejtjei még világosságinformációt is hordoznak, addig a V1 egyes sejtjei színes fényekre válaszolnak, fehér fényre azonban nem. A színekre legspecifikusabb kérgi terület a V4, melynek sejtjei viszonylag szűk hullámhossztartományokra szelektíven érzékenyek, fehér fényre nem válaszolnak, és színek szerinti 84 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
sejtoszlopokba rendeződnek. E sejtoszlopok különböző sejtjei azonos színtartományra érzékenyek (ugyanakkor különböző alakspecificitással rendelkeznek). A V4 sérülése kérgi eredetű színlátászavart, illetve a színlátás elvesztését okozza (akromatopszia). E veszteség meglehetősen specifikus a színlátásra nézve: az egyéb látási teljesítmények (pl. alaklátás, téri orientáció) túlnyomórészt megmaradnak akromatopszia esetén (Sacks 2004).
4. Színkonstancia és színkontraszt Színkonstancia alatt a következő jelenséget értjük. Amikor a külső megvilágítás változik (például ha a nap fénye az estébe hajló délutánban egyre narancssárgásabb lesz, vagy a napfényből belépünk egy mesterséges fénnyel megvilágított helyiségbe), nem tűnik úgy számunkra, hogy a tárgyak színe megváltozik, noha ilyenkor a tárgyakról a szemünkbe jutó fény spektrális összetétele nagyon is megváltozik. A meglepő az, hogy a tárgyak észlelt színe jobban korrelál az egyes tárgyak felületi ref- lektanciájával (amihez közvetlen észleléses hozzáférésünk nincs), mint a tárgyakról a szemünkbe jutó fénnyel (ami a színlátás közvetlen ingerét képezi). Hogyan lehetséges ez? E jelenség megértéséhez érdemes a színkonstanciánál egyszerűbb világosságkonstan- cia jelenségével kezdeni. Ehhez nézzük meg a 4.15. ábrát. Bár a teljes ábrán az O betű bekarikázott középső részét világosabbnak látjuk, mint az S betű ugyancsak jelölt feketéjét, mégis, az abszolút világosságok tekintetében fordított a viszony. A látórendszer a feltételezések szerint a teljes ábrát szegmentálja, felosztja különböző megvilágítású részletekre (a 4.15. ábrán a közvetlenül megvilágított, illetve árnyékos részek elkülönítése az alapvető), és ezen belül viszonyítja egymáshoz a különböző világosságú részeket. Így például az árnyékos tartományon belüli legvilágosabb felületrészletekhez ugyanúgy a fehér észleletét rendeli, mint a közvetlenül megvilágított területen belüli legvilágosabb részekhez. Mindkét tartományon belül a lokálisan legvilágosabb részletekhez viszonyítva alakulnak ki a sötétebb felszínek észleletei – például a lokális megvilágítási maximum felével jellemezhető felületeket nagyjából középszürkének látjuk.
4.15. ábra. A világosságkonstancia szemléltetése Kérdés, hogyan általánosítható ez az elv a színes látásra. Az egyik első, nagy hatású szín- konstancia-elmélet Edwin Land amerikai tudós és feltaláló nevéhez fűződik. Land, aki egyebek között a polaroid fényképezés feltalálója is, úgy gondolta, hogy a színkonstans észleléshez három különböző hullámhossztartományban egymástól függetlenül kell a világosságot nor- malizálni (Shepard 1997, Brainard-Wandell 1986). Elméletét Land retinexelméletnek nevezte. (A ’retinex’ kifejezés arra utal, hogy a színkonstans észlelés alapjául szolgáló mechanizmusok valahol a retina és az agykéreg – kortex – között, pontosan nem tudjuk, hol valósulnak meg.) Land híres kísérleteit úgynevezett Mondrian-ábrákkal végezte, melyek különböző színű, zömmel téglalap alakú mezőkből álló képek voltak, s nevüket onnan kapták, hogy Piet Mond- rian holland neoklasszicista festő egyes képeire emlékeztettek (4.16. ábra).
85 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
4.16. ábra. Edwin Land színkonstancia-kísérleteihez használt „Mondrian”-ábra Az ábrák megvilágítására három vetítőt használtak, melyek liláskék (rövid hullámhosszú), zöld (közepes hullámhosszú), illetve vörös (hosszú hullámú) fényt vetítettek az ábrákra. Az egyes vetítőket, illetve ezek kombinációit különböző fényerőre állítva, a megvilágítás tág határok között változtatható volt, miközben az ábra egyes foltjairól visszaverődő fény összetételét fénymérő műszerrel mérték. Az összetett Mondrian-ábrák egyes foltjainak észlelt színe alapvetően állandó maradt a megvilágítás nagymérvű változtatásai ellenére is. Ha például egy adott M1 megvilágítás mellett egy vörös folt ugyanolyan összetételű fényt vert vissza, mint egy másik, M2 megvilágítás mellett egy zöld folt, mindkét megvilágítás mellett a vörös folt vörösnek, a zöld zöldnek látszott. E jelenség alapja Land szerint egy normálási folyamat, de most nem egyetlen visszavert fényértékre, mint a világosságkonstancia esetén, hanem három hullámhossztartományra, egymástól függetlenül. Ha például vöröses megvilágítás (pl. naplemente) esetén a látvány egészében nagyon nagy a vörös tartományból származó bemenet, akkor a látórendszer e hullámhossztartomány súlyát arányosan csökkenti a színek kiértékelésekor, helyreállítva a normál kromatikus arányokat (hasonlóan a másik két hullámhossztartomány esetén). Ezzel az elmélettel azonban az a gond, hogy akkor is normalizál, ha a kromatikus túlsúly forrása nem a megvilágító fény színe, hanem a látványban jelen lévő felszínek árnyalata. Ha például egy csupa vöröses felszínből álló ábrát látunk, mint a 4.17. ábrán, a reti- nexmodell akkor is a vörös túlsúly eltávolítására törekszik, ami azonban most helytelen lépés, hiszen a látványban szereplő összes tárgy vörös színű, s pontosan ez az, amit látunk is (Shepard 1997).
4.17. ábra. Egy csupa piros felszínt tartalmazóábra, melybõl nem kell eltávolítani a piros színek túlsúlyát – a retinexelmélet háromcsatornás normálási eljárása viszont ezt tenné A színkonstancia ma legelfogadottabb elmélete Laurence Maloney és Brian Wandell nevéhez fűződik (Maloney 2003, Maloney-Wandell 1986, Wandell 1995). A retinexelmé- let imént említett problémájától Maloney és Wandell úgy szabadul meg, hogy feltételezik, a látórendszer egy független becslést végez a megvilágítás spektrális összetételére vonatkozóan, ez a spektrális összetétel pedig nem a környezet tárgyairól visszaverődő fény mértékétől függ. Ilyen független becslés érhető el például, ha valamilyen fényforrásra vagy annak irányába pillantunk, vagy akkor, ha a színbecslést a fényforrásnak a tárgyak felszínén látható tükörképe alapján végezzük (4.18. ábra). A 4.18. ábra alapján több fontos megfigyelést is tehetünk. Egyrészt, jól látható, hogy a tárgyak felületi reflektanciájának tulajdonképpen két összetevője van: egy diffúz komponens, mely az adott irányból beeső fényt minden irányban szétszórva veri vissza, s egy tükörszerű visszaverődés, mely a tükörhöz hasonlóan a párhuzamosan beeső sugarakat párhuzamosan veri vissza. A matt felületek esetében e tükörszerű 86 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
visszaverődés hiányzik, a fényes felületeknél viszont megvan. Másrészt, a diffúz visszaverődés hullámhosszszelektív, és meghatározza a tárgyak színét, a tükörszerű, párhuzamos visszaverődés a legtöbb fényes tárgy esetén minden hullámhosszat egyenlő mértékben ver vissza. (A fényvisszaverés e kettős természete a 4.18. ábrán megfigyelhető. Ezt illusztrálják az ábrán lévő paradicsomok, melyeken, bár pirosak, a fehér fényforrás képe fehér.)
4.18. ábra. A legtöbb – de nem mindegyik – színes felületen a fényforrás tükörképéből közvetlenül becsülhető a megvilágító fény színe A fényforrás képe alapján tehát közvetlen becslést lehet tenni a megvilágítás színére vonatkozóan. A színkonstans észlelés alapja tehát a felületi reflektancia valamiféle becslése, hiszen az a felületek állandó, a megvilágítás változásaitól független tulajdonsága. A reflektancia becsléséhez rendelkezésre áll az adott felületről a szemünkbe érkező fény spektrális összetétele és a megvilágító fény spektrális összetételéről való független becslés. Ezenkívül tudjuk, hogy minden egyes hullámhosszon a beeső fény intenzitásának (jelöljük ezt B-vel) és az adott felület reflektanciájának (R) szorzata adja a tárgyról a szemünkbe érkező fény spektrális összetételét (legyen ennek jele S). Azaz B x R = S; B-t és S-t ismerjük, tehát R-t ki tudjuk számítani. Ennek az összefüggésnek az alapján a látórendszer is képes lehet a tárgyak felületi reflektanciáját becsülni. A színkonstanciával kapcsolatos másik probléma az, hogy hogyan rekonstruálható, legalább közelítőleg, a felületek reflektanciája a mindössze három csaposztályból származó, igen korlátozott információ alapján. Ez csak akkor lehetséges, hogyha a látórendszer alacsony szintű, beépített (s a tudat számára nem hozzáférhető) hipotézisekkel rendelkezik arról, hogy a környezetben milyenfajta felületi reflektanciák, illetve megvilágító fények várhatók el. Maloney és Wandell elegáns matematikai modellt dolgoztak ki e probléma megoldására, amit itt most csak szavakban, röviden foglalunk össze. A látórendszer eme hipotézisei a környezetünkben található felületi reflektanciák egyfajta általános leírását tartalmazzák, például azt az információt, hogy a földi környezet reflektanciái folytonos, sima, a hullámhosszal lassan változó görbék (a 4.6. ábrán ez jól látható). Maloney és Wandell elmélete azt mutatja meg, hogyan lehet képes a látórendszer a beépített hipotézisek és a három csaposztály durva felbontású bemenete alapján a megvilágító fényeket, és azok alapján a felszíni reflektanciákat rekonstruálni. Ez azonban csak olyan környezetben lehetséges, amelyben a megvilágítás és a reflektanciák tényleg olyanok, mint ahogy azt a látórendszer implicit modellje leírja. Ha ez nem teljesül, akkor a rekonstrukció hibás lesz, és a színkonstancia leromlik vagy eltűnik. (Gondoljunk arra, hogy mondjuk egy kékeszöld lámpa fényénél milyen nehezen ismerünk föl színeket, vagy hogy este, nátriumgőzlámpák narancssárga fényénél milyen nehéz egy autót színe alapján felismerni a parkolóban.) A színkontraszt jelenségéről már közvetve szót ejtettünk a kontrasztszínek kapcsán. A kontrasztjelenségek leggyakoribb változata, a szimultán kontraszt lényege, hogy egy felület észlelt színe nemcsak az adott felület reflektanciájától függ, hanem az azt körülvevő, egyéb felületek színétől is. A szimultán kontraszthatások igen bonyolultak: függenek a célfelület és a háttér színeitől, az egyes színek téri elrendezésétől is, méghozzá meglehetősen összetett módon. A 4.19., 4.20. és 4.21. ábrákon látszik, hogy a színválasztás milyen erősen befolyásolja a kontraszthatást: a kis négyzetek az ábrák mindkét képén egy-forma fényvisszaverési tulajdonságúak, tehát azonos háttér előtt azonos színűnek látszanának. A klasszikus megfigyelés szerint a szürke négyzeteknek piros háttér előtt illene zöldesnek, élénkzöld háttér előtt ellenben kissé pirosasnak látszaniuk. A 4.19. ábrán e hatás nem igazán meggyőző. Ha azonban pasztell- (telítetlen) színeket választunk megfelelő összeállításban, a hatás sokkal erősebb lesz (4.20. és 4.21. ábra). A 4.22. ábrán viszont az is látszik, hogy telítettebb színekkel is kaphatunk erős kontraszthatást, ha megfelelően választjuk meg őket. Indukciós színnek (azaz a háttér előtt bemutatott célfelületnek, melyen a kontraszthatás indukálódik) szerencsésebb választás egy színes felület, mint egy akromatikus szürke (bár néha akromatikus felületen is létrehozható színindukció). A 87 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
színlátás kontraszthatásai nem valamiféle ritka, az illúziókkal egy csoportba tartozó jelenségek, hanem mindenütt jelen vannak a színészlelésben. Gondoljunk arra, hogy a kontrasztszíneket is e hatások hozzák létre. Az érdekes kontrasztábrák persze szokatlan kontrasztjelenségek, és néha csak a melléjük adott leírással együtt meglepőek. Például a 4.22. ábra esetén, ha nem figyelmeztetnek egy naiv szemlélőt, hogy a két kis négyzet önmagában azonos fényvisszaverési tulajdonságú, akkor az illető erre talán nem is gondolna, hanem elkönyvelné, hogy a két kis négyzet nem azonos színű. S ez voltaképp igaz is, abban az értelemben, hogy, mint mondtuk, az egyes tárgyak észlelt színét saját reflektanciájuk (fénykibocsátásuk) és a környezetüké együtt határozza meg.
4.19. ábra. Klasszikus színkontrasztábra. A hatás nem kifejezetten erős
4.20. ábra. Megfelelően választott színekkel sokkal erősebb kontraszthatás érhető el. A két kis négyzet azonos színű
4.21. ábra. Egy másik erős kontraszthatás
4.22. ábra. Erős kontraszthatás nem csak pasztellszínekkel érhető el A szimultán kontraszthatások magyarázatára többféle próbálkozás létezik (shepherd 1999, Lotto-Purves 2000). Akromatikus szürke felületeken megfigyelhető szürkekont- raszt-hatásokra léteznek olyan elméletek, melyek a világosságkonstancia és világosságkontraszt jelenségét egyszerre képesek magyarázni (Gilchrist et al. 1999). A színkontraszt- esetek közül egyeseket adaptációs hatásokkal, azaz a három csaposztály bemenetének egymáshoz képest változó súlyozásával is meg lehet magyarázni. Más jelenségekhez az ellenszínelmélet feltevéseire is szükség van, illetve vannak olyan elméletek is, melyek a színkonstanciáért felelős mechanizmusok
88 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
melléktermékeként magyarázzák a kontraszthatásokat. szinte bizonyos, hogy a színlátás magasabb szintű, kérgi folyamatai komoly szerepet játszanak a kontraszthatások létrejöttében. A színlátás magasabb szintű folyamatainak bonyolultságát illusztrálják a színasszimilációs jelenségek is (4.23. ábra,.). Itt a kontraszttal ellentétes hatás tapasztalható: a vékony sárga csíkok a szélesebb szürke sávok sárgás megjelenését okozzák, míg kék csíkok kékes megjelenést. A másik két ábrán is az látható, hogy a szegélyező színes keretek saját színük irányába változtatják az indukciós felület színét (s nem az ellenszín irányába, mint a szimultán kontrasztnál).
4.23. ábra. Színasszimiláció
5.3. táblázat A SZÍNLÁTÁS MINT ESETTANULMÁNY A TUDATOS ELMENY KUTATÁSÁBAN A kognitív pszichológia, illetve a megismeréstudomány által máig intenzíven használt és sokat vitatott elméleti alapfeltevés az úgynevezett számítógép-metafora (más néven információfeldolgozó szemlélet), melynek lényege, hogy elménk egy reprezentációs mechanizmus, melyben a mentális reprezentációk adatstruktúrák, a kognitív folyamatok pedig ezen adatstruktúrákon végzett számítások, átalakítások (komputációk). E felfogással kapcsolatban már mintegy harminc éve felmerült a következő elméleti probléma. Az emberi tudat egyik alapvető sajátossága, hogy észlelésünket és valamennyi megismerő funkciónkat áthatják azok az érzékleti minőségek, élmények, melyek ezt az információfeldolgozást kísérik. A piros szín látása, egy zongoraakkord, egy zenedarab meghallgatása, az ananász íze a szánkban, az égett gumi orrunkat facsaró bűze vagy egy kemény, hideg és sima felület érintése mind olyan sajátos élmények, melyek az észlelést, a képzeletet, gondolkodásunkat kísérik, s éber állapotban mindig jelen is vannak. Egyes belső állapotaink tehát fenomenológiai karakterrel rendelkeznek, azaz ezen állapotok létrejönnek bennünk, „valamilyenek” a számunkra, vagyis, ha megjelennek agyunkban, egy bizonyos módon átéljük őket. (Ezzel ellentétben számos agyi állapot, mely szervezetünk működését vagy akár viselkedésünket is befolyásolja, nem jut el a tudatunkig.) E jelenség jobban ismert angol neve a qualia (ezt csúnya magyarítással helyenként „kvália”-ként emlegetik). A „qualia” kifejezés meglehetősen elméletterhelt (vagyis inkább azok használják, akik a tudat dualista felfogásában hisznek). A „fenomenológiai karakter” ilyen szempontból semlegesebb, s ezért a tudatfilozófiai viták kontextusán kívül ez utóbbit célszerű használni. Ugyanakkor intuícióink alapján nem tartjuk valószínűnek, hogy programokat futtató számítógépek, 89 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
mesterséges információfeldolgozó rendszerek a mieinkhez hasonló élményeket élnének át. Ha pedig az emberi elme nem más, mint egy bonyolult információfeldolgozó rendszer, akkor hogyan élhet át élményeket? Esetleg az elme mégis több egy komputációs rendszernél? E kérdések az utóbbi huszonöt évben komoly elméleti vitákat váltottak ki. Ezek részleteit itt nem tudjuk teljességében bemutatni, röviden megemlíteni viszont azért érdemes, mert a színélményeknek és a színlátásnak a fejezetben bemutatott pszichológiai vonatkozásai az egyik legfontosabb hivatkozásként szolgálnak a tudatos élményről szóló elméleti vitában. E probléma érthetővé tételére az egyik klasszikus gondolatkísérletet érdemes felidézni. Tegyük föl, hogy valakivel beszélgetünk a színekről, és egyetértünk abban, hogy mit milyen színűnek hívunk, valamint abban is, hogy mit mitől lehet megkülönböztetni színük alapján. Ennek ellenére elvileg lehetséges, hogy ismerősünk olyan színűnek látja az eget, mint mi a tojássárgáját, és viszont (vagy épp az érett paradicsomot látja olyan színűnek, mint mi a pázsitot). Ez a kék-sárga, illetve zöld-piros spektruminverzió esete. Lehetséges-e ez? Esetleg vannak is ilyen esetek a valóságban? Ilyen esetek tényleges megléte a legtöbb szakértő számára valószínűtlennek tűnik, elsősorban azért, mert nem ismert olyan adat, amely biológiailag megalapozná ezt a feltevést. Egyes filozófusok szerint teljes biológiai azonosság mellett is lehetséges (egy bizonyos értelemben) fordított spektrum (pl. Chalmers 1996), ez azonban igencsak vitatott kérdés. Érdekesebb kérdés a következő: ha létezne is fordított spektrum, kiderülhetne-e ez a két ismerős számára beszélgetésükből, a fenti példában? Az elmefilozófiai vitákban ez fontos kérdésként merült föl – tehát az, hogy a fordított spektrum lehet-e a viselkedés szintjén detektálhatatlan. Ha ugyanis igen, akkor abból arra lehetne következtetni, hogy az érzékleti minőség független a viselkedéstől, sót a kognitívfunkcionális szerveződéstől is; tehát az elme hagyományos fizikalista felfogása elleni érvként szolgálna (Byrne 2005). (A fizikalista felfogás lényege, hogy a mai fizika és a fizika világképével ösz- szeegyeztethető többi természettudomány – kémia, biológia stb. – fogalmai segítségével maradéktalanul megérthető, magyarázható az elmével és tudattal kapcsolatos valamennyi jelenség – így az élmények is.) Úgy tűnik azonban, hogy a viselkedéses felismerhetetlenség tézise nehezen tartható – sokkal inkább van okunk azt gondolni, hogy ha létezne is személyközi fordított spektrum, az nem lenne észrevehetetlen a viselkedés szintjén. Már tudjuk például, hogy a legtelítettebb sárga szín jóval világosabb, mint a legtelítettebb kék, mivel a H és K csapok együttes domináns aktivitása, ami a sárga látásához kell, sokkal nagyobb mértékben járul hozzá a világosság élményéhez, mint az R csapok domináns válasza (ami általában a kék szín látásának alapja). Ha tehát két ismerős, akiknek egymáshoz képest kék-sárga inverziójuk van, beszélget egymással, akkor mondjuk az egyikük kifejezheti meggyőződését, hogy „Az érett citrom színe jellegzetesen telített és sötét, az érett szilváé pedig telített és világos”. Beszélgetőpartnere azonban – alighanem többségünkkel egyetértésben – az érett citrom színét ítéli világosabbnak, s az érett szilváét sötétebbnek. S noha mindketten a citromot neveznék sárgának, a szilvát pedig kéknek, a részletekben való egyet nem értés legalábbis felvetheti a különbség gyanúját. E gondolatmenetet folytatva, a példabeli két ismerős azt már valamivel nehezebben tudja elmondani egymásnak, hogy pontosan milyennek is látják a kérdéses színeket. Olyan született színvakoknak pedig, akik egyáltalán nem látnak színeket, egyenesen lehetetlen elmagyarázni, hogy milyen a színeket látni. Knut Nordby színlátással foglalkozó norvég pszichológus, aki maga született csaphiányos színvak, a színek több évtizedes elméleti tanulmányozása után is határozottan állítja, fogalma sincs a színlátás élményéről (Nordby 1990). A színélmény, úgy tűnik, nyelvileg kifejezhetetlen. Hogy miért, azt a kognitív pszichológia szemszögéből is érthetővé lehet tenni. Részben talán azért van ez így, mert észleleteink számos, a diszkriminációs küszöbök közelébe eső apró különbsége nem jut el a feldolgozás bizonyos magasabb szintjeiig (elsősorban az észlelési kategorizációig s az emlékezeti rögzítésig). Ezért viszont, bár az észlelés során hatnak a tudatra, e hatásuk igen illékony, a nyelvi kódolásba már nem vihető át (Raffman 1988, 1995). Gondoljunk arra, hogy sokkal több színárnyalatot vagyunk képesek észlelni, mint emlékezetünkben megjegyezni. Ezért kell például színmintát vinnünk a festékboltba, ha javítófestéket szeretnénk venni szobánk falához vagy egy bútordarabhoz: a pontos árnyalatra nem tudunk emlékezni. A nyelvi kifejezhetetlenség egy másik oka az lehet, hogy az egyes színélmények mint reprezentációs állapotok primitívek, azaz nincs bennük olyan struktúra, amit a nyelvi kód leképezhetne s mások számára közvetíthetne (Jakab 2000). Mit is jelent ez? Az alakok vizuális reprezentációi, hasonlóan a nyelv agyi reprezentációjához, kompozicionálisak: bizonyos reprezentációs alapelemekből, kombinációs szabályok segítségével állnak elő (gondoljunk Irving Biederman geonelméletére: Sekuler-Blake 2000). A feltevés szerint e vizuális reprezentációs struktúrák átkódolhatóak a nyelvbe, és így – ha nem is mindig könnyen – a nyelvi leírás segítheti a tárgyak alakjának elképzelését, felismerését. Egy adott szín észlelési élménye azonban nem reprezentációs alapelemek kombinációja, tehát ebben az értelemben nem strukturált –
90 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
épp ellenkezőleg, egy színélmény maga egy reprezentációs szempontból tovább nem bontható primitív. Nincs tehát benne a nyelvbe átkódolható struktúra (vagy csak egészen minimális: például a narancssárga élménye valamiképp a piros és sárga élményének kombinációja), s ezért nem segítheti a nyelvi leírás a teljesen színvak személyeket a színek elképzelésében. Érdemes még azt is megemlíteni, hogy a már tárgyalt tetrakromát színlátás mellett a trikromát színlátásnak is vannak egyéni különbségei. Ezek egyik fő oka a csapok érzékenységi görbéinek genetikailag meghatározott kisebb-nagyobb különbségeiben rejlik. Az egyéni különbségek kísérleti helyzetben jól kimutathatók a tisztaszín-lokalizáció segítségével, tehát például az, hogy milyen hullámhosszon látja a személy azt a zöldet, amely se nem sárgás, se nem kékes, vagy azt a tiszta pirosat, mely se nem narancsos, se nem lilás. A tiszta zöld lokalizációja 490 és 520 nm között változik a normál színlátóknál – ez a teljes spektrum terjedelmének mintegy 10 százaléka, tehát elég széles tartomány. A hétköznapi életben is adódnak időnként viták kifogástalan színlátással rendelkező személyek között arról, hogy például egy szövet vagy egy festett felület inkább kék, vagy inkább zöld. Ha tehát olyan nem is fordulhat elő, hogy egy személy színterének egyik dimenziója 180 fokkal elforgatott egy másik személyéhez képest (ez lenne a kék-sárga vagy a zöld-piros inverzió), a normál színlátás egyéni különbségei kisebb, néhány fokos dimenzióelforgatást eredményezhetnek a szubjektív színterek között. Összefoglalva: az érzékleti minőségek, s így a tudatos élmények neodualista elméletei (melyek szerint a mai fizika világképét alapvetően meg kell reformálni, és új fogalmakkal kell bővíteni ahhoz, hogy az érzékleti minőségek problémáját tudományos formában érthetővé tegyük: lásd chalmers 1996) jelentős eredményeket értek el a tudat problémájának tisztázásában. ugyanakkor az elme dualista elméleteit védők dolga azért is nehéz, mert az élményekkel kapcsolatos számos jelenség érthetővé tehető a kognitív pszichológia fogalmai – így például reprezentáció és feldolgozás stb. – segítségével. A tudatos élmény elmefilozófiai kérdései iránt érdeklődő olvasónak David Chalmers (1996) nevezetes könyve mellett Block, Flanagan és Güzeldere (1997) tanulmánykötetét, illetve a Metzinger (1997) szerkesztette kötetet ajánljuk.
4.1. ÖSSZEFOGLALÁS 1. Az emberi színlátás három, különböző hullámhossztartományra érzékeny receptortípus (a csapok) működésén alapul. A csapok érzékenységi görbéi a színlátás számos alapvetőjelenségét megmagyarázzák, így a homogenitás, a szuperpozíció, a színegyezés jelenségeit. A színegyezés legfontosabb elve, hogy azon felületeket látjuk megkülönböztethetetlen színűnek, melyek azonos mértékben hozzák működésbe a három csaptípust. A fizikai színkeverés és a színtévesztés jelenségeinek megértése is alapvetően a receptorok működésén alapul. 2. A színegyezésen és a hozzá kapcsolódó jelenségeken túlmutatnak azok az elméletek, melyek a receptorok működése alapján a színészleletek létrejöttét írják le. Az észlelt színek rendszerének elmélete az ellenszínelmélet, mely szerint a látható színek jól leírhatóak egy háromdimenziós tér – az úgynevezett színhasonlósági tér – segítségével. A három dimenzió közül kettő a tiszta ellenszíneknek (piros-zöld, illetve sárga-kék) felel meg, a harmadik pedig a világosságot jellemzi. E dimenziók a feldolgozás szintjén a receptorok válaszainak függvényei – az egyszerűsített ellenszínelmélet szerint a receptorválaszok lineáris kombinációi. Az ellenszínelmélet számos, a színlátással kapcsolatos jelenséget magyarázni képes. Ez az elmélet eredetileg egy absztrakt matematikai modell, melynek azonban idegrendszeri megvalósulásáról is egyre több ismerettel rendelkezünk. 3. Az ellenszínelméleten is túlmutatnak a színlátás bizonyos jelenségei, elsősorban a színkonstancia és a kontraszthatások. A színkonstancia jelenségének ma már egyre kifinomultabb elméletei léteznek, melyek szerint ahhoz, hogy a változó megvilágítás ellenére is azonos színűnek lássuk a tárgyakat, egyrészt a megvilágító fény spektrá- lis összetételéről kell a látórendszernek egyfajta becslést szereznie, másrészt bizonyos beépített hipotézisekkel kell rendelkeznie a földi környezetben elvárható megvilágítási és felületi reflektanciatípusokról.
4.2. KULCSFOGALMAK
91 Created by XMLmind XSL-FO Converter.
4. FEJEZET – Színlátás
ellenszínelmélet, felületi reflektan- cia, fizikai és pszichológiai színkeverés, háromszín-elmélet, keverék színek, metamerek, spektrális energiaeloszlás, színegyezés, színegyezési függvény, színhasonlósági tér, színkioltás, színkonstancia, színlátászavarok, tiszta színek, univariancia
4.3. ELLENŐRZŐ KÉRDÉSEK 1. Hogyan kellene működnie egy olyan receptornak a retinában, amelyből egyetlen fajta is elég lenne a színlátáshoz (hullámhossz-megkülönböztetéshez)? 2. a) Mely tényezőktől függ a színegyezési függvények alakja? b) A tetrakromát színlátás melyik típusánál fordulhat elő, hogy nem három, hanem négy színegyezési 4.16. ábra. Edwin Land színkonstanciakísérleteihez hasz- függvény kell a személy színegye- nált „Mondrian”-ábra zési válaszainak jellemzéséhez? c) Befolyásolják-e a színtévesztést korrigáló szemüvegek a viselő személy színegyezési függvényeit? Miért? 1. Korrigálható-e szemüveggel azon személyek színtévesztése, akiknek retinájában csak kétféle csaptípus található? (Indokold a választ!) 2. Milyen érvek szólnak a tiszta színek, illetve a keverék színek elkülönítése mellett? Miért nem lenne ésszerű mondjuk a narancsszínt vagy a lilát tiszta színnek tekinteni? 3. Miért nevezzük a barnát kontrasztszínnek? Igaz-e a következő állítás: Fénykibocsátó felület sohasem tűnhet barna színűnek? 4. Milyen értelemben áll fenn a linearitás a színegyezés esetében, és hogyan sérül a pszichológiai színkeverésnél? 5. Azok a színkategorizációs vizsgálatok, melyekben keverék színek színösszetevőinek százalékos leírására kérték a személyeket, meglehetősen idegenek a hétköznapi szemlélettől és színosztályozástól. Mi igazolja mégis e módszer használatát a színlátás kutatásában? 6. Miben különbözik Land retinexelmélete a Maloney-Wandell-féle színkonstancia-elmé- lettől? (Rávezető kérdés: Miért képes az utóbbi elmélet helyesen jósolni egy csupa piros felületből álló látvány észlelését – ti. hogy csupa piros felületet látunk benne -, szemben a retinexelmélettel, mely ebben az esetben helytelen jóslatot ad?)
4.4. AJÁNLOTT OLVASMÁNYOK Kardos Lajos 1984. Tárgy és árnyék. Akadémiai Kiadó, Budapest. sekuler, R. – Blake, R. 2000. Észlelés. osiris, Budapest.
4.5. AJÁNLOTT HONLAPOK http://www.cis.rit.edu/fairchild/WhyIsColor/ (Color Curiosity Shop, Mark D. Fairchild – remélhetőleg fejlődni fog.) http://www.purveslab.net/seeforyourself/ (Dale Purves Laboratory.) http://www.psy.ritsumei.ac.jp/~akitaoka/shikisai2005.html. (Szép kontrasztábrák.) http://mcsl.rit.edu/ (Munsell Color Science Laboratory.) http://www.journalofvision.org (Journal of Vision.) http://cvision.ucsd.edu/ (CVRL Color and Vision Database.) http://www.cie.co.at/cie/A Nemzetközi Világítástechnikai Bizottság honlapja.) http://cie.kee.hu/mnb_hun.html (Magyar Nemzeti Bizottság.) http://www.knt.vein.hu/ (A Veszprémi Egyetem Képfeldolgozás és Neuroszámítógépek Tanszéke, a magyar színtani kutatás egyik központja.) http://www.vital.hu/themes/sick/see3.htm (Egy magyar lap a színlátáskorrekcióról.) http://aris.ss.uci.edu/cogsci/personnel/kjameson/kjameson.html (Kimberly Jameson színlátáskutató honlapja számos érdekes, letölthető cikkel.)
92 Created by XMLmind XSL-FO Converter.
6. fejezet - 5. FEJEZET –Tárgyak, formák és alakok észlelése 1. Alak- és tárgylátás Az 5.1. ábrát nézve senkinek nem okoz gondot, hogy felismerje az ábrázolt tárgyat. Any- nyira könnyű a tárgyak észlelése, felismerése, hogy elsőre nehéz megérteni, milyen komplex is ez a folyamat. Az 5.2. ábra megpróbálja ezt a nehézséget szemléltetni. Képzeljük el, hogy egy olyan intelligens robotot szeretnénk alkotni, amely képes a képen látható székek felismerésére, és el tudja dönteni, hogy azok közül melyikre lehet leülni. Vegyünk egyelőre csak egy példát a képről: hogyan tudja robotunk eldönteni például azt, hogy az íróasztalon lévő modellre vagy a másik szobában, távol látható székre le lehet-e ülni? Számunkra a kérdés nevetségesen könnyű, de csak addig, amíg észrevesszük, hogy a két tárgy képe valójában teljesen azonos! Mi alapján döntsön tehát robotunk?
5.1. ábra. Egy komplex tárgy, melynek felismerése nem okoz gondot senkinek
5.2. ábra. Egy bonyolult szobabelső, mely demonstrálja azokat a problémákat, amelyeket egy tárgyfelismerő rendszernek meg kell oldania (Wallis–Bülthoff 1999 ábrája nyomán). Az adott tárgykategóriát felismerjük helyzetétől, megvilágításától, színétől, méretétől, illetve távolságától, nézőpontjától függetlenül, részlegesen kitakarva, részekre bontva, valamint a kategória eltérő elemeit szemlélve is Három fontos csoportja van azoknak az érveknek, melyek azt mutatják meg, miért is nehéz probléma a tárgyvagy alakészlelés. 1. Egy adott tárgyat csak nagyon ritkán látunk azonos feltételek mellett, vagyis a tárgy retinára vetülő képe sokszor változik, mivel más szögből, irányból, távolságból, méretben, színben, illetve fényviszonyok mellett látjuk. Az 5.2. ábra bemutat néhányat mindazokból a képtranszformációkból, melyektől függetlenül fel tudjuk ismerni az adott tárgyat. Azt mondjuk tehát, hogy tárgyészlelésünk pozíció-, méret-, távolság- vagy színinvariáns, vagyis független a fenti tulajdonságoktól. 2. Egy adott tárgy kategóriájának egyes tagjait kisebb eltéréseik ellenére is fel tudjuk elismerni, és ugyanúgy kezeljük őket. Az 5.2. ábra közepén, az előtérben álló két szék, bár eltérő formájú, hasonló célokat szolgál, így azonos kategóriába soroljuk őket (generalizá- ció). Ez persze nem jelenti azt, hogy ne tudnánk a 93 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése különbségeket is észrevenni egy adott kategória egyes tagjai között (szelektivitás). Tárgyfelismerésünk ezen két folyamat, a ge- neralizáció és a szelektivitás nyereség-veszteség vagy vám-rév hatásán múlik. 1. A tárgyakat egyszerre több specificitási szinten is fel tudjuk ismerni. Az 5.2. ábra tárgyaira összefoglalólag azt tudjuk mondani, hogy bútorok, székek vagy guruló iroda-székek. Hogy melyik felismerési (kategorizációs) szintet használjuk, az mindig a feladatunktól függ. Mint látni fogjuk, ezeket a problémákat a tárgylátás egyes modelljei eltérő módon kezelik. Fejezetünkben azokat a folyamatokat foglaljuk össze, melyek az alakok, formák, a két- illetve háromdimenziós tárgyak észlelését teszik lehetővé.
1.1. A tárgy-alakzat és a háttér elkülönítése: perceptuális szegregáció A minket körülvevő tárgyak, a környező világ legtöbb dolga jól megkülönböztethető alakú és formájú. Bár nem biztos, hogy mindenki tudatában van ennek, a tárgyakat körvonalaik alapján észleljük. (Az angolban használatos edge szó megfelelői – perem, él – helyett fejezetünkben a kifejezőbb kontúr, illetve körvonal kifejezéseket használjuk.) Például szobánk ablakán kitekintve az ablak körvonalai zárt négyszögalakot írnak le, míg a kint látható fák szabálytalan körvonalai jól láthatóak az égbolt háttere előtt. Amit „látunk”, azok mégsem a körvonalak, hanem az általuk határolt ablakok, fák, vagyis a tárgyak. A tárgylátás egyik alapvető lépése (sokak szerint előfeltétele), hogy az adott tárgyat annak hátterétől, valamint az együtt megjelenő tárgyakat egymástól elkülönítsük. Ezt afolyamatot nevezzük perceptuális szegregációnak, illetve alakzat-háttér szegmentációnak. A kifejezések egyben arra is utalnak, hogy egy tárgy látása során a tárgy alakja az, ami elkülönül, azaz szegregálódik a hátteret alkotó mintázattól. Vegyük példának az 5.3. ábrát, melyet Edgar Rubin dán pszichológus 1915-ben mutatott be, és nézzük meg, mi a szerepe ebben a folyamatban a körvonalaknak? Az ábra (mely úgynevezett kétértelmű ábra) jól demonstrálja az alakzat-háttér szegregáció fontosabb tulajdonságait. Ezek a következők: • Az alakzat a háttér előtt van. • A háttér olyan alaktalan anyag, amely az alakzat mögött is folytatódik. • A körvonal (kontúr), ami az alakzatot és a hátteret elkülöníti, az alakzathoz tartozik. • Az alakzat könnyebben megjegyezhető, és jobban hasonlít egy adott tárgyra, mint a háttér.
5. 3. ábra. Az úgynevezett Rubin-váza. Mi van a képen: két arcprofil vagy egy váza? Nézzük, hogyan érvényesülnek ezek az elvek az 5.3. ábrán. Próbáljuk úgy látni az ábrát, hogy a fekete felszín az alakzat. Ilyenkor két arcprofilt látunk, melyek mögött a fehér, differenciálatlan hátteret nem lehet mint vázát érzékelni, mivel az ábra kontúrjai ebben az esetben az arcokhoz tartoznak. Próbáljuk most a fekete felszínt mint hátteret elképzelni, és vegyük számba az alakzat-háttér szegregáció fenti tulajdonságait. Van néhány további fontos tulajdonsága is a képnek, mely meghatározza azt, hogy mit látunk háttérnek, és mit tárgynak: ezek a méret, a szimmetria, az orientáció és az ismertség. A kontúrokkal határolt kisebb területeket inkább mint alakzatokat érzékeljük, a szimmetrikus területeket úgyszintén. Ha egy terület fő tengelyiránya függőleges vagy vízsz- szintes, akkor megint csak inkább mint alakzatot érzékeljük. Végül a könnyebben értelmezhető és/vagy már ismert kontúrú területeket úgyszintén inkább mint alakzatokat ismerjük fel.
94 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése Nézzük meg, hol és hogyan történik a perceptuális szegregáció. A hatvanas években kezdődött elektrofiziológiai kísérletek paradigmaváltást hoztak a látáskutatásban. Évtizedekig tartó kísérletsorozatokban mára a kutatók leírták az emlősök látórendszerét alkotó egyes kérgi területeket és azok tulajdonságait. Az egyik első és legtöbbet vizsgált agykérgi terület a nyakszirti lebenyen elhelyezkedő primer (elsődleges) látókéreg (Broadman 17-es terület, V1) volt. Ennek neuronjairól kiderült, hogy eltérő méretű és irányú vizuális ingerekre a legérzékenyebbek. Campbell és munkatársai (Campbell-Robson 1968, Bla- kemore-Campbell 1969) voltak az elsők, akik felvetették, hogy ezek a neuronok fontos szerepet játszhatnak a körvonalak detekciójában és a perceptuális szegregációban. Elméletük szerint a látórendszer olyan neuroncsoportokból áll, melyek legjobban egy adott téri frekvenciasávra érzékenyek, vagyis téri frekvenciaszűrőkként működnek. Amint már a látás alapfolyamatairól szóló fejezetben szó volt róla, a kisebb receptív mezejű neuronok a magasabb, míg a nagyobb receptív mezejű neuronok az alacsonyabb téri frekvenciákra reagálnak a legjobban, így mintegy többszörös, egymástól relatíve független téri frekvenciacsatornákat hoznak létre, és a látott kép Fourier-analízisét végzik el. A magasabb térbeli frekvenciákra érzékeny neuronok a finomabb részletek, az alacsonyabb térbeli frekvenciákra érzékeny neuronok a durvább mintázatok felismerésében játszanak inkább szerepet. Az elmélet legfontosabb bizonyítéka a szelektív adaptációs technikával végzett kísérletekből ered. Blakemore és Campbell (1969) több percen át mutattak a kísérleti személyeknek egy adott (7,5 ciklus/fok) térbeli frekvenciájú rácsmintázatot (adaptáció), miután azt találták, hogy az alanyok érzékenysége erre a mintázatra lecsökkent. Az érzékenységcsökkenés szelektív volt az adott térbeli frekvenciára, ami arra utalt, hogy az egyes térbeli frekvenciákra hangolt neuronok egymástól független csatornákon dolgozzák fel a látott információt.
6.1. táblázat AZ EML Ő SAGY VIZUÁLIS RENDSZERE Az emlősök agykérgi vizuális rendszere a nyakszirti lebenyen elhelyezkedő elsődleges vagy primer vizuális kéregből (Broadman 17, V1) indul ki (lásd az ábrát). A V1-et rigid struktúra, szigorú retinotópia jellemzi. Neuronjainak receptív mezeje kicsi (0,5-1,5 fok), jellemző rájuk, hogy leginkább adott irányú álló vagy mozgó fénycsíkra érzékenyek. Az egyes irányokra érzékeny neuronok csoportokba rendeződve orientációs oszlopokat alkotnak. Ezek között az oszlopok között találhatók azok a fény hullámhosszára érzékeny neuronok, amelyek kortikális (kérgi) dugókat alkotnak. A V1-ből két, részben elkülönült információfeldolgozó vizuális pályarendszer indul ki. A parie- tális (fali lebeny felé haladó) vagy más néven dorzális (az agyféltekék felső, dorzális részén haladó), illetve funkcionálisan „Hol?” vagy „Hogyan?” rendszernek nevezett pálya inkább a tárgyak mozgásáért, háromdimenziós tulajdonságaiért, a velük való manipulációért felelős (DeYoe – van Essen 1988, Mishkin et al. 1983). A temporális (halántéklebeny felé tartó), ventrális (az agyféltekék alulsó, hasi oldalán haladó), „Mi?” látórendszer pedig inkább a szín- és a tárgylátásért felelős. A V1-et a másodlagos látókéreg (V2, Broadman 18) veszi körül. A V2 neuronjainak receptív mezeje némileg nagyobb (< 4 fok), egyszerű geometriai ábrák, mozgó felszínek ingerlik a leginkább. A V3, majd a V5 (MT – mediális temporális terület) a parietális rendszer tagjai, neuron- jaikat mintázatok mozgása ingerli a legjobban, receptív mezejük igen nagy. A tárgyfelismerésben fontos ventrális rendszer következő tagja a V4, mely a szín-, a forma- és a mintázatérzékelésben játszik szerepet. Neuronjainak receptív mezeje néhánytól néhány tíz fokig terjedő méretű, jellemző ingerei színes felszínek, textúrák, geometriai ábrák. A ventrális rendszer utolsó, tisztán vizuális állomása az inferior temporális kéreg (IT); neuronjainak receptív mezeje sokszor igen nagy méretű (akár 70 fok) is lehet. Jellemző ingerei bonyolult háromdimenziós ábrák, tárgyak, emberi vagy állati arcok képe. A főemlősök vizuális rendszerének vázlatos ábrázolása és a tárgylátásban fontos ventrális rendszer jellemző ingerei. Az egyes területek megközelítő helyét az emberi agy jobb féltekéjén jelöltük (V1, V2, V4, V5 – elsődleges, másodlagos, negyedleges, illetve ötödleges vizuális látókéreg; MT – mediális temporális kéreg; IT – inferior temporális kéreg) A közelmúltban az is kiderült, hogy a Vl-neuronok nem egyszerű szűrőként működnek. Lamme (1995) rhesusmajmokkal végzett kísérleteiben kimutatta, hogy ugyanarra a texturált felszínre a neuronok válasza nagyobb volt, ha azt alakzatként látták, mint ha háttérként, vagyis a V1 valószínűleg fontos szerepet játszik a körvonalak detek- ciójában és az alakzatok hátterüktől való elkülönítésében is.
95 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése
1.2. Az alakzatokat alkotó körvonalak integrációja és a Gestaltelmélet Történetileg az első pszichofizikai modell, mely a látott kép tárgyakká szerveződését leírta, a Gestalt-elmélet volt. (A Gestalt németül egészet jelent.) A koncepciót először 1879- ben Wilhelm Wundt írta le, de csak később, a századforduló után, Max Wertheimer, Kurt Koffka és Wolfgang Köhler munkáinak köszönhetően (1923-1947 között) formálódott ki teljesen. A Gestalt-megközelítés azt hangsúlyozza, hogy a tárgy (az „egész”) több, mint a részek összessége (a tárgyakat alkotó elkülönült körvonaldarabkák összege). A Gestalt-pszi- chológusok három fő területre koncentrálták munkájukat, ezek • az alakzat és a háttér összefüggései, • a csoportosítás szabályai, • az alakzatok „jósága” vagy pregnanciája. A Gestalt-elméletek ma is érvényes módon írják le azokat a fő szabályokat, amelyek alapján a háttértől már elkülönült körvonaldarabok egységes alakzatokká, tárgyakká szerveződnek. Nézzük az alakká, tárggyá formálódás legfontosabb Gestalt-törvényeit! 1. Egyszerűség: minden mintázatot úgy látunk, hogy a lehető legegyszerűbb struktúra szolgál domináns értelmezésként (domináns interpretáció). Az ismert olimpiai ötkarikát például tehát valóban mint öt kört észleljük, és nem mint kilenc bonyolult alakzatot (5.4. a ábra). 2. Hasonlóság: az egymáshoz hasonló dolgokat egymással csoportosítva mint egységet észleljük. Ezért látjuk az egymástól egyenlő távolságra lévő köröket és kereszteket mint sorokat, és nem mint oszlopokat (5.4. b ábra). 3. Jófolytatás (pregnancia): azokat a körvonalszegmenseket csoportosítjuk körvonalegésszé, melyek görbülete a legkevesebbet változik, más szavakkal: az egyenes vagy a folyamatos görbület mentén elhelyezkedő pontok tartoznak össze. Ezért látunk egy kört és egy X-et az 5.4. c) ábrán. 4. Közelség: az egymáshoz közelebbi tárgyakat csoportosítjuk (5.4. d ábra). 5. Közös sors: az együtt (egy irányban, azonos sebességgel) mozgó tárgyakat egységnek látjuk. 6. Ismertség: a dolgok könnyebben alkotnak csoportokat, ha a kialakuló egész ismert, és könnyen értelmezhető.
5.4. ábra. A Gestalt-törvényekbõl néhány: a) egyszerûség, b) hasonlóság, c) jó folytatás, d) közelség Hogyan alakulnak ki ezek a szabályok? Valószínűleg tanulás és tapasztalat útján: az egyedfejlődés alatt a környezettel való interakció során észlelt szabályszerűségek alakítják őket. A szabályszerűségeket azonban a vizuális feldolgozórendszer működési sajátosságai határozzák meg. Ezekre később visszatérünk.
1.2.1. Hogyan játszanak szerepet a Gestalt-törvények a körvonalak integrációjában? A Gestalt-pszichológusok feltételezték, hogy bizonyos törvények, mint amilyen például a „jó folytatás”, már a perceptuális szerveződés korai szakaszaiban is működnek. David Hubel és Thorsten Wiesel (1968) tanulmánya óta tudjuk, hogy a V1 neuronjai erős szelektivitást mutatnak a bemutatott vizuális inger (vonaldarab) irányára (erről bővebben már szó volt a látás alapvető folyamatait ismertető 3. fejezetben). Így például az 5.4. c) ábrán 96 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése látható körvonal egyes darabkáira más-más Vl-neuronok reagálnak a legjobban. Ez a tulajdonság további bizonyíték arra, hogy a V1 szerepet játszik a körvonal-szegregációban. Ugyanakkor, mivel a Vl-neuronok többségének receptívmező-mérete kicsi, csak egy (maximum néhány) vonaldarab kerül egyszerre receptív mezejükbe. Hogyan integrálódik egésszé a sok izolált vonaldarabka? A magyarázat abban rejlik, hogy az egyes vonaldarabkákat kódoló Vl-neuronok válaszát befolyásolják a mellettük lévő neuronok, illetve a klasszikus receptív mezejükön kívüli, úgynevezett kontextuális ingerek is. Egyrészt tudjuk, hogy a darabokból álló kontúrok detekciója jobb, ha az ingerek azonos tengelyre esnek, illetve ha zárt alakzatot alkotnak (KovácsJulesz 1993). Másrészt közvetlen bizonyíték is van arra, hogy a neuronok válasza nagyobb egy adott irányú vonaldarabra, ha azzal ko-lineárisan, vagyis vele megegyező irányban, a receptív mezőn kívül egy másik vonaldarabka is elhelyezkedik (Hess et al. 2003). (A téma részletes összefoglalását lásd Kovács 1996.)
5.5. ábra. Illuzórikus vagy szubjektív kontúrok alapján kialakuló alakzat, a „Kanizsa-háromszög”
1.2.2. Illuzórikus kontúrok Eddig olyan körvonalakról, kontúrokról beszéltünk, melyek úgy alakulnak ki, hogy az alakzat és környezete valamilyen fizikai paraméterében különbözik. Egy tárgyat, vagyis annak kontúrját definiálhatja az, hogy világosabb vagy sötétebb a hátterénél (fényességkontraszt), más színű (színkontraszt), más mintázatú (mintázatkontraszt), más háromdimenziós síkban helyezkedik el (diszparitás), vagy hogy alkotó pontjai más irányban mozognak, mint a háttér elemei (relatívmozgás-kontraszt). Ezekben az esetekben valódi kontúrok kialakulásáról beszélünk. Az 5.5. ábrán látható háromszöget (melyet leírójáról, a Gestalt-pszichológus Gaetano Kanizsáról Kanizsa-háromszögnek nevezünk) olyan kontúrok alkotják, melyek esetében nincs ilyen fizikai paraméterkülönbség a háromszög és annak háttere között. Mégis az élmény igen élénk, legtöbbünk éles határokkal elkülönülő háromszöget lát három fekete kör felett (nem pedig három, részben már megkezdett pizzaszeletet). Az élménynek több alkotója van: 1. a háromszöget alkotó vonalak egységes felületté integrálódnak, mely felület 2. fényesebb a hátterénél, és 3. az azt generáló három fekete felszín előtt helyezkedik el, melyeket 4. teljes körré egészítünk ki gondolatban. Számos pszichofizikai mérés mutatja azt is, hogy a valódi kontrasztok mentén kialakuló kontúrok és ehhez hasonlóan az feldolgozás kezdeti lépéseitől fogva hasonlóképpen viselkednek, és interakcióba lépnek egymással. Ennek megfelően kimutatták, hogy a V1 és a V2 neuronjai is hasonlóképpen reagálnak illuzórikus és valódi kontúrokra. Ester Peterhans és Rüdiger von der Heydt nagy hatású kísérleteikben (Peterhans – von der Heydt 1989) majmok V2-neuronjainak aktivitását regisztrálták mozgó, luminanciakontrasztú fénycsíkra és azonos irányú illuzórikus kontúrra, és azt találták, hogy a neuronok az utóbbira is reagáltak, bár ekkor receptív mezejükben nem volt semmilyen fizikai inger. Lee és Nguyen (2001) hasonló eredményekről számolt be a V1 neuronjait illetően is (bár az illuzórikus ingerekre kapott neuronális válaszok latenciája lényegesen hosszabb volt, mint a valódi kontúroké). Az illuzórikus kontúrok esetében szembeötlik ismét mindaz, amit a Gestalt-elméleteknél már leírtunk: sokszor a kép elrendezéséből eredő legegyszerűbb interpretáció (egy háromszög három kör előtt) csak a kép egészében létezik, de annak részleteiben nem. Ezt az egyszerű és egyértelmű leírásra való törekvést nevezzük perceptuális szerveződésnek. A következőkben a tárgyak ezen szerveződésének jelenlegi modelljeit vizsgáljuk meg.
1.3. A tárgylátás modelljei 97 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése A tárgyfelismerés számos modellje közül a továbbiakban két olyan alapvetően eltérő megközelítéssel foglalkozunk, amelyek a jelenkor kognitív tudományában a legnagyobb súly- lyal szerepelnek. Ez a két megközelítés a történetileg korábban keletkezett strukturális felismerés, illetve a későbbi képalapú felismerési modellek csoportja.
1.3.1. Strukturális felismerési modellek A strukturális modellek között Marr komputációs megközelítését és Biederman komponensalapú felismerés modelljét tárgyaljuk. David Marr és kollégái a bostoni MIT-en (Massachusetts Institute of Technology) alkották meg az első olyan tárgyfelismerési modellt, mely komplex módon képes válaszolni a tárgylátás problémáira (Marr-Nishihara 1978), és amely a kognitív pszichológusok körében máig népszerű. Megközelítésükben a következő kérdéseket próbálták megválaszolni: „Mit kellene egy számítógépprogramnak tennie ahhoz, hogy egy képen a tárgyakat pontosan regisztrálják? Milyen program lenne erre képes?” A tárgyészlelés folyamatát három fő szinten tárgyalták: 1. a komputációs elmélet, 2. a reprezentáció és a végrehajtó algoritmus, valamint 3. a szükséges hardver. Az elmélet a retinára vetülő képpel kezdődik (5.6. ábra). Az algoritmus ezután a képben lévő sötét és világos részeket analizálja. Ennek eredménye egy durva első vázlat, amelyen a képen található vonalak, körvonalak és olyan zárt alakzatok, mint egy kör, ellipszis, is megtalálhatóak már. Ebből a vázlatból azután a Gestaltszabályok alapján egy a már általunk látott képhez is hasonló, úgynevezett két és fél dimenziós (2,5 D) vázlat keletkezik. A végső lépésben ez a vázlat alakul tovább háromdimenziós (3-D) képpé.A Marr-modell erőssége, hogy könnyen létre tud hozni egy nézőpontfüggetlen tárgyreprezentációt, ugyanakkor nem világos, hogy hogyan is jön pontosan létre ez a háromdimenziós reprezentáció: sem az elméletben nincs világosan kifejtve, sem kísérleti adatok nem támasztják alá a részleteit.
5.6. ábra. David Marr komputációs alakfelismerés-elméletének vázlata A Los Angeles-i Irving Biederman (University of South California) által megalkotott komponensalapú felismerés modell vagy RBC-elmélet (Recognition by components) nagyon hasonló az előzőekben vázolthoz, ugyanakkor lényegesen tovább is fejleszti azt (Biederman 1987). Biederman szerint a tárgyakat határoló körvonalaik konkáv területein részekre bontjuk, és ezek a részek mint háromdimenziós elemek (henger, kocka, gömb, piramis stb. – 5.7. ábra) tárolódnak el memóriánkban. Ezek az elemek az úgyneve- zettt geometrikus ikonok, rövidített elnevezésük a geon. A geonok elkülönítése olyan, „nem véletlenszerű” tulajdonságokon alapul, amelyek pusztán véletlenül nem vagy csak nagyon ritkán fordulnak elő (ilyen tulajdonság például az, hogy egy görbe vonal csak speciális nézőpontból látszik egyenesnek, vagy hogy az egymás felé konvergáló vonalak nem látszanak párhuzamosnak). Ennek köszönhetően az egyes geonok nézőponttól függetlenül felismerhetők és megkülönböztethetők egymástól. Mivel az egyes geonok nézőpontfüggetlen módon felismerhetőek, magának a létrehozott tárgynak a felismerése is nézőpontfüggetlen lesz. Ez azt jelenti, hogy egy adott tárgynak egy vagy csak néhány nézőpontját kell a memóriánkban eltárolni. Az RBC-elmélet szerint a világ körülbelül harmincféle ilyen geonból legójátékszerűen felépíthető, ha a tárgyat alkotó geonok közötti térbeli viszonyokat meghatározzuk (a gomba törzsét alkotó henger tetején van a kalapot reprezentáló kúp).
98 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése 5.7. ábra. Irving Biederman strukturális alakfelismerés elméletének néhány eleme, geonja Az RBC-elmélet egyik legnagyobb előnye, hogy korlátozott számú elem felhasználásával képes a tárgyak nézőpontfüggetlen leírására. Ugyanakkor az elmélet nem tér ki arra, hogy számos esetben nemcsak a határoló körvonalak, hanem a tárgyak felülete is fontos a tárgyfelismerésben (gondoljunk például arra, hogy sokkal nehezebb egy piros, mint egy sárga banán felismerése). Többek között azt is nehéz az RBC-elmélet segítségével magyarázni, hogy miként történik az azonos geonokból felépülő, de egymástól részleteikben nyilvánvalóan különböző tárgyak megkülönböztetése, kategorizációja (például számos szék azonos számú és elrendezésű geonból áll, mégis megkülönböztethetőek egymástól). Vita folyik arról is, valójában mennyire nézőpontinvariáns a tárgyak felismerése, és úgy tűnik, hogy ezeket az ellentmondásokat próbálják megoldani a képalapú elméletek.
1.3.2. Képalapú modellek A strukturális felismerési elméletek legelterjedtebb alternatívája a képalapú reprezentáció. A képalapú reprezentációk közös jellemzője, hogy a feldolgozás során úgy őrződnek meg a tárgyak tulajdonságai (alakjuk, színük, textúrájuk egyaránt), ahogy azok a látott képen megjelentek. Az ilyen elméletek (Bülthoff-Edelmann 1992, Tarr-Bülthoff 1995) szerint a tárgyaknak nem egy háromdimenziós reprezentációja létezik, hanem számos kétdimenziós reprezentáció írja le az adott tárgyat, mégpedig számos eltérő nézőpontból. Éppen ezért az ilyen elméleteket nézőpontfüggő elméleteknek szokás nevezni. A kísérleti adatokból valóban úgy tűnik, hogy a tárgyfelismerés számos esetben függ a tárgy nézőpontjától: ismeretlen tárgyakat előzőleg már látott nézőpontból gyorsabban és kevesebb hibával ismerünk fel, mint az addig nem látott nézőpontokból. A képalapú elméletek szerint, ha ismert nézőpontokból látjuk a tárgyat, azt már annak létező kétdimenziós reprezentációjához illesztjük. Egy előzőleg nem ismert nézőpontból látva valamit, azt először a már ismert nézőpontokhoz kell hasonlítani. Mindez időigényes folyamat, és megnövekedett válaszidőhöz (-latenciához), illetve hibázáshoz vezet. További előnye a képalapú reprezentációknak, hogy (ellentétben a strukturális elméletekkel) könnyen magyarázzák az egyes kategóriákon belüli diszkriminációt is: nemcsak a tárgyak eltérő nézetei, hanem azok eltérő vonásai is külön reprezentálódnak. A képalapú elméletek a tárgyészlelés magyarázatában előnyös tulajdonságaik mellett súlyos problémákat is felvetnek. Először, egy adott tárgyról több reprezentációval kell rendelkeznünk, és mindez a dolgok elvileg végtelen számát tekintve, könnyen úgynevezett kombinatorikus robbanáshoz vezethet. Másodszor, nehéz magyarázni azt, hogy egy tárgy különböző nézeteiről honnan tudjuk, hogy ugyanahhoz a tárgyhoz tartoznak, és nem más, hasonló tárgyakhoz. Harmadszor, a képalapú elméletek nem mondanak semmit a tárgyakat alkotó részek egymáshoz való viszonyáról sem. Jelenleg úgy tűnik, hogy a strukturális és a képalapú megközelítés elemei egyszerre érvényesek az emberi tárgyfelismerés folyamataiban, és egy teljességre törekvő elméletnek mindkét elméletből egyszerre kell merítenie.
1.4. Látni tanulni: tanulás az alak- és tárgyészlelésben Bármennyire furcsán hangzik is, mint minden mást, a „látást” is meg kell tanulni. Fokozottan igaz ez a tárgylátásra. Nem minden tárgy látható egyformán jól, és egy adott tárgy láthatóságát, felismerhetőségét és értelmezését is befolyásolja számos környezeti tényező (a megvilágítás, a távolság, a környezet stb.). A ragadozó és a prédaállat számára egyaránt fontos például, hogy a másik ne vegye könnyen észre (5.8. ábra). Gyakorlással ugyanakkor a megfigyelő fejleszti azon képességét, mely lehetővé teszi számára a látott világ dolgainak felismerését, olyan vonások detektálását, melyeket a gyakorlás előtt nem vett észre. Példának gondoljunk az erdei nyomkeresőkre vagy a radiológus orvosokra, akik a hétköznapi embernél sokkalta jobban értenek a nyomolvasáshoz, illetve a daganatos elváltozások detektálásához. Számos kísérleti helyzetben tanulmányozták már a fenti tanulási folyamatokat. Mi ezek közül most csak a fejezet anyagához legszorosabban kapcsolódó két példát említünk. Az egyik esetben az alak-háttér elkülönítés nehézsége okozza a problémát, a másik esetben pedig egyszerre több, egymásnak ellentmondó lehetséges értelmezése létezik ugyanazon képnek.
99 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése
5.8. ábra. Nehezen felismerhető és kétérelmű ábrák. a) Ha a háttér és a tárgy színében, mintázatában is hasonló, akkor nehéz észrevenni. Ezt használja ki számos állat rejtőszíne és mintázata. b)–c) Mi van a képen? Fordítsuk el 180 fokkal a könyvet, hogy könnyebb legyen megfejteni őket. További segítséget a szöveg tartalmaz. d)–h) Példák kétértelmű képekre. d) Freud anyósa és felesége. Látjuk az idôs hölgy arcát és a fiatal nő elfordított profilját is? e) A Necker-kocka. Milyen irányba dől a kocka? f) Ragadozó madár vagy egy liba? Melyik irányba repül? g) Nyúl vagy kacsa? h) A Mach-könyv. A szöveges rész vagy a borító néz felénk? A környezeti elemek hatása a tárgy felismerésére Mint láttuk, minden tárgy felismerésének alapfeltétele, hogy hátterétől el tudjuk különíteni (perceptuális szegregáció). A szegregáció alapjául szolgálhat az, hogy a tárgy hátterénél világosabb vagy sötétebb (pl. 5.3. ábra). Egyértelmű, hogy a tárgy-háttér szegregációjánál a két felület találkozásánál kialakuló világosság- vagy luminanciakontraszt az, ami lehetővé teszi a perceptuális szegregációt. Kontraszt kialakulhat azonban két azonos fényességű, de eltérő színű, mintázatú, mozgású vagy egy másik, a harmadik dimenzió síkjában elhelyezkedő felület között is. Azt a fizikai paramétert, amely a látható kontrasztot létrehozza, vizuális kulcsnak (visual cue) nevezzük. A vizuális kulcs az általánosságban észlelési kulcsnak nevezett paraméterek egyike. (Mint később látni fogjuk, a hallási tárgyak észlelésekor is működnek észlelési kulcsok.) Bizonyos körülmények között, amikor a tárgyat meghatározó kontraszt alacsony, az nem válik el élesen a hátterétől. Ilyenkor a tárgy perceptuális szegregációja, vagyis az alakzat háttértől való elkülönítése és ezáltal a tárgy detektálása nehéz. Az 5.8. a) ábra egy ilyen helyzetet mutat be, amikor is az ábrán látható gepárd környezetéhez alkalmazkodó rejtőszínt és mintázatot (kamuflázs) vesz fel. Azt a mozdulatlan tárgyat (állatot), melynek színe megegyezik a háttér színével, és felületének mintázata is ahhoz hasonló, igen nehéz észrevenni. Hosszú, sokszor hetekig, nemritkán hónapokig tartó, rendszeres gyakorlással azonban az ilyen tárgyak detektálása is javítható. Ilyenkor perceptuális tanulásról beszélünk, melynek részleteiről a későbbi kötetekben lesz majd szó. A nehezen felismerhető tárgyak két érdekes példája látható az 5.8. b) és az 5.8. c) ábrán. Mit látunk a képeken? Ha még nem találkoztunk velük, akkor csak fekete és fehér foltok értelmetlen összevisszaságát látjuk. (Segítségként fordítsuk el 180 fokkal a könyvet, és próbáljuk most megfejteni a képeket. További segítségként az 5.8. b ábrán egy kutya, míg az 5.8. c ábrán egy emberi arc képe látható.) Az ilyen, csak teljesen fekete és teljesen fehér árnyalatokból álló képeket úgy hozzák létre, hogy igen erős megvilágítás mellett megnövelik a kép kontrasztját, ami a fényes részeket „beégeti”, míg a sötét területeket részletek nélkül, feketén hagyja. (Arcok esetében leírójukról Mooney-arcoknak nevezik ezeket a képeket.) Mivel ilyenkor a háttér elemei is véletlenszerűen lesznek fehérek, illetve feketék, azok megzavarják a tárgyak kialakulását lehetővé tévő Gestaltszabályokat (elsősorban a zártság, a közelség, a jó folytatás szabályait), és a képet érthetetlenné teszik. A zavar abban rejlik, hogy ezeken a Mooney-képeken a tárgy nem alkot zárt egészet, és egyes darabjai hasonlóbbak és közelebb vannak a háttér elemeihez, valamint görbületük is jobban egybeesik a háttér elemeinek görbületével, mint a tárgy más részeiével. Ellentétben az előző pontban leírtakkal, az ilyen képek esetében a tanulás hirtelen, gyorsan zajlik le, és nagyon sokáig fennmarad. Az egyik percben még értelmetlen képből egyszer csak
100 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése kiemelkedik egy dalmát eb vagy éppen egy színes bőrű békeharcos képe, amit azután he- tekkel-hónapokkal később is könnyű lesz felismerni. Sokszor segít az ilyen tanulásban a „felülről lefelé” jövő információ, vagyis, ha megtudjuk, hogy egy kutyát vagy arcot kell keresni a képen, illetve, ha figyelmünket valaki a kép egy adott részére irányítja (a kutya a kép jobb felső negyedében található), vagy ha bemutatják a megfigyelőnek a kép nem manipulált, eredeti változatát is. A folyamat részleteit szintén a perceptuális tanulás fejezeteiben fogjuk a későbbiekben tárgyalni.
1.4.1. Kétértelmű képek Bár agyunk számítási kapacitása csodálatra méltó, egymásnak ellentmondó adatok alaposan zavarba ejthetik. Az 5.8. d)-h) ábrán olyan képek láthatók, melyek hátterüktől jól elkülöníthetőek, mégis „furcsák”, mivel egyszerre többféle, ellentmondó értelmezésük létezik. Az 5.8. e) ábrán például a legtöbb olvasó hol egy jobbra lefelé, hol pedig egy balra felfelé fordított kockát lát majd. A két kép váltakozása spontán, ritmikus és folyamatos. Az ilyen, egymással rivalizáló, kétértelmű képek esetében is segíti az egyik vagy másik értelmezést a „felülről lefelé” történő információáramlás. Az 5.8. d) képen például az idős hölgy profilja mellett nem mindenki fogja elsőre észrevenni, hogy egy fiatal hölgy elfordított arca is látható. Segít azonban, ha eláruljuk, hogy az idős nő orra egyben a fiatal nő elfordított bal arca is. Az ilyen képek érdekessége abban rejlik, hogy a vizuális bemenet (vagyis a kép maga) változatlan, agyunk mégis hol az egyik, hol a másik „értelmezés mellett dönt”. A folyamat idegrendszeri korrelátumairól a tudatról szóló tanulmányok során esik szó. Egyelőre annyit jegyezzünk meg velük kapcsolatban, hogy egy adott kép értelmezése nemcsak passzívan az „alulról felfelé” áramló információtól (vagyis a képtől) függ, hanem a megfigyelő azt aktívan tudja figyelme irányításával, tanulással is befolyásolni.
2. Tárgyreprezentáció az agykéregben A fejezet első részében megismerkedtünk azzal, hogy miért is nehéz feladat egy adott tárgy felismerése. Viselkedési adatok segítségével mutattuk be, hogy az alakzatok és tárgyak észlelése milyen lépésekben történik, és elemeztük a tárgylátás két legfontosabb modelljét. A továbbiakban azokat az adatokat mutatjuk be, amelyek a főemlősök (főleg az ember és a legtöbbet tanulmányozott makákómajom) tárgyfeldolgozó agykérgi rendszeréről jelenleg rendelkezésünkre állnak. Mint láttuk, minden tárgy felismerésének alapfeltétele, hogy hátterétől el tudjuk különíteni (perceptuális szegregáció). A szegregáció alapjául szolgáló fizikai paramétert, amely a látható kontrasztot létrehozza, nevezzük vizuális kulcsnak. Nagyon sok adatunk van arról, hogy az egyes vizuális kulcsok által szolgáltatott információt nagyrészt elkülönült módon dolgozza fel az agykéreg. A vizuális kulcsok alapján két fő agykérgi feldolgozó rendszert lehet elkülöníteni: a dorzális rendszert, mely inkább a kép mozgásáért, elemeinek térbeli viszonyaiért és az ezekkel végzett manipulációkért felelős, valamint a ventrá- lis rendszert, mely elsősorban a tárgyak színéért és milyenségéért felelős. A két vizuális rendszer legfontosabb tulajdonságaival már a látás alapvető folyamataival foglalkozó fejezetben is megismerkedhettünk, illetve a főbb jellemzőket Az emlősagy vizuális rendszere című szövegdobozban (165. o.) külön is összefoglaltuk. Ezért a továbbiakban a tárgyfelismerésben fontosabb szerepet betöltő ventrális rendszer tulajdonságaira koncentrálunk.
2.1. A ventrális vizuális rendszer Mint korábban láthattuk, a két vizuális rendszer a nyakszirti vagy tarkólebenyen elhelyezkedő elsődleges látókéregből indul ki. Innen az információ a másodlagos (V2), majd a negyedleges (V4) vizuális agykérgi területen keresztül jut el a halánték- vagy temporális lebeny alulsó részén elhelyezkedő inferior temporális kéregbe (IT). Számos érv szól amellett, hogy a tárgyak durva feldolgozási lépéseit egyre finomodó lépések követik egy több lépcsőből álló hierarchikus rendszer működésének eredményeképpen. Nézzük meg egyenként a legfontosabb érveket ezen állítás mellett (Rousselet et al. 2004)! A feldolgozási hierarchiának itt a V1-et és V2-t követő területeire koncentrálunk, tekintettel arra, hogy ezek tulajdonságait a korábbi fejezetek már tárgyalták. 1. A ventrális rendszer állomásainak neuronális latenciája fokozatosan hosszabbodik. Egy inger (pl. egy arckép) megjelenésére a neuronok adott késéssel, latenciával válaszolnak. Ez a latencia, amely egyébként jellemző az adott agykérgi területre, a ventrális rendszerben előrehaladva fokozatosan nő (5.9. ábra). A legrövidebb latencia a Vl-neuronokra (majmok esetében átlagosan 60 ms), míg a leghoszabb latencia az IT neuronjaira jellemző (100-120 ms). Ez a latencianövekedés arra utal, hogy az információ a Vl-ből a V2-be, majd onnan a V4-be és végül az IT-be kerül, vagyis alapvetően soros módon dolgozódik fel.
101 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése 2. Az egyes állomások neuronjaira jellemző receptív mező mérete fokozatosan növekszik. Míg a Vl-neuronok receptív mezejének átlagos mérete 0,5-1,5 fok között változik (kb. akkora, mint kinyújtott karral nézve hüvelykujjunk körme), addig az IT-neuronok receptív mezeje igen nagy, ennek akár százszorosa is lehet. A receptív mezőnek ez a méretnövekedése annak köszönhető, hogy a ventrális rendszerben igen erős a kapcsolatok konvergenciája. Jusson eszünkbe, hogy a konvergencia fogalmával már találkoztunk korábban, a receptor-ganglionsejt konvergenciaeltéréseivel kapcsolatban, ami magyarázattal szolgált az M és P sejtek működésében az eltérő téri felbontásra. Itt is hasonlóról van szó, azaz például arról, hogy az IT-neuronok nagyon sok alacsonyabb területen elhelyezkedő (és kisebb receptív mezejű) neurontól kapják bemenetüket. Míg a kis receptív mezejű neuronok a látótérbe kerülő kép finom részleteiről és helyéről szolgáltatnak precíz információt, addig a nagy receptív mező akkor hasznos, ha a látótér nagyobb részéről jövő információt kell integrálnunk (például olyankor, amikor egy adott tárgyat helyzetétől függetlenül kell felismernünk). 1. Az egyes állomások neuronjai az ingerek egyre bonyolultabb vonásaira érzékenyek. Míg a V1-neuronok leginkább adott irányú vonalakra, illetve élekre érzékenyek, addig a hierarchiában feljebb elhelyezkedő területek egyre komplexebb és absztraktabb kontúrokra, geometriai mintázatokra érzékenyek. A V2 esetében vonalak és egyszerű geometriai ábrák, a V4 neuronjainál komplex, színes, 3-D tulajdonságokkal is rendelkező geometriai ábrák, az IT neuronjai esetében viszont bonyolult tárgyak, kategóriák, emberi, illetve állati arcok váltják ki a legnagyobb választ. Van-e a ventrális rendszer hierarchiájának csúcsa? A kezdeti tárgyfelismerési elméletek szerint a ventrális vizuális rendszer csúcspontján lévő neuronok mindegyike csak és kizárólag egy adott tárgyat, illetve jelenséget kódol. Ezeket a neuronokat kardinális sejteknek vagy megismerési egységeknek nevezték el. Leggyakrabban mégis mint nagymamasejteket emlegetik őket, mivel ha ez az extrém tárgyszelektív kódolás létezne, ezek az idegsejtek egyedül nagymamánk képére aktiválódnának. Könnyen belátható, hogy az ilyen neuronok megléte gyakorlatilag nem gazdaságos, elvileg pedig nem lehetséges. Egyrészt, ha elveszítenénk a nagymama-felismerő idegsejtünket, akkor legközelebb már nem ismernénk fel őt. Másrészt, nyilvánvalónak látszik, hogy véges számú agykérgi neuronjaink nem lennének elegendőek a környező világ végtelen számú dolgának felismerésére. A legfőbb ellenérv a kardinálissejt-modellel szemben az a teljesítményünk, hogy előzetes tapasztalatainkat összegezve képesek vagyunk az olyan tárgyakat is felismerni, melyeket addig még nem láttunk, és amelyekre éppen ezért nem létezhet felismerőegység sem. A hierarchia tetején elhelyezkedő terület, az IT tehát nem az egész tárgyfelismerésnek, hanem csak a ventrális rendszernek a végső állomása. A tárgyakkal kapcsolatos érzelmi, emlékezeti, feladatfüggő döntésekkel kapcsolatos információ további feldolgozó lépéseket igényel (ezekkel az Általános pszichológia 2. kötete több helyen is foglalkozik).
5.9. ábra. A ventrális rendszer állomásainak vázlatos reprezentációja. A V1, V2, V4 és az IT közötti hierarchikus rendszer egyes területeinek átlagos latenciája, receptívmezõ-mérete és a terület által leginkább kedvelt vizuális ingerek példái
102 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése
2.2. V4 – a színlátás agykérgi központja? Ahogy a dorzális rendszer fő mozgásfeldolgozó területe a V5/MT (lásd az előző fejezeteket, illetve a Mozgásészlelés című fejezetet), úgy tűnt, hogy a színlátás kérgi központja a V1/V2 után következő ventrális rendszerhez tartozó terület, a V4. Az első tanulmányok szerint a terület neuronjai rhesusmajom agyában a fény hullámhosszára igen érzékenyek. Semir Zeki londoni kutató nevéhez fűződik a terület színspecializálódásának leírása és annak felvetése, hogy a V4 egy szelektív színfeldolgozó modul lenne (Bartels-Zeki 2000). Ugyanakkor részletes újabb tanulmányokban sikerült kimutatni, hogy a V4 szerepe mesz- sze túlmutat a színfeldolgozáson. Egyrészt, nem minden V4-neuron érzékeny a tárgyak színére. Másrészt, a neuronok érzékenyek vonalak irányára, egyszerű és bonyolultabb geometriai ábrákra is. Harmadrészt, a tárgyak 3-D tulajdonságai és mozgása is befolyásolja a V4-neuronok aktivitását. Mindebből úgy tűnik, hogy a majmok V4 területének funkciói nem merülnek ki a fény hullámhosszának érzékelésében, és komplex szerepet töltenek be a tárgyfelismerésben. A fenti majomkísérletektől függetlenül felmerült, hogy az emberi agyban is lenne egy központi színfeldolgozó terület. Feltártak ugyanis egy olyan területet, amelyről úgy gondoljuk, hogy a majmok V4 területének emberi megfelelője (homológja) (5.10. ábra), ezért szintén V4-nek nevezzük. Ennek a területnek az irtása, illetve kiesése (léziója) emberben szelektív színlátászavarokhoz (akromatopszia) vezet. Később funkcionális képalkotó eljárásokkal (PET és fMRI, amelyek működését röviden ismertettük az észlelés természetéről szóló bevezető fejezetben) kimutatták, hogy a terület erős színszelektivitást is mutat. Bár még számos kérdés nyitott a V4 tulajdonságait illetően (egy vagy több agyi területről van-e szó; valóban homológjai-e egymásnak a majom és az ember V4 területei, s ha igen, mennyire, stb.), annyi bizonyos, hogy a ventrális vizuális rendszer és azon belül is a V4 az embernél jelentős szerepet játszik a színfeldolgozás több lépésében is.
5.10. ábra. A V4 megközelítõ helye az emberi agykérgen az agy ventrális nézetén (az ábra
2.3. Inferior temporális kéreg – a tárgylátás központi területe Charles Gross, valamint Robert Desimone munkacsoportjában az elsők között írták le (Gross et al. 1972, Desimone-Gross 1979), hogy a majomagykéreg temporális lebenyének neuronjai komplex tárgyakra és nem utolsósorban arcokra reagálnak a legjobban. Az azóta eltelt idő alatt az inferior temporális kéreg a ventrális rendszer egyik legtöbbet tanulmányozott agykérgi területe lett (Fujita 2002). Az IT neuronjainak válasza többé vagy kevésbé bonyolult alakzatokra (keresztek, rácsminták, valós és számítógéppel generált tárgyak, emberi és állati arcok, más testrészek stb.) a legnagyobb (5.11. ábra). Az egyes neuronok általában néhány tárgyra vagy alakzatra válaszolnak szelektíven. Nincs azonban olyan neuron, amely
103 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése kizárólag egy adott tárgy képére aktiválódna, tehát a kezdeti elképzelésekkel ellentétben az IT-ben sincs nagymamasejt! Egy neuron mindig több alakzatra reagál, igaz, eltérő mértékben. Ez a tárgyszelektivitás az alapja lehet a tárgyfelismerésnek. Ha ez így van, akkor a tárgyfelismerésre jellemző tulajdonságokat az IT-neuronoknak is tükrözniük kell. Az 5.2. ábra bemutatta azokat a legfontosabb tulajdonságokat, melyekre nézve tárgyfelismerésünk invariáns, vagyis ugyanazon tárgyaknak a tulajdonságoktól független felismerését teszik lehetővé. Nézzük most meg, hogy hogyan tükröződnek ezek az invarianciák az IT neuro- nális válaszaiban.
2.3.1. Invarianciák az inferior temporális kéregben Az egyik legnyilvánvalóbb perceptuális invariancia, hogy ugyanazt a tárgyat helyétől függetlenül fel tudjuk ismerni. Ennek a jelenségnek a kialakulásához az kell, hogy a neuronok hasonlóan válaszoljanak a tárgyakra, függetlenül azok receptív mezőn belüli helyzetétől. Az IT-neuronok receptív mezeje általban igen nagy, magában foglalja az éles látás helyét, a sárgafoltot, valamint csaknem az egész ellenoldali látómezőt, illetve részben az azonos oldali látómezőt is. Ezen a nagy receptív mezőn belül a neuronok hasonlóan aktiválódnak egy adott tárgyra, mégpedig függetlenül annak helyétől. Valószínűsíthető tehát, hogy a pozicionális invariancia jelenségének a hátterében az ilyen IT-neuronok állnak. A pozícióinvarianciához hasonlóan, tárgyfelismerésünk méret-, szín-, kontraszt- és vizuáliskulcs-független is. Ennek alapja úgyszintén az IT-neuronok alakszelektivitásának méret-, szín-, kontraszt- és vizuáliskulcsfüggetlensége, azaz invariáns természete lehet (Sáry et al. 1995, Kovács et al. 1995, 2003). Ez azt jelenti, hogy ha egy neuron például egy alma, egy pohár, egy szék és egy kutya képére egyre csökkenő mértékben válaszol, akkor ez az alakszelektivitás többé-kevésbé megmarad, ha az adott tárgyak méretét, színét, kontrasztját, illetve az őket definiáló vizuális kulcsokat változtatjuk.
5.11. ábra. Az inferior temporális kérgi neuronok által preferált vizuális ingerek egy reprezentatív csoportja. A képek a Szegedi Tudományegyetem Élettani Intézetének vizuális laboratóriumában végzett kísérletek során használt ingereket ábrázolják
2.3.2. Az inferior temporális kéreg oszlopos elrendeződése Hasonlóan a V1-hez, az IT is oszlopos (kolumnáris) elrendeződést mutat. Ez azt jelenti, hogy a hasonló tárgyakra szelektív neuronok lokális csoportokba rendeződnek. Ezek a neuroncsoportok végighúzódnak a kéreg
104 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése rétegein, és úgynevezett agykérgi oszlopokat alkotnak (5.12. ábra). Egy adott tárgyra egyszerre több ilyen agykérgi oszlop, vagyis egyszerre több tízezer neuron hálózata aktiválódik, mégpedig eltérő mértékben. A legújabb elképzelések szerint a különböző tárgyakat átfedő, de aktivitásukban eltérő neuronális hálózatok kódolják. Tehát mondjuk egy alakzatra a legnagyobb tüzelési frekvenciával az 5.12. ábra jobb sarkában látható oszlop neuronjai válaszolnának, ám kisebb mértékben ugyan, de adna választ a többi oszlop neuronja is. Egy arcra az 5.12. ábra arcoszlopának neuronjai válaszolnának a legnagyobb aktivitásfokozódással, de azért a oszlop idegsejtjei is reagálnának, csak kevésbé. Ugyanazon idegsejtcsoport (hálózat) eltérő aktivitásmintázata által tehát képes lenne egyszerre számtalan tárgyat „kódolni”.
5.12. ábra. Az inferior temporális kéreg oszlopos szerkezete. Az egyes oszlopokat eltérõ szürke árnyalatok jelölik. Az oszlopok által leginkább preferált vizuális ingereket az oszlop oldalán látjuk
2.4. Az emberi tárgyfeldolgozó rendszer Az emberi agy ventrális vizuális rendszere alapfelépítését tekintve megegyezik a majmok agyánál leírtakkal, de a részleteket tekintve jelentősek az eltérések. Az ember ventrális rendszere is a V1 és V2-ből indul ki, majd a V4-ben folytatódik. Az elmúlt években, a funkcionális képalkotó eljárások (eleinte a PET, majd később dominánsan az fMRI) fejlődésével ugyanakkor nemcsak ezeknek az alacsonyabb rendű vizuális területeknek, hanem a magasabb szintű, komplexebb területeknek a feltérképezése is megkezdődött (Malach et al. 2002). Ezek a tanulmányok azt igazolták, hogy a nyakszirti és a halántéklebenyek oldalsó (laterális) és alsó (ventrális) felszínén egy nagy kiterjedésű, összetett agyterület található, amelynek meghatározó szerepe van a tárgyfelismerésben. Ez a terület a LOC, a laterális okcipitális komplexum (Lateral Occipital Complex; 5.13. ábra). A vizsgálatok szerint a terület aktivitása megnövekszik, ha a kísérleti személyeknek tárgyak (3-D tárgyak, körvonalrajzok, emberi arcok stb.) képét mutatják, míg mintázott felületekre, véletlenszerű vizuális zajra a terület nem reagál. Az LOC, hasonlóan a majmok IT kérgéhez, nem retinotopikus, vagyis a bemutatott tárgy helyétől függetlenül aktiválódik. E mellett a pozicionális invariancia mellett a terület méret- és vizuáliskulcs-, illetve minden valószínűség szerint nézőpont-invarianciát is mutat. A terület hasonlóképpen aktiválódik tárgyak fényképére és azok körvonalrajzaira is. Mindezek az adatok arra utalnak, hogy a LOC igen hasonló tulajdonságokat mutat a tárgyfelismerés jelenségeihez, és ez valószínűsíti, hogy fontos szerepet játszik abban.
105 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése 5.13. ábra. Az ember nyakszirti és halántéklebenyének alulsó részén található, tárgyfelismerésben fontos területek megközelítõ helyzete. Baloldalt alulsó, jobboldalt alulsó-oldalsó nézetben látszanak az agyféltekék. A többféle tárgykategóriára aktív LOC (laterális okcipitális komplexum) részben magában foglalja az EBA-t (extrastriatális testterület), mely testrészekre, és az FFA-t (fuziformis arcterület) is, mely szelektíven arcokra aktív. A PPA (parahippokampális helyterület) ettõl kissé elkülönülve található. Az agyat úgynevezett felfújt állapotban mutatjuk; gyrusok: sötét sávok, sulcusok: világos sávok
2.4.1. Az emberi agykéreg kategóriaspecifikus területei A legújabb vizsgálatok szerint a nyakszirti és halántéklebenyek területén, részben a laterális okcipitális komplexummal átfedően találhatóak olyan kisebb területek, melyek adott specifikus kategóriába tartozó tárgyak képére nagyobb aktivitást mutatnak, mint más tárgyakéra (5.13. ábra). Már korai neuropszichológiai, majd elektrofiziológiai megfigyelések is utaltak arra, hogy a halántéklebeny alulsó részén van egy terület, mely elsősorban az emberi arcok feldolgozásában játszik szerepet. Később fMRIvizsgálatok megerősítették, hogy a terület aktivitása jóval nagyobb emberi arcokra, mint betűkre, különböző tárgyakra, állatokra vagy hátulról mutatott emberi fejekre. A területetfusiform face areának, vagyis fuziformis arcterületnek (FFA) nevezték el. Aktivitása akkor is erősebb, ha fekete-fehér portrékat, festményeket, arcok körvonalrajzait, karikatúráit, állatok arcát, ismeretlen személyeket mutatnak a kísérleti személyeknek. Egy másik kategóriaszelektív agyterület az úgynevezett parahippocampal place area vagy parahippokampális helyterület (PPA), amely a LOC-tól némileg elkülönülten helyezkedik el. A PPA elsősorban tájképek, épületek, emberalkotta tájak (még legóból épített absztrakt tájképek is) bemutatásakor aktiválódik inkább, szemben az arcok, vizuális zajok és tárgyak bemutatásával. Ez a fokozott válasz megjelenik a ppA területén, függetlenül attól, hogy milyen feladata van a kísérleti személynek, ami arra utal, hogy a PPA elsősorban épületek és helyszínek perceptuális feldolgozásában játszik szerepet. Újabban leírtak még egy területet a halántéklebenyben, részben átfedően a LOC területtel, amely specifikusan akkor aktiválódik, amikor emberi testek vagy testrészek képét mutatják be az alanyoknak. A területet extrastriatális testterületnek (extrastriate body area – EBA) nevezték el. Bár az EBA igen specifikusan leginkább testrészekre aktiválódott, a szerzők nem vitatják, hogy hasonlóan az FFA, illetve a PPA területekhez, az EBA is aktiválódik más ingerekre is. További kategóriák, melyekre specifikus agykérgi területek létezéséről vannak adataink: állatok, élőlények, kéziszerszámok, székek. Ezeknek a kategóriáknak a specifikus agykérgi reprezentációja ugyanakkor sokak által megkérdőjelezett, így tankönyvünkben sem tárgyaljuk őket tovább.
6.2. táblázat SPECIÁLISAK-E AZ ARCOK? Négy fő csoportja van azoknak az érveknek, melyek az emberi arcfeldolgozás speciális volta mellett szólnak. Mint látni fogjuk, mind a négy kérdéskör esetében megkérdőjelezhető specialitásuk, nem véletlen, hogy az erről folyó vita is folyamatos az irodalomban. Az első kérdéskör az arcok perceptuális feldolgozásának specialitásait illeti. Számos arcspecifikus perceptuális jelenség van. Egyik ilyen példa az inverziós hatás: míg mindenki remekül felismeri egy ismerőse arcát, ugyanazon személy arcát sokkal nehezebb felismerni megfordítva (lásd az ábrát). Ezt a jelenséget azzal magyarázzák, hogy az arcok feldolgozása során van egy olyan speciális lépés, amikor nem az arc részletei alapján, hanem azok konfigurációs tulajdonságai, az arc egésze alapján döntünk, és az arcok megfordítása ezt a holisztikus feldolgozást zavarja meg. Bár eredetileg a jelenséget speciálisan az arcokra gondolták csak érvényesnek, bizonyos személyek esetén (írásszakértők, kutyaszakértők és ujjlenyomat-szakértők) újabban kimutatták más, tehát nem arckategóriákra is. A második kérdéskör az emberi agy arcérzékeny területének, az FFA-nak a létrejöttével kapcsolatos. Miért és hogyan jött létre? Öröklött vagy szerzett tulajdonságról van-e szó? Egyesek szerint az arcok geometriájára érzékeny arcspecifikus kérgi modul velünk született. Ezt támogatja például az az adat, mely szerint újszülöttek is preferálják az egyenes állású arcokat más ingerekkel és fordított állású arcokkal szemben. Igaz azonban az is, hogy az újszülöttek minden olyan ingert preferálnak, melynek geometriájában több elem helyezkedik el annak felső, mint alsó részén. A harmadik vitatott kérdés az arcfelismerés szelektív zavarát, a prozopagnóziát (prosopos [gör.] – arc) illeti. 106 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése Régóta tudjuk, hogy az okcipitális és temporális lebeny ventrá- lis részének lézióját követő arcfelismerési zavar során a betegek képtelenek a látott személyt arca alapján felismerni, bár hangja, gesztusai vagy mozgása alapján meg tudják állapítani identitását. vitatott kérdés ugyanakkor az irodalomban, mennyire független egymástól a minden tárgykategóriára kiterjedő általános tárgyagnózia és a speciális prozopagnózia, mivel eddig csak nagyon kevés betegről sikerült a prozopagnóziát mindenfajta tárgyagnózia nélkül bizonyítani. Fontos érv a későbbi elkülönülés mellett, hogy gyerekeknél soha nincs prozopagnózia tárgyagnózia nélkül. Végül az utolsó érv az arcok speciális feldolgozása mellett a speciális arcfeldolgozó neuronok és modulok, így az FFA megléte (lásd a fejezet főszövegét). Ez a speciális modul azonban, mint fejezetünkben bemutattuk, az újabb eredmények szerint nemcsak arcokra aktiválódik, tehát ez az érv sem teljesen meggyőző.
Kiket ábrázol a kép? Vegyük észre, hogy megfordítva a leghíresebb személyek képét sem egyszerű felismerni! összefoglalva tehát azt mondhatjuk, hogy bár vannak adatok az arcok speciális perceptuális és idegrendszeri feldolgozása mellett, egyik sem bizonyítja azt teljes mértékben.
2.4.2. Az agykérgi reprezentáció elméletei Sokan sokféle elképzeléssel élnek arra vonatkozóan, hogy valójában mit is jelent ezeknek a kategóriaspecifikus agyterületeknek a megléte. Több elmélet van arra, hogy miért éppen arcokra, tájképekre és testrészekre alakultak ki ilyen specifikus agyterületek. Az elméletek alapvetően három csoportba sorolhatók. 1. Kategóriaspecifikus modulok. Jeny Fodor volt az, aki felvetette, hogy az egyes kognitív feladatok specifikus és egymástól függetlenül működő idegrendszeri modulok aktivitásán keresztül valósulnak meg (Fodor 1983). Az FFA, a PPA és az EBA olyan specifikus területek lennének, melyek az adott kategória reprezentációjára fejlődtek ki. A legfontosabb bizonyítékok az arcfelismerés specifikus voltára a neuropszichológiai eredményekből származnak. A szelektíven arcfelismerési zavarban (prozopagnóziában) szenvedő betegek mellett létezik az ellenkező kórkép is, melyben tárgyfelismerési zavar, agnózia van ép arcfelismerő képesség mellett, vagyis kettős disszociáció van az arc- és a tárgyfelismerő rendszerek között. Az elmélet ugyan vonzó, és vannak mellette szóló adatok, mégis számos problémát vet fel a benne foglalt túlzott specializáció. Könnyű belátni például, hogy sokkal több a reprezentálandó kategória a világban, mint amennyit az agykéreg kapacitása lehetővé tesz. Ezért az elmélet újragondolt változatában azt vetették fel a kutatók, hogy az evolúciósan fontos, sokat gyakorolt kategóriákra (mint amilyenek az arcok vagy a betűk, a tájképek) kialakulhatnak erősen szervezett speciális modulok, míg a többi kategóriák tagjainak felismerését változatlanul a ventrális rendszer egészének működése biztosítja. Ez az elmélet már nem áll messze attól az
107 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése elmélettől, amely a tapasztalat hatását hangsúlyozza. (Az emberi arcfelismerés speciális voltáról lásd a szövegdobozt.) 2. A feladat és a gyakorlás hatására kialakult modulok. Az egyes kategóriák jelentősen különböznek hasznukat és használatukat illetően. Egyes tárgyakat például manipulációra (eszközök), környezetünkben való tájékozódásra (tájképek), navigálásra használunk, mások viszont inkább szociális interakcióinkban fontosak (arcok), megint másokat pedig olvasáskor használunk (betűk). Elképzelhető tehát, hogy a kategóriákat reprezentáló modulok használatuk szerint alakulnak ki. Mivel bizonyos kategóriák mindenkinek hasonlóan fontosak (pl. az arcok), rájuk mindenkiben kialakulnak specifikus modulok. Ugyanakkor ez az arcfelismerő modul, az FFA, nemcsak arcok, hanem bármely más, a személynek fontos és sokat gyakorolt kategória elemeinek egymástól való megkülönböztetésére, felismerésére is aktiválódna. Az egyes agyterületek specializálódása nem a priori, hanem az éppen szükséges perceptuális feladatok függvényében, gyakorlás által automatikusan változik, flexibilis (Palmeri-Gauthier 2004). Mivel az emberi életben igen fontos az arcok, testrészek egymástól való megkülönböztetése és felismerése, valamint a környezetünkben való tájékozódás, így az átlagember is jóval kiterjedtebb tapasztalattal rendelkezik arcok, testrészek és tájak kategorizációját, mint bármi más perceptuális kategóriát illetően. Sokat gyakorolva kategorizációjukat, mintegy „szakértőivé” válunk a fenti kategóriáknak. (A kategorizáció magasabb szintű szerveződésével itt most nem foglalkozunk. A perceptuális kategóriák és a fogalmi reprezentáció, tágabban pedig a tudásreprezentáció kérdéseit az Általános pszichológia 2. és 3. kötetei bővebben tárgyalják.) Ezt támogatja az a megfigyeléssorozat, mely szerint olyan emberek, akik hobbijukon, illetve foglalkozásukon keresztül szakértői más, nem-arc kategóriákba tartozó tárgyaknak (madarászok, autó- és kutyaszakértők stb.), az általuk jól ismert kategória tagjait az emberi arcokhoz hasonló módon és hasonló agyterületek aktiválódása mellett dolgozzák fel és ismerik fel. Ez magyarázná tehát az FFA, az EBA és a PPA meglétét. 3. Szétosztott reprezentáció. A harmadik elmélet szerint az egyes kategóriák ventrális rendszerbeli reprezentációja több területre szétszórva és részben egymást átfedve valósul meg. E szerint az elmélet szerint egy geometrikus hasonlóságon alapuló tárgytulajdonság-térkép található a halántéklebenyben. Az adott kategóriákra maximálisan aktiválódó neuronok csoportjai a LOC területén egymástól elkülönülten, de szétszórtan helyezkednek el, és jól meghatározható topográfiával rendelkeznek. Az egyes modulok egymást átfedik, és az egyes tulajdonságok több mint egy helyen vannak reprezentálva. Egy adott tárgy kategóriáját tehát nem egy körülhatárolt terület, hanem a halántéklebeny területén szétszórtan elhelyezkedő neuroncsoportok jelentős részének aktivitásmintázata tükrözné. Az elmélet hasonlóságot mutat a majmok agyában, az inferior temporális kéregben egy- sejt-vizsgálatokkal feltárt kódolással.
2.5. ÖSSZEFOGLALÁS 1. Az emberi tárgyészlelés első látásra egyszerűnek tűnik, valójában azonban igen bonyolult számítási (komputációs) feladat. Ennek első lépése a tárgynak a hátterétől való elkülönítése, a perceptuális szegregáció, amelynek fontos agykérgi korrelátumait a V1 működési tulajdonságai határozzák meg. Az értelmetlen körvonaldarabkákat a Gestalt-törvé- nyeknek megfelelően csoportosítjuk. 2. A tárgylátás folyamatainak modelljeit két fő csoportba sorolhatjuk: strukturális és képi leíró modellek. Míg az első csoport a képet részeire bontva, strukturálisan értelmezi, addig a második a kétdimenziós képen megjelenő tulajdonságok alapján képzeli el reprezentációjukat. 3. A főemlősök agyában a ventrális rendszer felelős a tárgyak feldolgozásáért. A rendszerben a V1-től előre haladva egyre bonyolultabb és absztraktabb tulajdonságok reprezentá- lódnak. A majmok agyában az inferior temporális kéreg az, amely a tárgyfelismerésben a legfontosabb. 1. Az emberi agyban a tárgyakra szelektív területek a nyakszirti és a halántéklebeny alul- só részén helyezkednek el. Az egyes kategóriákra érzékeny területek egymástól többé-ke- vésbé elkülönülnek.
2.6. KULCSFOGALMAK Gestalt, illuzórikus kontúrok, inferior temporális kéreg (IT), komponensalapú felismerés modellek, nagymamasejt, perceptuális szegregáció; tárgytulajdonság-térkép
2.7. ELLENŐRZŐ KÉRDÉSEK
108 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése 1. Sorolja fel az összes (5.2. ábrán látható) képtranszformációt, melyekre alak- és tárgyfelismerésünk invarianciát mutat! 2. Mi kell ahhoz, hogy egy tárgy a hátterétől elkülönüljön? 3. Mik a legfontosabb Gestalt-törvények? 4. Miért látszanak az illuzórikus kontúrok? 5. Nézőpontfüggő reprezentációt feltételez-e Marr, Biederman, illetve a képalapú modellek? 6. Hány geonból épül fel egy váza, egy telefon és egy repülőgép? 7. Mutassuk meg az 5.8. b) és az 5.8. c) ábrát néhány ismerősünknek, és mérjük le, átlagosan mennyi ideig tart, amíg felismerik az ábrán látható kutyát és arcot! 8. Próbáljuk lemérni, milyen gyakran váltakozik a két rivalizáló értelmezés az 5.8. d)-h) ábrákon! Akaratlagosan meg tudjuk-e tenni, hogy csak az egyik értelmezést lássuk? 9. Milyen érvek vannak a ventrális rendszer hierarchiája mellett? 10.
A neuronok mely tulajdonságai változnak a ventrális rendszerbeli feldolgozás során?
11.
Miért nem létezhet „nagymamasejt”?
12.
Milyen különbségek és hasonlóságok vannak az emberi V4 és a majom V4 területe között?
13.
Miért gondoljuk, hogy az IT központi szerepet játszik a tárgyfelismerésben?
14.
Az információfeldolgozás szempontjából miért hasznos, hogy az IT oszlopos elrende- ződésű?
15. Milyen magyarázatok vannak arra, hogy specifikusan arcok, tájképek és székek bemutatására is aktiválódnak agyterületek?
2.8. AJÁNLOTT OLVASMÁNYOK Kovács Gyula 2006. Arcpercepció. In: Racsmány Mihály – Lukács Ágnes (szerk.): Az ezerarcú elme. Akadémiai Kiadó, Budapest. Kovács Gyula 2004. A perceptuális kategorizáció alapjai. In: Pléh Csaba – Gulyás Balázs – Kovács Gyula: Kognitív idegtudomány. Osiris, Budapest, 202-216.
2.9. AJÁNLOTT HONLAPOK Illuzórikus kontúrok és más illúziók: http://wisebytes.net/illusions/contours.php http://www.exploratorium.edu/exhibits/nf_exhibits.html http://www.michaelbach.de/ot/ http://www.eyetricks.com/ http://www.illusionworks.com http://www.ensc.sfu.ca/people/grad/brassard/personal/THESIS/node39.html (Gestalt) http://geon.usc.edu/~biederman/ (Irving Biederman) http://alpha.cog.brown.edu:8200/ (Michael Tarr) http://psychology.uwo.ca/faculty/goodale/ (Párhuzamos látórendszerek) http://mambo.ucsc.edu/psl/fanl.html (Arcpercepció) http://www.vislab.ucl.ac.uk/ (Semir Zeki – V4)
109 Created by XMLmind XSL-FO Converter.
5. FEJEZET –Tárgyak, formák és alakok észlelése Inferior temporális kéreg: http://www2.bpe.es.osakau.ac.jp/index_e.htmlhttp://neuroserv.med.kuleuven.be/index.phphttp://www.phys.szote.u-szeged.hu/ LOC-FFA-PPA-EBA: http://web.mit.edu/bcs/nklab/index.shtml http://www.psy.vanderbilt.edu/faculty/gauthier/
110 Created by XMLmind XSL-FO Converter.
7. fejezet - 6. FEJEZET – Tér- és mélységészlelés Magától értetődő, mindennapi élményünk környező világunk érzékelése. Nemcsak látjuk magunk körül a tárgyakat, hanem azt is meg tudjuk ítélni, hogy mi mekkora, és hogy milyen messzire van tőlünk. Ösztönösen és otthonosan tájékozódunk háromdimenziós terünkben. Könnyű belátnunk azonban, hogy ez a képességünk mennyire nem magától értetődő, ha meggondoljuk, milyen kevés az a vizuális információ – retináinkra jutó majdnem egyforma két kép -, ami ehhez látórendszerünk rendelkezésére áll. Látni fogjuk, hogy „szempillantás” alatt működő térbeli látásunk sok bonyolult „képfeldolgozó” mechanizmus együttműködésének az eredménye. Ezek egy része velünk született képességünk, a többit viszont születésünk óta tanultuk. Egy elterjedt nézet szerint azért látunk térben, mert két szemünkkel két különböző helyről tudjuk nézni a világot. Egyes mechanizmusok valóban kihasználják a kétszemes (binokuláris) látást, mások működéséhez azonban az egyszemes (monokuláris) látás is elegendő. (Madarak példája bizonyítja, hogy monoku- láris mechanizmusok is képesek tökéletes térlátásra: a bagoly kivételével a madarak fején kétoldalt elhelyezkedő szemek nagyrészt másmás képet látnak.) Ebben a fejezetben a látáshoz kapcsolható térészlelésre koncentrálunk, nem foglalkozunk a környezetből érkező, más érzékszervünk által közvetített információval. Látni fogjuk azonban, hogy a látás nem egyszerűsíthető le a szem optikáján keresztül a retinára vetülő kép értelmezésére. A tér észlelésének folyamatában valójában agyunkat kell a „látószervnek” tekinteni, ahol számos más ingerfajta és a világról már korábban megszerzett tudásunk együttes hatása alatt alakul ki az észlelet, míg a szemnek „csak” a „nézőszerv” szerepe jut. Az észlelésben alkalmazott mentális műveleteket tekintve környezetünket lazán definiált koncentrikus héjak rendszerére oszthatjuk, melynek középpontjában magunk állunk. „Közvetlen” környezetünknek azt a manipulációs teret tekinthetjük, melyet könnyen, kis helyzetváltoztatással elérünk, melyben dolgozunk, táplálkozunk, és ahonnan – ahogy a fajfejlődés megtanított – közvetlen veszély is fenyegethet. Életfontosságú, hogy ennek a térrésznek a berendezéséről és változásairól gyorsan és pontosan értesüljünk, ahogy reakcióinknak is gyorsaknak és pontosaknak kell lenniük. Ebben a térrészben kétszemes látásunkra támaszkodunk: kihasználjuk, hogy a két szem némileg különböző két képet lát. Bizonyos távolságon túl már nincs értékelhető különbség a két szem képe között, de a színek élénkek, a részletek jól felismerhetők. Még távolabbra tekintve, a tájat szemlélve, a részletek összemosódnak, a színek tompulnak, csak a főbb vonalak, kontúrok maradnak felismerhetők. Végül, legtávolabbi környezetünk az égbolt: a felhők, a Nap, a Hold, a bolygók és a csillagok világa. A maga visszatérő ismétlődéseiben is megnyilvánuló állandóságával, a földi életre gyakorolt számos hatásával, a misztikával is tűzdelt égbolt már a legkorábbi civilizációk figyelmének is középpontjában állt. Sajátos személyes kapcsolat érzését kelthette az égboltnak az a tulajdonsága, hogy, szemben a földi tárgyakkal, melyeket utunkban elhagyunk, az égbolt „velünk jön”. Sok ezer éves megfigyelése a természettudományok kialakulásában és fejlődésében alapvető és központi szerepet játszott. A „Hold-illúzió” (lásd a szövegdobozt a 204-205. oldalon) példája is mutatja azonban, hogy még a legegyszerűbbnek tűnő égi jelenségek és legismertebb égitestek észlelése terén is vannak még meglepő nyitott kérdések.
7.1. táblázat A BIOLÓGIAI TERESZLELES Az állatfajok földi evolúciójának évmilliói során a térészlelés, azaz a környező világ érzékelése a fennmaradás, a túlélés egyik alapvető feltétele volt. így az evolúciós fejlődés a biológia eszköztárával az állatvilágban létrehozta a környezet érzékelésének alapvető módjait, melyekhez az emberi tudomány és technika sem tudott minőségében, elveiben újakat hozzáadni. Az állatvilágban kialakult érzékszervek képesek a környezet elemeinek jelenlétét, mozgását és számos tulajdonságát a biológiai célhoz illeszkedő pontossággal jelezni. A közvetlen érintkezés, mint a környezet érzékelésének eszköze, már a növényvilágban is fellelhető. Ismerjük az indákkal és kocsányokkal megkapaszkodó növényeket, de ide sorolhatók a rovarokkal táplálkozó húsevő virágok érintésre összezáródó szirmai is. A föld alatt élő kisemlősök, rágcsálók több száz szabályosan elrendezett bajuszszőre az üregek és járatok végigsúrolt faláról képszerű információ továbbítására alkalmas. Teljes saját bőrfelületünkről magunk is folyamatosan kapunk a helytől függően részletes vagy elnagyolt jelzést a bőrünkhöz érő tárgyakról és a környező közeg – levegő, esetleg víz – állapotáról, áramlásairól.
111 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
Nyilvánvaló evolúciós előnyt biztosít, ha egy élőlény képes az őt körülvevő világ egyedeinek távoli érzékelésére is. Erre a környezetet betöltő, a távoli egyed „nyomait” hordozó és egyben mindannyiunkat beágyazó hullámterek közvetlen érzékelése ad lehetőséget. Ilyen hullámtér például a zajok, zörejek, a zenei és egyéb hangok által keltett nyomáshullámok együttese, melyet a kitöltő közeg – levegő vagy víz – közvetít, és melyet általában fülünkkel, de igen nagy hangerők esetében – pl. légkalapács, repülőgép-hajtómű vagy beatkoncert – akár teljes testünkkel, belső szerveinkkel is érzékelünk. Egyes állatfajok, mint a denevér vagy a delfin, képesek a maguk által keltett, igen magas rezgésszámú hang – kiáltás, fütty – visszaverődéseit felfogva nagy pontossággal érzékelni környezetüket. Mozgásukat megfigyelve nem kétséges, hogy ezek az állatok a maguk hangérzékelő eszközeivel a mi látásunkhoz hasonló minőségű „látó”-szervvel rendelkeznek. A teljesség kedvéért érdemes megemlíteni a civilizált ember életében csak alkalmanként tudatosuló, de az állatvilágban alapvető szerepet játszó másik, a beágyazó közeg által a környezetről hírt adó „hullámteret” – melyet ugyan a fizika tudománya nem szokott hullámként tárgyalni -, a szagok világát (az ebben a hullámtérben zajló észleléssel külön fejezet foglalkozik). Az elektromágnesség és a gravitáció az a két fizikai jelenség, melynek hullámai nem igényelnek közvetítő közeget, képesek csillapodás nélkül az üres térben – vákuumban – is terjedni, és így igen távoli eseményekről is üzenetet hozni. Bár a gravitáció folyamatos és közvetlen jelenléte, környezethez való viszonyunk érzékelésében játszott alapvető szerepe csak ritkán tudatosul, könnyen belátjuk fontosságát, ha gondolatkísérletként egy gravitációmentes világba képzeljük magunkat. Ha eltekintünk a technika nyújtotta lehetőségek bő kínálatától, az elektromágneses jelenségek széles spektrumából – biológiai lényként – egy keskeny sáv, a fény és a hőhullámok érzékelésére vagyunk képesek. Vannak élőlények, melyek ebben a képességben felülmúlják az embert, szélesebb színtartományban „látnak”, vagy – mint a vándorló madarak vagy a méhek – érzékelik a fény polarizációját is. Egyes halfajták képesek maguk körül váltakozó elektromos teret kelteni, melynek torzulásai a környezet „képét” közvetítik számukra. Jól ismertek más „elektromágneses” jelzőképességekkel rendelkező élőlények is, mint például a kaméleonok, tintahalak vagy ráják, melyek színüket változtatják. A szentjánosbogarak, egyes polip- és halfajták még fény kibocsátására is képesek; bár ezt a képességüket nem környezetük észlelésére-érzékelésére használják.
1. A távlat kulcsai Mindennapi életünkben környezetünk számos – általában egybehangzó – látványeleme együtt alakítja ki bennünk a tér, a távlat érzetét. A következőkben sorra vesszük azokat a főbb látványbeli sajátságokat, képi kulcsokat, jelzőmozzanatokat, melyek mind a tér látásában, mind a tér ábrázolásában a leglényegesebb szerepet játsszák. A téri jelzőmozzanatok többsége egy szemmel is érzékelhető, azaz monokuláris jelzőmozzanat, néhányhoz azonban két nézőpont, két szem szükséges. Ezek a binokuláris jelzőmozzanatok.
1.1. Monokuláris (egyszemes) jelzőmozzanatok Ha egy tárgyhoz közeledünk, az látóterünknek egyre növekvő részét fogja kitölteni. Így a tárgyak látszólagos mérete, azaz a retinára vetülő képük nagysága elsődleges térinformáció: minél nagyobb a retinális kép, annál közelebbinek érezzük a tárgy helyét. A látvány belső arányainak ismerete finomítja távolságérzetünket: tudjuk például, hogy a gyermek- és felnőtt-test arányai eltérőek; a gyerekfej sokkal nagyobb a testhez képest, mint a felnőtté, így a viszonyításul szolgáló környezettől elvonatkoztatva sem látnánk távoli felnőttnek egy közeli gyereket. Ez igaz a ló és a csikó esetére is (6.1. ábra, fölül). Szabad térben, sík mezőn a távolba nézve szemmagasságunkban látjuk a horizontot. Azt is tapasztalhatjuk, hogy a távoli, a horizonthoz közeli tárgyak képe a látómező közepére esik, míg a közelebbiek képe lejjebb van. Ezért a tárgyakat annál távolabbinak érezzük, mennél magasabbra kerül képük a látómezőben, azaz a látómezőbeli helyzet is fontos kulcs a térbeli helyzet megítélésében (6.1. ábra, alul).
112 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.1. ábra. A látszólagos méret és a látómezõben elfoglalt hely kulcs a távolsághoz Egymást részlegesen takaró tárgyak közül nyilvánvalóan a takartat érzékeljük a távolabbinak. Bizonytalan, takarásgyanús esetekben, ha a szomszédos tárgyakat nem ismerjünk fel, és így az egyes látott alakzatok teljességét vagy hiányos voltát nem tudjuk biztosan megítélni, akkor a hosszabb, folyamatos, törésmentes kontúrral rendelkező alakzat tűnik a közelebbinek (6.2. ábra).
6.2. ábra. A kék korong közelebbinek látszik, mint a piros Mesterséges, magunk építette környezetünkben dobozszerű házakban, szobákban, síkok és párhuzamosok között élünk. útjainkat párhuzamos egyenesek határolják, ahogy párhuzamos egyenesek a vasúti sínek és a villamoslégvezetékek is. Térbeli mélységet, távolságot sugalló, jól megtanult, mélyen tudatunkba rögződött jelzőmozzanat ezért a hosszú összetartó egyenesek képe, a lineáris perspektíva (6.3. ábra). Ennek mesteri alkalmazását látjuk Canaletto képén (A látvány fejlődése című szövegdoboz 5. ábrája), és ezzel játszik finoman képtelen képein M. C. Escher is (6.4. ábra).
113 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.3. ábra. Távolodva összetartó párhuzamosok Akár természeti, akár mesterséges környezetünket tekintjük, azt mintázatokban gazdagnak találjuk. A mintázatok között vannak szabályosak, mint egy téglafal (6.5. ábra) vagy egy telepített szőlőhegy képe, és szabálytalanok, mint a hullámzó tenger vagy az erdős hegyoldal. Nagyobb területű mintázatok hozzánk közel eső részeit természetesen tagoltabbnak, részletekben gazdagabbnak látjuk, mint a távolabb fekvőket. Ezért lehet térbeli jelzőmozzanat a kiterjedt mintázatokfinomsága: a macskaköves utat, a búzamezőt vagy a népgyűlésen összegyűlt tömeget a látott mintázat finomodásának irányában távolodónak érezzük. A részletgazdagság pedig a közelség benyomását kelti; autók hátán mindannyian láttuk már a „Ha ezt el tudod olvasni, túl közel vagy!” feliratot.
6.4. ábra. M. C. Escher hamis perspektívájú képe Tudjuk, hogy a Nap sugarai szóródnak a légkör molekuláin. Ez a szóródás a kék színhez közeli, rövidebb hullámhosszú sugarak esetén jelentősebb, ezért kék az ég. Ugyanígy szóródik a távoli tárgyakról, hegyekről visszaverődő és hozzánk érkező napfény is a közbenső vastag légtömegen, ezért a távoli tárgyak, hegyek képe „elkékül” (6.6. ábra). Az elkékülés mértéke annál nagyobb, mennél nagyobb a közbenső légtömeg vastagsága, azaz mennél távolabb van a látott tárgy. Ez a magyarázat arra, hogy szabadban a kékes tárgyakat távolinak érezzük.
114 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.5. ábra. Finomodó mintázatok A légrétegen szóródó fény egyben csökkenti a kontrasztot, elmossa az éleket, és tompítja a színeket is. Ez a hatás párás időben fokozottan jelentkezik. Ismerjük az érzést, hogy tiszta időben „közelebb a túlpart”, és a táj homályos részei egyben távolinak is tűnnek. A légtömeg által okozott fényszóródás, a látvány elkékülése és a részletek elmosódása által kiváltott távolságérzésünket légtávlatnak nevezzük.
6.6. ábra. Elmosódó kék hegyek Tárgyak térbeli alakját jól jellemzik megvilágított és árnyékban maradó részleteik, a fény-árnyék határvonal, a saját árnyék, a fény játéka a csillogó és matt részleteken. A fekete-fehér fényképészet a megvilágítás, a fények és árnyékok plasztikus művészete (6.7. ábra). Kozmetikusok, sminkesek jól ismerik és tudatosan alkalmazzák a finom árnyalás technikáját az arc arányainak módosítására – szélesebb orr vagy kiemelkedő, erősebb pofacsont eltüntetésére -, az arckifejezés, az összhatás megváltoztatására.
115 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.7. ábra. Fény és árnyék (Csikvári Péter)
7.2. táblázat A LÁTVÁNY FEJLŐDÉSE Nincs okunk abban kételkedni, hogy az emberi látás 5-10 ezer évvel ezelőtt is ugyanúgy működött, mint ma. Nyilvánvaló, hogy a legkorábbi civilizációk embere számára is érzékelhető volt környezetének térbeli elrendezése: érzékelte a közelebb-távolabb, az előtte-mögötte, a kisebb-nagyobb viszonyt. A távlat, a perspektíva szabályait, vagy legalábbis annak képi megjelenítését azonban, civilizációnk fejlődése során fokozatosan és meglepően későn tanultuk meg. Még a fejlett ábrázolási kultúrával rendelkező nagy ókori civilizációk, mint az egyiptomi (1. ábra), a görög vagy a római sem ismerték a térbeli mélység valósághű megörökítésének módját. Emberábrázolásaikban a méret nem a térbeli, hanem a társadalmi ranglétrán elfoglalt hely tükrözését szolgálta. Képeiken általában az egyes részletek legjellemzőbb nézeteit látjuk, sokszor egymáshoz képest természetellenes viszonyban.
1. ábra. Egyiptomi falfestmény Görög kancsók harci jelenetein tűnik fel a végtagok rövidülése, a síkból való kilépés nyilvánvaló szándékával. Elgondolkodtató, hogy építményeik viszont a perspektíva ismeretéről, sőt alakításáról, a látvány optikai torzulásának tudatos kompenzálásáról tanúskodnak. Periklész korában, a Kr. e. 5. században az athéni Akropoliszban Pallas Athénének, a város patrónusának tiszteletére épült, látványában tökéletes szabályosságot 116 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés sugalló hatalmas templom, a Parthenon számos finom perspektivikus „trükköt” tartalmaz: az oszlopok enyhén kúposak és befelé dőlnek, az oszlopsorok közepe meg van emelve, és kissé befelé ívelt.
2. ábra. A San Spirito-bazilika főhajója
3. ábra. Brunelleschi tervvázlata A középkori gótikus festészet már igyekszik a méretekkel és a képen belüli elrendezéssel érzékel- letr^jat éí|by?lpvoniionalíoes^inen^ilág felé szemét kitáró reneszánsz, a quattrocento festészete és építészete fedezte fel tudatosan és fejlesztette tökélyre a távlat, a látvány ábrázolását. A reneszánsz előfutárának és első nagy alakjának tartott festő és építész, Giotto di Bondone (1266-1337), mint a firenzei katedrális építésének felügyelője, negatív perspektívájú, felfelé bővülő harangtornyot tervezett, hogy ellensúlyozza a magas épületekre jellemző látszólagos hátradőlést, és hogy az alulról szemlélő számára a torony minél magasabbnak tűnjék. A kifelé dőlő, a valóságosnál nagyobb méreteket sugalló épülethomlokzat hosszú századokra divattá vált, és számos példája ma is megtalálható Nyugat-Európa korabeli városaiban. A hatalmasra növekedett templombelsőket átívelő boltozatok és kupolák már a mai értelemben vett mérnöki
117 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés tervezést és „tervdokumentációt” – rajzokat – kívántak. A zseniális építész, Filippo Brunelleschi (1377-1446) rajzolta először tervvázlataiban a térbeli párhuzamos éleket a horizont felé összetartó egyenesekként. A képen (2. ábra) a firenzei San Spirito- (Szentlélek-) bazilika főhajóját látjuk, és mellette a tervrajzot (3. ábra), melyen azt Brunelleschi a megrendelő városatyáknak bemutatta. Kortársa, Leon Battista Alberti (1404-1472) olasz humanista, építész, akit az univerzális reneszánsz ember prototípusának tartanak, a reneszánsz művészet első teoretikusaként írásaiban már a látvány tudományos elemzésével is foglalkozik. Munkája századokra inspirálta a perspektíva valósághű ábrázolását; még 1719-ben is ót idézi Brook Taylor Londonban megjelent könyvének illusztrációja (4. ábra).
4. ábra. Perspektíva szerkesztése Alberti nyomán(1719) Leonardo da Vinci (1452-1519) képei és műszaki vázlatai már a teljes perspektivikus eszköztár mesteri alkalmazásáról tanúskodnak. Feljegyzéseiből tudjuk, hogy a látvány szabályai, a távoli tárgyak látszólagos méretcsökkenése és halványodása különösen foglalkoztatták; a látványhú ábrázolást a művészi színvonal kritériumának tartotta. Canaletto (1697-1768), a 18. század leghíresebb velencei festője számos briliáns perspektívájú látképe közül az egyiknek éppen a Perspektíva címet adta (5. ábra).
5. ábra. Canaletto: Perspektíva A térbeli illúziók ismeretére utal számos, mai is látható templomboltozati freskó, melyek a szemlélőben a valóságos méreteknél lényegesen tágabb tér érzését keltik.
118 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6. ábra. Kirchner sötét szobája 1646-ból
7. ábra. Hooke „fényképezôgépe” 1694-bôl Érdemes megemlíteni, hogy a valósághű ábrázolás, a vetületi perspektíva reneszánsz forradalmában jelentős szerepet játszott a sötét szoba (camera obscura) mint vetítési segédeszköz felfedezése a festészet számára. A kis lyukon keresztül a falra vetülő fordított képet már kétezer évvel korábban is ismerték Kínában, Arisztotelész pedig napfogyatkozás megfigyelésében alkalmazta a Kr. e. 4. században. Alberti munkájában találunk rá utalást, Leonardo pedig részletesen foglalkozott vele titkosírásos jegyzeteiben. Közismertté Giovanni Battista della Porta 1558-ban megjelent könyve tette. A camera obscura elnevezés Keplertől származik, aki a kép visszafordítására homorú lencsét helyezett bele. Használata a portré- és tájképfestók körében a következó századokban igen elterjedt; a kor számos fényképszerű látképe valószínűleg ezzel a technikával készült, amint azt Athanasius Kircher 1646-ból fennmaradt rajza (6. ábra) is tanúsítja. Robert Hooke 1694-ben az angol Királyi Társaságban hordozható camera obscurát javasolt utazók számára, melybe a fej és a vállak is beleférnek (7. ábra). Ezt a javaslatot tekinthetjük a mai fényképezőgép ősének és a fototurizmus kezdetének; különbség csupán a képrögzítés „technikai részleteiben” van. Fényképezéskor, hogy éles képet kapjunk, be kell állítanunk a tárgy tőlünk való távolságát a fényképezőgépen. Modernebb gépek már rendelkeznek az autofókusz-funkcióval, amely az exponálás pillanatában elvégzi a kép élesre állítását. Ehhez hasonlóan, szemünk optikájának az éppen látni kívánt tárgy képét kell élesre állítania retinánkon. Ezt a feladatot – az akkomodációt – agyi „autofókusz-funkciónk” a szemizmok segítségével végzi el. A kép fókuszálásának képessége egyben azt is jelenti, hogy egy tárgy képének az élesre állításával agyunk meg is méri az illető tárgy távolságát, és ez az információ hozzájárulhat a környezetünkről kialakuló észlelethez. Ahogy fényképezéskor a közeli felvételek érzékenyek a távolság pontos beállítására, az akkomodáció is a két méterig terjedő távolságtartományban játszik érdemi szerepet.
119 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés Sporteseményen tapasztalhatjuk, hogy azonos sebességgel mozgó versenyzők közül a közelebbi halad át gyorsabban látóterünkön, fejünket az után kell gyorsabban fordítani. Vonaton, autón utazva a közeli villanyoszlopokat, kilométerköveket rohanni látjuk visszafelé, kissé távolabb a házak és a fák már lényegesen lassúbbak, míg a távoli templomtorony szinte egy helyben áll. Vegyük észre, hogy ezért a jelenségért (amint azt a mozgásészlelésről szóló fejezetben majd tárgyaljuk) már a retina szintjén megfigyelhető eltérések is felelősek. A retinaképen lévő elmozdulások ugyanis olyan mozgáskomponensekből állnak, amelyek térileg átfedő helyeken, de az eltérő fixációs távolságok miatt más irányokban mennek végbe. Ilyenkor valójában nem a mozgás sebességét érzékeljük, hanem a látvány szögsebességét, azaz a látószögváltozást, az észlelt tárgynak látóterünkön való áthaladási sebességét. Azonos sebességgel mozgó tárgyak közül a közelebbi halad át gyorsabban a látótéren, hiszen annak nagyobb a szögsebessége. Ennek megfelelően, a gyorsabbnak látott mozgó tárgyat közelebbinek, a lassúbbnak látottat távolabbinak észleljük; a jelenség neve mozgási parallaxis.
1.2. Binokuláris (kétszemes) jelzőmozzanatok A térbeli helyzet eddig felsorolt jelzőmozzanatai egyetlen képen, egy szemmel – mo- nokulárisan – is érzékelhetők, kiértékelhetők. További fontos jelzést kaphatunk a tárgyak térbeli helyzetéről, ha ugyanarról a látványról egyszerre két különböző helyről is tudunk képet készíteni, mint például a kétszemes látás vagy a sztereofotózás esetében. Ilyenkor a két kép lényegében ugyanazokat a tárgyakat mutatja, ezek helyzete azonban egymáshoz képest – illetve egy képen belül a kerethez képest – többé-kevésbé eltérő lesz. (A mon- okuláris jelzőmozzanatok között tárgyalt mozgási parallaxis esetében is több, ugyan nem szigorúan egyidejű, de részleteikben eltérő kép szolgáltat kulcsot a térbeli mélységhez.) Jobban megfigyelve azt tapasztalhatjuk, hogy a tőlünk azonos távolságban lévő tárgyak egymáshoz képest ugyanabban a helyzetben maradnak, eltolódás csak különböző távolságra lévők között jelentkezik. Az eltolódás oka az, hogy míg az azonos távolságban lévő tárgyakat két szemünk mindig ugyanabban a szögben látja, a különböző távolságban lévő tárgyak látószöge a távolságtól függően más és más: növekvő távolsággal a látószög csökken (6.8. ábra).
6.8. ábra. Azonos távolság – azonos látószög, növekvő távolság – csökkenő látószög Ha két szemünket felváltva behunyjuk-kinyitjuk, magunk is láthatjuk a tárgyak látszólagos elmozdulását. Ezt szemlélteti a 6.9. ábra. A legegyszerűbben akkor látjuk a viszonylagos eltolódást, ha két vékony tárgyat, például ujjainkat vagy ceruzákat helyezünk az egyik szemünk elé úgy, hogy az egyik eltakarja a másikat, majd szemet váltva tapasztalhatjuk, hogy a két tárgy képe egymáshoz képest elmozdul, a takarás pedig megszűnik. A jelenség neve binokuláris parallaxis. Tapasztalhatjuk, hogy minél közelebb van hozzánk egy tárgy, annál nagyobbnak látszik a neki megfelelő képi részlet mozgása. Ennek a tapasztalati logikának a megfordításával juthatunk el a kétszemes térlátás lényegi magyarázatához: ha két szemünk kissé eltérő képeket lát, akkor ezek részleteit a térben tőlünk más-más távolságban lévő tárgyakként érzékeljük; az érzékelt távolságok attól függenek, hogy a megfelelő képrészletek helye a két képen mennyire különbözik. (Mint látni fogjuk, ez a mechanizmus akkor is működik, ha nem is ismerjük fel, mit ábrázol a kép; ezért látjuk térben a „véletlen-pont” sztereogramot, amivel a későbbiekben részletesen foglalkozunk.) A parallaxis mellett további binokuláris jelzőmozzanatokhoz jutunk azzal, hogy két szemünkkel egy pontra nézünk. Ehhez agyunk – a szemmozgató izmaink vezérlésével – igyekszik a két szemet olyan, szükség szerint összetartó – konvergáló – helyzetbe hozni, hogy a nézett pont képe mindkét retinánk közepére, tehát a foveákra essen. A konvergencia mértéke kétszemes térbeli látásunkat segítő, járulékos információt szolgáltat: szemeink 120 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés enyhe összetartásából 6-10 méteren belül elegendő pontossággal meg tudjuk állapítani, milyen távolságra kereszteződnek szemsugaraink, hova nézünk.
6.9. ábra. Két szemünkben más a látvány, ha a tárgyak különböző távolságban vannak Ezzel áttekintettük térlátásunk legfontosabb jelzőmozzanatait, kulcsait. Mindezek azonban nem elegendőek ahhoz, hogy megválaszoljuk a „hogyan látunk térben?” kérdést. A „szempillantás” alatt működő, megszokott, mindennapi térérzékelés alapvetően más, mint a térlátás kulcsainak elemző tanulmányozása. A látvány ilyen elemzésére a mindennapokban nincs sem szükség, sem idő, sem elegendő agyi „képfeldolgozó kapacitás”. Hogy mégis képesek vagyunk térben látni, az nagyrészt annak köszönhető, hogy megtanultunk látni.
2. A megtanult látás – a látvány szabályai Az előzőekben áttekintett, néhány „egyszerű” szabályt alkalmazva rendezi be látórendszerünk a környező teret: hátterükből kiragadva felismeri a látott tárgyakat, megbecsüli méretüket, és a térben különböző távolságokban elhelyezi őket. Ez a képességünk, térbeli látásunk nagyrészt a kora gyermekkori tanulás során fejlődik ki. A látás tanulása kezdeti gyors fejlődés után – egyes vonatkozásaiban – egészen a kamaszkorig eltart. (Állatkísérletekből tudjuk, hogy már a látott kép elemi értelmezése is tanulás eredménye: a kizárólag függőleges mintázatot mutató környezetben tartott kismacska később „megbotlik a küszöbben”, mert nem tanulta meg látni a vízszintest.) Környezetünkben élőlények és élettelen tárgyak mozognak, és mi is mozgunk hozzájuk képest. A közeledők retinánkra eső képének mérete egyre növekszik, a távolodóké csökken. Az elhaladókról, elfordulókról pillanatról pillanatra más szögből, más oldalukról érkezik kép a retinánkra. Az is előfordul, hogy bizonyos dolgokat csak részletekben látunk, ahogy egy macskát a kerítés mögött. Közben sok esetben, mint például felhős, szeles időben vagy lombos fák alatt napsütésben a megvilágítás – és így a retinánkra érkező kép világossága is – folyamatosan változik. Napszemüveget viselve vagy egy katedrális belsejében színes üvegablakok mögött még a szemünkbe érkező fény színe is megváltozik. Mindezen változatosság ellenére pillanatnyi kétség nélkül ismerjük fel a látottakat: méretüket, alakjukat, színüket és világos vagy sötét voltukat. Hogy a retinális kép sokrétű és folyamatos változékonysága mellett és ellenére is képesek vagyunk felismerni környezetünkben azt, ami állandó, és ezeket elválasztani a valóban változó mozzanatoktól, azt a látás tanulása során elsajátított konstanciáknak köszönhetjük. A konstanciák közös jellemzője, hogy egy-egy tulajdonság – méret, alak, hely, szín vagy világosság – megítélésében mind a tágabb képi környezet, mind a világról megtanult tapasztalat is szerepet játszik. A LÁTÁS FEJLŐDÉSE Az újszülött látása homályos, életlen Mivel az újszülött nem tudja elmondani, mit lát, látásának fejlődésére viselkedéséből, viselkedésének változásaiból következtethetünk. Képeket, tárgyakat mutatva neki, tekintetének követésével megfigyelhetjük, mi 121 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés az, amire gyakran, szívesen néz, és mi az, ami nem érdekli; miközben mérhetjük szívritmusát, elemezhetjük agyi elektromos jeleit. Az újszülöttek látása kezdetben homályos és életlen (lásd az ábrát), lényegében világos és sötét foltokra korlátozódik. Egy hónapos kortól már meg tudják különböztetni az éles kontrasztokat, érzékelik az arcok körvonalát, szívesen figyelik az összetett, részletgazdag alakzatokat. Három hónap után egyszerűbb idomok éleit, sarkait nézegetik, és felismerik az anyjuk arcát. Ötödik hónaptól már az idegen arcokat is megismerik. A három hónapos csecsemő már nézegeti kezeit is, követi mozgásukat, amihez kapcsolódóan a harmadik és hatodik hónap között kialakul a távolság, a mélység érzékelése. Már az első hónap után elkezdődik az a 8-10 évig tartó folyamat, melynek során megtanuljuk, hogy a látott, egészében vagy részleteiben gyorsan változó kép forrása általában egy lényegében állandó vagy csak lassan változó környezet. Ahhoz, hogy ebben a környezetben eligazodjunk, hogy megfelelően viselkedjünk, a veszélyeket elkerüljük, látásunk fejlődésével kialakulnak azok az alapvető szabályok – a konstanciák -, melyek segítségével a változó képek mögött is képesek vagyunk meglátni a környezet állandó elemeit.
2.1. Nagyságkonstancia A környezetünkben mozgó tárgyak képének mérete folyamatosan változik a retinánkon: a közeledő tárgy retinális képe megnő, a távolodóé csökken. Ezért tekintjük a retinális kép méretét fontos távolsági jelzőmozzanatnak. A nagyságkonstancia érvényesülésének köszönhetően azonban, retinális képük méretének változása ellenére, magukat a tárgyakat folyamatosan és változatlanul ugyanolyan méretűnek észleljük. Egy tárgy felismerésekor ugyanis amellett, hogy azt perceptuálisan körülhatároljuk, kiragadjuk a hátteréből, egyben el is helyezzük benne, azaz a tárgy felismerése egyben térbeli helyzetének felismerését is jelenti. Látórendszerünk az észlelt méretet a retinális kép mérete és az észlelt térbeli helyzet együttes hatása alatt alakítja ki. Ez magától értetődik, ha meggondoljuk, hogy egy tárgy retinális képének mérete (6.10. ábra) közvetlenül tulajdonképpen nem a tárgy méretétől, hanem a tárgy látószögétől függ.
6.10. ábra. A retinális méret, azaz a látószög a tárgy méretétôl és távolságától függ. Ugyanannak a tárgynak a látószöge közelebbrôl nagyobb, távolabbról kisebb (a), azonos távolságból a nagyobb tárgy látószöge a nagyobb (b), és különbözô távolságból különbözô méretû tárgyak retinális képének mérete egyforma is lehet (c) Emmert törvénye szerint ahhoz, hogy a látószög ismeretében egy tárgy tényleges méretére következtethessünk, ismerni kell a tárgy távolságát is, amit a tárgy környezetét látva általában kellő pontossággal érzékelünk. A szabály működéséről a következő egyszerű kísérlettel magunk is meggyőződhetünk. Fehér számítógép-képernyő bal oldalára rajzoljunk egy 2 centiméter átmérőjű korongot, és nézzük meredten 15-20 másodpercig. Ezután a képernyő jobb oldalára nézve látni fogjuk a korong utóképét, mely a retinánkba „beégett”. Előre-hátra hajlongva, a képernyőt közelítve, távolítva, az utókép méretének csökkenését, illetve növekedését fogjuk tapasztalni, aminek magyarázata az, hogy a változatlan méretű retinális utóképet mindig a képernyő távolságában, a képernyőn lévőnek észleljük. Azokban a ritka esetekben, amikor egy tárgy távolsága nem nyilvánvaló, amikor a távolság becslését a körülmények nem teszik lehetővé, a méretek becslésével is zavarba jövünk. Példa lehet erre egy ismeretlen tárgy fényképe, ha a képen nem látszik a környezet, vagy más ismert méretű tárgy. Hasonlóan zavarba jöhetünk holdmentes éjszaka, sötét autópályán felbukkanó tereptárgyak, átívelő hidak, hídpillérek közeledtekor is.
2.2. Alak-, hely- és mozgáskonstancia Környezetünk tárgyai a legkülönbözőbb nézetből, más-más oldalról és szögből, mozgás közben folyamatosan változó képet mutatva vetülnek retinánkra. A csukott, a félig vagy teljesen nyitott ajtó képe a retinán a téglalap mellett különböző szélességű trapéz vagy – éle felől nézve – az ajtó vastagságának megfelelő szélességű vonal is lehet. A számos különböző retinális kép ellenére tárgyaink mindig a maguk alakjában tudatosulnak; bármelyik szögből nézzük is, bármelyik képét látjuk is egy ajtónak, azt mindig téglalap alakú ajtóként észleljük. Egy mozi nézőterén legfeljebb egy olyan hely van, ahonnan a látvány ugyanaz, mint ami a felvevőgépből „nézve” volt. Bár az összes többi helyről többé-kevésbé torzult, a valóságban sehonnan nem látható képsort látunk (tehát, szemben az ajtó esetével, nem azt a látványt, mintha a valóságos helyszínt néznénk máshonnan), akárhol ülünk is, tudatunkban a torzulásmentes cselekmény jelenik meg. Az alakkonstancia lényege az, hogy látórendszerünk egy retinális kép sok lehetséges értelmezése közül mindig a legvalószínűbbet választja, aminek alapja a látás 122 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés tanulásában gyökerezik. Hogy agyunkban a látványhoz választott alak valóban a maga térbeliségében tükröződik, a következő egyszerű kísérlettel (Shepard-Metzler 1971) bizonyíthatjuk: ha két egymáshoz hasonló, térben elforgatott, összetett alakról – melyek vagy egyformák, vagy egymás tükörképei (6.11. ábra) – el kell dönteni, hogy egyformák-e, a döntéshez szükséges idő azzal a térbeli szöggel arányos, mellyel az egyik alakot el kell forgatnunk ahhoz, hogy a másikkal fedésbe hozzuk. Ez arra utal, hogy agyunkban egy látványhoz nemcsak hozzárendelünk egy térbeli alakot, hanem ennek az alaknak a különböző nézeteit is tudjuk mentálisan kezelni. (Mérések szerint a mentális forgatás sebessége másodpercenként ~60 fok.)
6.11. ábra. Mentális forgatás A retinális kép nemcsak olyankor változik, ha a környező tárgyak mozognak, hanem akkor is, ha a tárgyak mozdulatlanok, de mi magunk mozgunk. Ilyenkor a kép egyes részletei – a mozgási parallaxis szerint – egymáshoz képest is elmozdulnak, ami távolsági jelzőmozzanatként segít a látott tárgyak térbeli elhelyezésében, és segít saját mozgásunk érzékelésében is. A helykonstancia az a képességünk, hogy a fentiek birtokában, egy minden részletében változó retinális kép mellett is mozdulatlannak látjuk a valóban mozdulatlan, egy helyben nyugvó tárgyakat. Ráadásul a valóságban is mozgó tárgyak mozgását is képesek vagyunk helyesen megítélni, miközben magunk is mozgásban vagyunk. A hely-, alak- és mozgáskonstancia hátterében látórendszerünkben a környező világból leszűrt néhány egyszerű feltételezés, szabály látszik működni, melyek szerint: • a látott tárgyakról egyenes vonal mentén érkezik szemeinkbe a fénysugár; • a tárgyak általában szilárdak, azaz részeik együtt mozognak; • a tárgyak általában sima, többé-kevésbé egyenes pályán mozognak, és mozgás közben létük folyamatosan fennáll; • a mozgó tárgy haladás közben eltakarja a hátterét, mely a tárgy elhaladtával újra előtűnik. Ezek a szabályok nemcsak azt biztosítják, hogy a folyamatosan változó látványt az esetek döntő többségében helyesen értelmezzük, hanem azt is, hogy mindezt a látvány által hordozott irdatlan mennyiségű képi információ töredékét feldolgozva vagyunk képesek elérni.
7.3. táblázat A HOLD -ILLUZ10 Méret- és távolságbecslésünkhöz kapcsolódik a felkelő és lenyugvó Holdat, Napot vagy érzékelhető kiterjedéssel rendelkező más égitesteket szemlélve tapasztalható, általánosan ismert, igen érdekes jelenség, a Hold-illúzió, mely szerint közvetlenül a látóhatár felett nagyobbnak és közelebbinek látjuk az égitesteket, mint magasan a fejünk felett, a zeniten. A Hold-illúzió valószínűleg a legrégebben megfigyelt és lejegyzett természeti jelenség, melynek okára ráadásul a mai napig sem sikerült kielégítő tudományos magyarázatot találni. Az első írásos utalások a ninivei királyi könyvtár Kr. e. 7. századból származó agyagtábláin találhatók, de korai kínai és görög források is tárgyalják. Arisztotelész és Ptolemaiosz óta, Leonardo da Vincin és Descartes-on keresztül szinte minden neves filozófus és természettudós foglalkozott vele. A korai elméletek szerint a jelenség valójában nem illúzió: a légköri torzítások valóban nagyobbnak láttatják az égitesteket a látóhatár közelében, mint feljebb. Az érzéki csalódás lehetősége először a 11. században élt arab tudós, AbuAli Haszan Ibn al-Haiszam (Alhazen) elméletében jelenik meg, mely szerint az égboltot nem szabályos félgömbnek, hanem a tetején belapultnak érezzük (1. ábra). Az azóta is népszerű elméletben az ugyanolyan látószögben látott égitesteket a „közeli” zeniten – az Em- mert-törvény szerint – kisebbként észleljük, mint a
123 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés látóhatáron, az égbolt „távolabbi” peremén.
1. ábra. A Hold képe, ahogy Alhazen „belapult égbolt”-elmélete szerint érzékeljük A 17. században Kepler, aki mind a csillagászatban, mind a szem optikájában járatos volt, már egyértelműen kizárta a jelenség fizikai okokra visszavezethető magyarázatát. Azóta számos elmélet született, melyek két csoportba sorolhatók: a „retina előtti” fiziológiaiba és a „retina utáni” pszichológiaiba. A számos elmélet ellenére a Hold-illúzió „megfejtése” még napjainkban is kutatott, nyitott tudományos kérdés; tanulságos ezért röviden áttekinteni a kapcsolódó tényeket és a főbb hipotéziseket. Sokak tapasztalata, hogy a felkelő Holdat nagyobbnak, hozzávetőlegesen másfélszer akkorának, ugyanakkor lényegesen közelebb lévőnek látjuk, mint a fejünk felett lévőt. Az a tény, hogy a felkelő Holdat egyszerre látjuk nagyobbnak és közelebbinek, ellentmond a „belapult égbolt”-magyarázatnak, mivel az a változatlan retinális kép mellett a méret észlelt növekedését növekedő távolsághoz kapcsolja. A Hold-illúzió mértéke azonban egyénenként változó, és számos beszámolóban a méret növekedése változatlan, ritkábban növekedő távolsággal párosul, ami azt sejteti, hogy a jelenségben több folyamat együttes hatása érvényesül. Ráadásul az illúzió meg is szűnik, ha a Holdat két ujjunk közé csippentjük, vagy vékony csövön keresztül, vagy akár megfordulva és lehajolva, a lábunk között nézzük, ami a távoli táj látványának kétségtelen szerepére utal. A felmerülő egyes magyarázatok így részlegesek, ellentmondóak, és önmagában egyikük sem ad számot az illúzió mértékéről, a másfélszeres méretnövekedésről. Egyszerűen ellenőrizhető, hogy a Hold-illúzió valóban észlelési csalódás: a Hold képe az égbolt minden pontján azonos méretben látszik, ahogy ezt az emelkedő Holdat ábrázoló fényképsorozat bizonyítja (2. ábra). (Egészen pontosan, a látóhatáron a Hold képe néhány százalékkal kisebb, mint a zeniten, mivel a holdpálya középpontja a Föld középpontjában van, és így a tetőző Hold a Föld felszínén álló szemlélőhöz egy földsugárnyival közelebb van, mint a felkelő.)
124 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
2. ábra. A felkelő Hold Számosan keresték a jelenség magyarázatát a szemek, szemizmok eltérő állapotában, ami az előre- és a felfelé nézésben áll elő. Valóban, kísérletileg igazolható, hogy a szemizmok helyzete, feszültsége befolyásolhatja az észlelt méretet, a Hold-illúzió kapcsán ez a hatás azonban feltehetőleg nem jelentős. Számos elmélet egyetért abban, hogy a Hold-illúzió alapvetően a látószög észleléséhez kapcsolódik. Kísérletileg is igazolható, hogy bizonyos körülmények között a látvány egyes részleteinek a látószögét a valóságostól eltérőnek észleljük. Közeli tárgyak esetében az észlelt látószög kisebb a szemtől mérhető szögnél, aminek oka lehet, hogy az észlelt látószögnek a fej forgatásában van szerepe. Mivel a fej forgástengelye hozzávetőleg 10 centiméterrel a szemek mögött van, a fejet valóban kisebb szögben kell fordítani, mint ami a szemeknél mérhető. Fordított jelenség tapasztalható, amikor nagy távolságokban látható tárgyak látószögét kell felszíni részletektől mentes tájon megítélni, ahol a távolságbecslésünk nem támaszkodhat a közbenső tereptárgyakra és textúrára. Tengeren, több kilométer távolságból végzett kísérletek tanúsága szerint ilyen körülmények között a látószöget jelentősen, akár 50 százalékkal is túlbecsülhetjük, ami a felkelő Hold látszólagos méretnövekedésével egybevág. Másrészt felszíni részletek jelenlétében is jelentkezik az észlelt látószögnek az Ebbinghaus-illúzióra emlékeztető bizonyos mértékű növekedése, a távolsággal egyre finomodó textúra hatására. Hajlamosak vagyunk ugyanis a környezetük tipikus méreteinél nagyobb tárgyakat a valóságosnál is nagyobbnak, a kisebbeket pedig kisebbnek érzékelni; Gullivert Liliputban nagyobbnak, Brobdingnagban kisebbnek látjuk, mint amekkora. A magyarázat további elemeit a „hétköznapitól” eltéró körülmények, a sötétség, az üres tér, a nagy távolság hatásában lehet keresni. A kitáguló pupilla, a szem sötétben megváltozott viselkedése, a romló optikai tulajdonságok miatt eleve elmosódottabb, így megnövekedő kép vetül a retinára. Ismert jelenség emellett az „éjszakai rövidlátás” és az „ürestér-rövidlátás”: sötétben és részletekben, látnivalóban szegény helyzetekben a szemek hajlamosak közelre, néhány méterre nézni, ami a szemizmok mozgatásához kapcsolódóan az észlelt tárgyak mérettorzulását – okulomotoros mikropszia – eredményezi. A nézett ponton túl a tárgyakat a valóságosnál kisebbnek látjuk, ami magyarázhatja a zeniten lévő Hold csökkent méretét. Egyes kutatók szerint a jelenség számos más esetben is fellép, ennek tulajdonítják például az esőben, vizes szélvédő mellett történő balesetek egy részét, amikor a fellépő mikropszia hatására a vezető rosszul becsüli fel a távolságot. A jelenség fordítottja az okulomoto- ros makropszia: a nézett pontnál közelebb eső tárgyakat a valóságosnál nagyobbnak észleljük; egyes kutatók a látóhatár megnövekedő Hold-képét ehhez az illúzióhoz kapcsolják. Az okulomotoros mikropszia-makropszia jelenséget elsőként Sir Charles Wheatstone ismerte fel 1852-ben, az általa korábban feltalált sztereoszkóppal végzett kísérletezés
2.3. Szín- és világosságkonstancia Amatőr fotósok gyakran szemlélik csalódottan alkonyaikor, belső térben vagy neonfénynél készített színes diáikat, filmjeiket a vörösbe, zöldbe, kékbe hajló képek láttán. Pedig valójában ezek a képek tükrözik hűen azokat a színviszonyokat, melyek a kép készítésekor fennálltak, a lefényképezett tárgyakról valóban a képeken látható színű fények érkeztek a fényképezőgép lencséjébe, bár a fényképész nem ilyen színeket látott. Egy tárgy színének azt tekintjük, amilyennek fehér fényű megvilágításban látszik, és ez attól függ, hogy a színspektrum egyes részeit milyen arányban veri vissza. A megvilágítás azonban sok esetben nem fehér színű, így a visszaverődő fény színe is más lesz, és ez az, amit a fényképek mutatnak. Modern, digitális kamerákon már
125 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés beállíthatjuk a külső megvilágítás típusát – mesterséges fényt, higanygőzlámpát –, és a kamera ehhez illeszkedően korrigálja a színeket. A valóságot jobban közelítő színeket kapunk attól a kamerától, melynek „megmutathatunk” egy fehér – azaz általunk fehérnek látott – felületet, amiről a kamera pontosan megmérheti az uralkodó megvilágítás színösszetevőit. Valami hasonló történik az emberi látórendszerben is; egy-egy részlet színének kialakulásában az arról érkező fény színe mellett a teljes látótérből, más részletekről érkező színek is szerepet játszanak azzal, hogy együtt lehetővéteszik a megvilágítás színének megbecslését. Ennek köszönhető a színkonstancia, azaz, hogy ritka kivételektől eltekintve a tárgyak színét a legkülönbözőbb világítási körülmények között is jól meg tudjuk ítélni: azonosnak látjuk, nem pedig olyannak, mint amilyennek színhibásnak tartott fényképeink mutatják. A különböző megvilágítási körülmények között is jól működő színészlelésünkhöz hasonlóan, félhomályban és fényes napon is egyformán jól érzékeljük egy felület világosságát, egy tárgy világos vagy sötét voltát. Világosnak tekintünk egy felületet, ha a ráeső fény nagy részét visszaveri, és sötétnek látjuk, ha csak kicsi a visszaverődő hányad. Ez az ítéletünk nem függ a megvilágítás mértékétől: ugyanazt a világos felületet mind erős, mind gyenge fényben világosnak látjuk, a sötét felületet pedig sötétnek, bár nyilvánvaló, hogy erős fényben egy sötét pontról is több fény érkezhet a szemünkbe, mint gyenge fényben a világosról. Az egy-egy pontról érkező fény érzékelése mellett azonban a látórendszer a környezetről beérkező fénymennyiséget átlagolja, és ehhez az átlaghoz képest ítéli meg és észleli az egyes pontok világosságát. Látórendszerünknek ez a képessége a világosságkonstancia. Érdemes megjegyezni, hogy különleges körülmények között a világosságkonstancia hibázhat. Sötét szobában felfüggesztett és keskeny fénysugárral megvilágított fekete felület fehérnek látszik (Gelb-effektus), és ennek fordítottjaként, jól megvilágított környezetben felfüggesztett fehér felület, melyre árnyék vetül, feketének látszik (Kardos-effektus). A látás tanulása során a konstanciákra és jelzőmozzanatokra építve sémákat alakítunk ki, aminek előnye egyrészt az, hogy ezekbe azután könnyen és gyorsan be tudunk sorolni egy-egy látványt, másrészt „gondolkodás nélkül” tudjuk, hogy egy-egy sémához milyen értelmezés, esetleg cselekvés tartozik. Arra is van példa, hogy a megtanult sémákba nem illeszkedő látványról egyszerűen nem veszünk tudomást, vagy „kicseréljük” egy ismerős látványra. Ilyen esetekben a látvány helyes értelmezéséhez szükséges idő a sokszorosa annak az időnek, amit egy megtanult sémába illeszkedő látvánnyal töltünk. A „szokatlan” látvány elemzésére fordított jelentős többletidő rávilágít látórendszerünk működésének „gazdaságossági” oldalára: a látás evolúciójának kulcsfontosságú tényezője volt a rendelkezésre álló agyi képfeldolgozó kapacitás korlátozott volta. Bár mindennapi tapasztalatunk azt sugallná, hogy látásunk alapján egy meglehetősen pontos és folyamatos képünk van fizikai környezetünkről, valójában a látórendszer a környezetből csupán annak és csak annak a képi információnak a kinyerését vállalja, amire tudatosan figyelünk, vagy amire cselekvésünk irányításához szükség van. Meglepő kísérletek bizonyítják, hogy pillanatnyi figyelemelterelés után beszélgetőpartnerünk cseréjét sem feltétlen vesszük észre, vagy erősen figyelve egy sportesemény részleteire, nem tűnik fel, amint egy majomjelmezes civil átsétál a színen.
3. Néhány elemi illúzió – a szabályrendszer kivételei Előfordulhat, hogy az elénk kerülő látvány nem értelmezhető helyesen megtanult látási szabályaink alapján, vagy a különböző szabályok ellentmondó értelmezésre vezetnek. Ha látórendszerünk ilyenkor egy téves értelmezést választ, illúzióról beszélünk. így, amikor illúziót akarunk láttatni, egyszerűen csak egy vagy több tanult szabálynak ellentmondó, azok szerint csak hibásan értelmezhető látványt kell előállítanunk. Bármilyen egyszerű is egy illúziót kiváltani, igen tanulságos és számos esetben a hihetetlenségig meglepő, hogy vizuális illúzióink mennyire erősek, mennyire „hiszünk” a szemünknek, még akkor is, ha pontosan tudjuk, hogy becsap minket. Az illúziók vizsgálata így megtanult látási szabályaink tanulmányozásának és megismerésének hatékony eszköze. Shepard képe (6.12. ábra) két teljesen egyforma alakot mutat, amint egyikük egy alag- útban menekül a másik elől. Az alagút lineáris perspektívája, valamint az, hogy a közelebbi alak a kép alsó részében van, a távolabbi pedig középtájon, határozott térbeliséget sugall. Itt az illúzió abban áll, hogy az üldöző képét a menekülő képénél nagyobbnak ítéljük. Az illúzió egyben érzelmi tartalmat is hordoz: még ha tudjuk is, hogy a két alak valójában nem különbözik egymástól, az üldöző arcán kegyetlenséget, a menekülőén rettegést érzünk tükröződni.
126 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.12 ábra. A két alak valójában teljesen egyforma A 6.13. ábrán változó szürkeségű kerek foltokat látunk. Megszoktuk, hogy mivel a fény általában felülről érkezik, az árnyak lefelé vetülnek, így a tárgyak felül világosak, és alsó részük árnyékos. Az ábra kerek foltjait ezért térbelinek látjuk – mélyedéseknek vagy domborulatoknak –, sötét és világos részük elhelyezkedésével összhangban. Megpróbálhatunk arra gondolni, hogy a fényforrás alul van; ha sikerül, akkor a bemélyedések és kiemelkedések szerepet cserélnek. Tartósan általában nem sikerül: más térbeliséget sugalló jelzőmozzanat hiányában a felülről érkező fény megtanult szabálya erős illúziót kelt.
6.13. ábra. A változó szürkeségű foltokat felülrõl megvilágított domborulatoknak és mélyedéseknek látjuk Más a helyzet, ha az illúzió eredménye a megszokott és belénk gyökerezett más tapasztalattal ellentmondásba kerül. Az emberi arc térbelisége ilyen, mélyen gyökerező tapasztalat. A Csodák Palotájában kiállított szobor felülről megvilágított gipsz negatívját alulról világított pozitívnak látjuk, annak ellenére, hogy még a fényforrás helyét is mutatja a tárló üvegén megcsillanó vakufény (6.14. ábra). 127 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.14. ábra. Mellszobor és negatívja A világosság mellett a tárgyak színe is befolyásolja a térbeli elrendezés megítélését. Az olyan tárgyakat, felületeket, melyek kékközeli – úgynevezett hideg – színűek, távolabbinak érezzük, mint a vörösközeli – meleg – színűeket. Világoskék falú szobát nagyobbnak látunk – és hidegebbnek érzünk -, mint a narancssárgára festett ugyanolyan méretűt. Televízió és számítógép képernyőjén, főleg élénk színű, összefüggő nagyobb szegmenseket látva – amilyen például szövegek háttere a teletextben -, gyakran érezzük azt, hogy a kép különböző színű részletei más-más térbeli távolságban vannak. Ennek az illúziónak a neve színmélység (bár manapság ez a fogalom a számítógépképernyők színvisszaadó képességét jellemző paraméterként él a köztudatban).
6.15. ábra. a) Az ikrek a tégla alakú, eredeti szobában. b) A szoba „észrevehetetlen” változása. c) Az ikrek a sarkokkal mennek. d) A „változatlan” szobában az ikrek bal oldali tagja törpe, a jobb oldali óriás „lett” Térlátásunk alapkérdésére világít rá az Ames-szoba-illúzió: elvileg végtelen sok, különböző, egymásra nem is hasonlító térbeli elrendezésnek lehet ugyanaz a retinánkra vetülő képe. Így ezeket a valójában különböző alakzatokat egy alkalmas pontból nézve egyformának látjuk, amint azt Helmholtz már ötven évvel az Amesszoba elkészítése előtt felismerte. Megfordítva, bármely térbeli tárgy pontjait „szemsugarunk” mentén – gondolatban – különböző mértékben eltolva, a retiná- lis kép megváltozása nélkül juthatunk új formákra. Az Ames-szoba (6.15. a-d ábra) készítésekor egy hagyományos, üres szoba falán fúrt kémlelőlyukból indított szemsugarak mentén toljuk el a túloldali sarkokat és éleket. Az így kapott szoba már nem tégla alakú, és elmozdított falai már nem téglalapok, padlója és mennyezete nem vízszintes. A távolabbra került sarokban a szoba egyben magasabb is lett, mint eredetileg volt, a közelebbre húzottban pedig alacsonyabb. Ennek ellenére, egy szemmel a kémlelőlyukon belesve retinális képünk változatlan marad. A megkülönböztethetetlen retinális képek miatt látórendszerünk a szobát természetesen változatlanul tégla alakúnak ítéli. Az illúzió igazán meglepő része akkor következik, amikor két egyforma magas személyt állítunk a szoba két sarkába, akikhez mérve azonnal láthatnánk a változást, azaz, hogy a távoli sarok magas, a közeli pedig alacsony (6.16. ábra) Kiderült azonban, hogy képtelenek vagyunk a szobát valóságos alakjában látni; amit ehelyett látunk, az az eredeti szoba, egyik sarkában egy törpével, másikban egy óriással. Ráadásul, ha a két személy helyet cserél, a látványt tudatunk úgy értelmezi, hogy a törpe megnő, és az óriás összezsugorodik. Ez akkor is így van, ha egyébként pontosan tudjuk, hogy mi az, amit látunk. 128 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.16. ábra. Egy valódi Ames-szoba Az Ames-szoba-illúzió is rávilágít arra, hogy mennyire meghatározza látásunkat a megtanult tapasztalat. A látáskutatás klasszikusai szerint látórendszerünk feladata nem más, mint hogy a látott képek sok lehetséges értelmezése közül kiválassza azt, amelyik a tapasztalatunk szerint a legvalószínűbb, azaz kitalálja, hogy melyik az a „külső világ”, ami a látottakat a legjobban magyarázza. A derékszögű sarkokkal rendelkező, téglatest alakú szobák világa mélyen belénk rögzült séma. (Érdekes kérdés, hogy barlanglakó őseink milyen eredményre jutnának az Ames-kísérlettel?)
4. A kétszemes látás Az Ames-szoba illúzió lényeges eleme, hogy egyetlen pontból, egy szemmel látjuk a teret. Az akkomodáció és a légtávlat jelzőmozzanataitól eltekintve, egy pontból valóban végtelen sok, különböző térbeli alakzat egyformának látszhat, és elvileg nem tudjuk eldönteni, hogy egy látvány valójában milyen alakzatot takar. Ha van egy másik pontunk is, ahonnan a kérdéses alakzatot megnézhetjük, az onnan látható másik képhez szintén végtelen sok, különböző térbeli alakzat tartozhat. (A lehetséges különböző térbeli alakzatok között természetesen mindig van síkbeli is, ami egyben a látott kép, de ilyen az alakzat fényképe vagy egy róla készült „realista” festmény is.) A 6.17. ábra vörös és kék színnel mutatja a látott képekhez rendelhető térbeli alakzatok két sorát. A térbeli változatok két végtelen sokaságában azonban csak egyetlen olyan alakzat van – és egy mindig van -, mely mindkét sokaságban megtalálható, közös. Ez a közös alakzat a valódi tárgy (amit az ábra lila színnel mutat), és ez az, amit két szemmel a térben látunk.
6.17. ábra. Két pontból nézve egyértelmű a látvány Kétszemes térbeli látásunk lényegi alapja a két retinális kép finom különbsége, a binokuláris diszparitás. Bár látásunk működése már az ókorban is foglalkoztatta a tudósokat, és természetesen felismerték, hogy a két szem más-más képet lát, a képi különbség szerepe meglepően későn tudatosodott. Az állati test, a szem és az agy anatómiájával már a történelem előtti pásztornépek is tisztában voltak. Időszámítás előtt 400 körül Hippokratész már ismerte a látórendszer fő funkcióit. A szem optikáját először Kepler írta le 1604-ben, a látvány agyi leképezésének gondolatát pedig Descartes vetette fel 1657- ben. A kétszemes térbeli látás mechanizmusának
129 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés felismerése is Kepler nevéhez kapcsolódik, aki a Föld és a csillagok távolságának méréséhez már a binokuláris – ez esetben stel- láris – parallaxis elvét használta. A méréshez szükséges két kép a földpálya két átellenes pontján készült az égboltról. 1775-ben veti fel Joseph Harris, hogy az emberi térlátás alapja a két szem által látott két kép különbözősége lehet. Azt, hogy valóban létezik a képi különbségeken alapuló emberi térlátás, csak 1838ban bizonyította be kísérletileg Whe- atstone a sztereoszkóp – egy egyszerű tükrös szerkezet – elkészítésével, mellyel két különböző képet tudott a két szembe vetíteni. Wheatstone-t követően a sztereoszkóp óriási közönségsikert aratott: a sztereokép-készítés – később a sztereofotózás – hosszú időre népszerű, divatos hóbort lett. A másképp szinte észrevehetetlen finom képrészletek a térbe kipattanva ma is elbűvölik a szemlélőt.
6.18. ábra. A Vieth–Müller-kör és a horopter A kétszemes térlátás biológiai alapja az egymásnak megfelelő pontok léte a két retinán. Ilyen egymásnak megfelelő pontok a foveák, a retinák éles látási pontjai, melyekre annak a térbeli pontnak a képe vetül, amelyre éppen ránézünk, fixálunk. A többi térbeli pont, mely az éppen fixálttal azonos szög alatt látszik, a térlátásban különleges szerepet visel. A térbeli felületnek, melyen ezek a pontok előttünk elhelyezkednek, horopter a neve. (A két szemből azonos szög alatt látszó pontok a geometria szabályai szerint tóruszfelületet alkotnak, melynek vízszintes síkmetszete a Vieth-Müller-kör [6.18. ábra]. A szem valóságos – a geometriai lyukkamerától eltérő – optikája miatt a horopter laposabb, mint a Vieth-Müller-kör, és azon kívül fekszik.) Látórendszerünk kialakulása, szemünk optikája gondoskodik arról, hogy a horopter pontjai is egymásnak megfelelő pontokra essenek a két retinán. Két szemünk egymásnak megfelelő pontjairól érkező idegi ingerek agyunkban páronként összetalálkoznak, összekapcsolódnak, és így ezeket egyetlen képpontként látjuk. Más szóval, a horopter az, amit elsődlegesen egyetlen képként látunk. Hogy az önálló képpontok egységes képpé állnak össze, abban fontos szerepe van annak a ténynek, hogy szemeinkből agyunk felé haladva a képi szomszédosság megőrződik, ezáltal a retinánkon keletkező kép agyunkban is retinotopikus kép marad. Ahogy retináinkat valóságos, optikai képernyőnek tekinthetjük, úgy beszélhetünk agyi képernyőről is. (Hogy ez az agyi képernyő nemcsak egy szemléletes szóhasználat, hanem a valóságban is létezik, és még mikroszkóp alatt is láthatóvá tehető, azt már a látáskutatás korábbi fázisaiban, meglehetősen kegyetlen, a mai törvények által már tiltott állatkísérletekkel bizonyították.) Ráadásul az agyi képernyő összerendezve, együtt tartalmazza mindkét retinaképet, ezért „csíkozott” (6.19. ábra). A szomszédos csíkok felváltva a jobb és a bal szem képét hordozzák. Az egymásnak megfelelő retinapontok mindig szomszédos csíkokhoz kapcsolódnak, így a két szemben keletkező két kép együtt – mozaikszerűen – vesz részt a közös agyi „kép” kialakításában. (Ez a csíkozott agyi képalkotás igen gazdaságos idegi működést tesz lehetővé: azok a képi részletek, melyeknek a látványban egymáshoz köze lehet, az agyi képben is mindig közel vannak egymáshoz, így a kép értékeléséhez nem kell bonyolult ideghálókat, távoli kapcsolatokat kiépíteni.)
130 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés 6.19. ábra. A két szem képének agyi közösítése – a fehér területekre a jobb, a feketékre a bal szem képe érkezik (majomagyi látókéreg „kivasalt” részlete) A fixált pontnál – illetve a horopternél – lényegesen közelebb vagy távolabb lévő más pontok képeit, melyek sem a retinán, sem az agyi képben nem esnek egymásnak megfelelő pontok közelébe, agyunk nem kapcsolja egybe, ezeket duplán látjuk (kettős látás). Ha magunk elé tartott ujjúnkra nézünk, megfigyelhetjük, hogy mögötte az ajtókilincs vagy a könyvespolc két példányban látszik. Ajelenség csak azért nem zavaró, mert megszoktuk, és nem figyelünk rá. Van azonban a fixált pont előtt és mögött a térnek egy kettős rétege, mely szendvicsként fogja közre a horoptert, ahonnan a pontok képe ugyan nem egymásnak megfelelő pontokra esik, de hozzájuk mégis elegendően közel ahhoz, hogy agyi képünkben is fel tudjuk fedezni a hasonlóságot. Ez az a sáv, ahol a látvány két képét összeolvasztjuk (fuzionáljuk), és a tárgyakat valóban a maguk térbeli mélységében érzékeljük; ez a sztereolátás (6.20. ábra). (Az agyi kép csíkozottságának szerepét ebben a funkcióban értékelhetjük igazán: ez teszi lehetővé, hogy egyszerű, egyenként csak néhány csíkot lefedő, „diszparitásérzékeny” idegsejtcsoportokkal képesek vagyunk a helyi hasonlóságokat –azaz valójában a térbeli mélységet – érzékelni. Aszerint, hogy milyen viszonylagos helyzetben lévő csíkokhoz kapcsolódnak, vannak „azonos távolság”-sejtek, „előtte”-sejtek és „mögötte”-sej- tek.) A sztereolátásban szerepet játszó idegrendszeri szerveződések meglétét Panum igazolta méréssel 1858-ban; ezeket róla Panum-mezőknek nevezik. A Panummezők mérete egyértelmű kapcsolatban van azzal a térbeli sávval – a sztereomélységgel – melyen belül sztereolátásunk működik.
6.20. ábra. A térlátás agyi képe: szilvát nézzük, szõlõ és banán azonos szög alatt („megfelelõ” pontok) = egyetlen kép; cseresznye, egres sztereomélységen belül = egyetlen fuzionált kép (mélységérzettel); áfonya, ribizli túl közel/messze = kettõs kép (nem figyelünk rá) Azaz, bár úgy tűnik, hogy magunk körül a teret a maga teljességében észleljük, tényleges sztereolátásunk – melynek alapjai apró képmozaikok helyi hasonlóságának elemi felismerésében gyökereznek – valójában egyszerre csak a látott tér kis térfogatára korlátozódik.
7.4. táblázat JULESZ BÉLA
131 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
Julesz Béla 1928-ban született Budapesten. 1950-ben a Budapesti Mü- szaki Egyetemen szerzett friss diplomájával villamosmérnöki pályáját a Távközlési Kutatóintézetben kezdte. 1956-ban védte doktori értekezését, melynek témája a mikrohullámú rendszerek és a televíziójel elmélete volt. Ezt követően az Egyesült Államokban, a Murray Hill-i Bell Laboratórium munkatársaként érdeklődése az agyi képfeldolgozás irányába fordult. 1960-ban a „random-dot” (véletlen-pont-) sztereopár kidolgozásával olyan új felfedezést tett, mellyel gyökeresen megváltoztatta a térlátásról alkotott addigi nézeteket, és egyben új, hatékony eszközt adott a modern látáskutatás kezébe. Munkássága, mely kutatói generációknak mutatott irányt és adott inspirációt, a kísérleti pszichológia, az emberi látórendszer megismerése, a térbeli mélység észlelése és az alakfelismerés területén meghatározó jelentőségü. Eredményeit több mint kétszáz tudományos közleményben adta közre; 1971-ben publikálta alapvető, azóta is nagy hatású könyvét a két szem képét egyesítő emberi térlátásról, melyet homéroszi metaforával, Odüsszeusz ellenfele, az egyszemü óriás – Küklopsz – után küklopszinak nevezett. A Dialógusok az észlelésről címmel 1995-ben megjelent könyve magyar nyelven is olvasható. Munkásságát a szakmai közélet számos díjjal és tudományos társasági tagsággal ismerte el; 1983 óta volt a Magyar Tudományos Akadémia tiszteleti tagja. A New Jersey-beli Rutgers Egyetem nyugalmazott professzoraként, az egyetem Látáskutató Laboratóriumának alapító igazgatójaként 2003. december 31-én hunyt el.
5. A Julesz-féle sztereopár Láttuk, hogy a kétszemes emberi térlátás alapja a két retinális kép finom különbsége, ami a szemek helyének néhány centiméternyi távolságából következik. Az egyes tárgyak helye a két képben annál jobban eltér, mennél közelebb van hozzánk az illető tárgy, amint azt magunk is tapasztalhatjuk, ha szemeinket váltogatva – nyitvacsukva – nézünk különböző távolságban lévő tárgyakra. A Julesz-féle „random-dot” (véletlen-pont) sztereopár leírását megelőzően nyilvánvalónak tűnt, hogy a térlátást megelőzi a felismerés: először mindkét szemben azonosítjuk a látvány egyes elemeit, a látott tárgyakat, és tudatunk csak ezután helyezi őket valódi térbeli mélységükbe, viszonylagos eltolódásuk – diszparitásuk – alapján. Julesz zseniálisan felismerte és a sztereopár segítségével bebizonyította, hogy a térbeli mélység érzékelése független a felismeréstől: térbeli mélységet akkor is képesek vagyunk érzékelni, ha külön-külön a két retinális képen egyáltalán nincs mit felismerni. Ahogy minden sztereokép, a Julesz-féle sztereopár is két képből áll, egyik a bal, másik a jobb szem számára. Az egyik kép, például a bal, egy tetszőleges, véletlen mintázat, mint egy fehér papírra szórt marék mák. Ebből kiindulva készül a másik, a jobb oldali, oly módon, hogy a mintázat bizonyos részleteit kivágjuk, és kicsit jobbra vagy balra eltoljuk aszerint, hogy az illető részlet látványát a térben közelíteni vagy távolítani kívánjuk. (Az így üresen maradó sávokat az eredetihez hasonló, egyébként tetszőleges mintázattal töltjük fel.) Ezekkel az eltolásokkal a bal és a jobb kép ugyanazon részletei a képen belül máshova kerülnek, ugyanúgy, ahogy két szemünk is eltolva, másutt látja ugyanazt a tárgyat (6.21. ábra).
132 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
6.21. ábra. Julesz-féle sztereopár
7.5. táblázat SZTEREOPÁR KÉSZÍTÉSE, A DISZPARITÁS MÉRTÉK A sztereopár készítésekor a legfontosabb kérdés, hogy a bal kép véletlen mintázatának mely részleteit és milyen mértékben kell eltolni a jobb képen ahhoz, hogy egy előre elhatározott látványhoz, mélységképhez jussunk. Szemváltogatós kísérletünkben megfigyelhettük, hogy az egyes részletek mindig a szemeinket összekötő vonallal párhuzamosan, azaz vízszintesen mozognak, ezért bármilyen bonyolult is egy látvány, azt vízszintes, vonalszerű mintázatokból össze tudjuk rakni. Hogy lássuk, mi honnan hova mozog, gondolatkísérletként készítsük el a mákos tapéta kapcsán említett képeket. Hogy együtt lássuk az összetartozó képszegmenseket, a mákos minta helyett legyen az alapsík zöld, a kiemelt rész piros, és az oldalak kékek. A piros tető „elmozdulásának” – disz- paritásának – és a nézőpont helyének kapcsolata az ábrán jól látható, mértéke elemi geometriai megfontolásokkal levezethető, egyszerű képletből ki is számítható. Ugyanennyivel kell a bal oldali képként használt tetszőleges „mákos” mintázat szegmenseit elcsúsztatni a jobb oldali kép készítésekor.
133 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés
Julesz első sztereopárjain a kép közepét kitöltő négyzet volt eltolva. Nyilvánvaló, hogy egy ily módon készült, „mákos” képen valóban nincs semmi, amit felismerhetnénk. Ha gondoskodunk arról, hogy mindkét szemünk a neki szánt képet lássa, kiderül, hogy mégis felismerjük és folyamatos, összetartozó felületdarabokként érzékeljük az egyes összefüggő mintázatszegmenseket, amint különböző, elcsúsztatásuk mértékétől függő távolságban lebegnek előttünk a térben. Az eredő felület érzékelése olyan erőteljes és stabil, hogy akár szemünket mozgatva is végig tudjuk vizsgálni részleteit, és képesek vagyunk egy ceruza hegyét végigvezetni rajta (6.22. ábra).
6.22. ábra. Lépcsős piramis sztereopár (Bal-Jobb-Bal) Julesz sztereopárjai alkalmasak voltak az emberi látórendszer egy addig ismeretlen „szervének”, a küklopszi (cyklopikus) szemnek a létét kimutatni és agybeli helyét behatárolni. Mint látásunk sok más eleme, tanulás eredménye ez a képességünk is, mellyel a két retinális kép finom különbségeit felfedezve térbeli mélységet érzékelünk. A két szem képe – csíkozott agyi képernyőnkön összefésülve – a közel fekvő részletek elemi hasonlósága által ingerelve alakítja ki agyunkban a kétszemes távolságérzékelésben szerepet kapó helyi idegi kapcsolatokat. Ez a tanulási időszak – „ablak” – a csecsemőkor második negyedévére esik, és féléves kor körül bezárul. Egyes látási rendellenességek – kancsalság, a két szem jelentős eltérése – gátolják vagy lehetetlenné teszik a kétszemes térlátás megtanulását azáltal, hogy a két retinális kép egymásnak megfelelő részletei nem „találkoznak” az agyi képernyőn. Hacsak lehet, ezért végzik a látáskorrekciós műtéteket féléves kor előtt. Látási rendellenességeknek tulajdoníthatóan a népesség hozzávetőleg 5 százaléka egyáltalán nem látja, 20-25 százaléka pedig kisebbnagyobb nehézséggel, esetleg csak részlegesen látja a Julesz-féle sztereopárokat.
7.6. táblázat A SZTEREOPÁR SZEMLÉLÉSÉNEK MÓDSZEREI Számos sztereopárok szemlélésére szolgáló tükrös, prizmás optikai szerkezet, sztereoszkóp létezik, melyek 134 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés alkalmasan szemeinkbe vetítik a nekik szánt képeket. Ezek azonban ritkán állnak rendelkezésünkre, ha szórakozásból, hobbiból sztereopárokat nézegetünk. Erdemes ezért megtanulni, hogyan boldoguljunk segédeszköz nélkül. Egy sztereopárt nézve az a szokatlan, az okozza a kezdeti nehézséget, hogy nem ott kell éles képet látnunk (akkomodálnunk), ahol szemsugaraink kereszteződnek (konvergálnak), azaz, ahova nézünk: míg a kereszteződésnek a papír síkja mögött vagy előtt kell lennie, szemeink „autofókuszával” a papírra kell élesíteni. Ráadásul, ha a papír elé, a levegőbe kell nézni, ott nincs semmi, ha pedig mögé, oda nem látunk. Mégis, ha eleinte nehezen áll is össze a kép, megéri a fáradságot. Első alkalommal megpillantani a térben lebegő alakot mindenki számára meglepő, a felfedezés örömét nyújtó élmény. Először el kell dönteni, melyik képet melyik szemünkkel akarjuk nézni. Ha ugyanis a képeket felcseréljük, akkor a mélység „kifordul”, mintha az alakzatot hátulról néznénk, mert a térbeli távolságot hordozó képbeli eltolódások – diszparitások – ellenkező irányúra változnak. Vannak sztereopárok, melyeket érdemes „elölről” is, „hátulról” is megnézni. Ha egészen közel szemünk elé tartjuk a sztereopárt, és várunk néhány másodpercet, akkor szemünk ellazult, távolba néző állapotba kerül. Ekkor a sztereopárt lassan olvasási helyzetbe távolítva, és közben tudatosan ügyelve arra, hogy folyamatosan messze mögé, és ne rá nézzünk, mindkét szem a neki szánt képet fogja látni, és küklop- szi szemünk előtt megjelenik a sztereopárban kódolt látvány. Ha nem sikerül a sztereopár mögé nézni, készíthetünk róla másolatot átlátszó fóliára. Ezen már keresztül tudunk nézni, és figyelhetünk egy fekete pontot, melyet egy kellő távolságban mögé tartott fehér papírra rajzoltunk. Ugyanerre az eredményre juthatunk, ha a sztereopárt üveglap mögé téve, a saját tükörképünkre meredünk. Ha a két szemnek szánt két képet (a papír felszabdalása nélkül) fel akarjuk cserélni, akkor a „mögé” nézés helyett bandzsítva „eléjük” kell nézni. Ezt megkönnyíti, ha az ábra és magunk közé féltávra tartott ujjunkat nézzük. Tarthatunk féltávra papírból kivágott kis ablakot is, melynek pontos helyét és méretét úgy kell meghatározni, hogy mindkét szemünk csak a neki szánt képet lássa az ablakon keresztül. A két kép felcserélésének megkönnyítésére a 6.22. és a 6.23. ábrák sztereopárjai kettő helyett három képet mutatnak, melyek közül a két szélső egyforma: Bal-Jobb-Bal. Így „egy nézésre” láthatjuk mind a Bal-Jobb, mind a Jobb-Bal párosítást, a mélység kifordulását, akár elé, akár mögé nézünk. Bár a diszparitáshoz kötődő kétszemes térlátás hiánya később nem korrigálható, a Ju- lesz-féle sztereopárok elláthatók néhány olyan egyszemes kulccsal, melyek a teljes mintázatot a 6.23. ábrán mutatott módon magukkal emelik a térbe, és azok számára is a tér élményét adják, akik egyébként azt nem látnák.
6.23. ábra. Sztereopár egy- és kétszemes kulcsokkal
5.1. ÖSSZEFOGLALÁS 1. Ebben a fejezetben megismerkedtünk azokkal az egy- és kétszemes távolsági jelzőmozzanatokkal, melyekre alapozva a látórendszer felépíti tudatunkban a környező teret (egyszemes jelzőmozzanatok: látszólagos méret, látómezőbeli hely [magasság], részleges takarás, lineáris perspektíva, mintázatok finomsága, légtávlat, fények és árnyékok, akko- modáció, mozgási parallaxis; kétszemes jelzőmozzanatok: binokuláris parallaxis, szemek konvergenciája). 2. A közvetlen látványelemek korábban megtanult sémákba illeszkedve, korábban megtanult szabályok szerint értelmezve alakítják térélményünket, mely a (kétdimenziós) sík retinaképek végtelen sok lehetséges (háromdimenziós) térbeli értelmezése közül (majdnem mindig) a valóságot tükrözi. Látási szabályaink mélyebb megismerésére szolgálnak a kivételek, a téves értelmezésre vezető, ellentmondásos látványkonstrukciók, az illúziók. 3. A kétszemes térbeli látás a binokuláris parallaxis jelenségén alapul, azaz a két szem re- tinális képeinek eltérésén, mely a látvány két különböző pontból történő szemléléséből következik. A kétszemes térbeli látás – a küklopszi szem – agyi mechanizmusának alapja a képies elrendezést megőrző, csíkosan összefésült, retinotopikus agyi kép helyi hasonlóságainak felismerésére képes idegi (neurális) szerveződés, mely a 135 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés hasonlatosságot – és így a mögöttes térbeliséget – még önmagában (monokulárisan) értelmezhető tartalom hiányában (mint például a Julesz-féle véletlenpont-sztereopárok esetében) is képes érzékelni.
5.2. KULCSFOGALMAK akkomodáció, Ames-szoba, binokuláris diszparitás, binokuláris jelzőmozzanat, binokuláris parallaxis, camera obscura, Emmert-törvény, Hold-illúzió, horopter, illúzió, Julesz-féle véletlen-pont- (random-dot) sztereopár, kétszemes látás, kettős látás, konstancia (nagyság-, alak-, hely-, mozgás-, szín-, világosság-), konvergencia, küklopszi (cyklopikus) szem, látószög, légtávlat, lineáris perspektíva, monokuláris jelzőmozzanat, mozgási parallaxis, okulomotoros mikropszia/makropszia, Panum-mező, perspektíva, retinotópia, színmélység, sztereofúzió, sztereolátás, sztereomélység, sztereopár, téri jelzőmozzanat, Vieth-Müller-kör
5.3. ELLENŐRZŐ KERDESEK 1. Melyek a monokuláris téri j elzőmozzanatok? 2. Mi a kétszemes térbeli látás alapja? 3. Hogyan függ az észlelt méret a retinális kép méretétől és a tárgy távolságától? 4. Mi az Emmert-törvény? 5. Milyen szabályokat alkalmaz a látórendszer a nagyság-, az alak- és a mozgáskonstanciákban? 6. Mi az illúzió? 7. Miért ellentmondásos a Hold-illúzió? 8. Miben tévedünk Ames-szobába nézve? 9. Mi a horopter kapcsolata a retinák egymásnak megfelelő pontjaival? 10.Mi a sztereomélység, a sztereofúzió és a Panum-mezők kapcsolata? 1. Mi a különbség egy Julesz-féle véletlenpont-sztereopár és egy sztereofénykép szemlélése között?
5.4. AJÁNLOTT OLVASMÁNYOK Gombrich, E. H. 1972. Művészet és illúzió. Gondolat, Budapest. Gregory, R. L. 1973. Az értelmes szem. Gondolat, Budapest. Hershenson, M. (Ed.) 1989. The Moon Illusion. Earlbaum, Hillsdale, NJ. Higashiyama, A. – Shimono, K. 1994. How accurate is size and distance perception for very far terrestial objects? Function and causality. Perception & Psychophysics, 55 (4), 429-442. Julesz, B. 1971. Foundations of Cyclopean Perception. Chicago University Press, Chicago. Shepard, R. N. 1990. MindSights. W. H. Freeman and Co., New York. Simons, D. J. – Levin, D. T. 1998. Failure to detect changes to people during a real-world interaction. Psychonomic Bulletin & Review, 5 (4), 644-649.
5.5. AJÁNLOTT HONLAPOK http://facstaff.uww.edu/mccreadd/ (Hold-illúzió.) http://dragon.uml.edu/psych/illusion.html
136 Created by XMLmind XSL-FO Converter.
6. FEJEZET – Tér- és mélységészlelés (Illúziók.) http://viscog.beckman.uiuc.edu/djs_lab/ (Fi- gyelmi vakság.) http://www.wga.hu/ (Művészeti alkotások hasznos honlapja.)
137 Created by XMLmind XSL-FO Converter.
8. fejezet - 7. FEJEZET – Mozgásészlelés 1. Hogyan keletkezik mozgás? Bár vannak élőlények gyenge vagy teljesen hiányzó szín-, mélység- vagy akár formalátással is, a mozgás észlelése nem hiányzik egyetlen olyan élőlény perceptuális világából sem, amely saját, aktív mozgásra képes. A mozgás s annak észlelése a percepció alapja. A mozgásészlelés segít abban, hogy elkerüljünk tárgyakat, három dimenzióban nyújt információt a környezetről, segít az alak-háttér elkülönítésben (7.1. ábra), s figyelmünket a tér fontos helyeire irányítja. Különleges esetekben – például baleset vagy agyvérzés következtében – előfordulhat, hogy az emberi agy szelektív károsodása a mozgás tudatos élményének hiányát okozza. A sérülést általában az agykéreg azon területére (V5) lokalizálják, amely megfelel a majomagy mediális temporális (MT) területének (lásd a szövegdobozt). A V5 sérülése nyomán keletkező érzékleti változást agykérgi mozgásvakságnak nevezzük, mivel nem a retina vagy a látóideg sérülésének tulajdonítható. A beteg ilyenkor arról számol be, hogy a világ állóképekből áll, melyek úgy jönnek egymás után, mintha diavetítést, s nem úgy, mintha filmet nézne. Számos mindennapi tevékenység nehézségbe ütközik emiatt. így például nem tud magának kancsóból vizet önteni, mert nem érzékeli a víz szintjének változását a pohárban (7.2. ábra). De az is előfordulhat, hogy megijed, mert kutyája hirtelen eltűnik a szobából (nem érzékeli a kutya mozgását, s nem látja, hogy kiment, csak azt, hogy hirtelen nincs ott). Nem tud segítség nélkül átkelni az úttesten, mert a közeledő autót csak akkor észleli, amikor már késő. Tehát gyakorlatilag vak – vagy mégsem?
7.1. ábra. Álcázott madár. Demonstráció a mozgás alakészlelésben betöltött szerepére, melyet könnyen el lehet készíteni. A képet átlátszó fóliára másoljuk le, majd a fóliát vágjuk ketté a random vonalak fölső széle mentén. Helyezzük a zajt a madárra, s figyeljük meg, hogy a random vonaldarabokból álló zaj tökéletesen álcázza a madárrajzot. Ha barátunkat megkérdezzük, hol a madár, nem fogja megtalálni. Amint azonban elmozdítjuk bármelyik fóliát, a madár láthatóváválik. A demonstráció azt igazolja, hogy a mozgásból származó információ önmagában elégséges a látórendszer számára ahhoz, hogy hatékony figura-háttér elkülönítést és formafelismerést hajtson végre (vegyük észre, hogy ezen a zajjal fedett képen sem luminencia, sem színkontraszt nem definiálja a formát). Azt is nagyszerűen bizonyítja a demonstráció, hogy a mozgáskorreláció detektálása (ugyanúgy, mint a binokuláris korreláció detektálása random-pont-sztereogramokon) alacsony szinten történik, még a formaazonosítás előtt (lásd az animációt: http://zeus.rutgers.edu/~ikovacs/SandP/bird/bird.html)
138 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
7.2. ábra. A V5 (MT) terület szelektív sérülése miatt agykérgi mozgásvakságban szenvedõ beteg nem érzékeli, ahogy a víz szintje változik a pohárban Milyen ingerek válthatnak ki mozgásérzékletet? 1. A legegyszerűbb inger nyilván egy tárgy valódi mozgása. Amikor tehát egy tárgy fizikailag elmozdul a megfigyelő látómezőjében, mozgásérzet keletkezik. 2. Ennél sokkal összetettebb jelenség a látszólagos mozgás. A mozgásérzékelés 19. századi vizsgálói, miközben azt próbálták mérni, hogy mi az a legkisebb elmozdulás, illetve sebesség, ami mellett még fellép a valódi mozgás érzete, egy különös jelenségre lettek figyelmesek. Valódi fizikai mozgás hiányában, egyszerűen két szomszédos fényforrás egymás utáni felvillantásával is kiváltható volt a mozgás, sőt a mozgásirány érzete. Ez a látszólagos mozgásnak vagy stroboszkopikus mozgásnak nevezett jelenség azután hatalmas karriert futott be, a filmiparban való gyakorlati hasznosítást is megélve. A Ges- talt-pszichológia születését Max Wertheimer 1912-ben megjelent cikkéhez kötjük, melyben a két fényfelvillanás közötti üres térben megjelenő látszólagos mozgást tárgyalja. Ekkor jött divatba a látszólagos mozgás paramétereinek – például milyen hosszú lehet a szünet két felvillanás között – mérése, amihez pedig a pszichofizika születése köthető. Mai fogalmaink szerint a valódi és a látszólagos mozgás idegélettani háttere azonos, tehát agyi feldolgozás szempontjából ezeket közösen lehet tárgyalni. A látszólagos mozgás korai tanulmányozása azonban kitűnő vizsgálati módszereket, ingeranyagot teremtett, melyeket a modern vizsgálatok is használnak. 3. Mozgásérzet létrejöhet mozgási utóhatás miatt. Ez úgy keletkezhet, hogy valamilyen koherens, egyirányú mozgás éppen megszűnik. Például amikor egy vízesés előtt állunk, és pár percig bámuljuk az alázuhanó vizet, majd az erdő felé pillantunk hirtelen, akkor az erdő néhány másodpercig felfelé látszik mozogni. Ezt nevezzük mozgási utóhatásnak (7.3. ábra), vagy vízesés-illúziónak is hívják. A mozgási utóhatások kísérleti alkalmazásai segítettek feltárni az agykérgi mozgásirány-kódolási mechanizmusokat.
139 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
Különleges kategória a mozgási illúzió. Míg a látszólagos mozgás és a mozgási utóhatások idegélettani háttere nagyjából tisztázott, a mozgási illúzióé nem, azaz létezik a mozgásérzetet keltő mesterséges képeknek egy igen széles köre, melyek esetében egyelőre nem tudunk makezésére. Ezek a mozgási illúziónak nevezett jelenségek (7.4-5. ábra) jelentik a legfrissebb kihívást a kutatók számára, s nemcsak azért, mert szórakoztatóak, hanem azért is, mert megfejtésük a mozgásészlelés jobb megértését hozza majd magával. A mozgás érzékelése, bármilyen vizuális jelzésen is alapul (pl. valódi vagy látszólagos), olyan feldolgozó műveletek révén jön létre, melyek a környezet tárgyainak mozgásirányát és sebességét becsülik meg. Bár ezek a műveletek egyszerűnek tűnhetnek az észlelet egyszerűsége és azonnalisága alapján, valójában sem számítástechnikai, sem idegélettani értelemben nem egyszerűek.
7.3. ábra. Mozgási utóhatás. Ha a kép fölső részén lévő spirált egy pörgettyűre szereljük, s a pörgő spirált 40-60 másodpercig bámuljuk, utána egy arcra pillantva annak kifelé áramló eltorzulását fogjuk néhány másodpercig észlelni
140 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
7.4. ábra. Akioshi Kitaoka „tojások” címû képe. A mozgásérzet eredete valószínûleg a retina apró elmozdulásaiban s a kép ismétlôdô elemeiben keresendô, de pontos magyarázatunk még nincs erre a mozgási illúzióra
7.5. ábra. Leviant mozgásillúziója, melynek címe „Enigma” (Leviant, I. 1996. Proc. R.Soc. London, Ser. B, 263, 997–1019). A szürke körgyûrûkben furcsa, vibráló mozgás keletkezik.Bár itt is felmerült a kis szemmozgások miatt fellépõ retinális elmozdulásokon alapuló magyarázat, mégis sokan úgy gondolják, hogy ez az illúzió inkább agykérgi eredetû
2. A mozgásészlelés neurális alapjai 2.1. Irányszelektív idegsejtek Milyen neurális struktúra képes a mozgásérzetek legegyszerűbbjének, a mozgás irányának kódolására? Igazából nem is gerinceseket, hanem legyeket tanulmányozva jutott Werner Reichardt 1961-ben arra a következtetésre, hogy egy egyszerűen huzalozott apró neurális hálózat, ha megfelelően vannak időzítve a kapcsolatai,
141 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
egyértelműen képes a mozgásirány jelzésére (Reichardt 1961). A mozgásirányra (direkció)érzékeny, azaz irányszelektív idegsejtek lényege, hogy a retina két (vagy több) szomszédos helyéről vesznek mintát, de a jel a különböző helyekről eltérő időzítéssel jut el az idegsejthez. Amint azt a 7.6. ábra illusztrálja, a retinális receptorok különböző hosszúságú axonokkal kapcsolódnak a több receptorból jelet fogadó idegsejthez. Az axonok eltérő hossza az egyik lehetőség arra, hogy a jel időzítése megvalósulhasson. Ebben a példában balról jobbra haladva egyre kisebb késleltetéssel jut el a jel a receptortól az idegsejthez. Ha a retinát pásztázó fénysugár éppen a megfelelő sebességgel mozog balról jobbra (7.6. a ábra), akkor előfordul, hogy mind az öt receptor jelzése egy időben éri el a neuront. Ez az „össztűz” éppen elég lesz ahhoz, hogy az idegsejt elérje a kisüléséhez szükséges küszöbértéket, s jelezze a következő idegsejtnek, hogy mozgás történt, méghozzá balról jobbra. Vegyük észre, hogy az irányon túl a sebességet is egyből kódolni tudja egy ilyen idegsejt, hiszen, mint mondtuk, csak egy optimális ingersebesség mellett fognak a jelek szimultán érkezni az idegsejtre – s a kódoláshoz ezen a szinten ennyi elég is .
7.6. ábra. Irányszelektív idegsejt válasza balról jobbra, illetve jobbról balra mozgó fényingerre A jobbról balra történő mozgás esetén, amint azt a 7.6. b) ábra mutatja, idői késéssel érkeznek a receptoroktól a jelek, így nem tudnak összegződni, s a neuron nem fogja elérni a kisüléshez szükséges küszöbértéket. A példában illusztrált idegsejt tehát a jobbra irányuló mozgás egy adott sebességére érzékeny, azaz szelektív hangolású. Werner Reichardt legyeinek mozgásérzékenységét sikerült alacsonyabb rendű gerincesek, például békák retinájában is megtalálni. Furcsa módon emlősök retinájában nem találtak ilyet, pedig a mozgásérzékenység rájuk is jellemző! Kiderült azonban, hogy az evolúciós barkácsolás csomagolástechnikát is jelent. A magasabb rendű gerincesek retinájának már túl sok feladata van (pl. színkódolás) ahhoz, hogy a mozgásirányra érzékeny mikrohálózat is bele legyen építve, s így, bár az elv maradt – tehát a jel idői késleltetése az irányszelektív válasz érdekében -, a csomagolás megváltozott, s náluk már az agykérgi neuronok, közelebbről a V1 vonalirányulásra is érzékeny sejtjei vállalták magukra ezt a feladatot. A mozgásirányra való szelektivitás V1-beli reprezentációja szorosan kötődik a vonalirányra való szelektivitáshoz (7.7. ábra).
7.7. ábra. A mozgásirányra való szelektivitás agykérgi térképe. Az eltérő színű foltok a különböző vonalirányultságra érzékeny sejtek populációit reprezentálják (például piros a vízszintes vonalakra). A mozgásirány detekcióját ugyanezen V1-beli sejtek végzik, s a sejtek leginkább az orientációhangoltságukra 142 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
merőleges mozgásirányokra lesznek érzékenyek (például a piros mezôn belül lévő sejtek a vízszintes vonalak függőleges irányú elmozdulására) A fenti, késleltetésen alapuló Reichardt-detektorok vagy mozgás-energia érzékelők (Adelson-Ber- gen 1985) tulajdonképpen téri-idői korrelációt mérnek, s ma is a mozgásérzékelés legelfogadottabb modelljeiként tartjuk őket számon. A modell konkrét megvalósulásáról (hogy például valóban axonhossz vagy más neurális paraméter áll-e a késleltetés hátterében) azonban továbbra is heves viták vannak.
2.2. Lokális mozgások integrációja A mozgásirányt detektáló Reichardt-detektorok ugyan kitűnően tudnak lokális elmozdulásokat detektálni, nem tudnak információt adni nagyobb tágyak, illetve összetettebb mozgások esetén. Az úgynevezett ablakproblémától szenvednek (7.8. ábra), ami azt jelenti, hogy csak egy adott kontúr irányára merőleges elmozdulásokat tudnak detektálni. Így további feldolgozási szintekre van szükség a mozgásirány egyértelmű megállapítása érdekében. Annak bizonyítéka, hogy a lokális érzékelők „szavazatai” a mozgásirányról összegződnek, megtalálható például a már említett mozgási utóhatás jelenségében (7.3. ábra). Az egy irányban történő, hosszú ideig tartó elmozdulás hatására az arra az irányra érzékeny lokális detektorok adaptálódnak, egy időre elvesztik válaszkészségüket. Amikor a mozgás megszűnik, az adaptáció hatása néhány pillanatig még tart, s a teljes neuron- populációból az adott irányra adott sejtek egy időre „kiesnek”, így a teljes populáció „szavazata” nélkülük pont az ellentétes irányú elmozdulás felé fog mutatni. A mozgási utóhatás jelensége tehát arra utal, hogy nem egyetlen sejt, hanem egy teljes populáció populációs kódja, azaz „szavazata” lesz a döntő.
7.8. ábra. A mozgásirány-detekció ablakproblémája. Képzeljük bele magunkat egy Reichardt-detektor helyébe: a kis ablakon keresztül (ami a detektor receptív mezejének felel meg) csak a nagyobb alakzat apró részét látjuk. Éppen a megfelelő irányú vonaldarab került a mezőbe, s annak merőleges irányú elmozdulását detektáljuk. Ha azonban nincs információ a szomszédos detektorok válaszairól, akkor nem tudjuk, hogy a vonaldarabkánkhoz tartozó nagyobb tárgy valóban merre mozdul, hiszen amit mi elmozdulásként detektálunk, az bármely irányú globális mozgás eredménye lehet. Így a legokosabb, ha mindenesetre a kedvenc mozgásirányunkról tudósítást adunk, s azokra az integratív egységekre bízzuk a döntést, melyek a többi detektor válaszát is látják A populációs kód azonban még nem a teljes megoldás, hiszen sokszor előfordul, hogy a retinaképen lévő elmozdulások összetettek, több mozgáskomponensből állnak, melyek esetleg térileg átfedő helyeken, de más és 143 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
más irányokban mennek végbe (például amikor a vonatablakon bámulunk ki, szemmozgásaink s fixációs távolságunk függvényében a táj eltérő részei eltérő irányokban mozdulhatnak el a retinánkon. Fontos, hogy ilyen esetekben is el tudjuk különíteni az egyes komponenseket. Ugyanakkor az is igen gyakori eset, hogy az egy tárgyhoz tartozó komponensek a térileg elkülönülő receptív mező „ablakokban” eltérő irányú lokális mozgáskomponenst eredményeznek (ha megnézünk például egy csúcsára állított négyzetet, amely jobbról balra mozog – a felső bal oldali él lokális mozgása diagonálisan fölfelé, az alsó bal oldali élé pedig erre merőlegesen fog jelentkezni az ablakban). Mégis, képesek vagyunk a négyzet egységként való kezelésére, s észleletünkben a bal-jobb irány, s nem a komponensek fognak megjelenni. A mozgáskomponensek és integrációjuk elkülönülő agykérgi szinteken való feldolgozására kapunk bizonyítékot olyan egysejt-aktivitást mérő vizsgálatokból, amelyek a 7.9. ábrán látható rácsmintázatok kombinációját alkalmazzák. A V1 lokális detektorai a kétkomponensű rács egyedi komponenseire, míg az MT/V5 terület detektorai a komponensek.
7.9.ábra. Mozgáskomponensek és azok vektoreredői eltérő neurális struktúrák válaszaiban. Az A, B, C irányba mozgó rácsmintázatok egyedi mozgáskomponensek, melyekre a példában egy V1- és egy MT sejt válaszát mutatjuk be. Az idegi választ a függőleges vonalkák jelzik (minden vonalka egy-egy akciós potenciálnak felel meg, s ahol nincs válasz, ott csak egy vízszintes vonalka szerepel). A példában adott sejtek egyaránt a diagonálisan lefelé való elmozdulást preferálják válaszukban, s a vízszintes, illetve felfelé való mozgásra nem reagálnak. A D eset olyan komplex rácsot mutat, melynek komponensei diagonálisan fölfelé, illetve lefelé mozognak. Érdekes módon csak a V1-sejt válaszol erre az ingerre! Az MT sejt, ugyan a komponensek között szerepel a preferált iránya, mivel válaszában a komponensek vektoreredőjét tükrözi (balról jobbra vízszintes irány), nem reagál akciós potenciállal. Ugyanezen okból, az E esetben, ahol a komponensek között egyik sejt preferált iránya sem szerepel, de az eredő iránya az MT sejt számára jó, az MT sejt válaszolni fog. Az F esetben pedig ismét csak a V1-sejt fog válaszolni
3. A szemmozgások szerepe A retinális kép állandó dinamikus mozgásban van. Vizuális világunkat folyamatos szem-, fej-, testmozdulatokkal mintavételezzük, s ugyanakkor a tárgyak, élőlények is mozgásban lehetnek. Nyilvánvaló, hogy a mozgásészlelés alapvető feladata a fontos események detektálása s a világban mozgó dolgokkal kapcsolatos információ szolgáltatása. De hogyan lehet ezt a retinakép alapján megtenni, ha maga a retina – s rajta a világ kétdimenziós vetüle- te – is állandóan mozog? Már Helmholtz elgondolkodott ezen, s arra jutott, hogy a retina saját mozgását szemünk elmozdulásának járulékos jelzései kísérik. Később ezt el is nevezték a járulékos kisülések elméletének. Az elmélet szerint a mozgásészlelés a következő háromféle jelen alapul: 1. Motoros jel, mely a szemmozgató izmok felé tart, amikor szemmozgást tervezünk. 2. Járulékos kisülés, mely ennek a motoros jelnek egy „másolata”. 3. Képmozgási jel, mely akkor keletkezik, amikor a retinán elmozduló kép ingerli a receptorokat. Mozgásérzetünk egy összehasonlító egység révén jönne így létre, mely akkor hoz csak létre mozgásérzetet, ha azt a járulékos kisülés, illetve a képmozgási jel függetlenül, nem szinkronizáltan éri el. Ha azonban mindkét jel egyszerre éri el az összehasonlítót, akkor kiegyenlítik egymást, s nem jön létre mozgásérzet. Ezt az elméletet magunk is tesztelhetjük egyszerű kísérletek végrehajtásával.
144 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
1. kísérlet: Rajzoljunk fehér papírra egy nagy fekete pöttyöt, s jól világítsuk meg! Bámuljuk mereven a pöttyöt egy percig, majd gyorsan vonuljunk be egy teljesen sötét helyiségbe! Figyeljük meg a megjelenő retinális utóképet (pislogással könnyen felfrissíthető, ha eltűnik)! Mi történik, ha mozgatjuk a szemünket? Az utókép a szemmozgásokkal együtt mozogni látszik. Miért? Az nyilván nem lehet az ok, hogy a pötty mozog a retinán, hiszen az utókép helye retinálisan kötött. Az inger mozgása nélkül nyilván nincs képmozgási jel. így csak a járulékos kisülés éri el az összehasonlító egységet, s mint mondtuk, ez mozgásérzethez vezet. 2. kísérlet: Nézzünk mereven egy pontra, s közben a szemhéjra helyezve ujjunkat, gyengéden nyomjuk el egy kicsit a szemgolyót, majd engedjük vissza! Ismételjük meg ezt párszor! Ennek eredményeként elkezdünk majd mosolyogni, mert furcsa, csiklandós érzést kelt, ahogy a világ elkezd ugrándozni. Miért látunk mozgást a szemgolyó passzív mozgatása következtében? Azért, mert miközben a pontra próbálunk fixálni, szemizmaink az elmozdítást ellensúlyozandó, megfeszülnek. így járulékos jel keletkezik, de valódi képelmozdulás nem, s ez ebben az esetben is mozgásérzetet eredményez. Milyen eseteket tudunk még felsorolni, ahol csak a járulékos kisülés jelentkezik, s ez mozgásérzethez vezet? Mi történik például, ha a szemizmokat átmenetileg lebénítjuk? Mi történik, ha egy mozgó tárgyat követünk a szemünkkel?
4. A biológiai mozgás észlelése A látáskutatás talán legérdekesebb kérdései közé tartozik az összetett, mozgásban lévő formák optimális reprezentációjának megválasztása. Ilyen összetett forma például egy mozgó élőlény. A vágtázó antilop testének minden porcikája mozgásban van a szemlélőhöz képest, de tulajdonképpen az állat saját főtengelyéhez (tehát a gerinchez) képest is. Az ízületek többirányú mozgást megengednek, s a test körvonalai is folyamatosan változhatnak az izommunka során. Elég azonban néhány rövid pillanatnyi „mintát” vennünk e mozgásból, s villámgyorsan felismerjük, hogy a sok mozgó „alkatrész” egyetlen mozgó állathoz tartozik. Esetleg a fajt is azonosítani tudjuk, bár az állat olyan távol van, hogy a fej részleteit s az állat egyéb jellegzetességeit nem is látjuk. Egy lesben álló gepárd pedig könnyedén fel tudja mérni, hogy a préda utoléréséhez mekkora sebességgel kell meglódulnia. Milyen, az alakészleléssel foglalkozó fejezetben tárgyalt reprezentációfajta szolgálhat alapul a komplex forma mozgásmintázatának biológiailag valószínűleg igencsak releváns felismeréséhez? A legtöbb gyakran emlegetett alakreprezentációs mód alkalmatlannak tűnik. Ilyenek például a kontúr, azaz egy téri kiterjedéssel rendelkező dolog határoló vonala; afelszín, azaz a dolog külső felszínének koordinátái s jellegzetességei (szín, textúra); a részek alapján való hierarchikus reprezentáció, melyben a test különböző elhelyezkedésű s méretű darabjai külön egységként vannak kódolva. Egyik reprezentációtípus sem képes megbirkózni a feladattal, mert túl sok információt hordoznak a térről, s mert önmagukban nem tudják megvalósítani azt az optimalizációt, amire itt szükség van: a téri és idői adatok folyamatos kivonatolását és egyeztetését. Az egyszerű mozgásérzékelő detektoroknak a retinán, illetve az elsődleges látókéregben történő azonosítása után, az 1970-es években felmerült az a kérdés, hogy vajon az élőlények mozgásának érzékeléséhez elegendőeke ezek az egyszerű, igazából csak egy-egy mozgásirányra érzékeny detektorok. Gunnar Johansson pszichológus úgy vélte, hogy a biológiai mozgás érzékeléséhez olyan specializálódott mechanizmusra van szükség, amely többet kell annál tudjon, mint a puszta irányérzékelés. Johansson az ízületeken elhelyezett fénylő pontok mozgását filmezte, s a 10-12 pont mozgásából álló filmet vetítette alanyainak (7.10. ábra). A pontok, amint mozogni kezdtek, mindenki számára felismerhetővé tették a mozgás eredetét, tehát hogy például egy sétáló ember mozgásából származnak. A megfigyelő a néhány pont mozgását követve meg tudja állapítani a cselekvő nemét, életkorát, az aktivitás típusát. Johansson számára ez a biológiai mozgás érzékelésének létét igazolta (Johansson 1973). A pontokról érdemes annyit tudni, hogy Johansson igen ügyesen választotta meg őket, s a test legtöbb információt hordozó helyein (az ízületeken) helyezte el őket. Ezzel nemcsak a fontos információt nyerte ki, de egyben megszabadult a redundáns információt hordozó téri részletektől – lehetővé téve ezáltal a téri-idői felbontóképesség optimalizálását. Később az az elképzelés is felmerült, hogy már az elsődleges látókéreg irányszelektív neuronjai is részt vehetnek ebben a fajta kivonatolásban (Ko- vács-Julesz 1994). Az ilyen neuronok feladata az lenne, hogy már csak egy, a Johans- son-féle pontoknak megfelelő alakleírást küldjenek a biológiai mozgás azonosítására specializálódott, a halántéklebenyi árokban (sulcus temporális superior) elhelyezkedő területnek (lásd a szövegdobozt; Vaina et al. 2001). A http://www.biomotionlab.ca/Demos/ BMLwalker.html internetoldalon nagyszerű kísérleteket lehet végezni a biológiai mozgással kapcsolatban.
145 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
7.10. ábra. A biológiai mozgás észlelésének tanulmányozásához használt inger, a pontemberke. Az inger elkészítéséhez először apró fényforrásokat helyeznek el az ízületeken, majd a sötét ruhában, sötétben mozgó emberről filmfelvétel készül. A film az alsó képhez hasonló kockákból fog állni, melyeket látórendszerünk kitünően tud integrálni, s pusztán a pontok mozgását alapul véve meg tudjuk mondani, hogy ki mozgott (ember vagy valamilyen állat), milyen cselekvést végzett (séta, tánc stb.), s még az emberi cselekvő nemére is képesek vagyunk következtetni. Úgy tünik, hogy ehhez sok tanulásra van azonban szükségünk, mert a gyerekek nem ennyire hatékonyak, s az is jellemző, hogy ha a filmet fejjel lefelé fordítva szemléljük, elveszítjük csodás felismerőképességünket (ez a mechanizmus tanult voltára utal; lásd még . edu/~ikovacs/SandP/kutya_e/example1.html)
4.1. ÖSSZEFOGLALÁS 1. A mozgásészlelés megértésében a legjelentősebb feltevést eddig Werner Reichardt tette, aki az egyszerű mozgásirány-érzékeny detektor idői késleltetésen alapuló modelljét megalkotta. A V1 irányszelektív idegsejtjei azonban önmagukban nem képesek megoldani a mozgásészlelés sokoldalú feladatait, s első lépésben ezen lokális detektorok mérési eredményeinek integrálására van szükség. Az MT terület neuronjai már képesek erre az integrációra, aminek eredményeként a látómezőben nemcsak apró, összevissza bolyongó vonaldarabkák, hanem koherens felszínek, tárgyak látszanak mozogni. 2. A mozgásészlelés bonyolultságára hívja fel a figyelmet az a pár egyszerű kísérlet, melyekkel a szemmozgásoknak az érzékletbe való beszámítását illusztráltuk. 3. Az evolúciósan legrelevánsabb s egyben legösszetettebb mozgásfajta, a biológiai mozgás érzékelése még nem teljesen feltárt, de valószínűleg olyan agyterületek együttműködésén alapul, melyek eredetileg külön elemzik a mozgást és a formát.
4.2. KULCSFOGALMAK ablakprobléma, agykérgi mozgásvakság, biológiai mozgás érzékelése, irányszelektív idegsejtek, járulékos kisülések elmélete, látszólagos mozgás, mozgási utóhatás, populációs kód, Reichardt-detektorok
4.3. ELLENŐRZŐ KÉRDÉSEK 1. Min alapul a Reichardt-detektorok mozgásirányra való érzékenysége? 2. Hogyan magyarázzák a V1 mozgásdetektorai a mozgási utóhatás jelenségét? 3. Mely agyterület sérülése nyomán lép fel mozgásvakság? 4. A látszólagos vagy a valódi mozgás hátterében áll a Reichardt-detektor? 5. Hogyan függhet össze a mozgásvakság és az ablakprobléma?
146 Created by XMLmind XSL-FO Converter.
7. FEJEZET – Mozgásészlelés
6. Miért nem elég egyetlen irányérzékeny sejt a mozgásirány megállapításához? 7. Honnan tudja agyunk, hogy a retinán jelentkező mozgás saját mozgásból vagy egy tárgy mozgásából származik-e? 8. Mely agyterületek vesznek részt a biológiai mozgás kódolásában?
4.4. AJÁNLOTT OLVASMÁNYOK Sekuler, R. – Blake, R. 2000. Észlelés. Osiris, Budapest. Julesz Béla 2000. Dialógusok az észlelésről Typotex Kiadó, Budapest.
4.5. AJÁNLOTT HONLAPOK http://en.wikipedia.org/wiki/Motion_perception http://webvision.med.utah.edu/VisualCortex.html http://www.psych.ualberta.ca/~iwinship/vision/mt_path.html http://defiant.ssc.uwo.ca/Jody_web/fMRI4Dummies/functional_brain_areas.htm
147 Created by XMLmind XSL-FO Converter.
9. fejezet - HALLÁS
Bármennyire is az egyik legfontosabb emberi képességünknek tartjuk a beszédet, a hallást mint észlelési modalitást mindig a látás mögé soroljuk. Ez többek között azzal magyarázható, hogy a látás az észleléskörnyezet interakcióban valóban a legfontosabb, a legfejlettebb érzékelésre támaszkodik, és a leggazdagabb információkkal szolgál. A jelentéssel bíró hangok, zajok, az emberi beszéd, a zene észlelése szintén összetett mechanizmusait a tudománynak a látáshoz képest jóval később sikerült megismernie. A látás „árnyékában” azonban igen hatékonyan működik, biztosítva ezzel a finom eltérések és a nagyobb mintázatok (beszédhangok, dallamok, jelzések) észlelését is. Többnyire mindez annyira a „háttérben” történik, hogy észre sem vesszük. Csukjuk be a szemünket, és hallgatózzunk figyelmesen! Meghalljuk-e az óra ketyegését? Meg tudjuk-e mondani, hogy vonat vagy az utcai közlekedés zaját halljuk-e? Meg tudjuk-e különböztetni azok hangját, akik a közelünkben beszélgetnek? Meg tudjuk-e különböztetni ki- és be- légzésünk hangját? Halljuk-e és meg tudjuk-e különböztetni az együtt megszólaló hangszerek hangját? Megpróbálhatjuk, és nagyon fogunk csodálkozni, mi mindent tudunk csukott szemmel „kihallgatni”. A beszéd és a zene észlelése, hasonlóan a látáshoz, egyszerre dolgozik a részletekből és az egészből. Hallásfejezeteinket Gustav Klimt (1862-1918) bécsi festőművész Zene című festményével vezetjük be. Tudjuk persze, hogy egy ily gyönyörű festménnyel is nehéz megragadni mindazt, amit a ze ség mindennapi zenét szeretne, tehát a századforduló a zenében is újat hoz. Klimt a zene, illetve a zeneszerzők ábrázolására újra és újra visszatér. Ezt tanúsítja többek között a botrányt okozó Beetho- ven-fríz (1912), valamint a jobban fogadott, ragyogó színekben pompázó Zene I. és Zene II. című festmé-nyek A hallási észlelés pszichológiai kutatásában csak jóval később kezdődik az az új korszak, amely a beszéd és a zene észlelésére vonatkozó mai tudásunkat megalapozta. Ezzel foglalkoznak következő fejezeteink.
148 Created by XMLmind XSL-FO Converter.
10. fejezet - 8. FEJEZET – A hallás alapvető folyamatai A hallási érzékelés tanulmányozása során az első kérdés, amire válaszolnunk kell, hogy mi a hallás funkciója. A hallás tulajdonképpen három dologra jó: 1. lehetővé teszi az emberek (és persze az állatok) közötti kommunikációt, 2. jelző, illetve riasztó funkcióval bír, valamint 3. a látáshoz hasonlóan a tárgyak felismerését és lokalizációját is lehetővé teszi. Ebben a fejezetben az alapvető hallási folyamatokkal foglalkozunk: egyrészt a hallási észlelés által feldolgozott ingernek, a hangnak a jellemzőivel, másrészt pedig a hang feldolgozását lehetővé tevő hallórendszer működésével.
1. A HANG 1.1. A hang és környezete A hallás révén a fizikai világnak azon eseményeiről szerezhetünk tapasztalatokat, amelyek valamiféle mechanikai rezgést bocsátanak ki magukból. Ez a rezgés nagyon sokféle lehet. Származhat egy fizikai behatás által keltett vibrációból, mint a zongora húrjainak rezgése, amikor leütünk egy billentyűt, vagy egy szúnyog szárnyának rezgése. Keletkezhet a levegőnek valamilyen rezgő közegen való áthaladásából, mint a sziréna hangja, vagy a hangképző szervek segítségével, mint a hangszalagokon áthaladó levegő által keltett emberi hang esetében. A hang létrejöhet a levegő turbulenciájából is, amelyet az okoz, hogy a levegő egy szűk résen halad át. Erre jó példa a fuvola hangja vagy a fák között fütyülő szél. Maga a rezgés azonban nem elegendő: szükség van egy olyan fizikai közegre, amely képes ezt a rezgést továbbítani és a rezgő tárgytól eljuttatni a rezgést felfogó hallószervhez. Legtöbb esetben ez a hordozó közeg a levegő, de a hang bármilyen olyan közegben képes terjedni, amelyben a közeget alkotó atomok a rezgőmozgás átadására alkalmasak. A közvetítő közeg meghatározza azt, hogy a hang milyen sebességgel terjed benne. Levegő esetén ez a terjedési sebesség 340 m/s, vízben jóval több, 1500 m/s. Mindez azt jelenti, hogy a fényhez képest (amelynek sebessége, mint tudjuk, 300 000 km/s) a hang szinte „csigalassúsággal” terjed, és sokkal több idő kell ahhoz, hogy egy tárgy által kibocsátott hangot észleljünk, mint ahhoz, hogy az általa visszavert (vagy kibocsátott) fényt észrevegyük. Legjobb példa erre a villámlás és mennydörgés esete: elvileg mindkettőt ugyanaz a légköri jelenség okozza, de ha megfelelően messze vagyunk az eseménytől, akkor akár több másodperc is eltelhet a villám fényének megpillantása és a mennydörgés hangjának meghallása között. Mindez azt is jelenti, hogy ha nincs vezető közeg, akkor hang sincsen: emiatt légüres térben, például a világűrben (ellentétben azzal, amit a Csillagokháborúja című, ma már klasszikusnak számító filmben tapasztalhatunk) semmiféle hang nem hallható. A hang terjedését tehát nagymértékben meghatározza a hordozó közeg. A terjedésre azonban nemcsak a közeg, hanem a tágabb környezet is hatással van: a hangok különböző tárgyakba ütközve elnyelődhetnek vagy visszaverődhetnek (ez a visszhang jelensége). Ha semmilyen tárgy nem akadályozza a terjedésüket, a hangforrástól távolodva akkor is csökken az erejük. a hangok terjedése leginkább ahhoz hasonlít, ahogyan a tó vize fodrozódik, ha egy kavicsot dobunk bele (8.1. ábra). A hullámok minden irányban szétterjednek, azonban ha valaminek nekiütköznek, akkor visszaverődnek róla, és ez egyre bonyolultabb hullámmintázatokat hoz létre.
149 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.1. ábra. A hangok terjedése a tó vizének fodrozódásáhozhasonlít A hangok visszaverődéséből származó információt bizonyos állatok (pl. a denevér és a delfin) képesek felhasználni a tájékozódásra, illetve a környezet feltérképezésére. Ezt az információt voltaképpen az ember is tudja alkalmazni, de ezt tanulnunk kell. Vakok esetében például a visszhang felhasználásának képessége nagyon jól működhet. A hangok és a környezet interakciójának ismerete gyakorlati szempontból is fontos lehet, például a modern koncerttermek kialakítása során nagyon komolyan figyelembe veszik ezeket az akusztikai ismereteket (lásd a Koncerttermi akusztika című szövegdobozt).
2. A hangok létrejötte A hangok terjedése a fénytől eltérően nem közvetlenül (a szemünket érő fény valóban a Napból származó fotonokból áll), hanem közvetetten valósul meg, a hanghullámok révén. A hanghullámok a levegő részecskéinek sűrűsödéséből és ritkulásából állnak. Képzeljük el, hogy mi történik akkor, amikor például egy hangvillát megütünk, és az mozgásba jön, ezáltal hangot bocsátva ki (8.2. ábra).
8.2. ábra. A hanghullámok keletkezése. A hangvilla szárainak mozgása a levegő részecskéinek sűrűsödését és ritkulását okozza, és az így létrejövő mozgási energia továbbítása vezet a hanghullám kialakulásához Amikor a villa szára előremozdul, összetömöríti a vele szomszédos levegőmolekulákat. Ezek a normálállapotba való visszajutás érdekében továbbítják ezt az energiát a szomszédos molekuláknak, azok a saját szomszédos molekuláiknak, és így tovább. A hangvilla szárának ellentétes irányba való elmozdulása éppen ellenkezőleg, ritkulást hoz létre a molekulák között, ami azonban ugyanúgy továbbítódik a levegőrészecskék között. Maguk a molekulák azonban nem mozdulnak el, hanem valójában csak a rezgést adják át. A hanghullám tehát lényegében 150 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai ennek a rezgési energiának a továbbítódását jelenti molekuláról molekulára, és a hullámforma a szabályos előreés hátramozdulás révén alakul ki. Természetesen ez a mozgás nagyon gyors lehet, egy zenei A hangot kibocsátó hangvilla például másodpercenként 440 oda-vissza mozgást végez.
10.1. táblázat KONCERTTERMI AKUSZTIKA A koncerttermi akusztika azzal foglalkozik, hogy egy terem mérete, formája és tartalma milyen módon befolyásolja a hallgatók hallási élményét. Ahogy láttuk, a hangok interakcióban állnak a környezettel: a különböző felületeken elnyelődnek, illetve visszaverődnek. A koncerttermi akusztika témája, hogy hogyan lehet a hangok és a környezet interakcióját szándékosan befolyásolni annak érdekében, hogy a hallgatóknak minél tökéletesebb hallási élményben legyen részük. A koncertterem akusztikája jelentős mértékben befolyásolja a hallott zenét vagy beszédet. Azt mondhatjuk, hogy a szabadtérhez képest egy terem „élővé” teszi a zenét. A szabadtérben a hangok közvetlenül a hangszerekből érkeznek, a zárt térben azonban a falakról, a padlóról, a plafonról és a közönségről visszaverődnek. Ennek hatására a hangok nemcsak hogy visszhangosak lesznek, hanem a spektrális tartalmuk is megváltozik. A koncerttermek egyik legfontosabb paramétere az utózengési idő, amely arra vonatkozik, hogy a hang a különböző felületekről való visszaverődést követően mennyi idő alatt hal el. Az utózengési időt elsősorban a terem méretei és az elnyelési tulajdonságai határozzák meg. Emiatt egy opera egészen eltérően szólhat télen, mint nyáron: télen ugyanis az operát hallgató közönség vastagabb ruhái jobban elnyelik a hangot, mint a könnyebb nyári ruhák. A hang különböző terekben való terjedésével már az ókori görögök is foglalkoztak, sőt nagyon is jók voltak ebben. Gondoljunk csak az általuk épített amfiteátrumokra, amelyek ma is tökéletesen működnek. A koncerttermek akusztikájának tudományos igényű tanulmányozása azonban csak a 20. században kezdődött el, egészen addig főként a hagyományokon és szerencsén múlott, hogy sikerült-e egy kiváló akusztikával rendelkező termet létrehozni. Minden bizonnyal a koncerttermi akusztika tudományossá válása tette lehetővé azt, hogy világszerte egyre több és egyre jobb minőségű terem jöhessen létre. A koncerttermi akusztikával kapcsolatban két, Magyarországon található termet szeretnénk illusztrációként bemutatni: egyrészt az egyik legrégebbi, már az akusztikai elvek figyelembevételével épült termet, a Magyar Rádió 1-es, illetve 6-os stúdióját, másrészt az egyik legmodernebb, az éppen aktuális akusztikai tudást felhasználó termet, a Bartók Béla Nemzeti Hangversenytermet.
1. ábra. A 6-os stúdió akusztikai próbája, az előtérben Doh- nányi Ernő és Békésy György A Magyar Rádió 1-es és 6-os stúdiójának (1. ábra) kuriózuma, hogy az akusztikai felépítésüket Békésy György tervezte, az 1930-as években (Békésyről bővebben lásd a szövegdobozt a 256. oldalon). Békésy a zenei stúdió akusztikai kialakításában eredeti megoldásokat alkalmazott. A stúdió falait különböző hangvisszaverési tulajdonságokkal rendelkező anyagokkal borította be: egyrészt textilborítást alkalmazott, amely a hangok elnyelésére szolgált, másrészt pedig az egyik falfelületet márvánnyal burkolta be, amelynek hangvisszaverési hatékonyságát az eléje helyezett, szétnyitható és összehúzható függönnyel változtathatták. De lássuk, hogyan emlékezett vissza Békésy maga a hangstúdiók létrehozásának munkálataira:
151 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
„A Magyar Kir. Postának másik fontos feladata volt a rádióstúdiók méretezése és akusztikai megoldása. Mivel a külföldön eredményesen használt hangszigetelő és hangtompító anyagok javarészt amerikai eredetűek, és ezeknek a behozatalát a gazdasági viszonyok nem engedték volna meg, kénytelenek voltunk egészen új utakon járni. Sok hangversenyteremről azt állítják, hogy rossz az akusztikája. Ha a zeneértőt megkérdezzük, hogy ez mit is jelent, válaszul általában a következőket hallhatjuk: száraz az énekesnő hangja, nem elég lágy a tenoré, annak dacára, hogy tegnapelőtt itt és ott gyönyörű volt, a szólistákat alig lehet hallani, a zenekar összefolyik. Ezekkel a műszakilag nagyon nehezen megfogható jelenségekkel szemben viszont a hangversenyterem építője már a tervezéskor is pontos és részletes adatokat kíván. Az első pillanatban szinte lehetetlennek látszik, hogy oly homályosan meghatározható érzetet, amely annyi különböző érzést foglal magában, és amelynek az eredőjét a terem akusztikájának nevezzük, számokkal lehessen jellemezni. Ennek dacára ez a kérdés ez idő szerint bizonyos fokig megoldódott. A fizika régen bevált módszere szerint ugyanis a zeneteremnek is az energiaviszonyait vizsgáljuk. Ha példának okáért egy kürtöt állandó erősséggel megszólaltatunk, akkor a tüdő erejével hangenergiát állítunk elő. Ez a hangenergia a kürttől minden irányba terjed, eléri a falat, ott bizonyos fokig visszaverődik, tovább halad a szemben lévő falhoz, ahonnan szintén visszaverődik, és így tovább, addig, míg végül az egész terem nagyjában egyenletesen megtelik hangenergiával. A terem valóban hangenergiával van megtelve, és ezt úgy érzékelhetjük, hogy a kürt fúvásának hirtelen megszüntetése után a hang a teremben még mindig tovább zeng. A teremben felhalmozott hangenergia azért nem hangzik végtelen hosszú ideig tovább, sőt aránylag rövid időn belül eltűnik, mert a falon – visszaverődésekor – a hangenergia egy része mindig hővé alakul át, és így a fül számára elvész. A hangrezgést végző levegő részecskéi a fal felületéhez súrlódnak, energiájuk súrlódási hővé alakul át. Minél több likacsot és hajszálnyílást tartalmaz a fal felszínén alkalmazott anyag, annál nagyobb a súrlódás, és természetesen annál gyorsabban csökken a zeneteremben felhalmozott hangenergia. Rendkívül hosszú és körülményes kísérletsorozatot kellett elvégeznünk ahhoz, hogy olyan anyagcsoportosítást találjunk, amely a magas frekvenciákat a kívánt kisebb mértékben nyeli el, mint a mély frekvenciás hangokat. sikerült egészen újfajta hangelnyelő anyagberendezést kidolgoznunk, amely lényegében megfelelő átitatással kellően merevvé tett ponyvával borított vattarétegből áll. Ezt a vatta-ponyva kombinációt, megfelelő keretekre szerelve és tűz ellen is biztosítva, a termek esztétikai kiképzésének megfelelően festhettük úgy, hogy a burkolat alig tért el észrevehetően a normálisan tapétázott faltól. A legapróbb részletekre is kiterjedő munkát minden esetben akkor fejeztük be, ha akusztikai méréseink eredménye és a zenei szakértők érzékelése teljesen azonos volt. Állandóan szem előtt tartottuk a rádióelőfizetők ama jogos kívánságát, hogy a stúdió akusztikailag és rádióátvitel szempontjából csak akkor mondható kifogástalannak, ha a zene és a beszéd átvitelekor a stúdióban és az adóban előálló torzítások nagyságrendileg lényegesen alatta maradnak még a legjobb vevőkészülékben előfordulható torzításoknak is.” (Békésy 1978.) A stúdiók építésekor, a harmincas években az akusztikai tervezés igen fiatal szakterület volt (az első, akusztikai szempontból is megtervezett hangversenytermet 1900-ban Bostonban adták át). Ám Békésy György már akkor olyan stúdiót tervezett, amely a maga nagyságrendjében ma is megállja a helyét. A koncerttermi akusztika szempontjából másik nagyon fontos terem, a Bartók Béla Nemzeti Hangversenyterem (2. ábra) a már „érett” akusztikai tervezés egyik mintapéldánya.
152 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
2. ábra. A Bartók Béla Nemzeti Hangversenyterem A termet az egyik legnevesebb akusztikai tervezőcég, az amerikai ARTEC tervezte, amely a világ számos országában épített már magas minőségi elvárásoknak megfelelő koncerttermeket. A terem maga úgynevezett „shoebox” (vagyis cipődoboz) formájú. Három különböző típusú terem létezik ugyanis: a „shoebox”, a „vineyard” (szőlőskert) és a „fan” (legyező) formájú. Ezek mindegyike eltérő hang-visszaverődési jellemzőkkel rendelkezik, és a shoeboxfor- mára az jellemző, hogy a hang jelentős mértékben visszaverődik a terem oldaláról. A hangversenyterem impozáns méretekkel rendelkezik: 25 méter magas, 25 méter széles és 52 méter hosszú. Teljes befogadóképessége 1700 fő. A terem egyik legfontosabb jellemzője, hogy mind a zenekari pódium, mind az e mögött elhelyezkedő hangvető ernyő dinamikusan változtatható. A pódium mérete háromféle lehet, és szükség szerint zenekari árok kialakítását is lehetővé teszi. A hangvető ernyő, amely a nézőtér fölé is benyúlik, mozgatható szárnyakkal rendelkezik, amelyeknek köszönhetően emelkedni, süllyedni és forogni is tud. szintén az akusztikai hatás változtatását szolgálják a pódium és az oldalfalak mentén elhelyezkedő zengőkamrák, amelyek révén lehetőség van a terem térfogatának és így a visszaverődések tulajdonságának módosítására. A „hangstúdióként” is funkcionáló koncertterem teljesen körbefüggönyözhető, és ezáltal az utózengési idő egy másodperc alá csökkenthető. Ha azonban a zengőkamrák ajtajait kinyitják, akkor az utózengési idő akár négy másodperc is lehet. A terem akusztikai jellemzőinek ezek a nagymértékű változtatási lehetőségei lehetővé teszik azt, hogy nagyon különböző stílusú zenei darabok a lehető legoptimálisabb akusztikai körülmények között szólaljanak meg, és ugyanúgy lehessen élvezni egy mindenféle hangosítás nélkül megszólaló áriát, mint egy hangszórókon keresztül áradó rockzenei koncertet. A hanghullám tehát a légnyomás szabályos megváltozásából jön létre. A légnyomás változását ábrázolhatjuk egy olyan grafikonon, ahol az idő függvényében tüntetjük fel az adott időpillanatban mérhető légnyomás nagyságát. Ezt az ábrázolást oszcillogramnak nevezzük. A hangvillához hasonlóan szabályos rezgést kibocsátó tárgy a 8.3. ábrán látható, periodikus légnyomásváltozást hoz létre, amely matematikailag egy szinuszfüggvénnyel írható le. Ahogy az ábrán is látható, a hanghullám három paraméterrel jellemezhető: a. A sűrűsödések és ritkulások nagyságával, vagyis a hangnyomással, ami lényegében a hanghullámot létrehozó elmozdulás nagyságát ragadja meg. A hangnyomást más néven hangerőnek is nevezzük, és az adott időpillanatban mért hangnyomást az amplitúdóval fejezzük ki. b. A sűrűsödések és ritkulások (azaz periódusok) időegység alatti számával, vagyis a rezgésszámmal. A rezgésszámot az időegység alatti rezgések számával, más néven a frekvenciával fejezzük ki. c. A hanghullám időtartamával. Az időtartamot szokás a fázissal is jellemezni. A fázis azt fejezi ki, hogy egy adott ponthoz képest (például ahol a hullámforma előszörmetszi az x tengelyt) egy teljes periódus mekkora része telt el. A fázis azért fontos mérőszám, mert a hang időtartamánál pontosabban (valójában attól függetlenül) jelzi, hogy a kezdőponthoz képest mennyit változott a hanghullám.
153 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai A hangvillás példánknál maradva azt mondhatjuk, hogy minél erőteljesebben rezegnek a villa szárai, vagyis minél nagyobb a kitérésük a nyugalmi helyzethez képest, annál nagyobb amplitúdójú hangot hoznak létre. Illetve minél gyorsabban rezegnek a villa szárai, annál nagyobb lesz az időegységre jutó rezgések száma, vagyis a frekvencia.
8.3. ábra. Szabályos rezgést kibocsátó tárgy hanghullámának oszcillogramja
2.1. A hanghullámok jellemzői – hangerő és rezgésszám Egy adott hang tehát leírható három érték: az amplitúdó-, a frekvencia- és a fázisértékek megadásával. A fázissal itt részletesen nem foglalkozunk, csak annyit jegyzünk meg, hogy a fázis által jelzett időtartam is nagyon fontos a hangok észlelésekor, mivel csak olyan hangokat észlelhetünk, amelyek bizonyos időtartammal rendelkeznek. Számunkra elsősorban a hangok amplitúdója és frekvenciája lesz fontos, mivel – mint később látni fogjuk – elsősorban ez a két paraméter határozza meg a hangok észlelt jellemzőit. Az észlelt hangok két fő tulajdonsággal jellemezhetők: a hang hangosságával és magasságával. Például egy zongora hangja e két tulajdonság mentén változhat: ha nagyobb erővel ütjük le a billentyűt, akkor hangosabb lesz a hang, ha viszont egy másik billentyűt ütünk le, akkor magasabb vagy mélyebb. A továbbiakban a hangmagasság és hangosság kifejezéseket fogjuk használni a hangok észlelt tulajdonságainak leírásához, szemben a hangok fizikai jellemzőinek leírásakor használt frekvencia és amplitúdó kifejezésekkel. A későbbi fejezetek során látni fogjuk, hogy nagyon fontos különbséget tennünk a fizikai és az észlelt tulajdonságok között, mivel ezek nem mindig feleltethetők meg pontosan egymásnak. Ennek ellenére általánosságban igaz az, hogy a hang amplitúdója szolgál a hangosság észlelésének alapjául, a hang frekvenciája pedig a hangmagassággal áll kapcsolatban. Ezt a viszonyt a 9. fejezetben fogjuk pontosabban bemutatni, itt egyelőre csak a fizikai jellemzők leírására koncentrálunk.
2.1.1. A hangerő Nézzük először, hogy hogyan jellemezhető a hangok hangereje. Ahogy említettük, a hang erősségét elsősorban az amplitúdóval, vagyis a hang létrejötte során keltett légnyomás értékével jellemezzük. Az amplitúdó mértékegysége a pascal (Pa) vagy ennek milliomod része, a mikropascal (mPa). A hangnyomást emellett egy másik mérőszámmal, az intenzitással is jellemezhetjük. Az intenzitás a hang energiáját, és így a hangforrás teljesítményét írja le, és definíció szerint a hangterjedés irányára merőleges egységnyi felületen időegység alatt átáramlott energiamennyiségre vonatkozik. Az intenzitás mértékegysége a watt/négyzetméter (W/m2). A hangerő kifejezésére tehát mind az amplitúdót, mind az intenzitást használhatjuk, de tudnunk kell, hogy ezek a hangerő más-más aspektusát ragadják meg: az amplitúdó az egy időpillanatban mutatott hangnyomás értékét, az intenzitás viszont az időegység alatt adott területen átáramló hangenergia mennyiségét írja le. A továbbiakban a hangerő, amplitúdó és intenzitás szavakat egymás szinonimájaként fogjuk használni, és nem vesszük figyelembe a közöttük lévő definícióbeli eltéréseket. A hangerő mérésére a gyakorlatban bevezettek egy harmadik mértékegységet is, a decibelt (dB). A decibel egy logaritmusos mértékegység, amely valójában két mennyiség közötti arányt fejez ki. A decibel, a logaritmusos skála révén, lehetővé teszi azt, hogy a nagyon kicsitől a nagyon nagy arányokig a mennyiségek széles skáláját tudjuk kifejezni viszonylag kevés mérőszámmal. Erre azért van szükség, mert a hallórendszerünk a hangnyomásértékek nagyon nagy tartományát képes feldolgozni: kb. 10 milliárdszoros mértékben eltérő hangokat is képesek vagyunk megkülönböztetni. Az óriási különbségek miatt a hangerő direkt módon történő leírása (az amplitúdóval vagy az intenzitással) meglehetősen körülményes. A decibelskála alkalmazásával viszont elérhető az, hogy az egyes hangok hangerejét ne milliós nagyságrendekben kelljen meghatározni, hanem a sokkal egyszerűbben kezelhető 0-100 nagyságrendben. 154 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai Ha a hangok hangerejét decibelben határozzuk meg, akkor már nem hangerőértékekről, hanem hangszintekről beszélünk. A decibelérték, ahogy említettük, valójában csak két mennyiség közötti arányt fejez ki, ezért ha ezt konkrétan a hangerő mérésére szeretnénk alkalmazni, akkor egyrészt meg kell határozni az arányt, másrészt pedig meg kell adni azt az értéket, amelyhez az egész skálát viszonyítjuk. A hangnyomás figyelembevételével tehát a decibel a következő képlettel határozható meg: dB = 20 log (p/p0), ahol pl a vizsgált hang amplitúdójának, p0 pedig valamely alaplégnyomás-értéknek felel meg. A leggyakrabban alkalmazott p0-érték 20 mPa. Ekkor a 0 dB egy olyan hangerőszintet fejez ki, amely az emberek nagy része számára egy másodpercenként 1000-szer rezgő hang esetében az éppen hallható hang erejének, vagyis az abszolút hallásküszöbnek felel meg. Ezt a specifikus hangerőszintet SPL-nek (Sound Pressure Level – hangnyomásszint) nevezzük. Minden esetben, amikor nincs külön feltüntetve, hogy a dB-értéket mihez képest határoztuk meg, akkor az SPL szintre kell gondolni. Az emberi hallórendszer által lefedett hangszinttartományt szemlélteti az 8.1. táblázat, amely a 0 és 160 dB közötti tartomány egyes értékeire hoz hétköznapi példákat. A táblázatban feltüntettük az adott a hangnyomás- és az intenzitásértékeket is, annak illusztrálására, hogy hogyan feleltethetők meg ezek egymásnak. A hangszinttartományon belül létezik két kitüntetett érték: az egyik a 0 dB SPL értékű hallásküszöb, amely az éppen észrevehető hangerő nagyságát határozza meg, a másik pedig a 130 dB SPL értékű fájdalomküszöb, ami azt az értéket jelzi, amely felett a hanginger valódi fájdalomérzetet vált ki a fülben. A fájdalomküszöb adaptív értékkel bír, mivel az ennél hangosabb hangok rövid idő alatt is képesek a hallórendszer károsítására, így a fájdalom a hangforrástól való menekülésre kényszerít. A táblázat illusztrálja a decibelskála működését is. Látható, hogy például a zsúfolt forgalom zaja kb. 10 dB-lel hangosabb, mint a kétszemélyes beszélgetés hangereje (70, illetve 60 dB), és látható, hogy ez 10-szeres hangerő-növekedésnek felel meg. Érdemes tehát óvatosan bánnunk a CD-lejátszó hangerőgombjával, mert egy 10 dB-lel való hangosítás 10-szeres, 20 dB-es 100-szoros, 30 dB-es pedig már 1000-szeres hangerő-növekedést okoz.
10.2. táblázat - 8.1. táblázat. Az emberi hallórendszer által lefedett hangszinttartomány Hangforrás
Hangszint
Hangnyomás
Hangintenzitás
(dB)
(mPa)
(W/m2)
Hallásküszöb
0
20
10-12
Normál légzés
10
63
10-11
200
10-10
Szellőben falevelek
susogó 20
Mozi üres nézőtere
30
630
10'9
Lakónegyedbeli környék éjszaka
40
2 000
10'8
Csendes vendéglő
50
6 300
10-7
Beszélgetés
60
20 000
10'6
Zsúfolt forgalom
70
63 000
10-5
Porszívó
80
200 000
10-4
Vízesés robaja
90
630 000
10-3 155
Created by XMLmind XSL-FO Converter.
Észlelet
Hallásküszöb
8. FEJEZET – A hallás alapvető folyamatai
Metró zaja
100
2000000
10-2
Légcsavaros repülőgép felszálláskor
120
20 000 000
1
zaja 130
63 000 000
10
Gépfegyver közelről Sugárhajtású repülőgép felszálláskor
140
200 000 000
102
Szélcsatorna
160
2 000 000 000
104
Fájdalomküszöb
2.1.2. A rezgésszám A hanghullámok másik fontos jellemzője a hangerőn kívül a rezgésszámuk vagy frekvenciájuk. A frekvencia mértékegysége a hertz (Hz), ami a másodpercenkénti rezgésszámot fejezi ki (1 Hz = 1 ciklus/másodperc). A rezgésszám leírható egy másik mértékegységgel, a hullámhosszal is, amely a hanghullám egyik csúcsától a következő hullám csúcsáig tartó távolságot fejezi ki. A hullámhosszt egy valódi hosszmértékegységgel, a méterrel mérjük. A két mértékegység, vagyis a frekvencia és a hullámhossz fordítottan arányosak egymással: nagyobb frekvenciaértékhez kisebb hullámhosszérték tartozik. Ezt az összefüggést szemlélteti a 8.4. ábra. Ahogy az ábrán látható, egy 1000 hertzes hanghoz kb. 20 centiméteres hullámhossz tartozik (vagyis ennyi a két egymást követő hanghullám csúcsa közötti távolság), egy 100 hertzes hanghoz pedig kb. 3 méteres hullámhossz. A rezgésszám esetében, csakúgy, mint a hangerőnél, szintén fontos kérdés, hogy mekkora tartományt vagyunk képesek érzékelni az egyes tárgyak által kibocsátott rezgésszámokból. Ahogyan azt a 8.5. ábra mutatja, az egyes állatfajok, beleértve az embert is, a lehetséges frekvenciatartományok meghatározott részét képesek csak észlelni. Ember esetében ez a tartomány 20 és 20 000 Hz között van, és látható, hogy egyéb fajok ettől eltérő frekvenciasávokra is érzékenyek. Például az elefántok meghallják a 20 Hz alatti infra- hangokat is, a kutyák vagy macskák pedig a 20 000 Hz feletti ultrahangokat is képesek felfogni (az infra- és ultrahangok természetesen párhuzamba állíthatók az elektromágneses sugárzás esetén az infravörös és ultraibolya fényekkel, amelyek szintén kívül esnek az ember látási észlelőrendszere által feldolgozható tartományon).
156 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.4. ábra. A hullámhossz és a frekvencia közötti kapcsolat Feltételezhető, hogy az egyes fajok azokra a frekvenciatartományokra érzékenyek leginkább, amelyek számukra valamilyen okból jelentőséggel bírnak, illetve amelyek környezetükben a leggyakrabban előfordulnak. Nyilvánvalóan itt is kompromisszumot kell kötni aközött, hogy a környezeti jellemzőket minél pontosabban dolgozzuk fel, és aközött, hogy erre ne kelljen egy végtelenül bonyolult apparátust kifejleszteni. A frekvencia esetében az alsó határ természetesen egy abszolút határ, mivel 1 Hz-nél kisebb rezgésszám fizikailag lehetetlen, hiszen az már nem számítana rezgőmozgásnak. A 20 000 Hz-nél magasabb frekvenciájú hangok feldolgozásával kapcsolatban két probléma lehet: egyrészt feltételezhetően nagyon kevés olyan hang van, ami ebbe a tartományba esik, másrészt pedig a fent már említett kompromisszum miatt valószínűleg nagyon bonyolult lenne egy olyan hallószervet létrehozni, amely képes ilyen tág tartományt feldolgozni.
157 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.5. ábra. A különféle fajok számára 60 dB spL hangosságon hallható frekvenciák tartománya
2.2. A hangok típusai Az előzőekben arról volt szó, hogy a hangokat a mechanikai rezgést végző tárgyak bocsátják ki. Láttuk azt is, hogy például a hangvilla olyan rezgésre képes, amely periodikus, szinuszfüggvénnyel leírható hanghullámot hoz létre. Az ilyen típusú hangokat tiszta vagy egyszerű hangoknak nevezzük, mivel csak egyetlen hangfrekvenciát tartalmaznak, vagyis egyetlen nagyon szabályos függvénnyel írhatók le. A 8.6. ábra felső részén egy tipikus tiszta hang oszcillogramja látható. Valójában azonban a hangvilla által létrehozott hang sem ennyire egyszerű, és csak közelíti ezt a nagyon szabályos hullámformát. A környezetünkben megtalálható hangok között igazából nem is találunk olyant, amely eny- nyire szabályos rezgőmozgást végezne. Ugyanakkor laboratóriumban, számítógép segítségével lehetséges ilyen hangokat előállítani, és ezek nagyon fontos szerepet játszanak a hallás folyamatainak vizsgálatában, mivel a lehető legegyszerűbb ingerfeltételek alakíthatók ki a segítségükkel. Mi jellemző akkor a környezetünkben előforduló hangokra? Ezeket a hangokat, például a madarak énekét, a hangszerek hangját, az ember beszédét megvizsgálva azt tapasztaljuk, hogy a legtöbb közülük nagyon bonyolult hullámmintázatot alkot, vagyis nagyon bonyolult rezgőmozgást végez. Az ilyen típusú hangokat komplex hangoknak nevezzük, és az jellemző rájuk, hogy általában egynél több frekvencia-összetevőből állnak, és nem írhatók le egyetlen szinuszfüggvénnyel (lásd a 8.6. ábra középső részét).
158 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.6. ábra. A hangok különböző típusainak oszcillogramja Összehasonlítva a tiszta hanggal, látható, hogy a komplex hang sokkal bonyolultabb mintázattal rendelkezik. Láttuk már, hogy az oszcillogram, vagyis az idő függvényében ábrázolt hangnyomásváltozás nem igazán szolgáltat egyértelmű információt az adott hang frekvenciájáról. Ezért ha arra vagyunk kíváncsiak, hogy egy hang milyen frekvenciával, illetve frekvencia-összetevőkkel rendelkezik, egy másikfajta ábrázolásra van szükségünk, az úgynevezett spektrális vagy amplitúdómetszet– ábrázolásra (lásd 8.7. ábra).
159 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.7. ábra. A tiszta- (a) és a komplex hangok (b) spektrális ábrázolása A hangok ábrázolásának ez a módja a frekvencia függvényében tünteti fel a hangok amplitúdóját egy adott időpillanatban. Nem szerepel rajta viszont az idői információ, vagyis hogy pontosan mely időpillanatban mutatta a hang az adott jellemzőket. Komplex hangok esetében a spektrum feltárja mindazokat a frekvenciaösszetevőket, amelyek a hangot alkotják. A frekvencia-összetevőket néha frekvenciakomponenseknek is nevezzük, és ezek összessége alkotja a hang spektrális szerkezetét. A komplex hangokat tehát úgy kell elképzelnünk, hogy azok egymásra épülő szinuszhullámokból tevődnek össze úgy, hogy ezek lényegében összeadódnak. A komplex hangoknak egyes frekvenciaösszetevőikre történő 160 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai lebontását Fourier-elemzésnek hívjuk. Emlékezzünk arra, hogy Jean Fourier ezen matematikai módszerét már a vizuális szűrőkkel kapcsolatban említettük. Megállapítottuk, hogy ennek segítségével bármely komplex hullámforma leírható meghatározott frekvenciával, amplitúdóval és fázissal rendelkező szinuszhullámok sorozatával. Ez alapján tehát azt mondhatjuk, hogy a komplex hangok lényegében több egyszerű szinuszhangból tevődnek össze, és a spektrum ezen komponenseknek a frekvenciáját és amplitúdóját jeleníti meg. A 8.8. ábra mutatja, hogy egy komplex hanghullám hogyan építhető fel olyan szinuszhullámok sorozatából, amelyek egyre kisebb periódussal rendelkeznek (vagyis egyre nagyobb a frekvenciájuk). Az ábrán az is látható, hogy az egyes összetevők milyen frekvenciával rendelkeznek. A periodikus hangokban a frekvenciakomponensek az úgynevezett alaphang egész számú többszöröseiként jelennek meg. Azaz, ha például az alaphang 200 Hz, akkor a frekvencia-összetevők értéke 400, 600, 800 stb. Hz lesz. Az alaphang rendelkezik a legalacsonyabb frekvenciával, vagyis valóban ez az alapja a többi komponensnek. Az erre épülő komponenseket pedig felharmonikusoknak vagy egyszerűen harmonikusoknak nevezzük. A komplex hangok által tartalmazott frekvenciákat tehát általánosságban frekvencia-összetevőknek, frekvenciakomponenseknek vagy frekvenciatartományoknak fogjuk nevezni. A periodikus komplex hangok esetében viszont ezeket a komponenseket harmonikusoknak vagy felharmonikusoknak fogjuk hívni, utalva egymás közti szabályosságukra, vagyis arra, hogy a harmonikusok az alaphang egész számú többszörösei.
8.8. ábra. A komplex hangok frekvencia-összetevőkre bontása a Fourier-elemzés segítségével A komplex hangok különböző frekvenciakomponensekre való felbontása azonban nem csak amiatt fontos, hogy ábrázolni tudjuk azokat egy spektrumon. Úgy tűnik, hogy a hallórendszer maga úgy működik, hogy a beérkező hangok egyfajta Fouri- er-elemzését végzi el, vagyis a hangokat összetevőikre bontja fel. Ezt a fajta működésmódot analitikus (szétválasztó) észlelésnek nevezzük, szemben a látórendszerre inkább jellemző szintetikus (összegző) működéssel. A látás esetében a szintetikus működésre példa lehet a színészlelés, amelynek során az egyszerre a szembe érkező hullámhosszak (kék és sárga színek) egy szét nem bontható zöld színélményt eredményeznek. Azt is láthattuk, hogy a kétdimenziós téri luminanciaeloszlások elemzéséhez a látórendszernek a retinális, valamint az első agykérgi szintjein egy globális Fourier-elemzés folyik. A hallásnál azonban nem fordulhat elő a színészleléshez hasonló szintézis. A zongorán egyszerre leütött C és D hangok nem vezetnek egy harmadik hang észleléséhez, hanem mindkét hangot külön-külön halljuk. A komplex hangok speciális típusa a zaj, amely sok véletlenszerűen összeadódó frekvencia-összetevőt tartalmaz (lásd a 8.6. ábra alsó részét). A zaj bizonyos értelemben a fehér fényre hasonlít, hiszen – ahogyan azt korábban láttuk – a fehér fény is a látható spektrum valamennyi hullámhosszán tartalmaz fényenergiát. A fehér fény analógiájára fehér zajnak nevezzük azt a zajt, ami az összes lehetséges frekvenciát tartalmazza, és amit például akkor hallhatunk, ha a rádión egy olyan frekvenciára tekerünk, ahol nincs semmilyen műsor. A tiszta hangokhoz hasonlóan fehér zaj sem fordul elő a természetes környezetünkben (a zajszerű természetes hangok – például a fúró hangja vagy a levelek susogá- sa – is mutatnak valamiféle periodikusságot és szabályszerűséget), de a hallási jelenségek tanulmányozásában nagyon fontos a szerepe. Összefoglalva tehát, három különböző típusú hang létezhet: az egyszerű vagy tiszta hang, amely egyetlen frekvenciakomponenst tartalmaz, és periodikusan ismétlődik; a komplex hang, amely több frekvenciakomponenst tartalmaz, és szintén periodikusan ismétlődik; és a zaj, amely több frekvenciakomponenst tartalmaz, de nem ismétlődik periodikusan. A hangok típusait a 8.2. táblázat foglalja össze.
10.3. táblázat - 8.2. táblázat. A hangok típusai és jellemzőik
161 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
Hang típusa
Frekvenciakomponensek
Periodikusság
Példa
Tiszta hang
e
gy
igen
hangvilla
Komplex hang
több
igen
zongora
Zaj
több
nem
fehér zaj
3. A fül és a hallórendszer A hallórendszer a többi érzékleti modalitáshoz hasonlóan három alapvető részből tevődik össze: a külvilágból származó fizikai ingereket feldolgozó receptorokból, melyek a fülben találhatók, a receptorok és az agy közötti összeköttetést megvalósító hallópályából és az agynak azon kéreg alatti és kérgi területeiből, amelyek a hallási információ feldolgozására specializálódtak.
3.1. A fül felépítése Az emberi fül három különálló anatómiai részre osztható: a külső, a közép- és a belső fülre. A fül felépítését és a hang útját a külvilágból a hallási receptorokig az emlékeztető szövegdoboz tartalmazza. A továbbiakban a fül egyes részeinek feladatait, funkcióit tekintjük át, amelyeket a 8.9. ábra foglal össze.
8.9. ábra. A fül egyes részeinek funkciói A külsőfül lényegében egy irányított mikrofon: a hang hallójáratba való irányításában és felerősítésében játszik szerepet. Az erősítés elsősorban a 3000 Hz körüli hangokat érinti, mivel a hallójárat ezen a frekvencián maga is rezgésbe jön, és ez néhány decibellel hangosabbá teszi a hangokat. A középfül feladata az ellenállás-csökkentés és a túlterhelés elleni védelem. Az ellenállás-csökkentést a középfül hallócsontocskái valósítják meg azáltal, hogy a hanghullámokat mechanikai rezgéssé alakítják, és ez a mechanikai rezgés hozza mozgásba a csigában található folyadékot. A hallócsontocskák nélkül azonban a levegő rezgése közvetlenül a folyadékra tevődne át, ez pedig jelentős energiaveszteséget okozna a két közeg sűrűségbeli különbsége miatt. Kiszámítható, hogy a levegő által közvetített hang mintegy 99 százaléka visszaverődik a vízfelszínnel való találkozáskor, és ez körülbelül 30 dB-nyi hangnyomáscsökkentést eredményez. Ez a veszteség azonban visszanyerhető akkor, ha a hanghullámot előbb visz- szaalakítjuk mechanikai rezgéssé (a dobhártya és a hallócsontocskák segítségével), és ezt a mechanikai rezgést vezetjük át a folyadékra. Az áttétel hatékonyságát tovább javítja az, hogy a dobhártya és az ovális ablak között jelentős méretbeli különbség van, vagyis egy nagyobb felületű mozgást vezetünk át egy kisebb felületre, ami szintén erősítő hatású. A középfül másik feladata a túlterheléssel szembeni védelem, ami az akusztikus reflex révén valósul meg. Az akusztikus reflex egy nagy intenzitású hang hatására bekövetkező automatikus izom-összehúzódás a középfülben, amely korlátozza a hallócsontocskák mozgását, és ezáltal csökkenti az átvitt hangerőt, megvédve a belső fület a túl intenzív ingerléstől. Az akusztikus reflexet elsősorban alacsony frekvenciájú hangok váltják ki, 162 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai ezért a feltételezések szerint egyik fő funkciója a saját magunk által létrehozott hangokra (pl. beszédhangokra) való érzékenység csökkentése (a beszéd észleléséről szóló fejezetben látni fogjuk, hogy a beszédhangok valóban főként alacsony frekvencia-összetevőkből állnak, és tényleg elég hangosak lehetnek). Ezen elképzelés szerint tehát az akusztikus reflex arra (is) szolgál, hogy ne süketüljünk meg a saját magunk által produkált beszédtől. A belsőfül elsődleges feladata a hangok frekvenciaelemzése. A továbbiakban részletesebben is megvizsgáljuk, hogy hogyan alakítják át a belső fülben lévő receptorok a hangokat idegi impulzusokká, és hogyan kódolják ezek a receptorok a hangok frekvenciáját és intenzitását.
10.4. táblázat A FÜL ANATÓMIÁJA ES ÉLETTANA – A HANG ÚTJA A FÜLKAGYLÓTÓL AZ ALAPHÁRTYA SZŐRSEJTJEIIG Az emberi fül három, működésében és elhelyezkedésében elkülönülő részből áll: a külső fülből, a középfülből és a belső fülből. Az alábbiakban áttekintjük a fül ezen részeinek felépítését és működését. Az olvasó az ábrákon követheti végig a leírásokat. A környezetből érkező hang a fülkagylón keresztül jut el a hallójáratba, majd annak közvetítésével a dobhártyához. Ez a három szerv alkotja a külső fület. A fülkagyló egy kagyló alakú szerv, amely különleges, minden emberre egyedileg jellemző tekervényeket tartalmaz. Elsődleges feladata a hangok összegyűjtése és a hallójáratba vezetése. Az emberi fülkagyló a többi állatétól eltérően nem mozgatható, ezért nekünk a hangok megfelelő összegyűjtéséhez az egész fejünket kell mozgatnunk. Ez történik olyankor, amikor valakihez odafordulunk, hogy jobban halljuk, amit mond. A fülkagylón keresztül tehát a hang a hallójáratba jut, ami egy kissé hajlított, kb. 2,5 centiméter hosszú és 7 milliméter átmérőjű cső. Ezen keresztül jut el a hang a dobhártyáig. A dobhártya egy kicsi, hártyás szerv, amely a hanghullámok hatására rezgésbe jön. A dobhártya elmozdulása rendkívül kicsi, egyes becslések szerint egy 2dB SPL hangerejű hang körülbelül 10-8 centiméterrel mozdítja el a dobhártyát, ami nagyjából egyetlen hidrogénmolekula átmérőjének felel meg! A dobhártya tehát az első állomása a külvilágból érkező hang átalakításának. A dobhártya rezgését a középfül hallócsontocskái továbbítják a belső fül felé. Három hallócsontocs- ka található az emberi fülben: a kalapács (malleus), az üllő (incus) és a kengyel (stapes). Ezek a parányi méretű csontok a formájukról kapták a nevüket. Működésüket tekintve mindhárom csontocska különböző izmok és kötőszövetek révén kapcsolódik egymáshoz, illetve egyik oldalról a dobhártyához, másik oldalról pedig a belső fül csiga nevű szervének ovális ablakához. A dobhártya rezgésének hatására a hallócsontocskák is elmozdulnak, és lényegében továbbítják ezt a mozgást a belső fül felé. A dobhártya rezgése azonban a hallócsontocskák révén erőkarok és emelők mozgásává alakul át, és ezáltal a rezgés felerősítődik. A szívizomhoz hasonlóan a hallócsontocskák is egész életünkben folyamatosan mozgásban vannak, hiszen minden egyes hang hatására kiváltódik az elmozdulásuk. Valójában a hallás egész mechanizmusa a dobhártya és a hallócsontocskák megfelelő mértékű mozgásán alapul. A hang által kiváltott rezgés végül a belső fülbe, pontosabban az ott található, borsószem nagyságú, csiga (cochlea) nevű szervbe jut. A csiga felcsavart, folyadékkal kitöltött üregeket tartalmaz, amelyek a hallási ingereket feldolgozó receptorokat rejtik magukban. A csiga három kamrára oszlik – vesztibu- láris csatorna, csigavezeték és dobcsatorna -, amelyeket vékony hártyák választanak el egymástól. A három csatorna egymással párhuzamosan fut a csiga teljes hosszában, a vesztibuláris csatorna és a dobcsatorna azonban egy kis átjárón közlekedik egymással, vagyis ezek gyakorlatilag folytonosak. A középső kamra – a csigavezeték – a másik két csatornát kitöltő folyadéktól kémiai összetételében eltér. A kamrákat kitöltő folyadékok két dolog miatt is fontosak: egyrészt a hallási inger idegi impulzussá alakításában van fontos szerepük, másrészt pedig a csiga sejtjeinek táplálásában vesznek részt. A csigában ugyanis nincsenek vérerek, amelyek a sejtek működéséhez szükséges tápanyagot szállíthatnák, mivel lüktetésük túlságosan nagy zajjal járna, és megnehezítené a hallási ingerek transzdukcióját. A hallócsontocskák rezgése a kengyel közvetítésével az ovális ablakon keresztül jut el a csigába. A csigában ez a rezgőmozgás az ott található folyadékok elmozdulását okozza. Pontosabban, mivel a ken gyel az ovális ablakon keresztül a vesztibuláris csatornával érintkezik, ezért csak az ebben lévő folyadék mozdul el. Ugyanakkor azt mondtuk, hogy a vesztibuláris csatorna közlekedik a dobcsatornával, ami ahhoz vezet, hogy a vesztibuláris csatorna folyadékának elmozdulása a dobcsatorna folyadékát is elmozdítja. A dobcsatorna 163 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai középfülhöz közeli részén szintén találunk egy nyílást, ez az úgynevezett kerek ablak. A kerek ablak lehetővé teszi, hogy a folyadék mozgásának energiája távozzon, vissza a középfülbe.
A fül anatómiája és élettana Lényegében tehát az történik, hogy a levegőrezgések először a külső fülbe jutnak be, majd a középfül hallócsontocskái mechanikus lökésekké alakítják át őket. A mechanikus mozgások a kengyelhez kapcsolódó ovális ablakra hatnak, ami a csiga vesztibuláris és dobcsatornájában található folyadéknak adja tovább azokat. Mivel a két csatorna kapcsolatban áll egymással, ez a nyomáshullám végighalad mindkettőn, és végül a kerek ablakon ki is lép onnan. A hangingerek idegi impulzusokká történő átalakulását azonban még ezzel nem magyaráztuk meg. Ehhez tovább kell kutakodnunk a csiga további részeiben. Említettük, hogy a csiga három csatornáját hártyák választják el egymástól. Az egyik az alaphártya, amely a dobcsatorna és a csigavezeték között található, a másik pedig a Reissner-hártya, amely a csigavezeték és a vesztibuláris csatorna között helyezkedik el. A hallási észlelés szempontjából az alaphártya lesz kulcsfontosságú, mivel ez az a szerv, amely a hallási ingereket feldolgozó receptorokat tartalmazza. Az alaphártya tetején helyezkedik el az úgynevezett Corti-szerv. A Corti-szerv fő alkotóelemei a következők: az alaphártyán található támasztósejtréteg, a támasztósejtekből kiálló szőrsejtek sorai és egy tetőszerű, a szőrsejtekre hajló hártya, a fedőhártya. A Corti-szervben található szőrsejtek azok a receptorok, amelyek végül is a hangot idegi impulzussá alakítják. Ez úgy történik, hogy a csiga csatornáiban végighaladó nyomáshullám az alaphártyát is mozgásra készteti. Az alaphártya mozgásának hatására a szőrsejteken található csillók is elmozdulnak, és ennek hatására olyan elektrokémiai változások történnek a sejtekben, amelyek kiváltják azok kisülését, vagyis egy idegi impulzus elküldését a velük összekapcsolódó hallóidegrostokon keresztül az agyba. Összefoglalásul tehát: a hang a középfültől kezdődően átalakulások során megy keresztül, amelyek elsődleges célja a hangrezgés felerősítése. Ez a mechanikai rezgés a belső fül csigájába jut, ahol folyadékok és hártyák elmozdulását okozza, és végül speciális sejtek csillóinak elhajlítása révén idegi impulzussá alakul át.
3.2. A hangingerek kódolása Ahogy az emlékeztető szövegdobozban láthatjuk, a belső fül legfontosabb része a csiga vagy cochlea, illetve az ebben található alaphártya, amelyen végigfut a Corti-szerv. Azt is láttuk, hogy a Corti-szerv szerkezetét tekintve támasztósejtekből, szőrsejtekből és az ezek fölé hajló fedőhártyából áll. A szőrsejtek azok a tulajdonképpeni receptorok, amelyek a hangingereket idegi impulzussá alakítják át. Ez a folyamat a következőképpen zajlik le: a fülbe érkező hang hatására a dobhártya, valamint a hallócsontocskák közvetítésével mozgásba jön a csiga folyadéka, és ennek révén az alaphártya. Az alaphártya mozgása a szőrsejtek tetején lévő csillószőrök elhajlását eredményezi, ez pedig elektromos változásokat okoz a szőrsejtekben. Ezek az elektromos impulzusok továbbítódnak a szőrsejtekhez kapcsolódó hallóidegekbe, és ezeken keresztül az agy megfelelő területeire. 164 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai Vagyis a rezgő tárgyak által keltett hanghullámok végül a hallószervben visszaalakulnak mozgási energiává, és ez a mozgás közvetlenül vezet az idegi impulzusok létrejöttéhez és végül a hang észleléséhez. A fizikai ingerek átalakítását ilyen módon idegi impulzusokká mechano-elektromos transzdukciónak nevezzük. A Corti-szervben található, fülenként mintegy 15 000 szőrsejt két csoportra osztható: a belső és a külső szőrsejtekre. A belső szőrsejtekből kb. 3500 van, és egy sorban követik egymást az alaphártya belső részén, pontosabban a Corti-szervnek azon a részén, amely közelebb van a fedőhártyához (8.10. ábra). A külső szőrsejtekből jóval több, mintegy 12 000 van, és több sorban helyezkednek el a Corti-szerv külső részén. Ezek a sejtek érintkeznek az egész Corti-szervet beborító fedőhártyával, ami nagyon fontos lesz működésük megértésében.
8.10. ábra. A Corti-szerv felépítése és működése. a) Az ábrán jól látszanak a Corti-szer- vet felépítő külső és belső szőrsejtek és a támasztósejtek, valamint a belső szőrsejteket beidegző afferens és a külső szőrsejteket beidegző efferens idegrostok. b) Az alaphártya elmozdulásának hatására elsősorban a külső szőrsejtek, valamint a fedőhártya mozdul el. Mivel azonban a belső szőrsejtek csillói hozzáérnek a fedőhártyához, ezek is elmozdulnak, aminek hatására a belső szőrsejt tüzelni kezd A belső és külső szőrsejtek azonban nemcsak számukban és elhelyezkedésükben különböznek, hanem természetesen működésükben is. A legfőbb különbség a beidegzésükben van: a hallóidegrostok mintegy 95 százaléka a belső szőrsejtekhez kapcsolódik, és csak a maradék 5 százalék csatlakozik a külső szőrsejtekhez. Ez arra utal, hogy a hangingerek idegimpulzussá történő átalakítását elsősorban a belső szőrsejtek végzik, hiszen főként ezek működéséről szállítódik tovább az idegi információ. Joggal merül fel a kérdés, hogy akkor mi a külső szőrsejtek feladata, annál is inkább, mert ahogy láttuk, ezekből van több. A külső szőrsejtek feltételezhetően nem közvetlenül a transzdukcióban vesznek részt, hanem egyfajta „cochleáris erősítő” szerepük van. Egy olyan mechanizmus részesei, amely felerősíti az alaphártya mozgását, és ezzel hozzájárulnak a kisebb hangenergiájú hangok feldolgozásához. Ez a folyamat úgy valósul meg, hogy amikor egy hang hatására az alaphártya elmozdul, akkor a belsőhöz hasonlóan a külső szőrsejtek csillói is elmozdulnak, és ez szintén elektromos változást vált ki a sejtekben. Ahogy láttuk, a belső szőrsejtek esetében ez az a változás, ami az idegi impulzus létrejöttéhez vezet. A külső szőrsejtekben ugyanakkor a változás egy mozgásos reakciót vált ki, ami a csillószőrök aktív mozgatásához vezet. Mivel a külső szőrsejtek kapcsolódnak a fedőhártyához, ezért a csillószőrök aktív mozgása a fedőhártyát is mozgásba hozza, ez pedig kihat a cochleáris folyadék és végeredményben az alaphártya mozgására. Fontos ugyanakkor, hogy mindez nem hoz létre valamilyen az eredetivel ellentétes mozgást, hanem a létezőket erősíti fel. Láthattuk tehát, hogy hogyan történik a fülben a fizikai hangenergia átalakítása idegi impulzussá. Mindebből azonban még nem derült ki, hogy valójában hogyan képes a hallórendszer a hangok frekvenciájának és
165 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai amplitúdójának kódolására. Az alábbiakban erre keressük a választ, áttekintve az alaphártya működésének régebbi és mai elméleteit.
3.3. Az alaphártya működésének elméletei A hallással foglalkozó kutatók régóta sejtették, hogy a frekvenciainformáció, vagyis a hangmagasság kódolásáért valamilyen módon az alaphártya a felelős. Több elmélet is született arra vonatkozóan, hogy ez hogyan történhet. A kérdés fontosságát mutatja, hogy a ma is elfogadott megoldásért 1961-ben a magyar származású tudós, Békésy György orvosi Nobel-díjat kapott.
3.3.1. Frekvenciaelmélet Az egyik elmélet szerint az alaphártya a telefonkagyló membránjához hasonlóan kódolja a hangok magasságát. A telefonkagyló membránja úgy működik, hogy a beszélő által kibocsátott hanghullámok hatására az érzékeny membrán rezgésbe jön, és pontosan azon a frekvencián rezeg, mint az a hang, ami rezgésbe hozta. A membrán rezgése egyszerűen lefordítható elektromos impulzusokká, és ezeket az impulzusokat a vonal másik végén lévő hallgató készüléke ismét vissza tudja alakítani beszédhangokká. A frekvenciaelmélet szerint, amely Ernest Rutherford nevéhez fűződik, és eredete a 19. századra datálódik, az alaphártya a membránhoz hasonlóan viselkedik, vagyis egy adott frekvenciájú hang hatására ugyanolyan frekvencián rezeg. Egy 1000 Hz-es hang hatására tehát az alaphártya másodpercenként 1000-szer rezegne, és ez egy ugyanilyen rezgésszámú elektromos impulzussorozatot váltana ki a hallóidegben. Az alaphártya pontos anatómiai és élettani jellegzetességeinek feltárása azóta több ponton is cáfolta a frekvenciaelméletet. Egyrészt az alaphártya nem úgy viselkedik, mint egy membrán, mivel szélessége és vastagsága nem azonos a különböző részein, és emiatt nem tud teljes hosszában ugyanazon a frekvencián rezegni. Másrészt az impulzusokat közvetítő idegsejtek nem képesek másodpercenként 1000-nél többször kisülni, noha tudjuk azt, hogy az emberi fül képes akár a 20 000 Hz-es hangokat is feldolgozni. Úgy tűnik tehát, hogy a frekvenciaelmélet annak ellenére, hogy egy viszonylag egyszerű és intuitív magyarázatot kínál, nem igazán állja meg a helyét. A frekvenciaelmélet vonzóságát az is mutatja, hogy történt próbálkozás az elmélet egyfajta megmentésére. Wever és Bray (1937) sortűzelmélete értelmében az 1000 Hz-es felső tüzelési határ kikerülhető úgy, ha az egyes idegsejtek egymás után, sortűzszerűen sülnek ki. Vagyis egy idegsejt mindaddig tüzel, amíg el nem éri a maximális kisülési frekvenciáját, majd ezután bekapcsolódik egy második neuron is, és így tovább. Eszerint tehát egy 2000 Hz-es hang kódolása úgy történhet, hogy két, egymás után 1000 Hz-es frekvenciával tüzelő idegsejt aktivitását egy magasabb szintű idegsejt összegzi. A probléma már csak az, hogy ez a magasabb szintű idegsejt elvileg szintén nem tudja túllépni az 1000 Hz-es határt.
3.3.2. Helyelmélet Egy másik elmélet a frekvencia kódolásával kapcsolatban a helyelmélet, amely szintén a 19. században született, és elsőként Hermann Helmholtz írta le (Helmholtz 1954). A helyelmélet szerint az alaphártya a rezonanciaelvnek megfelelően működne. A rezonanciaelv értelmében minden tárgy rendelkezik egy saját rezgési frekvenciával, ez adja az adott tárgy jellegzetes hangját. Ha most a saját rezgésnek megfelelő frekvenciájú hang megszólal a tárgy környezetében, akkor ennek a hangnak a hatására a tárgy képes maga is rezgésbe jönni. Például ha egy zongora mellett állva megszólaltatunk valamilyen hangot (mondjuk megfelelő hangerővel kiénekeljük a magas C-t), akkor a zongora megfelelő húrja is rezgésbe jön, mindenféle egyéb behatás nélkül. a zongora különösen jól illusztrálja azt a folyamatot, ami a helyelmélet szerint az alaphártya esetében is lezajlik. A zongora ugyanis sokféle húrral rendelkezik, ami azt jelenti, hogy sokféle külső hang képes rezgésbe hozni az egyes húrokat. A helyelmélet szerint az alaphártya felépítése a zongorához hasonlóan képzelhető el: tudjuk róla, hogy az ovális ablak közelében, az alapjánál keskenyebb, a másik végén, a csúcsánál viszont szélesebb, csakúgy, mint a zongora különböző hosszúságú húrjai. Helmholtz szerint ráadásul az alaphártya zongorahúrszerű keresztirányú rostokat is tartalmaz. Az elmélet szerint ez a strukturális hasonlóság működésbeli hasonlósággal jár együtt, azaz az alaphártya rostjai is a rezonanciaelvnek megfelelően, egy adott magasságú hang hatására rezgésbe jönnek. Nem az egész alaphártya rezeg tehát, mint ahogyan azt a frekvenciaelmélet feltételezte, hanem csak az alaphártya specifikus helyei. A zongoraanalógiát követve ráadásul azt is ki tudjuk következtetni, hogy az alaphártya pontosan hol jön rezgésbe egy adott magasságú hangot követően: a zongoránál a hosszabb húrok mélyebben, a rövidebbek pedig magasabban szólnak. Az alaphártya esetében a hosszabb rostok a csúcsnál, a rövidebbek pedig az alapnál találhatók, vagyis feltételezhetően a mély hangokat a csúcsnál, a magasakat pedig az alapnál kódoljuk.
166 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai Sajnos a frekvenciaelmélethez hasonlóan a helyelméletet is megcáfolták a később feltárt anatómiai bizonyítékok. Az alaphártya pontosabb vizsgálata kimutatta, hogy egyrészt nincsenek rajta különálló, egyedi rezgésre képes rostok, másrészt pedig a zongorahúroktól eltérően nem feszes, hanem laza. Az az elképzelés viszont, hogy az alaphártya a különböző frekvenciákat különböző részein dolgozza fel, tovább élt a következőkben bemutatandó utazóhullám-elméletben. Utazóhullám-elmélet Az utazóhullám-elmélet az alaphártya működésének az az elmélete, amely a mai napig helyesnek bizonyult. A magyar származású Békésy György nevéhez fűződik, aki – mint már említettük – megalkotásáért No- bel-díjat kapott (lásd a szövegdobozt). Békésy az utazóhullám-elméletet empirikus adatokra, mégpedig mind anatómiai, mind kísérleti adatokra alapozta. Az alaphártya anatómiai vizsgálata feltárta, hogy szerkezete egyáltalán nem homogén, hanem – mint azt már Helmholtz korában is tudták – az alapjánál keskeny, a csúcsánál pedig széles. Csak később fedezték fel azt, hogy magának az alaphártyának a vastagsága is változik, mégpedig úgy, hogy az alapnál vastag, a csúcsnál pedig vékony. Békésy arra jött rá, hogy az alaphártya struktúrája alapvetően meghatározza azt, hogy milyen típusú elmozdulást végez a rezgéshullámok hatására, és hogy ez a struktúra modellezhető egy hasonló jellemzőkkel bíró gumiszalag segítségével (Békésy 1960). Ennek megfelelően létrehozott egy mechanikus csigamodellt (8.11. ábra), amely egyszerűen képezte le a cochlea felépítést.
8.11. ábra. Békésy mechanikus csigamodellje A modell egy csőből állt, aminek a tetejét kivágta, és egy olyan gumiszalagot rögzített rá, amely az alaphártyához hasonlóan az egyik felén keskeny és vastag, a másik felén pedig széles és vékony volt. A cső egyik felére egy az üllőhöz hasonlító szerkezetet helyezett, amelyhez különböző frekvenciával rezgő hangvillákat tudott érinteni, és így meg tudta vizsgálni azt, hogy ezek az eltérő frekvenciák milyen választ váltanak ki a gumiszalagban. Az alkarját a gumiszalaghoz érintve Békésy képes volt a szalag rezgéseit észlelni, és azt tapasztalta, hogy egy hang hatására hullám fut végig a szalag teljes hosszán, de egy bizonyos helyen mozdítja meg leginkább. Tovább vizsgálódva rájött arra, hogy a helyelmélet elképzelésének megfelelően, a magas hangok ott váltották ki a legnagyobb elmozdulást, ahol a hangvilla kapcsolódott a csőhöz (a fülben ez a csiga alapja, vagyis az ovális ablakhoz közeli része), a mély hangok pedig pontosan az ellenkező oldalon. Békésy tehát a mechanikus csigamodell segítségével azt bizonyította, hogy a helyelméletnek van igaza, mivel a frekvencia kódolása az alaphártya specifikus részeihez köthető, nem pedig az egész alaphártya rezgése határozza meg, mint ahogyan azt a frekvenciaelmélet állította. Ugyanakkor az utazóhullám-elmélet a helyelmélethez képest egy eltérő mechanizmust tárt fel, mivel Békésy azt találta, hogy az alaphártya egyes részeinek rezgését egy az alaphártyán végigfutó, de meghatározott helyeken maximális kitérést mutató utazóhullám hozza létre. Ezt az utazóhullámot leginkább úgy képzelhetjük el, mint amikor egy lazán kifeszített kötél egyik végét hirtelen megrántjuk, és ennek következtében egy hullám fut végig rajta. Az alaphártyán hasonló módon alakul ki az utazóhullám, de itt az okozza, hogy a kengyel ráüt az ovális ablakra, és ez mozgáshullámot kelt a csiga folyadékában, ennek hatására pedig az alaphártyán is. Láttuk, hogy a Corti-szerv szőrsejtjei az alaphártya elhajlása hatására kezdenek tüzelni, és most már azt is értjük, hogy hogyan képesek a sejtek a frekvencia kódolására: az eltérő frekvenciájú hangok hatására az alaphártya eltérő részein jön létre egy maximális elhajlás (magas hangok hatására az alap, mély hang hatására pedig a csúcs közelében). Az alaphártya maximális elhajlása pedig az azon a területen lévő receptorok tüzelését okozza, vagyis azok a szőrsejtek tüzelnek leginkább, amelyek az utazóhullám „tetején” találhatók. Eszerint ha tudjuk, hogy az alaphártya melyik részén történt a legnagyobb elhajlás, akkor meg tudjuk mondani, hogy milyen frekvenciájú hang érkezett a fülbe. A frekvencia kódolásának ilyen rendezett voltát tonotópiás szerveződésnek nevezzük, és ahogy majd látni fogjuk, a hallórendszer szinte minden szintjén megtalálható. Az utazóhullám-elmélet nemcsak a frekvencia-, hanem az intenzitásinformáció kódolását is képes magyarázni. Eszerint nagyobb intenzitású hang nagyobb utazóhullámot hoz létre, pontosabban, a hullám maximális elhajlása
167 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai nagyobb lesz. A nagyobb elhajlás természetesen nagyobb aktivitást vált ki a szőrsejtekből, ami gyorsabb kisüléseket eredményez.
3.4. A hallóideg Láthattuk, hogy a hangingereknek az agy által feldolgozható idegi impulzusokká történő átalakítását a cochlea szőrsejtjei végzik. A szőrsejtekből az ott létrejött impulzusokat a hallóidegben összefutó hallóidegrostok vezetik el. Fontos különbséget tennünk a hallóidegrostok és a hallóideg között: a hallóidegrostok a receptorokból kiinduló axonok, a hallóideg pedig az ezeket összegyűjtő struktúra. Ahogy a szőrsejtek tárgyalásakor szó volt róla, az idegrostok nagyobb része (mintegy 95 százaléka) a belső szőrsejteket idegzi be, vagyis ezekből indul ki. Tudjuk azt is, hogy egy-egy fülben körülbelül 3500 belső szőrsejt található, és ezekhez körülbelül 50 000 idegrost kapcsolódik. Mindebből az következik, hogy egyetlen belső szőrsejthez több, átlagosan mintegy 14 ideg is kapcsolódik (lásd 8.12. ábra). Meglehetősen nagy redundanciát találunk tehát a hallási receptorok beidegzése kapcsán.
8.12. ábra. Egy belső szőrsejt beidegzése. A legtöbb szőrsejthez egynél több idegrost kapcsolódik A hallóidegrostok aktivitását állatkísérletes módszerekkel vizsgálták a leggyakrabban, mégpedig az egysejtvizsgálattal. Ahogy azt már tudjuk, az eljárás lényege, hogy egy elektróda segítségével közvetlenül rögzítjük az idegrost elektromos aktivitását, vagyis a rajta áthaladó akciós potenciálokat. A hallóideg működése kapcsán leginkább az érdekelte a kutatókat, hogy a különböző hangerőn megszólaló eltérő frekvenciákra milyen kisülési mintázatokkal reagálnak az idegsejtek (tudjuk, hogy a hangok kapcsán ez az a két ingerjellemző, amit az észlelőrendszernek kódolnia kell). A vizsgálatok két lényeges megállapításra jutottak a hallóidegrostok működésével kapcsolatban. Egyrészt úgy tűnik, hogy az idegrostok inger hiányában is mutatnak kisüléseket, úgynevezett spontán aktivitást. Másrészt az egyes idegrostok a különböző frekvenciákra nem egyformán érzékenyek, vagyis frekvenciaszelektívek.
3.4.1. Spontán aktivitás Liberman (1978) kutatási eredményei alapján tudjuk, hogy az idegrostok soha nincsenek teljes nyugalmi állapotban, és hangingerek hiányában is tüzelnek. Ez a spontán aktivitás azonban eltérő mértékű az egyes idegrostoknál, és így megkülönböztethetünk alacsony, közepes és magas spontán aktivitással rendelkező rostokat. Érdekes módon az, hogy egy idegrost milyen spontán aktivitást mutat, szoros kapcsolatban van azzal, hogy a belső szőrsejtek mely részéhez kapcsolódik. Eszerint a magas spontán aktivitású rostok inkább a belső szőrsejtek külső szőrsejtek felőli részéhez kapcsolódnak, az alacsony spontán aktivitású rostok az ellenkező oldalhoz, a fennmaradó helyekre pedig a közepes aktivitású rostok kapcsolódnak (8.13. ábra). Ráadásul a 168 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai spontán aktivitás összefügg azzal is, hogy az idegrost egy adott frekvencián milyen küszöböt mutat (egy idegrost esetében a küszöb az a legkisebb hangerőérték, amely az aktivitási mintázatában mérhető változást okoz): a magas spontán aktivitáshoz alacsony küszöb tartozik, és fordítva.
8.13. ábra. A hallóidegrostok különböző típusainak spontán aktivitása. A három tengelyen az idő múlásával bekövetkező spontán idegi kisülések láthatók, melyeknek hozzávetőleges számát is feltüntettük. Az idegrostok attól függően mutatnak eltérő aktivitást, hogy a belső szőrsejt mely részéhez kapcsolódnak. A százalékértékek azt fejezik ki, hogy az adott idegrostok milyen arányban találhatók meg a hallórendszerben
3.4.2. Frekvenciaszelektivitás A következő észrevétel a hallóidegrostok aktivitásával kapcsolatban az, hogy egyes idegrostok a különböző frekvenciákra nem egyformán érzékenyek. Valójában minden idegrost esetén létezik egy kitüntetett szűk frekvenciatartomány (az egyszerűség kedvéért tekintsük ezt egyetlen frekvenciának), ahol az idegrost alacsony hangerőküszöböt mutat, és minden más frekvenciára a küszöb értéke magasabb (Liberman 1982). Ezt a kitüntetett frekvenciát nevezzük az adott idegsejt jellemző frekvenciájának. Ha grafikonon ábrázoljuk az egyes frekvenciák esetében az idegi aktivitás kiváltásához szükséges legkisebb hangerőt, akkor a frekvenciahangolási görbét kapjuk (8.14. ábra). A frekvenciahangolási görbe mindenegyes idegrostesetében U alakot vesz fel, aminek a negatív csúcsa jelöli ki az idegrost jellemző frekvenciáját. Az ábrán látható, hogy a görbe U alakja kissé torzított: felfutása általában meredekebb a jellemző frekvenciánál magasabb frekvenciájú hangokra, mint az alacsonyabbakra. Ez azt jelenti, hogy az idegrostok érzékenyebben reagálnak a magasabb frekvenciákra, mivel ezeknél az inger jellemzőinek kis változása nagy aktivitásbeli változást vált ki (a tüzelés csökkenését). Az idegrostok frekvenciaszelektivitása annak köszönhető, hogy az alaphártya más-más pontjaihoz, pontosabban az alaphártya más-más pontjain található belső szőrsejtekhez kapcsolódnak. Tudjuk, hogy az egyes frekvenciák az alaphártya különböző részein kódolódnak (a magas hangok az alap közelében, a mélyek pedig a csúcs közelében), és eszerint az, hogy egy bizonyos idegsejt milyen frekvenciára érzékeny leginkább, attól függ, hogy az alaphártya mely részéhez kapcsolódik. Ugyanakkor a hallóidegrost válaszjellemzőinek meghatározása szempontjából nemcsak az alaphártyához való kapcsolódás helye lényeges, hanem – ahogy láttuk – az is, hogy az alaphártyán lévő belső szőrsejt mely részéhez kapcsolódik az idegrost. Így hát a belső szőrsejt alaphártyán való helyzete határozza meg az idegrost jellemző frekvenciáját, a szőrsejthez való kapcsolódás helye pedig a spontán aktivitás mértékét.
169 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.14. ábra. Frekvenciahangolási görbék több különböző idegrost esetén. Az ábrán kiemeltünk egyetlen idegrosthoz tartozó görbét, és feltüntettük ennek jellemző frekvenciáját Láthattuk tehát, hogy a frekvencia kódolása hogyan valósul meg a hallóidegrostban. Arról azonban még nem beszéltünk, hogy a hangerő hogyan kódolódik. Az első fontos megállapítás, amit ennek kapcsán tennünk kell, az, hogy nincs értelme a hangerő általános kódolásáról beszélnünk. Ahogy láttuk, az egyes idegrostok csak egyetlen frekvenciára mutatnak specifikus érzékenységet, eszerint tehát az intenzitás kódolását egy adott frekvencia esetében tudjuk csak megnézni. Az idegrostok aktivitásának változását az intenzitás növekedésének függvényében a 8.15. ábra mutatja.
8.15. ábra. A különböző típusú hallóidegrostok aktivitásának változása a hangerő függvényében. Fölül magas spontán aktivitással, alacsony küszöbbel és kis dinamikai tartománnyal, alul alacsony spontán aktivitással, magas küszöbbel és nagy dinamikai tartománnyal rendelkező idegrost görbéje látható
10.5. táblázat -
170 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
BEKESY GYÖRGY (Budapest, 1899. jún. 3. – Honolulu, 1972. jún. 13.)
Békésy György 1961-ben „A belső fül csigájában létrejövő ingerületek fizikai mechanizmusának felfedezéséért” orvosi-élettani Nobel-díjat kapott, annak ellenére, hogy ő maga nem volt orvos. Diplomáját kémiából szerezte, doktori címét pedig fizikából. A Nobel-díjhoz vezető kísérletek nagy részét a budapesti Postakísérleti Állomáson kialakított laboratóriumban végezte, és a távközléssel foglalkozó mérnökök Békésyt tréfásan „az eddig egyetlen Nobel-díjas postamérnökként” tartják számon. Békésy Budapesten született, diplomata szülők gyermekeként. Hamar elkerült Budapestről, mivel a család először Münchenbe, majd Törökországba, végül Svájcba költözött. Békésy itt szerzett diplomát vegyészetből, majd visszatért Budapestre, és a doktori tanulmányait már itt folytatta a Pázmány Péter Tudományegyetemen. 1923-ban doktorált fizikából. 1968-ban így emlékezett vissza az 19221923-ban Budapesten, Tangl Károly irányításával töltött doktoranduszi évekre: „A budapesti egyetem igen különbözött a bernitől... A laboratórium igazgatója – Tangl professzor előtt – Eötvös volt. Sohasem találkoztam vele (Eötvös Loránd 1919-ben meghalt), a technikusával azonban többször is. Valahányszor elvégeztem vagy hozzákezdtem egy kísérlethez, azt mondta, hogy a kegyelmes úr nem így csinálná. Néha igaza is volt. így tudtam meg, hogyan gondolkozott és dolgozott Eötvös, és ismét csak azt mondhatom, hogy egy probléma több, különböző oldalról való makacs megközelítésének egyszerűsége volt az, ami Eötvöst a világ kimagasló tudósainak egyikévé tette...” A doktori fokozat megszerzése után Békésy 1923 és 1946 között a Postakísérleti Állomáson dolgozott mérnökként, és lehetőséget kapott egy laboratórium felépítésére. Itt elsősorban a jelátvitel problémáival foglalkozott, és ennek révén kezdte el az emberi fül tanulmányozását, mint a jelátviteli rendszer legfontosabb komponensét. Hamarosan állandó vendége lett a kórházak bonctermeinek és a Postakísérleti Állomás műhelyeinek, ahol a munkások gyakran találtak furcsa csontszerű anyagot a fúróikon reggelente. Ebben az időszakban pályája meredeken ívelt felfelé, 1939-ben az Akadémia levelező tagjává választotta, 1940-ben pedig a Tudományegyetem Gyakorlati Fizikai Tanszékére kapott tanári kinevezést. így már két laboratóriumban folytathatta munkáját. Mindeközben gyakorlati feladatokat is vállalt: az 1928-ban elkészült Magyar Rádió önálló stúdiójának akusztikai terveit Békésy készítette, és a nagyzenekari előadásokra kiépített, azóta legendássá vált 6-os stúdió akusztikai kialakítását is ő tervezte (lásd a koncerttermi akusztikáról szóló szövegdobozt). A második világháború során bombatámadás érte a Postakísérleti Állomás épületét, és elpusztult Békésy itteni laboratóriuma, de az egyetemi laboratórium műszereit sikerült megmentenie. A háború után azonban az egyetemen már nem jutott pénz a laboratórium fejlesztésére, és egyébként is jelentős változások álltak be a magyarországi viszonyokban, ezért, hogy átvészelje ezeket a zavaros időket, 1946-ban kutatói ösztöndíjat kért a svédországi Karolinska Intézetbe. Közben meghívták az Egyesült Államokba, a Harvard Egyetemre, és 1947től itt dolgozott. Amerikai tartózkodását azonban Magyarországon nem nézték jó szemmel, és 1949-ben akadémiai tagságát is megszüntették. Ezzel egy időben teljesen eltüntették a magyarországi közéletből, a nevét is csak suttogva lehetett kiejteni. A Magyar Tudományos Akadémián csak halála után nyolc évvel „rehabilitálták”. A Harvard Egyetemen 17 évet töltött, ahol tovább folytatta a fül és a hallórendszer tanulmányozását, és itteni tartózkodása során számos kitüntetést szerzett. Ezek közül a legjelentősebb az 1961-ben kapott aranyérem az
171 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai Amerikai Akusztikai Társaságtól, s az ugyanebben az évben megkapott orvosi-élettani Nobel-díj volt. Békésy 1966-ban elfogadta a Hawaii Egyetem meghívását, és az ottani Érzékszervi Kutatólaboratórium vezető kutatójaként tevékenykedett. Életének utolsó hat évét töltötte itt, hódolva két legnagyobb szenvedélyének: az érzékeléskutatásnak és a művészettörténetnek. Ez irányú érdeklődését jól példázza a Nobel-díj kapcsán tartott előadása (Concerning the Pleasures of Observing, and the Mechanics of the InnerEar, letölthető a http://nobelprize.org/nobel_prizes/medicine/laureates/1961/bekesy-lecture.html címen), amelyben a belső fül működését szemléltető ábrák mellett rengeteg műalkotás fotóját is bemutatja. Békésy 1972-ben halt meg Hawaii szigetén, és hamvait kívánsága szerint ősi polinéz szokás szerint a Csendesóceánba szórták, hogy újból egyesüljenek a természettel. Élete során mintegy 160 tudományos dolgozatot publikált. Ma már széles körű megbecsülés övezi emlékét mind külföldön, mind idehaza: díjak, iskolák és laboratóriumok viselik a nevét. Az ábráról leolvasható, hogy az idegrost jellemző frekvenciáján megszólaló hang különböző hangszintjei milyen aktivitásváltozást idéznek elő az idegrostban. Látható, hogy a rost spontánaktivitás-szintje egészen a küszöb eléréséig nem változik, majd ez követően monoton növekedést mutat. A növekedés azonban egy bizonyos intenzitás felett nem változik, vagyis elér egy platót. Azt a pontot, ahol az intenzitás növekedése már nem vált ki aktivitásnövekedést, telítődési (szaturációs) pontnak hívjuk, a küszöb és a telítődési pont közötti tartományt pedig (ahol az intenzitás változása okoz egyáltalán valamilyen változást az idegrost aktivitásában) dinamikai tartománynak. Az ábrán látható S alakú, vagyis szigmoid összefüggés minden idegrost esetén hasonlóan néz ki, de ahogy arról már volt szó, az egyes idegrostok eltérnek abban, hogy milyen mértékű spontán aktivitással (magas, alacsony, közepes) és küszöbértékkel rendelkeznek. Ahogy az várható, a három különböző típusú idegrost a dinamikai tartományban is eltér egymástól, mégpedig oly módon, hogy a nagyobb spontán aktivitású és alacsony küszöbű rostok kis dinamikai tartománnyal rendelkeznek, és így tovább. A három különböző típusú hallási idegrost válaszjellemzőit a 8.3. táblázat foglalja össze. A hallóidegrostokkal kapcsolatban meg kell még említenünk azt, hogy az alaphártya tonotopikus szerveződése is (vagyis az, hogy az egymáshoz közeli frekvenciaértékek az alaphártya egymáshoz közeli részein reprezentálódnak) megőrződik az idegrostokban. így a magas frekvenciákra érzékeny rostok a hallóideg perifériás részein találhatók, és az ideg közepe felé haladva a rostok egyre mélyebb frekvenciákra érzékenyek.
3.5. A hallópálya és az agy hallóközpontjai Az eddigiekben áttekintettük a hang útját a fülkagylótól a hallási receptorokat tartalmazó csigáig, valamint azt a folyamatot, ahogyan az alaphártya működése révén a hangok az agy számára érthető idegi aktivitássá alakulnak. Az idegimpulzusok a hallóideg révén jutnak el a belső fülből az agynak azon területeire, amelyek a hangok feldolgozásával foglalkoznak. A továbbiakban áttekintjük a hallópálya útját és azokat az átkapcsolóállomásokat, amelyek a hangingerek különböző mértékű előzetes feldolgozását végzik el, mielőtt az agy halántéklebenyi területén található hallókéregbe jutnának. A két fülből induló hallóideg a vesztibuláris ideggel (amely szintén a fülből, de az egyensúlyérzetért felelős félkörös ívjáratokból indul) együtt a VIII. agyideget alkotva jut el a központi idegrendszerbe. Itt elsőként az agytörzsben található nucleus cochleárisban kapcsolódik át (8.16. ábra), ahol még nincs átkereszteződés, vagyis a jobb fülből érkező hangok a jobb, a bal fülből érkező hangok pedig a bal nucleus cochleárisba futnak. A következő átkapcsolódási pont az oliva superior, ahol már átkereszteződnek az idegpályák, és az e feletti szintek esetében mindenütt lehetőség van mindkét fülből származó információ feldolgozására. Az oliva superior után a hallópálya a colliculus inferiorba, majd a középső geniculatus magba, végül pedig az elsődleges hallókéregbe (Br 41, 42) fut. A hallópálya minden szintjén, így az elsődleges hallókéregben is megőrződik a hangmagasság tonotopikus reprezentációja. A közelmúltban érdekes hasonlóságokat tártak fel a látás és hallás kérgi szerveződésével kapcsolatban. Úgy tűnik, hogy a hallás esetében is létezik két különálló pályarendszer a „mi” és a „hol” információ feldolgozására, vagyis a tárgyak hallás alapján történő azonosítására és a tárgyak helyének megállapítására (Rauschecker-Tian 2000). Ennél részletesebben egyelőre nem beszélünk a kéreg alatti és kérgi területek működéséről, hanem a későbbi fejezetek során még visszatérünk azokra az éppen tárgyalandó pszichológiai működések idegi alapjai kapcsán. 172 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai
8.16. ábra. A hallópálya áttekintése
3.6. ÖSSZEFOGLALÁS 1. A hallás alapvetően három funkcióval rendelkezik: lehetővé teszi egyrészt a kommunikációt, másrészt a riasztást és jelzést, harmadrészt a hangokat kibocsátó tárgyak lokalizációját és felismerését. 2. A hallás révén a mechanikai rezgést kibocsátó tárgyakról szerezhetünk tapasztalatot. 3. A hangok hanghullámok formájában terjednek, amelyek a levegő (vagy egyéb közvetítő közeg) részecskéinek sűrűsödéseiből és ritkulásaiból jönnek létre. 4. A hanghullámok három jellemzővel rendelkeznek: hangerővel vagy amplitúdóval, rezgésszámmal vagy frekvenciával és fázissal. 5. A hangerő a hangnyomás nagyságára vonatkozik, és a hangosság szubjektív érzetéhez vezet. Mértékegysége a decibel. Az emberi hallórendszer a 0 (hallásküszöb) és 160 dB közötti hangerőtartományt képes feldolgozni, amely mintegy 10 milliárdszoros nagyságrendbeli különbségnek felel meg. 6. A rezgésszámot vagy frekvenciát a másodpercenkénti hanghullám-periódusok számával, azaz a Hz-cel mérjük. A frekvencia a hangmagasság szubjektív érzetének alapja. Az emberek a 20-20 000 Hz-es frekvenciatartományt képesek meghallani. 7. A hangok különbözőek lehetnek attól függően, hogy egy vagy több frekvencia-összetevőt tartalmaznak, és hogy periodikusan vagy véletlenszerűen ismétlődők. Három hangtípust ismerünk: tiszta hang, komplex hang, zaj. 8. Az emberi hallórendszer a három anatómiailag elkülönülő részre osztható fülből, a hallópályából és az agy hallási információkat feldolgozó területeiből áll. 9. A fül egyes részeinek eltérő a feladatuk a hallási folyamatban. A külső fül egyfajta irányított mikrofon, a középfül szerepe az ellenállás-csökkentés és a túlterhelés elleni védelem, a belső fülben pedig a hangok idegi impulzussá való átalakítása történik. 10. A transzdukció a belső fülben található csiga alaphártyáján megy végbe. Az alaphártya tartalmazza a Corti-szervet, amelynek szőrsejtjei alkotják a hangreceptorokat. A hang hatására az alaphártya elmozdul, ami ingerületbe hozza a szőrsejteket, és kiváltja tüzelésüket. 11. Az alaphártyának a hangmagasság kódolásában betöltött szerepével kapcsolatban több elmélet is született, köztük a frekvenciaelmélet, a helyelmélet és az utazóhullám-elmélet. Ez utóbbit a mai napig nem cáfolták meg, a másik kettő ellen viszont több érv is szól. 12. A szőrsejtekből az ott létrejött idegi impulzusokat a hallóidegrostok vezetik el. A hallóidegrostok eltérőek lehetnek attól függően, hogy milyen spontán aktivitással, küszöbbel és telítődési ponttal rendelkeznek. Ugyanakkor az egyes rostok egy szűk frekvenciatartományra érzékenyek, amelyet az adott rost jellemző frekvenciájának nevezünk.
173 Created by XMLmind XSL-FO Converter.
8. FEJEZET – A hallás alapvető folyamatai 13. A hallóidegrostok a hallóidegben futnak össze, amely az agytörzsben több helyen átkapcsolódik, illetve átkereszteződik, végül pedig az agykéreg halántéklebenyi területén található elsődleges hallókéregbe érkezik. 14. A hallás kérgi szerveződése a látáshoz hasonló bonyolultsággal rendelkezik, és itt is megtalálhatóak a „hol” és „mi” információ feldolgozására specializálódott pályák.
3.7. KULCSFOGALMAK akusztikus reflex, alaphang, amplitúdó, dinamikai tartomány, fázis, felharmonikusok, frekvencia, frekvenciaelmélet, frekvenciahangolási görbe, sortűzelmélet, spontán aktivitás, telítődési pont, tonotópiás szerveződés, utazóhullám-elmélet
3.8. ELLENŐRZŐ KÉRDÉSEK 1. Mi lehet az oka annak, hogy a hang vízben vagy fémekben gyorsabban terjed, mint a levegőben? 2. Létezik-e hang akkor, ha senki sem hallja? 3. A fény és a hang ingere sokban hasonlít egymáshoz. A hang magassága és hangereje a fény mely tulajdonságainak feleltethető meg? 4. Próbáljuk meg összefoglalni, hogy a hallási inger feldolgozása során hány és milyen típusú mozgásokat végeznek a fül egyes részei! 5. Az alaphártya működésének utazóhullám-elmélete a két másik elmélet közül melyikhez hasonlít inkább? Miért? 6. Mit jelent az, hogy a hallási receptorok beidegzése redundáns? Hol van szerepe ennek a redundanciának? 7. Hogyan lehet kimutatni azt, hogy a hallókéregben a hangok leképeződése tonotópiás szerveződésű?
3.9. AJÁNLOTT OLVASMÁNYOK Moore, B. C. J. 1997. An introduction to thepsychology of hearing. 4th ed. Academic Press, San Diego. Pap János 2002. Hang, ember, hang. Vince Kiadó, Budapest.
3.9.1. AJÁNLOTT HONLAPOK http://www.iurc.montp.inserm.fr/cric/audition/english/start2.htm (A hallórendszer működésének szemléltetése, sok ábrával és animációval.) http://www.brainconnection.com/topics/?main=anat/auditory-phys (A hallás működésének gazdagon illusztrált bemutatása.) http://nobelprize.org/nobel_prizes/medicine/laureates/1961/index.html (A Nobel-díj hivatalos oldala, ahol sok információ található Békésy Györgyről, köztük a Nobel-díj-átadás archív felvétele és Békésy több beszéde.) http://www.pbrc.hawaii.edu/bekesy/ (Békésy hawaii laboratóriumának honlapja, ahol több fotó is található Békésyről és a mechanikus csigamodellről.)
174 Created by XMLmind XSL-FO Converter.
11. fejezet - 9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang A hangok szubjektív észlelésének tanulmányozásával a pszichoakusztika tudománya foglalkozik. Pap János (2002) szerint a hangok észlelése kapcsán két alapvető „posztulá- tumot” kell elfogadnunk: 1. Mindenki azt hall, amit hall. Valójában nincs módunk arra, hogy közvetlenül tudomást szerezzünk arról, hogy mások hogyan észlelik a környezet hangjait, nem tudhatjuk meg, hogy milyen élményt vált ki bennük egy hang meghallása. Vannak viszont közvetett módszerek, és lényegében a pszichoakusztika tudománya azzal foglalkozik, hogy minél pontosabb és jobb eszközöket és módszereket fejlesszen ki annak érdekében, hogy közelebb kerüljünk mások akusztikai élményeinek megismeréséhez. 2. A szubjektív hang paraméterei kölcsönhatásban vannak egymással. Mint arról az előző fejezetben már szó volt, a hangok többféle paraméterrel (pl. hangosság, hangmagasság) rendelkeznek. Ebben a fejezetben azt fogjuk bemutatni, hogy miként lehetséges az, hogy a hangokat nem különálló fizikai jellemzőik révén, hanem egységes egészként észleljük, és hogy az egyes ingerdimenziók megváltozása magával vonja a többi észleletének megváltozását. Egy hétköznapi példa erre, amikor operaénekeseket hallgatunk, és egyikük énekét jóval hangosabbnak észleljük, mint a másikét. Ha ez fizikailag is így van, észlelőrendszerünk rendben követi a hangosságeltérést. Próbáljuk meg viszont azt a helyzetet értelmezni, amelyben mindketten azonos hangossággal, azaz műszeresen kimérve azonos decibelértékű, mondjuk 80 dB intenzitással énekelnek, és mégis, egyikük hangját hangosabbnak halljuk. Ez úgy következhet be, hogy az egyik énekes nagyobb erőfeszítéssel, a gégefedő fokozottabb lenyomásával éri el a hangosságnövekedést. Ennek következtében hangjában a magas részhangok aránya megnő, így a magas hangok összetételének megváltozása miatt hangosabbnak halljuk az ő énekét, miközben a fizikai hangosság azonos. Ezzel ráadásul még az is együtt járhat, hogy a szöveg érthetetlenné válik, hiszen a magánhangzók frekvencia-összetevői feljebb, egymáshoz közelebb csúsznak, és a magán hangzó-kategóriák megfelelő észlelése lehetetlenné válik. Minderről később, a beszédhangok észlelésével foglalkozó 11. fejezetben bőven lesz szó. A pszichoakusztikai ismeretek azonban nem csak arra jók, hogy többet tudjunk arról, hogyan is működik az emberi észlelés. A mérnöki és számítástechnikai tudományok egyre több területen használják ki ezeket az ismereteket, és a hangok fizikai jellemzőinek vizsgálata helyett egyre inkább arra figyelnek, hogy valójában mit is hallanak az emberek (lásd az mp3 formátumról szóló szövegdobozt). Ennek a fejezetnek tehát a hangok szubjektív észlelése lesz a témája. Miután az eddigiekben megtanultuk, hogy milyen információt dolgoz fel a hallórendszer, és ehhez milyen anatómiai és élettani eszköztár áll a rendelkezésére, most arra leszünk kíváncsiak, hogy vajon mit hallanak valójában az emberek. Látni fogjuk, hogy a hangok és az azokat feldolgozó mechanizmusok jellemzői önmagukban nem határozzák meg azt, hogy mit is észlelünk. Azt is mondhatjuk, hogy a hallórendszer szerkezete és működése csak egyfajta megszorítást jelent: szükséges, de nem elégséges feltétele a hallási élménynek. A fejezetben két nagy témával foglalkozunk: a hangosság észlelésével és a hangmagasság észlelésével. Ezt kiegészíti még a hallórendszer frekvenciaszelektivitásának és a hangszín észlelésének a tanulmányozása.
1. A hangosság észlelése Az emberi fül érzékenysége csodálatra méltó: az általunk észlelhető hangok tartománya 0-130 dB közötti, ami 1 : 1012 intenzitásaránynak felel meg. A hangosság észlelése kapcsán az első kérdés az lesz, hogy hogyan képes feldolgozni a hallórendszer egy ilyen óriási hangerőtartományt. Ugyanakkor tudjuk azt is, hogy egy hang észlelt hangossága szubjektív élmény. Definíció szerint a hangosság a hallási észlelésnek az a jellemzője, amelynek alapján a hangokat hangosságuk mentén egy skálán sorba tudjuk rendezni a halk hangoktól a hangos hangokig. Ebből fakad a második kérdés: mi határozza meg valójában a hangosság észlelését? Ha az utca emberét megkérdeznénk arról, hogy mitől lesz egy hang hangosabb egy másiknál, akkor természetesen azt válaszolná, hogy attól, hogy az nagyobb hangerővel rendelkezik. Sőt valószínűleg azt is meg tudná mondani, hogy hogyan tudja elérni azt, hogy a rádióból szóló zene hangosabb legyen: egyszerűen felcsavarja a hangerőgombot. Látni fogjuk azonban, hogy egy hang hangosságát nem csak az intenzitása vagy hangereje befolyásolja. Mint az operaénekes-példából kitűnhetett, a hang frekvenciája legalább olyan fontos szerepet játszik a hangosság
175 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang élményének kialakulásában, mint az, hogy milyen hangerővel, fizikai értelemben véve, milyen hangnyomással rendelkezik.
1.1. A hangosság észlelésének tartománya 1.1.1. Az abszolút küszöb A hallható hangok tartományának alsó határát úgy határozhatjuk meg, hogy megmérjük azt a legkisebb intenzitást, ami ahhoz szükséges, hogy egy adott frekvenciájú hangot éppen meghalljunk. Ezt az éppen detektálható intenzitást nevezzük a hang abszolút küszöbének. Egy ilyen mérést nagyon csendes környezetben kell elvégezni, és érdemes arra is odafigyelni, hogy fülhallgatón vagy hangszórón keresztül adjuk-e a hangokat, ugyanis a kettő között jelentős különbségek lehetnek (akár 2dB eltérés is, lásd Moore 1997). Ha sok személy sok különböző frekvencián mutatott abszolút küszöbét megmérjük, és ezeket ábrázoljuk, akkor a 9.1. ábrán látható görbét, az úgynevezett hallhatósági függvényt kapjuk.
9.1. ábra. Hallhatósági függvény A hallhatósági függvény tehát az egyes frekvenciák függvényében ábrázolja a hallási küszöböket. Fontos kiemelnünk, hogy a görbe egyénileg eltérő lehet, hiszen nem egy fizikai összefüggést, hanem egy szubjektív élményt jelenít meg, nevezetesen azt, hogy a kísérleti személy egy adott szituációban hallott-e egy hangot vagy sem. Természetesen, mivel a hallhatósági függvény sok ember átlagolt válaszaiból készült, ezért nagyjából mindenkinél hasonló lesz. Ugyanakkor az is teljesen normális, ha valakinél ±20 dB-nyi eltérés tapasztalható valamelyik frekvencia esetén. Ahogy az ábrán látható, a hallhatósági függvény egy U alakú összefüggést ábrázol a frekvencia és az intenzitás között: az alacsony és a magas frekvenciák esetében a hallási küszöb magas, a középső frekvenciák esetén viszont alacsony. A görbéről az is leolvasható, hogy leginkább az 1-4 kHz-es (1 kHz = 1000 Hz) tartományra vagyunk érzékenyek. Ez a tartomány kitüntetett jelentőségű a hallási észlelésben: a beszédhangok és a zenei hangok frekvenciájának jelentős része is ebbe a tartományba esik. A hallhatósági függvény az életkorral változik: a magas hangokra mutatott érzékenység csökken. Kisgyerekek képesek akár a 20 kHz-es hangokat is detektálni, egy átlagos felnőtt azonban 15 kHz felett már nem hall hangokat, és időskorban ez az érték akár a beszédhangok tartományát is elérheti (lásd A hangosság észlelésének problémái, 279. sk.). A pszichofizika korábbi tárgyalása során nemcsak az abszolút küszöbről, hanem a különbségi küszöbről is tanultunk. Mint tudjuk, a különbségi küszöb azt fejezi ki, hogy mennyivel kell megváltoztatnunk az inger intenzitását ahhoz, hogy ez változást okozzon az inger észlelésében. A hangerő kapcsán két eljárás is létezik a különbségi küszöb mérésére: az egyik esetében közvetlen nagyságbecslés révén állapítjuk meg a hangok hangosságát, a másikban viszont a hangossági szinteket mérjük. A továbbiakban ezt a két eljárást és a segítségükkel kapott eredményeket tekintjük át.
1.1.2. A hangerő közvetlen nagyságbecslése A hangok észlelt hangosságának megállapítására az egyik leggyakrabban alkalmazott módszer a közvetlen nagyságbecslés. A módszer Stevens (1957) nevéhez fűződik. A hangosság nagyságbecslésére két különböző eljárást is alkalmaznak. Az egyikben különböző hangosságú hangokat adnak a kísérleti személyeknek, és arra kérik őket, hogy rendeljenek számokat ezekhez a hangokhoz aszerint, hogy milyen hangosnak hallják őket. Vagyis, ha például egy 80 dB-es hangot 10-zel jelöltek, akkor csak az a lényeges, hogy egy ennél hangosabb
176 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang hang 10-nél nagyobb értéket, egy halkabb hang pedig 10-nél kisebbet kapjon. A másik típusú feladatban, ami egy produkciós feladat, a személyeknek az a dolguk, hogy egy hang hangerejét úgy állítsák be, hogy az megfeleljen egy előre meghatározott másik hang hangosságának, illetve egy annál bizonyos mennyiséggel hangosabb szintnek (kétszer, négyszer stb. hangosabb vagy halkabb legyen). Bármelyik módszert használjuk is, egy olyan általános összefüggést kapunk a hang intenzitása és az észlelt hangosság között, amely szerint a hangosság a hangerővel együtt, de annál lassabban növekszik. pontosabban, ahogyan azt stevens is leírta, a hangok észlelt hangossága és fizikai intenzitása között hatványösszefüggés van. Ezt az összefüggést az alábbi képletben foglalhatjuk össze: Φ = k Ψ0,67, ahol $ az inger észlelt hangossága, W az inger intenzitása, k pedig egy olyan állandó (konstans, innen a k), amely a személytől és a használt mértékegységtől is függ. Vagyis a hatványösszefüggés szerint egy adott hang hangossága arányos a hang intenzitásának 0,67. hatványára emelésével. Stevens bevezetett egy mérőszámot is a hangosság mérésére, mégpedig a s o n t. A definíció szerint 1 son egy 1000 Hz-es és 40 dB-es hang hangosságát jelöli, és értékét úgy választották meg, hogy az 1 son különbség körülbelül 10 dB-nyi intenzitásbeli különbségnek, vagyis a hangerő megduplázódásának feleljen meg. Eszerint tehát egy 2 son hangosságú, 1000 Hz-es hang kétszer olyan hangos, mint az 1 sonos hang, és hangereje 50 dB. A hangok hangosságának és intenzitásának hatványösszefüggését Ste- vens eredeti vizsgálata óta sokan alátámasztották. Több kritika is felmerült az eredményekkel kapcsolatban. Ezek elsősorban arra vonatkoztak, hogy a mérés során több torzító hatás is felléphetett. Poulton (1979) szerint az alábbi tényezők befolyásolhatják az eredményeket: • a használt ingerek tartománya, • a bemutatott ingerek sorrendje, • a kísérleti személynek adott instrukció, • a megengedett válaszok típusa, • a válaszok szimmetrikussága, • egyéb faktorok, amelyek a személy motivációjával, tapasztalatával, figyelmével stb. vannak összefüggésben. Általános tapasztalata a vizsgálatoknak az is, hogy rendkívül nagy egyéni variabilitás tapasztalható az eredményekben: egy-egy személy eredményeit figyelembe véve nem feltétlenül kapjuk meg a Stevens-féle „ideális” hatványösszefüggést, azt valójában csak nagyon sok személy átlaga adja ki. Mindezek az eredmények megkérdőjelezik a hatványfüggvény megbízhatóságát.
1.1.3. A hangossági szintek A különbségi küszöbök megállapításának másik módja a hangossági szintek mérése. Ez a módszer a nagyságbecslési módszerrel szemben sokkal megbízhatóbb eredményeket hozott, olyannyira, hogy ma már szigorú követelményeknek megfelelő ISO- (International Organization for Standardization – Nemzetközi Szabványügyi Szervezet) szabályozás is létezik ezzel kapcsolatban (ISO 226: 2003). A hangossági szintek megállapításához azt kérjük a kísérleti személytől, hogy állítsa be egy 1000 Hz-es hang hangosságát úgy, hogy az ugyanolyan hangos legyen, mint a tesztinger. A hangokat felváltva adjuk, és minden esetben az a személy feladata, hogy az 1000 Hz-es hang hangerejét változtatva a teszthanghoz hasonlóvá tegye. Azt a hangerőszintet, amelyen az 1000 Hz-es hang a teszthanggal megegyezően észlelt hangosságú, a teszthang hangossági szintjének nevezzük, és egy speciális mértékegységben, a phonban mérjük. Definíció szerint egy 1000 Hz-es hang hangossági szintje megfelel a dB SPL-ben mért hangerő szintjének. Ezek szerint egy 10 dB SPL hangerejű 1000 Hz-es frekvenciájú hang 10 phon hangossági szintnek felel meg. Minden más frekvenciájú hang, amely szubjektív hangosságát tekintve megegyezik a 10 dB SPL hangerőszintű 1000 Hz-es hanggal, szintén 10 phonos lesz, függetlenül attól, hogy pontosan hány dB hangerővel szólal meg. Ha ezt az eljárást 177 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang megismételjük sok eltérő frekvenciájú hanggal, akkor egy egyenlő hangosságú szintvonalat kapunk. Természetesen sok különböző hangossági szintet állapíthatunk meg, minden esetben úgy, hogy az 1000 Hz-es hanghoz viszonyítjuk a többi hang hangosságát (lásd 9.2. ábra).
9.2. ábra. Egyenlõ hangosságú szintvonalak Az egyenlő hangosságú szintvonalat egyszerűen úgy értelmezhetjük, hogy az azon fekvő hangokat azonos hangosságúnak észleljük. Ha azonban szemügyre vesszük a 9.2. ábrát, amely a frekvencia függvényében tünteti fel a hangerőértékeket, láthatjuk, hogy az azonos hangosságú hangok valójában egy görbén helyezkednek el. próbáljuk az ábrán megkeresni a 10 phonnak megfelelő szintvonalat. Ha most ezt a vonalat végigkövetjük a különböző frekvenciákra, akkor azt tapasztaljuk, hogy szinte minden frekvencia esetén eltérő hangerőérték mellett kapjuk meg az azonos hangosságot. Tegyünk egy próbát, hogy értjük-e a phonskála működését: keressük meg a 9.2. ábrán a 20 phonos szintvonalat. Most próbáljuk megállapítani, hogy egy 100, 1000 és 10 000 Hz-es hangnak milyen hangerővel kell szólnia ahhoz, hogy egyformán 20 phon hangosságúnak halljuk őket? Az 1000 Hz-es hangot könnyű kitalálni: definíció szerint ez 20 dB-nél lesz 20 phon. A 100 Hz-es hang körülbelül 35 dBnél metszi a 20 phonos szintvonalat, a 10 000 Hz-es pedig 30 dB-nél. Ha valakinek nem ez az érték jött ki, annak érdemes még egyszer átolvasnia a fentieket. Észrevehetjük, hogy az egyenlő hangosságú szintvonalak nagyon hasonló alakot mutatnak, mint a hallhatósági függvény. Valójában a 0 phon az abszolút küszöbnek megfelelő hangossági szintet jelöli. Vagyis az egyenlő hangosságú szintvonalakra szintén jellemző, hogy a középső frekvenciatartományoknál a legjobb az érzékenység, és a nagyon mély és nagyon magas hangokra csökken az érzékenység. Ráadásul, ahogyan az a 9.2. ábrán is látszik, a különböző hangossági szintek nagyon hasonló lefutást mutatnak, de nagyon magas hangszintek esetén (110-120 phon környékén) a görbe kezd ellaposodni, és elveszíti U-alakját. Ebből arra következtethetünk, hogy magas hangerőszinteken más mechanizmusok valósítják meg a hangosság percepcióját, mivel itt úgy tűnik, hogy a hangok észlelt hangosságát kevésbé befolyásolja a hang frekvenciája, mint alacsony hangerőszintek esetén. A hangosságot kódoló mechanizmusokról a következő részben többet fogunk mondani. Az egyenlő hangosságú szintvonalak létezésének van egy olyan következménye, amivel a hétköznapokban is gyakran találkozunk. A modern hifiberendezéseket (sőt ma már akár a televíziókat és az icipici mp3-lejátszókat is) ellátják egy equalizernek (hangszín-ki- egyenlítőnek) nevezett eszközzel. Az equalizer feladata, hogy minden egyes frekvenciasávot külön-külön tudjunk hangosítani. Az egyenlő hangosságú szintvonalakból ugyanis az következik, hogy ha minden frekvenciát ugyanolyan intenzitással szólaltatunk meg, akkor bizonyos frekvenciatartományok hangosabbak lesznek, mint mások. Ezt a fenti ábrán például úgy tudnánk szemléltetni, hogy egy a vízszintes tengellyel párhuzamos egyenest húzunk egy adott intenzitásszinten, például 80 dB-nél. Ez jelölné a hanglejátszó eszköz által kibocsátott hangerőszintet. Ha most megnézzük, hogy ez a vonal hol metszi az egyes frekvenciáknál az azonos hangosságú görbéket, vagyis milyen hangosnak halljuk azokat, akkor azt tapasztaljuk, hogy az 1000 Hz-es hangoknál ez 80 phon hangosságot eredményez, a 100 Hz-es hangoknál kb. 75 phon lesz, a 4000 Hz-es hangoknál viszont kb. 90 phon. A mély és nagyon magas hangok tehát sokkal halkabbnak fognak tűnni, mint a közepes frekvenciájúak. Mi viszont azt szeretnénk, hogy minden frekvenciatartományt hasonló hangosságúnak halljunk, és ezért a mély és magas hangokon hangosítani, a közepes frekvenciájúaknál viszont halkítani kell.
178 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang Az equalizerek használatának van még egy olyan aspektusa, amely nagyon jól illusztrálja az egyenlő hangosságú szintvonalak működését. Ez pedig a „dübörgő basszus” jelensége. Ha egy megfelelően beállított equalizernél, ahol tehát a mély (basszus) hangok a többi frekvenciánál nagyobb hangerőt kapnak, és egy viszonylag nagy általános hangerőt állítunk be, akkor az addig azonos hangossággal szóló tartományok helyett a mély tartomány sokkal hangosabbá válik. Ennek a magyarázata természetesen az, hogy a nagyobb általános hangerő egy magasabb hangossági szintre tolja el a görbéket, ahol viszont sokkal kevésbé érvényesül az U alakú összefüggés, vagyis a mély hangok sokkal kevésbé hallatszanak halknak. Ha viszont a mély hangok egy további hangosítást kapnak, akkor természetesen sokkal hangosabbnak fognak hallatszani, vagyis „dübörögnek”.
1.2. A hangosság kódolása A következőkben azt fogjuk áttekinteni, hogy hogyan kódolja a hallórendszer a hangerőt. A 8. fejezetben láttuk, hogy hogyan valósítják meg az alaphártya szőrsejtjei a hanginger idegi impulzusokká történő átalakítását. Emlékezzünk vissza, hogy egy adott frekvenciájú hanginger az alaphártya meghatározott pontján hoz létre maximális elhajlást, és ennek következtében az ezen a ponton található szőrsejtek jönnek ingerületbe. Ezen szőrsejtek aktivitása hozza létre azt az idegi impulzust, amelyet az agy le tud fordítani észleletté. Ezzel a mechanizmussal azonban csak azt magyaráztuk meg, hogy a különböző frekvenciájú hangokat hogyan kódolja az alaphártya. De mi a helyzet a hangerővel? Milyen módon képesek a szőrsejtek a hangerővel kapcsolatos információt kódolni? A legkézenfekvőbb elképzelés ezzel kapcsolatban az, hogy a hangerőt a hallóideg kisüléseinek száma kódolja. Ez úgy képzelhető el, hogy halkabb hangok esetén az adott frekvenciát kódoló neuronok csak kismértékben tüzelnek, míg hangosabb hangok esetén magasabb tüzelési arányt mutatnak. Az idegrendszer magasabb szintű folyamatai pedig ezeket a tüzelési arányokat alakítják vissza a hangosság élményévé. Ezzel az elképzeléssel az a probléma, hogy az empirikus adatok nem igazolják. A hallóidegrostok válaszjellemzőit részletesen megvizsgálva Palmer és Evans (1979) azt találta, hogy az idegrostoknak csak nagyon kis része, mintegy 10 százaléka képes széles dinamikai tartományt kódolni, de ez a tartomány is csak mintegy 60 dB-t jelent. Ugyanakkor, mint tudjuk, legalább 130 dB-nyi hangerőtartományt kellene az idegrostoknak feldolgozni, mivel a hallásküszöb és a fájdalomküszöb között körülbelül ennyi a különbség. Mindez azt jelenti, hogy a hangerő kódolásában a kisülések számán kívül valamilyen más mechanizmus is szerepet játszik. A nagy intenzitású hangok kódolásában részt vevő „kiegészítő” mechanizmus lehet a növekvő intenzitású hangok hatására bekövetkező aktivációsmintázat-terjedés. Megfigyelték, hogy a növekvő intenzitás hatására nemcsak azok az idegrostok tüzelnek, amelyeknek a jellemző frekvenciáját tartalmazza a megszólaló hang, hanem azok is, amelyek a hanghoz közeli jellemző frekvenciával rendelkeznek. Ennek oka egyszerűen megérthető, ha visszagondolunk arra, hogy hogyan is működik az alaphártya. Tudjuk, hogy egy adott frekvenciájú hang hatására az alaphártya meghatározott része mutat maximális mértékű elhajlást, és azt is tudjuk, hogy minél nagyobb intenzitású a hang, annál nagyobb ez az elhajlás. A nagyobb elhajlás hatására azonban nemcsak a hang frekvenciáját kódoló területhez kapcsolódó idegrostok jönnek aktivációba, hanem a szomszédos területek is (a magasabb csúcs nagyobb felülettel jár együtt, pont úgy, mintha egy gumiszalag közepét felhúznánk). Ezt az aktivációsmintázat-terjedést szemlélteti a 9.3. ábra.
9.3. ábra. Idealizált idegi aktivációs mintázat nagy intenzitás esetén (folytonos vonal).Az intenzitás növelésének hatására (szaggatott vonal) az idegi aktivitás nagysága nem változik, de több neuron kezd el tüzelni Az ábráról leolvasható, hogy nagy intenzitású hangok esetén az aktivációs mintázat közepén található neuronok esetében az intenzitás növekedésének hatására már nem nő tovább a kisüléseik száma, vagyis telítődtek, idegen szóval szaturálódtak. Ha növeljük a hang intenzitását, akkor a szaturálódott neuronok ezt természetesen már
179 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang nem képesek kódolni, ugyanakkor a nagyobb intenzitás hatására további neuronok aktiválódnak, mivel az alaphártya nagyobb része mozdul el. így ha összehasonlítjuk a két intenzitásszint által kiváltott aktivációs mintázatot, akkor láthatjuk, hogy a kisülések száma nem változik, azonban a tüzelő neuronok száma nagyobb lesz. Eszerint a nagy intenzitás kódolásában felhasználható ezeknek a további neuronoknak az aktivációs mintázata. Az aktivációs mintázat terjedésének a hangosság kódolásában játszott szerepét olyan vizsgálatokkal bizonyították, amelyben háttérzaj jelenlétében kellett a kísérleti személyeknek hangosságmegkülönböztetési (diszkriminációs) feladatokat végezniük. A háttérzajnak maszkoló (elfedő) hatása van: zaj jelenlétében nehezebben hallhatók a hangok. Ezenkívül tudjuk, hogy a zaj olyan komplex hang, amely nagyon sok frekvencián tartalmaz hangenergiát. Különböző eszközökkel meg tudjuk szűrni a zajt, azaz csak bizonyos tartományokat tartunk meg, a többit pedig eltávolítjuk (lásd bővebben a látással kapcsolatban a színkeverésről mondottakat). Alul áteresztő szűrésnek nevezzük azt, amikor a tartomány alsó részeit tartjuk meg, és a felsőket távolítjuk el, felül áteresztő szűrésnek, amikor a felső tartományt tartjuk meg, és az alsót távolítjuk el, és sávszűrésnek nevezzük, ha mind az alsó, mind a felső tartományokból eltávolítunk bizonyos részeket, és a kettő közöttit tartjuk meg (9.4. ábra). A zaj szűrése azért fontos, mert a zaj mindig csak azokat a hangokat fedi el, amelyeknek frekvenciája beleesik a zaj által tartalmazott frekvenciatartományba. Vagyis elképzelhető, hogy egy szűrt zaj nem képes elfedni egy hangot, ha a kettő frekvenciája nem esik egybe. A szűrésről és zajelfedésről a későbbiekben (280. skk.) részletesebben is fogunk beszélni. Ilyen különböző módokon megszűrt zajok használatával Moore és Raab (1974) azt találta, hogy a különböző hangerejű hangok megkülönböztetését csak a felül áteresztő szűrővel szűrt háttérzajok rontották le. Mit jelent ez? A felül áteresztő szűrés a zajból csak a felső frekvenciákat tartja meg, és emiatt feltételezhetjük, hogy a zaj csak a magas frekvenciájú hangokat fedi el. Eszerint a zaj azoknak a neuronoknak a válaszait gátolja, amelyek a magasabb frekvenciákat kódolják. Leegyszerűsítve ezt úgy kell elképzelnünk, mintha az „aktivációterjedés” ábrán a magas jellemző frekvenciájú neuronokat egyszerűen levágnánk. Ennek hatása természetesen az, hogy a gátolt neuronok nem képesek a fent említett pluszaktivitást kifejteni, és így nem képesek hozzájárulni a hangosság kódolásához. Ezzel alátámasztható, hogy a nagy intenzitású hangok kódolásában valóban fontos szerepet játszik az aktivációs mintázat terjedése, vagyis a hang frekvenciájánál magasabb jellemző frekvenciájú neuronok tüzelése. Az utóbbi években felmerült egy az eddigiekben bemutatottaktól lényegesen eltérő elképzelés a hangosság kódolásával kapcsolatban. Ahogyan az előző fejezetben láttuk, a hallóidegrostok válaszjellemzőinek pontos vizsgálata fényt derített arra, hogy három eltérő típust tudunk elkülöníteni a spontán aktivitás, a hangerőküszöb és a telítődési pont alapján (lásd a 8.3. táblázatot). A három különböző típusú idegrost feltételezhetően eltérő hangerőtartományokat kódol, és ez teszi lehetővé, hogy a 130 dB-es dinamikai tartományt olyan rostok kódolják, amelyek egyenként csak egy maximálisan 60 dB-es tartomány átfogására képesek. Ezt a lépcsőzetes hangerő-kódolási mechanizmust úgy kell elképzelnünk, hogy az alacsony, közepes és magas intenzitástartományokat eltérő neuroncsoportok kódolják, és aszerint észleljük hangosnak vagy halknak a hangokat, hogy melyik csoport aktív. Fontos észben tartanunk, hogy az eltérő típusú idegrostok ugyanahhoz az alaphártyai szőrsejthez kapcsolódhatnak, vagyis ugyanazt a frekvenciát képesek kódolni, de eltérő hangerőszinteken. A hangerő kódolásának ezen mechanizmusa ugyanakkor felvet egy komoly problémát: a mechanizmust nagyon kisszámú idegrost is képes megvalósítani, egyes számítások szerint (pl. Viemeister 1988) akár 100 idegrost is elég lehet erre a feladatra. Ha viszont 100 idegrost elég a mechanizmus megvalósítására, akkor vajon mit csinál a maradék 30 000? Illetve, ha valójában 30 000 neuron áll rendelkezésre, akkor miért nem jobb a hangerődiszkriminációs képességünk? A lépcsőzetes hangerőkódolás elmélete tehát egy teljesen új kérdést vetett fel a hangerő kódolása kapcsán: most már nem az a legnagyobb probléma, hogy hogyan képes a hallórendszer a 120 dB-es dinamikai tartományt átfogni, hanem az, hogy miért nem jobb a felbontóképességünk? Ennek a problémának a megoldása talán az lehet, hogy az intenzitás diszkriminációját nem a hallóidegrostok által szállított információ korlátozza, hanem az, ahogyan ezt az információt a hallási feldolgozás magasabb szintű folyamatai felhasználják (Carlyon-Moore 1984).
1.3. A hangosság észlelésének problémái Magyarországon az ismert statisztikai adatok szerint az emberek mintegy 10 százaléka szenved valamilyen, a hangosság észlelését befolyásoló halláskárosodásban (KSH 2003). A halláskárosodás különböző mértékű lehet, és az enyhe fokú frekvenciaspecifikus halláscsökkenéstől a teljes süketségig terjedhet. Mivel a mindennapi hangok segítenek abban, hogy kapcsolatban maradjunk a környezetünkkel, a hallás csökkenése vagy elvesztése
180 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang nemcsak más emberek hangjától, és így a velük folytatott kommunikációtól foszt meg bennünket, hanem az élet biztonságot nyújtó háttérzajaitól is. A halláskárosodásnak két típusát különböztetjük meg: a vezetéses és az érzékszervi-idegi halláskárosodást. A vezetéses halláskárosodást a külső vagy középfül megbetegedései okozzák, és általánosságban az jellemző rá, hogy az érzékenység a teljes hangtartományra és nem csak bizonyos frekvenciákra vonatkozik. Ahogyan a neve is mutatja, ez a fajta halláskárosodás amiatt jön létre, hogy a külső és a középfül valamilyen okból kifolyólag nem képes vezetni a hangot a külvilágból a belső fülbe, ezáltal a hangok tompulnak. Ve- zetéses halláskárosodást többnyire három probléma okoz: a hallójáratban felhalmozódó fülzsír, a középfül gyulladása (otitis media) és az otoszklerózis nevű betegség, amely a hallócsontocskák fokozatos mozgásképtelenségét okozza. Ezek a problémák többnyire kezelhetők gyógyszeres vagy súlyosabb esetben sebészeti beavatkozással, illetve egyszerű hallókészülékek alkalmazásával. A halláskárosodás másik fajtája az érzékszervi-idegi károsodás. Ez szintén gyűjtőfogalom, és minden olyan problémát vagy betegséget magában foglal, ami a csigát, vagy hallóideget károsítja. Az ilyen típusú halláskárosodások leggyakoribb fajtája az időskori halláscsökkenés (presbyacusis). Az időskori halláscsökkenés a fejlett ipari társadalmakban az emberek nagy részét érintő probléma, és jellemzően frekvenciaspecifikus, azaz csak a magas frekvenciatartományokra való érzékenység elvesztését jelenti. progresszív probléma, vagyis az érintettek fokozatosan egyre nagyobb tartományokat nem képesek meghallani, és mindez viszonylag korán, már 30 éves korban elkezdődik. Egy felmérés szerint (Davis-Silverman 1960) a 30 évesek nagy része a halláscsökkenés miatt nem képes meghallani a 15 kHz-nél magasabb frekvenciájú hangokat (emlékezzünk vissza, hogy az ember által feldolgozható hangok felső határa 20 kHz), ami 50 éves korra 12 kHz-re, 70 éves korra pedig 6 kHz-re csökkenhet. Az ilyen nagyfokú halláskárosodás már komolyan veszélyezteti a beszédhangok megértését is. Az időskori halláscsökkenés okával kapcsolatban két elmélet is létezik. Az egyik szerint a halláscsökkenést a csiga érrendszerét érintő keringési problémák okozzák, amelyek következtében romlik a csiga vérellátása, ez pedig a csiga szöveteinek (így az alaphártyának) a pusztulását okozza. Egy másik elmélet azon alapul, hogy mivel az időskori halláscsökkenés elsősorban a fejlett ipari társadalmakra jellemző, a problémát a hosszú időn át tartó folyamatos környezeti zaj (ami a nagyvárosi élet elkerülhetetlen velejárója) kedvezőtlen hatása okozza. Ezt az elképzelést alátámasztja az, hogy a zajszennyezéstől mentes kultúrákban élő idősek nem mutatják ezt a specifikus halláscsökkenést. Egy másik gyakran előforduló érzékszervi-idegi károsodás a különböző zajhatások miatt kialakuló halláscsökkenés. Itt elsősorban a nagy zaj által kiváltott halláscsökkenésre kell gondolnunk, amelyet akár hirtelen, akár tartós zajok okozhatnak. A hirtelen nagy zajhatásra példa egy robbanás vagy egy fegyver eldördülése, ami gyakran okoz átmeneti, majd később maradandó halláscsökkenést, például a vadászoknál. A hosszan tartó magas zajszint a többinél gyakrabban előforduló oka a halláscsökkenésnek. Ezek közül kettőt érdemes kiemelni: az egyik a munkahelyi zajártalom, amely nagyon komoly munka-egészségügyi és egyben ergonómiai kérdés. Kimutatható, hogy a nagyon zajos munkahely (pl. szerelőüzemek) nemcsak a munkások hallásának károsodását okozhatja, hanem egy ilyen helyen fokozott a balesetveszély is. Ennek megfelelően ma már a legtöbb zajos munkahelyen fokozottan gondoskodnak a dolgozók zajvédelméről. A másik halláskárosodást okozó tartós zajszint a hangos zene. Bármennyire meglepő, a fiatalok körében igen gyakori az enyhe fokú halláskárosodás, amelynek fő okaként a túl hangos zenehallgatást, a könnyűzenei koncerteket, illetve a walkmanek és mp3 lejátszók túl hangos hallgatását nevezik meg. Egy vizsgálatban Han- son és Fearn (1975) azt találta, hogy a rockkoncerteket gyakran látogató és az azokat nem látogató egyetemisták között mintegy 2 dB-nyi, konzisztensen jelentkező hallásküszöb-különbség volt kimutatható minden vizsgált frekvenciatartományban.
2. Frekvenciaszelektivitás, zajelfedés és kritikus sávok Az 8. fejezetben a fül különböző részeinek tárgyalásakor arról beszéltünk, hogy a belső fül szerepe a beérkező hangok frekvencia szerinti elemzése. Ez jelentheti a tiszta hangok esetében egyetlen frekvencia, a komplex hangoknál pedig több frekvencia kinyerését. Láttuk azt is, hogy az alaphártya működésének milyen mechanizmusai képesek ezt megvalósítani. Az alábbiakban ugyanezt a frekvenciaszelektív működést fogjuk megvizsgálni, de most nem a biológiai, hanem a pszichológiai, viselkedéses jelenségek felől közelítünk a problémához.
181 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
2.1. A zajelfedés A hallórendszer frekvenciaszelektivitását vizsgáló kísérletekben gyakran alkalmazzák a maszkolásnak (elfedésnek) nevezett módszert. Említettük már, hogy a háttérzaj elfedi a hangokat, vagyis zaj jelenlétében a hangok nehezebben detektálhatók. Kicsit szabatosabban fogalmazva, az elfedés azt jelenti, hogy a tiszta hangok észlelési küszöbe zaj jelenlétében megemelkedik. Az elfedési kísérletekben a legtöbb esetben két hangingert használnak: egy tiszta hangot, amelyet gyakranjelnek neveznek, és egy komplex hangot, amely általában egy sávszűrt zaj. A kísérletekben a résztvevők feladata általában az, hogy észrevegyék (detektálják) a zajjal együtt bemutatott jelet. A kísérletek általános eredménye az, hogy egy hangot egy olyan zajjal lehet a legjobban elfedni, amely tartalmaz a tiszta hangéhoz hasonló vagy azzal megegyező frekvenciát. Az elfedés tehát úgy jön létre, hogy a hallórendszer nem képes megkülönböztetni egymástól a jelet és az elfedő hangot. Az elfedés tehát a fül frekvenciafelbontási képességének határairól mond valamit. Az elfedés mértékét alapvetően két tényező befolyásolja: egyrészt a zaj nagysága (minél nagyobb a zaj, annál nagyobb az elfedés), másrészt az, hogy a tiszta hanghoz képest milyen frekvenciák találhatók a zajban. Ez utóbbit érdemes egy kicsit részletesebben áttekintenünk. Mint tudjuk, a zajra mint komplex hangra az jellemző, hogy sok különböző frekvenciát tartalmaz. Ha a zaj valamennyi hallható frekvencián tartalmaz hangenergiát, akkor széles sávú zajnak nevezzük. A 9.5. ábra szemlélteti a széles sávú zaj energiatartományát. Az ábra vázlatosan szemlélteti az egyes frekvenciákon található energiamennyiséget, amely, mint látható, a széles sávú zaj esetében egy minden frekvenciára kiterjedő trapézalakot vesz fel. Ez lényegében egy leegyszerűsített spektrális ábrázolása a hangoknak, és arra hívja fel a figyelmet, hogy jelen esetben nem a hangok idői változása érdekel bennünket, hanem az, hogy a hangok és a zajok milyen frekvenciákon szólalnak meg. A széles sávú zaj két paraméter mentén módosítható, a sávszélesség és a középfrekvencia mentén. A sávszélesség, vagyis a zaj frekvenciatartománya különböző szűrési eljárásokkal módosítható, és így úgynevezett sávszűrt zaj hozható létre. A sávszűrt zajból bizonyos mértékben alacsony és magas frekvenciák is hiányoznak. Az ilyen típusú zajra az jellemző, hogy más minőségű és egyben csökkent erősségű lesz. A 9.5. ábra mutat olyan sávszűrt zajokat, amelyek különböző szélességűek, de ugyanolyan középfrekvenciával rendelkeznek. A középfrekvencia a zaj középpontjára, pontosabban a zaj frekvenciaeloszlásának középpontjára vonatkozik. A 9.5. ábra illusztrálja azt, hogy hogyan változik a sávszűrt zaj, ha sávszélességét állandóan tartjuk, de a középfrekvenciát változtatjuk. Ahogy látható, a középfrekvencia változtatása lényegében azt jelenti, hogy a zajt szimbolizáló trapézt a vízszintes frekvenciatengely mentén jobbra vagy balra elmozdítjuk. Mindezek után most már megvizsgálhatjuk azt, hogy milyen hatással vannak a különböző típusú zajok a tiszta hangok detektálására.
182 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
9.5. ábra. A zaj akusztikus energiatartalmának vázlatos ábrázolása. Az egyes grafikonokon a sötét terület az energiamennyiséget jelöli Az első elfedéssel kapcsolatos kísérleteket Fletcher (1940) végezte, aki a tiszta hangok detekciós küszöbét vizsgálta sávszűrt zajok szélességének függvényében. A zaj középfrekvenciája minden esetben megegyezett a detektálandó jel frekvenciájával, és a zaj sávszélességét változtatták. Az eredmények azt mutatták (lásd 9.6. ábra), hogy minél szélesebb tartományú volt a zaj, vagyis minél több frekvencián tartalmazott hangenergiát, annál hatásosabban fedte el a jelet, vagyis annál hangosabbnak kellett lennie a jelnek, hogy észrevehető legyen.
9.6. ábra. Egy zajelfedési kísérlet eredménye. A kísérletben egy 2000 Hz-es hangot kellett detektálni egy 2000 Hz-es középfrekvenciával rendelkezô és egyre szélesebb sávú elfedô zaj mellett. Látható, hogy az elfedő zaj sávszélességének növelése hatására a hang detektálásának küszöbe egyre magasabb lett, de kb. 75 dB felett már nem nőtt tovább (Schooneveldt–Moore 1989 nyomán) Fletcher kísérletének egy másik fontos eredménye az volt, hogy a zaj sávszélességének változtatása csak egy bizonyos mértékig volt hatásos: egy szintet elérve hiába növelte a sávszélességet, ugyanakkora maradt a jel 183 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang küszöbe. Ráadásul, ahogy az ábrán látható, ez a felső szint jóval a hangosság észlelésének felső korlátja (a 130 dB-es fájdalomküszöb) alatt volt. Vagyis ezt a platót nem az okozta, hogy ennél hangosabb hangokat már nem képes a hallórendszer feldolgozni, hanem úgy tűnik, hogy a széles sávú zajnak csupán egy korlátozott részlete járul hozzá a tiszta hang elfedéséhez. Ezt a tartományt kritikus sávnak nevezzük.
2.1.1. A kritikus sávok Fletcher az elfedési kísérletek eredményeinek és a kritikus sávok létezésének magyarázatára a hallórendszer működésének új modelljét javasolta. Eszerint a hallórendszer úgy képzelhető el, mint egy a teljes hallható frekvenciatartományt lefedő és egymást átfedő sávszűröket tartalmazó készlet (lásd 9.7. ábra). Minden egyes szűrő egy meghatározott frekvenciatartományt kódol, mégpedig a sávszűrés elve alapján. Eszerint minden szűrő csak a rá jellemző frekvenciasávot engedi át, a spektrum többi részét pedig levágja. Ezzel a viszonylag egyszerű elvvel érhető el az, hogy a teljes frekvenciatartományt összetevőire bontsuk fel, és attól függően, hogy hány és milyen sávszélességű szűrők állnak rendelkezésre, változtatható a felbontás pontossága. Ezeket a sávszűrőket hallási szűrőknek nevezzük, a modellt pedig a hallórendszer hallásiszűrő-modelljének. Az elfedési helyzetekben Fletcher feltételezése szerint a hallási szűrők a következőképpen működnek. Amikor egy jelet szeretnénk detektálni zajos háttérben, akkor egy olyan hallási szűrőt használunk, amelynek középfrekvenciája közel esik a jelhez. Ez a szűrő úgy működik, hogy átengedi a jelet, de a zaj nagy részét – a szűrőn kívül eső tartományokat – levágja. Emiatt a jel elfedésére a zajnak csak az a része használható fel, amelyet a hallási szűrő átengedett. Ha most, mint ahogy az eredeti kísérletben láttuk, elkezdjük növelni a zaj sávszélességét, akkor egyre több zaj fog átjutni a szűrőn, és egyre több zaj képes elfedni a jelet. Abban a pillanatban azonban, ahogy a zaj sávszélessége átlépi a szűrőét, további tartományok hozzáadása már nem lesz hatással az elfedésre, és így létrejön a jellegzetes plató az elfedési görbén. a kritikus sáv nemcsak az elfedéshez szükséges frekvenciatartományt határozza meg, hanem arra is utal, hogy a hallási szűrőnek milyen a sávszélessége. Láthattuk, hogy a zaj effektív sávszélessége megegyezik a szűrő sávszélességével. Eszerint az elfedési kísérlet révén meghatározható a hallási szűrők sávszélessége, vagyis kritikus sávja is. Így tehát a kritikus sáv kétféle értelemben használható: egyrészt az elfedő zaj effektív sávszélességét, másrészt pedig a hallási szűrő sávszélességét jelezheti.
9.7. ábra. A hallórendszer hallásiszűrő-modellje. Az ábra felsô része a bejövő hangok spektrumát jelzi, ahol az egyenes vonalak az adott frekvenciájú hangokat jelőlik. Az ábra alsó része a feltételezett hallási szűrőket mutatja, amelyek haranggörbe alakúak, és a középfrekvenciától függően eltérô sávszélességgel rendelkeznek
2.2. A hallási szűrök A kritikus sávokkal kapcsolatban Fletcher klasszikus munkája óta sok ismeret halmozódott fel. Az egyik legfontosabb adalék a kritikus sávok alakjával kapcsolatos. Eredetileg azt feltételezték, hogy létezik egy töréspont az elfedési görbén, ami a kritikus sáv határát jelöli ki. Ez az elképzelés azon alapult, hogy a hallási szűrőket téglalap alakúnak tartották, vagyis olyannak, hogy mind az oldaluk, mind a tetejük (a szűrő szélessége) egyenes. Ma már tudjuk, hogy a hallási szűrő sokkal inkább haranggörbe alakú. Hogyan lehet ezt meghatározni, és mi a jelentősége a frekvenciaszelektivitás szempontjából? Patterson (1976) elfedési módszere a hallási szűrő alakjának meghatározására alkalmazható. Az eljárás során egy állandó frekvenciájú tiszta hangot és egy széles sávú, a tiszta hanggal megegyező középfrekvenciájú zajt alkalmaztak. A zajt speciális módon, úgynevezett lyukszűrővel szűrték, ami azt jelenti, hogy nem a felső és alsó frekvencia- sávokat vágták le, és a középső sávot hagyták meg, hanem éppen fordítva, a középső sávot vágták ki, és a két szélsőt hagyták meg. Ezt a 9.8. ábra szemlélteti. A kísérlet során a szokásos elfedési vizsgálatokhoz 184 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang hasonlóan változtatták a zaj középső tartományának szélességét (azaz a „lyuk” nagyságát), és ennek függvényében mérték a jel küszöbét. Egy ilyen lyukszűrt zaj esetében minél nagyobb a lyuk, annál kevesebb zaj kerül a hallási szűrőbe, és annál kisebb az elfedés, vagyis annál jobban csökken a jel küszöbe. Az ábrán a besatírozott terület nagysága jelzi az átkerülő zaj mértékét.
9.8. ábra. Patterson elfedési módszere a hallási szűrő alakjának meghatározására Ha ezek után fokozatosan növeljük a lyuk nagyságát, és mérjük a jel küszöbét, akkor azt kapjuk, hogy a küszöb egyre alacsonyabb lesz, ahogy a lyuk szélesedik. Vagyis, kezdetben, a lyukszűrő nélküli zajnál a hangnak nagyon hangosnak kell lennie, hogy észrevegyük, de ahogy növeljük a lyuk nagyságát a zaj frekvenciatartományának közepén, úgy hallunk meg egyre halkabb hangokat is. A küszöbnek a lyuk szélessége függvényében történő változásából különböző matematikai módszerekkel meg lehet határozni a hallási szűrő alakját, és a legtöbb vizsgálatban azt kapják, hogy a hallási szűrő legömbölyített csúccsal és meredek lejtéssel rendelkezik (lásd 9.9. ábra).
9.9. ábra. Egy tipikus hallási szűrő alakja. Az ábrán feltüntettük a hallási szűrő eredetileg feltételezett téglalapalakját Hogyan értelmezhető a hallási szűrőnek ez a speciális alakja? Egyrészt a szűrő csúcsos és nem egyenes vonalú maximummal rendelkezik. Ezt azt jelenti, hogy nagyon érzékenyen reagál a frekvencia kismértékű megváltozására, hiszen a középfrekvenciánál csak kismértékben kisebb vagy nagyobb frekvencia már kisebb küszöbbel rendelkezik, mint a középfrekvencia. Másrészt a szűrő oldala nem hirtelen, merőlegesen, hanem bizonyos meredekséggel csökken. Ennek következménye az, hogy a szűrő válasza nem egyik frekvenciáról a másikra, hirtelen változik meg, hanem fokozatosan. A hallási szűrő másik nagyon fontos jellemzője az alakján kívül az, hogy mekkora a sávszélessége. A Pattersonféle lyukszűrőt alkalmazó módszerrel megállapítható, hogy a hallási szűrő sávszélessége (vagyis az a frekvenciatartomány, amelyre válaszol) 50 és 2000 Hz között változik. De ami ennél is fontosabb, a sávszélesség szisztematikusan változik: alacsony frekvenciák esetében kicsi, magas frekvenciák esetén viszont nagy. Ez az összefüggés valójában már a hallási- szűrő-modell ábráján (9.7. ábra) is látható volt: a magasabb frekvenciák szűrői sokkal „szélesebbek” voltak, vagyis sokkal nagyobb frekvenciatartományt fogtak át, az alacsonyabb frekvenciák esetében viszont a szűrők „keskenyebbek”, azaz kisebb frekvenciatartományt dolgoznak fel.
185 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang Milyen hatása van ennek a hangok észlelésére? Az eltérő sávszélesség értelmezhető úgy, mint eltérő érzékenység: minél kisebb a sávszélesség, annál jobb az érzékenység, hiszen annál kevesebb egyéb frekvenciát dolgoz fel az adott szűrő. Eszerint az alacsony frekvenciájú, vagyis mély hangok esetében sokkal jobb az érzékenység, mint a magas hangok esetében, és ennek az a következménye, hogy a mély hangokat sokkal jobban meg tudjuk különböztetni, mint a magasakat. A hangmagasság észlelésekor még visszatérünk erre a problémára. Bármilyen pontosan határozzuk is meg a hallási szűrő formáját és működését, azt nem szabad elfelejtenünk, hogy a szűrő csupán egy elméleti modell, amelynek felhasználásával megfelelően magyarázhatók a pszichoakusztikai kísérletek eredményei. Ugyanakkor a hallórendszer leegyszerűsítése különböző középfrekvenciával rendelkező szűrők csoportjára két szempontból is jelentős. Egyrészt, a számítógépes hangfeldolgozásban nagyon hasznos egy ilyen típusú modell használta (lásd a szövegdobozt az mp3 formátumról). Másrészt, a hallórendszer élettani működése párhuzamba állítható a szűrőkkel. Nézzük meg, hogy hogyan értelmezhető a belső fül frekvenciaszelektivitása a hallási szűrőelmélet fogalmainak segítségével.
2.3. A frekvenciaszelektivitás eredete – a hallóidegrostok hangolási görbéje A 8. fejezetben bemutattuk azt, hogy az alaphártya szőrsejtjeihez kapcsolódó hallóidegrostok milyen válaszjellemzőkkel rendelkeznek. Szó volt arról, hogy az idegrostok mindegyike egy bizonyos frekvenciára, a rost jellemző frekvenciájára reagál a legérzékenyebben. Ésszerű feltételezésnek tűnhet, hogy az elfedési kísérletek eredményei valamilyen módon magyarázhatók a hallóidegrostok hangolási görbéinek figyelembevételével. Lássuk, hogyan. Az elfedési kísérletben alkalmazott tiszta hang hatására egy olyan hallóidegrost aktiválódik, amelynek jellemző frekvenciája megegyezik a teszthangéval. Ez a rost ugyanis a legérzékenyebb a vizsgált frekvenciára, és ennek a rostnak az aktivitása vezet a küszöbintenzitású tiszta hang észleléséhez. A rostot természetesen a zaj is aktiválja, amennyiben a zaj olyan frekvenciákon is tartalmaz energiát, amelyre a rost válaszol. A zaj jelenléte megemeli a hallóideg háttértevékenységét, és a jel detektálásához ettől a háttértől kell elválasztanunk. Ehhez az kell, hogy a jel erőssége nagyobb legyen, mint a zajé. Ha növelni kezdjük a zaj sávszélességét, akkor az idegi háttértevékenység egyre nő, és a jelet egyre nehezebb elválasztani ettől. Egy bizonyos pont után azonban az egyre nagyobb sávszélesség már olyan frekvenciákat is tartalmaz, amelyek kívül esnek a rost frekvenciahangolási görbéjén, és így nem gyakorolnak további hatást annak háttéraktivitására. Ettől kezdve a küszöb nem emelkedik tovább, és az elfedés mértéke változatlan marad. Ezt az okfejtést követve azt mondhatjuk, hogy az elfedési görbe töréspontja (lásd 9.6. ábra) szabja meg a tiszta hang észrevételében szerepet játszó rostok frekvenciatartományát, vagyis kritikus sávját. Eszerint a hallóideg frekvenciaszelektív működése felfogható a hallási szűrők működéséhez hasonlóan: valójában a rostok a frekvenciatartomány egy bizonyos részére reagálnak leginkább, és ez felfogható úgy, mint az adott frekvenciára vonatkozó sávszűrés. Érdemes megjegyeznünk, hogy a hallás esetében a kritikus frekvenciák megléte nagyon hasonlít ahhoz, amit a látás esetében a téri frekvenciák kapcsán láttunk. Ha visszagondolunk, a téri frekvenciáknál is arról van szó, hogy a vizuális információt le lehet írni több különböző frekvenciájú szinuszráccsal, és úgy tűnik, hogy a látórendszer rendelkezik olyan neuronokkal, amelyek specifikusan reagálnak az egyes téri frekvenciákra. Egy fontos különbség azonban lehet a látó- és a hallórendszer között, nevezetesen az, hogy a látórendszerben a különböző téri frekvenciákra reagáló neuronok a látási információ feldolgozásának magas szintjén találhatók, a hallórendszerben viszont nagyon alacsony szinten, lényegében a transzdukciót végző neuronok szintjén vannak. Eddig olyan elfedési kísérletekkel foglalkoztunk, amelyekben az elfedő zaj sávszélességét változtatták. Ahogy azt fentebb láttuk (lásd 9.5. ábra), a sávszűrt zajnak egy másik paraméterét is lehet változtatni, mégpedig a középfrekvenciáját. Az eddigiek fényében nagyjából kitalálható, hogy milyen eredményeket kaptak a kutatók. Tegyük fel, hogy a kísérletet egy olyan sávszűrt zajjal kezdjük, amelynek a középfrekvenciája jóval a teszthang frekvenciája alatt van. Ekkor természetesen a zaj energiájának egyetlen részlete sem ingerli a vizsgált hangot feldolgozó idegrostot, vagyis semmilyen elfedő hatás nem jelentkezik (habár a zaj maga hallható). Ahogy fokozatosan növeljük a zaj középfrekvenciáját, az egyre inkább bekerül az idegrost kritikus sávjába, és emiatt a küszöb elkezd csökkenni. Az elfedés akkor lesz a legnagyobb, ha a teszthang és a zaj középfrekvenciája egybeesik. Ha ezután még tovább növeljük a zaj középfrekvenciáját, akkor megint csak azt tapasztaljuk, hogy az elfedés egyre csökken. a középfrekvencia és a küszöb összefüggését grafikonon ábrázolva egy fordított U alakú görbét kapunk. Az ilyen típusú ingerek alkalmazása tehát szintén a kritikus sáv elméletét támasztja alá.
186 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang összefoglalva, a kritikus sávok elmélete szerint a tiszta hangokat az egyes frekvenciákra hangolt idegi folyamatok révén észleljük. számos, az elfedési paradigmát alkalmazó vizsgálat eredménye szerint a zajnak akkor van hatékony elfedő hatása, ha a vizsgált hanghoz közeli frekvenciákat tartalmaz. Ráadásul az eredményül kapott elfedési görbék a hallóidegrostok hangolási görbéire emlékeztetnek, amiből arra lehet következtetni, hogy a kritikus sávokat megvalósító idegi mechanizmusok legalábbis részben a hallóidegrostok működésén alapulnak.
11.1. táblázat HOGYAN MŰKÖDNEK AZ MP3-AS FÁJLOK? Az mp3 mozgalom a zenei ipar egyik legnagyobb hatású jelensége. Ez a mozgalom a többitől (hangkazetta, CD) eltérően nem az iparágból magából nőtt ki, hanem az Internet zeneimádó közössége indította el. Az mp3 formátum, ami nem más, mint a hangok digitalizált, számítógépen tárolható és megosztható adathordozója, óriási hatással volt és van napjainkban is arra, ahogyan az emberek a zene hallgatásához hozzáállnak. Az mp3 fájlok lényegét természetesen maga az mp3 formátum adja. A formátum egy digitális hangkódoló és egy tömörítő eljárást tartalmaz. Ilyen értelemben nagyon hasonlít ahhoz, ahogyan a CD tárolja a hangot: nevezetesen az analóg (folyamatos) hang digitális (diszkrét) formába történő átalakításával. A hangok digitalizálása azt jelenti, hogy a hanghullámokat számokká alakítjuk át, mégpedig úgy, hogy ahelyett, hogy az egész hullámformát rögzítenénk, annak csak egyes részeit tároljuk el. Tudjuk, hogy minden hang leírható az egyes időpillanatokban mutatott légnyomásváltozás mértékével. A hanghullám digitalizálása úgy valósítható meg, hogy bizonyos időpillanatokban mintát veszünk belőle, azaz megnézzük, hogy adott pillanatban milyen hangnyomásértéket mutat. Ezt nevezzük mintavételezésnek (lásd ábra). Minél gyakoribb a mintavételezés, annál pontosabban tudjuk leképezni az adott hanghullámot. CD-k esetében a megfelelő hangzás elérése érdekében meglehetősen nagy mintavételezési frekvenciával dolgoznak, másodpercenként 44 100-szor „olvassák le” a hangnyomás értékét. Ez természetesen azt jelenti, hogy másodpercenként 44 100 szám keletkezik, amelynek a tárolása elég nagy kapacitást igényel. Az mp3 ezen az óriási tárolási kapacitáson segít, méghozzá úgy, hogy egy meglehetősen bonyolult tömörítési eljárást (kódolást) alkalmaz. Ennek segítségével valódi minőségvesztés nélkül körülbelül tizedére csökkenhet a szükséges kapacitás. Az mp3 valódi érdekessége pszichológiai szempontból az, hogy a tömörítés során pszichoakusztikai elveket is figyelembe vesznek. Például azt, hogy a hangosabb hangok elfedik a halkabbakat, ezért a halkabbakat nem is kell kódolni. Az alábbiakban a teljesség igénye nélkül összefoglalunk néhány olyan elvet, amelyet az egyes mp3 kódolóeljárások rutinszerűen alkalmaznak. Szürőkészlet • Az mp3 kódolás alapja az, hogy a hanghullámokat frekvencia-összetevőikre bontják, és ezeket külön-külön kezelik a kódolás során. Láthattuk, hogy a hallórendszer hallásiszürő-modellje szerint az emberi hallás is így működik. Minimális hallási küszöb • Tudjuk, hogy a különböző frekvenciákkal rendelkező hangok hallási küszöbe nem azonos (lásd hallhatósági függvény). A kódolás során ezt úgy használják ki, hogy a nem hallható frekvenciákat nem kódolják. Ez meglehetősen „drasztikus” is lehet, mivel egyes eljárások csak a 2-5 kHz közötti frekvenciatartományt veszik figyelembe, de ezt valójában nem vesszük észre (pontosabban az „átlagos” zenehallgatónak nem tűnik fel). Sztereo • Ahogyan azt a hanglokalizációról szóló fejezetben látni fogjuk, a különböző frekvenciájú hangok lokalizációja nem egyformán jó. Általában a nagyon mély és nagyon magas hangok esetében nem tudjuk pontosan lokalizálni a hangok forrását. Ezt a hatást a kódolásban úgy lehet felhasználni, hogy az ezekben a frekvenciatartományokban található hangokat nem két, hanem csak egy csatornán kódolják (sztereohang úgy jön létre, hogy két külön csatornát használnak a jobb és a bal fülbe szánt hangok számára, és ez természetesen duplaannyi információ kódolását teszi szükségessé). Vagyis, egy nagyon magas vagy nagyon mély hangot elég csak az egyik fül számára megszólaltatni. Mivel úgysem vagyunk képesek pontosan lokalizálni ennek forrását, nem fog feltűnni, hogy valójában csak az egyik fülünkkel hallottuk. Az mp3 formátum kialakítása során a mérnökök arra törekedtek, hogy kompromisszumot valósítsanak meg a tömörítés és a minőség között: minél nagyobb tömörítéssel minél kisebb minőségvesztés elérése volt a cél. A hang minősége azonban szubjektív kategória, és ezért a megfelelő kódolás elérése érdekében nagyon sok pszichoakusztikai vizsgálatot végeztek, ahol a személyeknek a hangok minőségét kellett megítélniük. Gyakorlatilag tehát minden elvet, amelyet a kódolás során felhasználtak, empirikusan is ellenőrizték, és csak 187 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang azokat tartották meg, amelyeknél a kísérleti személyek nagy része nem tudott különbséget tenni az eredeti és a kódolt hang között. Összefoglalásként azt mondhatjuk, hogy az mp3 formátum kialakításában nagyon fontos szerepe volt mindannak a tudásnak, amit az emberi hallórendszer működéséről tudunk. Ezért amikor legközelebb kedvenc számunkat hallgatjuk számítógépünkön vagy mp3 lejátszónkon, jusson eszünkbe, hogy ezekbe a pici fájlokba mennyi pszichológiai ismeret van beépítve.
A hangdigitalizálás folyamata. A folyamatos vonal jelzi a hang időben változó amplitúdóját. Az oszlopok a mintavételezést mutatják, és az x tengelyen látható számok az adott idői tartományban található átlagos amplitúdóértéket jelzik. Látható, hogy a mintavételezés során bizonyos információk elvesznek, és minél nagyobb a mintavételezési frekvencia (vagyis minél szélesebbek az oszlopok), annál több információ vész el
3. A hangmagasság észlelése A hangok azonosítása és ezáltal az akusztikus világ megismerése a hangmagasságon alapul, ezért a hangok jellemzői közül ezt tekinthetjük a leglényegesebbnek. Ez azt is jelenti, hogy a hangmagasság feldolgozása a legbonyolultabb a hang jellemzői közül. A bonyodalmak ott kezdődnek, hogy nehéz pontosan meghatározni, mi is a hangmagasság, mivel ez is, hasonlóan a hangossághoz, szubjektív élményt jelöl. Ugyanakkor, miként a hangosság szubjektív észlelését a hangerő fizikai változásaihoz tudjuk kapcsolni, a hangmagasság esetében is van egy olyan fizikai jellemző, amelynek megváltozása a hangmagasság észlelésében is eltéréshez vezet, ez pedig a frekvencia. A frekvencia és a hangmagasság közötti kapcsolat korántsem olyan egyszerű, mint a hangerő és a hangmagasság közötti: azonos frekvencia esetén is lehet eltérő az észlelt hangmagasság, és eltérő frekvencia is észlelhető azonos hangmagasságként. Ráadásul nem mindegy, hogy tiszta vagy komplex hangok hangmagasságáról van-e szó. A tiszta hangok esetében viszonylag egyszerű a frekvencia és a hangmagasság közötti viszony, a komplex hangok esetében viszont meglehetősen bonyolult. Annak ellenére, hogy a komplex hangok teljesen egyértelmű hangmagasságélménnyel járnak együtt (lásd a zongora C és D hangja), nem világos, hogy a hangot alkotó sok frekvencia-összetevő közül melyik szolgál a hangmagasság alapjául. Azt mondhatjuk tehát, hogy nincs egy az egyhez megfelelés a frekvencia és a hangerő között. A hangmagasság mindezek alapján úgy definiálható, mint a hallásnak az a jellegzetessége, amelynek alapján a hangok a mélyektől a magasakig sorba állíthatók. Ha például egy zongorán sorban leütjük az egymás melletti billentyűket, akkor egy olyan hangsort hallunk, amelyben az egymást követő hangok egyre magasabb hangmagassággal rendelkeznek. Általában pontosan meg tudjuk mondani, hogy két hang közül melyik rendelkezik nagyobb hangmagassággal. Ez azt is jelenti, hogy a hangmagasság egy egydimenziós skála (csakúgy, mint a hangosság): a hangok egyetlen skála mentén sorba rendezhetők a mélyektől a magasakig.
3.1. A hangmagasság skálázása A hangmagasság skálázásával kapcsolatban a legtöbbször a hangok frekvenciáját veszik figyelembe, amit, ahogy már láttuk, Hz-ben mérünk. A frekvencia azonban csak a tiszta hangok magasságát jelölheti, mivel a komplex hangoknál (vagy akár a zajoknál) egyszerre több frekvencia-összetevő is jelen van. A fejezet további részében ezért elsősorban azzal fogunk foglalkozni, hogy a komplex hangok hangmagasságát mi határozza meg. Több próbálkozás is történt szubjektív hangmagasságskálák létrehozására. Az egyik ilyen az úgynevezett melskála. Egy 1000 Hz-es tiszta hang értéke definíció szerint 1000 mel, egy ennél kétszer magasabb hangé 2000 mel, és a feleolyan magasé 500 mel. A hangok melskálán történő besorolása egy olyan szubjektív skálázási eljáráson alapul, amelynek során a kísérleti személyektől a különböző hangmagasságú hangok összehasonlítását 188 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang kérik. Azt kell tehát meghatározni, hogy pontosan milyen magas is az a hang, ami kétszer olyan magas, mint amit az előbb hallottam. A melskála, talán éppen amiatt, hogy nem képes egyértelmű viszonyokat megragadni, nem igazán terjedt el a pszichoakusztikai szakirodalomban. Egy másik skála már jóval sikeresebbnek mondható, és ez a zenei hangmagasságskála. A zenei hangmagasságskála a zenei hangok sorba állítását teszi lehetővé. A zenei hangok a zenedarabok létrehozására felhasznált, hangszereken lejátszott vagy esetleg elénekelt hangokra vonatkoznak. A zenei hangokat olyan nevekkel illetjük, mint C, D, E vagy dó, ré, mi stb. A zenei skála nagyon jól használható a zenei hangok megragadására, de kizárólag ezekre, hiszen a zenei hangok csak bizonyos meghatározott frekvenciákkal rendelkeznek, egy viszonylag szűk frekvenciatartományon belül (kb. 20-4000 Hz). Például az A4 hang (az úgynevezett „egyvonalas” A hang) 440 Hz-es frekvenciájú, a skálában ezt követő H4 viszont 494 Hz, de nincs olyan hang, amely 450 Hz-es lenne. A zenei skálákról a zenei észlelésről szóló 12. fejezetben még részletesen fogunk beszélni. A továbbiakban áttekintjük, hogy milyen tényezők befolyásolják a tiszta hangok hangmagasságának észlelését, majd megnézzük, hogy milyen idegrendszeri alapjai vannak a hangmagasság észlelésének, végül pedig arra keressük a választ, hogy mi határozza meg a komplex hangok magasságának észlelését.
3.2. A hangmagasság-észlelés elméletei Az alaphártya működése kapcsán már beszéltünk néhány olyan elméletről, amelyek a hangmagasság észlelését és az alaphártya működését kívánták összekapcsolni. Ezek voltak a frekvenciaelmélet, a helyelmélet és az alaphártya működésének ma is teljes mértékben elfogadott elképzelése, az utazóhullám-elmélet. Áttekintettük a hallórendszer frekvencia- szelektív működését magyarázó egyik elképzelést, amely szerint a hallórendszer olyan különböző középfrekvenciával rendelkező szűrők készleteként képzelhető el, amelyek egymást részben átfedve átfogják az egész frekvenciaészlelési tartományt, és különböző frekvenciákat dolgoznak fel (hallási szűrők). Az alábbiakban lényegében ezeket az elméleteket ismételjük át, hiszen ezek mindegyike alapvetően a hangmagasság észlelését magyarázza, és fontos tisztában lennünk azzal, hogy ezek nemcsak az alaphártya működésével és a hangok frekvenciájának feldolgozásával, de a hangmagasság élményének kialakulásával is foglalkoznak. A hangmagasság észlelésével kapcsolatban alapvetően két nagy elmélet létezik: a helyelmélet és az idői elmélet (frekvenciaelmélet). A helyelmélet mai változata szerint a hanginger a belső fülben egyfajta spektrális elemzésen (vagyis frekvencia-összetevőkre való lebontáson) megy keresztül oly módon, hogy a hangot alkotó frekvenciák az alaphártya különböző részeit hozzák mozgásba, ennek révén pedig különböző jellemző frekvenciával rendelkező neuronok jönnek aktivációba. A helyelmélet gyenge pontja, hogy a komplex hangok észlelését nehezen tudja magyarázni. A komplex hangok ugyanis, mivel több frekvenciát tartalmaznak, az alaphártya több pontján is maximális kitérést hoznak létre, ezek közül viszont nem feltétlenül a legnagyobb csúccsal rendelkező vezet a hangmagasság meghatározásához. A későbbiekben még visszatérünk arra, hogy a komplex hangok esetén végül is melyik frekvencia-összetevő vezet a hangmagasság élményéhez, és hogy ennek észlelését hogyan segíti elő az alaphártya. Az idői elmélet a helyelmélettel szemben a hang magasságát a hang által kiváltott neu- rális aktivitás idői mintázatához kapcsolja. Az idői elmélet egyik korai változata volt a frekvenciaelmélet, amely szerint az alaphártya a hang frekvenciájának megfelelően jön rezgésbe, és ez a hallóidegben hasonló mintázatú kisüléseket hoz létre (vagyis egy 1000 hz-es hang hatására másodpercenként 1000-szer rezeg az alaphártya, és ugyanennyiszer sül ki a hallóideg). Az idői elméletek egy modernebb változata a hallóideg aktivitásának fázisszinkronizá- cióján alapul. A fázisszinkronizáció azt jelenti, hogy a hallóideg a hang frekvenciájával, vagyis periódusával szinkronban sül ki. Az előző fejezetben szó volt arról (lásd 241. o.), hogy a hanghullám fázisa azt fejezi ki, hogy egy adott ponthoz képest egy teljes hullámperiódus mekkora része telt el. A hallóideg fázisszinkronizált aktivitása úgy valósul meg, hogy a neuronok tüzelése valamilyen módon időben kapcsolódik a hang bizonyos fázisához, és így gyakorlatilag a periódusokkal együtt tüzel. Ha belegondolunk, akkor ez pontosan azt írja le, mint amit a frekvenciaelmélet: a hallóideg a hang frekvenciájának (periódusváltozásának) megfelelő kisülési mintázatot produkál. A különbség az, hogy a fázisszinkronizáció lehetővé teszi, hogy a kisülések ne minden egyes periódusnál, hanem csak minden másodiknál vagy harmadiknál jelenjenek meg, és így sokkal nagyobb frekvenciák kódolása valósítható meg, mint ahogy azt a frekvenciaelmélet feltételezte. 189 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
3.3. A tiszta hangok hangmagassága A tiszta hangok esetében a hangmagasságot a hang frekvenciája határozza meg. Ezért itt nem is annyira az a kérdés, hogy mi az alapja a hangmagasság észlelésének, hanem inkább az, hogy mennyire lineáris az összefüggés frekvencia és hangmagasság között. A tiszta hangok hangmagasság-észlelése kapcsán is fontos kérdés, hogy mennyire tudjuk megkülönböztetni őket egymástól, vagyis milyen a különbségi küszöbük. A leggyakrabban alkalmazott módszerben két egymást követő, eltérő frekvenciájú hangról kell eldönteni, hogy melyik volt magasabb (ez tehát egy klasszikus konstans ingerek módszere paradigma, lásd pszichofizika). A hangok sorrendjét változtatják, és a legkisebb észrevehető különbséget (vagyis a különbségi küszöböt) annál a frekvenciaeltérésnél „húzzák meg”, ahol a vizsgált személy legalább 75 százalékban helyesen válaszol. A vizsgálatok általános eredménye az, hogy a frekvencia függvényében nő a különbségi küszöb, vagyis minél nagyobb frekvenciájú egy hang, annál nagyobb változásra van szükség ahhoz, hogy eltérő hangmagasságú hangot észleljenek a személyek. Így az 1000 Hz-es hangok esetében körülbelül 2-3 Hz-es változást hallunk meg (azaz például egy 1 Hz-es növekedést nem), 8000 Hz körül ez az érték viszont már 50 Hz körüli. Mindez emlékeztethet bennünket a Weber-törvényre: minél nagyobb az inger kiinduló értéke, annál nagyobb inger kell ahhoz, hogy észleljük a változást. A különbségi küszöb ilyen módon történő alakulása magyarázható az alaphártya frek- venciaszelektív működésével, valamint a hallásiszűrő-elmélettel. Ahogy fentebb már láttuk, kimutatható, hogy az alacsony frekvenciákat feldolgozó hallási szűrők kisebb sávszélességgel rendelkeznek, mint a magas frekvenciákat feldolgozó szűrők. Ebből következően a mély hangokra érzékenyebbek vagyunk, és így a mély hangokat sokkal jobban tudjuk diszkriminálni, mint a magasakat. Úgy tűnik tehát, hogy a hangmagasság különbségi küszöbének változása a hallórendszer alapvető tulajdonságából származik, nevezetesen abból, hogy a magas frekvenciájú hangoknál az alaphártya felbontóképessége rosszabb, mint az alacsony frekvenciájú hangoknál. A tiszta hangok esetében is van a hangmagasság észlelésében néhány olyan jelenség, amely miatt összetett és nem mindig egyértelmű a frekvencia és a hangmagasság közötti kapcsolat. Az egyik ilyen a hangerő hatása: a hangerő növekedésével megváltozik a hangmagasság élménye. Ez az összefüggés meglehetősen komplex: megfigyelték, hogy 2 kHz alatt a nagyobb hangerejű hangot mélyebbnek észleljük, 4 kHz felett viszont a nagyobb hangerő nagyobb hangmagassághoz vezet. A hangmagasság tehát a hangerő függvényében csúszkál. Moore (1997) szerint egyelőre nincs általánosan elfogadott magyarázat a hangmagasság csúszkálására, ezt a hangmagasság észlelésének egyik elmélete sem magyarázza kielégítően. A hangmagasság észlelését a hang időtartama is befolyásolja. Ahhoz, hogy egy hang egyáltalán hangmagasságélményt váltson ki, bizonyos hosszúságúnak kell lennie. Bármilyen furcsának tűnik is, a nagyon rövid hangokat nem egy adott hangmagasságú hangnak, hanem csak egy kattanásnak halljuk. Többnyire már 1015 milliszekundum hanghossz elég ahhoz, hogy észlelni tudjuk a hang magasságát, bár ez nagyban függ a hang frekvenciájától. A magas (nagyobb frekvenciájú) hangokat ugyanis mindig rövidebb idő alatt tudjuk azonosítani. Ennek az lehet az oka, hogy a nagyobb frekvenciájú hangoknál rövi- debb idő alatt is elegendő számú rezgési periódus alakul ki. Minél nagyobb frekvenciájú egy hang, a rezgési periódusok száma annál nagyobb.
3.4. A komplex hangok hangmagassága 3.4.1. Alaphang és felharmonikusok Ahogyan a bevezetőben említettük, a komplex hangok hangmagasságának észlelését elég nehéz magyarázni. Mindennapi tapasztalatunk persze az, hogy a komplex hangok nagyon is jól meghatározható hangmagassággal rendelkeznek: elég csak a zongorára gondolnunk, ahol az egymás után leütött billentyűk egy egészen nyilvánvaló zenei skálát adnak ki, és pontosan meg tudjuk mondani, hogy melyik hang volt magasabb, és melyik mélyebb. Vagyis teljesen természetes számunkra, hogy a zongora hangjai egyértelmű hangmagasságélményt okoznak. Ugyanakkor, ha bevetjük újonnan megszerzett pszichoakusztikai ismereteinket, és belegondolunk abba, hogy mi is okozhatja a zongora hangjainak egyértelmű hangmagasságát, akkor rögtön elbizonytalanodunk. Tudjuk ugyanis, hogy a zongora hangja komplex hang, azaz több frekvencián tartalmaz akusztikus energiát. Azt is tudjuk, hogy a tiszta hangok esetében többé-kevésbé a hang frekvenciája vezetett a hangmagasság élményéhez. Nyilvánvalóan ezt a két ismeretet kellene ötvöznünk a zongora
190 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
3.5. Feldolgozott hangok hangmagasságának megmagyarázása érdekében, de rögtön rá kell jönnünk, hogy ezt nem tudjuk megtenni. Nem tudjuk, hogy melyik az a frekvencia a sok közül, amelyet ki kellene választanunk, és amely a hangmagasság élményéhez vezetne. A komplex hangok akusztikai jellemzőinek leírásakor (lásd 8. fejezet) láthattuk, hogy az azokat alkotó frekvenciákat alapvetően két összetevőre, az alaphangra és a felharmonikusokra bonthatjuk. Az alaphang a legalacsonyabban megszólaló frekvencia, a felharmonikusok pedig ennek egész számú többszörösei. Mivel az alaphang ilyen kitüntetett szerepet játszik (nemcsak hogy a legalacsonyabb frekvencia, de a többi frekvenciát is hozzá viszonyítjuk), logikus lenne feltételezni, hogy valamilyen módon ez járul hozzá a komplex hangok magasságának észleléséhez. Sajnos azonban van egy olyan jelenség, amely megcáfolja ezt az elképzelést, ez pedig a hiányzó alaphang jelensége. A hiányzó alaphang vagy alapfrekvencia jelensége azt jelenti, hogy a komplex hangból kivágott vagy zajjal elfedett alaphang esetében nem változik meg a hang észlelt hangmagassága. Ez arra utal, hogy a komplex hangok hangmagasságát valamilyen sokkal bonyolultabb észlelési mechanizmus révén állapítjuk meg.
3.5.1. A maradványhang Az, hogy a komplex hangok magasságát valamilyen akusztikai paraméter változásához kapcsoljuk, két szempontból is problémás. Egyrészt, a komplex hangok, eltérően a tiszta hangoktól, az alaphártyának nemcsak egy bizonyos pontján okoznak maximális elmozdulást, hanem egyszerre több különböző helyen is. Ráadásul nem feltétlenül a legnagyobb elmozduláshoz kapcsolódó frekvencia lesz az, amely a hangmagasság élményét okozza. Másrészt, a hiányzó alaphang jelensége arra utal, hogy nem feltétlenül az alaphang az, ami a hangmagasság élményét okozza, mivel a hangmagasság akkor sem változik, ha az alaphangot kiszűrjük a hangból. Ahogyan arról már szó esett, a komplex hangok egy alaphangot és annak egész számú többszöröseiből álló frekvenciákat tartalmaznak. Például létrehozható egy olyan hang, amely 200-tól 2000 Hz-ig tartalmaz 400, 600, 800... stb. frekvenciájú összetevőket. Ennek a hangnak a magassága megegyezik egy 200 Hz-es tiszta hang magasság á v a l , mivel a komplex hang alapfrekvenciája is 200 Hz. Ha azonban eltávolítjuk a 200 Hz-es frekvenciát (vagyis az alaphangot), akkor a hang magassága továbbra is meg fog egyezni a 200 Hz-es tiszta hang magasságával, illetve az eredeti, az alaphangot még tartalmazó hangéval. Ami változik, az a hang minősége, vagyis az eredeti és az alaphang nélküli hangokat ösz- szehasonlítva fogunk közöttük eltérést tapasztalni, de mindkettő hangmagasságát ugyanakkorának fogjuk észlelni. Valójában az alaphangon kívül még egy sor frekvenciatartomány kiszűrhető, és ez továbbra sem okozza a hangmagasság megváltozását. Ha módszeresen végigpróbáljuk, hogy mely frekvenciák elvétele vezet a hangmagasság megváltozásához, akkor azt tapasztalhatjuk, hogy szinte az összes alacsony frekvencia kiszűrhető, egészen az 1-1,5 kHz-es tartományig, és a hang még mindig megtartja a magasságát, bár a minősége lényegesen eltérő lesz. Schouten (1940) a magas felharmonikusok (az előző példában az 1 kHz feletti frekvenciák a többi frekvencia nélkül) esetében észlelt mély hangmagasságot reziduálisnak vagy maradványhangnak nevezte. Rámutatott, hogy a maradványhang megkülönböztethető a fizikailag is jelen lévő alaphangtól, ami arra utal, hogy a maradványhang észlelése nem az alaphártya aktivitásától függ. A zajelfedést használó kísérletekben szintén bebizonyították, hogy a maradványhang akkor is hallható, ha egyébként az annak megfelelő frekvenciatartományokat zajjal maszkolják. Mivel tudjuk, hogy a maszkolás lehetetlenné teszi az elfedett hang észlelését, ez arra enged következtetni, hogy a maradványhang nem egy adott fizikai hangnak felel meg. A maradványhangot virtuális hangmagasságnak is szoktuk nevezni. Ez az elnevezés különösen kifejező, mivel utal arra, hogy a hangmagasságot az összetevők sajátosságaitól függően az észlelőrendszer hozza létre.
3.6. A komplex hangok magasságának észlelését magyarázó elméletek A maradványhang észlelése furcsának tűnhet, de valójában a hétköznapokban minden komplex hang esetében ezt halljuk, és ez az ami alapján a hangok magasságát megállapítjuk. A maradványhang észlelését magyarázó elméletek két típusba sorolhatók. Az úgynevezett mintázatfelismerő modellek szerint a komplex hangok magasságát az egyedi felharmonikusok magasságából származtatjuk valamilyen módon. A másik típus, az idői modellek szerint viszont a hallóideg kisülési mintázata vezet a hangmagasság észleléséhez. 191 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
3.6.1. A mintázatfelismerő modellek A mintázatfelismerő modellek szerint a komplex hangok magasságának észlelése két lépésben történik. Elsőként a bejövő akusztikai információ frekvenciaelemzését végezzük el, vagyis a hang egyedi frekvenciatartományainak meghatározását. A második lépésben egy mintázatfelismerő rendszer az egyedi frekvenciatartományok alapján meghatározza a hang magasságát. Az első lépés nem kíván különösebb magyarázatot, hiszen tudjuk, hogy az alaphártya alapvető feladata az, hogy a hangokat frekvencia-összetevőikre bontsa le, és azt is jól tudjuk, hogy miként képes ezt az alaphártya megtenni (lásd az alaphártya működésének elméleteit). A második azonban némi kiegészítésre szorul, hiszen egyelőre csak annyit mondtunk ezzel kapcsolatban, hogy valószínűleg létezik egy olyan rendszer, amely a mintázatfelismerést megvalósítja, és valamilyen módon a frekvenciamintázatok alapján kinyeri a hang magasságát. Goldstein (1973) elképzelése szerint például a következőképpen működhet a mintázatfelismerő rendszer. A rendszer a komplex hangot alkotó frekvenciákon dolgozik, ezeket egy hely- vagy időmechanizmus nyeri ki az alaphártya szintjén az ingerből. A felismerő lényegében azt csinálja, hogy megpróbálja a kinyert harmonikusoknak legjobban megfelelő alaphangot rekonstruálni, vagyis ez valamilyen matematikai művelet eredménye lenne. Tudjuk, hogy a felharmonikusok az alaphang egész számú többszörösei. így ha például az elemzett hang egy 1836, 2040 és 2244 Hz-es harmonikust tartalmaz, akkor a rendszer megpróbálja megtalálni azt a frekvenciaértéket, amely mindhárom harmonikus egész számú osztója. Kis számolással kideríthetjük, hogy ez az érték a 204 Hz, és ennek a 9., 10. és 11. harmonikusa lenne a fenti három frekvencia. Természetesen, mint azt fentebb láttuk, a hallórendszer frekvenciákra való érzékenysége nem ennyire nagy, ezért „kerekítések” elképzelhetők. A fenti példa esetében valószínűleg az 1840, 2040 és 2240 Hz-es harmonikusok is a 204 Hz-es hangmagasság érzetét okoznák. Ráadásul kétértelmű szituációk is adódhatnak, például olyan esetben, amikor a harmonikusok egynél több alaphang eltérő egész számú szorzataiként jönnek létre. Valóban vannak olyan kísérleti eredmények, amelyek szerint egy adott felharmonikus kombináció eltérő hangmagasságélményt váltott ki a különböző kísérleti személyekből. Az esetek nagy részében azonban a mechanizmus jól működhet. (Érdekes lehet elgondolkodni azon, hogy vajon ezek a személyek közötti eltérések milyen szubjektív élménybeli eltéréseket okoznak. Gondoljunk csak bele abba, hogy ha már ezen a nagyon alacsony szinten, egyetlen komplex hang feldolgozásakor is eltérések vannak az emberek között abban, hogy milyen hangmagasságot észlelnek, milyen óriási különbségek lehetnek akkor, amikor egy több hangszeren lejátszott és több száz hangból álló zenei darabot hallgatnak!) A mintázatfelismerő modellek szerint létezik egy fontos korlátja a hangmagasság észlelésének. Nevezetesen, a maradványhang csak akkor nyerhető ki egy komplex hangból, ha az tartalmaz olyan frekvenciakomponenseket, amelyek „kihallhatók” a teljes hangból. A vizsgálatok szerint azok a komponensek hallhatók ki, amelyek kb. 5 kHz alattiak, és csak akkor hallhatók ki, ha nincs belőlük túlságosan sok. Körülbelül 20 harmonikus felett ugyanis csak egy meghatározhatatlan hangmagasságú zaj hallható.
3.6.2. Az idői modellek A komplex hangok hangmagasság-észlelésének idői modelljei egészen más megközelítést alkalmaznak. Schouten (1940) szerint az alaphártya tüzelési mintázataiból érdemes kiindulni. Tudjuk, hogy a komplex hangok harmonikusai az alaphártya különböző helyein dolgozódnak fel, és eltérő kisülési mintázatot váltanak ki a szőrsejtekben. Ezek a kisülési mintázatok az egyes harmonikusoknak, nem pedig az egész hangnak feleltethetők meg. Ha visszaemlékszünk, a hangmagasság feldolgozásának idői elmélete szerint a hangok frekvenciája egy a frekvencia periodikus változásának megfelelő kisülési mintázatot vált ki a hallóidegben (például minden fázis kezdetekor van egy kisülés-fázisszinkronizáció). Vagyis az alaphártya meghatározott helyein található szőrsejtek egy ilyen periodikus kisülést mutatnak, akkor is, ha csak egy egyszerű, egyetlen frekvenciából álló hang rezeg- teti meg az alaphártyát, és akkor is, ha egy több frekvenciából álló komplex hang. A komplex hangok feldolgozása esetén az alaphártya különböző helyein aktiválódó és különböző fázisszinkronizált aktivitást mutató idegsejtek kisülési mintázatai interakcióba léphetnek egymással, és átfedhetik egymást. Vagyis bizonyos időpillanatokban az idegsejtek egyszerre aktiválódnak (9.10. ábra). Az izgalmas dolog mindebben az, hogy úgy tűnik, ezek az átfedések leképezik az eredeti komplex hang periodicitását, vagyis az átfedések az alaphanggal, pontosabban a maradványhanggal szinkronban jönnek létre. Ez azt jelenti, hogy függetlenül attól, hogy jelen van-e az alaphang vagy sem, találunk egy olyan aktivitásmintázatot, amely a maradványhanggal van szinkronban. Ily módon az idői modellek is képesek megmagyarázni a hiányzó alaphang észlelését. Fontos kiemelnünk a fenti két elmélet között egy lényegi különbséget, ami abból fakad, hogy a hallási feldolgozás mely szintjére helyezik a hangmagasság élményének kialakulását. Mint láttuk, a mintázatfelismerő modellek különböző bonyolult számításokat tételeznek fel a maradványhang megállapítása során. A számítások vagy komputációk alapvetően központi idegrendszeri, azaz centrális folyamatok lennének, amelyek a 192 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang hallórendszer alacsonyabb szintjei által már feldolgozott információt használnák fel. Ezzel szemben az idői modellek a hallórendszer alacsony szintjén, valójában az alaphártya és a szőrsejtek szintjén működő periferiális folyamatokat tételeznek fel, és azt tartják, hogy a hangmagasság élménye már ezen az alacsony szinten kialakul.
3.6.3. Kísérleti bizonyítékok a két elmélet mellett A két modell kapcsán nagyon sok kísérleti eredmény született, amelyeknek alapvető konklúziója az, hogy mindkét elmélet mellett hozhatók fel bizonyító és cáfoló adatok. A kísérleti eredmények egyik csoportja azt mutatja, hogy akkor is egyértelmű hangmagasság észlelhető, ha a felharmonikusok nem hallhatók ki a hangból (például mert túl sok van belőlük, vagy túl magasak). A mintázatfelismerő elméletek szerint ez nem lehetséges, mivel a maradványhang a kinyert harmonikusok alapján számítható csak ki, és ha nem tudjuk kinyerni a harmonikusokat, akkor nem jön létre hangmagasságélmény. Moore és Rosen (1979) ezt egy olyan kísérlettel bizonyította, ahol olyan komplex hangokból álló hangsorokat játszottak le a kísérleti személyeknek, amelyek egyfajta dallamot alkottak. A hangokat úgy állították elő, hogy az alacsony frekvenciatartományokat kiszűrték, vagyis csak olyan magas frekvenciák maradtak meg, amelyeket önmagukban nem lehet kihallani. Ezenkívül alacsony frekvenciájú sávszűrt zajjal fedték el az alsó frekvenciákat. Mindezen módosítások ellenére a kísérleti személyek képesek voltak a dallamokat felismerni, ami arra utal, hogy azok létrehoztak valamilyen hangmagasságélményt (természetesen ezek a nagymértékben eltorzított hangok egészen más hangmagasságélményhez vezetnek, mint amit például egy zongorán lejátszott dallam okoz, de ennek ellenére valami dallamélmény- szerűség kialakulhat). Az eredmények egy másik csoportja viszont éppen a periferiális elméleteket cáfolja. Houtsma és Goldstein (1972) például arra a következtetésre jutott, hogy a maradványhang akkor is hallható, ha a harmonikusok között nem jöhet létre interakció az alaphártyán. Kísérletükben két felharmonikusból álló hangokat (pl. a 4. és 5. harmonikus) játszottak le a kísérleti személyeknek, akiknek a maradványhang magasságát kellett megállapítaniuk. Pontosabban, egy viszonylag bonyolult feladatot kaptak a zeneileg képzett alanyok: az volt a dolguk, hogy két egymást követő, két felharmonikusból álló hang zenei skálán való távolságát állapítsák meg. Ehhez természetesen az egyébként hiányzó alaphangot kellett felhasználniuk. Ráadásul még egy „csavart” alkalmaztak: a hangot alkotó két felharmonikust külön-külön adták a két fülbe. Ezt dichotikus helyzetnek nevezzük. Azt találták, hogy a feladat megoldása, vagyis a hiányzó alaphanggal rendelkező hangok zenei távolságának megállapítása még úgy is megfelelő volt, hogy a felharmonikusok más-más fülben voltak hallhatók. A dichotikus hallgatási helyzettel a kutatók ki tudták zárni annak lehetőségét, hogy a két felharmonikus az alaphártyán interakcióba lépjen, és ez okozza a hangmagasság élményét. A hangmagasság észlelése ebben a szituációban csak úgy képzelhető el, hogy a két fülből származó információ a feldolgozás valamely későbbi szintjén egyszerre kerül feldolgozásra, és ez a centrális feldolgozás vezet a hangmagasság élményéhez.
193 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
9.10. ábra. Az alaphártya idegsejtjeinek kisülési mintázata egy komplex hang feldolgozásakor. A bal oldali értékek azokra a frekvenciákra vonatkoznak, amelyek maximális idegi aktivitást eredményeznek az alaphártya adott pontjain Houtgast (1976) még ennél is tovább ment ahhoz, hogy bizonyítsa, a hangmagasság centrális folyamatoktól függ. Kimutatta, hogy akár egyetlen felharmonikussal rendelkező hang esetében is hallható egy ettől eltérő maradványhang. Olyan kísérleti helyzetet hozott létre, amelyben a személyeknek azt kellett eldönteniük, hogy két egymást követő komplex hang esetén a másodikként hallott magasabb vagy mélyebb-e, mint az első. Az első hang mindig hat felharmonikust tartalmazott, és egyértelmű hangmagassággal rendelkezett, a második hang viszont először három, majd kettő, végül pedig csak egy harmonikust tartalmazott. Az egy harmonikust tartalmazó hang esetében nagyon nehéz volt meghallani az ahhoz elvileg kapcsolódó mélyebb maradványhangot, egészen addig, amíg nem játszottak le a hanggal együtt háttérzajt is. Zaj jelenlétében ugyanis az egyetlen harmonikussal rendelkező hang is egyértelmű hangmagasságélményt okozott. Az ilyen módon kialakuló hangmagasságélményhez két dolog szükséges: egyrészt a személy egy meghatározott hangmagasságtartományra kell hogy figyeljen, és ebben a tartományban kell elvárnia az adott hangot (az elvárást a kísérleti helyzet maga alakítja ki). Másrészt szükséges, hogy a háttérzaj a beérkező hanginger feldolgozását zavarja, és ezáltal többértelművé tegye. Ha ezek a feltételek fennállnak, akkor lehetséges, hogy egyetlen felharmonikus is létrehozzon egy ettől mélyebb hangmagasságélményt. Ezek az eredmények azt bizonyítják, hogy a hangmagasság élménye a feldolgozás nagyon magas szintjén alakul ki, és többek között a személy figyelme vagy elvárásai is képesek befolyásolni. Vagyis, noha nyilvánvalóan a hang akusztikai jellemzőiben kell keresnünk a hangmagasság észlelésének alapjait, maga az élmény azonban nagyon erőteljesen pszichológiai tényezők által befolyásolható jelenség. Összefoglalva, a komplex hangok magasságának észlelésével kapcsolatban az alábbiak derültek ki: 194 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang 1. A hangmagasság olyan helyzetekben is észlelhető, amikor a harmonikusok túl magasak ahhoz, hogy kihallhatók legyenek. Ez az eredmény cáfolja a mintázatfelismerő elméleteket. 2. A hangmagasság észlelése nem kizárólag az alaphártya működésén alapul, mivel olyan esetben is észleljük, amikor nem lehetséges a harmonikusok interakciója (pl. dicho- tikus hallgatási helyzet). Ez az eredmény cáfolja az idői elméleteket. Mivel úgy látszik, hogy mind az idői, mind a mintázatfelismerő modellek jól magyaráznak bizonyos jelenségeket, más jelenségeket viszont nem, feltételezhetjük, hogy mindkettőnek igaza van, és a kettő egyesítéséből származó modell a hangmagasság-észlelési jelenségek szélesebb körét tudná magyarázni. Nézzünk meg egy ilyen elméletet, amely Moore (1997) nevéhez fűződik.
3.6.4. Moore egyesített elmélete A 9.11. ábra szemlélteti a modell működését. A modell egy soklépcsős feldolgozási folyamatot képzel el a hangmagasság-észlelés hátterében. Az első lépés a bejövő komplex hangnak egy átfedő sávszűrőket tartalmazó készlet (a hallási szűrők) segítségével történő feldolgozása. Ennek révén kinyerhetők a hang frekvenciatartományai, vagyis a harmonikusok, mivel az egyes szűrők csak a nekik megfelelő sávszélességű frekvenciákat engedik át. Ez lényegében megfelel az alaphártya működésének: a hang az alaphártya különböző helyein okoz elmozdulást, és ezáltal aktiválja az ott található szőrsejteket. Láthattuk, hogy a hallási szűrők ezeknek a szőrsejteknek a frekvenciaszelektív működését modellezik. A szűrők kimenete egy olyan mintázat, mint ami az ábrán látható, és a feldolgozási folyamat további lépcsői már ezen a kimeneten dolgoznak, vagyis az egyes harmonikusok külön-kü- lön dolgozódnak fel.
195 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
9.11. ábra. A komplex hangok hangmagasság-észlelésének sematikus modellje (Moore 1997 nyomán) A következő lépés a szűrők kimenetének idegi impulzussokká történő átalakítása. Ezt a lépést a fázisszinkronizációs elmélet írja le legjobban. A transzdukciós folyamat során eszerint egy olyan kisülési mintázat jön létre, amely egy idői leképezését adja az adott frekvenciának. Fontos, hogy mindez már ugyanúgy működik, mint az egyszerű hangok esetében: a hang frekvenciáját egy az adott hangnak megfelelő jellemző frekvenciával bíró idegrost dolgozza fel. Vagyis a modell szerint a komplex hangok feldolgozásának egyik kritikus lépése a hangok különböző frekvencia-összetevőkre való lebontása (amit az alaphártya helyelmélete magyaráz meg), mivel, ha ez megtörtént, akkor a későbbi feldolgozás már haladhat úgy, mintha tiszta hangokról lenne szó (csak éppen sok idegrost „dolgozik” egyszerre). A feldolgozás következő szintjén egy olyan mechanizmus található, amely a különböző jellemző frekvenciával rendelkező idegrostok kisülési mintázatait elemzi külön-külön. Ez az információ azután továbbítódik egy újabb szintre, ahol a különálló kisülési mintázatok összehasonlítása történik meg. Az összehasonlítás során a mechanizmus közös idői mintázatokat keres, vagyis olyan pontokat, ahol több idegrostból származó kisülési információ egybeesik és átfedi egymást. Emlékezzünk vissza, hogy ez az átfedés, illetve interakció képezte az
196 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang alapját az idői elméleteknek, de azok ezt a mechanizmust az alaphártyához kapcsolták. A Moore-féle modell ezzel szemben egy centrális mechanizmust tételez fel az átfedés kinyerésére, mivel csak egy ilyen mechanizmus tudja megvalósítani azt, hogy akár két külön fülből érkező kisülési mintázatot is figyelembe vegyen. Ahogyan az idői elméleteknél, itt is a közös, átfedő idői mintázat az, ami a maradványhangot meghatározza, vagyis ez a mechanizmus számítja ki lényegében a komplex hang magasságát. Végül a feldolgozás utolsó lépésében egy döntési mechanizmus választja ki a hang végleges magasságát, mégpedig úgy, hogy nemcsak az alulról felfelé irányuló tüzelési mintázatokból származó információt veszi figyelembe, hanem különböző felülről lefelé ható folyamatok (figyelem, emlékezet) és a kontextus is befolyással vannak rá. Látható, hogy a modell a hangmagasság észlelésének mind idői, mind helyelméletét figyelembe veszi, és egyesíti magában a komplex hangok hangmagasság-észlelésének idői és mintázatfelismerő modelljeit. Ráadásul magában foglalja mindazt az ismeretet, amit az alaphártya frekvenciaszelektív működéséről, a jellemző frekvenciákról és a hallóidegrostok tüzelési mintázatairól tudunk. Ilyen értelemben a hallási észlelés egyik legkomplexebb elméletét nyújtja. A fentiekben áttekintettük a hallási észlelés egyik legfontosabb témáját, azaz azt, hogy hogyan dolgozza fel a hallórendszer a hangok magasságát, legyenek azok tiszta vagy komplex hangok. Láthattuk, hogy annak ellenére, hogy a hangoknak a magasságuk a legalapvetőbb jellemzőjük, ennek észlelése teljes mértékben szubjektív élmény, és nincs egy az egyben megfelelés egy hang frekvenciája és hangmagassága között.
4. Hangszín A hangszín minden bizonnyal a hangok legfontosabb szubjektív tulajdonsága. A hangszín teszi ugyanis lehetővé, hogy a környezet hangjait megkülönböztessük egymástól, és ezáltal felismerjük a tárgyakat a hangjuk alapján. Ennek ellenére a hangszín észleléséről nagyon keveset tudunk. A hangszín a hangok minőségére vonatkozik, és a következőképpen definiálhatjuk. A hangszín a hangok azon tulajdonságára vonatkozik, amely mentén az azonos hangossággal, hangmagassággal és hosszúsággal rendelkező komplex hangok megkülönböztethetők egymástól. Egyszerűbben fogalmazva, a hangszín az a jellemző, amely különbözővé teszi a zongora és a szaxofon vagy két ember beszédhangját. Hangszínről csak a komplex hangok esetében beszélhetünk, és fizikai értelemben a különböző frekvenciatartományokban található hangenergia eloszlása, vagyis a hang spektrális tartalma határozza meg. Ha emlékszünk, a komplex hangok alaphangból és felharmonikusokból állnak. A spektrális tartalom lényegében arra vonatkozik, hogy hány és milyen típusú harmonikusokat tartalmaz egy adott hang. A hangok eddig tárgyalt szubjektív jellemzői, a hangosság és a hangmagasság, egydimenziósnak tekinthetők. A hangok hangosságuk és hangmagasságuk alapján egyetlen skálán sorba rendezhetők, halktól a hangosig, illetve mélytől a magasig. Ezzel szemben a hangszín többdimenziós: a hangok hangszín alapján történő osztályozásához több kategóriára is szükség van. Valójában a hangszín kutatásának egyik fő kérdése, hogy pontosan hány dimenzióra van szükség ahhoz, hogy a hangokat a minőségük alapján megkülönböztessük egymástól. A problémák ott kezdődnek, hogy nehéz pontosan meghatározni a hangszín dimenzióit, hiszen hogyan tudnánk leírni a zongora és a hegedű hangja közötti különbséget? Több próbálkozás is történt valamilyen többdimenziós skálarendszer létrehozására. Von Bismarck (1972, idézi Pap 2002) sok különböző hangszínű hang hasonlóságát ítéltette meg, és az eredményeket különböző statisztikai módszerekkel dolgozta fel. Két alapvető hangszínjellemzőt talált: az élességet és a kompaktságot. Az élesség elsősorban a hang frekvenciájához és hangerejéhez kapcsolódott, a kompaktság viszont egy olyan dimenzió volt, ami jól elkülönítette a zajokat és a zenei hangokat. Ezenkívül olyan kategóriákat talált még, mint a teltség, színesség és érdesség. A hangszínt a spektrális tartalmon kívül azonban egyéb, időben változó jellemzők is befolyásolják. Túlzott leegyszerűsítés lenne azt állítani, hogy a zongora és a hegedű hangja csak annyiban tér el egymástól, hogy eltérő frekvenciatartományokban tartalmaznak hangenergiát.
197 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang
9.12. ábra. Két hangszer burkológörbéjének illusztrálása: a) cintányér, b) fuvola. Az ábrán a vastag vonal jelzi a burkológörbét, amely pontosan követi a hang amplitúdójának változását Valójában a környezeti hangok folyton változnak, és a legritkább esetben maradnak statikusak. A legfontosabb hangszínt befolyásoló tényezők a hang burkológörbéje, valamint a hangkezdet és a hangvégződés (lásd 9.12. ábra). Ezek a jellemzők gyakorlatilag a hangerő folyamatos váltakozásából származnak, hiszen a hangkezdet és a hangvégződés is felfogható úgy, mint a hangerő megváltozása (0-ról, illetve 0-ra). Azt, hogy ezek a dinamikai jellemzők mennyire fontosak, a következő példával illusztrálhatjuk. A régebbi elektromos orgonák (szintetizátorok) a valódi hangszerek hangját csak a spektrális jellemzők lemásolásával utánozták. Ha hallottunk már a hatvanas évekből származó, elektromos orgonán játszott dalokat, akkor tudjuk, hogy ezek az utánzott hangok egyáltalán nem hasonlítottak az eredeti hangszer hangjára, és valójában sípszerűen szóltak. A mai modern szintetizátorok és főként az elektromos zongorák már szinte teljesen hűen képesek visszaadni a hangszerek hangját. Ennek többek között az az oka, hogy a modern szintetizátorok használják a burkológörbe és a hangkezdet megváltoztatását, míg a régiek erre nem voltak képesek. Vagyis az igazán élethű hangzás elérése érdekében nem csak a hangok spektrális tartalmát, hanem idői és hangerőváltozását is modellezni kell.
4.1. ÖSSZEFOGLALÁS 1. A pszichoakusztika tudománya azzal foglalkozik, hogy hogyan észleljük a hangok hangosságát, hangmagasságát és hangszínét, és hogy milyen viszonyban vannak egymással a hangok fizikai jellemzői és ezek szubjektív észlelése. 2. A hangosság észlelését elsősorban a hang erőssége (amplitúdója) határozza meg, de ezenkívül számos egyéb tényező is befolyásolja, köztük a hang frekvenciája. 3. A hangosság észlelésének tartományát a hallhatósági függvény írja le, amely az egyes frekvenciák esetén mérhető abszolút hallási küszöböket ábrázolja. 4. A hangosság észlelésének különbségi küszöbét két módszerrel lehet mérni: a közvetlen nagyságbecsléssel és a hangossági szintek módszerével. A közvetlen nagyságbecslési módszer eredményei szerint hatványösszefüggés áll fenn a hang fizikai intenzitása és észlelt hangossága között. A hangossági szintek módszerének eredményei szerint a hangosság észlelését nemcsak a hang intenzitása, de a frekvenciája is
198 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang befolyásolja: nagyon mély és nagyon magas hangoknak nagyobb intenzitással kell rendelkezniük, hogy ugyanolyan hangosnak halljuk őket, mint a közepes frekvenciájú hangoknak. 5. A hangosság idegi kódolása egy lépcsőzetes kódolási mechanizmussal történik, amelyben a különböző válaszjellemzőkkel rendelkező idegrostok a hangerőtartomány különböző szintjeit kódolják. 6. A halláskárosodás a hangosság észlelésének problémája; lehet vezetéses vagy érzékszervi-idegi. A halláskárosodás leggyakoribb fajtája az időskori halláscsökkenés, amely a magas frekvenciájú hangok iránti érzékenység fokozatos elvesztésével jár együtt. 7. A hangmagasság észlelésének alapja a hallórendszer frekvenciaszelektív működése, amelyet zajelfedési kísérletekkel vizsgáltak. A kísérletek eredménye szerint egy célhangot olyan széles sávú zajjal lehet legjobban elfedni, amely a hangéhoz hasonló vagy azzal megegyező frekvenciát tartalmaz. Illetve, minél több frekvenciát tartalmaz a zaj, annál hatékonyabban fedi el a célhangot, de csak egy bizonyos határig, az úgynevezett kritikus sávig. E felett további frekvenciák hozzáadása a zajhoz már nem okoz nagyobb elfedést. 8. A kritikus sávok jelenléte a hallórendszer hallásiszűrő-modelljét támasztják alá. Eszerint a hallórendszer úgy képzelhető el, mint a teljes hallható frekvenciatartományt lefedő és egymást átfedő sávszűröket tartalmazó készlet. 9. A hallási szűrők haranggörbe alakúak, és sávszélességük 50 és 2000 Hz között változik: az alacsonyabb frekvenciák esetén a sávszélesség kisebb, a magasabb frekvenciák esetén pedig nagyobb. Emiatt a hallórendszer érzékenysége az alacsony és magas frekvenciák esetén eltérő. 10. A hangmagasság észlelése a tiszta hangok esetében a frekvencián alapul, de több más tényező befolyásolja, például a hang hangossága és időtartama. 11. Komplex hangok esetében még bonyolultabb a viszony a hangmagasság és a hang frekvenciája között. A hiányzó alaphang jelensége azt mutatja, hogy a hangmagasság észlelése nem az alaphanghoz kapcsolódik, mivel ennek eltávolítása nem okoz változást az észlelésben. Az alaphang nélküli felharmonikusok esetében észlelt hangmagasságot maradványhangnak nevezzük. 12. A maradványhang észlelésének magyarázatára kétféle elmélet született. A mintázatfelismerő modellek szerint a komplex hangok magasságát az egyedi felharmonikusok magasságából származtatjuk valamilyen módon. Az idői modellek szerint viszont a hallóideg kisülési mintázata vezet a hangmagasság észleléséhez. A kettő egyesítéséből származó Moore-féle modell a hangmagasság-észlelési jelenségek széles körét tudja magyarázni. 13. A hangszín teszi lehetővé a környezet hangjainak egymástól való megkülönböztetését. A hangszínt a hangok spektrális jellemzői (felharmonikusok száma és egymáshoz való viszonya) és időben változó tulajdonságai (amplitúdó-burkológörbe) határozzák meg.
4.2. KULCSFOGALMAK abszolút küszöb, burkológörbe, egyenlő hangosságú szintvonalak, hallási szűrők, halláskárosodás, hallhatósági függvény, hangszín, hiányzó alaphang, idői modellek, közvetlen nagyságbecslés, kritikus sáv, maradványhang, mintázatfelismerő modellek, zajelfedés
4.3. ELLENŐRZŐ KÉRDÉSEK 1. Miért mondhatjuk azt, hogy a hallórendszer szerkezetének és működésének ismerete csak egyfajta megszorítást jelent arra vonatkozólag, hogy az emberek hogyan észlelik a hallási ingereket? 2. Lehet-e az abszolút küszöb 0 dB SPL alatti? 3. A modern hordozható mp3 vagy CD-lejátszóknál találkozhatunk előre meghatározott equalizer beállításokkal (pl. pop, rock, beszéd stb.). Miben különbözhetnek ezek, és mire jók? 4. Miért nem okoz sokáig problémát a frekvenciaspecifikus halláscsökkenés a mindennapi életben? 5. Mi a jelentősége annak, hogy a hallási szűrők az alacsony frekvenciák esetében kisebb sávszélességűek, mint magasabb frekvenciáknál? 199 Created by XMLmind XSL-FO Converter.
9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang 6. Mi a legfontosabb bizonyíték amellett, hogy a hangmagasság észlelése teljes mértékben szubjektív élmény? 7. Hogyan lehetséges az, hogy a zongorán és a szaxofonon lejátszott zenei A hangot ugyanolyan hangmagasságúnak halljuk, noha a két hang spektrális összetétele nagymértékben eltér egymástól?
4.4. AJÁNLOTT OLVASMÁNYOK Moore, B. C. J. 1997. An introduction to the psychology of hearing. 4th ed. Academic Press, San Diego. Pap János 2002. Hang, ember, hang. Vince Kiadó, Budapest. 1. 1.
200 Created by XMLmind XSL-FO Converter.
12. fejezet - 10. FEJEZET – A hallási objektumok észlelése – hol és mi Az eddigiekben áttekintettük a hallási ingerek legfontosabb fizikai jellemzőinek (hangerő, frekvencia, hangszín, időtartam) szubjektív észlelését. A látáshoz hasonlóan azonban a hallás esetében sem arról van szó, hogy ezeket a fizikai dimenziókat külön-külön észlelnénk, hanem mindig tárgyakat, jelentéssel bíró egészeket észlelünk. Ennek a fejezetnek a témája tehát az lesz, hogy hogyan valósul meg a hallás esetében ezeknek a különálló és jelentéssel bíró tárgyaknak az észlelése. Elsőre talán furcsának tűnhet hallási tárgyakról vagy hallási objektumokról beszélni, hiszen a „tárgy” szó hallatán valamilyen kézzelfogható, kiterjedéssel bíró dologra gondolunk először. Ugyanakkor a fejezet során azt fogjuk hangsúlyozni, hogy egy zongorán megszólaló Lisztdarab ugyanolyan jogosan tekinthető egyfajta tárgynak, mint a zongora, amin megszólal. Azt is látni fogjuk, hogy a hallásban nagyon is hasonló észlelési elvek működnek, mint amilyeneket a látás kapcsán már megtanultunk, egyszerűen csak a hallás esetében egy kissé nehezebb őket értelmezni (ez valószínűleg annak is köszönhető, hogy az észlelési elveket elsőként a látott világra alkalmazták, és innen származnak a példák is). Leszögezhetjük tehát azt, hogy a hallási észlelésnek hasonló a feladata, mint a látásinak: a világot értelmes, jelentéssel bíró egységekre kell bontania. Ehhez két dolog szükséges: egyrészt meg kell határoznunk, hogy hol található a tárgy (lokalizáció), másrészt pedig meg kell határoznunk, hogy mi az (azonosítás). Azt, hogy milyen elképesztően nehéz feladata van a hallórendszernek, amikor ezt a két funkciót megvalósítja, a következő kis metaforával lehetne illusztrálni (Bregman 1990 nyomán). Képzeljük el, hogy egy tó partján állunk. A tóban kacsák és hattyúk úszkálnak, a távolban vitorlások siklanak a vízen, és a tó felszínét szél fodrozza. Most képzeljük el azt, hogy a tó partján két keskeny csatornát ásunk. Ezek mindegyike néhány méter hosszú, néhány centiméter széles, és pár méterre vannak egymástól. Félúton mindkettőbe egy zsebkendőt helyezünk, és odaerősítjük őket a csatorna széléhez. Ahogy a tó hullámai elérik a csatornákat, megmozgatják a zsebkendőket. Ezek után kizárólag a zsebkendők mozgásából kell a tavon történő eseményekre következtetnünk: hány hajó van a tavon, hol vannak, melyik van közelebb, és merre úsznak a kacsák. Annak ellenére, hogy ez a feladat tökéletesen lehetetlennek tűnik, a hallórendszerünk mégis képes megoldani: csupán a dobhártyánkat érő hanghullámok alapján képesek vagyunk egy sor következtetést levonni és meglepően pontosan leképezni a hallott világot.
1. Hanglokalizáció A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok forrásának helyét és távolságát megállapítjuk. A hanglokalizáció képessége egyértelmű evolúciós haszonnal jár, hiszen segít a hangot kiadó tárgyak vagy élőlények megközelítésében (vadászat) vagy elkerülésében (menekülés). Tudjuk ugyanakkor, hogy mindezt a vizuális rendszer is képes megvalósítani, sőt azzal az előnnyel is rendelkezik, hogy passzív, vagyis hangokat ki nem bocsátó tárgyak vagy élőlények helyét is azonosítani tudjuk a segítségével. Emiatt természetesen a legtöbb esetben a vizuális információt használjuk fel a tárgyak helyének és távolságának megállapítására, vagyis a látás viszonylagos dominanciával rendelkezik a hallás felett. A hallás eszerint elsősorban kiegészítő szerepet játszik a lokalizációban, azaz elsősorban olyan tárgyak helyének megállapítására használjuk, amelyeket nem látunk. Ezért a hallás alapján történő lokalizáció szerepe elsősorban az, hogy a hangokat kibocsátó tárgyak helyzetét nagyjából beazonosítsa, és a vizuális figyelmet odairányítsa. Ezzel a jelenséggel az észlelés integrációs kérdéseinél (modalitásközi facilitáció) és a téri figyelemmel foglalkozó 16. fejezetben részletesebben is megismerkedhetünk majd. Természetes körülmények között a látás jól ismert dominanciája ellenére is viszonylag pontosan meg tudjuk határozni a hangforrások helyét és irányát. Ha valaki benyit a szobába, ahol éppen tanulunk, akkor habozás nélkül a nyikorgó ajtó felé irányítjuk a tekintetünket. Sőt a hallásnak kifejezett téri minősége van, azaz úgy tűnik, hogy a hangok mindig jönnek valahonnan. A hang lokalizációja teljesen automatikus és erőfeszítés nélküli, ráadásul nagyon gyorsan lejátszódik. Látszólagos egyszerűsége ellenére a hangok lokalizációja nagyon is bonyolult folyamat. Ennek elsősorban az az oka, hogy magában a hallási információban nincsenek jelen egyértelmű téri információk. Tudjuk, hogy a látás esetében a retinára vetülő kép a környezet analóg reprezentációja. Ez azt jelenti, hogy ami a valóságban jobbra van, az a retinális képen is jobbra van, ami balra van, az a képen is balra van. Ezzel szemben a fülbe érkező akusztikus információ nem tartalmaz hasonló téri
201 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi viszonyokat: kizárólag a hang erősségét, frekvenciáját és időbeliségét tudjuk felhasználni ahhoz, hogy a hang forrásának helyére következtessünk belőle. A hallási lokalizációban a kulcsszó tehát a következtetés lesz. Míg a látás esetében a tárgyak egymáshoz viszonyított helyzetének megállapítása nem kíván következtetést, hiszen mindez az információ benne van a retinán kialakuló képben, addig a hallás esetében különböző következtetési folyamatok szükségesek, amelyek segítségével rekonstruálható, hogy a tér mely pontjáról származik az adott hang. Persze azért a látás esetében sem eny- nyire egyszerű a dolog: tudjuk, hogy a háromdimenziós világ két dimenzióban reprezentálódik a retinán, és ebből kell következtetni a valódi mélységre. Mielőtt belefognánk annak tanulmányozásába, hogy hogyan is valósul meg a hangforrás helyének meghatározása, tisztáznunk kell még két alapfogalmat. Az egyik arra vonatkozik, hogy milyen információt használunk fel a lokalizációban: csak az egyik fülbe érkezőt, vagy mindkét fülbe érkezőt. Az előbbit monaurális, az utóbbit pedig binaurális észlelésnek nevezzük. Látni fogjuk, hogy a lokalizációban elsősorban a binaurális, vagyis két- füles észlelésre támaszkodunk, de monaurális, vagyis egyfüles módon is viszonylag jól működhet a tárgyak helyének meghatározása. A másik tisztázandó alapfogalom a hallási térrel kapcsolatos. Annak érdekében, hogy egyértelműen tudjunk beszélni a hallási térről és a különböző téri helyekről származó hangokról, érdemes bevezetnünk egy speciális koordináta-rendszert (10.1. ábra). A hallási tér koordináta-rendszerét a hallgató fejéhez viszonyítjuk, ez kerül a középpontba, és a fejhez képest három síkot határozunk meg. A horizontális síka fül hallójáratát és a szemet metszi, és lényegében ez határozza meg az elöl-hátul dimenziót. A frontális sík erre merőleges, és a fejtetőn halad keresztül, szintén metszve a hallójáratot. A frontális síkon értelmezzük a fent-lent irányokat. Végül a mediális sík mind a horizontális, mind a frontális síkokra merőleges, és a fej középvonalán halad át, vagyis mindkét fültől azonos távolságra található. A három sík metszéspontja nagyjából a fej közepében van, és ez a középpont az egész rendszer kiindulópontja, minden irányt ehhez viszonyítunk. Érdekes módon egyébként létrehozható olyan szituáció, amikor a hangokat történik, ha a hangokat fülhallgatón keresztül, valóban ide, vagyis a fejünk közepébe lokalizáljuk. Ez akkor sztereóban hallgatjuk. Erről a későbbiekben még lesz szó.
10.1. ábra. A hangok téri lokalizációjában alkalmazott koordináta-rendszer
1.1. A binaurális lokalizáció Ahogy a bevezetőben már említettük, a hangok lokalizációja úgy működik a legjobban, ha felhasználjuk a mindkét fülünkbe érkező hallási információt. Két kérdésre kell válaszolnunk, ha meg akarjuk érteni a lokalizációt: 1. milyen információt használunk fel, és 2. hogyan tesszük ezt? Említettük már, hogy a hallási információban nincsen semmilyen egyértelmű jelzés a hangforrás irányával kapcsolatban. Mi az, ami mégis rendelkezésre áll? Tudjuk, hogy minden hang három alapvető fizikai paraméterrel rendelkezik: hangerővel, frekvenciával és időtartammal. Ezek közül a hallórendszer a lokalizáció céljára a hangerőt és az időt használja fel, a frekvencia pedig elsősorban a hallási tárgyak azonosításában játszik fontos szerepet. A hangok terjedésének fizikai jellemzői miatt, ha egy hang valamilyen irányban eltér a mediális síktól, például közelebb van a jobb fülhöz, mint a balhoz, akkor két jellemzőben is változás történik. Egyrészt a hangforráshoz közelebbi fülbe előbb ér el a hang, másrészt ebben a fülben hangosabb lesz. A két fülbe érkező hang hangerejének eltérését interaurális hangerőkülönbségnek (IHK), azt a jelenséget pedig, hogy a hangok eltérő időpillanatban érik el a két fület, interaurális időkülönbségnek (IIK) nevezzük. Fontos leszögeznünk, hogy annak ellenére, hogy a két fülbe eltérő fizikai jellemzőkkel rendelkező hangok érkeznek, soha nem két különálló hangot hallunk, hanem mindig csak egyetlen, de meghatározott téri minőséggel rendelkező hangot. Lássuk
202 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi előbb, hogy miből származik az IHK, és hogyan képes ezt a hallórendszer felhasználni a hangok lokalizációjában.
10.2. ábra. A fülek közötti hangerőkülönbség és a hangforrás irányának összefüggése
1.1.1. Az interaurális hangerőkülönbség A fülek közötti (interaurális) hangerőkülönbség elsősorban a fej árnyékoló hatásának köszönhető, mivel a hangforrással ellenkező oldali fülbe érkező hangnak át kell haladnia a fejen. Az észlelőrendszer a két fülbe érkező inger hangerejének különbségéből következtet a hangforrás pozíciójára. A helyzet azonban nem ennyire egyszerű: az alacsony frekvenciájú hangokat ugyanis a koponya nem tudja leárnyékolni. Ha visszagondolunk a hangok rezgéséről tanultakra, akkor tudjuk, hogy a hanghullámot nemcsak az időegységenkénti rezgés számával tudjuk meghatározni, hanem a hullámhosszal is, amely a hullám két egymást követő csúcsa közötti távolságot fejezi ki. Az 8.4. ábra illusztrálta a frekvencia és a hullámhossz közötti összefüggést. Ha visszalapozunk az ábrához, akkor láthatjuk, hogy az alacsony frekvenciájú hangok esetében a hullámhossz egyre nagyobb lesz, 1000 Hz alatt már körülbelül 40 cm. Ez tehát azt jelenti, hogy egy 1000 Hz-es hang esetében a hanghullám két csúcsa között kb. 40 cm van, vagyis ez elég ahhoz, hogy a kb. 20 cm széles emberi koponyát mintegy „átugorja”. Azaz a fej az 1000 Hz alatti hangokat nem tudja leárnyékolni, mégpedig azért, mert nem elég nagy ahhoz, hogy a hangok útjába álljon. Az IHK különböző módszerekkel pontosan meghatározható. Shaw (1974) például úgy mérte meg, hogy egy mesterséges emberi fejen a fülek helyére mikrofonokat szerelt, majd pedig egy hangforrást a fej horizontális síkja mentén mozgatott, és a mikrofonokkal rögzítette a hangforrás által kibocsátott hangokat. A vizsgálat eredményét a 10.2. ábra mutatja. Ezt a mérést több frekvenciával is megismételték, és valóban azt kapták, hogy kb. 500 Hz alatti hangok esetében nem volt lényeges eltérés az IHK-ban, viszont egy 6000 Hz-es hang esetében az IHK akár a 20 dB-t is elérhette. Vagyis ez a binaurális jelzőmozzanat elsősorban a magas hangok irányának meghatározását segíti, és ezek esetében nagyon hatékonyan működik. Érdemes kiemelnünk azt a tényt, hogy Shaw kísérletében nem emberi alanyokat, hanem egy mesterséges fejet használtak. Ezt azért tehették meg, mert az IHK teljes mértékben fizikai jelenség, azaz egyszerűen a hangok terjedési sajátosságaiból fakad, nem pedig valamilyen szubjektív tapasztalat (a szubjektív tapasztalat pontosan az, hogy nem két eltérő hangerejű hangot hallunk, hanem egyetlen, a tér valamely pontjáról származót). Ami az IHK-t egy kicsit mégis humánspecifikussá teszi, az az, hogy az emberi fejkörméret és a fej hangelnyelési jellemzői befolyásolják az árnyékolás nagyságát (ezért is kellett mesterséges fejet alkalmazni a kísérletben, nem pedig egyszerűen két mikrofont). Az IHK jelentősége inkább az, hogy az észlelőrendszer specifikus feldolgozási mechanizmusokat fejlesztett ki annak érdekében, hogy ezt az eleve adott fizikai paramétert kihasználja a hangok lokalizációjában.
203 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
10.3. ábra. A tévesztési kúp A 10.2. ábrára visszatérve, észrevehetjük, hogy több olyan téri hely is létezik, ahol a hangforrás ugyanazt a hangerőkülönbséget okozza. Például a teljesen a fej előtt és teljesen mögötte (0 és 180°) megszólaló hang egyformán kicsi (valójában 0) IHK-t okoz. Ez azt jelenti, hogy ha csak ezt az információt vesszük figyelembe, akkor nem tudjuk egyértelműen eldönteni, hogy honnan származik a hang, azaz előttünk vagy mögöttünk van-e. A különböző téri pontokhoz tartozó IHK-kat szemügyre véve a kutatók arra a megállapításra jutottak, hogy sok ilyen nem egyértelmű téri irányt nyújtó pont létezik, és hogy ezek a pontok egy geometriai alakzatba rendeződnek, mégpedig egy kúp palástján helyezkednek el (10.3. ábra). Az egyértelmű lokalizációt adni nem képes pontok halmazát ezért tévesztési kúpnak nevezzük (Woodworth 1938). Erre a témára még visszatérünk, miután az IIK-t is megvizsgáltuk. Azt mondtuk tehát, hogy az IHK alapvetően az emberi fej és a hangok terjedési jellemzőinek interakciójából, együttes hatásából származik. Ezzel azonban még nem mondtunk semmit arról, hogy hogyan képes a hallórendszer kihasználni ezt az információt a hangok lokalizációja érdekében. A kutatók állatkísérletes és egysejt-akti- vitást vizsgáló módszerekkel próbáltak nyomára bukkanni ezeknek a mechanizmusoknak, és azt találták, hogy a hallópálya egyik kéreg alatti átkapcsolóállomásán, a colliculus inferiorban valóban találhatók olyan idegsejtek, amelyeket mindkét oldalról elér a receptorokból továbbított ingerület. Ezek az idegsejtek szelektív érzékenységet mutatnak a jobb vagy a bal fülbe nagyobb hangerővel érkező hangokra. Az ilyen típusú, mindkét fülből idegi impulzusokat kapó neuronokat binaurális idegsejteknek nevezzük. Látni fogjuk, hogy nemcsak az IHK, de az IIK feldolgozását is hasonló idegsejtek végzik.
1.1.2. Az interaurális időkülönbség A hang lokalizációjának másik binaurális jelzőmozzanata az IIK. Ahogy említettük, az IIK abból az egyszerű tényből származik, hogy a hangforráshoz közelebb lévő fület a hang előbb éri el, mint az ellenoldali fület. Tudjuk, hogy a fénnyel összehasonlítva a hang viszonylag lassan terjed (340 m/s a levegőben), és ez vezet ahhoz, hogy a két fül közötti mintegy 20 cm távolság az érzékelőrendszer számára feldolgozható idői eltérést eredményez. Ennek ellenére itt olyan kicsi idői különbségekről van szó, amelyek néhány száz mikroszekundum (a másodperc egymilliomod része) nagyságrendűek. Az IHK-hoz hasonlóan az IIK is meghatározható a már említett, mesterséges fejet alkalmazó vizsgálat segítségével (Shaw 1974). A vizsgálat eredménye (10.4. ábra) hasonló ahhoz, mint amit az IHK kapcsán már láttunk. Egyrészt, akkor a legnagyobb az idői különbség, ha a hangforrás közvetlenül a fej egyik oldalán található, és merőleges a mediális síkra. Másrészt, itt is vannak olyan pontok, amelyek nem teszik lehetővé az egyértelmű lokalizációt: az IIK esetében is megalkotható a tévesztési kúp. Fontos megjegyeznünk, hogy az IIK és az IHK esetében eltérőek a tévesztési kúpok, valamint minden egyes frekvenciaértékhez más-más tévesztési kúp tartozik. Harmadrészt, az IHK-hoz hasonlóan az IIK esetében is vannak olyan frekvenciatartományok, amelyek esetében nem működik megfelelően. Láttuk például, hogy az IHK esetében a mély hangoknál van probléma. Az IIK-nál pont fordított a helyzet, azaz ez az eltérés a magas hangok lokalizációja esetében nem nyújt megbízható információt. Ennek oka a hangok idői különbségének jellegzetességeiben keresendő.
204 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
10.4. ábra. A fülek közötti idõi különbség és a hangforrás irányának összefüggése Az IIK-t valójában nem az okozza, hogy a hangok különböző időben érkeznek a két fülbe, hanem a hanghullámok közötti fáziskülönbség. Láttuk, hogy a fázis azt fejezi ki, hogy egy adott ponthoz képest egy teljes hanghullám-periódusnak mekkora része telt el, vagyis hogy a kezdőponthoz képest mennyit változott a hanghullám. Az IIK esetében a hallórendszer valójában a két fülbe érkező hang fázisai közötti különbséget dolgozza fel. Az alacsony frekvenciájú hangok esetében nincs is semmi probléma, a fáziskülönbség hatékonyan jelzi a hangforrás irányát. A magas frekvenciájú hangoknál viszont a hullámhossz túl kicsi lesz, azaz kisebb, mint a fej mérete. Ha a hangok hullámhossza kisebb, mint a két fül közötti távolság (azaz kb. 20 cm), akkor a két fül között a hanghullám több periódust is leír. Több periódus esetén viszont nem egyértelmű, hogy a fáziskülönbség miből származik, mivel önmagában csak a fázis nem mondja meg, hogy hány periódus telt el. Ezért van az, hogy a magas frekvenciájú hangoknál az IIK nem nyújt egyértelmű információt a hang lokalizációjával kapcsolatban. Természetesen az IIK-ra is igaz az, amit az IHK kapcsán megállapítottunk: az IIK is a hangingerek fizikai jellemzőiből, és nem azok szubjektív észleléséből következik. Ezért itt is sokkal érdekesebb az a kérdés, hogy a hallórendszer hogyan képes ezt a jellemzőt felhasználni a lokalizációban. Az IIK kapcsán is találtak olyan binaurális idegsejteket, amelyek vagy a bal, vagy a jobb fülből előbb beérkező hangokra reagáltak csak. Ezek az idegsejtek elsősorban az oliva superior nevű kéreg alatti struktúrában találhatók. Az, hogy hogyan valósítható meg, hogy egy idegsejt szelektív választ adjon akkor, ha az egyik fülből érkező inger előbb éri el, mint a másik fülből érkező inger, azzal a viszonylag régi elmélettel ma is jól magyarázható, amely Jeffress (1948) nevéhez kapcsolható. Jeffress késleltetésivonal-elmélete szerint egy IIK-t detektáló binaurális idegsejt a következőképpen működne (10.5. ábra). Tudjuk azt, hogy az egyes neuronokat hosszabb-rövidebb idegrostok (axonok) kötik össze, és ezek szállítják az idegi impulzusokat az idegsejtek között. Az axon hossza befolyásolja az ingerületvezetés sebességét, vagyis azt, hogy mennyi idő alatt jut el az impulzus egyik idegsejttől a másikig. Minél rövidebb egy axon, annál rövidebb idő alatt továbbítja az impulzust. Élettani ismereteink alapján tudjuk, hogy az idegi impulzusok terjedési sebessége meglepően kicsi (idegrosttól függően a maximális sebesség kb. 100 m/s, vagyis 360 km/h), vagyis egy axon hossza jelentősen képes befolyásolni az ingerületátvitel idejét. Mindezeket észben tartva most képzeljünk el egy olyan neuront, amelyhez különböző hosszúságú idegrostok kapcsolódnak. Az egyszerűség kedvéért tételezzünk fel egy olyan binaurális idegsejtet, amelyhez egy-egy axon kapcsolódik a két fülből. A két axon közül az egyik (pl. a jobb fülből jövő) rövidebb, a másik pedig kicsit hoszszabb. Tegyük fel ezenkívül, hogy a binaurális idegsejt csak akkor aktiválódik, vagyis kezd el tüzelni, ha mindkét axontól egyszerre kap bemenetet (ezt nevezzük szummációnak). Milyen következményekkel jár ezek alapján a bemeneti axonok különböző hossza? Három eset lehetséges: a. Ha mindkét fület egyszerre éri egy hang, akkor, mivel a jobb fülből érkező axon rövidebb, onnan előbb kap impulzust a binaurális idegsejt, és így nem jön létre a szummáció, vagyis az idegsejt nem tüzel. b. Ha a hang jobbról jön, akkor a jobb fülből érkező axontól még előbb ér az idegsejtig az impulzus, vagyis az továbbra sem tüzel.
205 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi c) Ha a hang balról jön, akkor a jobb fülből érkező axonból később érkezik be az impulzus, mivel a jobb fülbe később jut el a hang, de mivel a jobb oldali axon rövidebb, ezért a balról érkező impulzussal együtt érheti el az idegsejt. Ezáltal létrejöhet a szummáció, és az idegsejt tüzelni kezd. Vagyis az látható, hogy egy olyan binaurális idegsejt, amely a jobb fülből egy rövidebb axon révén kap bemenetet, a balról jövő hangokra képes preferenciálisan válaszolni. Most már érthető az is, hogy miért hívják az elméletet késleltetésivonal-elméletnek: a különböző axonhosszúságokkal különböző módokon lehet késleltetni a fülből beérkező ingerületet. Természetesen ahhoz, hogy bármelyik oldalról érkező hangot képesek legyünk detektálni, az szükséges, hogy olyan binaurális idegsejtek is létezzenek, amelyeknél a bal fülből érkező axonok rövidebbek, és így a jobbról jövő hangokra válaszolnak inkább. Továbbá valószínűleg nagyszámú binaurális idegsejt szükséges ahhoz, hogy a tér minden lehetséges helyéről származó hangokat kódolni lehessen. A 10.5. ábra mutatja, hogy hogyan képzelhető el egy ilyen, több idegsejtből álló rendszer.
10.5. ábra. A késleltetésivonal-elmélet (Jeffress 1948) illusztrációja Látható, hogy a fülből érkező hallóideg a binaurális idegsejtekhez érve mintegy szétválik, és az egyes idegsejtekhez azok téri elrendeződése miatt az idegrostok eltérő hosszúsággal érnek el. Hogyan dolgozódnak fel ebben a rendszerben a három fő irányból származó hangok? a. Ha a hang elölről jön, vagyis mindkét fület egyszerre éri el, akkor egy olyan idegsejt fog kisülni, amelyhez azonos hosszúságú axonok kapcsolódnak. b. Ha a hang jobbról jön, akkor egy olyan idegsejt fog kisülni, amelyhez a bal fülből hosszabb axon kapcsolódik.
206 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi c. Ha a hang balról jön, akkor egy olyan idegsejt fog kisülni, amelyhez a jobb fülből hosszabb axon kapcsolódik. Vagyis ugyanaz a késleltetési mechanizmus működik itt is, mint amit az előbb megnéztünk, de most már látható, hogy hogyan alkalmazható ez az összes téri irány leképezésére. A binaurális idegsejtek téri elrendeződése és az ebből következő eltérő axonhosszúság, valamint az, hogy csak akkor sülnek ki, ha a két fülből származó bemenet egyszerre éri el őket, lényegében automatikusan megvalósítja az irányszelekciót. A binaurális sejtek tehát a hallási tér egy jól körülhatárolható területén hallható hangokra érzékenyek. Ezt a területet az idegsejt receptív mezőjének nevezzük, hiszen – hasonlóan a vizuális rendszer CGL sejtjeihez – ezek is akkor válaszolnak leginkább, ha egy hang az idegsejthez tartozó receptív mezőben szólal meg. A binaurális sejtek összessége a hallási tér térképét építi fel, amely már egy analóg reprezentációja a külvilágnak. Látható tehát, hogy noha a hallási információ feldolgozásának kezdetén nem áll rendelkezésre egyértelmű téri információ, a hallórendszer kéreg alatti struktúráiban található binaurális idegsejtek működése révén mégis kialakul a hallási környezet téri leképeződése, és a magasabb szintű idegrendszeri folyamatok már ezen a reprezentáción dolgozhatnak tovább.
1.1.3. A binaurális lokalizáció duplexelmélete A fentiekben áttekintettük azt a két binaurális jelzőmozzanatot, amelyet a hallórendszer felhasználhat a hangok lokalizációja során. A továbbiakban arra keressük a választ, hogy valójában hogyan hasznosítja a hallás ezeket: vajon mindkettőt egyszerre figyelembe vesz- szük-e, vagy vannak olyan szituációk, amikor csak az egyiket vagy a másikat? Mind az IHK, mind az IIK rendelkezik egy olyan korláttal, amely esetében már nem nyújt hatékony információt a hangok lokalizációjával kapcsolatban. Az IHK esetében ez a mély hangoknál van így, az IIK-nál viszont a magas hangoknál. Eszerint a mély hangok esetében inkább az IIK-t tudjuk használni, a magas hangok esetében viszont az IHK-t. Úgy tűnik ugyanakkor, hogy van egy olyan frekvenciatartomány, amelyben egyik jelzőmozzanat sem működik megfelelően, vagyis a lokalizáció pontatlan. Stevens és Newman (1934) klasszikus kísérletükben empirikusan is alátámasztották ezt. A kísérleti személyeket egy 3 méter magas állványra ültették a Harvard Egyetem biológiai laboratóriumának tetején, mégpedig annak érdekében, hogy a lokalizációt ne zavarja a hangok visszaverődése a közeli falakról. A hangokat egy olyan hangszóróból játszották le, amelyet horizontális síkban egy 3,5 méter hosszú karon a kísérleti személy feje körül tudtak mozgatni. A hangok különböző frekvenciákon szólalhattak meg, és csak a jobb oldalon voltak hallhatók, összesen 13 különböző pontban. A kutatók az egyes frekvenciák esetében a lokalizációs hibákat mérték. A 10.6. ábra mutatja a kísérlet eredményét. A grafikonon jól látszik, hogy mind az alacsony, mind a magas frekvenciák esetében viszonylag jól működött a lokalizáció, ellenben a 2000-4000 Hz között frekvenciasávban megugrott a hibázások száma. Ez lenne tehát az a tartomány, ahol sem az IHK, sem az IIK nem nyújt megfelelő információt a hang téri helyzetével kapcsolatban.
10.6. ábra. A hangok lokalizációjának függvénye a frekvenciától. A hibázások száma 1000 Hz körül megnő, de 5000 Hz felett visszatér az eredeti szintre (Stevens-Newman 1934 nyomán) Stevens és Newman szerint ezek az eredmények egy kettős mechanizmus működésére utalnak, amennyiben az alacsony frekvenciájú hangok lokalizációjában elsősorban az IIK-t, míg a magas frekvenciájú hangoknál az IHK-t használjuk fel. Erre a kettősségre természetesen csak indirekt módon tudunk következtetni abból a 207 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi tényből, hogy a lokalizációs teljesítmény valahol 1000 Hz környékén elkezd romlani, de 5000 Hz-nél újból visszaáll az eredeti szintre. Az elméletet azóta a hallási lokalizáció duplexelméletének nevezték el. Ez az elmélet mára sok és sokféle módszert alkalmazó vizsgálatban nyert megerősítést. A hallási lokalizáció kapcsán tehát a duplexelmélet egy újabb hibalehetőséget vet fel: a 2000-4000 Hz-es hangok esetében az IHK és IIK nem teszi lehetővé a megfelelő lokalizációt. Egy másik problémával már korábban találkoztunk. Láttuk, hogy mind az IHK, mind az IIK esetében léteznek a hallási térnek olyan pontjai, amelyek nem teszik lehetővé az egyértelmű lokalizációt. Ezek együttesét neveztük tévesztési kúpnak. Hogyan lehetséges, hogy mindezek ellenére a hangok lokalizációja mégis jól működik? Három megoldás is létezik ezzel kapcsolatban. Egyrészt a hétköznapi életben a legtöbb esetben nem tiszta, hanem komplex hangokkal találkozunk. Ez azt jelenti, hogy a hangok több frekvencia-összetevőt is tartalmaznak. Ugyanakkor Stevens és Newman vizsgálatukban tiszta hangokat használtak, és a 2000-4000 Hz-es hangoknál mutatott hibázásokat ilyen hangok esetében mutatták ki. Mivel a komplex hangok egynél több frekvenciát tartalmaznak, ezért ezek között valószínűleg van olyan, amelynél jól működik a lokalizáció. A másik megoldás az, hogy a laboratóriumtól eltérően a hétköznapokban mozgatjuk a fejünket. A fejmozgás úgy hat a lokalizációra, hogy megváltoztatja a korábban mozdulatlan hangforrást jellemző interaurális különbségek mintázatát, és ezáltal eloszlatja a hangforrás helyével kapcsolatos bizonytalanságot. Ez azért lehet így, mert a fej minden egyes pozíciója eltérő tévesztési kúppal jár együtt, és már kisebb mozgás is elmozdítja a tévesztési kúpot, lokalizálhatóvá téve az addig a téri helyét tekintve egyértelműen nem azonosítható tárgyat. Végül a harmadik megoldás az lehet, hogy a hangok lokalizációjában felhasználjuk az egyetlen fülből származó téri jelzőmozzanatokat, azaz a monaurális lokalizációt. Nézzük meg ezt egy kicsit részletesebben.
1.2. A monaurális lokalizáció A monaurális lokalizáció a fülkagyló formáján alapul. A fülkagyló elsősorban a függőleges, vagyis frontális síkban való lokalizációt segíti. Eddig nem igazán foglalkoztunk a fülnek ezzel a részével, pontosabban annyit állítottunk róla, hogy a hangok hallójáratba való irányításában van fontos szerepe. Az utóbbi évek kutatásai kiderítették, hogy a lokalizációban ki tudjuk használni azt a jelenséget, hogy a fülkagyló speciális tekervényein a hang a hallójáratba való lépése előtt ide-oda verődik (10.7. ábra). Ezeknek a visszaverődéseknek a mintázata megváltozik attól függően, hogy a hang milyen irányból származik, így ennek figyelembevételével következtetni lehet a hangforrás helyére.
10.7. ábra. A hang visszaverõdése a fülkagyló tekervényeirõl Milyen változásokat okoznak ezek a visszaverődések a fülbe érkező hangban? A fülkagyló hatása egyfajta szűrőként értelmezhető: bizonyos frekvenciák felerősödnek, mások viszont halkabbak lesznek, vagyis a hang spektrális tartalma kismértékben megváltozik. A hang spektrális tartalmának megváltozása a fülkagyló, a fej és 208 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi a hang irányának komplex interakciójából származik. Ezek hatását összefoglalóan fejhez kötött átviteli függvénynek (FKÁF) nevezzük. Az FKÁF hatását a 10.8. ábra szemlélteti.
10.8. ábra. Az FKÁF frekvenciaspektrum-módosító hatása. A sötétített terület jelzi az FKÁF hatását a bejövõ hangra (az ábra illusztráció, nem valós adatokon alapul) Az FKÁF-nek többszörös funkciója van. Egyrészt, lehetővé teszi a hangok lokalizációját. A hangok ugyanis téri irányuktól függően eltérő FKÁF-fel rendelkeznek, mivel az eltérő irányból származó hangok eltérő viszszaverődési mintázatot hoznak létre. Másrészt, az FKÁF jelenléte utal arra, hogy a hang valóban a külvilágból érkezett. Ez utóbbit úgy bizonyították (Batteau 1967), hogy hangokat vettek fel oly módon, hogy a felvételhez használt mikrofonokat két mesterséges fülkagylóban helyezték el. Az így felvett hangokat azután fülhallgatón keresztül játszották le a kísérleti személyeknek, vagyis a személyek egyfajta „távoli külső fület” kaptak. Aki hallgatott már sztereóban rögzített zenét fülhallgatón keresztül, az tudja, hogy az így hallott hangok nem rendelkeznek realisztikus téri minőséggel, hanem mintegy a fejen belül szólalnak meg. A kísérlet során azonban a személyek arról számoltak be, hogy a mesterséges fülkagylókkal rögzített hangok kívülről szóltak, nem pedig a fejen belül. Ráadásul a kísérlet eredményei szerint a személyek lokalizációs teljesítménye is lényegesen jobb volt a hagyományos módon rögzített hangokhoz képest. Mivel a fülkagyló és a tekervények alakja egyénenként változik, ebből következően az FKÁF is mindenkinél más, és egyfajta, az ujjlenyomat analógiájaként „füllenyomatnak” nevezett mintázattal jellemezhető. Ez a füllenyomat tekinthető úgy is, mint olyan „spektrális aláírás”, amellyel a fül minden beérkező hangot ellát. Wightman és Kistler (1989a, b) egy szellemes kísérlettel bebizonyította, hogy az FKÁF valóban egyénenként változik, és ráadásul csak a saját FKÁF-ünk segítségével tudjuk pontosan lokalizálni a hangokat. Vizsgálatukban egyénileg lemérték a kísérleti személyek FKÁF-ét, majd ezeket szintetizálták, vagyis egy számítógép segítségével mesterségesen állították elő. Ezt követően olyan hangokat játszottak le a kísérleti személyeknek fülhallgatón keresztül, amelyekre rákeverték a saját vagy mások szintetizált FKÁF-ét. Azt találták, hogy minél inkább eltért a szintetizált FKÁF a sajáttól, annál többet hibáztak a személyek a lokalizációban. Az egyik legérdekesebb eredmény az volt, hogy a mások FKÁF-én „keresztül” hangokat hallgató kísérleti személyek leggyakrabban abban hibáztak, hogy összecserélték az elöl-hátul irányt. Vagyis ha például a hang 30 fokos szögben érkezett, akkor ugyanolyan gyakran mondták azt, hogy 30 fokról származik, mint azt, hogy 120 fokról. Ez emlékeztethet bennünket a tévesztési kúpra, vagyis arra, hogy vannak olyan téri pontok, amelyek esetén a hangforrás lokalizációja nem egyértelmű. Mindebből az következik, hogy a fülkagyló szerepe pontosan az, hogy ezeknek a binaurális jelzőmozzanatoknak a segítségével megfelelően nem lokalizálható pontoknak a lokalizálását segítse, azaz egyér- telműsítse, hogy a hang elölről vagy hátulról származott-e. A kísérlet eredménye szerint tehát a monaurális lokalizációban nemcsak hogy felhasználjuk a fülkagyló formájából és elhelyezkedéséből származó információt, hanem mindez akkor működik a legjobban, ha saját egyedi fülkagylónkat használjuk. Ez persze a mindennapi életben így van. A kísérleti eredmények arra is utalnak, hogy a hallási tárgyak helyének észlelése tanult: az évek során megtanuljuk, hogy hogyan alkalmazzuk a fülkagyló speciális spektrális aláírását a hangok lokalizációjában. Ha viszont az FKÁF lokalizációban való felhasználása tanult, akkor feltételezhetjük, hogy akár újra is tanulható. Pontosan ezt az eredményt kapták Hofman és munkatársai (1998). Vizsgálatukban négy felnőtt személy lokalizációs képességeit tanulmányozták 209 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi úgy, hogy megváltoztatták a fülkagyló tekervényeit egy, az igazihoz hasonló műanyag tekervény fülbe helyezésével. Ahogyan az várható volt, ez a mesterséges tekervény lényegesen rontotta a személyek hanglokalizációját, mégpedig amiatt, mert megváltoztatta az addigi FKÁF-et. A műanyag tekervény hat héten át tartó viselése után azonban meglepő módon egyre inkább javult a lokalizáció, míg végül elérte az eredeti szintet. Vagyis hat hét alatt a kísérleti személyek megtanulták a módosított FKÁF segítségével lokalizálni a hangokat. Még ennél is meglepőbb volt az az eredmény, hogy miután levették a műanyag tekervényeket, a lokalizációs teljesítmény nem változott. Vagyis nem egyszerűen arról volt szó, hogy a személyek megtanultak egy az eredetitől eltérő FKÁF-et, és ezentúl ennek alapján végezték a lokalizációt, hanem megtartották az eredeti FKÁF alapján történő lokalizációt is. Ez az eredmény azért nagyon meglepő, mert a legtöbb hasonló perceptuális tanulási helyzetben nem ez történik: ezekben az inputot módosító eszköz eltávolítása után egy újabb tanulási szakasznak kell lezajlania ahhoz, hogy az eredeti észlelés visszaálljon. Gondoljunk például Stratton klasszikus fordított szemüvegére (erről bővebben szóltunk már az észlelés természetével foglalkozó bevezetőben). Ezekben a vizsgálatokban a retinális kép irányát prizmákkal megváltoztatták, és bár a személyek bizonyos idő után megtanultak jól látni a prizmával, azt levéve nem állt vissza rögtön az eredeti percepció, hanem újra meg kellett tanulniuk rendesen látni. Az új FKÁF megtanulása inkább olyan, mintha egy második nyelvet tanultak volna meg a kísérleti személyek: az új nyelv megtanulása miatt az eredetit nem felejtjük el, az adott szituációtól függően pedig bármelyiket, a régit és az újat is tudjuk használni. A fentiekben áttekintettük azokat a binaurális és monaurális jelzőmozzanatokat, amelyeket a hangforrások lokalizációjában fel tudunk használni. Láthattuk, hogy elsősorban a hangok terjedési jellegzetességeit kihasználó binaurális jelzőmozzanatokon alapul a lokalizációs képességünk, de ha ezek valamilyen okból nem szolgáltatnak egyértelmű információt a hallási tárgyak helyével kapcsolatban, akkor a monaurális információt is felhasználjuk. Valójában mivel az észlelőrendszernek az a célja, hogy a külvilág minél pontosabb leírását adja, ezért minden rendelkezésére álló információt felhasznál. A továbbiakban a hallási lokalizációnak néhány olyan specifikus jellemzőjét tekintjük át, amely a kétfüles észlelésen alapul: a látási és hallási információ integrálását, a visszhangok észlelését és egy olyan elfedési jelenséget, amely csak két füllel történő hallgatás révén valósul meg.
12.1. táblázat TÉRHATÁS A MOZIBAN ÉS OTTHON A mai modern mozik szinte már elképzelhetetlenek a háromdimenziós hangzási élményt nyújtó hangtechnika nélkül. A legtöbb nagy költségvetésű mozifilm kezdetekor csak úgy sorjáznak a különböző technológiákra vonatkozó szakkifejezések, mint a Dolby Surround, DTS, SDDS stb. Ráadásul a házi- mozirendszerek elterjedésével ma már az otthonunkban is létrehozhatjuk az eddig csak mozikban tapasztalható térhatású (surround) hangzást. De mit is jelentenek ezek a technológiai kifejezések, és hogyan lehet egyáltalán térhatású hangzást létrehozni?
210 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
1.ábra. A Dolby Stereo rendszer A hangok rögzítésének és lejátszásának több módja képzelhető el. A legegyszerűbb eljárás a mono felvétel, amikor is a hangot egyetlen hangsávon rögzítik, és egyetlen hangszóróval játsszák le (mint például a régi rádiókon). Egy kissé valósághűbb hangzási élményt nyújtanak a sztereo felvételek, amelyeket két külön mikrofonnal két hangsávra rögzítenek, és két hangszóróval játszanak le. Ma a sztereo a széles körben elfogadott formátuma a televízió- és rádió- (legalábbis az FM) adásoknak. A térhatású hangfelvétel lényegében ugyanezen a koncepción alapul: itt még több (3-7) sávra rögzítik a hangokat, és ezeket a megfelelő számú hangszóróval játsszák le. A térhatású felvételek esetében már ritkán használják azt az eljárást, hogy több különböző mikrofon segítségével rögzítik az egyes sávokat. Valójában inkább az történik, hogy a film felvétele után a hangmérnökök keverőstúdiókban állítják össze a film hangjait. Igazából itt nyeri el a film a végső hangzását, itt kerül rá a háttérzene, a párbeszédek és a hangeffektusok. Az utóbbi évek során annyira fontossá váltak ezek a hangeffektusok, hogy külön csapat – úgynevezett „foley”-művészek – foglalkoznak a minél valóságosabb hanghatások létrehozásával. A selyemruhák suhogása vagy a cipő alatt csikorgó kövek, ahogy a főhős végighalad az úton, mind-mind a foley-művészek által létrehozott mesterséges effektusok, mivel ezeket a hangokat a film forgatása során képtelenség lenne ilyen minőségben felvenni. Ezek a hanghatások azonban – bár a legtöbb esetben észrevétlenek maradnak, hiszen nem elsősorban ezekre figyelünk – nagyon sokat adnak hozzá a film realitásához és hangulatához. Analóg rendszerek Az első valódi térhatást keltő technika a Dolby Stereo® volt, amelyben öt hangsávot: egy jobb, egy bal, egy középső és két surround sávot használtak, és több hangszórón szólaltattak meg (1. ábra). Ezek közül az elülső csatornákon általában a párbeszédek hallhatók, a hátulsók pedig a hangeffektusok számára vannak fenntartva. Az első olyan film, amelyben a surround csatornák már igen fontos szerepet kaptak, George Lucas Csillagok háborúja című filmje volt. Ebben a hangmérnökök az elülső és hátulsó csatornák közötti hangerőátmenetekkel képesek voltak olyan hatást elérni, mintha a filmben látható űrhajók a közönség feje felett repültek volna el. A későbbiekben a rendszer fontos része lett egy speciális hangszóró, az úgynevezett mélysugárzó (subwoofer), amely kifejezetten az alacsony frekvenciájú hangokat szólaltatta meg. Ezzel lehet létrehozni azt a nagyon speciális dübörgést, amely ma már szinte minden mozifilm sajátja. A házimozirendszerekben megtalálható Dolby Surround® lényegében a Dolby Stereo®-nak a kissé leegyszerűsített változata, amelyben csak három hangsávot: jobb, bal és surround sávot használnak. Ennek oka a helytakarékosság: minél több sávot használunk, annál nagyobb tárolási kapacitásra van szükségünk.
211 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
2. ábra Az SDDS rendszer Digitális rendszerek Egy következő nagy ugrást jelentett a térhatású hangok előállításában a digitális tömörítés megjelenése. Egészen addig ugyanis analóg módon rögzítették a hangokat, ami óriási tárolási kapacitást igényelt. A digitális felvétel elsősorban azt tette lehetővé, hogy sokkal nagyobb mennyiségű hanganyagot tudtak a mozifilmekhez, illetve a házimozi-berendezéseken lejátszott DVD-khez kapcsolni. Az első digitális rögzítést a DTS Digital Sound® technikával végezték el, mégpedig Steven Spielberg Jurassic Park című filmjében. Ezenkívül további digitális technikák is születtek az utóbbi években, köztük a Dolby Digital® és a Sony Dynamic Digital Sound® (SDDS). A DTS és a Dolby Digital, valamint az SDDS közötti legfontosabb különbség, hogy az előbbi esetében a hangot egy külön tárolón (pl. CD) rögzítik, illetve játsszák vissza, míg az utóbbiaknál a hangot, az analóg rendszerekhez hasonlóan magára a filmszalagra rögzítik. A térhatású hangzás létrehozásában annyi különbség van ezen technikák között, hogy a DTS-ben hat, míg az SDDS-ben nyolc hangcsatornát használnak (2. ábra). A térhatású hangzás létrehozására alkalmas házimozirendszerek elterjedését tehát a digitális hangrögzítés tette lehetővé. Ennek segítségével ma már egyetlen DVD-n elfér egy teljes mozifilm képi és hanganyaga, mégpedig általában nagyon jó minőségben. Mindez ugyanakkor a mozifilmgyártást is megváltoztatta, és ma már egy-egy nagyobb film esetében hangtechnikusok egész csoportja dolgozik azon, hogy minél élethűbb és tökéletesebb minőségű hanghatásokat hozzanak létre. Ha legközelebb moziba megyünk, vagy megnézzük kedvenc DVDnket, érdemes végignézni a stáblistán, hogy há- nyan is dolgoztak a hangok rögzítésén és létrehozásán.
1.3. A binaurális lokalizáció speciális esetei 1.3.1. A hallási és látási lokalizáció interakciója A bevezetőben említettük, hogy a tárgyak lokalizációja során elsősorban a látási információt használjuk fel, a hallásnak pedig inkább kiegészítő szerepe van ebben. Az ezzel kapcsolatos bizonyítékok elsősorban olyan szituációkból származnak, amelyekben a hallási és látási információ ellentmond egymásnak. Erre egy hétköznapi példa lehet a mozi esete. A mozikban még a mai modern hangrendszerek korában sem lehet maradéktalanul megvalósítani azt, hogy a hangok a mozivászon közepéről származzanak. Ennek ellenére a főhős beszédét mindig úgy halljuk, mintha az a szájából eredne. Kis paradoxona a háromdimenziós élményt nyújtó „surround” rendszereknek, hogy hiába halljuk a settenkedő szörny lépteit a hátunk mögött elhelyezett hangszórókból, azt soha nem a hátunk mögé, hanem a mozivászonra (vagy adott esetben a házimozink képernyőjére) fogjuk lokalizálni. Vagyis a méregdrága hangrendszer sajnos nem tudja becsapni az 212 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi észlelőrendszerünket, és a látás minden esetben „felülírja” a hallást. A modern, háromdimenziós hangzásról bővebben a keretes szövegben lehet olvasni, a mozgókép és a hangforrás interakcióival pedig később (multiszenzoros integráció) ismét foglalkozunk. A látás téri lokalizációban mutatott dominanciáját a pszeudofonnal végzett klasszikus kísérlet (Young 1928) bizonyította. A kísérletben egy olyan, pszeudofonnak (álmikrofon) nevezett eszközt alkalmaztak (10.9. ábra), amely összecseréli a két fülbe jutó hallási bemenetet. Vagyis a jobb oldalról érkező hangokat a bal fülbe, a bal oldalról érkezőket pedig a jobba vezeti. Mi történik, ha ezzel az eszközzel hallgatjuk a különböző irányból származó hangokat? Attól függően, hogy nyitva vagy csukva van a szemünk, más a cserének az észlelésben megragadható következménye. Ha csukva van a szemünk, akkor felcseréljük az irányokat, mivel a pszeudofon mindkét irányból az ellenkező oldali fülbe vezeti a hangot. Ha azonban nyitva van, és látjuk a hang forrását, akkor a hangot a megfelelő oldalra fogjuk lokalizálni. Noha ez utóbbi esetben természetesen helyesen oldjuk meg a feladatot, mivel a megfelelő irányt választjuk ki, ez valójában nagyon is meglepő, mivel a fülünk pont az ellenkezőjét hallja. Eszerint tehát a vizuális információhoz való hozzáférés esetén agyunk figyelmen kívül hagyja a hallási információt.
10.9. ábra. A pszeudofon Mi lehet az oka a látás viszonylagos dominanciájának? A magyarázat talán a hang és a fény fizikai jellemzőiben keresendő. Azt mondhatjuk, hogy a fény sokkal megbízhatóbban szállít információt egy adott tárgyról, mint a hang. Egyrészt, a hang a fényhez képest nagyon lassan terjed, és emiatt, főként a távoli tárgyak lokalizációjakor, viszonylag nagy hibázáshoz vezet. Másrészt, a hangok nemcsak áthatolnak a tárgyakon, hanem töb- bé-kevésbé vissza is verődnek azokról, és ez lényegesen megnehezíti helyzetük meghatározását, főként azért, 10.8. ábra. Az FKÁF frekvenciaspektrum-módosító hatása. A sötétített terület jelzi az FKÁF hatását a bejövő hangra (az ábra illusztráció, nem valós adatokon alapul) mert nem igazán lehet eldönteni, hogy egy közvetlen vagy egy visszavert hang érkezett-e a fülünkbe. A vizuális rendszer eltérő sajátosságaira visszavezethető feldolgozási aszimmetriákra a multimodális integráció tárgyalásakor, a 15. fejezetben további példákkal találkozhatunk még.
1.3.2. Elsőbbségi hatás Ahogy az előző fejezetben láttuk, a hangok komplex interakcióban állnak a környezettel: bizonyos tárgyak elnyelik, mások visszaverik őket. Egy természetes hallgatási környezetben, mondjuk egy nappali szobában, a hangok a hangforrásból (például kedvenc CD-lejátszónk hangszórójából) több különböző útvonalon jutnak el a fülünkbe. Némelyek közvetlenül érkeznek hozzánk, mások viszont visszaverődhetnek a szoba bútorairól vagy faláról. Ez azt jelenti, hogy a visszaverődött hangok nem egyszerre és nem is egy irányból érkeznek a fülünkbe. Ennek ellenére általában nem vagyunk tudatában ezeknek a visszaverődéseknek vagy visszhangoknak, azaz mindez a hangok lokalizációját sem befolyásolja. A visszaverődésre nem érzékeny hallási észlelés jelenségét laboratóriumi körülmények között általában úgy vizsgálják, hogy hangpárokat mutatnak be a kísérleti személyeknek fülhallgatón keresztül. Mindkét fülbe kétkét hangot adnak, és változtatják a hangpárok közötti időt, vagyis azt, hogy az első hang mikor érkezik a két fülbe (azaz az interaurális idői különbséget, 10.10. ábra).
213 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
10.10. ábra. Az elsőbbségi hatás vizsgálatához használt ingerek. Az első ingerpár a két fülbe kis idői különbséggel ért el, melyet a nyilak jeleznek. A második ingerpár a visszhangot modellezi, és ezeknél az idői különbség nagyobb. A két fülbe adott ingert egyetlen, meghatározott téri minőséggel rendelkező hangként észleljük Az ilyen kísérlet általános, megismételhető eredménye az, hogy ha a két hang között elég rövid idő telik el (legalább 5 ms, de komplex hangok esetén nagyobb is lehet, akár 40 ms), akkor a két hang összeolvad, és egyetlen hangot hallunk két különálló helyett. Amennyiben ez az összeolvadás megtörténik, akkor az összeolvadt hang lokalizációját az első hang iránya határozza meg, függetlenül attól, hogy a második hang milyen irányból jött. Ezt a jelenséget nevezzük elsőbbségi hatásnak (Wallach et al. 1949). Az elsőbbségi hatás azonban nem jelentkezik minden olyan esetben, amikor a két hang megfelelően kicsi idői távolságra van egymástól. A következő feltételek szükségesek a létrejöttéhez: a. A hangok nem folytonosak, hanem tranziensek, azaz rövid ideig tartók és átmenetiek. b. A két hang között legalább 1 ms különbség van; ennél kisebb különbség esetén a két hang valamilyen összesítése adja az összeolvadt hang lokalizációját. c. A második hang az elsőhöz hasonló hangerejű: ha sokkal hangosabb annál (legalább 10-15 dB-lel), akkor nem jön létre a hatás. d. A két hang minőségileg hasonló; minél kevésbé hasonlóak, annál kevésbé működik a hatás. e. Elég idő áll rendelkezésre a hatás felépüléséhez; az elsőbbségi hatás nem jön létre azonnal, a hangpárok néhány ismétlése szükséges hozzá. Fontos kiemelnünk, hogy az elsőbbségi hatás nem azt jelenti, hogy a visszhangokat teljesen elnyomja az első hang, ugyanis képesek vagyunk meghallani a különbséget a visszhanggal együtt hangzó és a visszhang nélküli hangok között. Vagyis a visszhang nem azzal jár, hogy két különálló hangot hallunk, hanem egyetlen, de a visszhang nélkülitől eltérő minőségű hangot észlelünk. Úgy is értelmezhetjük mindezt, hogy a hallórendszer elnyomja a visszhangot: arra következtet, hogy a visszhang ugyanannak a hangnak a visszaverődése, és ezért nem kell figyelembe venni a visszaverődés irányát. Akármennyire is egyszerűnek és automatikusnak tűnik az elsőbbségi hatás működése, úgy tűnik, hogy szintén tanult, és nagyon is magas szinten zajló, kognitív folyamatról van szó. Erre például abból lehet következtetni, hogy nem azonnali: láttuk, hogy kell egy kis idő a felépüléséhez. Vannak olyan eredmények is, amelyek azt mutatják, hogy a hatást a személy hallási környezetről kialakított elvárásai is befolyásolják (például hogy menynyire visszhangosnak gondolja a szobát, ahol tartózkodik). Mivel a legtöbb hétköznapi szituációban a hangokból visszaverődések és visszhangok keletkeznek, az elsőbbségi hatás nagyon fontos szerepet játszik az észlelésben. Ez teszi lehetővé, hogy az akusztikus környezet változásai ellenére viszonylag jól tudjuk lokalizálni, értelmezni és azonosítani a hangokat.
1.3.3. Binaurális felfedés A hanglokalizáció mellett egy másik szerepe is van a binaurális hallásnak: segít elkülöníteni az egyes hangokat a zajos környezet többi hangjától. A hangoknak a zajos környezettől való elkülönítését néha koktélpartijelenségnek is szokták hívni. A jelenség a nevét annak a helyzetnek az alapján kapta, amilyen egy zajos parti. Itt 214 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi általában sok ember beszél egyszerre, és nekünk ebből a háttérzajból ki kell tudnunk választani beszélgetőpartnerünk hangját ahhoz, hogy arra figyelhessünk, amit mond. A legtöbb esetben erre természetesen képesek vagyunk, annak ellenére, hogy a többiek beszélgetéséből keletkező zaj akár hangosabb is lehet, mint partnerünk hangja. A koktélparti-jelenség egyike azon témáknak a pszichológiában, amelyek nagyon sok területen megjelennek, és sok különböző lélektani működés illusztrálására használják fel őket (talán mert a tudomány művelői maguk is kedvelik az effajta szituációkat). A hallási figyelemmel foglalkozó fejezetben többet fogunk beszélni erről a jelenségről. A koktélparti-jelenség empirikus vizsgálatára az alábbi eljárást alkalmazták, amely a binaurális felfedésnek nevezett jelenségen alapul (Durlach 1963). A kísérleti személyeknek fülhallgatón keresztül egyidejűleg hangokat és széles sávú zajt játszottak le az egyik fülükbe (pl. a jobba). A zajelfedés tárgyalásakor (280. skk.) láttuk, hogy a zaj hatására a hang észlelési küszöbe megnövekszik, és a hangot nehezebben halljuk meg. Ebben a kísérletben is ez történt, vagyis a zaj elfedte a hangot. Amikor azonban a másik (bal) fülbe is ugyanolyan zajt adtak, akkor az addig nem hallható hang ismét hallhatóvá vált (10.11. ábra). Ha pedig ezek után a zaj mellé a bal fülbe is a jobb fülbe továbbított hangot adták, akkor a hang ismét eltűnt! Hogyan magyarázható az eredményeknek ez a furcsa mintázata? A választ valószínűleg a hanglokalizációs jelenségekben kell keresnünk. Amíg a hang és a zaj csak a jobb fülbe érkezik, addig az észlelőrendszer azonos hangforrásból származónak tekinti azokat, és a megszokott elfedési hatás érvényesül. Amikor azonban a bal fülbe zajt adunk, akkor a zaj téri konfigurációja a hanghoz képest megváltozik, mivel az most már mindkét fülben hallható. Vagyis most a hangot és a zajt eltérő forrásból származónak ítéljük. Ez viszont csak akkor működik, ha az akusztikai információ nem mond ellent a két fülbe érkező zaj azonos forrásból való származásának, vagyis a két fülbe érkező zaj ugyanolyan fázisú, hangosságú és hangmagasságú. Ha ezek után a hang is megjelenik a bal fülben, akkor megint arra következtetünk, hogy a zaj és a hang ugyanabból a forrásból származik, mivel téri konfigurációjuk megint csak hasonló lesz. A binaurális felfedés egyfajta átmenetet képez a hallási objektumok lokalizációja és azonosítása között. Ha belegondolunk, a felfedés esetében az történik, hogy a lokalizációs mechanizmusok segítségével választjuk külön a tárgyakat (azaz a hangot és a zajt): ha azok egy forrásból származónak tűnnek, akkor egy hallási tárgynak tekintjük őket, ha viszont úgy véljük, hogy különálló forrásból származnak, akkor két tárgyat észlelünk. A továbbiakban azt tekintjük át, hogy milyen egyéb folyamatok révén valósul meg a hallási tárgyak elkülönítése és felismerése.
10.11. ábra. A binaurális felfedés kísérleti illusztrációja. a) Az elfedő zaj megnehezíti a hang detektálását (ezért a szomorú arc). b) A másik fülbe adott ugyanolyan elfedő zaj hatására a hang detektálása könnyebbé válik. c) Ha azonban a másik fülbe a zajon kívül hangot is adunk, akkor a hang detektálása nehezebb lesz
2. Hallási mintázatok és objektumok észlelése Az eddigiekben a hallási élménynek már számos jellemzőjét bemutattuk: áttekintettük, hogyan történik a hangforrás helyének megállapítása, vagyis a lokalizáció, és még előbb azt is, hogy a hanginger egyéb jellemzőit, mint a hangerőt és a hangmagasságot, miként kódolja az idegrendszer. A mindennapi életben azonban nem különálló akusztikai jellemzőket észlelünk, hanem egységes, egész dolgokat. Noha a hangok magasságát és hangosságát dolgozzuk fel, ezek nem önmagukban léteznek, hanem mindig tárgyakhoz kapcsoljuk őket. A 215 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi hallási észlelés végső állomásai nem ezek, hanem egy hallási tárgy: madárcsicsergés, a vonat zakatolása, a cselló szólama egy vonósnégyesben vagy egy szeretett személy hangja. Ezek azok, amiket eltárolunk az emlékezetünkben, és amik, ha újra találkozunk velük, ismerősek lehetnek. A hallási tárgyak azonosításának legfontosabb problémája, hogy a legtöbb esetben nagyon sok hang szól egyszerre, és nekünk ezekből kell kiválasztanunk azt, amelyik számunkra valamilyen okból fontos. Természetesen addig, amíg nem választjuk szét az egyes hangokat, felismerni sem tudjuk őket. Az alábbiakban ezért nagyrészt arról lesz szó, hogy az egyszerre beérkező hangokat hogyan csoportosítjuk egységes hallási objektumokba, és hogy ezekből hogyan tudjuk létrehozni a külvilág reprezentációját.
2.1. A hallási színtérelemzés Képzeljük el, hogy egy könnyűzenei koncerten veszünk részt egy koncertteremben: villódznak a fények, dübörög a zene az óriási hangszórókból, legalább négy hangszer szól egyszerre, és a többiek körülöttünk együtt énekelnek az énekessel. Ekkor barátunk fülünkbe kiabálva felhívja a figyelmünket arra, hogy mennyire fantasztikus volt az a gitárszóló, amit a gitáros a refrén előtt játszott. Valószínűleg mindenki képes az itt leírt feladatok megvalósítására: tudjuk követni az egész zenekar játékát, mégpedig a közönség zaja ellenére, tudjuk követni az egyik hangszer hangját a többi ellenére, sőt bizonyos mértékig még beszélgetni is tudunk, háttérbe szorítva az összes többi hangot. Ráadásul mindez nem is igazán okoz nehézséget, hanem valójában egy nagyon is élvezetes tevékenységnek találjuk. Alább arra fogunk rámutatni, hogy a fentiek látszólagos egyszerűsége ellenére mennyire nehéz feladata van a hallórendszernek akkor, amikor ezeket az észlelési folyamatokat meg akarja valósítani. Ennek illusztrálására vessünk egy pillantást a 10.12. ábrára, amely egy zeneszám spektrogramját ábrázolja. A spektrogram a hangok ábrázolásának egy olyan módja, amely az idő függvényében tünteti fel a hangok frekvenciáját. A 8. fejezetben láthattunk már két másik ábrázolást is: az oszcillogramon az idő függvényében tüntettük fel a hangnyomás változását (lásd 8.3. ábra), a spektrálison pedig a frekvencia függvényében az amplitúdót (ezt hívtuk spektrális ábrázolásnak, lásd 8.7. ábra). A spektrogram mintegy ennek a kettőnek az ötvözete: az idő függvényében ábrázolja az egyes frekvenciatartományokban található hangenergia mennyiségét, amelyet a söté- tebb és világosabb foltok fejeznek ki. Minél sötétebb a folt, annál több energiát tartalmaz egy adott tartomány. Vagyis a spektrogram a hang mindhárom fizikai tulajdonságát képes egyszerre ábrázolni: a hangerőt, a frekvenciát és az idői lefutást. A spektrogramon történő ábrázolást gyakran alkalmazzák a beszédhangok megjelenítésére, ezért a beszédészlelés kapcsán még visszatérünk rá.
10.12. ábra. Egy zenei részlet spektrogramja A spektrogram azért is fontos, mert tulajdonképpen azt modellezi, ahogyan az alaphártya leképezi a hangokat. A spektrogram létrehozására egy olyan eljárást alkalmaznak, amelyben egy átfedő sávszűrőket tartalmazó készlet képezi le az egyes frekvenciatartományokat, csakúgy, mint ahogy azt az alaphártyáról feltételezzük (lásd 283. sk.). Az y tengely, ahol a frekvenciát ábrázoljuk, megfeleltethető a függőleges irányba fordított alaphártyának, a sötét és világos foltok pedig annak, hogy aktív-e az alaphártya adott területe vagy sem. Az időt ábrázoló x tengely úgy képzelhető el, mintha az alaphártya aktivitását minden időpillanatban egymás mellé helyeznénk.
216 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi A 10.12. ábrán bemutatott spektrogram tartalmaz minden olyan információt, amely a hallórendszer számára rendelkezésre áll: a hang frekvenciatartományait, az egyes tartományok hangerejét és mindennek időben történő változását. Azt is feltételezhetjük, hogy a hallórendszer magasabb szintjei az információt ehhez nagyon hasonló formában kapják meg. Mindez azt jelenti, hogy egy ilyen inputot kell a hallórendszernek elemeznie oly módon, hogy kinyerje belőle a hangok jellemzőit, és külön-külön objektumokba csoportosítsa az egyszerre hallható akusztikus információt. Jelen esetben a spektrogram által megragadott külvilági esemény egy dal rövid részlete, amelyben egyszerre szól egy dob, egy basszusgitár, egy zongora és egy énekhang. A spektrogramot nézve azonban az egyes hangszerek hangjának szétválasztása lehetetlen feladatnak tűnik. Mégis, hallórendszerünk képes arra, hogy kizárólag a spektrogramban található információk alapján szétválassza ezt a négy hangszert, majd pedig kövesse az általuk lejátszott dallamot is. Ez az egyszerű példa jól szemlélteti, hogy hogyan működik a hallási észlelés. Az akusztikus világ különálló hangforrásokat tartalmaz, amelyek különböző fizikai jellemzőkkel rendelkező hangokat bocsátanak ki. Az észlelés során az a feladatunk, hogy a külvilág pontos leképezését alakítsuk ki, vagyis a hangforrások mentális reprezentációjának hűen kell tükröznie azok különállóságát. Ha négy hangszer szólt egyszerre, akkor négy hangszer mentális reprezentációját kell kialakítanunk. A probléma az, hogy az egy időben hallatszódó hangok egyszerre érkeznek a fülbe, és egyszerre történik meg az idegi impulzusokká való átalakításuk is. Ez azt jelenti, hogy a külvilágban elkülönülő források a transzdukció során összekeverednek, és nem őrzik meg elkülönültségüket. Az észlelés magasabb rendű folyamatainak ezért az a feladatuk, hogy mintegy „rendet tegyenek”: eldöntsék, hogy melyik akusztikai információ (frekvencia, intenzitás, lokalizáció) melyik hangforráshoz tartozik, vagyis szétválasszák azokat. Ezt a szétválasztási műveletet nevezzük Bregman (1990) nyomán hallási színtérelemzésnek. A színtérelemzés problémájával egyébként nemcsak a hallásnál találkozhatunk, hanem a látásnál is. A vizuális információ esetében persze lényegesen egyszerűbb a feladat, mert a külvilág leképezése során megmaradnak a tárgyak közötti téri viszonyok. Ennek ellenére az a tény, hogy a háromdimenziós világ a retinán két dimenzióban képeződik le, jelentősen megnehezíti az észlelés arra irányuló feladatát, hogy a külvilág pontos mását hozza létre. Nézzük meg a 10.13. ábrát, amely egyszerű építőkockák rajza.
10.13. ábra. A vizuális színtérelemzés illusztrációja Első ránézésre világos számunkra, hogy az ábrán A-val és 5-vel jelölt részek egyetlen tárgyhoz tartoznak, amelyet azonban eltakar egy másik elem. Annak ellenére így gondoljuk ezt, hogy az A és B elem között nincs folytonosság, és elvileg nyugodtan tekinthetnénk őket két különálló síkbeli négyszögnek, ahelyett hogy egyetlen térbeli, mélységgel rendelkező téglatestnek látjuk. A retinális információ mindkét interpretációt lehetővé teszi, annak ellenére, hogy a valóságban csak a második helyes. Feltételezhetjük, hogy a látás esetében működnek olyan feldolgozási folyamatok, amelyek a kétértelmű érzékszervi információból a helyes mentális reprezentációt alakítják ki. Amire ezzel a példával rá szeretnénk mutatni, az az, hogy a külvilág megfelelő leképezése érdekében a látás esetében is az első lépés annak megállapítása, hogy mely jellemzők tartoznak össze, és melyek nem. Ez olyan, mintha az összetartozó részeket egyszerűen azonos színűre festenénk, és azt mondanánk, hogy azok az elemek tartoznak össze, amelyek azonos színűek. Feltételezhetjük, hogy a hallás esetében is valami ilyesmit kell csinálnunk: az összetartozó, egy forrásból származó részeket (mondjuk a koncert hallgatásakor a gitár hangját) csoportosítanunk kell, és el kell választanunk a többi, ezzel egy időben hallható hangtól. A csoportosítás és elválasztás folyamata emlékeztethet bennünket a látás kapcsán tanult figura-háttér elkülönítésre. Tudjuk, hogy a figura a vizuális információ azon része, amelyre a figyelmünk irányul, és háttérként szolgál az összes többi olyan jellemző, ami nem része a figurának. Tudjuk azt is, hogy a figura-háttér elkülönítést az úgynevezett Gestalt-elvek vezérlik: például a közelség, zártság, hasonlóság és jó folytatás. Abból
217 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi a tényből kiindulva, hogy a hallási észlelés esetében ugyanaz a feladatunk, mint a látásnál, nevezetesen, hogy elkülönült tárgyak reprezentációját hozzuk létre, feltételezhetjük, hogy hasonló csoportosítási elvek segítik a reprezentáció létrejöttét. Arról, hogy a Gestalt-elvek hogyan működnek a hallásnál, a fejezet későbbi részében még részletesen fogunk beszélni. A továbbiakban azt tekintjük át, hogy milyen jellemzőkkel rendelkeznek a csoportosítási folyamat eredményeként létrejövő hallási tárgyak vagy más néven a hallási láncok.
2.2. A hallási láncok A hallási tárgyak helyett a továbbiakban a hallási lánc kifejezést fogjuk használni a hallási észlelés alapegységének megjelölésére. A „tárgy” szó ugyanis nagyon erősen kötődik a vizuális észleléshez, és ezért félrevezető lehet a hallás tanulmányozásakor. Milyen különbségek fedezhetők fel a vizuális tárgyak és a hallási láncok között? A látás esetében a tárgyak a külvilág azon objektumai, amelyekről a visszavert fény eljut a szemünkbe, és olyan tulajdonságokkal rendelkeznek, mint alak, méret, szín stb. Ezzel szemben a hallás során csak olyan dolgokról szerezhetünk tudomást, amelyekkel valami történik, és emiatt hangot bocsátanak ki. A szél átfúj a fák levelein, és megzörgeti őket, egy harkály kopogtat a fa törzsén, egy mentő szirénázik a távolban. Ezek mind egyedi, különálló és aktív történések (a hallás passzív visszaverődéseket is képes feldolgozni – ennek segítségével tájékozódik például a denevér; ezeket azonban nagyon ritkán használjuk, így nem foglalkozunk külön velük). A hallási lánc kifejezés ezekre a történésekre, más néven hallási eseményekre vonatkozik. A tárggyal szemben a lánc szó jobban megragadja a hallási események azon tulajdonságát, hogy ezek legtöbb esetben időben elnyúló, idői kiterjedéssel rendelkező történések. Felmerülhet a kérdés, hogy miért nem hívjuk a hallási láncokat egyszerűen hangoknak. Ennek két oka is van. Egyrészt egy esemény (pl. egy dallam) több hangot is magában foglalhat, és emiatt érdemes elkülönítenünk az esemény alkotórészeit (a hangokat) magától az eseménytől (a hallási lánctól). Ráadásul egy hallási lánc egyéb események hierarchikus szerveződését is tartalmazhatja: láncnak hívhatjuk az egyik hangszer által játszott dallamot, de az összes, egyszerre szóló hangszer is lehet egy lánc, ha például az egyéb környezeti zajoktól különítjük el. A másik oka a lánc kifejezés használatának, hogy a hang egyszerre fejezi ki a fizikai történést és ennek mentális reprezentációját. Ezért a továbbiakban a hallási láncot fogjuk használni a mentális reprezentációkra, míg a fizikai történésre a hangot vagy hallási eseményt. A hallási láncok tehát a hallási észlelés alapegységéül szolgálnak, és így a tárgyak hallásbeli megfelelői. Azokhoz hasonlóan bizonyos összetartozó tulajdonságok csoportját reprezentálják. Vagyis mindaz a jellemző, amit a hallórendszer feldolgoz (hangerő, hangmagasság, hangszín, lokalizáció), végül a hallási láncokhoz rendelődik hozzá. Vagyis, ahogy már említettük, a hangmagasság vagy hangosság nem állhat önmagában, hanem mindig valamilyen dologhoz kapcsolódik. Ahogyan a vizuális világban a szín csak egy adott tárgy tulajdonságaként jelenik meg, és nem önmagában (kivételt a prizmával összetevőire bontott fény színei jelenthetnek), úgy a hangmagasság is csak egy hallási lánc jellemzőjeként szerepelhet, és nem önmagában. A probléma ott kezdődik, ha egyidejűleg több hang is szól. Ekkor elvileg sok különböző lánc jön létre, amelyek mindegyike megfelel a külvilágban egy-egy hangforrásnak. A problémát az okozza, hogy a sok hangforrás akusztikai jellemzői összekeverednek, mivel ezek egyszerre érik el a fület, és egyszerre kerülnek feldolgozásra. Ahogy azt fentebb láttuk, a hallási színtérelemzésnek pontosan az lesz a feladata, hogy a hallási láncokhoz hozzárendelje a nekik megfelelő akusztikai tulajdonságokat. A hallási láncok alkotják tehát észlelésünk középpontját, amelyekhez a perceptuális jellemzőket hozzákapcsoljuk. Az objektumok elkülönítése azonban csak egy köztes lépés a külvilág reprezentációjában és megértésében: az elkülönítéssel annyit teszünk, hogy kijelöljük, mely fizikai jellemzők mely dolgokhoz kapcsolódnak. Azt is mondhatjuk, hogy a hallási színtérelemzés egy szükséges, de nem elégséges lépés a hallási láncok létrejöttében, mivel ezt még nagyon sok feldolgozási lépcső követi addig, amíg felismerjük és kategorizáljuk a körülöttünk lévő világ dolgait. Ha ez nem történik meg, akkor nem zongora- meg énekhangot hallunk, hanem különböző hangosságú és hangmagasságú hangok kavalkádját, amelyek mindenféle jelentés és értelem nélkül kavarognak körülöttünk. Sajnos azonban nagyon keveset tudunk még azokról a folyamatokról, amelyek végül értelemmel és jelentéssel ruházzák fel a hallott világot. Emiatt az alábbiakban elsősorban a hallási láncokat létrehozó csoportosítási folyamatokkal foglalkozunk. A továbbiakban arról lesz szó, hogy hogyan valósítja meg a hallórendszer az egyidejűleg beérkező hallási információ láncokra bontását. Mielőtt erre rátérnénk, tisztáznunk kell, hogy milyen módon szerveződhet a hallási információ. Kétféle szerveződés képzelhető el ugyanis: a szekvenciális vagy horizontális szerveződés és 218 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi a spektrális vagy vertikális szerveződés. Ezt a két szerveződést legjobban egy kotta illusztrálja: a kottában egymást követő hangok, amelyek a zene dallamát adják meg, szekvenciálisan, vagyis sorozatosan, egymás után szerveződnek. Az egymás feletti hangok, amelyek egyszerre szólalnak meg, és egy harmóniát vagy több hangszert jelölnek, vertikálisan vagy spektrálisan szerveződnek. Ha visszatérünk a fejezet elején említett koncertpéldánkra, akkor azt mondhatjuk, hogy az egyszerre megszólaló hangszerek közül egynek a kiválasztása a spektrális szerveződést példázza, az egy hangszeren játszott dallam követése pedig a szekvenciális szerveződésre példa.
12.2. táblázat ALBERT BREGMAN
Albert Bregman 1936-ban született Torontóban, Kanadában. Itt járt egyetemre és szerzett diplomát pszichológiából 1959-ben. PhD-fokozatát a Yale-en szerezte kísérleti pszichológiából 1963 -ban. Ezt követően a Harvar- don tanított és kutatott, majd 1965-ben visszatért Kanadába, Montrealba, a McGill Egyetemre, ahol jelenleg is mint professzor emeritus dolgozik. Bregman kutatásaiban elsősorban a hallási színtér elemzésének problémájával foglalkozik, amelyet több mint ötven tudományos publikációban tárgyal. Az 1990-ben megjelent Auditory Scene Analysis című könyve foglalja össze addigi kutatásainak eredményét, és a könyv azóta is a hallási színtérelemzés alapművének számít. Lényegében Bregman kutatásai hívták fel elsőként a figyelmet arra, hogy a hallási észlelés tanulmányozása nem a hangosság- és hangmagasság-észlelés megértésével ér véget, hanem valójában ott kezdődik.
2.3. A hallási láncok szekvenciális szerveződése 2.3.1. Az idő és a frekvencia szerepe a hallási láncok kialakulásában Azt a folyamatot, amelynek során az észlelőrendszer az egyes láncokat egymástól elválasztja, hallási láncra bontásnak nevezzük (Bregman 1990). A láncra bontás jelenségét laboratóriumi körülmények között az alábbi, azóta klasszikussá vált kísérlettel vizsgálták (Bregman-Campbell 1971). A kísérleti személyeknek egy tiszta hangokból álló hangsort játszottak le, amely 3 mély és 3 magas hangot tartalmazott. A hangokat úgy mutatták be, hogy váltogatták a mély és magas hangokat, például 1-4-2-5-3-6 sorrendben (az 1, 2, 3 a mély, a 4, 5, 6 a magas hangokat jelöli). A hangok közötti idői távolságot változtatták, és azt az eredményt kapták, hogy ennek függvényében megváltozott a hangsor észlelése. Ha a hangokat nagy idői távolsággal, vagyis lassan játszották le, akkor a személyek az eredeti sorrendben hallották a hangokat, vagyis a mély és magas hangok váltakozását észlelték. Ha azonban egyre kisebbre állították az idői távolságot, vagyis egyre gyorsabban játszották le a hangokat, akkor ez az észlelet megváltozott: már nem váltakozó mély és magas hangokat hallottak a személyek, hanem egy csak mély hangokat tartalmazó dallamot és egy ezzel párhuzamosan hallható, csak magas hangokat tartalmazó dallamot. Vagyis az eredeti 1-4-2-5-3-6 sorrend helyett az 1-2-3 és 4-5-6 észleléséről számoltak be (10.14. ábra). A két párhuzamosan hallható hallási lánc kialakulása valójában illúzió: két láncot hallunk, holott csak egy hangforrás szólt. Ezt a jelenséget ezért illuzórikus láncra bontásnak nevezzük, elkülönítve ezzel a láncra bontásnak attól az általános jelenségétől, amellyel a hallási tárgyakat elkülönítjük.
219 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
10.14. ábra. Az illuzórikus láncra bontás jelensége. A pontok az egyes hangokat jelölik, a folytonos vonal illusztrálja a hangsor eredeti észleletét, a szaggatott vonal pedig a láncra bontás révén létrejövő, két párhuzamosan hallható hangsor észleletét Az illuzórikus láncra bontásnál tehát úgy tűnik, hogy a hallórendszer a tempótól függően az eltérő jellemzők alapján csoportosítja a hangokat: eredetileg a csoportosítás a hangok időbeli elrendeződése mentén történt meg, de később a nagyon gyors tempónál a hangok a hangmagasságuk szerint csoportosultak. Hogyan szemlélteti ez a kísérlet a hallási láncok kialakulását? Azt mondhatjuk, hogy a mély és a magas hangok eredetileg egyetlen hallási lánchoz tartoztak, egyetlen eseményként fogták fel őket a kísérleti személyek. A gyorsítás hatására azonban a hangok két különálló láncra bomlottak fel: az egyik láncba a mély, a másikba pedig a magas hangok kerültek. Vagyis ugyanazt a fizikai ingert a bemutatás jellegzetességétől függően hol így, hol úgy „értelmezték” a kísérlet résztvevői, azaz a kétféle ingeridőzítés két eltérő észleletet eredményezett. Az illuzórikus láncra bomlásnál a láncok kialakulását két tényező befolyásolta: egyrészt a hangok frekvenciája, másrészt pedig a közöttük lévő idői távolság. A hasonló elrendezést használó további vizsgálatokban kimutatták, hogy ez a két tényező egyszerre határozza meg, hogy az egymást követő hangok egy láncba tartoznak-e (egybeolvadás), vagy szétválnak két külön láncra (szétválás). A szétváláshoz ugyanis nem elég, ha megfelelő gyorsasággal játsszuk le a hangokat, az is szükséges, hogy közöttük elég nagy frekvenciabeli eltérés legyen. Egyfajta kompromisszum valósul meg a frekvencia és idő között: minél nagyobb a frekvenciabeli távolság, annál kevésbé kell gyorsan lejátszani a hangokat a szétváláshoz, és minél kisebb a frekvenciabeli távolság, annál gyorsabban kell lejátszani őket. A láncra bomlás ebben a nagyon egyszerű szituációban valójában még ennél is bonyolultabb. Bizonyos határok között ugyanis a hallgató dönthet arról, hogy egyetlen láncot vagy több láncot akar-e hallani: ugyanaz a hangsor ugyanolyan jellemzők mentén észlelhető így is, úgy is. Ez voltaképpen hasonlít a kétértelmű ábrákra: bár az ingerfeltételek ugyanazok, hol fiatal hölgyet, hol idős nénit láthatunk, és az észlelet tudatosan változtatható. Ez arra utal, hogy a láncra bontás esetén is magas szintű észlelési folyamatok működnek. Vannak ugyanakkor bizonyos határok, amelyek korlátozzák ezt a választási lehetőséget. Azt a határt, ami felett a hangokat már nem lehet egy hallási áramlatba szerveződőnek hallani, idői koherenciahatárnak (IKH), azt a határt pedig, ami alatt nem lehet az egymást követő hangokat külön áramlatban hallani, hasadási határnak (HH) nevezzük. Ezt a két határt szemlélteti a 10.15. ábra. Látható, hogy a két határt az idő és a frekvencia együttesen határozza meg, vagyis a kettő komplex interakciója befolyásolja a hallási láncok létrejöttét.
220 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi
10.15. ábra. Az idõi koherenciahatár (IKH) és a hasadási határ (HH) A két határt a következőképpen kell értelmeznünk: az idői koherenciahatár azt a határt jelzi, ahonnan kezdve a hallórendszer mindenképpen a hangsor két láncra bontására kényszerül, vagyis, akármennyire is szeretnénk, nem vagyunk képesek egy láncba tartozónak hallani a hangokat. Ahogyan a 10.15. ábrán látható, az idői koherenciahatár úgy alakul, hogy kb. 100 milliszekundumos hangok közötti idői távolság felett meredeken nő a frekvencia értéke. Ez azt jelenti, hogy nagy idői távolság esetén nagy frekvenciakülönbség szükséges ahhoz, hogy a hangsort két láncra bontva halljuk. A hasadási határ viszont azt a korlátot jelzi, ami alatt már nem tudjuk a hangsort két láncra bomlónak hallani, vagyis a hangok mindenképpen egy láncba tartozónak hallatszanak. Szintén a 10.15. ábrán látható, hogy ez a határ kevésbé változik meg: a hangok közötti idői távolságtól többé-kevésbé függetlenül, nagyjából hasonló frekvenciaeltérés esetén van az a határ, ami a hangsort mindenképpen egy láncban tartja. A továbbiakban arra keressük a választ, hogy miért jön létre egyáltalán két láncra bomlás ebben a kísérletben? Azt mondtuk, hogy a fenti kísérletben a két párhuzamosan hallható hallási lánc kialakulása valójában egy illúzió. Ugyanakkor tudjuk, hogy az illúziók mindig valamilyen észlelési mechanizmus működéséből származnak, pontosabban abból, hogy a mechanizmus az adott körülmények között nem működik megfelelően. Az tehát a kérdés, hogy az illuzórikus láncra bomlás esetében milyen mechanizmusok működhetnek. Kétféle magyarázat is létezhet, élettani és pszichológiai. Az egyik élettani magyarázat szerint a hallórendszer periferiális mechanizmusai felelősek a láncra bomlásért. Eszerint a szétválás csak akkor jöhet létre, ha a hangok között elég nagy frekvenciabeli eltérés van ahhoz, hogy eltérő kritikus sávokkal rendelkező szőrsejteket hozzanak aktivációba az alaphártyán. Ha két hang egymáshoz közeli frekvenciával rendelkezik, akkor feltételezhetően ugyanazt a szőrsejtet aktiválja, ez pedig nem teszi lehetővé a két külön lánc létrejöttét. Ez az elmélet tehát a hasadási határ létrejöttét magyarázza jól. Egy másik élettani magyarázat azon alapul, hogy léteznek az agyban olyan idegsejtek, amelyek nem bizonyos frekvenciákra, hanem ezek megváltozására érzékenyek. Az elmélet szerint a láncra bomlás azért következik be, mert ezek a „változásdetektorok” nem képesek követni a gyors és nagymértékű frekvenciaváltozásokat, és így a kisebb, egy láncon belüli változásokkal tudnak csak foglalkozni. Ez az elképzelés az idői koherenciahatárra ad inkább magyarázatot. Mindkét élettani elméletre jellemző, hogy az illuzórikus láncra bomlást az észlelőrendszer egyfajta hibás működésének tartja: azért jön létre, mert a hallórendszer nem rendelkezik elég nagy frekvenciaérzékenységgel, vagy nem képes elég gyorsan követni a változásokat. A Bregman nevéhez fűződő pszichológiai elmélet ezzel szemben az illuzórikus láncra bomlást az észlelőrendszer sikeres működésének tartja. Az elmélet szerint a hallórendszer ebben a helyzetben is egy hallási színtérelemzést végez el, vagyis megpróbál következtetni arra, hogy a hangok milyen forrásból származnak. Ehhez a perceptuális szerveződés Gestalt-elveit használja, például a hasonlóság vagy közelség elvét, amelyek szerint az egymáshoz hasonló vagy közel lévő hangok feltételezhetően egy forráshoz tartoznak. Ezek az elvek ugyanakkor egy olyan általánosabb elv részeinek tekinthetők, amely azt írja le, hogy milyen jellemzőkkel rendelkeznek a hallási láncok általában. Például a hallási láncokra jellemző, hogy folyamatosak, és bizonyos állandósággal rendelkeznek, vagyis nem változnak meg egyik pillanatról a másikra. Így, amíg a fenti kísérletben a hangok lassan követik egymást, addig a közelség elve érvényesül, vagyis az egymás melletti hangokat egy láncba csoportosítjuk, annak ellenére, hogy viszonylag nagy frekvenciabeli változások vannak a láncon belül. 221 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi Ez a változás ugyanis még belefér az általános elvbe, hiszen lassan történik. Gyorsabb tempó esetén azonban az idői közelséggel szemben egyre inkább a frekvenciabeli hasonlóság válik dominánssá, ugyanis egyre kevésbé lesz valószínű az, hogy az egymás melletti hangok egyetlen forrásból származnak, mivel túl nagy és túl gyors változásokat tartalmaznak. Vagyis azt mondhatjuk, hogy a hangok csoportosítása a Gestalt-elvek alapján történik ugyan, de ezeket a hallási színtérelemzés általános elveinek megfelelően használjuk fel. A láncra bomlás egyik magyarázata tehát az észlelés hibájának, a másik viszont az észlelés sikerének tartja azt. Van-e mód arra, hogy ezt a két eltérő magyarázatot összeegyeztessük? Bregman szerint igen. A két magyarázat ugyanis eltérő szintet képvisel, az egyik élettani, a másik pedig pszichológiai. Ezért elképzelhető, hogy a láncra bomlás élettani szinten hibának minősül ugyan, de pszichológiai szinten sikernek számít, hiszen az észlelést szolgálja – mindkettő lehet igaz, csak éppen eltérő nézőpontból. Bregman szerint ez olyan, mint a mamutcsapda: fizikai szempontból az a tény, hogy a csapda teteje beszakad a mamut alatt, hibának számít, de ez a hiba egy másik szinten sikerhez vezet, nevezetesen az állat elejtéséhez és a vadászok jóllakásához. Összefoglalva, az illuzórikus láncra bomlás jelensége jól modellezi az általános hallási láncok kialakulásának folyamatát, és segítségével ellenőrizhetők az ezekkel kapcsolatos elméleti feltételezések.
2.3.2. Figura-háttér hatás a láncra bomlásban Ha létrejönnek a hallási láncok, akkor az az érdekes dolog történik, hogy a két lánc közül csak az egyikre tudunk figyelni, a másik mintegy a háttérben marad. Ez szintén ismerős jelenség: a látás esetében a figura-háttér hatásnál találkoztunk már azzal, hogy egyszerre csak egy tárgyra figyelünk, és minden más a háttérben marad. A láncra bomlásnál is megvalósítható az, hogy hol az egyik, hol a másik láncra figyeljünk. A nem figyelt lánc kevésbé jól hallható, és kevésbé vesszük észre, ha valamilyen változás történik benne. Ez azt mutatja, hogy a hallási láncok a vizuális tárgyakhoz nagyon hasonlóan viselkednek, nemcsak hogy elkülönülnek egymástól, de valamelyik rögtön megragadja a figyelmünket (vagy tudatosan ráirányítjuk), és ekkor a másik kevésbé pontosan észlelhető. Annak bizonyítására, hogy valóban csak egyetlen láncra figyelünk egyszerre, Bregman és Rudnicky (1975) az alábbi kísérletet végezte el. A kísérleti személyek feladata az volt, hogy két eltérő hangmagasságú hang, A és B sorrendjét megállapítsák. A hangok különböző sorrendben követhették egymást. Ez a feladat önmagában nagyon könnyű, még viszonylag nagy tempó esetén is. Ha azonban ezeket a hangokat két másik elterelő hanggal (ezeket jelöljük E-vel) mutatták be, E-A-B-E vagy E-B-A-E sorrendben, akkor az A-B hangpár sorrendjének megállapítása nagyon nehézzé vált (10.16. ábra). A hangpár ugyanis elveszítette egyediségét, és egy nagyobb mintázat részévé vált, ekkor azonban már gyors bemutatás mellett nagyon nehéz volt a sorrendjük megállapítása.
10.16. ábra. A Bregman–Rudnicky-kísérlet (1975) ingeranyagának illusztrációja Vegyük észre, hogy ebben az esetben az E-A-B-E hangsor egyetlen láncot alkot, ugyanis nincs olyan jelzés, ami arra utalna, hogy két különálló hangforrásból származnának. Feltételezhetjük ugyanakkor, hogy ha sikerülne valami olyan bizonyítékot szolgáltatni az észlelőrendszer számára, ami alapján szétválasztaná az E hangokat és az A-B hangpárt, akkor – mivel az A-B újból egyedül alkotna egy hallási láncot – ismét könnyű lenne a sorrendjüket meghatározni. A kutatók valóban ezt az eredményt kapták. További hangok, úgynevezett „foglyulejtők” (F) hozzáadásával a 10.16. ábrán látható hangsort hoztak létre, és most már ebben az F-F-F-E-AB-E-F-F sorozatban kellett az A-B sorrendjét megállapítani. Ahogy az ábrán látható, az F hangok hangmagassága közelebb volt az E, mint az A-B hangok magasságához. Emiatt a F hangokból létrejövő lánc
222 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi azonos láncba csoportosította az E hangokat, vagyis valóban mintegy foglyul ejtette azokat. Az A-B pár viszont frekvenciabeli eltérése miatt egy ezektől eltérő láncot alkotott. Vagyis két lánc: egy F-F-F-E-E-F-F és egy ezzel párhuzamosan hallható A-B jött létre. A hipotézisnek megfelelően ennek a csoportosításnak valóban az lett az eredménye, hogy az A-B sorrend megállapítása pontosabbá vált, mivel most már csak ez a két hang alkotta a figyelt hallási láncot. A kísérlet eredménye tehát úgy értelmezhető, hogy egyszerre csak egy lánc az, amelyre figyelünk, és csak a figyelt lánc tulajdonságait dolgozzuk fel. A kísérletben bizonyítást nyert az is, hogy a láncok ugyanúgy viselkednek a hallási környezettől – vagyis a háttértől – elválasztva, mint amikor önmagukban szerepelnek, mindenféle zavaró ingerek nélkül. Vagyis úgy tűnik, hogy az észlelőrendszer jó munkát végez a láncokra bontási folyamatban, hiszen ennek eredményeképpen egy hasonló jellemzőkkel rendelkező lánchoz jutunk, mint amikor a lánc önmagában állt, és nem kellett elválasztanunk azt a többi akusztikai eseménytől. Az eddigiekben a hallási láncok szekvenciális szerveződésében két akusztikus jellemző szerepét hangsúlyoztuk: a hangok közötti idői távolságot és a frekvenciájuk különbségét. De mi a helyzet a többi jellemzővel? Menynyire fontosak ezek, és fel lehet-e őket használni a hangforrások azonosításában és így a hallási láncok létrehozásában?
2.4. Egyéb tényezők szerepe a hallási láncok kialakulásában A hallási láncok szekvenciális szerveződésének célja, hogy az egy hangforráshoz tartozó hangsorokat csoportosítsa. Láttuk, hogy a csoportosítást a hasonlóság és közelség szerveződési elvei alapján végezzük el, és elsősorban a hangok közötti idői és frekvenciabeli távolságot vesszük figyelembe. Ugyanakkor azt, hogy több hang egy hangforráshoz tartozik-e, egyéb jellemzők is alátámaszthatják. Így például feltételezhető, hogy az azonos téri irányú, hangosságú vagy hangszínű hangok ugyanabból a forrásból származnak, vagyis egyetlen akusztikus esemény részei. Nézzük meg, hogy ezek a jellemzők hogyan befolyásolják a láncra bomlást. a. Lokalizáció. Ha hangforrások szétválasztásáról beszélünk, akkor azt gondolhatnánk, hogy ennek leghatékonyabb módja, hogy a hangokat a téri irányuk, vagyis a lokalizációjuk alapján választjuk el egymástól. Azok a hangok tartoznának egy láncba, amelyek azonos helyről származnak. Valóban vannak bizonyítékok arra, hogy a hallási láncra bontásban felhasználjuk a téri információt, de úgy tűnik, hogy nem ez a legerősebb kulcs. Ez azt jelenti, hogy ha a téri lokalizáció valami miatt konfliktusba kerül egy másik típusú információval (például a hangok frekvenciájával), akkor nem a lokalizáció alapján fogjuk a hangokat csoportosítani. Ezt igazolta Diana Deutsch skálaillúziója (Deutsch 1975). A kísérlet során két zenei skálát, egy emelkedőt és egy ereszkedőt játszottak le a kísérleti személyeknek. A skálák hangjait fülhallgatón keresztül játszották le úgy, hogy a két fülbe eltérő, de egyszerre megszólaló hangok érkeztek (10.17. ábra).
10.17. ábra. A skálaillúziót létrehozó ingerminta. Az a) részben fülenként, a b) részben pedig a skálába tartozás szerint vannak feltüntetve a hangok. A c) rész mutatja, hogy a kísérleti személyek hogyan észlelték valójában a hangokat. Kék hangjegyek: bal fülbe érkező hangok; piros hangjegyek: jobb fülbe érkező hangok
223 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi Ahogyan az ábra a) részén látható, az emelkedő és ereszkedő skálákat úgy mutatták be, hogy a skála hangjai váltakoztak a két fül között. Amikor a jobb fülben az emelkedő skála egyik hangja szólt, akkor eközben a bal fülben az ereszkedő skála egyik hangja, majd pedig váltottak, és a jobb fülbe érkező következő hang már az ereszkedő skálához tartozott. (Szánjunk egy kis időt ennek az ingermintának a megértésére; a http://www.brl. ntt.co.jp/IllusionForum/basics/auditory/onkai-e.html oldalon meg is hallgathatjuk.) A két szimultán hangzó és a két fül között váltakozó hangsort kétféleképpen lehet csoportosítani: aszerint, hogy melyik fülbe érkeztek, és aszerint, hogy melyik skálába tartoztak. Az ábra a) része mutatja a fülek szerinti csoportosítást, a b) rész pedig a skálába tartozás szerinti csoportosítást. Kérdés, hogy a valóságban hogyan csoportosítjuk a hangsorokat. A kísérleti személyek valójában mindkettőtől eltérően észlelték a hangokat, és a legtöbben az ábra c) részén látható észleletről számoltak be. Vagyis két, egyszerre hallatszódó skálát észleltek; az egyik fülben egy ereszkedőt, a másikban pedig egy emelkedőt, de mindezt úgy, hogy amikor a két hangsor találkozott (lásd a vonást az ábrán), akkor azok nem keresztezték egymást, hanem mindkettő mintegy visszafordult. Mindez azt jelenti, hogy a személyek frekvencia szerint, és nem téri helyzet szerint csoportosították a hangokat. Ez annál is meglepőbb, mert az egyes hangok nagyon erős téri minőséggel rendelkeztek: mindegyik egy adott fülhallgatóból érkezett, és ez teljesen egyértelműen meghatározta, hogy jobbról vagy balról származik-e a hang. Ennek ellenére a hallási láncok kialakulásában a frekvenciabeli hasonlóság és jó folytatás képes volt elnyomni a téri helyzetből fakadó hasonlóságot. a. Hangosság. A lokalizációhoz hasonlóan a hangosságot is ki tudjuk használni annak érdekében, hogy csoportosítsuk a feltételezhetően egy hangforrásból származó hangokat. Egyes vizsgálatok szerint 3-4 dB-es különbség elég ahhoz, hogy a hangokat külön hallási láncra bontsuk. Ugyanakkor a hangossággal kapcsolatban is azt kell elmondanunk, mint a lokalizációnál: ez a frekvenciánál gyengébb észlelési kulcs, vagyis ha esetleg a hangosság és a frekvencia ellentmond egymásnak, akkor a frekvencia alapján történő csoportosítás kerül ki győztesen. Feltételezhető, hogy a hallási láncok kialakulásában a hangosság nem annyira az egy objektumhoz való tartozásra utal, hanem inkább a hangok kezdetét és végét jelzi. Az előző fejezetben a hangszín tárgyalásakor láthattuk, hogy az egyes tárgyak hangjai közötti különbségért nemcsak a spektrális tartalom felelős, hanem a hangok burkológörbéje is, ami pontosan a hangerő váltakozását jelenti. A komplex hallási tárgyaknak tehát alapvető, azaz inherens tulajdonsága, hogy bizonyos mértékű hangerőváltozást mutatnak, így ezt a jellemzőt nem a legszerencsésebb a tárgyak elkülönítésére felhasználni. Azt mondhatjuk, hogy ha jelen van hangosságbeli eltérés is a hangok között, akkor ez erősítheti a láncra bomlást, önmagában azonban nem túl erős csoportosító jellemző. b. Hangszín. A lokalizációtól és a hangosságtól eltérően a hangszín nagyon is fontos jellemző a szekvenciális csoportosításban. Ahogy a 9. fejezetben láttuk, a hangok felismerését a hangszín teszi lehetővé, ez az a jellemző, ami elkülöníti egymástól az azonos hangmagasságon és hangosságon megszólaló hangszerek hangját. Feltételezhető tehát, hogy lényeges a szerepe a hangok csoportosításában. Warren és munkatársai (1969) kísérlete arra mutatott rá, hogy a különböző hangszínnel rendelkező hangok sorrendjét nagyon nehéz megállapítani. Említettük már, hogy a hangok sorrendjét akkor tudjuk pontosan megállapítani, ha egy láncba tartoznak. Ezért, ha külön láncba csoportosítjuk őket, akkor nehezebb lesz a sorrend megállapítása, mivel a láncok közötti sorrendet sokkal nehezebb megállapítani, mint a láncon belülit. Warrenék négy különböző hangot használtak: egy sziszegő, egy berregő, egy tiszta és egy beszédhangot. Mindegyik hang 200 milliszekundum hosszú volt, és szünet nélkül követték egymást újra és újra, ugyanolyan sorrendben lejátszva. A viszonylag hosszú bemutatási idő ellenére a kísérleti személyek képtelenek voltak a hangok sorrendjét megállapítani. Ez az eredmény értelmezhető úgy, hogy a nagyon különböző hangszínek miatt az észlelőrendszer minden hangot külön hallási láncba csoportosított, és ez megnehezítette a sorrendjük megállapítását. Egy másik kísérletben Van Noorden (1975, idézi Bregman 1990) arra volt kíváncsi, hogy azok a komplex hangok, amelyekből kivették az alaphangot, vajon melyik jellemzőjük alapján csoportosulnak: a hiányzó alaphang ellenére is létrejövő hangmagasság vagy a spektrális tartalom, vagyis a hangszín alapján. Azt az eredményt kapta, hogy ha a hangok magassága ugyanolyan volt, de eltérő harmonikusokat tartalmaztak (az eltérő harmonikusok természetesen vezethetnek ugyanolyan hangmagassághoz!), akkor a más hangszínű hangok egy külön hallási láncot alkottak. Ha ellenben a magasságuk különbözött, de a harmonikusok hasonlóak voltak, akkor egy láncba kerültek. Vagyis úgy tűnik, hogy a hangszín a hangmagasságnál is erősebb csoportosító tényező, mivel az azonos hangszínű hangok az eltérő hangmagasság ellenére nem váltak szét külön láncokra. A hangszínnek ugyanakkor, bár láthatóan a szekvenciális csoportosítást is vezérli, sokkal lényegesebb a szerepe a hallási láncok spektrális csoportosításában, vagyis abban, hogy az egyszerre hallható hangokat (például egy
224 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi koncert egyetlen pillanatában egyszerre megszólaló hangszerek hangját) szétválasszuk. A következőkben ezt a spektrális szerveződést fogjuk áttekinteni.
2.5. A hallási láncok spektrális szerveződése A hallási láncok spektrális szerveződése esetén tehát az a kérdés, hogy hogyan bontjuk részekre az egy időben szóló hangokat. Ha újra megnézzük a zenei részlet spektrogramon történő ábrázolását (10.12. ábra), akkor látható, hogy minden időpillanatban több frekvenciatartomány is tartalmaz hangenergiát. Tudjuk, hogy a komplex hangok alaphangból és felharmonikusokból állnak. Ha több komplex hang egyszerre szól, akkor egy adott időpillanatban nagyon sok harmonikus (és több alaphang is) található egyszerre a hangingerben, és ezek átfedésben vannak egymással. A hallási színtérelemzés feladata ebben a helyzetben az, hogy ezeket az átfedésben lévő, összekeveredett harmonikusokat szétválogassa, vagyis megállapítsa azt, hogy melyek járnak együtt, melyek származnak egy forrásból. Ez azzal a következménnyel jár, hogy ha több komplex hang is szól egyszerre, akkor ahhoz, hogy ezek hangszínélménye létrejöjjön, előbb szét kell válogatnunk, hogy mely frekvenciakomponensek mely hangokhoz tartoznak. A 10.18. ábrán látható, hogy hogyan képzelhető el a harmonikusok összekeveredése. A továbbiakban áttekintünk néhány olyan elvet és szabályt, amelyet felhasználunk a hallási láncok spektrális szervezésére.
10.18. ábra. A különböző alaphanggal rendelkező komplex hangok felharmonikusainak átfedése
2.5.1. Az idő és a frekvencia szerepe a spektrális szerveződésben Bregman és Pinker (1978) a következő kísérletet végezték el a spektrális tartalom csoportosításának szabályszerűségeit feltárandó. A kísérleti személyeknek három különböző frekvenciájú tiszta hangot mutattak be, a 10.19. ábrán látható módon. A hangokat sokszor ismételték. Ez az ingerminta kétféle észlelethez vezethet: egyrészt hallhatunk egy tiszta hangot (A), amelyet egy két frekvenciakomponensből (B és C) álló komplex hang követ. Ebben az esetben spektrális csoportosítást alkalmaznánk, mivel az egy időben szóló B és C hangokat egy láncba csoportosítanánk. A másik észlelet ezzel szemben a szekvenciális csoportosításon alapulna: ekkor az A és B hangot észlelnénk egy láncba tartozónak, és ezzel párhuzamosan hallanánk a C hangot egy külön lánc részeként. Vegyük észre, hogy ekkor nem hallanánk komplex hangokat, hanem három különálló tiszta hangot.
10.19. ábra. A Bregman–Pinker-kísérlet (1978) ingeranyagának illusztrációja
225 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi A kérdés persze az, mitől függ, hogy melyik csoportosítás jön létre. Bregman és Pinker szerint ezt két tényező határozza meg: az A és B hang frekvenciabeli közelsége, illetve a B és C hang időbeli közelsége, azaz egybeesése. Ezt a két tényezőt az ábrán nyilak jelölik. A kísérlet eredménye szerint az A és B hang akkor került egy láncba, és jött létre két párhuzamos hallási lánc, ha frekvenciájuk nagyon hasonló volt. Ez ugyanaz az elv, amit az előzőekben a szekvenciális csoportosításnál láttunk: a hallórendszer azokat a hangokat véli egy forrásból eredőknek, amelyek hasonló frekvenciával rendelkeznek. Ezzel szemben a B és C hang akkor került egy láncba, és következésképpen akkor jött létre a kettő kombinációjával a komplex hang, ha a két hang kezdete – és lehetőség szerint a vége is – egybeesett, vagy más szóval szinkronban volt. A későbbiekben látni fogjuk, hogy a spektrá- lis szerveződésnél a harmonikusok időbeli egybeesése játssza az egyik legfontosabb szerepet. A két tényező – az A-B frekvenciaközelség és a B-C egybeesés – azonban egyszerre működött, és ebből következően versengett egymással. Ha az A és B közelsége kicsi volt, akkor valószínűbb volt ezek szekvenciális szerveződése, ha viszont B és C közel volt egymáshoz, vagy egybeesett, akkor ezek spektrális csoportosulása volt valószínűbb. Emlékezzünk vissza, hogy korábban a szekvenciális szerveződésnél azt láttuk, hogy a frekvenciabeli és időbeli közelség ott is verseng, és attól függően, hogy melyik kerül fölénybe, a hangok az idői sorrend vagy a frekvenciabeli hasonlóság szerint csoportosultak. Úgy tűnik tehát, hogy a versengés a különböző elvek között általános jelenség a hallási színtér elemzésében. A fenti kísérlet azonban csak egy lehetséges csoportosítási elvet ragad ki, ráadásul egy nagyon leegyszerűsített szituációban. Milyen más szabályok használhatók fel annak érdekében, hogy az átfedő frekvenciakomponenseket szétválasszuk?
2.5.2. Egyéb elvek a spektrális szerveződésben Az egyik ilyen szabályszerűséget úgy nevezhetnénk, hogy „régi plusz új” szabály. Eszerint, ha az éppen hallható frekvenciakomponensek között van egy olyan csoport, amelyik valamilyen okból egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor érdemes ezeket egy láncba csoportosítani. A megmaradó komponenseket pedig egy vagy több másik lánc létrehozására lehet felhasználni. Ezen szabály működését a következő kísérlettel demonstrálták (van Noorden 1975, idézi Bregman 1990). A kísérleti személyeknek két gyorsan váltakozó hangot mutattak be: egy tiszta hangot (A) és egy komplex hangot (B), amely sok frekvenciakomponensből állt, de ezek közül az egyik megegyezett A-val. Az A-B hangsor gyors és ismétlődő bemutatása során azt figyelték meg, hogy az A hang nem egyszer, hanem kétszer hangzott el. Ez az észlelet úgy jöhetett létre, hogy a B hang komponensei közül az A kivált. Ennek az lehetett az oka, hogy a „régi plusz új” szabály alapján az észlelőrendszer arra következtetett, hogy az A hang folytatódott a B-vel párhuzamosan. Az A hang kiválása ugyanakkor nem befolyásolta nagymértékben a B minőségét (hangszínét), mivel az sok harmonikusból állt, és egyetlen harmonikus kiválása nem okozott túl nagy változást. Egy következő fontos szabályszerűség a harmonikussági alapelv. Eszerint a hallórendszer hajlamos azokat a harmonikusokat csoportosítani, amelyek feltételezhetően egy alaphanghoz tartoznak. Tudjuk, hogy a harmonikusok frekvenciája az alaphang frekvenciájának egész számú többszöröse. Azt is láttuk, hogy a hallórendszer a komplex hangok hangmagasságának megállapításakor, és főként a hiányzó alaphang esetén történő hangmagasság-észleléskor ki is használja ezt a matematikai összefüggést. Ezt a képességünket azonban nemcsak a hangmagasság megállapítására, hanem annak meghatározására is fel tudjuk használni, hogy mely harmonikusok tartoznak egy objektumhoz. Hasonlóan fontos csoportosítási szabály a közös sors elve. A fentebb bemutatott Bregman-Pinker-kísérlet (1978) kapcsán már említettük, hogy az egy időben szóló hangok akkor csoportosulnak leginkább, ha egyszerre kezdődnek vagy végződnek. A közös sors elve kicsit általánosabban ugyanerre a dologra vonatkozik. Azt mondja ki, hogy az észlelőrendszer azokat a hangokat fogja csoportosítani, amelyek egyszerre változnak meg. A látásban a mozgás észlelése kapcsán láthattuk már ugyanennek az elvnek a működését, amely például a biológiai-nem biológiai mozgás észlelésénél különleges teljesítménnyel ruházza fel az észlelőrendszert. Kérdés, hogy vajon a hallás esetében a hangok milyen jellemzőjében történhet olyan változás, amely a közös eredetükre enged következtetni. Ha belegondolunk, hogy a hangok milyen fizikai jellemzőkkel rendelkeznek, akkor könnyen rájöhetünk, hogy a frekvencia és a hangerő időbeli változásának, vagyis modulációjának követéséről lesz itt szó (a 8. fejezetben beszéltünk már e két modulációról). Eszerint az egyszerre hallható hangok közül azokat fogjuk csoportosítani, amelyeknek frekvenciája vagy amplitúdója együtt járó, azaz korrelált módon változik meg, illetve amelyek egyszerre kezdődnek és végződnek (a hangszínnel foglalkozó részben láthattuk, hogy a hangkezdet és hangvégződés felfogható az amplitúdóváltozás speciális eseteként). A közös sors elvének működését láthatjuk Rasch (1978) kísérletében, amely a hangkezdetek egybeesésének hatását vizsgálta a hangok elkülönülésére. A kísérletben két komplex hangot használtak, amelyek hasonló spekt226 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi rális szerkezettel, de eltérő alaphanggal rendelkeztek. Egy időben adva a hangokat, azok elfedték egymást, pontosan úgy, ahogy azt a zajelfedési kísérletekben láttuk. A kísérleti személyek feladata az volt, hogy a magasabb alaphanggal rendelkező hangot detektálják a másik hang hátterében. Ha a két hang pontosan egyszerre kezdődött, akkor a célhang detektálásához annak majdnem olyan hangosnak kellet lennie, mint az elfedő hangnak (10.20. a ábra).
10.20. ábra. A Rasch-kísérlet (1978) ingeranyagának illusztrációja Ha azonban a célhang előbb kezdődött, akkor azt sokkal kisebb hangerő mellett is észrevették (10.20. b ábra). Ráadásul a célhang akkor is folyamatosan hallhatónak tűnt, ha valójában nem is volt jelen az elfedő hang mellett (10.20. c. ábra)! Ehhez az kellett, hogy a célhang előbb kezdődjön, és hogy az elfedő hang hasonló frekvenciakomponenseket tartalmazzon, mint a célhang. Ezt a jelenséget a folytonosság illúziójának nevezzük, és a zártság Gestalt-elvével magyarázható. A folytonosság illúziójának van egy ennél is erőteljesebb demonstrációja, amelyet a 10.21. ábra illusztrál. Tegyük fel, hogy az ábrán látható módon három, frekvenciájában változó hangot mutatunk be. Ezeket egyértelműen különálló, gyors hangmagasság-változást mutató hangoknak észleljük. Ha ezek után a hangokat elválasztó szüneteket széles sávú zajjal töltjük ki, a hangok észlelése megváltozik: egyetlen folytonos és hangmagasságában lassan változó hangot fogunk hallani. Ha szemügyre vesszük az ábrát, akkor valójában ez a folytonossági illúzió vizuálisan is nyilvánvaló: nem különálló vonalakat látunk, hanem egy összefüggő vonalat, amelyet néha eltakarnak a széles hasábok. Tehát ezt a hangsort hallgatva a hallási élményünk is hasonló lesz, ugyanígy fogunk hallani egy összefüggő hangot, és néha ezzel együtt rövidebb idejű zajt. A folytonosság illúziója azonban csak akkor valósul meg, ha valóban van bizonyíték arra, hogy a hang az elfedés ellenére folytatódik. Ehhez ebben az esetben egyrészt az járul hozzá, hogy a szüneteket kitöltő zaj tartalmaz olyan frekvenciakomponenst, amely a hangban is megvan, másrészt pedig, hogy a szünet utáni hang jó folytatása a szünet előttinek.
10.21. ábra. A folytonosság illúziója. A vonalak a hangok frekvenciájának változását illusztrálják, a hasábok pedig a szüneteket kitöltő széles sávú zajt 227 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi A hangkezdetek közötti különbséget a zenehallgatás közben is maximálisan kihasználjuk annak érdekében, hogy az egyes hangszerek hangjait elválasszuk egymástól. Ahogy a hangszín tanulmányozásakor láttuk, a hangszerek hangjai nemcsak abban különböznek egymástól, hogy eltérő spektrális tartalommal rendelkeznek, hanem a hangkezdeti idejükben is. A húros hangszerek hangja például hirtelen, gyors hangosodással kezdődik, a fúvósoké viszont folyamatosan, hosszabb idő alatt hangosodik fel (természetesen a hosszabb idő alatt néhány tíz milliszekundumot kell érteni). Az utolsó megemlítendő tényező a spektrális szerveződésben a hangok téri iránya. Egy szimfonikus zenekar esetében a különböző hangszerek hangjai viszonylag eltérő irányból származnak. Ez nagymértékben elősegíti a hangszerek hangjának szétválasztását. Ahhoz azonban, hogy a lokalizáció alapján szét tudjuk választani a hangokat, az szükséges, hogy minden egyes spektrális komponensnek külön-külön rendelkezésre álljon a téri iránya. Ezen a feldolgozási szinten ugyanis még nincsenek teljes hangok, vagyis nem tudunk a hangokhoz téri minőséget rendelni, hiszen éppen azon dolgozunk, hogy ezek a teljes hangok létrejöjjenek. Szerencsére úgy tűnik, hogy a hallórendszer képes arra, hogy a komplex hangokat felépítő frekvenciakomponensekhez különkülön téri irányokat rendeljen, és ha ez megtörtént, akkor a komponensek téri jellemzőit felhasználhatjuk azok csoportosításában. Összefoglalásul azt mondhatjuk, hogy a hallórendszer sok különböző akusztikus jellemzőt figyelembe vesz annak érdekében, hogy az egy időben megszólaló hangokat forrásuk szerint szétválasszuk. Ahogy láthattuk, egyszerre több csoportosítási elv is működhet, és ezek versengése és együttműködése vezet oda, hogy az akusztikus világ mentális reprezentációja létrejön. Természetesen a hétköznapi életben ritkán fordul elő, hogy a különböző elvek ellentmondanak egymásnak, és így a legtöbb esetben a hallási színtér elemzése helyes megállapításokat tesz az akusztikus esemény számával, irányával és általános tulajdonságaival kapcsolatban. Ezeknek a mechanizmusoknak a tanulmányozása ugyanakkor felhívja a figyelmet arra, hogy az a teljesen automatikusan és minden erőfeszítés nélkül végbemenő tevékenység, amikor például egy koncert hallgatása közben csak a hegedű melódiájára figyelünk, valójában milyen rendkívül bonyolult feldolgozási folyamatokon alapul. A hallási objektumok szerveződésének szabályszerűségei azt szolgálják, hogy az egymás után következő, de egy forrásból származó hangok (szekvenciális szerveződés), valamint az egyszerre megszólaló hangok (spekt- rális szerveződés) csoportosuljanak és elkülönüljenek egymástól. A csoportosítást a hallásban is olyan elvek vezérlik, mint amilyeneket már a Gestalt-pszichológusok is leírtak a vizuális információ szerveződésével kapcsolatban. A hallási színtér elemzésében az alábbi csoportosítási elvek érvényesülnek: a. Hasonlóság. A hasonlósági elv értelmében azok a hangok fognak egy csoportot alkotni, amelyek valamilyen jellemzőjükben hasonlítanak egymáshoz. Ez a jellemző lényegében az eddig említettek közül bármi lehet: hangosság, hangmagasság, hangszín, téri helyzet. Láttuk, hogy a hasonlóság alapján történő csoportosítással lehet magyarázni Bregman klasszikus, három mély és három magas hangot tartalmazó kísérletében a frekvencia alapján létrejövő két külön láncot, a magas és mély hangok váltakozó idői sorrendje ellenére. b. Jó folytatás. Ez az elv a hangforrások azon jellemzőjét használja ki, hogy azokban nem történik hirtelen, illetve nagymértékű változás. Ha a hallórendszer egy ilyen változással találkozik, akkor azt általában úgy értelmezi, hogy a változás pillanatában egy másik forráshoz tartozó hang szólalt meg. c. Közös sors. Ez az elv, mint a spektrális szerveződésnél már láttuk, arra vonatkozik, hogy az azonos forrásból származó frekvenciakomponensek általában együtt kezdődnek és végződnek, valamint amplitúdójuk és frekvenciájuk egyszerre változik. A közös sors elve elsősorban a komplex hangok spektrális komponenseinek csoportosításában használható ki, és meglehetősen erőteljes csoportosítási elv, hiszen ahogy Bregman és Pinker 1. , illetve Rasch (1978) kísérlete kapcsán láttuk, képes felülkerekedni a frekvenciabeli hasonlóságon, valamint az elfedésen. a. Zártság. A zártság elve a hallás esetében akkor érvényesül, ha a hangokat időlegesen más hangok elfedik, és emiatt azokról nem áll rendelkezésre szenzoros információ. Ekkor az elfedett hang mégis folyamatosan hallhatónak tűnik. A zártság elve felelős a folytonosság illúziójáért. b. Hozzátartozóság (kizáró allokáció). Ezt az elvet azért nevezik hozzátartozóságnak, mert egy hangot, illetve komponenst egyszerre csak egy tárgyhoz, vagyis hangforráshoz lehet hozzárendelni. A kizáró allokáció viszont arra a tulajdonságra utal, hogy ha egy hangot egyszer már felhasználtunk egy adott hallási lánc csopor
228 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi tosítására, akkor azt több lánchoz nem rendelhetjük hozzá. A kizáró allokáció valójában egy nagyon általános elv, ami a többi csoportosítási elvvel együtt hat: ha egyszer már valamely másik elv alapján létrejött a csoportosítás, akkor a kizáró allokáció valósítja meg azt, hogy az egyes hangok ne tartozzanak több lánchoz. A fejezetben részletesen bemutattuk azt is, hogy a hallás esetében az észlelőrendszernek mennyire hasonló problémákat kell megoldania, mint a látásnál. A hallás esetében is tárgyakat, objektumokat észlelünk, nem pedig egymástól független jellemzőket, és ahhoz, hogy létre tudjuk hozni a külvilág mentális reprezentációját, meg kell tudnunk határozni, hogy az egyes jellemzők mely tárgyakhoz kapcsolódnak. Albert Bregman a hallási színtérelemzéssel foglalkozó könyvét így zárja: „Ami számomra leginkább figyelemre méltó..., az az, hogy sok olyan dolog, amit magától értetődőnek tekintünk, mint például a zenei vagy emberi hang egységessége, valójában csoportosítási folyamatok révén jön létre. A másik dolog, ami szintén nem magától értetődő, hogy a hangok sok olyan egyszerű jellemzője, amelyet – úgy tűnik – automatikusan dolgozunk fel, valójában szintén csoportosítás révén jön létre. Ilyenek például a hangmagasság, hangosság, hangszín, helyzet vagy disszonancia. Végül, számomra nagyon meglepő, hogy a hallás azon folyamatai, amelyek a csoportosítást létrehozzák és ezeket a perceptuális élményeket megalapozzák, nagyon gyorsan, néhány milliszekundum alatt kell, hogy végbemenjenek.” (Bregman 1990, 704-705.)
2.6. ÖSSZEFOGLALÁS 1. A hallási észlelés feladata a világ értelmes, jelentéssel bíró egységekre bontása. Ehhez egyrészt meg kell határoznunk, hogy hol található a tárgy (lokalizáció), másrészt pedig meg kell határoznunk, hogy mi az (azonosítás). 2. A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok forrásának helyét és távolságát megállapítjuk. Mivel a hallási információ nem tartalmaz egyértelmű téri információkat, a lokalizáció következtetés révén valósul meg. A lokalizációban binaurális (két füllel észlelhető) vagy monaurális (egy füllel észlelhető) információkat használunk fel. 3. A binaurális lokalizáció az interaurális hangerőkülönbségen (IHK) és az interaurális idői különbségen (IIK) alapul. Az IHK a fej árnyékoló hatása miatt, az IIK pedig amiatt jön létre, hogy a hang a két fület eltérő időben éri el. Mindkét jelzőmozzanat esetében találunk olyan téri pontokat, amelyek lokalizációja nem egyértelmű. Ezt nevezzük tévesztési kúpnak. A lokalizáció duplexelmélete szerint a két jelzőmozzanaton alapuló lokalizáció eltérő frekvenciájú hangok esetében működik jól: a mély hangok esetében inkább az IIK, a magas hangok esetében viszont az IHK. Valamint van egy olyan frekvenciatartomány (2000-4000 Hz között), amelyben egyik jelzőmozzanat sem működik megfelelően. Az IIK esetében ismert a lokalizáció idegi háttere, melyet a késleltetési vonal elmélete ír le. 4. A monaurális lokalizáció a fülkagyló formáján alapul, és elsősorban a függőleges irányú lokalizációt segíti. A lokalizációban a fülkagyló tekervényeiről visszaverődő hang spektrális megváltozását használjuk fel, amelyet a fejhez kötött átviteli függvény ír le. 5. A pszeudofonnal végzett vizsgálatok rámutattak arra, hogy a látási információ alapján történő lokalizáció képes befolyásolni a hallási lokalizációt. 6. A lokalizáció során képesek vagyunk kiszűrni a hangok visszaverődéséből származó információkat. Ezt kísérletileg az elsőbbségi hatásnak nevezett jelenséggel vizsgálják, amely szerint, ha a két hang között elég rövid idő telik el, akkor azok összeolvadnak, és egyetlen hangot hallunk. Az összeolvadt hang lokalizációját az első hang iránya határozza meg, függetlenül attól, hogy a második hang milyen irányból jött. 7. A binaurális hallás a hanglokalizáció mellett segít elkülöníteni az egyes hangokat a zajos környezet többi hangjától. A binaurális felfedés jelensége arra vonatkozik, hogy az egyik fülbe adott zaj csak akkor fedi el a hangot, ha azokat egy forrásba tartozóknak tartjuk. 8. A hangok azonosításához az egyszerre a fülünkbe érkező hangokat különálló hallási objektumokba, úgynevezett hallási láncokba kell csoportosítanunk. Ezt a hallási színtérelemzés folyamata valósítja meg. A hallási láncok a hallási észlelés alapegységéül szolgálnak, és így a tárgyak hallásbeli megfelelői. 9. A hallási színtérelemzés során a perceptuális csoportosítás Gestalt-elvei használjuk fel, amelyek a hallási információ kétféle szerveződését valósítják meg: a szekvenciális (horizontális) és a spektrális (vertikális) szerveződést.
229 Created by XMLmind XSL-FO Converter.
10. FEJEZET – A hallási objektumok észlelése – hol és mi 10. A szekvenciális szerveződés során az egymást követő hangok összetartozását kell eldöntenünk. Ez elsősorban a hangok közötti idői és frekvenciatávolságon alapul, de ezenkívül a hangok lokalizációját, hangosságát és hangszínét is fel tudjuk használni a hallási láncok csoportosításához. 11. A spektrális szerveződés esetén az a kérdés, hogy hogyan bontjuk részekre az egy időben szóló hangokat. Ebben szintén az idői és a frekvenciatávolságot használjuk ki, valamint olyan elveket, mint a „régi plusz új” szabály (ha az éppen hallható frekvenciakomponensek között van olyan, amely egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor érdemes ezeket egy láncba csoportosítani), a harmonikussági alapelv (azokat a harmonikusokat csoportosítjuk egybe, amelyek feltételezhetően egy alaphanghoz tartoznak) és a közös sors elve (azokat a hangokat csoportosítjuk egybe, amelyek egyszerre változnak meg).
2.7. KULCSFOGALMAK binaurális felfedés, elsőbbségi hatás, fejhez kötött átviteli függvény, hallási láncok, hallási színtérelemzés, interaurális hangerőkülönbség, interaurális idői különbség, lokalizáció duplexelmélete, pszeudofon, tévesztési kúp
2.8. ELLENŐRZŐ KÉRDÉSEK 1. Mondjunk egy olyan példát, amikor a hallási lokalizáció jobban működik, mint a látási! 2. Rosszabbul lokalizáljuk-e a hangokat, ha fülhallgatót viselünk, amelyben hangos zene szól? 3. Hogyan lehet a visszhangot a tárgyak helyének megállapítására felhasználni? 4. Miért nincs tudomásunk a hétköznapokban a tévesztési kúpról? 5. Megváltozik-e a hallási élményünk, ha egy sztereóban rögzített zene hallgatásakor felcseréljük a jobb és bal oldali fülhallgatókat? 6. Álljunk meg egy pillanatra a tankönyv olvasásában, és figyeljünk a körülöttünk hallható hangokra. Hány hallási láncot tudunk elkülöníteni? És hányra tudunk egyszerre figyelni? 7. Egy zeneszám hallgatásakor milyen hallási láncok jönnek létre a szekvenciális szerveződés révén? És a spekt- rális szerveződés révén? 8. Mi a különbség a látási és a hallási színtérelemzés között?
2.9. AJÁNLOTT OLVASMÁNY Bregman, A. S. 1990. Auditory scene analysis: Theperceptual organization of sound MIT Press, Cambridge, MA.
2.10. AJÁNLOTT HONLAP http://www.aip.org/pt/nov99/locsound.html (Ismeretterjesztő cikk, sok illusztrációval, a hanglokalizációval
230 Created by XMLmind XSL-FO Converter.
13. fejezet - 11. FEJEZET– A beszéd észlelése A környezet valamennyi hangja közül valószínűleg a többi ember által keltett beszédhangok a legfontosabbak a számunkra. A beszéd célja a nyelvi közlések megfogalmazása: gondolataink és érzéseink kifejezése, valamint annak megértése, hogy mások hogyan válaszolnak erre. A beszédfolyamatnak két lényeges összetevője van. Az adott beszélő közösség számára feldolgozhatóan produkált nyelvi közlés, azaz a beszédprodukció, valamint a mások által produkált nyelvi közlés megértése, azaz a beszédértés. A 11.1. ábra a beszédfolyamat leegyszerűsített modelljét mutatjabe .
11.1. ábra. A beszéd folyamata Amint az az ábrán jól látható, mind a beszédprodukció, mind a beszédmegértés több részfolyamatból áll. Ezek közül ebben a fejezetben a beszédhangok észlelésével, annak törvényszerűségeivel foglalkozunk. A beszédhangokból összeálló szavak és mondatok megértésével, valamint az azokat kialakító szabályokkal a nyelv és gondolkodás témakörében foglalkozik a pszichológia. Ezt részletesen az Általános pszichológia 3. kötete tárgyalja (Csépe-Győri-Ragó [szerk.]: Általános pszichológia. 3. Nyelv és gondolkodás). Maga a beszédészlelési folyamat is több összetevőből áll. A mondanivalónkat mondatokba foglaljuk, amelyek szavakból épülnek fel, a szavak pedig beszédhangokra tagolhatók. A beszédészlelés kifejezéssel azt az észlelési folyamatot jelöljük, amelynek során a beszédhangok, hangkapcsolatok felismerése, vagyis azonosítása történik. A beszédhangok a beszédnek azok a legkisebb elemei, amelyek egy adott nyelvben jelentésmegkülönböztető szerepűek. A beszédhangokon kívül a szavak alkotóelemeit nevezhetjük fonémáknak is. A két kifejezés azonban nem azonos. A beszédhang a beszéddelkapcsolatos akusztikai információ,a fonéma pedig az általános tulajdonságok alap ján azonosnak észlelt beszédhangok mentális reprezentációja, azaz ugyanannak a beszédhangnak az akusztikailag sokféle megvalósulásából létrejött absztrakció. A beszédhangok akusztikai és fonetikai elemzésének eredménye a beszédhangoknak a megfelelő fonémákkal történő azonosítása, az úgynevezett fonémadöntés. Ez azt jelenti, hogy a beszédhangokat a fonológiai (hangalak-) elemzés szintjén adott fonémakategóriához (erre később visszatérünk) rendeljük hozzá. A fonémáról hozott döntés azonban gyakran nem is olyan egyszerű, mivel a beszédhangok hangkörnyezetüknek megfelelően módosulnak, jóllehet ez a hangkörnyezet az azonosításhoz szükséges jellemző jegyeket is hordozza. A rúgta szóban például a igi zöngés mássalhangzó zöngétlenedik, azaz a többi hangtól elkülönítve (izoláltan) nem valószínű, hogy ugyanúgy /g/ hangként azonosítanánk, mint magában a szóban. A beszédhangok észlelésében tehát kontextustól független és kontextusfüggő észlelési folyamatok működnek. Ezen a szinten a fonémadöntést meghatározó kontextuális elemek: 1. a szótag szerkezete, 2. a beszédhang helye a szótagban, 3. a szomszédos beszédhang jellemzői. A fonéma tehát absztrakt kategória, és a beszédnek arra a legkisebb, reprezentációalapú perceptuális építőelemére vonatkozik, amelynek alapján képesek vagyunk két szó között különbséget tenni. Vegyük például a kéz és a kész szavakat. Ezek csak egyetlen hangban, a szóvégi /z/ és /sz/hangban térnek el egymástól. (A továbbiakban, mint ahogy fentebb is, a i i jelet fogjuk használni a hangokra utalásnál, és a nem nyelvész olvasó
231 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
dolgát megkönnyítendő, nem fogjuk használni a beszédhangok egyezményes fonetikai átírását.) Az ehhez hasonló, egyetlen fonémában különböző szavakat minimális pároknak nevezzük. Ebben a fejezetben arra keressük a választ, hogy hogyan dolgozzuk fel ezeket a beszédhangokat, és miként tudunk különbséget tenni a kéz és kész szavak között. Annak érdekében azonban, hogy megérthessük, hogyan is észleljük a beszédhangokat, szükséges tudnunk azt is, hogy milyen jellegzetességeik vannak ezeknek, vagyis szemügyre kell vennünk a beszédhangok produkcióját és az észlelésben alapvető szerepet játszó akusztikai és fonetikai feldolgozás törvényszerűségeit. A fejezet során tehát először is áttekintjük a beszédhangok produkciójának jellegzetességeit és fizikai jellemzőit. Látni fogjuk, hogy az emberi beszédképzés során létrejövő beszédhangok hasonló tulajdonságokkal rendelkeznek, mint a legtöbb környezeti hang: több frekvenciakomponenst tartalmaznak, vagyis komplex hangok, és periodikus ismétlődés jellemzi őket. Majd azt nézzük meg, hogy a beszédhangok mely jellegzetességeit használjuk fel ahhoz, hogy egyedi hallási objektumokat, fonémákat hozzunk létre belőlük. Végezetül bemutatunk néhány olyan pszichológiai modellt, amely az emberi beszéd megértésének magyarázatára jött létre.
1. A beszédhangok jellemzői 1.1. A beszédhangok képzése Az emberi beszédképző szervek az evolúció során olyan szervekből fejlődtek ki, amelyeket eredetileg más célra használtunk, és ma is betöltenek egyéb funkciókat is. A beszédképző rendszer három nagy részre osztható: a gége alatti (tüdő), a gégei és a gége feletti (száj- és orrüreg) rendszerre (11.2. ábra).
11.2. ábra. A beszédhangképző szervek Leegyszerűsítve azt mondhatjuk, hogy a beszédhangok produkciója két lépésből áll. A tüdőből kiáramló levegő hatására rezgésbe jönnek a gégében található hangszalagok, és ezt a rezgést a szájüreg, a nyelv, az ajkak formálják tovább. Nézzük meg ezt a folyamatot egy kicsit részletesebben. A beszédhangok képzéséhez a tüdőből kiáramló levegőt használjuk fel. A levegő mennyisége, illetve nyomása határozza meg a hangok hangosságát, valamint azt, hogy mennyi ideig tudunk egyfolytában beszélni. A beszéd közbeni levegővétel módja jelentősen eltér a nyugalmi légzéstől, a nyugalmi légzésnél ugyanis a levegővétel és a -kifújás időtartama nagyjából azonos, míg beszéd közben egy gyors beszívást nagyon lassú és egyenletes tempójú kifújás követ. A beszéd közbeni légzés tehát nagyon precíz és egyben automatikus irányítás alatt áll. Semmilyen tudatos kontrollt nem tudunk gyakorolni a beszédprodukció során a levegő kiáramlására, noha tudjuk, hogy a légzés egyébként akaratlagosan befolyásolható.
232 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
A hangképzés tulajdonképpeni szerve a gégében található. A gége porcokból és a porcokat összekötő ízületekből és izmokból áll. A beszédképzés szempontjából legfontosabb részei a hangszalagok és az ezek által körbevett hangrés (11.3. ábra). A gége izmai teszik lehetővé a hangszalagok megfeszítését, illetve ellazítását, és ezáltal szabályozzák a hangrés nagyságát. A hangrés nagyságától függ, hogy keletkezik-e hang vagy sem. Ha teljesen nyitva van, akkor a levegő akadálytalanul áramlik át a gégén, vagyis nem jön létre hang. Ahogy természetesen akkor sem, ha a hangrés teljesen zárva van. Érdekes módon azonban a hangképzés nem akkor valósul meg, amikor a hangszalagok a nyílt és zárt állás között vannak, és a tüdőből kiáramló levegő képes rezgésbe hozni őket. Ebben a félig nyílt állapotban ugyanis nem a beszédhangok képzéséhez szükséges rezgés, az úgynevezett zönge alakul ki, hanem a /h/ hang képzéséhez szükséges surrogó hang valósul meg.
11.3. ábra. A gége felépítése A zönge egy viszonylag bonyolult folyamat hatására jön létre, amelyet a 11.4. ábra szemléltet. Az ábrán bemutatott folyamatot a következőképpen értelmezhetjük. A hangrés zárt állapota esetén a tüdőből kiáramló levegő feltorlódik a hangszalagoknál, és ennek hatására megnő az úgynevezett szubglottális (hangrés alatti) nyomás. Egy idő után azonban a hangszalagok nem tudják fenntartani a hangrés zárát a szubglottális nyomással szemben, és emiatt a hangrés kinyílik, a levegő pedig kiáramlik. A kiáramló levegő hatására, különböző fizikai törvényszerűségek miatt, valamint a hangszalagok idegrendszeri szabályozása nyomán, a hangszalagok ezután ismét visszazáródnak. A hangrésnek ez a gyors, periodikus nyitása és zárása hozza létre lényegében a beszédhangok alapját képező zöngét. Ez az elv hasonló ahhoz, mint amit a 8. fejezetben a hangvilla hangkeltése esetében leírtunk: egy rugalmas tárgy oda-vissza mozgása hozza létre a hanghullámot.
11.4. ábra. A zöngekeltés folyamata a gégében A hangszalagok működésére szintén az a jellemző, hogy nem állnak tudatos ellenőrzés alatt. A működésük révén létrejövő zönge a beszéd alapvető jellemzőjét, az alaphangot határozza meg. Az alaphang egyénenként eltér, és a fentiek alapján kitalálhatjuk, hogy a hangrés nyitódásának és záródásának periódusideje határozza meg (vagyis az, hogy a hangrés másodpercenként hány nyitódásra és záródásra képes). A hangrésnek, pontosabban a hangszalagoknak ezt a jellemzőjét különböző anatómiai tényezők befolyásolják. Ilyenek például a hangszalag hossza, tömege, illetve rugalmassága. A hangszalagok működésének jellemzőit, és így az alaphangot is, elsősorban a nem és a kor befolyásolja. Tudjuk, hogy a férfiaknak mélyebb a hangjuk, mint a nőknek vagy a gyerekeknek: férfiak esetében a beszéd alaphangja 120 Hz körüli, nőknél ez az érték 250 Hz körül található, gyerekeknél pedig 400 Hz felett. A beszédhangképző rendszer harmadik, gége feletti része az úgynevezett artikulációs csatorna. Az artikuláció az az automatikus mozgás, amely a beszédhangok létrehozására irányul. Eszerint az artikulációs csatorna a 233 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
hangképzés azon rendszere, amely a beszédhangok végső formáját létrehozza. Ez a rendszer a hangréstől az ajkakig terjedő szerveket foglalja magában, és lényegében egy viszonylag hosszú, bonyolult formájú cső, amelyen a levegő végighalad. A csatorna a beszédhangokat két módon képes megformálni: egyrészt a benne található üregek különféle rezonanciákat, rezgéseket képesek kelteni a már létrejött hangon, másrészt pedig a hang különböző akadályokba (pl. nyelv, ajkak) ütközhet, vagy szűkületeken halad át, amelyek szintén módosítják.
11.5. ábra. Az artikulációs csatorna felépítése Az artikulációs csatorna három üregből áll (11.5. ábra): garatüreg, orrüreg, szájüreg. Ezek mindegyikének alakja módosítható a nyelv vagy a lágy szájpad mozgatása révén, és ezáltal különböző típusú rezonanciák alakulhatnak ki bennük. A szájüregben találhatók azok az akadályokat képző szervek is, amelyek tovább képesek módosítani, esetleg önmagukban is képesek létrehozni egyes beszédhangokat. A szájüreg beszédszervei aktív és passzív beszédszervekre oszthatók aszerint, hogy tudjuk-e őket mozgatni vagy sem. Ezeket a 11.6. ábra mutatja be.
11.6. ábra. A szájüreg beszédhangképző szervei Összefoglalva tehát, a beszédhangok a hangszalagok által létrehozott komplex, periodikus rezgések, amelyeknek a spektrális szerkezetét az artikulációs csatorna különböző részei módosíthatják. Láthattuk, hogy a hangképzést nagyon precíz, finoman összehangolt izommozgások szabályozzák, amelyek azonban tudatosan nem irányíthatók. Nem tudjuk akaratlagosan úgy szabályozni a tüdő, a légcső vagy a nyelv izmait, hogy például egy iói hangot hozzunk létre. Ugyanakkor azt is érdemes észrevennünk, hogy mindazok a szervek, amelyeket a beszédhangok létrehozása során használunk, nem erre a célra jöttek létre. Mindegyiknek megvan a saját egyéni funkciója (légzés, táplálkozás stb.), és mintegy „mellékesen” a beszédhangok létrehozását is megvalósítják (egyedül talán a hangszalagok jelentenek kivételt, azoknak valóban a hangadás az alapvető és egyetlen funkciójuk). A továbbiakban azt vizsgáljuk meg, hogy az így létrejött beszédhangok milyen akusztikai tulajdonságokkal rendelkeznek, vagyis milyen jellemzőket kell feldolgoznunk ahhoz, hogy beszédhangokat észleljünk.
1.2. A beszédhangok csoportosítása 234 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
A fentiekben láttuk, hogy a beszédképző rendszer hogyan hozza létre a beszédhangokat. Bemutattuk, hogy a beszédképzés két szakaszból áll: az alaphangot adó zönge létrehozásából és az így létrejött hang további formálásából. Ez akusztikai szempontból megfogalmazva azt jelenti, hogy az egyes beszédhangokra jellemző formá- lásssal egyben az adott hangra jellemző speciális spektrális szerkezetet hozunk létre. Ez utóbbi lépést úgy képzelhetjük el, hogy az artikulációs csatorna beszédképző szervei egyfajta bonyolult szűrést alkalmaznak a hangon, és bizonyos frekvenciatartományok hangosodását és halkulását hozzák létre, vagyis megváltoztatják a kialakuló komplex hang harmonikusait. Ezt a fajta működést szemlélteti a 11.7. ábra.
11.7. ábra. A beszédképző szervek működésének modellezése. Az a) részen látható a hangszalagok keltette alaphang. A b) azt mutatja, hogy néhány magánhangzó esetében az artikulációs csatorna milyen pozíciókat vesz fel, a c) rész pedig azt, hogy ezek a pozíciók milyen változást eredményeznek a létrejövő beszédhangok spektrális szerkezetében Az artikulációs csatorna működése révén létrejövő módosult felharmonikusokat a beszédhangok esetében formánsoknak nevezzük. A formánsokat általában F-fel jelöljük, és egy sorszámot is kapnak aszerint, hogy milyen távol vannak az alaphangtól. A 11.7. ábrán a frekvenciaspektrumban található csúcsok jelzik a formánsokat. A legtöbb esetben csak a beszédhangok első három formánsáról, vagyis az F1, F2 és F3-ról beszélünk. Három formáns ugyanis megfelelően meghatároz egy magánhangzót, a többi frekvenciakomponens valójában redundáns, a megfelelő észleléshez nincs is igazán szükség rájuk. A három formánson kívül ugyanakkor egy negyediket is meg kell említenünk, ez pedig az F0, vagyis a 0. formáns. Az eddigiek fényében kitalálható, hogy az F0 az alaphangra vonatkozik. Többféle oka is lehet annak, hogy a beszédhangok esetében miért tekintjük az alaphangot a 0. formánsnak. A beszédhang, hasonlóan más komplex hangokhoz, alaphangból és felharmonikusokból áll. Ha tehát a felharmonikusokat vagy formánsokat F1, F2 stb.-vel jelöljük, akkor logikus, hogy az ezeknél mélyebb frekvencia-összetevőt, az alaphangot 0-val jelöljük. Ugyanakkor az F0 jelölés használata arra is utal, hogy ez a komponens nem játszik szerepet a beszédhangok jellegzetességeinek meghatározásában. Láttuk, hogy bár az alaphang adja meg a beszéd és így az összetevők magasságát, magának a beszédhangnak a kialakításában igazából csak az F1, F2 stb. formánsok vesznek részt. A beszédhangok nagyon sokfélék lehetnek, és természetesen nagyon eltérő akusztikai jellemzőkkel rendelkezhetnek. Ráadásul az egyes nyelvek között óriási eltérés van abban, hogy milyen beszédhangokat használnak, és ezeket hogyan képzik. Ezt mindenki megtapasztalhatja, amikor először próbál egy idegen nyelvet elsajátítani. Nemcsak a hangok megfelelő produkciójához szükséges rendkívül sok gyakorlás, hanem ahhoz is, hogy magukat a beszédhangokat megfelelően észleljük, a belőlük alkotott szavak hangalakját azonosítsuk, és a szavakat megértsük. Az egyes nyelvek az emberi beszédképző szervek által létrehozható lehetséges beszédhangoknak csak egy korlátozott készletét használják. Nyelvenként eltér, hogy pontosan hány beszédhangot használnak, és ez a szám 11 és 141 között változhat (Gósy 2004). A legtöbb nyelv 20-37 hangot alkalmaz. A beszédhangokat két nagy csoportra szokták osztani: a magánhangzókra, amelyek képzése minden esetben a zöngére épül, és a mássalhangzókra, amelyek nem feltétlenül tartalmaznak zöngét, de a képzésükkor a levegő valamilyen akadályba (beszédszervek) ütközik. A továbbiakban áttekintjük, hogy miként osztályozzuk ezeket a hangokat, illetve azt, hogy az egyes csoportok milyen képzési és akusztikai jellemzőkkel írhatók le. Az áttekintés csak felsorolásszerű lesz, nem térünk ki a hangok részletes jellemzésére. A cél inkább az, hogy lehetővé tegyük a 235 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
beszédhangcsoportok közötti eligazodást. Az érdeklődők Gósy Mária (2004) könyvéből további részleteket tudhatnak meg.
1.2.1. A magánhangzók A magánhangzók zöngés hangok, vagyis képzésükkor a tüdőből kiáramló levegő megrezegteti a hangszalagokat. Az egyes magánhangzók formánsszerkezetükben és időtartamukban térnek el egymástól. Ezt az artikulációs csatorna különböző üregeinek eltérő alakja teszi lehetővé (11.6. ábra). Egy magánhangzó meghatározásához négy paraméter szükséges: a nyelv helyzete függőleges és vízszintes irányban, az ajakállás és az időtartam. A nyelv függőleges állása összesen négyféle lehet: felső, középső, alsó és legalsó. Az így képzett hangok elsősorban az F1 formánsban térnek el egymástól, és a felül képzett hangok (pl. iii) magasabb F1-gyel rendelkeznek, mint az alulképzettek (pl. iai). A nyelv vízszintes állás szerint megkülönböztetünk elöl képzett (palatális) és hátul képzett (veláris) hangokat. Az előbbire példa az iii, az utóbbira pedig az iui hang. Mindez akusztikailag elsősorban az F2 formáns változásában jelenik meg oly módon, hogy az elöl képzett magánhangzók magasabb frekvenciájú F2-vel rendelkeznek, mint a hátul képzettek. Az ajakállás kétféle lehet: ajakkerekítéses (labiális) és ajakréses (illabiális). Az ioi hang például ajakkerekítéssel, az iéi viszont ajakréssel képződik. Az ajakállás elsősorban az F2-F3 viszonyát módosítja, vagyis viszonylag komplex hatást gyakorol a hang formánsszerkezetére. Végül az időtartam alapján beszélhetünk rövid és hosszú magánhangzókról, amelyek főként időtartamukban térnek el egymástól (az időtartam kissé módosítja persze a formánsértékeket is). Ilyen például az ioi és iói hang. Sokan azt gondolják, hogy az iai és iái, valamint az iei és iéi hangok ugyanannak a magánhangzónak az időtartam szerint eltérő változatai. Ezt azonban az írástudók számára főleg a hosszúságjelölés konvenciója sugalmazza, az iai és iái vagy az iei és iéi hangok formánsszerkezete ugyanis minőségi eltérést mutat. A magyar nyelvben összesen 15 magánhangzót tudunk megkülönböztetni. A 11.1. táblázat mutatja ezek csoportosítását a felsorolt kategóriák szerint. Nagyon fontos, hogy ezek a kategóriák mindig egyszerre határoznak meg egy hangot, tehát például az iái hang egy hátul képzett, legalsó nyelvállású, ajakréses és hosszú magánhangzó. A táblázat a rövid és hosszú hangokat nem jelöli külön, ha egy adott magánhangzóból mindkettő létezik, akkor ezek egymás mellett vannak feltüntetve a táblázat azonos cellájában.
13.1. táblázat - 11. 1. táblázat. A magánhangzók csoportosítása (Gósy 2004 nyomán) Nyelv függőleges Nyelv vízszintes mozgása mozgása Elöl képzett
Felső nyelvállású
Ajakréses
Ajakkerekítéses
i, í
ü, ü
u, ú
ö, ő
o, ó
Középső nyelvállású é Alsó nyelvállású
Hátul képzett Ajakréses
e
Ajakkerekítéses
a
Legalsó nyelvállású
á
1.2.2. A mássalhangzók A beszédhangok másik nagy csoportját a mássalhangzók alkotják. A mássalhangzók szintén a kilégzés során jönnek létre, mégpedig úgy, hogy a kiáramló levegő az artikulációs csatorna szájüregi részében valamilyen aktív vagy passzív akadályba ütközik (11.6. ábra).
236 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
A magyar nyelvben összesen 32 (28 egy, 4 két képzési hely típusú) mássalhangzó különíthető el. A képzett hangok jellemzése négy paraméter mentén történik: a képzés módja, a képzés helye, a zöngésség és az időtartam. Már itt felhívjuk a figyelmet arra, hogy a mássalhangzók képzési jellegzetességeivel, illetve osztályozásával kapcsolatban a beszédhangok sajátosságainak tudományos leírásával foglalkozó fonetikusok sem mindig értenek egyet. Ez azt mutatja, hogy egyes hangok képzése nem feltétlenül egyértelmű, illetve változatlan, mivel elképzelhető, hogy ugyanazt a hangot két különböző ember kissé másképp ejti ki. Ennek ellenére bemutatunk egy általánosan elfogadott csoportosítást. A zöngésség és az időtartam a mássalhangzóknak legegyszerűbb jellemzői. Zöngésség szerint lehetnek zöngések (pl. ibi), amikor is a hang a hangszalagok rezgése révén jön létre, és zöngétlenek (pl. ipi), amikor a hangszalagok nem rezegnek. A mássalhangzók a zöngésség szempontjából párt alkothatnak, amikor is a zöngés és zöngétlen hangok minden egyéb jellemzőjükben megegyeznek (pl. ib-pi). Időtartam szerint a magánhangzókhoz hasonlóan a mássalhangzók is lehetnek rövidek vagy hosszúak (pl. ili illi), vagy más néven mássalhangzó-kettőzések (gemináták). A magyar nyelvben a mássalhangzók hosszúságészlelése fontos, hiszen jelentésmegkülönböztető funkciójuk lehet, mint például a hal és hall szavak esetében. A képzés módja arra az artikulációs működésre vonatkozik, ahogyan az adott mássalhangzót megformáljuk. A képzési mód szerint öt mássalhangzócsoportot különböztethetünk meg: zárhangok, réshangok, zár-rés hangok, pergőhangok és közelítőhangok. A zárhangok (pl. ibi) esetében az artikulációs csatorna valamely részén egy teljes zárás alakul ki (a ibi hangnál például az ajkak zárulnak össze), és ez a zár megállítja a levegőt. A zár bizonyos ideig fennmaradhat, de azután általában gyorsan kinyílik, és ez a nyílás – vagy más néven zárfelpattanás – vezet a hang létrejöttéhez. A zöngés zárhangok esetében a hangszalagok a zárfelpattanáskor, de akár előtte is rezeghetnek. A réshangok (pl. ifi) ezzel szemben úgy jönnek létre, hogy a levegőnek egy, a beszédszervek által létrehozott szűk nyíláson kell keresztülhaladnia. Ez a folyamat egy zajszerű hangot hoz létre, hasonlóan a fák levelein keresztül fújó szél hangjához. A zajszerű hang állhat önmagában vagy zöngés réshangoknál egy zöngével együtt (pl. a ivi esetében). A zár-rés hangok (pl. icsi) a zár- és réshangok tulajdonságait ötvözik. Képzésük során a zárat nem felpattanás, hanem egy szűkülés követi. Apergőhangok (az egyedüli ilyen hang a magyarban az iri) valamely beszédszerv vibrációjából, pergetésé- ből származnak. Ez a magyarban a nyelv, de például a franciában a lágy szájpad pergetésével jönnek létre a pergőhangok. A közelítőhangokat (pl. ili) az artikulációs csatorna valamely részének nem teljes zárása hozza létre. Emiatt ezek kissé hasonlítanak a magánhangzókhoz, hiszen a magánhangzók képzés során sem jön létre zár. Természetesen azért a közelítőhangoknál egy kismértékű zárást mindenképpen találunk, de az ilyen hangok lágyságát pontosan ez a nem teljes zárás okozza. A képzés helye, vagyis aszerint, hogy a mássalhangzót a szájüreg mely részében képezzük, hét típust különíthetünk el (zárójelben megadjuk az egyes típusok idegen nevét is, mivel a szakirodalom legtöbbször így hivatkozik ezekre). Vannak két ajakkal képzett hangok (bilabiálisok), ajak-fog hangok (labiodentálisok), fogmederhangok (alveolárisok), hátsófogmeder-hangok (posztalveolárisok), elülsőszájpadlás-hangok (palatálisok), hátul- s ó s z á j p a d l á s – h a n g o k (velárisok) és gégehangok (l a r i n g á l i s o k).
13.2. táblázat - 11.2. táblázat. A mássalhangzók csoportosítása Képzési Képzési mód hely Zárhangok
Réshangok
Zár-rés hangok
237 Created by XMLmind XSL-FO Converter.
Pergő-
Közelítohan-
han
gok
11. FEJEZET– A beszéd észlelése
Felpattanó
Nazá
zárhangok
lisok
zön
zön
zön
zön
zön
zön
zön
gés
gétlen
gés
gés
gétlen
gés
p
m
v
f
z
sz
zs
s
Bilabiáli b s Labiode ntális Alveolár d is
t
n
Posztalv eo-
gok
Me-
Late
diális
rális
zön
zön
zön
gétlen
gés
gés
gés
dz
c
r
dzs
cs
l
láris Palatális gy
ty
Veláris
k
Laringál is
g
n
j
y
h
A 11.2. táblázat összefoglalja a magyar mássalhangzók különböző típusait a képzés módja, helye és a zöngésség szerint. Hasonlóan a magánhangzókhoz, itt is láthatjuk, hogy minden egyes mássalhangzót az összes jellemző mentén lehet csak meghatározni. Vagyis például a ibi hang egy bilabiális, zöngés zárhang.
1.3. A beszédhangok akusztikai jellemzői A fentiekben tehát láthattuk, hogy az egyes beszédhangok létrehozásához a beszédképző szervek milyen hihetetlenül bonyolult vezérlése és összehangolása szükséges. Egy-egy hang kiejtése a légzés, a hangszalagok, a garat és a szájüreg, valamint a nyelv, az ajkak rendkívül pontos és finom mozgása révén valósul meg. Könynyen belátható, hogy az ily bonyolult módon képzett hangok nagyon összetett akusztikai mintázattal kell, hogy rendelkezzenek. Gondoljunk csak arra, hogy egy zongorán leütött billentyű milyen egyszerűen hozza létre a zongora hangját, hiszen voltaképpen egy egyszerű húr jön periodikus rezgésbe. Ehhez képest a beszédhangok – és főként a mássalhangzók – sokkal összetettebb és komplexebben változó hangok lesznek. Ahogy már fentebb láttuk, lényegében a beszédhangok – más komplex hangokhoz hasonlóan – olyan, több frekvenciakomponensből összetevődő, periodikus hangok, amelyek a frekvencia és intenzitás időbeni változásait tartalmazzák. A továbbiakban azt fogjuk áttekinteni, hogy mi jellemző pontosan ezekre a változásokra, illetve általában a beszédhangok akusztikai megvalósulására. A beszédhangok vizuális megjelenítésének legjobb módja a 10. fejezetben már bemutatott, spektrogramon történő ábrázolás. Mint láttuk, a spektrogram a különböző frekvenciákon található akusztikus energia mennyiségét tünteti fel az idő függvényében, és tulajdonképpen úgy ábrázolja a hangokat, ahogy azok az alaphártyán reprezentálódnak.
238 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
11.8. ábra. Egy mondat spektrogramja. A mondat angol verziója a beszéd spektrogramon történő ábrázolásának egyik leggyakrabban használt illusztrációja; eredete Franklin Cooper 1950-es évekbeli beszédszintézissel foglalkozó munkáira nyúlik vissza A 11.8. ábra egy több szóból álló mondat spektrogramját mutatja be. Az ábrát tüzetesen megvizsgálva észrevehetünk bizonyos szabályos változásokat. Felfedezhetünk például egy olyan frekvenciasávot, amely szinte a mondat teljes hosszában tartalmaz energiát. Ez a legmélyebb frekvenciakomponens, vagyis az alaphang vagy alapfrekvencia. Láttuk, hogy a beszédhangok esetében ezt F0-lal jelöljük. Az F0 mellett további frekvenciakomponenseket is találunk, ezeket formánsoknak neveztük. Az ábrát szemügyre véve láthatjuk, hogy a formánsok gyors változásokat mutatnak, a frekvencia hirtelen növekszik vagy csökken. Ezeket a változásokat formáns- átmeneteknek nevezzük. A formánsátmenetek a legtöbb esetben a beszédképző szervek egyik helyzetből a másikba történő mozgását jelzik. A formánsátmenet bizonyos hangok, például a zárhangok esetében a hang képzésének része, más esetekben viszont hangkapcsolatok esetében figyelhető meg, amikor is egy hang képzését követően a hangképző szerv egy másik pozícióba kell, hogy átálljon. Az eddigiekben tehát áttekintettük a beszédhangok típusait, képzésüket és akusztikai jellemzőit. Tudjuk már, hogy a beszédhangok komplex hangok, és tudjuk, hogy különböző zöngéket, vagyis periodikus rezgéseket és zajokat, zörejeket tartalmaznak. Azt is áttekintettük, hogy az egymást követő beszédhangok (szavak) esetében az észlelőrendszer milyen formában „kapja meg” ezt az akusztikai inputot – folyamatosan változó lassú vagy hirtelen spektrális változások, hangátmenetek sorozataként. A spektrogramon történő ábrázolás ugyanis töb- békevésbé megfelel annak, ahogyan a hallóideg aktivitásmintázata közvetíti a hangok akusztikai jellemzőit az agy felé. Most már csak azt kellene megnéznünk, hogy mihez kezd az agy ezzel az inputtal, vagyis hogy milyen folyamatok közvetítésével történik a beszéd észlelése. A következő részben ezzel a témával foglalkozunk.
1.4. A beszédhangok észlelése 1.4.1. A beszédhangok észlelésének lépései A beszéd megértésének folyamata alapvetően két részből áll: a nyelvi kódoknak vagy perceptuális egységeknek megfelelő akusztikai információk feldolgozásából, valamint ezeknek az információknak az értelmezéséből. Az első rész a beszédhangok és hangkapcsolatok felismerését jelenti, és lényegében az adott nyelvre jellemző fonémák azonosításából áll. A második rész ennek értelmezését foglalja magában, vagyis a szavak, mondatok, illetve az egész szöveg feldolgozását és megértését. Itt most csak a beszédészlelés első részével, vagyis a nyelvi egységek percepciójával foglalkozunk. A beszédhangok észlelési folyamata két szakaszból áll: a beszédhangoknak az akusztikai környezettől való elválasztásából és az ily módon elkülönített beszédhangok fonémaazonosításából, amelyhez referenciaként ezek mentális reprezentációja szolgál. A beszédhangoknak a többi hangtól való elkülönítésével nem foglalkozunk részletesen. Pontosabban, csak annyit állapítunk meg róla, hogy feltételezhetően ugyanazokat a mechanizmusokat használjuk a beszédhangoknak a többi hangtól való elválasztásában is, mint az összes többi hang esetében, mindenekelőtt pedig a perceptuális csoportosítás Gestalt-szabályait. A beszédhangok elválasztását segítheti, hogy a beszéd általában ritmikus, periodikus, és a frekvenciakomponensek együtt változnak. A beszéd tehát olyan jellemzőkkel rendelkezik, amelyek megkönnyítik az elkülönítését. Erre a legjobb példa a vokális zene hallgatása. Ha a hangszerek mellett ének is szól egy zeneszámban, akkor elsősorban erre fogunk figyelni, és ez lesz a leginkább kiugró, a többi hang hátterétől a leginkább elkülönülő. Tudnunk kell azonban, hogy az emberi beszédészlelő rendszer a beszédhangkontrasztokra ugyan születéstől fogva érzékeny, a percepció természetes egységeit mégsem a beszédhangok jelentik, hanem a szavak hangalakja, illetve a szótagok. Miközben a nyelv elsajátítása során ezekre az eltérő egységekre egyformán
239 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
hangolódik a beszédészlelő rendszer, a szavak hangösszetevői közül az olvasás elsajátítását megelőzően csak a szótagokhoz és a szókezdő hangokhoz van tudatos hozzáférésünk. A beszédészlelés automatikus folyamatában azonban kialakul a beszédhangkontrasztok megfelelő észlelését biztosító mentális reprezentáció.
1.4.2. A beszédhangok és a fonémák megfeleltetése Szó volt már arról, hogy a beszéd legkisebb egysége a fonéma. A fonéma egy olyan absztrakt nyelvi egység, amely önmagában nem rendelkezik jelentéssel, de képes a szavak jelentését megváltoztatni. Azt mondhatjuk tehát, hogy a fonémák a nyelv építőkockái, hiszen a megfelelő fonémákként azonosított beszédhangok sorozatából előállíthatók egy adott nyelv szavai. Ezek alapján feltételezhetjük, hogy a beszédhangok feldolgozásának célja, hogy az akusztikai inputot megfeleltessük a fonémák mentális reprezentációjának. Ez a megfeleltetés azonban sajnos nem ennyire egyszerű. Ahogy látni fogjuk, a beszédészlelés tanulmányozásának egyik központi problémája, hogy az észlelt beszédhangok és a mentális reprezentáció megfeleltetése meglehetősen összetett. Ha közelebbről megvizsgáljuk a beszéd akusztikai jellegzetességeit, akkor több olyan jelenséget is találunk, amelyek cáfolják azt a nézetet, hogy a beszédészlelés során a beszédhangok és a fonémák egy az egyben történő megfeleltetése zajlik. Az egyik ilyen probléma a beszédhangok gyorsasága. Egyes vizsgálatok szerint 30 fonéma/másodperc beszédtempó mellett is képesek vagyunk megérteni a beszédet, ami azt jelenti, hogy az egyes beszédhangok átlagosan csak kb. 30 milliszekundum időtartamúak. Ha hasonló tempóval mutatunk be egyéb, nem beszéd jellegű hangokat, akkor ezeket a kísérleti személyek képtelenek azonosítani, és csak egy egybefolyó hangkavalkádot hallanak. Vagyis úgy tűnik, hogy a beszédészlelés során olyan gyorsan tudjuk követni a hangsorokat, amit elvileg a hallórendszer működése nem tesz lehetővé. A másik problémába akkor ütközünk, ha megnézzük, hogy egy adott fonéma két eltérő kontextusban (például két eltérő szóban vagy szó elején és szó végén) milyen eltérő akusztikai paraméterekkel valósul meg. Liberman és munkatársai (1954) két azonos fonémával kezdődő szótag esetében tették ezt meg. A két szótag a /di/ és /du/ volt, amelyeknek a spektrogramját a 11.9. ábra mutatja. Az ábrán egy stilizált spektrogram mutatja a szótagok két formánsát (F1 és F2). Az F1 és F2 formánsok elegendő információt nyújtanak ahhoz, hogy a szótagokat világosan eltérőnek halljuk (ennek ellenére nagyon mesterségesen, „gépszerűen” szólnak). Látható, hogy az F1 mindkét szótagnál hasonló frekvenciatartományban található, de az F2 teljesen eltérő: a /di/ esetében 2200 Hz-ről emelkedik 2600 Hz-re, míg a /du/-nál 1200 Hz-ről ereszkedik 700 Hz-re.
11.9. ábra. Formánsátmenetek a /di/ és /du/ szótag esetében (Liberman et al. 1954 nyomán) A két szótag esetében tehát a /d/ hang teljesen eltérő akusztikai jellemzőkkel rendelkezik. Ennek ellenére a kísérleti személyek mindkét esetben határozottan /d/ hangnak hallják, és nem veszik észre a spektrogrammal nyilvánvalóvá tehető jelentős akusztikai különbségeket. Ugyanakkor, ha ezeket a változásokat, vagyis a formáns- átmeneteket izoláltan mutatjuk be (ekkor a hangok elveszítik beszédjellegüket), akkor ezek az eltérő akusztikai jellemzők egyértelműen megkülönböztethetők. A beszédhangoknak ezt a változatosságát kontextusfüggő átszerveződésnek vagy koartikulációnak nevezzük. Az előbbi elnevezés az akusztikai paraméterek megváltozására utal, az utóbbi pedig a jelenség hátterére, vagyis arra, hogy a beszédhangok képzéséből, artikulációjából származik. A koartikuláció definíció szerint az a jelenség, hogy egy beszédhang akusztikai jellemzői megváltozhatnak attól függően, hogy előtte vagy utána milyen hangok állnak. Például az /n/ hang némileg eltérő akusztikai paraméterekkel rendelkezik az int – ing – ina szavakban. A koartikuláció egy viszonylag egyszerű fizikai 240 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
korlátozás miatt alakul ki, nevezetesen, hogy a beszédképző szerveket nem tudjuk tökéletesen átvinni egyik pozícióból a másikba. Bizonyos hangkapcsolatok esetén, vagy a következő hang ejtésére való felkészülés miatt, vagy az előzőből való nem tökéletes visszatérés miatt, az adott hang ejtése megváltozhat. A beszéd produkciója ugyanis egy dinamikus folyamat, és a beszédképző szervek folyamatosan mozognak a magánhangzók képzésétől egy mással-hangzót létrehozó akadály létrehozásáig, majd vissza. Ez azzal jár, hogy nagy különbségek lehetnek az önmagukban képzett és a folyamatos beszéd során létrehozott beszédhangok között, mivel a folyamatos beszédben a hangok mindig úgy jönnek létre, hogy a beszédképző szervek valamilyen pozícióból indulnak, és a hang képzése után valahová tartanak. Ezt úgy képzelhetjük el, mint egy táncos mozgását. A táncos mozdulatai nem önmagukban állnak, hanem mozgássorok részét képzik, és ennek az a következménye, hogy ezek végrehajtása más és más lehet attól függően, hogy milyen mozdulat szerepelt előtte és utána. A koartikuláció okozta módosuláson kívül van még egy tényező, amely jelentősen képes módosítani egy adott beszédhang akusztikai jellemzőit, ez pedig maga a beszélő. Az egyes beszélők egészen más akusztikai paraméterekkel hozzák létre az egyes hangokat. Ezt sok minden befolyásolja: a beszélő neme, kora, illetve ugyanazon beszélő esetében a napszak, betegség vagy az aktuális érzelmi állapot. Egy következő probléma, amely a beszédhangok és a fonémák megfeleltetését megnehezíti, az úgynevezett szegmentációs probléma. Az akusztikai input ugyanis folyamatos, a reprezentáció viszont szükségszerűen diszkrét. Az egyes hangok között nincsen határ, sőt a legtöbb esetben egybe is olvadhatnak. Ezt úgy demonstrálhatjuk, hogy megpróbálunk kivágni egy akkora részt az akusztikus inputból (mondjuk egy számítógépes hangszerkesztő segítségével), amely pontosan megfelel egy fonémának. Mi történik például akkor, ha a fent bemutatott /di/ szótagból megpróbáljuk kivágni a /d/ hangot? Ha elkezdjük a szótag végéről fokozatosan levágni a hangrezgéseket, akkor vagy a /d/-t és a magánhangzót halljuk, vagy csak valamilyen nem beszéd jellegű zörejt. A /d/ hangot tehát nem találjuk meg az inputban. Pontosabban, ott van ugyan, de valójában a formáns- átmenet határozza meg, abban pedig szükségszerűen benne van a magánhangzó is. A /d/ ugyanis egy alveoláris zárhang, vagyis képzésekor az artikulációs csatorna lezárul, és nem enged ki hangot. Emiatt a /d/ csak akkor szólal meg, ha egy másik hang is jelen van, ami követi vagy megelőzi (próbáljuk kiejteni a /d/-t önmagában - valószínűleg ez csak úgy sikerül, ha egy magánhangzót is hozzáteszünk). Mindezek a jelenségek tehát arra utalnak, hogy nincs egy az egyben megfelelés a beszédhangok akusztikai jellemzői és azok reprezentációja között. Nem igazán tudjuk kijelölni azt a szakaszt az inputban, amelynek egy fonéma pontosan megfeleltethető lenne, ráadásul egy adott fonéma attól függően, hogy ki, mikor, milyen állapotban mondja, és hogy milyen egyéb hangok társaságában szerepel, egészen különböző megjelenési formákat ölthet. Ezt a megfeleltetési problémát Klatt (1979) akusztikai-fonetikai varianciaprob- lémának nevezte el. Másként ezt a következőképpen fogalmazhatjuk meg: mivel a fonémák vitathatatlanul rendelkeznek perceptuális realitással (hiszen meg tudjuk mondani, hogy a kéz és kész szavak miben különböznek egymástól), elvárható lenne tőlük, hogy olyan akusztikai jellemzőkkel bírjanak, amelyek lehetővé teszik a megkülönböztetésüket. Ennek ellenére mind ez idáig nem sikerült olyan állandó akusztikai észlelési kulcsokat találni, amelyek minden esetben meghatároznának egy adott fonémát. A variancia-invariancia probléma kapcsán két kérdés is felmerülhet. Az egyik, hogy van-e egyáltalán bármilyen olyan tulajdonsága a hangoknak, amely a kontextustól függetlenül mindig állandó (azt leszámítva, hogy a percepció, vagyis a fonéma reprezentációja valóban mindig az). A /d/ esetében például azt mondhatjuk, hogy a képzése során az artikulációs csatorna nagyjából ugyanazon a helyen záródik, a nyelv a fogmederhez tapad. Ez minden /d/ hangnál így van, függetlenül attól, hogy végül a megszólalásakor milyen akusztikai jellemzőkkel fog rendelkezni. Ez egy nagyon fontos tény, és a beszédészlelés elméletei kapcsán látni fogjuk, hogy a produkció invarianciája esetleg felhasználható a percepcióban. A másik kérdés, hogy vajon mennyire általános az invariancia? Minden fonémára igaz, vagy csak néhányra? Ezzel kapcsolatban azt mondhatjuk, hogy a mássalhangzókra szinte kivétel nélkül igaz, de a magánhangzók esetében nem feltétlenül van így. A magánhangzók, ha elég hosszúak, és nem tartalmaznak valamilyen gyors változást, akkor nem mutatnak kontextusfüggő átszerveződést. Ugyanakkor élőbeszédben a magánhangzók nagyon ritkán ilyenek, és ebben az esetben már létrejön a kontextusfüggő átszerveződés (Stevens-House 1963).
1.4.3. Beszédkód és beszédmód Liberman és munkatársai (1967) szerint mindezen eredmények alapján fel kell adnunk azt az elképzelést, hogy a fonémák és a beszédhangok között egy az egyben megfeleltetés létezik. Ha viszont nincs egyértelmű megfeleltetés, akkor hogyan lesznek a beszédhangokból fonémareprezentációk?
241 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
Liberman és munkatársai (1967) szerint a beszéd olyan, mint egyfajta kód. A kódokra általában az jellemző, hogy ugyanúgy képesek szállítani az üzenetet, mint az eredeti médium, de ezt olyan formában teszik, ami nem hasonlít az eredetihez. A telefonálás során például egy kódot használunk: az üzenetünk elektromos impulzusokká alakul át, és ezt közvetíti a telefonvonal egyik beszélőtől a másikig, ahol azután visszaalakul beszéddé. Ha azonban csak az elektromos impulzust néznénk, abból nem tudnánk megfejteni az üzenetet. Ehhez szükség van a kód lefordítására, vagyis a dekódolásra. Eszerint tehát a beszéd észlelése során is dekódolás zajlik, nem pedig megfeleltetés (Liberman et al. 1967). Miért mondhatjuk azt egyáltalán, hogy a beszéd kódként viselkedik? Liberman és munkatársai (1967) szerint a beszéd produkciója és percepciója között egyfajta kompromisszumos megoldás született. Ahhoz ugyanis, hogy a beszédhangok hatékonyan tudják szállítani az üzeneteket, az szükséges, hogy viszonylag nagy tempóval kövessék egymást (nagyon nehéz megérteni akkor egy szöveget, ha azt nagyon lassan mondják el; próbáljuk ki, milyen nehézséget okoz a megértésben, ha csak feleolyan gyorsan kezdünk beszélni barátainkhoz!). A gyors tempó viszont azt eredményezi, hogy nem tudjuk a hangokat külön-külön diszkréten kiejteni, vagyis létrejön a koartikuláció, és ennek révén a beszédkód. Ha a beszédészlelés során valóban dekódolás történik, akkor szükség van egy dekóderre is, vagyis egy olyan mechanizmusra, amely a kódot, azaz a beszédhangot lefordítja üzenetté, azaz fonémává. Azt mondhatjuk, hogy a beszédészlelés folyamatát olyan mechanizmusok valósítják meg, amelyek specifikusan csak a beszédhangok feldolgozását végzik, és nem foglalkoznak egyéb hangokkal. Mivel azonban a beszédészlelés során ugyanazt a hallószervet, illetve hallórendszert használjuk, mint bármilyen más hallási inger feldolgozása során, ezért ezek a speciális mechanizmusok valahol a feldolgozás magasabb szintjein helyezkednek el. Vannak bizonyítékok azzal kapcsolatban, hogy a hallási észlelésnek létezik egy speciális beszédmódja, pontosabban üzemmódja, ami akkor „kapcsol be”, ha beszédhangokkal találkozunk. Ezek a bizonyítékok olyan vizsgálatokból származnak, amelyek az úgynevezett szinuszhullámú beszédet használták ingerként (Remez et al. 1981). A szinuszhullámú beszédet úgy hozzák létre, hogy megvizsgálják a beszédhangok első három formánsát és ezek amplitúdó- és frekvenciaváltozásait, majd ezeket szintetizálják szinuszhullámok segítségével úgy, hogy a változásokat megtartják. Ezek a hangok két fontos jellemzőben térnek el a valódi beszédhangoktól: nem tartalmazzák azok komplex harmonikusszerkezetét, és nem tartalmazzák a hangszalagok rezgése által megvalósuló zöngét. Emiatt bár beszédszerűek, meglehetősen nehezen érthetők, és nagyon természetellenesen hangzanak. A kutatók azt találták, hogy ezeket az ingereket kétféleképpen lehetett észlelni: beszédhangként vagy komplex zajként. Ami még ennél is fontosabb, az instrukciótól függött, hogy a résztvevők hogyan hallották őket. Azok, akiknek azt mondták, hogy különös elektromos zajokat fognak hallani, valóban így értelmezték azokat, és nem hallottak beszédet. Azok viszont, akiknek azt mondták, hogy beszédet fognak hallani, képesek voltak megérteni azt, még ha nehezen is. Érdekes módon, miután a résztvevők egyszer már beszédként értelmezték a hangokat, később már nem voltak képesek nem így hallani őket. Ez a jelenség hasonlít a látás kapcsán tárgyalt azon mintafelismerési jelenségekhez, amikor csak bizonyos előzetes tudás birtokában vagyunk képesek egy alulspecifikált ábrán egy tárgyat felismerni (ilyet láthatunk a tárgylátással foglalkozó fejezetben). Eszerint tehát, ha beszédhangokat hallunk, akkor azokat kétféleképpen, beszédként vagy nem beszédként észlelhetjük. A beszédmód beindulásához az szükséges, hogy a hallgató a megfelelő, beszédszerű ingerekkel találkozzon. Ha ezek a hangok nem egyértelműek, mint a szinuszhullámú beszéd esetén, akkor az előzetes elvárások befolyásolhatják azt, hogy a hallgató beszédet vagy nem beszédet hall-e. A legtöbb esetben azonban nem kétséges, hogy amit hallunk, beszéd-e vagy sem, így ezekben az esetekben a beszédmód automatikusan beindul. Az automatikusságot bizonyítja, hogy nagyon nehezen tudjuk a beszédet nem beszédként hallani. Akárhogyan is próbáljuk, a természetes beszédet nem igazán tudjuk füttyök, zörejek és sziszegések kavalkádjának hallani, mint ahogyan ez a szinuszhullámú beszéd esetében minden probléma nélkül lehetséges. Remez és munkatársai (1981) viselkedéses mutatókat alkalmazó kísérleteinek eredményeit nemrégiben idegtudományi módszerekkel (EKP és fMRI) is megerősítették. A kutatók (Dehaene-Lambertz et al. 2005) azt találták, hogy ugyanazt a hangingert a kísérleti személyek beszéd üzemmódban gyorsabban dolgozzák fel; azaz, ha fonémaelvárásuk van, akkor az eltéréseket előbb detektálják, mint ha komplex hangot várnak. Ezenkívül azt is sikerült kimutatni, hogy a beszédhang üzemmódban a bal félteke másodlagos hallókérgi területen az agyi aktivitás erőteljesen növekszik. A beszédmód működését a szinuszhullámú beszéd észlelésén kívül két másik jelenségben is tetten érhetjük: a fonémák egy speciális észlelési módjában, az úgynevezett kategoriális észlelésben, valamint a beszédészlelés 242 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
agyféltekei különbségében. Nézzük meg először az agyféltekei különbségeket, a kategoriális percepció jelenségét pedig majd ezután tárgyaljuk.
1.4.4. Agyféltekei különbségek a beszédészlelésben A beszédhangok észlelése kapcsán nagyon sok kísérlet vizsgálta azt, hogy a feldolgozás jellegzetességeiért és eltéréseiért mely agyi területek felelősek. Bár ezen területek pontos azonosítása máig nem fejeződött be, általánosságban igaz az, hogy a beszédhangok feldolgozása inkább az agy bal oldali területein történik. A legelső kísérleti bizonyítékok olyan vizsgálatokból származnak, amelyek a beszédhangok feldolgozásánál a jobb fülbe érkező hangok feldolgozásának fölényét mutatták ki. Ezekben a vizsgálatokban a kísérleti személyeknek dichotikusan mutatnak be különböző szavakat, mégpedig mindkét fülbe egyszerre. A dichotikus hallgatási helyzetben a feladat az, hogy a bemutatás után idézzenek fel annyi szót, amennyit csak tudnak. Az ilyen kísérletek általános eredménye az, hogy a személyek több szót idéznek fel a jobb fülbe érkező szavak közül, mint a bal fülbe érkezők közül. Ez arra utal, hogy a beszédet feldolgozó agyi központok a bal féltekében találhatók, mivel tudjuk, hogy a fülekből érkező hallóidegek átkereszteződnek, vagyis a jobb fülből érkező információ a bal féltekébe jut, a balból érkező pedig a jobba. A jobb fül előnyét (az angolban a right ear advantage kifejezés alapján a REA rövidítést használják) kimutató kísérletek mellett közvetlenebb bizonyítékok is rendelkezésre állnak, amelyek a beszéd bal féltekei feldolgozását igazolják. Így a képalkotó eljárásokat alkalmazó vizsgálatok (fMRI, PET) általánosságban azt mutatják, hogy a beszédhangok hallgatása során az agy bal oldali részei és elsősorban a halántéklebeny egyes részei aktívak (Scott-Johnsrude 2003).
1.5. A beszédhangok kategoriális észlelése A beszédhangok kategoriális észlelése elnevezés arra a jelenségre utal, hogy az akusztikus jel kisebb-nagyobb mértékű változásai nem okoznak változást az észleletben, míg más, akusztikai jellemzőiben hasonló mértékű változások az észlelet megváltozásához vezetnek, azaz egy másik fonéma észlelését eredményezik. A kategoriális percepció valójában nem más, mint az anyanyelv beszédhangjainak torzított észlelése. Arról van ugyanis szó, hogy nem pontosan azt észleljük, ami valójában elhangzik, vagyis a beszédhangok fonémaazonosításának folyamatában nem képezzük le pontosan a hangok akusztikai tulajdonságait. Ez annál is furcsább, mert, mint láttuk, általában nagyon pontosan észleljük a hangok különböző akusztikai jellemzőit. Például, ha egy tiszta hang frekvenciáját változtatjuk, akkor nagyon jól különbséget tudunk tenni az egyes változások között. Ráadásul nagy különbség van a hangokban bekövetkező változás megkülönböztetése (diszkrimináció) és a megváltozott hangok azonosítása között. Általában sokkal több hangot meg tudunk különböztetni, mint ahányat azonosítani tudunk. A fonémáknál ez nem így van. Minden kísérleti adat arra utal, hogy körülbelül ugyanannyi fonémát tudunk diszkriminálni, mint amennyit azonosítani. Lényegében ez jelenti a kategoriális észlelést, azaz az egy adott fonémával azonosítható sokféle, eltérő akusztikai tulajdonságú beszédhangoknak a kategórián belüli akusztikai eltéréseit nem tudjuk diszkriminálni. Mindez arra utal, hogy a beszédhangok feldolgozása jelentősen eltér minden más hangétól, hiszen bármilyen, nem-beszéd jellegű hangoknál nem találjuk meg a kategoriális észlelést. Akármennyire torzított észlelést takar is a kategoriális percepció, nagyon is fontos célt szolgál, nevezetesen, a beszédhangok meghatározó akusztikai jegyeinek feldolgozását követő fonémaazonosítást. Azt segíti, hogy az egyébként nagymértékben változó akusztikus jellemzőkkel rendelkező beszédhangokat a fonémakategóriákhoz rendeljük. Azt is mondhatjuk, hogy a kategoriális észlelés teszi lehetővé azt, hogy a beszédhangokat megfelelően megértsük, hiszen a beszédhangok esetében pont az lenne a rossz, ha mindig pontosan az akusztikai jellemzőik mentén dolgoznánk fel őket.
1.5.1. A kategoriális észlelés kísérleti vizsgálata A kategoriális észlelés kísérleti bizonyításához kétfajta paradigmát szoktak alkalmazni: egy azonosítási és egy diszkriminációs vizsgálatot. Az azonosítási (identifikációs) vizsgálatban a kísérleti személyeknek olyan beszédhangokat mutatnak, amelyek csak egyetlen paraméter mentén térnek el egymástól (pl. csak az F2-ben). Ezt a paramétert egy kontinuum mentén, kis lépésekben változtatják, és a személyeket arra kérik, mondják meg, hogy melyik fonémát hallják. Ezzel az eljárással a fonémakategóriák határait lehet megtalálni. Liberman és munkatársai (1957) például kizárólag az F2 formáns átmenetének változtatásával mesterségesen létre tudták hozni a / bi/, /di/ és /gi/ szótagokat (11.10. ábra).
243 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
11.10. ábra. A Liberman és munkatársai (1957) által használt ingeranyag. Az F2 formáns fokozatos változtatásával elõbb a /bi/, azután a /di/, majd a /gi/ szótag jött létre Noha ezek egyáltalán nem hangzottak természetesen, mégis jól érthetőek voltak. Ezek után az egyik szótagból kiindulva, kis lépésekben változtatni kezdték a formánsátmenetet, egészen addig, amíg meg nem kapták a második, majd a harmadik szótagot. Ezzel egyfajta kontinuumot hoztak létre. Arra voltak kíváncsiak, hogy a személyek hogyan észlelik az F2 formánsátmenet változásának azon lépéseit, amelyek nem vezetnek egy másik fonéma észleléséhez, hanem valahová a kettő közé esnek. Ha belegondolunk, két eset lehetséges: például ha a / bi/ szótagból indulunk, és kis akusztikai változtatásokkal haladunk a /di/ szótag felé, akkor vagy az történik, hogy a személyek a két szótag között valamilyen átmeneti szótagot hallanak, vagy pedig egy ideig a /bi/-t, majd pedig a /di/-t. Valójában a kísérleti személyek ez utóbbiról számoltak be. Nem hallották a kis ugrásokat, hanem az észlelt szótag egyik pillanatról a másikra változott meg. Ha megnézzük a 11.11. ábrát, azonnal látszik, hogy a kísérleti személyek egy adott kategória elemeit jó ideig teljes bizonyossággal (100%) az adott kategóriához sorolják, és soha (0%) nem a másikhoz. A két kategória határán (50%) viszont meredeken, mindenféle fokozatos átmenet nélkül vált az észlelő a másik kategóriára. Ez azért is különös, mert az akusztikai lépés nagysága a kategóriahatáron ugyanakkora, mint előtte a kategórián belül volt. Az észlelésben azonban drámai a különbség. Vagyis egyszerűbben fogalmazva: ugyanazon kategórián belül (a fonéma absztrakt reprezentációja) az eltérő akusztikai megvalósulási változatokat nem halljuk, míg két, azonos akusztikus dimenzió mentén kontinuumot alkotó fonéma határán (például a zöngésségi időben eltérő /b/ és /p/) két eltérő hangot észlelünk.
11.11. ábra. A fonémák kategoriális észlelése. A formánsátmenet változtatásával a fonémák azonosítása egyik lépésrõl a másikra, hirtelen változik meg. Az x tengelyen feltüntetett számok az elõzõ ábrán látható ingerekre vonatkoznak A diszkriminációs vizsgálatban az a kérdés, hogy a személyek képesek-e a különböző mértékben eltérő beszédhangokat megkülönböztetni egymástól. Ez tehát egy másik oldalról vizsgálja meg a kategoriális észlelést, és ugyanakkor erősebb bizonyítékát nyújtja. A diszkrimináció esetén ugyanis nem az a feladat, hogy a személyek címkézzék a hangokat, hanem egyszerűen azt kell megmondaniuk, hallanak-e különbséget közöttük. Ez tehát egy „alacsonyabb szintű” feldolgozást igényel. A diszkrimináció vizsgálatához leggyakrabban az úgynevezett AXB paradigmát használják. Ebben három beszédhangot mutatnak be egymás után, amelyek az azonosítási feladathoz hasonlóan csak egy paraméterben térnek el egymástól, és a kontinuum különböző részeiről választják ki őket. Valójában a diszkriminációs feladatban ugyanazokat az ingereket lehet használni, mint az azonosításiban. A három inger közül az A és B alkot egy párt, amelyek vagy egy fonémakategóriából, vagy két külön kategóriából származnak. Az X hang megegyezik vagy az A-val, vagy a B-vel. A kísérleti személyek feladata, hogy az AXB sorozat meghallgatása után eldöntsék, hogy az X az A-ra vagy a B-re hasonlít-e inkább. Ha a személyek nem tudják megkülönböztetni az A és a B hangot, akkor az X hanggal kapcsolatos döntés véletlen körüli találati pontosságú lesz, vagyis 50 százalék. Ha viszont különbséget tudnak tenni a két hang között, akkor ez az arány 50 százalék feletti lesz. Ezzel az eljárással úgy tudjuk bebizonyítani a kategoriális észlelés létezését, ha azt találjuk, hogy a kísérleti személyek nem tudnak különbséget tenni A és B között akkor, ha azonos fonémakategóriából származnak (de eltérő akusztikai tulajdonságaik vannak), de jól meg tudják különböztetni őket, ha eltérő kategóriába tartoznak.
244 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
Vagyis a diszkrimináció fogalmaiban a kategoriális észlelés úgy fogalmazható meg, hogy a beszédhangok esetében a kategóriák közötti különbségre nagyon érzékenyek vagyunk, vagyis ezeket a különbségeket jól tudjuk diszkriminálni, a kategórián belüli különbségekre viszont elveszítjük az érzékenységünket, vagyis ezeket kevésbé jól tudjuk diszkriminálni.
1.5.2. A kategoriális észlelés újabb eredményei A beszédhangok kategoriális percepciójának első leírása óta természetesen nagyon sok vizsgálat született, amelyek több ponton is módosították Liberman és munkatársai (1957) eredeti elképzelését. Az egyik ilyen, azóta módosított elképzelés, hogy a kategoriális észlelés csak a mássalhangzókra vonatkozik. Liberman szerint, mivel a koartikuláció csak a mássalhangzókra vonatkozik, csak a mássalhangzóknál jelentkezik az akusztikai változatosság. Ebből következően valójában csak a mássalhangzók esetében van szükség arra, hogy az akusztikai információt átkódoljuk fonémakategóriákká, vagyis hogy ezeket kategoriális módon észleljük. Mivel tehát a magánhangzók esetében a koartikuláció nem jelentős, ezért azokat nem kategoriális módon, hanem a többi, nem beszédhanghoz hasonlóan dolgoznánk fel. Ha azonban jobban megvizsgáljuk a magánhangzók akusztikai jellemzőit, akkor azt találhatjuk, hogy valójában ezeknél is van bizonyos kontextusfüggő változás, főleg a természetes beszédhelyzetben, amikor is viszonylag gyorsan követik egymást a hangok. Ilyen „természetes” magánhangzókat vizsgálva valóban találtak bizonyítékot amellett, hogy a magánhangzók esetében is kategoriális észlelés működik (Fujisaki-Kawashima 1971, Pisoni 1975). Egy másik módosítás arra vonatkozik, hogy a kategoriális észlelés beszédspecifikus lenne. Liberman eredeti elképzelése szerint ugyanis a kategoriális percepció kizárólag a beszédhangok észlelésére jellemző, bizonyítékát adva a speciális beszédmód működésének. Azóta azonban kiderült, hogy vannak olyan nem-beszéd jellegű akusztikus ingerek is, amelyeket szintén kategoriális módon észlelünk. Locke és Kellar (1973) például zenei akkordokat mutattak be olyan kísérleti személyeknek, akik vagy profi zenészek vagy zenével nem foglalkozó laikusok voltak. Az akkordok három, egyszerre hallható tiszta hangból álltak, és csak a középső hang frekvenciáját változtatták egy kontinuum mentén. A kontinuum két végét két létező akkord alkotta. Azt találták, hogy a zenészek valóban kategoriálisan észlelték a hangokat, vagyis azokat a hangokat is, amelyek nem feleltek meg tökéletesen az akkordnak, hajlamosak voltak ahhoz hasonlónak észlelni. Ez a hatás nem jelentkezett ilyen erősen a laikusoknál, ők sokkal inkább az akusztikai különbségeknek megfelelően észlelték a hangokat. Végül a harmadik fontos módosítás a kategoriális percepció humánspecifikusságát érintette. Természetesen, ahogyan az egész beszédészlelést, a fonémák kategoriális percepcióját is csak az emberekre vonatkoztathatónak tartották. Ezzel szemben kiderült, hogy bizonyos körülmények között állatok is képesek a beszédhangok kategoriális észlelésére. Kuhl és Miller (1975) például csincsillákat vizsgálva azt találta, hogy ha megtanítják őket a /d/ és /t/ hang megkülönböztetésére (a csincsillák számára ismeretlen és jelentés nélküli ingerekhez jutalmat lehet társítani), akkor egy a fentiekben bemutatott klasszikus azonosítási feladatban a csincsillák „kategóriahatárai” hasonlóak lesznek az emberekéihez. Mindezek az eredmények tehát azt mutatják, hogy a kategoriális percepció nem csak a mássalhangzókra vonatkozik, sőt valójában nem-beszéd jellegű akusztikus ingereknél is megtalálható, ráadásul nem csak az ember képes erre. Ez megkérdőjelezi azt a feltételezést, hogy a kategoriális észlelés a speciálisan csak beszédhangokat feldolgozó észlelési mechanizmus létét bizonyítja. Mivel magyarázható akkor?
1.5.3. A kategoriális észlelés magyarázata A kategoriális percepció egyik leginkább elfogadott magyarázata a tanulással indokolja ennek létrejöttét. Eszerint, amikor a beszéd megértését tanuljuk, akkor megtanuljuk, hogy csak bizonyos akusztikai különbségekre figyeljünk oda, olyanokra, amelyek befolyásolják a szavak jelentését. Láttuk, hogy a fonéma koncepciója pontosan erre vonatkozik, hiszen azt mondtuk, hogy a fonémák azok a nyelvi egységek, amelyek képesek a szavak jelentését megváltoztatni. Megtanuljuk viszont azt is, hogy azokra az akusztikai különbségekre, amelyek például a koartikuláció miatt léteznek ugyan, de nem okoznak jelentésbeli változást a szavakban, nem kell odafigyelni. A nyelv elsajátítása során nagyon sokszor találkozunk ezzel a dologgal, és így fokozatosan megtanuljuk, hogy táblykilil AihságühlfangJöikc sésmtlyítéstem. Nagyon sok tanulás után tehát lényegében átalakul az észlelésünk, és tulajdonképpen már nem is halljuk meg azokat az akusztikai változásokat, amelyek nem befolyásolják a szavak jelentését. Ha ez megtörténik, akkor lényegében létre is jött a kategoriális percepció. A tanulásnak a kategoriális percepcióban játszott szerepét két dologgal is alátámaszthatjuk. Az egyik a fentebb már említett zenei akkordok példája. Láthattuk, hogy az akkordok észlelése is kategoriálisan történt, de csak a profi zenészek esetében. Ők aktívan és minden bizonnyal 245 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
hosz- szú idő át tanulták az akkordokat, és azt is megtanulhatták, hogy egy-egy akkord viszonylag eltérő akusztikai mintázatot tartalmazhat. A másik bizonyíték egy nyelvi különbségre mutat rá. A japán nyelvet beszélők számára különösen nagy problémát szokott okozni az, ha egy olyan idegen nyelvet kell megtanulniuk, amelyben az /l/ és /r/ hangok különálló fonémák, vagyis jelentésmegkülönböztető szerepük van. A japánban ugyanis nincs különbség e között a két fonéma között, ezért a japánok elveszítik érzékenységüket a két hang megkülönböztetésére. Természetesen minden más nyelv is így működik, vagyis mindazokra az akusztikai különbségekre, amelyek nem játszanak szerepet a fonémák elkülönítésében, elveszítjük az érzékenységünket.
1.5.4. A percepciós bázis A nyelvi egységek észlelésének mechanizmusa tehát a beszédmegértés fejlődése során alakul ki. Ahogy láttuk, ez a mechanizmus lényegében dekódolást hajt végre: az akusztikus információt (beszédhangok) fordítja le a perceptuális egységek mentális reprezentációjára (fonémák). Ezt a mechanizmust percepciós bázisnak nevezzük. Minden nyelvnek saját percepciós bázisa van, amely tanulás révén jön létre, az anyanyelv elsajátítása során. Azt mondhatjuk, hogy a percepciós bázis egyfajta szűrőként működik, vagyis csak azokat a beszédhangokat tudjuk feldolgozni, amelyek léteznek a saját nyelvünkben is. Ennek működését egy nagyon egyszerű példával szemléltethetjük (Gósy 2005). Tegyük fel, hogy van egy gyümölcsválogató gépünk, amely képes különválogatni az almát, a barackot, a körtét és a szilvát. Az a feladata, hogy amikor beledobunk egy gyümölcsöt, akkor azt annak fizikai jellemzői alapján betegye a megfelelő rekeszbe, vagyis gyümölcskategóriába. A gép úgy van beállítva, hogy csak a gyümölcsök lényeges jellemzőit vegye figyelembe, tehát azzal például nem foglalkozik, hogy a beledobott almák pontosan milyen színűek vagy méretűek, mivel azok lehetnek pirosak, sárgák, zöldek, kicsik, nagyok stb. De mi történik akkor, ha egy narancs jelenik meg a válogatandó gyümölcsök között? Természetesen a gép ezt is bele fogja dobni valamelyik rekeszbe, annak ellenére, hogy pontosan egyik kategóriának sem felel meg. Mégpedig abba a rekeszbe fogja belerakni, amelynek a tulajdonságaihoz a leginkább hasonlít. A gépnek ez a működése teljesen automatikusan és fennakadás nélkül zajlik. Nem áll meg gondolkodni azon, hogy most akkor melyik rekeszbe is kerüljön ez az újfajta gyümölcs, és nem is lepődik meg, hogy ilyennel találkozott. A gyümölcsválogató gépnek ez a működése megfelel annak, amit a beszédhangok percepciója során az észlelőrendszer csinál. A beszédészlelés során is vannak különböző jellemzőkkel rendelkező hangok, amelyeket meg kell feleltetnünk bizonyos véges számú fonémakategóriáknak. A hangok bizonyos akusztikai jellemzői fontosak, mások meg nem, és azt, hogy pontosan mely jellemzőkre kell figyelnünk, a nyelvelsajátítás során tanuljuk meg. Ez az analógia jól mutatja azt is, hogy mi történik akkor, ha egy olyan beszédhanggal találkozunk, amelynek nincs megfelelő kategóriája: ezt betesszük egy számunkra már létező kategóriába. Az ember azonban képes arra is, hogy ha szükséges, módosítsa a kategóriákat. A nyelvtanulás során pontosan ezt tesszük, vagyis új kategóriákat hozunk létre, és ezzel lényegében bővítjük a percepciós bázisunkat. Minden fonémakategória esetén kialakul az adott kategóriára leginkább jellemző akusztikai mintázatokkal rendelkező elem, az úgynevezett prototípus. Ez lenne az az elem, amit a csecsemő a leggyakrabban hall, vagyis ami az adott nyelvre leginkább jellemző. Miután ez a prototípus létrejött, úgy kezd el működni, mint egy perceptuális mágnes (lásd a szövegdobozt). Azokat a beszédhangokat, amelyek hasonlítanak hozzá, elkezdi maga felé vonzani. Ennek az lesz az eredménye, hogy a prototípushoz hasonló, de azzal nem megegyező hangokat is elkezdjük ugyanolyannak észlelni. Következésképpen a prototípushoz közeli hangok esetében, vagyis a kategórián belül csökkennek a különbségek, a prototípushoz nem hasonlító hangok esetében viszont nő a különbség, vagyis ezek eltérő kategóriába fognak kerülni. Ez a perceptuálismágnes-hatás tehát gyakorlatilag felülírja a valódi akusztikai különbségeket, és valójában azokat a hangokat fogjuk hasonlóan hallani, amelyek azonos kategórián belül vannak, és azokat halljuk különbözőnek, amelyek két külön kategóriában vannak. Mindez gyakorlatilag független attól, hogy valójában mekkora akusztikai különbség van a hangok között, mivel ugyanakkora különbség okozhatja az azonos kategóriába tartozást és a különböző kategóriába tartozást is. A perceptuális mágnes esetében tehát egy alapvető mechanizmus a kategórián belüli perceptuális különbségek csökkentése és a kategóriák közötti perceptuális különbség növelése.
13.3. táblázat AZ ANYANYELVI MÁGNES A nyelvre jellemző fonémakategóriák elsajátítása kapcsán érdemes megemlítenünk Patricia Kuhl (1991) „perceptuális mágnes” vagy „anyanyelvi mágnes” (NativeLanguageMagnet) elméletét. Eszerint a csecsemők már születésüktől képesek a beszédhangokat megkülönböztetni, de valójában az összes lehetséges fonéma
246 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
között képesek különbséget tenni. Az anyanyelvvel való intenzív érintkezés hatására azonban a fonémakategóriák átalakulnak, és idomulnak az adott nyelvhez. Azok a kategóriák, amelyek az adott nyelvben nem léteznek, eltűnnek (például a japánban az l-r különbség), és a megmaradó kategóriák is megváltoznak úgy, hogy a kategóriahatárok megfeleljenek az adott nyelvben létező kategóriáknak. Ezt úgy képzelhetjük el, mintha egyfajta észlelési térben különböző mozgások és görbületek jönnének létre. A teret a lehetséges akusztikai jellemzők határozzák meg, és a fonémák ennek a térnek bizonyos pozícióit foglalják el. Kicsit „dramatizálva” a helyzetet, úgy foglalhatjuk össze a csecsemők beszédészlelésének fejlődését, hogy minden baba „világpolgárként” születik, azzal a képességgel, hogy a világ összes nyelvében fellelhető beszédhangokat meg tudja különböztetni. De azután mire egyévesek lesznek, elveszítik ezt a képességüket, „nyelvspecialistákká” válnak, és már csak a saját anyanyelvük hangjai között tudnak különbséget tenni. Mindez azonban természetesen szükségszerű, és lehetővé teszi azt, hogy azokat a jellemzőket, amelyek a saját nyelvünkben fontosak, a lehető legjobban és leggyorsabban képesek legyünk feldolgozni.
1.6. A fonéma mint elemi perceptuális egység Mind ez idáig a fonémáról úgy beszéltünk, mint a beszéd alapvető alkotóeleméről, és a beszédészlelés céljaként a bejövő akusztikai információ és a fonéma reprezentációja közötti megfeleltetést jelöltük ki. Láttuk azonban azt is, hogy ez a megfeleltetés akusztikai bemenet és reprezentáció között nem egyértelmű, mivel a beszédhangok meglehetősen változatos akusztikai jellemzőkkel rendelkezhetnek a kontextustól és a beszélőtől függően. Ezen akusztikai-fonetikai non-invariancia-probléma egyik megoldásaként kínálkozott az, hogy a beszédhangokat nem pontos akusztikai megjelenésüknek megfelelően észleljük, hanem kategoriális módon, mintegy elvonatkoztatva az akusztikai információtól. Láttuk azt is, hogy a kategoriális észlelés a nyelvi tapasztalat révén jön létre, és ennek megfelelően nyelvspecifikus, azaz minden nyelv esetében más. Azonban annak ellenére, hogy tudjuk, hogy a fonémákat kategoriálisan észleljük, ez még nem feltétlenül jelenti azt, hogy valóban a fonéma az a perceptuális egység, amit a beszédészlelés során feldolgozunk. A fonéma mint elemi perceptuális egység problémája úgy fogalmazható meg, hogy a fonémák észlelése valójában két módon történhet: közvetlenül vagy következtetés révén. A közvetlen észlelés azt jelenti, hogy a beszédészlelés során az akusztikai inputot a fonémák mentén „daraboljuk fel”, és ezeknek a szekvenciáknak feleltetjük meg a fonémákat. A következtetés révén történő észlelés során viszont előbb egy nagyobb egységet észlelünk, majd pedig a későbbiekben ezt tördeljük kisebb egységekre, azaz fonémákra. Azt természetesen senki sem vitatja, hogy a beszédészlelés központi és alapvető feladata a fonémák reprezentációjának létrehozása. Mindkét elmélet szerint igaz az, hogy a fonémák nyelvi realitással rendelkeznek, hiszen a minimális párok (kéz-kész) jelentése között egyedül a fonémák tesznek különbséget. Az viszont kérdéses, hogy vajon a beszéd észlelése során közvetlenül ezeket észleljük-e, vagy pedig csak következtetünk rájuk. Milyen bizonyítékokat lehet hozni amellett, hogy a fonémákra valójában csak következtetünk?
1.6.1. A fonémarestaurációs hatás A fonémák nem közvetlen észlelésére utaló egyik lehetséges bizonyíték a fonémarestauráció jelensége (Warren 1970). A fonémarestauráció vagy fonemikus helyreállítás arra vonatkozik, hogy amikor egy szóból kivesznek egy fonémát, és a helyét zajjal elfedik, akkor ezt általában nem vesszük észre, és nem tudjuk megmondani, hogy melyik beszédhang hiányzott. Warren a vizsgálatában mondatokat játszott le a kísérleti személyeknek; a mondatok egyik szavából egy-egy fonémát kivett, és valamilyen természetes zajjal (pl. köhögéssel) helyettesítette. Például: „A képviselők találkoztak a fővárosban összehívott *örvényhozó testületekkel”, ahol a * helyén köhögés volt hallható. Az ehhez hasonló mondatok megértése semmilyen problémát nem okozott a kísérleti személyeknek, sőt valójában sem azt nem tudták megmondani, hogy melyik hang hiányzott a mondatból, sem azt, hogy pontosan hol szerepelt az elfedő inger (a köhögés). Hasonló jelenséggel már találkoztunk az előző fejezetben, a hallási szerveződés elveinél. A folytonosság illúziója nagyon hasonló jelenségre mutatott rá, hiszen annál arról volt szó, hogy ha egy eredetileg nem folytonos hangban a szünetek helyét zajjal kitöltjük, akkor a hangot folyamatosnak fogjuk hallani. A fonémarestauráció tulajdonképpen ugyanerre a dologra vonatkozik, hiszen itt is egy nem létező hang hallását teszi lehetővé az, hogy egy elfedő ingert mutatunk be a hang helyén.
247 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
A jelenség további vizsgálata feltárta, hogy a fonémarestauráció három feltételtől függ: az elfedő hang tulajdonságaitól, a beszéd folytonosságától és a hallgató nyelvi képességeitől. A jelenség ezek szerint csak akkor áll elő, ha az elfedő hang valóban egy maszkolásra alkalmas hang, vagyis ha csak csenddel helyettesítjük a fonémát, akkor nem jön létre a hatás. Valamint az szükséges, hogy a hallgató a beszédet valóban folytonosnak észlelje, ellenkező esetben szintén nem alakul ki a fonémarestauráció. Végül úgy tűnik, hogy a fonémarestauráció magas szintű nyelvi képességeken alapul. Amikor a kísérleti személyeknek olyan szavakat mutattak, amelyekben egy fonémát szándékosan rosszul ejtettek (pl. „kommuwikáció” – „kommuíikáció”), majd ezt a rosszul ejtett fonémát vágták ki és cserélték ki zajjal, akkor azt tapasztalták, hogy a személyek a helyes, és nem a rosszul ejtett fonémát állították vissza. Annak ellenére történt ez így, hogy a koartikuláció a /t/ és nem az /n/ hangot jelezte előre. Vagyis úgy tűnik, hogy a személyek a fonémarestauráció során felhasználják magas szintű nyelvi ismereteiket is. A fonémarestaurációs hatás azt mutatja, hogy akkor is hallhatunk fonémákat, ha azok voltaképpen nem is szerepelnek az akusztikai inputban, ráadásul az ily módon hallott fonémák nem különböznek a valóban hallottaktól. Következésképpen az akusztikai bemenetből nem feltétlenül a fonémákat nyerjük ki elsőként, hanem inkább csak következtetünk azokra. Kiegészítésképpen érdemes megjegyeznünk, hogy az úgynevezett kattanás- (click-) kísérletek eredményei szintén arra utalnak, hogy a percepció a fonémáknál nagyobb egységekben történik. Ezekben a vizsgálatokban a folyamatos beszédben kattanó hangokat helyeznek el, a kísérleti személyeknek pedig ezek helyét kell meghatározniuk. Az esetek többségében ez nem sikerül, sőt a legtöbben észre sem veszik a kattanást. Az ilyen, elsősorban a beszédfeldolgozás hierarchiájának feltárására végzett kísérletek következtetése is az, hogy a beszédészlelésben a fonémáknál nagyobb egységek működnek.
1.6.2. A fonémák azonosításának sebessége Egyéb bizonyítékok is vannak arra vonatkozóan, hogy nem a fonéma az elsődleges perceptuális egység. A fonémamonitorozási feladatokban például azt találták, hogy a kísérleti személyek gyorsabban detektálják a szótagokat, mint a fonémákat (Savin-Bever 1970). A fonémamonitorozási feladatban a résztvevőknek az a feladatuk, hogy egy szöveget hallgassanak, és minél gyorsabban lenyomjanak egy gombot, ha a szövegben észreveszik a célingert, amely egy fonéma vagy egy szótag lehet. Az ilyen kísérletek általános eredménye az, hogy a kísérleti személyek rövidebb reakcióidővel reagálnak a célingerre, ha az egy szótag, mint ha az egy fonéma. Ez arra utal, hogy az input feldolgozása során a szótagokat előbb dolgozzuk fel, mint a fonémákat, vagyis valószínűleg ez utóbbiak már egy következtetési folyamat eredményei.
1.6.3. A magánhangzószekvencia-illúzió Az egyik leginkább meggyőző bizonyíték a magánhangzószekvencia-illúzió vagy illuzórikus szótag nevű jelenségből származik. Az illúzió abban áll, hogy ha nagyon rövid magánhangzócsoportokat (pl. négy magánhangzóból álló szekvenciákat) gyors egymásutánban mutatunk be, akkor nem különálló fonémákat hallunk, hanem szótagokat. Ezekre az illuzórikus szótagokra az jellemző, hogy követik az adott beszélők nyelvi tapasztalatait, vagyis a formánsátmenetekhez hasonló akusztikai jellemzőket az észlelő az anyanyelvére jellemző és az anyanyelv fonotaktikai (a beszédhangoknak az adott nyelvben lehetséges együtt-előfordulása) szabályainak megfelelő szótagként hallja (Warren et al. 1991). Ez a különös észlelet szintén arra utal, hogy a beszéd észlelése során nem elsődlegesen a fonémákat dolgozzuk fel, hanem nagyobb, magasabb szintű nyelvi egységeket. A magánhangzószekvencia-illúzió pontosan azt mutatja, hogy ha az ingerfeltételek nem optimálisak (például mert a hangok túl gyorsan követik egymást), akkor az észlelőrendszer nem képes kivonni a fonémainformációt, de a szótagokat továbbra is felismeri. Sőt az optimális feldolgozásra alkalmatlan fonémaszekvencia kapcsán egy olyan döntést hoz, hogy azok minden bizonnyal nem önmagukban állnak, hanem mássalhangzókkal együtt, és ez utóbbiakat „mesterségesen” hozzáadva, egy szótagsorozat észleletét kapjuk meg. Mindezek az eredmények tehát, kiegészítve a fonémaészlelés fejlődési aspektusával, melyről a Fonémaészlelés gyerekeknél című szövegdobozban lehet olvasni, megkérdőjelezik azt, hogy valóban a fonéma lenne az a perceptuális egység, amely mentén a beszédet észleljük. Természetesen felmerül a kérdés, hogy akkor melyik nyelvi egység lenne alkalmas az elemi perceptuális egység szerepére. Ahogy a fentiekben láthattuk, bizonyos esetekben a szótagok sokkal inkább alapvető perceptuális egységként viselkednek: a szótagokat gyorsabban detektáljuk a fonémamonitorozási helyzetben, a magánhangzószekvencia-illúzió esetében szótagokat hallunk különálló fonémák helyett, és a gyerekek is könnyebben tagolják a hallottakat szótagokra, mint fonémákra. A szótagokkal mint perceptuális egységekkel kapcsolatban azonban van egy komoly probléma: nevezetesen az, hogy egy adott nyelvben a lehetséges szótagok száma meglehetősen nagy. Ez azért okoz problémát, mert túl sok 248 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
információt kellene elraktároznunk. A fonémák esetében ez a tárolási feladat nagyon hatékonyan működik: a fonémákból viszonylag kevés van, mégis az összes lehetséges szó felépíthető a segítségükkel. A szótagok esetében sokkal több eltárolt információra van szükség ahhoz, hogy minden lehetséges szót fel tudjunk építeni belőlük. Ez úgy oldható fel, ha azt feltételezzük, hogy a beszédészlelés automatikus azonosítási egységei a fonémák (ezek kategoriális természete születéstől fogva adott, a tapasztalat ezt módosítja), az észlelő számára hozzáférhető perceptuális egységek viszont a szótagok. Egyelőre még nem született konszenzus az elemi perceptuális egységgel kapcsolatban, és nem lehetünk biztosak sem a fonéma, sem a szótag „nyerési esélyeiben”. Az itt bemutatott eredmények arra utalnak, hogy a fonéma reprezentációja sok esetben nem közvetlen módon, hanem valamilyen következtetés révén jön létre. Ugyanakkor vitathatatlan a fonéma nyelvi realitása, vagyis az, hogy létfontosságú szereppel bír a beszéd észlelésében. További kutatások fogják eldönteni ezt a kérdést.
13.4. táblázat FONEMAESZLELES GYEREKEKNÉL A felnőttekkel végzett kísérleteken kívül két speciális csoporttal folytatott kísérletek eredményei is azt támasztják alá, hogy a beszéd észlelésében nem a fonéma a legfontosabb perceptuális egység. Gyerekekkel végzett kísérletek azt mutatják, hogy ők még nem képesek meghatározni az egyes szavakban található fonémák számát, vagyis nem képesek a szavakat fonémákra bontani. Ezzel szemben a szavak szótagjainak számát pontosan meg tudták határozni. Ez arra utal, hogy a szavak beszédhangokra bontása nem automatikus folyamat, miközben a beszédhangkontrasztok eltérésének agyi feldolgozása az (bővebben lásd Csépe 2006). Mivel azonban a gyerekek kb. öt-hat éves koruk előtt a szavakat nem képesek az összetevő fonémák szerint lebontani, azonosítani, azt is feltételezhetjük, hogy a fonémák azonosításának képessége tanult (Liberman et al. 1974). Nem csak a gyermekek számára okoz nehézséget a szavak fonémákra tagolása. Morais (1979) azt találta, hogy az olvasni nem tudó, azaz analfabéta felnőttek számára szintén nehézséget okoz a szavakat alkotó fonémák azonosítása. Ez arra utal, hogy a szavak fonémákra bontása nem automatikus folyamat, hanem tanulás révén, mégpedig az olvasás tanulása révén jön létre. Az olvasás folyamatait a nyelv és gondolkodás témakörében szokás inkább tárgyalni (Csépe-Győri-Ragó [szerk.]: Általános pszichológia 3.), az érdeklődő olvasó ott bővebben tájékozódhat. Itt most csak annyit jegyeznénk meg, hogy az olvasási képesség elsajátításához nyilvánvalóan szükség van arra, hogy a gyerekek képesek legyenek a szavakat hangjaikra bontani és azokat a megfelelő fonémával azonosítani, hiszen azt kell megtanulniuk, hogy ezeket hogyan lehet hozzákapcsolni az írott szavakat alkotó betűkhöz.
2. A beszédészlelés elméletei Az eddigiekben áttekintettük mindazokat a jelenségeket, amelyek a beszédhangokkal és észlelésükkel kapcsolatosak. Nem foglalkoztunk azonban azzal a kérdéssel, hogy valójában hogy is valósul meg a beszéd észlelése. A továbbiakban azt a két legfontosabb elméletet tekintjük át, amelyek a beszédészlelést próbálták magyarázni.
2.1. A motoros elmélet A beszédészlelés motoros elmélete szerint a perceptuális invariancia annak köszönhető, hogy a beszédhangok feldolgozása során szoros kapcsolat van a beszédhangok produkciója és percepciója között, és ezt a kapcsolatot a percepció során fel is használjuk. Vagyis az, ahogyan a fonémákat produkáljuk, közvetlenül hat arra, ahogyan észleljük őket. Ennek az elképzelésnek több változata is létezik, amelyek közül a legismertebb az Alvin Liberman nevéhez fűződő motoros elmélet (Liberman et al. 1967). Az elmélet szerint a /di/ szótag kezdetét azért halljuk hasonlónak a /du/ szótag kezdetéhez, mert ezek képzésekor ugyanolyan motoros parancsot adunk ki a beszédképző szerveknek. Vagyis a percepció során azért tűnnek egyformának az egyébként eltérő akusztikai paraméterekkel rendelkező fonémák, mert a produkció során ezeket valóban egyformának szánjuk. Az más kérdés, hogy a beszélők különbözősége, illetve a koartikuláció miatt ezek a fonémák akusztikailag nem lesznek azonosak, de szándék szerint ezeknek egyformáknak kellene lenniük. A beszédészlelés során tehát valamilyen módon erre a szándékra próbálunk következtetni, és nemcsak az akusztikai inputot vesszük figyelembe, hanem megpróbáljuk kitalálni, hogy a beszélő mit akart mondani.
249 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
A motoros elmélettel kapcsolatban meglehetősen sok kritika fogalmazható meg. Az ellenérvek közül a legfontosabbak a következők (Gósy 2005): a. A beszédképzés hibája nem feltétlenül vezet az észlelés károsodásához. Például attól, hogy valaki nem képes az /r/ hangot kiejteni, még a megértésnél felhasználhatja azt. b. Az idegen nyelvet általában könnyebb megérteni, mint beszélni. Sőt a legtöbb esetben az, hogy akcentussal beszélünk egy idegen nyelvet, még nem okozza annak megértési problémáit. c. Az anyanyelv elsajátítása során a gyerekek előbb értik meg a beszédet, mint hogy beszélni tudnának. Mindezen kritikák ellenére a motoros elmélet – támogatói szerint – nagyon jól magyarázza a beszédészleléssel kapcsolatos alapvető problémát, vagyis az akusztikai-fonetikai non-invariancia-problémát. Ugyanakkor az elmélet legnagyobb hiányossága, hogy nem képes megmagyarázni, hogyan kapcsolódik össze a beszédészlelés során az akusztikai input és a produkciós szándék.
13.5. táblázat ALVIN MEYER LIBERMAN
Alvin Meyer Liberman 1917-ben született az egyesült államokbeli St. Josephben. Diplomáját a Missouri Egyetemen, PhD-fokozatát pedig a Yale-en szerezte. 1975 és 1986 között ő volt a Yale híres Haskins Laboratóriumának vezetője, és élete végéig ott dolgozott mint vezető kutató. Mind a Connecticut Egyetem, mind a Yale professzor emeritusává választotta. E két rangos cím jól tükrözi egész pályafutását: a Connecticut Egyetemen ugyanis a pszichológiai tudományok professzora, míg a Yale-en a nyelvészeti tudományok professzora volt. Liberman a beszédészlelés pszichológiai kutatásának meghatározó alakja volt, akinek elméletei nemcsak az elmúlt ötven év kutatásának alapjául szolgáltak, de fontos szerepet játszottak a modern számítógépes beszédszintézis kialakulásában is. Liberman beszéddel kapcsolatos kutatásai a második világháború után kezdődtek, amikor is azt a feladatot kapta, hogy hozzon létre vakoknak szánt olyan felolvasógépet, amely képes az írott szöveg beszéddé alakítására. Az első próbálkozások arra irányultak, hogy az ábécé különálló betűihez a betűknek megfelelő hangokat rendeljék hozzá. Többévnyi erőfeszítés után sem tudtak azonban egy olyan berendezést létrehozni, amely ezen az elven működve képes lett volna akár a normál beszéd tizedrészét megközelítő gyorsasággal érthető szöveget produkálni. A sikertelen próbálkozások hatására Libermant az kezdte foglalkoztatni, hogy a beszéd miért képes olyan gyorsan és hatékonyan a nyelvi információ átvitelére? Ennek a kérdésnek a tanulmányozása lényegében egész további tudományos pályafutását meghatározta, és elvezetett a beszédhangok kategoriális észlelésének és a beszédészlelés motoros elméletének megalkotásához. A kutatások során Liberman és munkatársai feltárták a beszédhangok több fontos akusztikai jellemzőjét is, ami azután nagyban segítette a számítógépes beszédszintézis létrejöttét. Jórészt Liberman munkásságának köszönhető, hogy a beszédészlelés tanulmányozása – ami addig elsősorban a nyelvészet érdeklődésére tartott számot – bekerült a kognitív pszichológia kutatási témái közé.
2.2. Megkülönböztető jegyek elmélete – vonásdetekció a beszédészlelésben A megkülönböztető jegyek elmélete szerint a beszéd feldolgozásának bizonyos szintjén vannak olyan vonásdetektorok, amelyek a fonémák bizonyos jellegzetességeire (képzés helye, zöngésség stb.) szelektíven 250 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
érzékenyek. Az elképzelés szerint ezek a neuronok hasonlóan működnek, mint a látás kapcsán tárgyalt vonásdetektorok, melyek a vizuális inputban található különböző jellemzőkre – mint az élek iránya vagy mozgása – voltak érzékenyek. A beszédészlelés kapcsán ezek a vonásdetektorok úgy működnének, hogy a már részben feldolgozott akusztikai inputban a nekik megfelelő jellemzőket keresnénk, és ha az jelen van, akkor tüzelnének, ha viszont nincs jelen, akkor nem tüzelnének. Például egy /d/ hang feldolgozása során azok a detektorok tüzelnének, amelyek a zöngés, az alveoláris és a zárhangokra lennének érzékenyek (lásd a 11.2. táblázatot). Ha ellenben a zöngétlen, az alveoláris és zárhangokra érzékeny neuronok tüzelnének, akkor a /t/ fonéma lenne aktív, vagyis azt észlelnénk. Fontos, hogy a detektorok működése nyelvspecifikus, vagyis egy adott nyelvre jellemző fonémakülönbségekre reagálnak. Ebből következően a vonásdetektorok válaszjellemzői a nyelvelsajátítás során alakulnak ki. Az elmélettel kapcsolatos legfőbb bizonyítékok hasonló kísérleti elrendezést használtak, mint amit a vizuális rendszer vonásdetektorainak tanulmányozásánál már láthattunk. Vagyis a kísérletek arra törekedtek, hogy az adott jellemzőre érzékeny neuronokat „kifárasszák” azáltal, hogy egy olyan ingert ismételnek sokszor, amelyre azok szelektíven válaszolnak. Például, ha egy bizonyos irányú vonalat hosszú ideig nézünk, akkor a kissé eltérő irányú vonalakat átmenetileg valódi irányuktól eltérőnek látjuk. Ennek az az oka, hogy a neuronok érzékenysége a sokáig nézett irányra a kifáradás miatt csökken. A beszédhangok esetében Eimas és Corbit (1973) végzett hasonló kísérleteket, amelyekben különböző mesterségesen előállított beszédhangokat mutattak be a kísérleti személyeknek. A hangok között voltak olyanok, amelyek nem egy fonémakategória prototipikus tagjai voltak, hanem két kategória között helyezkedtek el. Emiatt ezeket a kísérleti személyek hol az egyik, hol a másik kategóriába tartozónak észlelték (emlékezzünk vissza, hogy a kategoriális észlelés értelmében soha nem észlelünk „összegyúrt” kategóriákat, hanem mindig vagy egyik, vagy másik kategóriához tartozó hangokat). Ezután a személyek hosszú perceken át hallgatták az egyik tiszta kategóriát, majd ismét a bizonytalant. A kutatók azt találták, hogy az egyik kategória hosszú időn át történő hallgatásának hatására a bizonytalan fonémát sokkal inkább a másik kategóriába tartozónak észlelték a kísérleti személyek. Ez az eredmény úgy értelmezhető, hogy ugyanannak a fonémának a hosszú időn át való hallgatása kifárasztotta az arra érzékeny neuronokat, azaz a vizuális észlelőrendszerben megfigyelt adaptációs jelenségről lehet szó. A bizonytalan fonémáról feltételezhető, hogy azt mindkét neuroncsoport feldolgozza. Ha azonban az egyik csoportot kifárasztjuk, akkor csak a másik tud majd válaszolni, és emiatt a bizonytalan fonémát immár a másik kategóriába tartozónak fogjuk észlelni.
2.3. ÖSSZEFOGLALÁS 1. A beszédészlelés során a beszédhangok és hangkapcsolatok azonosítása történik. A beszédhangok a beszédnek azok a legkisebb elemei, amelyek egy adott nyelvben jelentésmegkülönböztető szerepűek. A beszédhangok a beszéddel kapcsolatos akusztikai információk, a fonémák pedig az általános tulajdonságok alapján azonosnak észlelt beszédhangok mentális reprezentációi. 2. A beszédhangokat a hangképző szervek hozzák létre, amelyek a gége alatti, a gégei és a gége feletti rendszerből állnak. A beszédhangok képzésekor a tüdőből kiáramló levegő megrezegteti a hangszalagokat, aminek hatására zönge keletkezik. A beszédhangok végső formáját az artikulációs csatorna (garat-, száj-, orrüreg) hozza létre. 1. A beszédhangok magánhangzókra és mássalhangzókra oszthatók, amelyek tovább csoportosíthatók a magánhangzók esetében a nyelv függőleges és vízszintes helyzete, az ajakállás és az időtartam, a mássalhangzók esetében pedig a képzés módja, a képzés helye, a zöngésség és az időtartam alapján. 2. A beszédhangok több frekvenciakomponensből összetevődő, periodikus hangok, amelyek a frekvencia és intenzitás időbeni változásait tartalmazzák. A beszédhangok frekvenciakomponenseit formánsoknak nevezzük, az alapfrekvenciát pedig F0-lal jelöljük. A beszédhangok időben változó frekvenciakomponenseit a spektrogramon lehet megjeleníteni. 3. A beszédhangok észlelési folyamata két szakaszból áll: a beszédhangoknak az akusztikai környezettől való elválasztásából, amely a perceptuális csoportosítás Gestalt-elvei alapján történik, és az ily módon elkülönített beszédhangok fonémaazonosításából. A beszéd akusztikai jellegzetességei nem teszik lehetővé a beszédhangok és a fonémák egy az egyben történő megfeleltetését (akusztikai-fonetikai varianciaprobléma). 4. Ennek oka, hogy a) a beszédhangok túl gyorsan követik egymást; b) koartikuláció jön létre, vagyis a beszédhang akusztikai jellemzői megváltozhatnak attól függően, hogy előtte vagy utána milyen hangok 251 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
állnak; c) a beszélő jellemzői (kor, nem, érzelmi állapot) befolyásolják a beszédhangok akusztikai megvalósulását; d) az akusztikai input folyamatos, a fonémareprezentáció viszont diszkrét (szegmentációs probléma). 5. A beszéd észlelése során dekódolás zajlik, és létezik egy speciális beszédmód, amely kizárólag a beszédhangok feldolgozását valósítja meg. A beszédmód létezésére több bizonyíték van: a) a szinuszhullámú beszéd észlelése; b) agyféltekei különbségek a beszéd észlelésében; c) a beszédhangok kategoriális észlelése. 6. A beszédhangok kategoriális észlelése azt jelenti, hogy az akusztikus jel kisebb-nagyobb mértékű változásai nem okoznak változást az észleletben, míg más, akusztikai jellemzőiben hasonló mértékű változások az észlelet megváltozásához vezetnek. A kategoriális észlelés azt segíti, hogy az egyébként nagymértékben változó akusztikus jellemzőkkel rendelkező beszédhangokat a fonémakategóriákhoz rendeljük. 7. A kategoriális észlelés tanulás révén jön létre: azt tanuljuk meg, hogy csak bizonyos akusztikai különbségekre figyeljünk oda, olyanokra, amelyek befolyásolják a szavak jelentését. A tanulás révén átalakul az észlelésünk, és elveszítjük érzékenységünket azokra az akusztikai változásokra, amelyek nem befolyásolják a szavak jelentését. Így jön létre az adott nyelvre jellemző percepciós bázis. 8. Vannak bizonyítékok amellett, hogy a fonémák valójában nem a beszéd alapvető perceptuális egységei, hanem következtetünk rájuk. Ezen bizonyítékok: a) a fonémarestaurációs hatás; b) a fonémák azonosítási sebessége; c) az illuzórikus szótag jelensége; d) a fonémaészlelés fejlődése kapcsán kapott eredményekből származnak. 9. A beszédészlelést két jelentős elmélet magyarázza: a) a motoros elmélet, amely a percepció és a produkció szoros együttműködését tételezi fel, és b) a megkülönböztető jegyek elmélete, amely a fonémák akusztikus jellemzőire érzékeny vonásdetektorokat tételez fel.
2.4. KULCSFOGALMAK akusztikai-fonetikai varianciaprobléma, artikulációs csatorna, dichotikus hallgatási helyzet, fonémák, fonémarestaurációs hatás, formáns, kategoriális észlelés, koartikuláció, motoros elmélet, spektrogram, szegmentációs probléma
2.5. ELLENŐRZŐ KÉRDÉSEK 1. Minimális pár-e a gal és a kai szó? 2. Próbáljuk meg felsorolni, hogy a ma szótag képzésében mely szervek vesznek részt! 3. Hogyan jön létre a beszédhangok komplex és periodikus jellege? 4. Mi szükséges ahhoz, hogy mesterségesen hozzunk létre beszédhangokat? 5. Mi a hasonlóság és a különbség az /i/ és /a/ hangok között a nyelv helyzete, az ajakállás és az időtartam tekintetében? 6. Hasonlítsuk össze a hangok oszcillogramon, spektrumon és spektrogramon történő ábrázolását! Melyik a legalkalmasabb a beszédhangok megjelenítésére, és miért? 7. Mit jelent az, hogy a beszéd egyfajta kód? 8. Mi lehet az oka annak, hogy könnyű mesterségesen olyan beszédhangokat létrehozni, amelyek jól érthetők, de nehéz olyanokat, amelyek nagyon hasonlítanak az emberi beszédhez? 9. Miért mondhatjuk azt, hogy a kategoriális észlelés valójában egy észlelési torzítás? 10.
Hogyan értelmezhető az akcentus a kategoriális észlelés fogalmaiban?
2.6. AJÁNLOTT OLVASMÁNYOK
252 Created by XMLmind XSL-FO Converter.
11. FEJEZET– A beszéd észlelése
Gósy Mária 2004. Fonetika, a beszéd tudománya. Osiris, Budapest. Gósy Mária 2005. Pszicholingvisztika. Osiris, Budapest.
253 Created by XMLmind XSL-FO Converter.
14. fejezet - 12. FEJEZET – A zene észlelése David Huron, a zene evolúciós eredetével foglalkozó neves kutató a következő példával illusztrálja a zenének az emberek életében betöltött szerepét (Huron 1998). Képzeljük el, hogy marslakók vagyunk, akik néhány hónapja érkeztek a Földre, és az itteni emberek viselkedését tanulmányozzuk és próbáljuk megérteni. Már egy csomó értelmes tevékenységre fényt derítettünk, és rájöttünk, hogy az emberek idejük nagy részét olyan hasznos tevékenységekkel töltik, mint az élelem felkutatása és elkészítése, a szálláshely fenntartása, az utódok gondozása és más egyéb ehhez kapcsolódó tevékenység. Néhány napja azonban megfigyeltük két, látszólag normális egyed, Kati és János igencsak furcsa viselkedését. Úgy tűnik, hogy János egy nagyon különös betegségtől szenved. Néha hosszú ideig némán ül a székén, és csak bámul maga elé. Esetenként az egy helyben ülés mellé a láb ismétlődő rázása is társul, és időnként az is előfordul, hogy felugrik a helyéről, és a tengelye körül forog, valamint összevissza rázkódik. Úgy tűnik, hogy ezek a szokatlan tevékenységek minden esetben bizonyos berendezésekből származó furcsa zajokhoz kapcsolódnak. Kati, János szomszédja, hasonlóan meglepő tevékenységeket folytat. Kati esetében a legfurcsább az, hogy néha órákon át képes egy hosszú fémbotot tartani a szájában, miközben az azon található lyukakat ütögeti. Mindezt ráadásul néha egy nagyobb társaságban teszi, ahol a többi ember hasonlóan furcsa, különböző zajokat kibocsátó eszközökkel van felszerelkezve. Azok számára, akik nem tudják, mi az, a zene élvezete és létrehozása az emberi tevékenységek egyik legnevetségesebb és leghaszontalanabb formájának tűnik. És valóban, nagyon nehéz bármilyen hasznosságot tulajdonítanunk a zenének. Ha egyik napról a másikra eltűnne az életünkből, minden bizonnyal ugyanúgy tudnánk folytatni az életet. Ennek ellenére a zene meglepően fontos szerepet tölt be a mindennapokban: rengeteg időt, energiát és pénzt áldozunk arra, hogy a zene élvezetének hódolhassunk (gondoljunk csak a hanghordozókra, koncertekre, zenelejátszó készülékekre!). Ráadásul ezt nagyon sokféle szituációban és nagyon sokféle céllal tesszük meg, ahogyan a 12.1. táblázat is bizonyítja, amely összefoglalja a zene által betölthető funkciókat (Pap 2002 nyomán).
14.1. táblázat - 12. 1. táblázat. A zene funkciói (Pap 2002 nyomán) Társadalmi-kommunikációs funkciók szakrális-kultikus • reprezentációs-dicsőítő • ceremoniális • összetartozási, identitást fokozó • táncindukáló • nevelési • munka- • nyelvi-kommunikációs • játék- • gyógyító • transzállapotot előidéző Individuális-pszichikus funkciók szórakoztató-örömokozó • érzelemkompenzációs • érzelemfokozó • magányosságot oldó • konfliktusmegoldó • relaxáló • aktiváló Mindezek alapján tehát úgy tűnik, hogy annak ellenére, hogy nem igazán tudjuk meghatározni a zene evolúciós hátterét, vagyis nem tudjuk azt, hogy miért maradt fenn a zene létrehozására és élvezetére vonatkozó képességünk, a zene mégis nagyon fontos szerepet játszik az életünkben. A zene két további szempontból is különleges. Egyrészt úgy tűnik, hogy kizárólag az emberi faj rendelkezik a zene észlelésének és létrehozásának képességével. Másrészt a zene nagyon sok pszichológiai működés komplex interakcióján alapul. Koelsch és Siebel (2005) idegtudományi adatokkal is alátámasztott kognitív modellje szerint a zene hallgatása során a 12.1. ábrán látható mechanizmusok működnek. Látható, hogy az eddig tárgyalt észlelési jelenségek közül több is működik a zenében: az észlelési jegyek kivonása és a Gestaltok kialakulása (vagyis az azonos forrásból származó jegyek egy objektumhoz való csoportosítása) minden hallási eseménynél jelen van. A különböző intervallumok észlelése és a szerkezet felépülése már sokkal inkább a zenére specifikus feldolgozási folyamat, csakúgy, mint az a tény, hogy a zenei észlelés nagyon szoros kapcsolatban áll az érzelmekkel (a legtöbb zenei darab közvetít valamilyen jobban vagy 254 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
kevésbé jól meghatározható érzelmet: szomorúságot, vidámságot, haragot, félelmet), és képes az autonóm idegrendszer, valamint az immunális rendszer működését befolyásolni. Ez utóbbiak tárgyalása túlmutat a jelen fejezet keretein, az érdeklődőknek Koelsch és Siebel (2005) tanulmányát javasoljuk. Ebben a fejezetben elsősorban a zene észlelésével foglalkozunk. Ezen belül is alapvetően két témára koncentrálunk: a zenei hangmagasság és a zenei ritmus észlelésére és feldolgozására (továbbiakban a „zenei” jelzőt fogjuk használni a hangmagasság és a ritmus előtt, ha speciálisan a zenére jellemző szerveződésükre utalunk). Ez a két jellemző azért különösen fontos, mert a zene leginkább pszichológiai és humánspecifikus aspektusát ragadják meg: mindkettőre igaz ugyanis, hogy egyszerű, jól meghatározható elemekből bonyolult és sokrétű szerveződésű mintázatok jönnek létre. Ezek a szerveződési szintek ráadásul meghatározott szabályok szerint egymásra épülnek. A struktúra első szintje a zenei felszín: a különböző hangmagassággal, hangszínnel, hangossággal és időtartammal rendelkező hangok szekvenciális és egyidejű sorozata. Ezekből a hangokból jön létre egy következő szinten két független, hierarchikus szerveződésű struktúra: a ritmus és a zenei hangmagasság. Fontos leszögeznünk, hogy a kettő egymástól független, amit az bizonyít, hogy mindkettő szerepelhet a másik nélkül. Vannak olyan zenei darabok, amelyeknek szinte kizárólag ritmikai szerveződésük van, és nagyon kevés hangmagasság-változást tartalmaznak (ilyen például a rap), és vannak olyanok, amelyeknél alig van ritmus, és szinte kizárólag a hangmagasság változását tartalmazzák. Természetesen egy tipikus zenei darab a legtöbb esetben mindkettőt tartalmazza, és a darab megértése lényegében a két szerveződés egyidejű, párhuzamos feldolgozását foglalja magában. Annak érdekében, hogy megértsük, hogyan is történik egy zenei darab észlelése, azt kell tehát elsősorban megvizsgálnunk, hogy hogyan történik a ritmus és a hangmagasság szerveződésének észlelése. Mielőtt azonban erre rátérnénk, érdemes összevetnünk a hallási észlelés két legbonyolultabb ingerének, a beszédnek és a zenének az észlelését.
12.1. ábra. A zenei észlelés neurokognitív modellje (Koelsch–Siebel 2005 nyomán)
1. A zene és a beszéd észlelése A zene és a beszéd az általunk észlelt hangok közül a leginkább komplex hangok. Ez a két akusztikus inger sok jellemzőben osztozik, de sokban el is tér egymástól (Zatorre-Krumhansl 2002). Mindkettőre jellemző, hogy szándékosan hozzuk létre őket, azzal a céllal, hogy valamilyen információt közöljünk másokkal. Erre a célra természetesen a beszéd sokkal alkalmasabb, de a zene is képes hangulatok, érzelmek, de akár egészen komplex 255 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
jelentés közvetítésére. További fontos hasonlóság, hogy mindkettő meghatározott struktúrával rendelkezik. A beszéd beszédhangokból épül fel, amelyek szavakba, azok pedig mondatokba szerveződnek. A zene esetében az alapvető építőelem a zenei hang, amely zenei motívumokba, futamokba, végül egy egész darabbá szerveződik. A szerveződéssel kapcsolatban mindkettőre igaz, hogy meghatározott szabályok irányítják. Mindezeken kívül mind a beszéd, mind a zene észlelése tanulás eredménye, és mindkettő univerzális, azaz minden ismert emberi kultúra esetében megtalálható. Milyen különbségek fedezhetők fel a beszéd és a zene között? A legnyilvánvalóbb eltérés, hogy a beszédet csak egyetlen „eszköz”, az emberi beszédképző rendszer tudja létrehozni, míg a zene rengeteg hangszeren (köztük az emberi beszédképző szerveken) megszólalhat. Kimutatható ugyanakkor egy nagyon lényeges akusztikai eltérés, amely a két inger feldolgozására fontos hatást gyakorol. Úgy tűnik, hogy a beszéd esetében nagyon fontos szerepet játszik az idői változások feldolgozása. Az előző fejezetben volt szó arról, hogy a mássalhangzók esetében a formánsátmenetek lényegesek az egyes beszédhangok megkülönböztetése szempontjából. A formáns- átmenetek azonban nagyon kis idői különbségeket foglalnak magukban. Azaz ahhoz, hogy a formánsátmenete- ket pontosan tudjuk észlelni, és így képesek legyünk a mássalhangzók megfelelő megkülönböztetésére, érzékenynek kell lennünk ezekre a gyors idői változásokra. Ezzel szemben a zene esetében ritkán fordulnak elő a beszédben található gyors idői változások. Itt inkább a hangmagasság változásának pontos észlelése fontos, hiszen a zene dallamát a hangmagasság meghatározott változása adja. Vagyis a dallam megfelelő követéséhez érzékenynek kell lennünk a hangmagasság kismértékű megváltozására is. A beszéd esetében ugyanakkor nem fordulnak elő ilyen kis hangmagasság-változások. Azt mondhatjuk tehát, hogy a beszéd esetében elsősorban a gyors idői változások feldolgozása lényeges, míg a zenénél a hangmagasság kismértékű megváltozásának detektálása. Mindez azonban felvet egy problémát, nevezetesen azt, hogy mérnöki szempontból nehéz olyan eszközt létrehozni, amely egyszerre képes nagy idői és nagy frekvenciabeli felbontásra. Valószínű, hogy ez az emberi hallórendszer számára is problémát okozott. A hallórendszer esetében a feltételezhető megoldás az, hogy eltérő agyi rendszerek foglalkoznak a beszéddel, illetve a zenével kapcsolatos akusztikai információ feldolgozásával. Eszerint a beszéd inkább a bal, míg a zene inkább a jobb temporális területeken kerül feldolgozásra (Zatorre-Krumhansl 2002).
2. A ritmus észlelése A ritmus bizonyos események (pl. hangok vagy mozdulatok) szabályos időbeli szerveződésére vonatkozik. A ritmus nem csak a zenében jelentkezik: például a vonat zakatolása is ritmikus hang. A ritmus észlelésével kapcsolatos első vizsgálatok ezért nem a zenei ritmussal, hanem sokkal egyszerűbb, időben ismétlődő események észlelésével foglalkoztak. A ritmus és az idő észlelésével kapcsolatban Paul Fraisse (1963, 1982) kutatásait kell megemlítenünk, aki ennek a területnek az egyik „szülőatyja”. A továbbiakban elsősorban az ő írásai alapján áttekintjük az idő és a ritmus észlelésének főbb jellemzőit. Fraisse szerint attól függően, hogy az események között mennyi idő telik el (vagyis mekkora az események közötti intervallum), azok nagyon különböző élményt váltanak ki. A továbbiakban nem hangokról, hanem eseményekről fogunk beszélni, utalva arra, hogy a ritmus nemcsak az akusztikus történésekre, hanem a mozgásra is vonatkozhat (pl. a tapsolásra). Ha az idői intervallum 100 milliszekundumnál kisebb, akkor az eseményeket nem észleljük különállóknak, hanem egyetlen, folyamatos eseménynek. 100 és 1500 milliszekundum közötti intervallum esetén képesek vagyunk különálló események észlelésére és arra, hogy az eseményeket csoportosítsuk. 1500 milliszekundum feletti intervallumnál nehézséget okoz, hogy az egymást követő eseményeket egyetlen egységbe csoportosítsuk (lásd a 10. fejezetet a hallási események szerveződésével és a szekvenciális csoportosítással kapcsolatban). Ugyanakkor képesek vagyunk arra, hogy az eseményeket hierarchikusan szervezett nagyobb egységekbe, a „csoportok csoportjaiba” szervezzük, de 5 szekundum felett már ez sem lehetséges. Fraisse szerint ez az 5 szekundumos határ jelenti a pszichológiai jelen felső határát: minden, ami ennyi idő alatt történik, arról úgy érezzük, hogy „most” van, ami viszont ennél hosszabb ideje történt, az már a múlt része. Mindez azt is jelenti, hogy azok az események, amelyek 5 szekundumnál régebben történtek velünk, már csak emlékezeti működések, és nem a közvetlen észlelés révén dolgozhatók fel. Eszerint tehát a ritmus közvetlen észlelése akkor lehetséges, ha az események közötti idői távolság 100 milliszekundum és 5 szekundum között van. Az idői távolság azonban még csak az egyes események közötti intervallumra, valamint a ritmus észlelésének korlátaira vonatkozik. A ritmushoz szükség van valamilyen szabályos, periodikus ismétlődésre. Nagyon sok emberi tevékenységben jelenik meg ez a szabályos ismétlődés, például a légzésben, a szívdobogásban, a járásban vagy a csecsemő szopásában. Érdekes módon ezeknél a tevékenységeknél az események közötti
256 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
intervallum egy nagyon szűk tartományban, 500 és 1000 milliszekundum között mozog. Ugyanebbe a tartományba esik az úgynevezett spontán tempó is. Ha arra kérjük az embereket, hogy tapsoljanak vagy kopogjanak egyenletes tempóban hosszabb időn keresztül, akkor a legtöbb embernél ez a tempó valahol 300 és 800 milliszekundum között lesz (Krumhansl 2000). Az egyes emberek között viszonylag nagy különbséget fedezhetünk fel a spontán tempóban, de nagyon kicsi a változás egy ember esetében, ha a spontán tempóját különböző időpontokban mérjük meg. Ez arra utal, hogy a spontán tempó jellemző egy adott személyre, és Pap János humoros megjegyzése szerint (Pap, 2002) ezt érdemes figyelembe vennünk akkor, ha párt választunk magunknak. Hiszen például az emberek járásának tempóját is befolyásolja a spontán tempó, és nagyon nehéz egy egész életen át együtt sétálnunk valakivel, akinek a járástempója nagyon különbözik a mienktől. Ahogy említettük, a ritmus nemcsak a hangok észlelésében, de a mozgások produkciójában is szerepet játszik. Sőt Fraisse (1982) szerint nagyon erős kapcsolat mutatható ki a kettő között, mivel az emberek nagyon könnyedén képesek a mozgásukat egy szabályos ritmussal rendelkező hangsorhoz szinkronizálni. Ráadásul ez a képesség az emberi fejlődés során nagyon korán és spontán módon jelenik meg: a csecsemők körülbelül másfél éves korukra képesek arra, hogy a zenére ritmikusan mozogjanak (Moog 1976). A zene ritmusához szinkronizált mozgás (legyen az tánc, tapsolás vagy a fejünk rázása) azonban korántsem egyszerű tevékenység. A szinkronizált mozgás ugyanis nem a ritmikai egységet követi, hanem pontosan azzal egyszerre hajtjuk végre. Ezt azonban csak úgy tudjuk megtenni, hogy anticipáljuk, vagyis megpróbáljuk bejósolni, előre megtervezni a mozgás pontos idejét. A ritmus észlelésének ez az anticipáció az egyik legfontosabb jellemzője. A ritmus észlelésének egy másik lényeges vonása, hogy minden esetben valamiféle csoportosítást foglal magában. Ahogy említettük, a ritmikai szerveződés többszintű lehet, vagyis az alapvető ritmikai elemekből bizonyos elvek (pl. a Gestalt-elvek) alapján csoportok jönnek létre, majd ezek további csoportokká szerveződhetnek. Ez a csoportosítás olyan erősen nyilvánul meg, hogy az emberek az egyébként teljesen azonos idői távolságban lévő, teljesen azonos hangokat is csoportokra szerveződve hallják (Fraisse 1982). Ezt az úgynevezett szubjektív ritmizációt, amely a hangokat kettesével vagy négyesével csoportosítja, valójában semmi sem indokolja, mégis úgy tűnik, hogy a legtöbb hallgató így észleli ezeket a hangsorokat. Természetesen a ritmikus hangsorok esetében általában rendelkezésre állnak olyan kulcsok, amelyek a ritmust jelzik. A következő részben azt fogjuk áttekinteni, hogy a zenében miként jön létre a ritmus, és hogy történik meg ennek észlelése.
3. A zenei ritmus észlelése A ritmikai elemek a zenében a meghatározott hangmagassággal, hangerővel, hangszínnel és időtartammal rendelkező hangok, illetve az ezeket elválasztó szünetek. A hangok időtartamát a kottában a tempójelzések (pl. allegro – gyorsan) határozzák meg. Ezek azonban nem jelölik egyértelműen a gyorsaságot. A gyorsaság pontosabb meghatározását a tempó, vagyis az egy percen belüli egységek számát meghatározó metronómjelzés teszi lehetővé. A legtöbb zenedarabban azonban az előadók nem tartják be szigorúan az időtartamokat, kisebb ingadozás teljes mértékben elképzelhető. Sokkal fontosabbak a hangok egymáshoz viszonyított idői arányai. Eszerint léteznek egész-, fél-, negyed-, nyolcad-, tizenhatod- stb. hangok, illetve ezeknek megfelelő szünetek. Értelemszerűen egy egészhang időtartamának két fél-, négy negyed- stb. hang felel meg. A ritmus tehát a különböző időtartamú hangok váltakozásából jön létre, melyekre az jellemző, hogy szabályos viszonyban állnak egymással. Vagyis annak ellenére, hogy a pontos időtartam (vagyis az, hogy például egy negyedhang hány ezredmásodperc hosszúságú legyen) nem feltétlenül van meghatározva, a negyedhangok mindig az egész hangok negyedrészéig tartanak. A ritmikai elemek váltakozásának hátterében magasabb szintű szerveződést is találunk, mégpedig egyfajta szabályos lüktetést, a metrikus lüktetést. A ritmikai elemek nemcsak hogy váltogatják egymást, hanem bizonyos csoportosulások alakulnak ki belőlük. A csoportosulások az egyes hangok hangsúlyviszonyainak váltakozásából erednek. Egy dallamon belül ugyanis nem minden hang szól ugyanolyan hangerővel, és ezek a hangerőváltozások is szabályosak. A hangosabb és halkabb, más szóval hangsúlyos és hangsúlytalan hangok szabályos váltakozása hozza létre az ütemet. Az ütem az a zenei egység, amely két leginkább hangsúlyos ritmikai elem közé esik. Egy-egy ütemen belül meghatározott számú ritmikai egység található, melyet az ütemjelzés határoz meg. Az európai popzenében például a leggyakoribb ütem a 4/4-es, ami azt jelenti hogy egy ütemegységen belül négy darab negyedhangot, illetve az ennek megfelelő fél-, egész-, nyolcad- stb. hangokat találunk. Az ütemekre az jellemző, hogy általában az első ritmikai elem lesz a leginkább hangsúlyos. A hangsúlyok azonban komplex, többszintű és hierarchikus rendszerbe szerveződnek, azaz az ütemeken belül több különböző szintű fő-, illetve mellékhangsúlyok találhatók.
257 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
A zene ritmikai szerveződése tehát két különálló szerveződést tartalmaz: a csoportosítást és a metrumot (Jackendoff-Lerdahl 2006). A csoportosítás a zenei hangok szegmentálását jelenti különböző nagyságú egységekbe. A csoportosítás hierarchikusan történik, vagyis a kisebb egységek nagyobbakba szerveződnek, amelyek még nagyobbakba és így tovább, egészen a teljes zenei darab szintjéig. A csoportosítást a már sokat tárgyalt Gestalt-elvek vezérlik, például a hasonlóság vagy a jó folytatás. Ahogyan azt a 10. fejezetben a hallási láncok szekvenciális szerveződésénél láthattuk, a csoportosítási elvek nem abszolút érvényűek, vagyis a legtöbb esetben több elv versengése vezet a percepció létrejöttéhez. A metrum szintén egy hierarchikus szerveződés, amely a ritmus szabályos lüktetéséből származik. Amikor például egy dalt letapsolunk, akkor a hangoknak ezt a metrikai struktúráját követjük. A tapsolás során azonban különböző szinteken követhetjük a metrumot: tapsolhatunk minden egyes hangra, vagy csak az ütemek első hangjára, stb. A metrikai szerveződésben a hierarchiát a hangosabb és halkabb hangok szabályos ismétlődése okozza. Például egy ütemen belül a legerősebb mindig az első hang. A hierarchikus szerveződés úgy jön létre, hogy a legalsó szinten a ritmikai elemek között még egyforma intervallumok találhatók, a következő szintek a közvetlenül alattuk lévő szinteken található intervallumok többszörösei (általában kétszeresei vagy háromszorosai). A 12.2. ábra illusztrálja, hogy hogyan képzelhető el ez a metrikai szerveződés. Az ábrán a függőleges oszlopok jelzik a ritmikai elemeket, és minél több x van egymás felett, annál hangsúlyosabb az adott ritmikai elem. Az x-ek vízszintes sora jelzi a hierarchikus szerveződés egy-egy szintjét. Látható, hogy minél feljebb haladunk a szerveződésben, annál kevesebb elem található az egyes szinteken. Valamint, ahogy említettük, a felsőbb szintek esetében az elemek közötti intervallum egyre hosszabb lesz (a 12.2. ábrán például a legfelső szinten egy-egy elem között négy alsó szintű elem található), ráadásul ez szabályosan változik, azaz a felsőbb szinten az intervallumok hossza mindig egész számú többszöröse az alsóbb szint intervallumának. Fontos, hogy természetesen nem abszolút intervallumokról beszélünk, vagyis nem milliszekundumban mérhető kapcsolat van a szintek között, hanem a ritmikai elemek egymáshoz viszonyított arányáról. A 12.2. ábra illusztrálja a csoportosítás működését is. Ha összevetjük a csoportosítás és a metrum alapján történő szerveződést, akkor látható, hogy a kettő egymástól függetlenül működik, mivel a szerveződési határok nem esnek egybe.
12.2. ábra. A Beatles Yellow submarine címû dalának elsõ frázisa, a csoportosítási és metrikus szerkezet jelölésével A zenének ez a szabályos és hierarchikus szerveződése azért fontos, mert semmilyen más emberi tevékenységben nem jelenik meg ez a szerveződési forma. Pontosabban, a beszéd esetében szintén találunk egyfajta szabályosan ismétlődő és több szinten szerveződő ritmikusságot, de ott korántsem olyan szabályos az ismétlődés, mint a zenében. A beszéden kívüli egyéb ritmikus tevékenységek esetében (például a járásnál vagy a légzésnél) viszont nem találjuk meg a hierarchikus szerveződést. A járás esetében ugyanis minden lépés ugyanolyan, egyik sem „hangsúlyosabb” a másiknál. Összefoglalva tehát, a zenei ritmus egy nagyon speciális, semmilyen más emberi tevékenységben nem jelentkező hierarchikus szerveződést mutat, ami ráadásul kettős: egyrészt a közelségen, hasonlóságon, jó folytatáson stb. alapul (csoportosítás), másrészt pedig a hangsúlyos és hangsúlytalan ritmikai elemek szabályos váltakozásán (metrum). A ritmus észlelésének ugyanakkor vannak általánosabb alapmechanizmusai, amelyek a nem-zenei ingerek esetében is működnek. Ezekre többek között az jellemző, hogy csak korlátozott idői intervallumon belül (100 ms – 5 s) működnek, illetve hogy a ritmikai elemek anticipációját foglalják magukban, amely révén elvárásokat alakítunk ki a következő ritmikai elemekkel kapcsolatban.
4. A zenei hangmagasság észlelése 4.1. A zenei intervallumok észlelése A ritmus mellett a zenei észlelés másik alappillére a hangmagasság szerveződése. Az eddigiekben már szó volt arról, hogy a hangmagasság a hangok frekvenciájához kapcsolódó szubjektív észlelet, amely a tiszta hangok esetében viszonylag egyszerűen értelmezhető, a komplex hangoknál viszont meglehetősen bonyolult viszonyt 258 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
takar (lásd 290. skk.). A zene esetében a hangmagasság nagyon különös módon működik. Egyrészt viszonylag kis frekvenciatartományba (kb. 20-4000 Hz között) tartoznak azok a hangok, amelyek a zenei darabokban felhasználhatók. Másrészt nemcsak hogy egy kis tartományból kerülnek ki, de szinte kizárólag olyan hangok építik fel a zenét, amelyek meghatározott frekvenciaértékekkel rendelkezhetnek. Pontosabban, a zenei hangok esetében nem az a fontos, hogy milyen abszolút hangmagassággal rendelkeznek, hanem az, hogy az egyes hangok között milyen viszony található. A zenében tehát a két vagy több hang közötti intervallum, vagyis a hangköz az, ami számít. A zenében a hangközök nagyon szabályos rendszer szerint alakultak ki. Az alapvető hangköz az oktáv, amely esetén a hangok alapfrekvenciája arányban áll egymással, azaz a magasabb hang frekvenciája kétszerese a mélyebb hangénak. A zenei észlelés egyik alapvető jelensége, hogy az oktávnyi távolságra lévő hangok nagyon hasonlónak hangzanak. Azt a jelenséget, hogy az oktávkapcsolatban álló hangok hasonlónak tűnnek, oktávazonosságnak nevezzük. Az oktávazonosság a legtöbb kultúra zenei rendszerében megtalálható, és az európai zenei skálában az oktávnyi távolságban lévő hangoknak azonos a nevük (pl. C3, C4 stb.). (Európai zene alatt a klasszikus zenei hagyományokon alapuló zenét értjük, amibe beletartozik a pop-, a rock- és a dzsesszzene is, hiszen ezek nagyon hasonló zenei elveken alapulnak.) Az oktávazonossággal számos vizsgálat foglalkozott, amelyek alátámasztották, hogy az oktávnyi távolságban lévő hangokat hasonlóan kezeljük: általában, ha megtanuljuk azt, hogy egy hangra valamilyen specifikus választ adjunk, akkor nagyon könnyen hasonló választ adunk az egyoktávnyival magasabb hangra is (vagyis a válasz generalizálódik; Humphreys 1939). Ahogy említettük, a zene hangmagassága csak korlátozott frekvenciatartományban működik. Ezzel kapcsolatban empirikus bizonyítékok is léteznek. Az egyik vizsgálatban (Ward 1954) arra kérték a kísérleti személyeket, hogy egy célhang frekvenciáját állítsák be úgy, hogy az egy oktávval legyen magasabb, mint egy teszthang magassága. Ha a teszthang frekvenciája 2500 Hz alatt volt, akkor a személyek viszonylag konzisztensen a teszthang frekvenciájának kétszeresét állítják be. Ha azonban a teszthang frekvenciája 2500 Hz feletti, és emiatt a célhang 5000 Hz fölött lenne, ebben az esetben a személyek nem pontosan a kétszeres frekvenciát használják. Ez arra utal, hogy az oktáv viszony csak 5000 Hz alatti hangok esetében működik. Az oktávon kívül egyéb hangközök is léteznek a zenében. A másik fontos hangköz, a kvint például 3 : 2 frekvenciaarányt jelent. Az európai zenében létező hangközöket és azt, hogy ezek a hangok milyen frekvenciaarányára vonatkoznak, a 12.3. ábra mutatja be. Az oktáv mellett a többi hangközre is igaz, hogy az egy ok- távokon belül található hangközök azonosak egymással, tehát a kvint hangköz mindig ugyanolyan hallási élményt vált ki, akármelyik oktávon belül (vagyis bármilyen alapfrekvenciájú kezdőhanggal) játsszuk is le. A lényeg, hogy a hangok frekvenciája közötti arány azonos legyen, tehát például a kvint esetében 3 : 2. A zenei dallamok tehát a különböző hangközökből épülnek fel. A hangközök azonban két különböző módon szerveződhetnek: szimultán, azaz egyidejűleg, amikor úgynevezett akkordokat alkotnak, és szekvenciálisan, vagyis egymás után, amikor is dallamot hoznak létre. A továbbiakban ezt a két szerveződést vizsgáljuk meg.
12.3. ábra A zenei hangközök neve és a C hanghoz viszonyított frekvenciaarányai
4.1.1. A zenei hangok szimultán szerveződése – az akkord
259 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
A hangok közötti viszonyok egyik nagyon fontos következménye, hogy a frekvenciareláció befolyásolja, hogy mennyire kellemes az adott hangközt hallgatni. Ez elsősorban az egyszerre megszólaló hangok, vagyis az akkordok esetében van így. Ha megvizsgáljuk a kellemesség vagy konszonancia és a frekvenciaviszony összefüggését, akkor azt találjuk, hogy minél egyszerűbb a viszony (pl. 2 : 1, 3 : 2), annál kellemesebb hallgatni őket, és minél komplexebb (pl. 256 : 243, kis szekund), annál kevésbé kellemes, vagy más szóval disszonáns. Ráadásul ez az összefüggés elsősorban a komplex hangokra igaz, tiszta hangok esetében nem igazán jelentkezik. Több elmélet is létezik azzal kapcsolatban, hogy az egyszerű frekvenciaviszonyban álló hangok miért hangzanak kellemesnek, konszonánsnak, a bonyolultabb viszonyban állók viszont miért disszonánsak. Az egyik elmélet szerint, amely Helmholtz (1885/1954) nevéhez fűződik, a disszonancia oka a hangok magasságának egymáshoz való közelsége. A komplex hangközök ugyanis azt is jelentik, hogy az adott hangok hangmagassága közel van egymáshoz (például a kis szekund egy egész- és egy közvetlenül mellette lévő félhang közötti hangköz). Ha a hangok magassága közel van egymáshoz, akkor ezek az alaphártyán is egymáshoz közel dolgozódnak fel. Ez viszont odavezethet, hogy a két hangot nem tudjuk megfelelően diszkriminálni, mivel az alaphártya felbontóképessége ezt nem teszi lehetővé. Azaz a hangok mintegy „összemosódnak”, és ez percep- tuálisan a disszonancia érzetét okozza. Egy másik elmélet (Plomp-Levelt 1965) a hangok felharmonikusainak egybeesésével határozza meg a kellemességet: minél inkább egybeesnek a harmonikusok, annál kellemesebbnek halljuk a hangpárt. A harmonikusok egybeesése viszont azon múlik, hogy milyen viszony áll fenn a két hang frekvenciája között: például az oktáv kapcsolat esetén teljes egybeesést találunk. Emlékezzünk vissza, hogy a zenei hangok esetében a felharmonikusok mindig az alaphang egész számú többszörösei. Tehát például egy 440 Hz-es alaphanggal rendelkező hang (ez az A4 hang frekvenciája) esetében a harmonikusok frekvenciája 880, 1320, 1760 stb. Hz lesz. Az ennél egy oktávval magasabb hang esetében az alaphang a 440 Hz kétszerese, azaz 880 Hz lesz, a felharmonikusok pedig 1760, 2640 stb. Vagyis az oktáv, azaz a 2 : 1 viszony esetében a magasabb hang összes harmonikusa megtalálható az alacsonyabb hang harmonikusai között. A többi hangköz esetében is hasonlóan több-kevesebb átfedést találunk a felharmonikusokban. Az elképzelés szerint tehát az átfedés mértéke határozza meg a konszo- nancia mértékét. Az egyes hangközök konszonanciája és disszonanciája a zenében úgy nyilvánul meg, hogy – legalábbis az európai zenében – olyan akkordokat használnak a zeneszerzők, amelyek konszonánsak. Vannak azonban olyan kultúrák is, amelyek ezt kevésbé tartják fontosnak. Vagyis azt mondhatjuk: nem minden zenére igaz, hogy a hangközök kellemes hangzására törekszik, azaz hogy a zenei szerkezet létrehozása során figyelembe vesz pszichoakusztikai jelenségeket.
4.2. A zenei hangok szekvenciális szerveződése – a dallam A hangok szekvenciális szerveződése során részben eltérő elvekkel találkozhatunk, mint a szimultán szerveződés során. A legfőbb különbség, hogy míg a szimultán szerveződésben a kis hangközöket általában kerülik, addig a szekvenciális szerveződésben a kis hangközök sokkal gyakoribbak, és sokkal inkább természetes hangzásúak (Jackendoff-Lerdahl 2006). Ennek két oka is lehet. Egyrészt az éneklés során (illetve bizonyos hangszerek esetében) sokkal könnyebb a kis hangközlépést megvalósítani. Másodszor, a dallam észlelése során (mint a legtöbb magas szintű perceptuális jelenség esetében) a csoportosítási elvek a kisebb lépéseket részesítik előnyben. Pontosabban, valószínűbben csoportosítjuk egy hallási láncba a hangokat akkor, ha kis frekvenciabeli távolság van közöttük, mint ha ez a távolság nagy. Ezekkel az elvekkel a 10. fejezetben, a hallási láncra bontás tanulmányozásakor már foglalkoztunk, és azt mondhatjuk, hogy a dallam szerveződése esetében ugyanezek a szerveződési elvek működnek. A dallam észlelése azonban több mint az egymást követő zenei hangok egy hallási áramlatba csoportosítása. Úgy tűnik, hogy a dallamot valójában nem hangjegyek sorozataként, hanem mintázatok közötti viszonyként észleljük. A Hull a pelyhes fehér hó ugyanaz a gyermekdal marad akkor is, ha különböző hangszereken, tempóban vagy hangnemben játsszák el (a hangnemmel kapcsolatban lásd a tonális rendszerről szóló szövegdobozt). Sőt, akkor is felismerjük, ha különböző zenei stílusokban, például rock-and-roll vagy dzsesszstílusban szólal meg. Dowling és Fujitani (1971) arra kereste a választ, hogy mi határozza meg a dallam állandóságát: melyek azok a tényezők, amelyeknek a megváltoztatása esetén már nem ugyanazt a dallamot fogjuk észlelni? Kísérletükben egyszerű, mindenki által ismert gyermekdalokat mutattak a kísérleti személyeknek, akiknek egyszerűen az volt a feladatuk, hogy felismerjék azokat. A dalokon azonban különböző változtatásokat hajtottak végre. Elsőként a 260 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
dalokat alkotó hangok abszolút magasságát változtatták meg, de megmaradtak az eredeti hangközök (ezt lényegében a hangnem megváltoztatásával érték el). A változtatás hatására a dalok felismerése kismértékben romlott, de a hallgatók nagyobb része számára még mindig felismerhető volt (12.4. ábra). Ezt követően a hangközöket is megváltoztatták, de az úgynevezett dallamkontúr, vagyis a hangmagasság megváltozásának iránya az eredeti dalhoz hasonló maradt. Ez a torzítás tovább rontott a felismerésen, de a dal még mindig felismerhető volt. Végül a dallamkontúrt is eltorzították (ahol eddig emelkedő volt, most ereszkedő lett a dallam), és ez a változás szinte teljesen lehetetlenné tette a dal felismerését. Ezek az eredmények tehát azt mutatják, hogy a dallam észlelése során valójában egy mintázatot észlelünk, amely független a pontos fizikai megvalósulástól.
12.4. ábra. Dowling és Fujitani (1971) dallamészlelési kísérletének eredménye Összefoglalásul tehát azt mondhatjuk, hogy a zenei hangok szimultán szerveződésében elsősorban a kis frekvenciaarány, a szekvenciális szerveződésben pedig a kis frekvencialépés a vezérlő elv. Valamint úgy tűnik, hogy a dallam valójában egy magas szintű perceptuális mintázat, amely független lehet a konkrét formától, vagyis attól, hogy milyen tempóban, hangszeren vagy akár hangnemben játsszuk le. A zenei hangoknak azonban van egy még az eddigiekben tárgyaltaknál is absztraktabb szerveződési formája, amely a ritmushoz hasonlóan egy komplex, hierarchikus szerveződést foglal magában, ez pedig a zene tonális szerveződése.
4.3. A zene tonális szerveződése Ahogy a bevezetőben szó volt róla, a zene kapcsán alapvetően két különböző szerveződést találunk: a hangok időbeli és hangosságbeli szerveződését, azaz a ritmust, és a hangmagasságbeli szerveződésüket. Az európai zenében legalapvetőbb és legfejlettebb szerveződés a hangmagasság szerveződése. Annak ellenére, hogy a különböző hangmagasságú hangok rendkívül változatos módon követhetik egymást, találunk bizonyos szabályszerűségeket, amelyek a zenei hangok szerveződését meghatározzák. Ezeket a szabályokat vagy elveket a zeneelmélet írja le, és a legtöbb esetben egy adott zenei stílusra, pontosabban zenei hagyományra vonatkoznak. Ez azt jelenti, hogy a különböző kultúrák zenéjében nem feltétlenül azonos módon jelennek meg a szerveződési elvek. A zene tonális szerveződésének észlelése kapcsán az egyik fő kérdés, hogy vajon a zeneelmélet által leírt elvek mennyire felelnek meg annak, ahogyan az emberek valójában a zenét észlelik (lásd az európai tonális rendszerről szóló szövegdobozt). Azaz mennyiben írják le a valós észlelést, és mennyiben tekinthetők inkább csak idealizált elméleti konstruktumnak?
14.2. táblázat AZ EURÓPAI ZENE TONÁLIS RENDSZERE
261 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
1. ábra. A zongorabillentyüzet a megfelelő ábécés nevekkel A tonalitás a zenei hangok egy, az európai zenében a 17-18. században megszilárdult vonatkoztatási rendszere, amely alapvetően egy zárt rendszeren belüli harmonikus hangzásra törekszik. A zenei hangok rendszere egymástól oktáv távolságra elhelyezkedő hangokra osztható fel, és egy oktávon belül 12 hang különböztethető meg (pontosabban a hagyományos európai zenében ennyit használunk). Ezeket a hangokat az 1. ábrán látható zongorabillentyüzet segítségével lehet a legszemléletesebben ábrázolni. Látható, hogy egy oktávon belül (C-től C’-ig) 12 billentyű található, melyből 7 fehér és 5 fekete. A fehér billentyűk szólaltatják meg az egészhangokat (ezeket nevezzük törzshangoknak), ezeket a zenei ábécé betűivel jelöljük (C, D, E, F, G, A, H). A fekete billentyűk félhangokat szólaltatnak meg (ezeket kiegészítő hangoknak nevezzük), és az egészhangokból származtatjuk őket, azok félhanggal történő felemelésével vagy leszállításával. A kereszt (#) jelöli a felemelt hangokat (ezek elnevezésében az „-isz” végződést használjuk, vagyis C# = „cisz”), a bé (p jel) pedig a leszállításnak felel meg (az elnevezésében a végződése „-esz”, vagyis Dp = „desz”). Látható, hogy egy-egy félhangra mind a kereszt, mind a bé révén utalhatunk, azaz a Cisz és a Desz ugyanarra a C és D hang között található félhangra vonatkozik. A 7 törzshang önmagában az úgynevezett diatonikus (egészhangokból álló) hangsort (skálát) alkotja, a törzshangok és a kiegészítő hangok pedig együttesen a kromatikus skálát alkotják. A kromatikus skála mind a 12 hangjára épülhetnek hangsorok. Azt a hangot, amelyről a hangsor indul, tonikának nevezzük. A hangsorok a legtöbb esetben 7 hangot tartalmaznak, de van például 5 (pentaton) vagy 8 (oktaton) stb. hangból álló hangsor is. Az európai zene két legnépszerűbb hangsora a dúr és a moll. Eszerint van C-dúr, Cisz-dúr, c-moll, cisz-moll stb. skála (a dúr hangsort általában nagybetűvel, a mollt pedig kicsivel jelöljük). A legegyszerűbb skála a C-dúr skála, amely a C, D, E, F, G, A, H hangokat tartalmazza. Ebben az esetben a C hang a hangsor tonikája. A hangsorokat az előjegyzés segítségével jelöljük ki. Az előjegyzés a kottaírásban egy egész kottasorra érvényes, és azt határozza meg, hogy egy adott hangsorban mely hangok lesznek módosított, vagyis felemelt (keresztes) vagy leszállított (bés) hangok. Az előjegyzés adja meg a darab hangnemét. A módosított hangok számát az egyes hangsorok tonikájának a C hangtól való kvinttávolsága határozza meg. Kvintenként emelkedve a keresztek száma, kvintenként süllyedve pedig a p-k száma nő. Például a G hang a C-nél egy kvint távolsággal (5 egészhangnyi hangköz) magasabb, ezért a G-dúr előjegyzése: egy kereszt. Ezzel szemben az F egy kvinttel alacsonyabb a C-nél, ezért az F-dúrnál az előjegyzés egy P lesz. Ezek az összefüggések a kvintkörrel ábrázolhatók a legszemléletesebben (2. ábra). A moll hangsor a dúrból származtatható, mégpedig úgy, hogy annak harmadik, hatodik és hetedik hangját egy félhanggal leszállítjuk. Az ily módon létrejövő skálát nevezzük az eredeti dúr hangnem azonos alapú moll hangnemének. Az azonos alapú moll hangnemnek ugyanaz a tonikája, de eltér az előjegyzése. Például a C-dúr hangnem azonos alapú moll hangneme a c-moll, a hozzá tartozó hangsor a C, D, Esz, F, G, Asz, B hangokból áll, és a kvintkör alapján megállapítható, hogy előjegyzése 3p.
262 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
2. ábra. A kvintkör. Az ábécés nevek hangnemeket jelölnek. A kvintkörön az óramutató járásával megegyező irányban a keresztek, ellenkező irányban pedig a b-k száma nő. A 12, egymástól kvint távolságra elhelyezkedő hangnem körüljárása után visszaérkezünk a kiinduló hangnembe, de egy oktávval magasabban. a) A dúr hangnemek kvintköre C-dúrból indulva. b) A moll hangnemek kvintköre a-mollból indulva Ezenkívül a dúr hangnemből származtatható egy párhuzamos moll hangnem is, amelynek ugyanaz az előjegyzése, mint a dúr hangnemnek, de eltér a tonikája. A párhuzamos moll hangnem tonikája mindig három egészhanggal lejjebb (vagy hat egészhanggal feljebb) található, mint a dúr hangnemé. Például a C-dúr relatív párhuzamos dúr hangneme az a-moll. Az a-moll hangnemhez tartozó a-moll skála hangjai (ún. természetes moll esetében): A, H, C, D, E, F, G vagy (ún. dallamos moll esetében): A, H, C, D, E , Fisz , Gisz . Egy dúr hangnem, valami nt an nak az ono s alapú vag y p árhuz amos moll hangne me között az az egyik legjellegzetesebb különbség, hogy a dúrt vidám hangulatúnak, a mollt viszont inkább szomorúnak érzékeljük. Végeredményben tehát a 12 lehetséges tonika a két eltérő (dúr és moll) hangnemben alkotja meg a 24 hangnemből álló tonális rendszert. Ez a rendszer képezi a hagyományos európai müzene alapját, ezekből a hangnemekből és a hangnemek által meghatározott hangokból állnak a zenei darabok. A tonális rendszernek két fontos jellemzője van. Egyrészt a zenében a dallamot alkotó hangokat nem önmagukban, hanem egy kitüntetett hanghoz, a tonális központhoz vagy tonikához képest észleljük. A tonika egy adott hangnem hangsorában a legfontosabb és legstabilabb hang, ez adja az adott hangnem nevét is. A tonika az egész rendszer viszonyítási pontja: szabályszerüen ez a hang, valamint a rá épülő harmónia (a tonikai hármashangzat) zárja a zenei darabokat, és minden egyéb hangot ehhez képest ítélünk meg. A tonális rendszer másik fontos sajátossága, hogy az egy oktávon belüli 12 lehetséges hang hierarchikus szerveződést alkot, amelyet hangtérnek nevezünk. A hangtérben a különböző hangmagasságú zenei hangokat a tonikához viszonyítjuk. Minden hang meghatározott frekvenciaviszonyban áll a toni- kával, amelyet hangköznek nevezünk. A hangtéren belüli hierarchikus viszony azt jelenti, hogy a zenei hangok nem egyszerüen valami lyen hangközviszonyban állnak a tonikával. Egyes hangok kitüntetettebb szerepet játszanak, mint mások. A hangok közötti viszonyokat megvizsgálva egy olyan szerveződést találhatunk, amelynek a legfelső szintjén a tonika található (3. ábra). Ezt követi a tonikából és az úgynevezett domináns hangból álló szint. A domináns hang (illetve harmónia) a második legfontosabb hang egy zenei hangnemben, és kvintkapcsolatban áll a tonikával. A domináns az a hang, amelyen egy zenei tétel közbenső részei a legtöbbször végződnek (a tételek végét általában a tonika zárja), és a tonikai harmónián (akkordon) kívül a domináns a legfontosabb akkord (ráadásul, ha megfigyeljük a kvint frekvenciaarányát, láthatjuk, hogy az oktávon kívül ez tartalmazza a legegyszerűbb viszonyt, a 3 : 2-t). A hangtér következő szintjén a tonikán és a dominánson kívül a terchangviszony is szerepel. A negyedik szinten már megtaláljuk a diatonikus skála többi hangját, és végül az ötödik szint a kromatikus skála összes hangját tartalmazza, vagyis mind a 12 hang szerepel benne. Ezen az utolsó szinten kívül még egy szintet is meg szoktak különböztetni, amely nemcsak a zenei skála hangjait, hanem az összes hangmagasságot tartalmazza. Ezt legtöbbször nem a dallam alkotásában, hanem annak díszítésében használják fel. Röviden így foglalható össze az a zeneelméleti tudás, amely a zenei hangok viszonyait és szerveződését írja le. A zene észlelésének pszichológiai tanulmányozása számára azonban sokkal fontosabb az a kérdés, hogy hogyan találjuk meg az emberi észlelésben az ismertetett zeneelméleti szabályokat és elveket.
263 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
3. ábra. A C-dúr hangnem hangtere Carol Krumhansl az 1970-es években kezdett és máig tartó kutatássorozatban erre a kérdésre próbált válaszolni. Az egyik első vizsgálatban Krumhansl és Shepard (1979) a kísérleti személyeket arra kérte, ítéljék meg, hogy a kromatikus skála egyes hangjai mennyire jó befejezését jelentették egy hét hangból álló, C-dúr hangnemen alapuló hangsornak. A kísérleti személyek által adott értékelések tükrözték a tonális hierarchiát, mivel a személyek a tonikát találták a legjobb befejezésnek; ezt követte a domináns, a terc, majd a diatonikus és végül a kromatikus skála többi hangja. Érdekes módon azonban az ítéletek és a tonális hierarchia megfelelése nagymértékben függött attól, hogy a személy mennyire volt zeneileg képzett. Azaz a zenében jártas személyek sokkal inkább a tonális hierarchiának megfelelő válaszokat adtak, mint a zeneileg kevésbé képzettek. Ez arra utal, hogy noha valóban jelen lehet egy „internalizált tonális hierarchia”, vagyis a zenei hangok közötti viszonyok mentális reprezentációja a hallgatók fejében, ez csak a tapasztalat révén jön létre. Ezt támasztják alá Krumhansl és Keil (1982) eredményei is. A szerzők különböző életkorú gyermekeket vizsgálva azt találták, hogy létezik egyfajta fejlődési trend a tonális rendszer elsajátításában. Eszerint a 6-7 éves gyermekek még csak a hangnembe tartozó és nem tartozó hangok (diatonikus és kromatikus) között tettek különbséget, és a tonikadomináns-terc elkülönítés csak később, 10-11 éves korban alakult ki. A fejlődés iránya tehát az, hogy a gyermekek egyre inkább képesek differenciálni a tonális szerepeket, azaz megtanulják, hogy egy hangnemen belül a tonika, a domináns és a terc kitüntetett szereppel rendelkezik. A tonális szerveződésnek a zene észlelésében játszott szerepét további empirikus tanulmányok támasztották alá. Ezek szerint a hierarchiában magasan lévő hangok több kognitív jellemzőben is eltérnek az alacsonyabban lévő hangoktól: pontosabb a felidézésük, valószínűbben várjuk el őket egy dallamban, és inkább észleljük őket végső vagy záró hangként (Zatorre-Krumhansl 2002). Dewar és munkatársai (1977) például azt találták, hogy a jól formált tonális szerkezettel rendelkező dallamokra a kísérleti személyek jobban emlékeztek, mint azokra, amelyek nem a tonális hierarchiának megfelelően épültek fel. Barucha és Krumhansl (1983) eredményei szerint egy adott hangnem nemdiatonikus hangjait (vagyis azokat, amelyek a kromatikus, de nem a diatonikus hangsor részét képezték) a kísérleti személyek kevésbé jól ismerték fel, mint a diatonikus hangokat. Ráadásul a diatonikus hangokat gyakrabban összekeverik egyéb diatonikus hangokkal, mint a nemdiatonikus hangokkal. Az eddigiekben az egy hangnemen belüli hangok szerveződésével foglalkoztunk. A tonális rendszernek azonban legalább ilyen fontos jellemzője, hogy az egyes hangnemek milyen viszonyban vannak egymással. A különböző hangnemek ugyanis többé vagy kevésbé hasonlóak egymáshoz. A zeneelmélet szerint a hangnemek hasonlóságát három tényező határozza meg: a hangsorok hangjainak átfedése (azaz hogy hány olyan hang van, ami mindkét hangsorban szerepel), a módosító jelek számának eltérése és a hangnemek távolsága a kvintkörön. Így például a C-dúr hangnem jobban hasonlít az F-dúrhoz, mint az A-dúrhoz, mivel több átfedő hangot tartalmaznak, az F-dúr egy bét tartalmaz, míg az A-dúr három keresztet, és az F-dúr a C-dúr mellett található a kvintkörön, az A-dúr viszont távolabb (lásd a szövegdoboz 2. ábráját). Természetesen pszichológiai szempontból inkább az a kérdés, hogy a hangnemek közötti viszonyok milyen módon reprezentálódnak a hallgatók fejében. Ennek vizsgálata érdekében Krumhansl és Kessler (1982) a fentebb már bemutatott, Krumhansl és Shepard (1979) által is használt eljárást alkalmazta. Vagyis a kísérleti személyektől azt kérték, hogy ítéljék meg, mennyire jó befejezése volt egy adott hang egy adott hangnemű hangsornak. Ezt az eljárást kiterjesztve, a kromatikus skála mind a 12 hangját megítéltették többféle skála esetében, többek között az összes dúr és moll skála esetén. Ezzel a meglehetősen időigényes eljárással eltérték azt, hogy minden hangnem esetében kaptak egy úgynevezett hangprofilt, amely az adott hangnem esetében azt ábrázolta, hogy a 12 hang mennyire jó befejezése volt a hangsornak, vagyis hogy mennyire jól illett az adott hangnembe. Tudjuk, hogy a hangnem határozza meg, hogy egy adott hang illik-e egy hangsorba. Például a Gdúr hangnemnek része a Fisz hang, ezzel szemben a C-dúr hangnemnek nem. Vagyis, ha egy hangsorról azt gondoljuk, hogy az G-dúr- ban van, akkor abban a Fisz a diatonikus skálába fog tartozni, ezért a hangsor jobb befejezésének fogjuk tartani, mint ha a hangsorról azt gondoljuk, hogy C-dúrban van, mivel ekkor a Fisz nem a 264 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
diatonikus, hanem a kromatikus skála része. Természetesen ezek a döntéseink automatikusan, és nem valamilyen gondolkodási folyamat eredményeként születnek meg: egy G-dúr hangnemű hangsorban a Fiszt jó befejezésnek érezzük, C-dúrban viszont nem. Krumhansl és munkatársainak vizsgálatsorozata pontosan annak feltárást tűzte ki célul, hogy vajon hasonlóan észleljük-e a zene hangszerkezetét, mint ahogyan azt a zeneelméleti szabályok és elvek meghatározzák. A 12.5. ábra mutatja a C-dúr és c-moll hangnemek hangprofilját. Az ábra 10 személy válaszának átlagát mutatja; az 1-es a nagyon rossz, a 7-es a nagyon jó befejezést jelentette. Látható, hogy a profil pontosan követi a tonális hierarchiát. Legnagyobb értéket a C hang, vagyis a hangnem tonikája kapta, ezt követte a G, a domináns és az E, a terc hang. Alacsony értéket kaptak a további diatonikus hangok, és a kromatikus hangok kapták a leginkább alacsony értékeket. A többi hangnem profilja az itt láthatóhoz nagyon hasonló volt, természetesen annyi különbséggel, hogy ott a kiemelkedő értékek eltolódtak (mivel egyéb hangnemek esetében más a tonika).
12.5. ábra. A C-dúr és a c-moll hangnemek profilja (Krumhansl– Kessler 1982 nyomán) Ezek után a kutatókat az érdekelte, hogy az így kapott profilok segítségével vajon kimutatható-e valamilyen módon a hangnemek közötti hasonlóság. Ennek érdekében a dúr és moll profilokat (összesen 24-et) korreláltatták egymással, mégpedig az összes dúr hangnemet az összes dúrral, azután a dúrokat a mollokkal, és végül a mollokat a mollokkal. A 12.6. ábra azt mutatja, hogy például a C-dúr és az a-moll hangnemek közötti korreláció kiszámítása hogyan történt.
265 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
12.6. ábra. A C-dúr és az a-moll hangnemek profiljának korrelációja. A két profil egymásra helyezve mutatja a kettõ közötti eltéréseket (Krumhansl–Kessler 1982 nyomán) Látható, hogy a két profilt egyszerűen egymásra helyezték, majd pedig kiszámolták, hogy a profilok minden egyes pontja esetében mekkora a korreláció a két profil között. A C-dúr és az a-moll hangnemek esetében meglehetősen nagy az átfedés, ami el is várható, hiszen az a-moll a C-dúr párhuzamos mollja. Ezt az összevetést tehát minden egyes skála esetében elvégezték, és végül egy meglehetősen nagy korrelációs mátrixhoz jutottak. A mátrixot különböző statisztikai eljárások segítségével tovább elemezték; arra voltak kíváncsiak, hogy a 24 hangnem hasonlóságai és különbségei hogyan jeleníthetők meg vizuálisan. Az elemzések során azt az eredményt kapták, hogy a hangnemeket egy négydimenziós térben lehet úgy ábrázolni, hogy a hasonló hangnemek egymáshoz közel, az eltérő hangnemek pedig egymástól távol helyezkedjenek el. Ily módon ábrázolva a hangnemek egy tórusz, vagyis egy fánkszerű alakzat felszínén helyezkedtek el (12.7. ábra).
12.7. ábra. A hangnemek közötti kognitív távolságok grafikus ábrázolása egy tórusz felületén Ennek a téri elrendezésnek létezik egy kétdimenziós megjelenítési formája is, amely pontosabban és egyértelműben ábrázolja a hangnemek közötti viszonyokat (12.8. ábra). Ezen az ábrán a tórusz lényegében „kiterítve” látható: ha a vízszintes széleket összeérintve feltekerjük a téglalapot, majd pedig a nyitott végeket is összeérintjük, akkor megkapjuk az eredeti háromdimenziós tóruszt. Hogyan értelmezhető a hangnemek egymáshoz való viszonyának ez a különös téri elrendeződése? Azt mondhatjuk, hogy a hallgatók ítéletei alapján kapott téri elrendeződés nagyon is szabályos viszonyt tár fel a hangnemek között. Először is azt vehetjük észre, hogy adott vonalon (például a 12.8. ábrán a középső vonalon) olyan hangnemek találhatók (pl. F – C – G – D), amelyek egymástól kvint távolságra vannak, és dúr hangneműek. Ha újra szemügyre vesszük a kvintkört, akkor láthatjuk, hogy ezek a hangok a kvintkörön is egymás mellett találhatók.
12.8. ábra. A hangnemek közötti kognitív távolságok grafikus ábrázolása a síkba transzformált tóruszon Visszatérve a 12.8. ábrára, nézzük most meg balról a harmadik vonalat. Ezen többek között a d – a – e – h hangok találhatók meg. Ezek a hangok szintén egymás mellett vannak a kvintkörön, de ezek a moll hangnembe tartoznak. Ráadásul az is látható, hogy a dúr és ezek párhuzamos moll hangnemei (pl. C-dúr, c-moll) egymással párhuzamosan haladnak. Mindkét vonal háromszor tekeredik körbe a tóruszon, majd pedig visszajut önmagába. Itt tehát annak bizonyítékát láthatjuk, hogy a kvintkörön lévő távolságok, amelyek elsősorban zeneelméleti törvényszerűségeket írnak le, megjelennek a hallgatók szubjektív ítéleteiben. Ráadásul a háromdimenziós ábrázolás lehetővé teszi egy olyan viszony megragadását, amelyet eddig nem igazán tudtak megragadni a zeneelmélettel foglalkozók: nevezetesen, hogy a dúr és ezek relatív moll hangnemei egymáshoz nagyon hasonló hangnemeket képviselnek. A kvintkörön ezt a viszonyt nem lehetett ilyen pontosan és szemléletesen megmutatni. Ezek az eredmények tehát azt bizonyítják, hogy a hallgatók fejében valóban úgy szerveződnek a zenei hangsorok, ahogyan azt a zeneelméleti elvek leírják, és amelyek alapján a zenei darabokat megkomponálják. Fontos kiemelnünk azt a tényt, hogy a legtöbb olyan kísérletben, amelyben a tonális 266 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
hierarchia percepcióját vizsgálják, zeneileg képzett személyeket alkalmaznak. Ez nem feltétlenül jelenti azt, hogy a személyek képesek pontosan leírni, miért döntöttek egy adott hang esetében így vagy úgy, inkább csak amiatt fontos, mert a zeneileg képzett személyek a zenével való tapasztalat révén valószínűbben sajátították már el a zenei dallamokat felépítő szabályszerűségeket. Tehát túlzott általánosítás lenne azt állítani, hogy a tonális hierarchia fent vázolt szabályos szerveződése minden ember fejében megtalálható. Valószínűleg inkább az igaz, hogy a zenével való tapasztalat révén, automatikusan szerezzük meg ezt a tudást, de nem úgy, hogy ezt megtanítják nekünk. Ezek az eredmények tehát rávilágítanak arra is, hogy a zene hallgatását tanulnunk kell: minél többet hallgatjuk, annál inkább tisztába jövünk a zenét felépítő szabályszerűségekkel. Ha viszont olyan zenével találkozunk, amellyel kapcsolatban nincsenek előzetes ismereteink, akkor valószínűleg nagyon kevéssé fogjuk érteni azt. Ez a helyzet akkor, ha az európai zenén nevelkedett „fülünkkel” indiai zenét hallgatunk: nem valószínű, hogy elsőre nagyon tetszeni fog. Ha azonban vesszük a fáradságot, és elmélyülünk az indiai zene tanulmányozásában, akkor előbb-utóbb elkezdjük megérteni, idővel pedig megszeretjük. Összefoglalva tehát, Krumhansl és Kessler (1982) azt találta, hogy a 24 hangnem empirikus adatok alapján létrehozott téri reprezentációja nagymértékben megfelel a zeneelmélet által leírt tonális szerveződésnek. Az eredmények alátámasztják azt, hogy az adott zenei stílusban járatos hallgatók a hangnemek rendszerének belső reprezentációjával rendelkeznek, és ezt használják fel egy adott zenei darab hangmagasság-struktúrájának megértése során.
5. Egyéni különbségek a zene észlelésében – abszolút hallás, relatív hallás és dallamsüketség Mint a legtöbb emberi képesség tekintetében, a zene észlelésében is találunk különbségeket az egyes emberek között. Ráadásul úgy tűnik, hogy a zenei képességekben is létezik egy kontinuum a nagyon gyenge és a nagyon jó képesség között. Lássuk először, hogy mi jellemző azokra, akik nagyon magas szinten képesek a zene észlelésére.
5.1. Abszolút és relatív hallás Egyes emberek rendelkeznek az úgynevezett abszolút hallás képességével. Az abszolút hallás arra vonatkozik, hogy ezek az emberek képesek tökéletesen megnevezni a hallott zenei hangokat. Azaz, ha az abszolút hallással rendelkezőknek lejátszunk egy tetszőleges dallamot, akkor meg tudják mondani, hogy az adott dallam pontosan milyen zenei hangokból áll. Mindezt ráadásul erőfeszítés nélkül teszik, ahhoz hasonlóan, ahogyan a színeket meg tudjuk nevezni (Levitin-Rogers 2005). Egyes vizsgálatok szerint (Ward 1999) az abszolút hallás minden tízezer emberből egynél fordul elő. A híres zeneszerzők közül több is rendelkezett abszolút hallással, például Wolfgang Amadeus Mozart vagy Liszt Ferenc, de ez a képesség semmiképpen sem feltétele a zenei tehetségnek, hiszen olyan nagy muzsikusok is éltek, akik nem rendelkeztek vele, mint például Joseph Haydn vagy Richard Wagner. Sőt azt mondhatjuk, hogy a zenei észlelésben az abszolút hallás akár hátrányos is lehet, mivel – ahogy a fentiekben láttuk – a zenében nem az abszolút hangmagasságok, hanem a hangok közötti viszonyok, a hangközök észlelése a lényeges. Valóban, az abszolút hallással rendelkezők gyakran panaszkodnak arról, hogy meglehetősen kellemetlen számukra egy olyan dallamot hallgatni, amelyet egy szokatlan hangnemben játszanak le. Ekkor ugyanis a hangközök ugyan megmaradnak, de a dallamot alkotó hangok abszolút hangmagassága megváltozik. Az abszolút hallás kapcsán felmerült annak esetleges genetikai eredete. Megfigyelték ugyanis, hogy egyes családokban gyakrabban jelentkezik. Mivel azonban a képesség kifejlődéséhez mindenképpen szükséges bizonyos mértékű tanulás (legalábbis a hangok neveit meg kell tanulni), ezért az egyes családokban való nagyobb arányú előfordulás nem bizonyítja a genetikai eredetet; feltételezhető ugyanis, hogy ezekben a családokban a gyerekek sokkal nagyobb mértékben vannak kitéve a tanulási hatásnak, hiszen családtagjaik is rendelkeznek a képességgel (Levitin-Rogers 2005). Az abszolút halláson kívül létezik egy sokkal gyakoribb zenei képesség, a relatív hallás. A relatív hallással rendelkezők nagyon pontosan képesek meghatározni a hangok közötti különbségeket. Például ha lejátszunk nekik egy dallamot, és megmondjuk, hogy az milyen hanggal kezdődik, akkor ebből kiindulva képesek megállapítani a dallam többi hangját. A relatív hallás képessége elsősorban zenészeknél fejlődik ki, mégpedig hosszas gyakorlás eredményeként. Valójában a relatív hallás a zenét csak élvező, de nem produkáló hallgatóknak nem igazán fontos, mivel viszonylag ritkán kerülünk olyan helyzetbe, hogy bizonyos hangközöket meg kellene neveznünk. 267 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
5.2. Dallamsüketség A legtöbb ember tehát sem az abszolút, sem a relatív hallás képességével nem rendelkezik. Ahogyan azonban a zene tonális rendszerének észlelése kapcsán láthattuk, az egyszerű hallgatók is nagyon sok, automatikusan elsajátított ismerettel rendelkeznek a zenei szerveződéssel kapcsolatban. Azt mondhatjuk, hogy egy adott zenei stílus megértéséhez és élvezetéhez rendelkeznünk kell bizonyos alapvető ismeretekkel. Ugyanakkor a zenei képességek kontinuumának létezik egy másik véglete is, amely a zenei képességek viszonylagos hiányát jelenti. Ez az úgynevezett dallamsüketség vagy amúzia. A dallamsüketségnek létezik egy szerzett változata is, amely valamilyen agysérülés hatására alakul ki. Számunkra fontosabb a dallamsüketség fejlődési változata, amely feltételezhetően öröklött, és a populáció körülbelül 4-5 százalékát érinti (Peretz et al. 2002). A dallamsüketségben szenvedőkre az jellemző, hogy képtelenek a dallamok felismerésére, egyszerű dalok visszaéneklésére, illetve a dallamokban a hamis hangok detektálására, de nem mutatnak problémát egyéb észlelési feladatokban. Isabelle Peretz és munkatársainak kutatássorozata (Peretz et al. 2002) fényt derített arra, hogy a dallamsüketségben szenvedők alapvető problémája a kis hangmagasság-különbséggel rendelkező hangok megkülönböztetése (fél vagy egész zenei hang). Az ilyen kis hangközök a dallam észlelésében alapvető fontosságúak, ahogy azt a zenei hangok szekvenciális szerveződésénél láttuk, más akusztikus ingerek (pl. a beszéd) esetében viszont nincs szükség ilyen pontos hangmagasság-megkülönböztetésre. A szerzők szerint ez lehet az oka annak, hogy a dallamsüketségben szenvedők egyéb kognitív képességekben nem mutatnak problémákat.
5.3. ÖSSZEFOGLALÁS 1. A zene észlelése a beszéd észlelése mellett a másik legmagasabb szintű észlelési folyamat a hallás területén. Ennek két oka van: egyrészt csak az emberi faj rendelkezik a zene észlelésének és létrehozásának képességével, másrészt a zene nagyon sok pszichológiai működés komplex interakcióján alapul. 2. A zene alapvetően az idői és frekvenciabeli változások, vagyis a ritmus és a hangmagasság észlelését foglalja magában. Mindkettő egyszerű, jól meghatározható elemekből, meghatározott szabályok révén létrejövő, sokrétű szerveződési mintázatokat jelöl. 3. A ritmus bizonyos események (pl. hangok vagy mozdulatok) szabályos időbeli szerveződésére vonatkozik. A ritmus észlelésének alapja az események közötti időintervallumok és ezek periodikus ismétlődésének feldolgozása. 4. A zenei ritmus a különböző időtartamú hangok váltakozásából jön létre, amelyek szabályos viszonyban állnak egymással. A ritmus két különálló szerveződést tartalmaz: a csoportosítást és a metrumot. A csoportosítás a zenei hangok különböző nagyságú egységekbe történő szegmentálását jelenti. A metrum egy hierarchikus szerveződés, amely a hangsúlyos és hangsúlytalan ritmikai elemek váltakozásából származik. 5. A zenei hangmagasság észlelésében nem a hangok pontos hangmagassága, hanem a köztük lévő hangközök fontosak. A zenében a hangközök szabályos rendszert alkotnak, melynek alapja az oktáv. Az oktávnyi távolságra lévő hangok hasonlónak hangzanak, ezt oktávazonosságnak nevezzük. 6. A zenei hangok kétféle szerveződést mutatnak: szimultán (akkord) és szekvenciális (dallam). A szimultán szerveződésben elsősorban a hangok közötti kis frekvenciaarány fontos, amely kellemes hangzásúvá (konszonánssá) teszi az akkordot. A szekvenciális szerveződésben inkább a kis frekvencialépés lényeges, amely lehetővé teszi a hangok egy hallási láncba csoportosítását. A dallam több egymást követő hangok sorozatánál: valójában egy magas szintű perceptuális mintázat, amely független lehet a konkrét formától, vagyis attól, hogy milyen tempóban, hangszeren vagy hangnemben játsszák le. 7. A zenei hangokat hangnemekben értelmezzük, és a hangnemek tonális hierarchiába szerveződnek. Vannak bizonyítékok amellett, hogy a zeneelmélet által leírt tonális szerveződés leképeződik a hallgatók fejében. 8. A zeneészlelési képességek egyfajta kontinuumot alkotnak, amelyek a dallamsüketségtől az átlagos zenei észlelésen át a relatív és abszolút hallásig terjednek.
5.4. KULCSFOGALMAK abszolút hallás, dallam, dallamsüketség, hangköz, konszonancia, metrum, oktáv, relatív hallás, ritmus, tonális szerveződés 268 Created by XMLmind XSL-FO Converter.
12. FEJEZET – A zene észlelése
5.5. ELLENORZO KÉRDÉSEK 1. A zene evolúciós hátterét nem igazán tudjuk meghatározni. Mégis, miféle túlélési hasznossággal rendelkezhet 2. a zene? 3. Miben hasonlít és miben különbözik a zenei ritmus és a légzés ritmusa? 4. Milyen szerepet játszanak a hangok szubjektív jellemzői (hangerő, hangmagasság, hangszín, időtartam) a zene észlelésében? 5. A zeneészlelés kapcsán melyek azok a jellemzők, amelyek megfelelő észleléséhez tanulásra van szükség? 6. Miben tér el egymástól a beszéd és a zene produkciója? 7. Miért találunk zenészek között gyakrabban abszolút hallással rendelkezőket, mint nem zenészek között?
5.6. AJÁNLOTT OLVASMÁNY Pap János 2002. Hang, ember, hang. Vince Kiadó, Budapest.
269 Created by XMLmind XSL-FO Converter.
15. fejezet - AZ ÉRZÉKELÉS MÁS DIMENZIÓI
Képesek vagyunk-e láttatni, művészi formában kifejezni mindazokat az érzetek!, amelyek sem nem ' láthatók, sem nem hallhatók. Miként mutathatók be a világnak azok a dimenziói, amelyekhez ízek, szagok, külső és belső testi érzések kapcsolódnak, a kellemestől a fájdalmasig? Ha művészi illusztrációt keresünk, a szürrealizmusban találjuk meg igazán. Az édesapja révén részben magyar származású mexikói festőművésznő, Frida Kahlo (19071954) sem csupán azt festette meg, amit látott, hanem azt is, amit érzett, amire vágyott. Szürrealista festőként azzal a szabadsággal festett, amely a torzított tárgyak-motívumok segítségével tudta kifejezni a világ szépségét, sokszínűségét, a testi és mentális fájdalmat. Az érzékelésnek a látáson és halláson kívüli dimenzióiról szóló fejezeteit A két Frida című képe illusztrálja. A fájdalmak, az élet megpróbáltatásai miatt megtört szív a fájdalom sokféle alakjának ábrázolására röntgenképszerű, sajátos szürrealista eszköz. Frida Kahlo felnőttkorára megtanult együtt élni a fájdalommal. Hatéves volt, amikor polio (gyermekbénulás) támadta meg; jobb lába erőtlenné vált, tornával és atlétikával igyekezett erősíteni. Egy tizennyolc éves korában elszenvedett buszbalesetben szerzett súlyos sérülése miatt csaknem egy teljes éven át ágyhoz kötve lábadozott. Az ágya fölé erősített tükör segítségével festette önarcképeit, így kezdődött festői karrierje. Balesete után négy évvel az ünnepelt festő, Diego Rivera felesége lett. Szenvedélyesen szeretett mindent: az élénk színeket, a zenét, a táncot, a csípős mexikói ízeket. És persze végigkísérte életét a fájdalom, a testi, a lelki, a mentális. A két Frida című kép két alakja közül a jobb oldali a szeretett, a bal a megtört szívű Frida. Képei életének szürrealista 270 Created by XMLmind XSL-FO Converter.
AZ ÉRZÉKELÉS MÁS DIMENZIÓI dokumentumai, azt is mondhatnánk, hogy az érzékelés és észlelés művészi illusztrációi. Frida Kahlo minden idegszálával érzékelt, minden létező modalitásban tobzódott. Boldogan eltelt Rivera monumentális festményeivel, élvezte az utcai muzsikusok zenéjét, élvezte Mexikó zamatait. Kevés festőt ismerünk, aki ennyire elmerült volna a világ ingereiben, akit ennyire magával sodort volna az eseményeknek a fizikai világhoz tartozó valamennyi szintje. Frida Kahlo élete kinagyított példája annak, hogy az érzékelés és észlelés gyökerei milyen erősen kötődnek tapasztalatainkhoz, és annak, hogy észlelésünk mennyire ehhez alkalmazkodva alakul, jól vagy kevésbé jól, esetleg torzulva tükrözve a világot. Frida Kahlo megőrizte mindazt, amivel a világ élvezhető, látható, hallható, szagolható, ízlelhető. Ugyanakkor a szokásosnál jóval többet tudott a testérzésekről és a fájdalomról. A következő fejezetek ezeknek a más dimenzióknak a bemutatásával zárják az észlelésről szóló részt. Megismerkedünk azzal, miként is lehetséges saját testünk jelzéseinek érzékelése, észlelése, értelmezése. Kérdezhetjük, hogy van-e észlelés a testi jelzések szintje alatt is, van-e olyan extraszenzoros észlelés, amellyel, ha nem is mindenki, de néhányan rendelkeznek. A pszichológus számára ezeknek a kérdéseknek a megismerése is fontos lehet ahhoz, hogy megértse az ember mentális folyamatait és viselkedését.
271 Created by XMLmind XSL-FO Converter.
16. fejezet - 13. FEJEZET – Testérzékelés és fájdalom 1. Testérzés A testérzés (szomesztézia) fogalommal a test felszínéről és mélyéből érkező ingerek feldolgozását jelölik. Alapvetően három, jellegében különböző, de egymással össze is függő érzőminőség tartozik ide: • bőrérzékelés (pl. tapintás, hőérzés, nyomásérzés), amely többféle érzékfajtát is átfog, közösen szokás őket az „érintés” fogalmába összegyűjteni; • mozgásérzékelés (kinesztézia – pl. karhajlítás, fejbiccentés, lábfeszítés), amely a testhelyzetnek, a testrészek egymáshoz való viszonyának, illetve a mozgásoknak az érzékelését foglalja magában; • szervérzékelés (zsigeri érzékelés, viszcerocepció – pl. szívdobbanások gyakorisága, hólyagfeszülés, gyomormozgások), amely a belső szervekből származó ingerek feldolgozásának közös elnevezése. Nem eldöntött kérdés, hogy van-e egy negyedik érzőminőség, a teljesség kedvéért azonban ésszerű külön is említeni, noha az előzőekkel is szoros rokonságban lehet: • fájdalomérzés (nocicepció, illetve algesztézia – pl. égési seb, horzsolás, izomhúzódás, gerincsérv, gyomorfekély).
1.1. Börérzékelés A bőr a legnagyobb felületű érzékszerv, területe kb. 175 cm 2. A csecsemő teljes testsúlyának 19,7 százalékát teszi ki, míg a felnőttnél ez az arány 17,8 százalék, tehát tömegénél fogva is jelentős szervként fogható fel. Összehasonlításul: a látószerv összfelülete 2 cm2, a hallószervé 4 cm2, a szaglószerveké 6 cm2, az ízérzékelő szervé 8 cm2. A bőrben mintegy 200 ezer érzőidegrost található, a látószervben kb. 1 millió, a fülben 80 ezer, a szagló- hámban 50 ezer, az ízérző területeken pedig 10 ezer. Elmondható tehát, hogy a bőrérzékelés messze a legnagyobb felülettel és a második legnagyobb számú idegrosttal jellemezhető, nagy tehát a súlya az érzékelési folyamatokban. Jelentőségét fokozza az is, hogy a bőr az első érzékszerv, amely az ontogenezis során megjelenik: a 8 hetes magzat (kb. 3 cm hosszú ilyenkor) már jól fejlett bőrrel rendelkezik, és érintésre mozgással reagál. A többi érzékszerv csak később indul fejlődésnek: előbb a hallás szervei alakulnak ki, majd ezt követően a látáséi. Az újszülött, noha képes hangok és vizuális ingerek felvételére is, szintén elsősorban tapintása révén ismerkedik a világgal (jellemzően a legsűrűbb beidegzésű ujjvégek és ajkak segítségével), és csak jóval később veszi át a vezető szerepet a látás és a hallás. Az érintés azonban ekkor sem veszít sokat jelentőségéből. Jellemző például, hogy a tárgyak felületének tulajdonságait látásunk révén csak akkor tudjuk megbízhatóan megítélni, illetve a textúrájukat azonosítani, ha már előzőleg volt módunk az adott vagy más hasonló felületet megérinteni, ujjainkkal (vagy ajkunkkal) megvizsgálni. Más érzékszervek hiányát vagy csökkent működését részben szintén kompenzálni tudjuk az érintés segítségével (gondoljunk például a vakok számára kifejleszett, pontegyüttesekből álló Braille-írásra; 13.1. ábra), még a látás és a hallás veleszületett együttes hiányát is lehet részlegesen pótolni az érintés és a tapintás révén (megfelelő gondozás esetén az ilyen emberek még műalkotások, például szobrok készítésére is képesek lehetnek, pusztán bőrérzékeik közreműködésével). A bőrérzékelés alapvetően három érzékfajtát jelent: mechanikai, hő-, illetve károsító ingerek felvételét. Az elsőt mechanorecepciónak, a másodikat termorecepciónak, a harmadikat nocicepciónak nevezik. Itt most csak az előbbi kettőről lesz szó, a nocicepcióval a fájdalom kapcsán foglalkozunk majd. Közös sajátosságuk, hogy receptoraik úgynevezett kontakt receptorok, vagyis aktiválásukhoz az ingereknek az érzőfelülettel érintkezniük kell. Ezért szokták őket együttesen taktilis érzékelésnek, illetve érintésnek nevezni; bár mindkét kifejezést használják szűkebb értelemben, kizárólag a mechanikai ingerekre vonatkoztatva is. A közös elnevezést az indokolja, hogy nagyon sok bőrbeli receptor többfajta ingerre is érzékeny, illetve, hogy a taktilis (érintő jellegű) ingerek többsége több mint egy érzékfajtát ingerel.
272 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
13.1. ábra. A Braille-írás ábécéje. A jeleket kiemelkedõ pontcsoportok képezik, amelyeket az olvasó az ujjával tapogat le
16.1. táblázat A BOR FELEPITESE A bor nemcsak érzékszerv, hanem élő, sokféle funkcióval rendelkező szerv; egyik kiemelkedően fontos tulajdonsága állandó megújulásra való képessége, tehát hogy folyamatosan keletkeznek új sejtek a bőralján, és állandóan lelökődnek az elhalt, elszarusodott sejtek a felszínen. A sejtek állandó felfelé mozgása többféle átalakulással jár együtt, ez a bőrt réteges szerkezetűvé teszi. A bőr alsó, a szervezet belsejével érintkező része a bőralja (szubdermisz), efelett van az irharéteg (dermisz), majd a hám (epidermisz), és ennek felszíni része, az elszarusodott felhám. A bőr igen sokféle sejtet, illetve más szerkezeti elemet (pl. különféle rostokat) tartalmaz, és számos függeléket (mirigyeket, szőrtüszőket) találunk benne. Felszínét a szaruréteg alatt szorosan záródó, zsírszerű anyagokkal összecementezett záróréteg borítja, amely a kórokozók behatolását, de a vízvesztést is megakadályozza. A bonyolult felépítésű bőrbe az erek és idegek egész hálózata nő be, amely hálózat nem állandó, hanem a bőr élete során változik; ez vonatkozik a receptorokra is, noha az idegi elemek maguk nem cserélődnek, de hosszuk és elrendezésük változhat. A bőr réteges szerkezete azt is eredményezi, hogy az egyes receptorok különböző mélységekben helyezkednek el, a felszín közvetlen közelétől egészen a bőralja mélyrétegéig; ez érzékenységükben és funkciójukban is jelentős eltéréseket okoz.
273 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
A bőr felépítése. Az ábrán a bőr keresztmetszeti képe látható a benne lévő különböző képletekkel együtt
1.1.1. A bör receptorai Bár az érintést vagy taktilis ingerlést elsősorban a kézzel asszociáljuk, ingerek felvételére az egész testfelület képes, és ennek nemcsak tapintási funkciója van; szerepe van a testtartásban, a járásban (például a talp letételének jelzésében), a védekező reflexekben, a mozdulatok szabályozásában, valamint a személyes tér kialakításában is. A bőrben lévő receptorok szabad idegvégződések ugyan, tehát az érzőneuronok nyúlványainak végződései, egyes receptorok esetében azonban járulékos struktúrákat, illetve speciális alakzatokat is találunk. A mechanikai ingerek felvételére specializálódott a legtöbb receptor, ezek adekvát ingere általában a bőr különböző méretű deformációja, illetve különböző irányú elmozdulása (szőrtüszők esetén a nyíróerő, tehát az oldalirányú elmozdulás mértéke): • A szőrtüszők idegvégződései, amelyek a szőrtüszők tokjában találhatók, és a felszíni mozgásokra – például egészen könnyű felszíni érintés, a ruha mozgásai, szellőfuvallat stb. – reagálnak. • A szabad idegvégződések, amelyek a hámban és az irhában találhatók, képesek érzékelni az érintést, bár magas az ingerküszöbük. • A Meissner-testecskék, amelyek ovális struktúrát mutatnak, és a bőrléceket alkotó kiemelkedésekben (dermális papillákban) foglalnak helyet. Jellemző rájuk, hogy gyorsan adaptálódnak. Az epidermisz és a dermisz között a test szőrtelen felületén, ujjbegyeken, tenyéren, talpon, nyelven, nemi szervekben találhatók. Ezek a receptorok az enyhe mechanikai ingerekre érzékenyek, az érintés legkisebb formáira is reagálnak. Ezek kerülnek ingerületbe például, ha ujjunkat egy tárgy felszínén könnyedén végighúzzuk (pl. cirógatás). • A Pacini-testek, amelyek a bőr mélyebb rétegeiben, az ízületekben, a mély szövetekben, a nemi szervekben és az emlőkben helyezkednek el. Az ujjak nagy számban tartalmazzák, és az erősebb nyomásokat érzékelik. A Pacini-testek a vibrációs érzéseket közvetítik, szerepük van a felszíni mozgások detektálásában. A bőr felszínébe erősebben benyomódó, mozgó ingerek, például dörzsölés, valamint erősebb nyomás, például a kéz megszorítása, ingerlik ezeket a receptorokat. • A Merkel-korongok a bazális rétegben helyezkednek el, és a gyors, vibrációs jellegű ingerületekre válaszolnak, illetve érzékelhetik a felszíni mozgásokat is. Valószínűleg ilyen receptorok közvetítik a tartós nyomást, például az ülő-, illetve állófelületeken keletkező hatásokat. A receptorok alaki jellemzőit mutatja a 13.2.ábra, míg legfontosabb működési sajátosságaik a 13.3. ábrán láthatók.
13.2. ábra. Érzőreceptorok a bõrben: a) Ruffini-testek, b) Merkel-korongok, c) Meissner-testecskék, d) Pacinitestek, e) Krause-féle végtestek, f) szabad idegvégződések a sejtek között
274 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
13.3. ábra. A bőrreceptorok néhány fontosabb tulajdonsága (Rosenzweig et al. 2002 nyomán) A termoreceptorok adekvát ingere a környezetükben lévő szövetek hőmérsékletének változása. A hidegreceptorok ingerküszöbe 0,004 °C/s hőmérséklet-csökkenés, a melegreceptoroké 0,001 °C/s hőmérsékletemelkedés. Az ingert a receptorok közvetlen környezetének hőmérséklet-változása képezi; az állandó hőmérséklet nem ingerli őket. A hőreceptoroknak is több fajtája van, egyesek közülük több érzékfajtára érzékenyek, azaz polimo- dálisak. (Megjegyezzük, hogy a modalitás fogalmát általában nagyobb érzőműködésfajtákra – pl. látás, hallás, szaglás stb. – alkalmazzák, de használják az egyes érzőminőségeken belüli alfajták megkülönböztetésére is; a polimodális kifejezésben ez utóbbi értelemben szerepel.) A termoreceptorok közé tartoznak: • A Ruffini-testek, amelyek mélyen a bőrben helyezkednek el, hő- és nyomási receptorok. • A Krause-féle végtest a hám felszíni rétege alatt helyezkedik el, és leginkább hidegre érzékeny. A hőmérséklet változására a legérzékenyebb testrészeink az arc, a karok és a kéz, mert ezek a területek akkor is szabadon vannak, amikor teljesen fel vagyunk öltözve. A receptorok jellemző tulajdonsága a receptív mező (más néven az érzőmező), azaz az egy receptor által ellátott bőrterület nagysága és határának minősége (vagyis az, hogy mennyire éles vagy elmosódott, diffúz a receptív mező széle); az adekvát inger (az, amire a receptor a legalacsonyabb küszöbbel reagál); továbbá az, hogy az inger tartós fennállása esetén a receptorok meddig maradnak ingerületben, azaz az adaptáció. (A 13.1. táblázat összefoglalja a legfontosabb mechanoreceptorok tulajdonságait.) Érdemes megemlíteni, hogy a bőrreceptorok egy része igen gyorsan adaptálódik, ez az oka annak, hogy például nem érezzük testünk felületén a ruhát.
16.2. táblázat A BŐRBŐL SZÁRMÁZÓ INGERÜLET TOVÁBBI ÚTJA Mint említettük, a bőrreceptorok az elsodleges érzősejtek nyúlványainak végződései; sejttestük a periférián, az érzo- ganglionokban van. Az innen kiinduló axonok a hátsó gyökéren, illetve a befelé vezető agyidegeken keresztül lépnek be a gerinc- és nyúltvelőbe, ahol átkapcsolódnak. A rostok egy része közvetlenül vagy köztes neuronok közvetítésével a mozgatóidegsejtekkel kapcsolódik, ez képezi a gerincvelői (nyúltvelői) mozgási reflexek alapját. A rostok más része, nagyobb többsége a gerincvelő más szegmentumaiba, zömmel pedig az agyba fut. A gerincvelőben két pályarendszerben haladnak: az ősibb spinotalami- kus rendszer általános, diffúz, tömeges jellegű információt szállít, míg az újabb lemniszkális vagy közismertebb nevén szomatoszenzoros rendszer a finom, tér- belileg is megtartott, specifikus taktilis információt szállítja. Ez utóbbiak, tehát a szomatoszenzoros rostok a nyúltvelő, majd a talamusz relémagjaiban átkapcsolódnak, végül pedig elérik az agykérget (1. ábra). Az agykéreg elsődleges testérző (szomatoszenzoros) területe (SI kéreg) a nagy oldalsó árok (fissura centralis) mögött helyezkedik el; ezen az egyes mátrix, fájdalomreakció, fájdalomtolerancia, habituáció, hiperalgézia, hiperszenzitivitás, kapuelmélet, komfortérintés, kontakt receptor, krónikus fájdalom, mechanorecepció, mozgásérzékelés, nocicepció, proprioceptorok, protopátiás, pszichogén fájdalom, szociális fájdalom, termorecepció, testérzés, viszceroceptorok testtájak topografikusan képeződnek
275 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom le, azaz megtartják elkülönült reprezentációjukat. A test teljes térképe egy kissé eltorzított homunkuluszt formál, amely nem a valós testarányokat, hanem a receptorok sűrűségét tükrözi: azoknak a területeknek, ahol a legtöbb receptor van (ujjak, ajkak, nyelv, lábfej stb.), nagyobb, a többinek kisebb kérgi area felel meg. A kis emberkefigurának tehát nagy feje, még nagyobb nyelve és ajkai, illetve keze van, törzse pedig egészen kicsiny (2. ábra). A topografi- kus elrendeződés még a másodlagos testérző mezőn (SII) is megmarad valamelyest, de már nem olyan éles, a magasabb rendű kérgi területeken és különösen az asszociációs kérgen azonban már nincs meg. Az ősibb felszálló testérző rendszer inkább emocionális reakciók, például védekezés, menekülés megindításában szerepel, az újabb szoma- toszenzoros rendszer pedig az ingerek tulajdonságainak analízisét (alaki sajátosságok, időviszonyok, ingererősség stb.), az inger percepcióját segíti elő, illetve ez szerepel a taktilis explorációban (a tárgyak tulajdonságainak tapintásos felderítésében) és a tárgyak manipulációjában.
1. ábra. A testérző rendszer gerincvelői bemenetei és az agyba felszálló pályák
2. ábra. A testérző receptorok képviselete az agykérgi testérző mezőben. A területek nagysága a receptorok
276 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom sűrűségével arányos. Figyeljük meg, hogy a fő tapintási területek (pl. ujjak, ajkak, nemi szervek) reprezentációja a többinél sokkal nagyobb
1.1.2. Érintés és kultúra Az érintés és a tapintás megkülönböztetése nem mindig egyértelmű. Talán azt mondhatnánk, hogy az érintés felületes, könnyű, kis intenzitású nyomást jelent a bőr felszínére; lehet statikus, ha csak egy pontra irányul, és dinamikus, ha a felszínen halad is (Bárdos-Deák-Fogarasi 2003). Az érintés nem szükségszerűen akaratlagos, és nem feltétlenül célja a megismerés vagy észlelés, elsősorban kommunikációs célokat szolgál. A tapintás célzott érintés, amelynek funkciója az, hogy egy objektumról információt szerezzünk. Ilyenkor a figyelem is a megérintett felületre irányul, és a tapintó személy képes a szerzett információkat kognitív úton is megjeleníteni. Az érintés tehát egy általánosabb kategória, a tapintás pedig annak speciális, megismerést szolgáló formája. Ebben a könyvben ezeket a fogalmakat ebben az értelemben használjuk, de megemlítjük, hogy ezt a megkülönböztetést nem mindenki alkalmazza, a két fogalom gyakran keveredik (sajnos ez sok félreértés forrása is lehet). Hajlamosak vagyunk elfelejtkezni arról, hogy az érintés az egyik legősibb, ontogenetikusan is első kommunikációs eszközünk; ennek ellenére az érintés területén igen jelentős kulturális különbségek mutathatók ki. Az érintés mennyiségi és minőségi sajátosságai a mikroszociális környezetben alakulnak ki, de kiteljesedését számos szociokulturális hatás teszi lehetővé. Minthogy az érintés intim kommunikációs forma, elterjedtsége és elfogadása az adott kultúra, sőt szubkultúra jellegétől függ: a déli, mediterrán népeknél például hagyományosan igen elterjedt és gyakori, az észak-európai területeken viszont ritka, sőt gyakran elfogadhatatlan. Számos természeti nép tartja csecsemőjét állandó testi kontaktusban, máshol különleges érintési szokások alakultak ki, mint például az Indiában honos babamasszázs, amely a csecsemő teljes testére kiterjedő, mérsékelten erős masszírozást jelent, amelyet akár naponta is alkalmaz az anya, gyakran ölében tartva gyermekét (Field 2003). Bizonyára szerepe van ebben az adott nép életmódjának, a népsűrűség történeti alakulásának, a tevékenységek domináló jellegének és még sok más tényezőnek, amelyek a ma már néha nehezen érthető tradíciók, a gyakran meglepően erős intolerancia mögött húzódnak. Különleges szerepe van az érintésnek a vallási életben, ahol az érintés bonyolult szimbolikával rendelkezhet. Az áldásra emelt kéz, a kézcsók, a hívők érintése egyfajta gyermeki elfogadásra invitál, a felsőbbrendű gondoskodás megtestesítője. Az érintés közvetítheti ezt a gondoskodást indirekt úton is, a szent tárgyak, szobrok, kegytárgyak megtapintása révén.
16.3. táblázat - 13.1. táblázat. A bőr specializálódott érintési receptorainak jellemzői Jellemző tulajdonság Receptor Pacini-test Adekvát inger
Meissner-test
vibráció (>200 Hz), érintés felszíni mozgás
Merkel-korong
Ruffini-test
érintés
feszülés (pl. felszíni mozgáskor)
Receptív mérete
mező nagy
kicsi
kicsi
nagy
Receptív határa
mező diffúz
éles
éles
diffúz
gyors
lassú
lassú
Adaptáció
gyors
1.1.3. Érintés és megismerés Az érintés lehet passzív, és lehet aktív is (Montagu 1971). Az előbbit az egyén mintegy elszenvedi, illetve elfogadja, anélkül hogy figyelme különösebben az érintő objektum felé irányulna. Érdemes megjegyezni, hogy a passzív ingerhatások gyakran a percepciós küszöb alatt maradnak, Head terminológiájával élve, protopátiásak (Head 1920). Ilyen például az, amikor egy nagyobb tömegben az emberek egymáshoz érnek, vagy amikor a villamoson fogódzkodás közben két kéz egymáshoz ér. 277 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom Ahhoz, hogy az érintés percepciója létrejöjjön, illetve tartós maradjon, aktív taktilis manipulációra, azaz tapintásra van szükség, az ilyen ingerek messze az észlelési küszöb fölé kerülnek (noha intenzitásuk néha kisebb, mint egyes nem észlelt passzív érintéseké), és epikritikussá válnak. Ha egy tárgyat érintés révén szeretnénk azonosítani, aktívan körül kell tapogatni, hogy elegendő információnk legyen: egy zoknit a kesztyűtől csukott szemmel is el tudunk különíteni, ha kitapogatjuk az ujjakat a kesztyűn (igaz, az ötujjas ’lábtyű’ becsaphatja érzékeinket, bár az ujjak hossza ez esetben is eligazíthat). A tapintás (taktilis manipuláció) lényegi eleme tehát a figyelem: az egyén (vagy egyed) az adott objektum szisztematikus érintése révén deríti fel annak jellemző tulajdonságait. Noha információt passzív érintés révén is szerezhetünk, az aktív érintés sokkal hatékonyabb, durván kétszer annyi az információtartalma, mint a passzívé. A taktilis manipuláció a csecsemő esetében még a megismerés legfőbb eszköze (nevezik thigotrópiának, érintésmódnak is – Montagu 1971), amelyhez olyan bőrterületeket használ, amelyekben igen nagy a receptorsűrűség: a kezeit, illetve a száját. Ez utóbbi két ilyen felületet is kínál: az ajkakat és a nyelvet, mindkettő igen finom taktilis információ felvételére képes. A kézzel való manipulációval szemben az ajkak használatának nagy előnye, hogy sokkal vékonyabb a bőr, és ezért érzékenyebbek a receptorok, illetve jóval nagyobb számú hőreceptor (sőt nociceptor) is található az ajkakon. Az aktív érintés a tárgyak térbeli tulajdonságainak megismerését is lehetővé teszi (sztereognosztikus), azaz képesek vagyunk tapintás révén a tárgyakat három dimenzióban is rekonstruálni. Az aktív érintés lehetővé teszi továbbá a felületek tulajdonságainak, a textúrának, a hőmérsékletnek, a nedvességnek, illetve a keménységnek az explorációját. Ez az oka annak, hogy bár a felnőtt emberben elsősorban a látás és a hallás a megismerés eszköze, a tapintás továbbra sem veszít jelentőségéből. Jól érzékelhető ez, ha az ember a piacon gyümölcsöt válogató asszonyokat figyeli: bár a kirakott áruk általában szépek és vonzóak, valódi ítéletet csak akkor tudnak róla alkotni, ha alaposan meg is tapintják (amit persze az árusok nem szeretnek); ha nincs mód a gyümölcsöt megtapintani, inkább nem vásárolnak belőle. Ennek az a magyarázata, hogy a tapintás révén a gyümölcsnek a fogyasztás szempontjából lényegi tulajdonságait lehet megítélni, mint például a puhaságát, a gyümölcshús rugalmasságát, bizonyos mértékig a nedvességtartalmát is. Még inkább a tapintásra kell hagyatkozni akkor, ha egy tárgy hőmérsékletét akarjuk megítélni, amit – kivéve a vörösen izzó tárgyakat – szinte csak érintéssel lehet (13.4. ábra). Paradox módon erre nem az egyébként legjobb felbontású tapintófelület, az ujjak vége a legalkalmasabb, hanem az ajkak (ahol elég vékony a bőr), illetve például a könyök (ahol kevés a másféle receptor, és így kisebb a zavaró hatás).
16.4. táblázat AZ ÉRINTÉS ONTOGENEZISE Mint már említettük, a bőr kialakulása már a 8. embrionális héten eléri azt a fejlettséget, hogy benne működő receptorok vannak. A nyolchetes embrió már határozott reflexes választ mutat például ajkai vagy nyaka megérintésekor. A magzat is állandó érintési környezetben él, amit a magzatvíz folytonos mozgása hoz létre; ez egy finom, elsősorban a felszíni szőrzet által közvetített taktilis inger. Valószínű, hogy a harmadik trimeszter során a magzat már elemi tapintási tevékenységet is végez, elsősorban kezeivel és az ajkaival (Montagu 1971). A születés után a felületi kontaktus az újszülött és a csecsemő egyik legfontosabb életszükséglete. Mint ahogy azt Harlow vizsgálatai megmutatták, a bőrkontaktus még a táplálásnál is fontosabb, a csecsemő és az anya közötti kötődés elemi eszköze; hiányában zavart szenved a személyiség fejlődése (Harlow 1958). Újszülött kismajmokat, anyjuktól elvéve, műanyákra helyeztek néhány napra. Az egyik szőrős volt, de nem volt rajta táplálékforrás, a másik csupasz drótból volt, viszont a megfelelő helyen cumisüvegek voltak rajta. A szőranyán nevelkedett kölykök később, visszahelyezve a közösségbe, beilleszkedtek, fejlődésük és szociális viselkedésük is normális volt; a drótanyára helyezett kölykök viszont, noha normálisan táplálták őket, nem tudtak beilleszkedni, szociális viselkedésük zavart volt, és főleg az anyai viselkedésben mutattak hiányosságokat. Ez a testi kölcsönhatás adja a biztonságérzetet is, ami szintén elengedhetetlen a normális egyedfejlődéshez. Azt is felismerték, hogy az anyával való bőrkontaktus fontos eszköze az énhatárok kialakulásának, a saját test felismerésének és később a megfelelő leválásnak is (Field 2003). Ez lényegében azt jelenti, hogy az érintésnek elsődleges szerepe van abban, hogy a gyermek a saját testét az anyáétól megtanulja megkülönböztetni, önálló létét, önazonosságát felismeri, és magát mint az anyától független, saját akarattal jellemezhető lényt fogja fel; ez a folyamat feltétlenül szükséges az önazonosság (identitás) kialakulásához. Különleges szerepét elsősorban a pszichoanalitikus irányzatok hangsúlyozzák.
278 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
komfortérintés… Anzieu (1989) a bőr különleges státusát azzal is hangsúlyozza, hogy feltételezi egy sajátságos bőr-Én létét, amely nélkülözhetetlen az Én és a külvilág közötti határfelület definiálásához, az identitás kialakulásához, a megfelelő védelemhez és elkülönüléshez, továbbá kommunikációs funkcióval is rendelkezik. A gyermek normális fejlődése során megtanulja magát az anyjától megkülönböztetni, de ez még nem elég ahhoz, hogy a környezetében is el tudja magát helyezni. Ehhez szükséges az is, hogy a saját teste és a környezet világosan elkülönüljön, az egyes történésekről egyértelműen el tudja dönteni, hogy azok a testében vagy annak felületén, illetve azonkívül, a környezetben történnek-e. Ha nem alakulnak ki világosan a testhatárok, az Én összemosódik a környezetével, és az egyén nem érzékeli, hogy a saját hatóköre meddig terjed. Ez a zavar nemcsak a tárgyi, hanem a személyi környezetre is vonatkozik, mivel ilyenkor a megfelelő személyes tér sem alakul ki. A személyes tér a testből és annak közvetlen környezetéből áll, nagysága a pszichés fejlődés során alakul ki (és egyénenként változó), attól függően, hogy az egyén milyen közelségben érez egy másik embert vagy akár tárgyat már zavarónak. Anzieu vizsgálatai megmutatták, hogy ha a testhatárok nem egyértelműek, sem az énhatárok, sem a személyes tér határa nem éles, az egyén a környezettel folytonos konfliktusban van, mivel úgy érzi, a környezet elemei saját testébe hatolnak be. Valószínű, hogy ezek a zavarok a bőrre mint kommunikációs szervre is kivetülnek, ez állhat számos bőrbetegség hátterében (például a bőr erős hámlása vagy pattanásai tisztátalannak mutatják azt, ezért távolabb tartják a többi embert, megnövelve ezzel a relatív személyes teret). Az érintés fontos szerepét mutatja az úgynevezett komfortérintés léte, ami nemcsak az embernél, hanem az emlősök többségénél is már kimutatható. Az érintés mint nyugtató, relaxáló, biztonságot nyújtó mozzanat jelentőségét az anyai gondozásból vezethetjük le, amely mélyreható nyomokat hagy a szervezetben. Már patkányoknál kimutatták, hogy a kölykeit rendszeresen nyalogató-kurkászó (grooming) anya lányai is hasonló gondozási viselkedést mutatnak később, és ezt a hatást a gének kifejeződésének megváltozása és az ennek következtében megváltozó hormonális miliő közvetíti. A korai gondozás végső soron az oxitocin (a simaizmokat összehúzó, hipotalamikus eredetű hormon) szintjének emelése révén hat (ami viszont a nőstény kölykökben, illetve leányokban az ösztrogén iránti érzékenység növekedésének közvetítésével jön létre), de felnőtt állatokban, illetve emberben is valószínűleg elsődlegesen ez a hormon közvetíti az érintés komfortot nyújtó hatásait (bár ennek mechanizmusa egyelőre nem ismert). Az érintés jelentőségét mutatja a megkapaszkodási ösztön (Hermann 1984), illetve a fogási reflex is, amely a főemlősök és az ember csecsemőinek sajátos viselkedése. A megkapaszkodási ösztön akkor aktiválódik, ha a babát valamilyen kapaszkodásra alkalmas felületre helyezik (különösen, ha függőleges a felület), amikor is kezeivel erősen megmarkolja a puhább felületi elemeket (pl. szőrzetet, ruhát), és testével a felülethez simul; eredeti funkciója az anyához való szoros hozzáfekvés. A fogási reflex akkor alakul ki, amikor a baba kezébe valamilyen tárgyat teszünk (például az ujjunkat): ilyenkor a baba erősen megmarkolja azt (akár fel is lehet emelni ily módon). Mindkét típusú ősi reakció a csecsemő és a mama szoros együttmaradását szolgálja. Az érintés fontosságát igazolja az is, hogy az érintéssel operáló manipulációk (különféle masszázsok, érintéses relaxációk, manuálterápiás eljárások) felnőttek esetében is jótékony hatásúak, sőt terápiás eszközök is lehetnek. Különösen jól működik ez gyermekeknél (Demcsákné Kelen Ilona külön eljárást dolgozott ki erre építve – Demcsákné 1982), illetve olyan beteg állapotokban, ahol erős érzelmi regresszió (az emocionális fejlődés egy korábbi fázisába való visszatérés) következik be. Érintő funkciót teljesít a grooming, vagyis a kontaktápolási viselkedés, magyarul kurkászás is, aminek önmagára irányuló (autogrooming), illetve társas változata (szociális grooming) egyaránt fontos emlősviselkedés. A testfelületen lévő apró idegen tárgyak, egyenetlenségek, esetleg rovarok eltávolítása, az 279 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom egyén önmagára vagy társára irányuló apró érintései rendkívül megnyugtatóak, ellazulást, társas esetben egyfajta összehangolódást eredményeznek. Nagy jelentőséget tulajdonítanak a kurkászásnak az izgalmi állapot szintjének csökkentésében is. Talán ennek vagy az anya-csecsemő közti testi kontaktusnak késői módosulata az ölelés, amely mind a nyugtatásnak, mind az együttérzésnek, mind pedig a személyek közti harmonikus kommunikációnak kiemelt formája. Az érintésnek különleges jelentősége van a szexuális aktivitásban is, ahol – különösen az embernél – a szexuális előjáték egyik leghatékonyabb eszköze. A taktilis kommunikáció az anyától való leválás szakaszában is fontos, noha erre az időszakra a telereceptoros kommunikáció (látás és hallás) válik már dominánssá, vagyis a kisgyermek távolabbi objektumokra irányítja inkább a figyelmét. A biztonságot nyújtó érintés azonban fontos feltétele az énhatárok kialakulásának, a megbízható önazonosság kiépülésének, végső soron az identitástudat kifejlődésének. Az aktív érintés kapcsán már említettük, hogy tapintás révén a tárgyakról térbeli információt is szerezhetünk. Ehhez azonban körbe kell járatni ujjainkat (vagy ajkunkat) a vizsgált objektumon; ez a mozgás, amit ekkor végzünk, maga is információt hordoz. Abból, hogy az egyik jellemző ponttól a másikig mennyit mozgunk, a tárgy méreteire, a mozgatás útvonaláról az objektum alakjára, míg például a benyomásához szükséges erőből a tárgy keménységére tudunk következtetni. Agyunk a tapintási és a mozgási receptorokból származó ingerületet együttesen értékeli, ezt nevezzük haptikus érzékelésnek. A haptikus érzékelés emlékeztet a látás, illetve a hallás térbeli formáira, a tárgyak formáját, nagyságát, sőt bizonyos mértékig a tárgyak térbeli orientációját, valamint irányokat is észlelni tudunk ily módon. A haptikus megismerés korlátait a szerzett információ feldolgozásának időbeli szűkössége, az egyszerre befogható információ mennyisége és az információ felbontásának korlátossága jelenti. Közismert anekdota szól arról, ahogy a négy világtalan az elefántot próbálja tapintás alapján azonosítani: a hátulsó részen lévő szerint az elefánt lényege egy hatalmas lyuk, a lábainál álló szerint az elefánt egy nehéz oszlop, a törzsét vizsgáló hatalmas, ráncos tömbnek, az orrmányát tapogató pedig vastag kígyónak mondja. A tréfát félretéve, a bonyolult objektumok alakját és térbeli tulajdonságait a látás révén sokkal megbízhatóbban tudjuk megmondani, mint tapintással; ha azonban a felület szerkezete (textúra), a tárgy minőségi tulajdonságai, például keménysége, rugalmassága, hőmérséklete, tömege a kérdés, a haptikus észlelés sokkal előnyösebb. Ha a mozgási információt kivonjuk a haptikus észlelésből, és csak a puszta érintésre hagyatkozunk (például elgémberedtek az ujjaink a hidegben, és nem mozognak), a szerzett információ nagyon szegényes és gyakran csalóka.
13.4. ábra. Hőpontok felkeresése és azonosítása a bőrön hideg, illetve meleg vízzel töltött hőpróbák segítségével
1.2. Mozgásérzékelés A mozgással kapcsolatos érzékszerveket proprioceptorok néven szokás összefoglalni. Ezek az izmokban, az inakban, illetve az ízületekben találhatók, és alapvetően azok működési állapotáról, illetve helyzetéről nyújtanak információt. Valójában tehát nemcsak a mozgás, hanem a testhelyzet érzékeléséről is szó van. A mozgásérzékelés (kinesztézia) meglehetősen bonyolult funkció. Mivel a sokféle izom, ín és ízület ingereit nehéz lenne egyszerre észlelni, az ingerek zöme az észlelési küszöb alatt marad, azaz protopátiás. A proprioceptív ingerek tudatosodását elsősorban a figyelem fókuszálása indítja el, ami főleg a mozgás tanulását szolgálja, ilyenkor az ingerek epikritikussá válnak (Head 1920). Amint a mozdulatok automatizálódnak, az észlelés ismét megszűnik. Jó példa erre az autóvezetés: a kezdő vezetőnek állandóan figyelnie kell a mozdulatait, amikor a sebességet váltja, a gyakorlott vezető gyakran még kérésre sem tud számot adni arról, mikor váltott sebességet, és hogy honnan hová. 280 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
16.5. táblázat PROPRIOCEPCIO Az izmok nyújtását a rostokkal párhuzamosan elhelyezkedő izomorsók, feszülését pedig a rostok között elhelyezkedő, virágszerű receptorok érzékelik. Ugyancsak az összehúzódások erejéről vesznek fel információt az ínorsók (amelyek tulajdonképpen az inak megnyúlására reagálnak). Végül az ízületekben lévő különféle receptorok, köztük Pacini-testek is, az elfordulás szögét, illetve kisebb mértékben az ízület torzióját érzékelik. Valamennyi receptorból viszonylag vastag (A p) rostok szállítják az ingerületet az elsődleges érzőneuron felé, amely – a bőrreceptorokhoz hasonlóan – a hátsó gyöki ganglionban van. Ennek axonja lép be a gerincvelőbe, ahol többszörös kapcsolatokat létesít. A proprioceptorokból érkező afferensek egy része közvetlenül vagy interneuronokon keresztül a mozgatóidegsejtekhez kapcsolódik, ezáltal reflexhurok képződik, ez képezi a mozgásszabályozás alapját. A rostok egy másik része, illetve ugyanazon axonok oldalágai is, a bőrérzékelésnél már ismertetett szomatoszenzoros rendszerbe lépnek be és haladnak a felsőbb agyi központok felé. Proprioceptív ingerek más mechanizmussal is a figyelem középpontjába kerülhetnek: a fájdalom vagy az egyes testrészek rendellenes mozgása/helyzete is lehet kiváltó tényező. Ilyenkor az ingerek epikritikussá válása a védelmet szolgálja, és mindaddig a tudatban maradnak, amíg a veszélyes helyzet fennáll. Érdemes megjegyezni, hogy ilyenkor nemcsak a sérült vagy veszélyeztetett testrész észlelése történik, hanem általában is nő a proprioceptív tudatosság: a fájó könyök egy – egyébként öntudatlan – teniszmozdulat minden elemét a figyelem fókuszába hozza, de ilyenkor nemcsak a kéz, hanem a meg-megcsúszó láb is sokkal jobban fáj. A mozgásérzékelés tudatosodása szándékosan, kognitív úton is elérhető, ezen alapulnak a különböző mozgásterápiás eljárások, illetve a különleges mozdulatokat igénylő sportok vagy más szakmai tevékenységek oktatása is. A Jacobson-féleprogresszív relaxáció (ebben minden egyes izomcsoport mozgatását, illetve ellazítását tudatosítják, hogy aztán csak azokat feszítsük meg, amelyekre egy-egy mozdulatnál szükség van), sőt kisebb mértékben az autogén tréning is vagy a Feldenkraitz-féle testtartás- és mozgáskorrekciós módszer (ennek lényege a különféle rossz mozdulatok, tartási hibák tudatosítása és korrekciója) ezt a lehetőséget használja ki, de szerepelnek propriocepcióra utaló szuggesztiók a különféle hipnotikus indukciókban is (amelyek például a kéz köny- nyűségére utalnak, és annak felemelkedését eredményezik). Összességében azt mondhatjuk, hogy bizonyos helyzetekben fokozódik, általában azonban meglehetősen alacsony a mozgástudatosság; ez utóbbi emelkedését belső és külső tényezők (fájdalom, akadályozott mozgás, célobjektum rendellenes viselkedése, célzott figyelem stb.) egyaránt kiválthatják.
1.3. Szervérzékelés Kémiai-, mechanikai-, illetve hőreceptorok a zsigeri rendszer szinte minden területén vannak, percepciójuk azonban ritka esemény; ezért a szervérzékelés (viszcerocepció) elsősorban a fiziológia és a pszichofiziológia számára jelent kihívást. Attól azonban, hogy ezek az információk ritkán kerülnek a tudatba, és gyakran hozzá sem férhetők a kognitív működés számára, még többszörösen és sok szinten befolyásolják a viselkedést (Ádám 1998, Bárdos 2003). Noha a zsigerek beidegzése elég sűrű, és összfelületük is hatalmas, a zsigeri percepció, vagyis a belső szervekből érkező ingerek észlelése ritkán fordul elő; akkor is meglehetősen elmosódott és bizonytalan. A gyomor vagy a belek telődése, a hólyag feszülése csak homályos érzetet kelt, a vérnyomás emelkedését vagy a vércukor- szint csökkenését, noha valamiféle érzetek keletkeznek ennek kapcsán, már azonosítani sem tudjuk. A zsiger- működésre vonatkozó, a mindennapokban esetleg észlelt ingerek többsége valójában nem a zsigerekből, hanem szomatikus receptorok, illetve más modalitások ingerületéből származik (gyomorkorgás és szívdobbanások hallás útján, gyomorkontrakciók vagy a szív lüktetése a hasfal-mellkasfal közvetítésével stb.). Valódi zsigeri ingereket elsősorban az ürítéssel kapcsolatos funkciók esetében feltételeznek, de valójában itt is inkább a kontrollt biztosító harántcsíkolt izomgyűrűk feszülésének proprioceptív ingereit észleljük. Vannak olyan zsigeri receptorok, amelyek ingerülete közvetlenül sohasem jut el a tudatba (például a kemoreceptoroké, a vérnyomási receptoroké, általában a tömör, nem üreges szervek, például a máj vagy a vese receptoraié), így nincs közvetlen tudomásunk mondjuk a vércukorszintről vagy a vérnyomásról (arról, hogy azért a viselkedést ezek is befolyásolhatják, alább még lesz szó).
16.6. táblázat -
281 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
A VISZCERALIS AFFERENTACIO A zsigerekben található érzékelőket összefoglalóan viszceroceptoroknak nevezzük. Ezek lehetnek mechanoreceptorok, amelyek az adott zsiger (főleg üreges szervek) falának feszülését, nyúlását, térfogatváltozását, az adott szerv mozgásait, illetve az üregekben lévő levegő, folyadék vagy bennék nyomását érzékelik; lehetnek fizikai és kemoreceptorok, amelyek a légzési gázok – oxigén és szén-di- oxid – nyomását, az ozmotikus koncentrációt, a pH-t, továbbá egyes anyagok – főleg a szőlőcukor, az aminosavak és a lipidek – koncentrációját mérik; termoreceptorok, amelyek a szövetekben létrejövő hőmérséklet-változásokra érzékenyek; és végül nociceptorok, amelyek a szöveti károsodásra, erózióra, illetve a gyulladásos folyamatokra reagálnak. Egy részük úgynevezett alvóreceptor, amit csak hosszan tartó sérülések vagy gyulladási folyamatok aktiválnak. A receptorok idegrostjai a vegetatív idegekben (tehát a szimpatikus, illetve paraszimpatikus rendszerben) haladnak, részben a gerincvelő, részben a nyúltvelő felé, ahol többnyire átkapcsolódnak. A kapcsolatok egy része a vegetatív efferensek felé irányul, és zsiger-zsiger (viszcero-viszcerális) reflexíveket képez, más részük felszáll az agy, illetve annak magasabb régiói felé. Futnak zsigeri eredetű afferensek a szomatoszenzoros rendszerben is, ingerületük eléri a szomatoszenzoros agykérget. Jelentős célállomás a hipotalamusz, illetve a limbikus rendszer különböző részei, különösen az amygdala és a szeptum. Fontos felismerés az, hogy az afferentáció különböző szintjein összefutnak a zsigeri és testi eredetű afferensek, ez a viszcero-szomatikus konvergencia. A zsigerekből jövő ingerek zömükben tehát protopátiásak (vagyis az észlelési küszöb alatt maradnak), epikritikussá (a kritikus észlelési küszöb felettivé) csak veszély vagy sérülés esetén válnak, illetve a figyelem kifejezett koncentrálása révén kerülhetnek (Ádám 1998). Ez utóbbi sem egyszerű azonban, mert csak erősen ingerszegény környezetben, a többi érzék lanyha működése vagy működésének hiánya esetén valósulhat meg. A zsigeri funkciók tartós percepciója valójában patológiás jelenségnek tekinthető, nem előnyös például, ha valaki állandóan a bélcsatornája mozgásait próbálja érzékelni. Ugyanakkor a viszcerális eredetű ingerek képesek a viselkedést befolyásolni (Bárdos 2003). Ennek két útja is van: egyfelől általános, diffúz, de mégis címkézhető mintázatokat észlelhetünk, ezt nevezik állapotészlelésnek, másfelől eljuthat tudatunkig az ingereket kísérő érzelmi (emocionális) hatás (szubjektív értékelés). Tipikus állapotészlelés az éhség vagy a szomjúság érzése, aminek azonosítását a csecsemő egészen korán, tanulás révén sajátítja el, de tanulhatók állapotok felnőttkorban is (például ezen a módon lehet valamennyire mégis észlelni a vérnyomás vagy a vércukorszint változásait, pontosabban az ezek által keltett állapotváltozást). Az emocionális hatások – mivel specifikus percepció nem kíséri őket, mint a külső eredetű vagy a proprioceptív ingerek esetében – gyakran elkerülik a figyelmet, hatásukat általában a közérzet szóval szoktuk leírni. A közérzet lényegében a belső eredetű, zsigeri információk összesített mintázata, illetve az ezt kísérő általános emocionális állapot: azt észleljük, hogy valami bennünk kellemes vagy kellemetlen, de azt nem, hogy az valójában mi is.
13.5. ábra. A bőr területeinek megoszlása a gerincvelő szakaszai, illetve azon belül az egyes szegmentumok szerint. a) A gerincvelő négy fő szakasza (nyaki, hát-hasi, deréktáji és keresztcsonti), benne az egyes szegmentumokkal. b) A bőrterületek megfelelő elosztása. c) Annak bemutatása, hogy az egyes szegmentumokhoz tartozó bőrterületek átfednek (Rosenzweig et al. 2002 nyomán) A zsigeri ingerek diffúz jellege a zsigeri fájdalomban is tükröződik. A pontszerű, időben és térben jól körülhatárolható viszcerális eredetű fájdalom ritka; fekélyek, szöveti károsodás, belső sérülések okozhatnak 282 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom ilyeneket. A receptorok diffúz és viszonylag szórt elhelyezkedése és a károsító ingerek elmosódott hatása miatt a zsigeri fájdalom általában diffúz és bizonytalan; sem kezdete és vége, sem kiterjedése és lokalizációja nem állapítható meg pontosan. Végül számos olyan zsigeri károsodás létrejöhet, ami önmagában sosem éri el a tudatot, de hatására nem fájdalmas, proprioceptív ingerek okoznak fájdalompercepciót. Ez esetben úgy észleljük, mintha az adott bőr- vagy izomterület fájna, holott a fájdalom valamely belső szervből származik; ezt nevezik referált vagy áttolt fájdalomnak. Az észlelt fájdalom ugyanabban a gerincvelői szelvényben (szegmentumban) jelenik meg, ahová a zsigeri afferens is befut; az egyes zsigerek ily módon jellegzetes mintázattal vetülnek a testfelületre: ezeket nevezik Head nyomán dermatomáknak (Head 1920; 13.5-6. ábra). A zsigeri fájdalom tehát nehéz diagnosztikai feladatot jelent az orvosnak, és nem is mindig sikerül felismerni.
13.6. ábra. A belső szervek képviselete az adott dermatomán (egyszerűsített vázlat) Fájdalom A fájdalom tekinthető egyfelől egy speciális érzékfajtának, másfelől élettani jelenségnek, de tekinthető pszichés eseménynek is. Ez a sokszínűség gyakran okoz zavart a fájdalmat tárgyaló publikációk egy részében, mert nem mindig derül ki világosan, melyik folyamatról van éppen szó. Ezen a zavaron segíthet, ha az egyes részjelenségeket eltérően nevezzük el. A fájdalomingerek hatására létrejövő érzőfolyamatokat nevezik nocicepciónak, a fájdalom pszichés folyamatait fájdalomélménynek, a kettő együttes hatására kialakuló élettani folyamatokat pedigfájdalom reakcióknak . A fájdalomélmény kialakulásának feltétele a nocicepció (lásd alább), de nem minden nociceptív esemény vált ki fájdalomélményt. A fájdalom kialakulásának – és egyben a fájdalomélmény keletkezésének – három aspektusa (dimenziója) van (Melzack 1977, Price 1988): • szenzoros-diszkriminatív, amely a fájdalominger tulajdonságainak, jellemzőinek észlelését jelenti (például hogy egy injekciót hova kaptunk, mennyi időbe telt, amíg beszúrták és kihúzták a tűt, mekkora területet feszít a beadott folyadék, esetleg milyen az adott oldat hőmérséklete); • affektív-motivációs, amely a fájdalmat kísérő, általában negatív élményeket és az azokból eredő, az inger elhárítására, megszüntetésére, elkerülésére irányuló vágyat foglalja magában (lényegében tehát azt, hogy injekciót kapni nem jó, az kellemetlen hatású, vagy hogy csíp-e); és – kognitív-értékelő, amely a fájdalomélmény keletkezésébe beépíti a tapasztalatokat, a korábbi fájdalomélmények emlékeit, a tanult fájdalmi folyamatokat, továbbá az elvárást, illetve a kulturálisan meghatározott jellemzőket (például az injekciós fecskendő és tű látványa nyomán elvárjuk a keletkező fájdalmat). A fájdalom maga tehát igen bonyolult jelenség, ezt tükrözi a Nemzetközi Fájdalomkutató Társaság (IASP) bizottsága által alkotott definíció is (Merskey 1975): „A fájdalom egy kellemetlen szenzoros és emocionális élmény, amely aktuális vagy potenciális szöveti károsodással kapcsolatos, vagy annak terminusaival írható le. ” A meghatározás több, a fájdalom aspektusaira vonatkozó utalást tartalmaz. Először is azt, hogy a fájdalom egy érzet, azaz szenzoros természetű, megértését tehát ezzel kell kezdenünk. Másodszor, a fájdalom fontos eleme annak élményjellege. Ez az élmény, tehát egy olyan pszichés esemény (is), amely minden egyes személyben egyedi és saját, mások számára közvetlenül nem hozzáférhető, szubjektív. A fájdalomnak ez a jellemzője hasonló az emocionális élményhez, amely szintén egyedi és szubjektív, és aminek valószínű oka az, hogy a fájdalomélmény maga tekinthető egy sajátos emocionális élménynek (affektnek) is. Harmadszor, noha a fájdalom gyakran szöveti sérülés vagy károsodás, esetleg arra irányuló behatás (potenciális károsítás, például egy forró objektum futólagos megérintése) következménye, enélkül is keletkezhet fájdalomélmény (amit viszont többnyire a szöveti sérülések leírására használt fogalomrendszerrel tudunk csak kifejezni). Mint látni fogjuk, 283 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom fájdalom pszichés úton, illetve szociális kapcsolatrendszerben is keletkezhet, sőt úgynevezett allegorikus formában is megjelenhet (tehát analógiaként, szimbolikusan is használjuk a fájdalommal kapcsolatos fogalmakat; példul azt mondjuk: fáj a szívem érte).
1.4. Nocicepció A kifejezés a latin noxa szóból származik, ami kártételt, illetve sérülést jelent; a nocicepció tehát a károsító jellegű ingerek érzékelését jelenti, erre utal a kifejezés második része. Arról nincs teljesen egységes vélemény, hogy a nocicepció önálló érzékfajtának (modalitás) tekinthető-e, vagy csak más modalitásba tartozó receptorok fokozott működése révén alakul ki, de mivel találtak olyan receptorokat, amelyek csak igen erős, valóban károsító jellegű ingerek esetében kerülnek ingerületbe, a nocicepció mint önálló modalitás létét érdemes elfogadni. A nociceptív ingerület keletkezése nem egyértelmű függvénye az inger erősségének, abban más paraméterek is szerepelnek. Egy 40 °C körüli hőmérsékletű fémtárgy a bőrhöz érintve kellemes melegérzetet kelt, ha átmérője 20 mm, éles, igen kellemetlen fájdalmat, ha átmérője 2-5 mm, míg elviselhetetlen, szúró fájdalmat, ha átmérője 1 mm körüli. A keletkező érzet nagysága függ az ingerlés időtartamától, valamint a kontextustól is. Az ingerület kialakulásában az idegvégződésekből felszabaduló irritáns, illetve gyulladáskeltő anyagok is részt vesznek, ezek a végződéseket túlérzékennyé is tehetik. Ezt nevezik perifériás érzékenyítésnek vagy szenzibili- zációnak, aminek következtében kisebb intenzitású ingerek is ingerületbe hozzák a nociceptorokat. A későbbiek megértése érdekében fontos megjegyezni, hogy a perifériás érzékenyítés arra a területre korlátozódik, ahol a sérülés bekövetkezett; ezzel szemben a centrális (központi) érzékenységnövekedés nagyobb területekre, akár az egész testre vonatkozóan okoz túlérzékenységet (lásd alább).
16.7. táblázat NOCICEPTOROK A nociceptorok, tehát a károsító ingerek felfogására és idegrendszeri kódolására specializálódott receptorok általában szabad idegvégződések, amelyek sejtteste a hátsó gyöki ganglionokban van (tehát még a periférián), rostjai pedig a legkülönfélébb szövetekben, a bőrben, a nyálkahártyákban, mély hártyákban, zsigeri szervek kötőszöveteiben, szalagokban és ízületi tokokban, csonthártyákban, izmokban, inakban és a vérerek falában végződnek. Vannak közöttük olyanok, amelyek rece- pív mezője pontszerű, másoké kiterjedtebb, gyakran átfedő, szélei néha diffúzak. A receptív mező kiterjedése és alakja időben is változik, illetve függ az inger erősségétől is. A nociceptív ingerek felfogására három lehetőség van: • intenzitásfüggő recepció, amikor egy adott receptor gyengébb ingerek esetén az adott modalitásra jellemző érzetet, erősebb inger esetén fájdalomérzetet (pontosabban nociceptív ingerületet) kelt; • mintázatfüggő recepció, ahol több, eltérő küszöbű, de azonos modalitásba tartozó receptor létezik, és nociceptív ingerület akkor keletkezik, ha az alacsony és a magasabb küszöbű receptorok egyidejűleg kerülnek ingerületbe; és • specifikus recepció, amelynek során speciális, csak a károsító jellegű ingerek felvételére szolgáló, magas küszöbű receptorok ingerületbe kerülése generálja a nociceptív ingerületet. Valószínű, hogy mindhárom mechanizmus működik, más-más helyeken persze: a bőrben valószínűleg mindhárom előfordul, a zsigerek falában főleg az első és a második, míg az üreges szervek falában valódi, specifikus nociceptorokat is találtak. Nociceptív ingert elsősorban mechanikai és hőhatások keltenek, de bizonyos kémiai anyagok is kiválthatják.
1.4.1. A fájdalomingerek továbbítása A nociceptív ingerületet vezető idegrostok igen vékonyak, ezért meglehetősen lassan vezetnek. Az A b (ejtsd: adelta) típusú rostok velőshüvellyel rendelkeznek, és kb. 15-25 m/s sebességgel terjed rajtuk az ingerület, a C rostok nem rendelkeznek velőshüvellyel sem, ezek a szervezet leglassabban – 0,5-2 m/s sebességgel – vezető idegrostjai. Részben ez felelős azért, hogy a fájdalomérzet keletkezése az ingerhez képest jelentős késleltetéssel alakul csak ki. Az A§ rostok a valós idejű, akut jellegű hatásokat közvetítik (például ha valaki megszúrja a kezét egy tűvel), a C rostok az elhúzódó, különféle érzőminőségekben jelentkező ingerek továbbításában vesznek részt (gyulladásos, illetve hőingereket is továbbítanak; nevezik őket polimodális receptoroknak is, lásd fentebb). 284 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom A gerincvelői és nociceptív hálózatok jellemző sajátossága, hogy tartós ingerlés, többféle nociceptív bemenet, illetve bizonyos magasabb idegrendszeri folyamatok hatására a gerincvelői sejtek érzékenysége növekszik; ezt nevezik gerincvelői vagy centrális hiperszenzitivitásnak. A fokozott érzékenységnek kétféle következménye lehet (bár a kettő mechanizmusa nem teljesen azonos): 1. hiperalgézia: azaz fokozott fájdalomérzékenység: már viszonylag kis intenzitású nociceptív ingerek is erős fájdalomérzetet keltenek; valamint 2. allodínia: nem nociceptív ingerek, tehát egyszerű nyomás vagy dörzsölés is keltenek fájdalomérzetet. A túlérzékenység minden formája lényegében patológiásnak tekinthető, hiszen vagy nagyobb a fájdalomérzet az indokoltnál, vagy akkor is keletkezik fájdalomérzet, ha nincs rá ok. Ezért a fájdalomterápiák egyik fontos célja a túlérzékenység megelőzése, illetve, ha már kialakult, gyors csökkentése.
16.8. táblázat FÁJDALOM ES INGERÜLET Az elsődleges érzősejt a periférián a hátsó gyöki ganglionban van, ennek axonjai lépnek be a gerincvelőbe, illetve a nyaki-feji régióban a nyúltvelőbe. A fájdalompályákról először Descartes dolgozott ki elképzelést (Descartes 1644), híres ábrája sokáig uralta a pszichofiziológiai gondolkodást.
A gerincvelőbe lépő rostok a hátsó szarvi neuronokkal képeznek szinapszist, innen azután többféle úton is haladhat az ingerület: közvetlenül a mozgató- és vegetatív motoros neuronokhoz (ez képezi az elsődleges nociceptív reflexek anatómiai alapját), az azonos vagy szomszédos szegmentumban lévő más neuronokhoz, továbbá a központi idegrendszer más területeihez (felszálló rostok). A specifikus nociceptív neuronok csak károsító ingerekre reagálnak, a széles dinamikus tartományú neuronok nociceptív és más természetű ingereket egyaránt fogadnak, míg a nem nociceptív neuronok csak más természetű ingerekre reagálnak. Az ingerület átadásában serkentő aminosavak (főleg glutamát), illetve neuropeptidek (elsősorban P-anyag) vesznek részt, de más transzmitterek is előfordulnak (utóbbiak inkább módosító hatásúak). A nociceptív ingerek gerincvelői továbbításával kapcsolatban Wall és Melzack dolgozott ki általános elképzelést, amely – kisebb módosításokkal – máig is elfogadott (Melzack 1977, Wall 2003, Bárdos 2006). Elképzelésüket kapuelméletnek, pontosabban a „fájdalomtovábbítás gerincvelői kapukontrollmechanizmusának” szokták nevezni (13.7. ábra). Ennek lényege az, hogy a nociceptív jellegű, a vékony idegrostok által közvetített no- ciceptív ingerületen kívül a vastagabb, testérző (szomatoszenzoros) rostok ingerülete is beleszól abba, hogy továbbítanak-e a gerincvelői vetülő (projekciós, más néven transzmissziós) sejtek fájdalomingert az agyi fájdalomközpontok felé; ez utóbbi a feltétele a valódi fájdalomérzet keletkezésének. Az előbbiek (vékony rostok) nyitják, az utóbbiak (vastag rostok) zárják a kaput, a továbbított ingerület nagysága a kétféle ingerület erősségének arányától függ: mennél több a károsító hatás az adott területen, annál nagyobb a továbbított inger nagysága. Ez a mechanizmus biztosítja azt, hogy csak valódi károsító hatások okozzanak fájdalmat, másfajta beérkező ingerek viszont ne. A vastag rostok kaput záró hatása az oka annak, hogy nagy felületű mechanikus vagy hőingerek (dörzsölés, borogatás, alkalmasint ütögetés) csökkenthetik a fájdalom mértékét, és ugyanennek a hatásnak a hiánya játszik szerepet a neuropátiás és neuralgiás fájdalom kialakulásában is (az előbbi esetben a vastag rostok elsorvadnak, például cukorbetegségben vagy bizonyos gyógyszerek hatására; az utóbbi pedig a rostok gyulladásos eredetű, például vírusos megbetegedéséből származik). Minden ilyen esetben erős, hosszan tartó, gyakran csillapíthatatlan fájdalom a következmény (Bárdos 2006). Agerincvelőben lévő transzmissziós neu- ronok rostjai több különböző pályán haladnak az agy felé, ahol végső állomásuk minden esetben a talamusz (Almeida et al. 2004). Innen az információ az úgynevezett agyi fájdalommátrix (13.8. ábra) különböző részeibe halad, amely egy laterális (oldalsó) és egy mediális (középső) részre oszlik; az előbbi főleg a szenzoros-diszkriminatív, az utóbbi inkább az affektív-motivációs, illetve kognitív-értékelő aspektusok feldolgozásáért felelős. A két rendszer
285 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom összeköttetésben van egymással, ez biztosítja, hogy a fájdalom aspektusai együttesen alakuljanak ki (Bárdos 2006).
13.7. ábra. A fájdalomkapu-mechanizmus vázlatos rajza. A nociceptív ingert az agy felé továbbító (T) sejteket a vékony és a vastag rostok is izgatják (+), míg ezt a hatást a hálózati sejtek (HS) gátolni képesek (-). Ez utóbbiak a gerincvelő hátulsó részén található, idegsejthálózatot képező állomány (substantia gelatinosa) neuronjai. A kritikus pont a befutó rostok kapcsolata a hálózati sejtekkel, amelyeket a vastag rostok aktiválnak (így nem jut el a befutó ingerület a T sejtekre a HS sejtek gátló hatása miatt), míg a vékony rostok gátolnak (így ingerületük továbbítását a HS sejtek nem akadályozzák, a T sejt fájdalomingert továbbít). Ebből az is következik, hogy a vastag rostok ingerlésével gátolható vagy legalábbis csökkenthető a továbbított fájdalominger nagysága. A kapu nyitását, illetve zárását az agyból leszálló, gyors vezetésű idegrostok is befolyásolják, amelyek egy azonnali kognitív értékelés eredményeit közvetítik
13.8. ábra. Az agyi fájdalommátrix egyszerűsített sémája Az agyi fájdalommátrix elemei mellett járulékos területek is aktiválódnak a fájdalomingerek hatására. A mozgatóterületek (pl. kisagy, mozgató agykéreg) működésének fokozódása valószínűleg a fájdalomreakciók szerveződésével kapcsolatos, ezek motoros komponenseinek kialakításában vesznek részt, míg az úgynevezett periakveduktális szürkeállomány a belső fájdalomcsillapító mechanizmusok központja (lásd alább). A fájdalom kialakulásában kulcsszerepet játszik a figyelem. A figyelem fókuszálása a nociceptív ingerforrásra erősíti mind az affektív, mind a kognitív folyamatokat, elterelése viszont erősen csökkenti a fájdalomérzet nagyságát. Fontos felismerés az is, hogy a nociceptív ingerek, különösen, ha erősek, általában megváltoztatják, gyakran meg is szakítják az éppen folyó pszichés folyamatokat, és többnyire magukra vonva a figyelmet, a kognitív és érzelmi működés középpontjába helyeződnek. Egy valamelyik végtag sérüléséből eredő fájdalomhullám hatására abbahgyjuk az evést, és a fájó terület dörzsölgetésével kezdünk foglalkozni; amíg a fájdalom nem csökken, az evést nem is tudjuk folytatni. A keletkező fájdalomérzet nagyságát a figyelmen kívül befolyásolja a téri, illetve időbeli szummáció (a különböző helyen, illetve időben érkező ingerek hatásának összeadódása), valamint a bemenet hatására aktiválódó memóriafolyamatok (korábbi hasonló hatások emlékképeinek tudatba kerülése) is. 286 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
1.4.2. A fájdalom efferens módosítása A nociceptoros ingerek továbbítása nemcsak a perifériás és gerincvelői folyamatoktól függ, hanem agyi eredetű leszálló (efferens jellegű) hatások is befolyásolják. Már a kapuelmélet is feltételezte, hogy a nyitási-zárási folyamatokat egy igen gyors vezetésű agyi leszálló rendszer módosítja, mely utóbb valóban létezőnek bizonyult. A nociceptív ingereket szállító, gerincvelőbe futó rostok oldalágai közvetlenül az előagyba futva aktiválnak egy gyorsan vezető leszálló rendszert, amelynek rostjai a kapurendszeren végződnek. Ez a hurok egy gyors kognitív feldolgozás eredményét közvetíti, amely valószínűleg a korábbi tapasztalatok, illetve aktuális elvárások segítségével módosítja a fájdalomingerek beérkezését. Ha tehát az adott környezetben már korábban előfordult inger éri a szervezetet (gondojunk például az iskolai oltások helyszínére), az emléknyomok aktiválása nyíthatja a kaput, az eredmény egy fokozott fájdalomélmény lehet. A kapufolyamatok azonban csak az egyik célpontját képezik a leszálló hatásoknak. Agyi eredetű rostok már a kapurendszer előtt, a nociceptív ingereket szállító idegpályákon, illetve az azokat fogadó elsődleges neuronokon is végződnek, és közvetlenül befolyásolni képesek a nociceptív ingerület bejutását a központi idegrendszerbe (tehát azok – adott esetben – el sem érik már a kapukat). A legjelentősebb leszálló rendszer a III. agykamra és az abból kiinduló agyvezeték (akveduktusz) alját borító sejtrétegből (periakveduktális szürkeállomány) indul ki, és erős fájdalomcsillapító hatású. Valószínűleg ez a legerősebb belső fájdalomcsökkentő idegpálya, amely endogén opioidokkal (belső eredetű, morfinszerű anyagokkal) működik, és a fájdalomrostokról a hátsó szarvi neuronokra való ingerületáttevődést gátolja a gerincvelőben. Ez tehát azt jelenti, hogy a nociceptív ingerek nem vagy erősen csökkentett mértékben érik el a gerincvelői kapurendszert, és következésképpen kevésbé aktiválják a fájdalomingereket továbbító transzmissziós sejteket is. Ennek eredményeként nem vagy sokkal kisebb mértékben keletkezik fájdalomélmény; ezért beszélhetünk belső fájdalomcsillapító hatásról. A periakveduktális szürkeállomány a teljes fájdalommátrixszal kapcsolatban van, tehát nemcsak a perifériát érő nociceptív ingerek, hanem az agyi fájdalomfeldolgozó mechanizmusok is aktiválni tudják. Ez utóbbi kapcsolat lehet felelős például a kognitív úton, a placebohatással vagy a hipnózissal kiváltott fájdalomcsökkentésért. Leszálló hatások az agytörzs különböző más részeiről is indulnak, amelyek elsősorban limbikus eredetű hatásokra (például az amygdalából érkezhet ilyen hatás) aktiválódnak. Ezek között nemcsak gátló, tehát fájdalomcsillapító, hanem serkentő, vagyis fájdalomfokozó hatásúak is vannak. Az agytörzsi eredetű leszálló rendszerek egy része működik csak opioidokkal (amelyek többnyire fájdalomgátló hatásúak, és az úgynevezett narkotikus leszálló rendszert alkotják), a többi nem opioid jellegű, többnyire szerotonin, orexin, noradrenalin vagy dopa- min az átvivőanyaguk (ezeket nevezik nemnarkotikus leszálló rendszereknek). A leszállópályák egy része a hátsó szarvi neuronokon, más része a nociceptív pályák későbbi állomásain végződik, és ezek felelősek az agyi eredetű érzékenységfokozódás (hiperszenzitivitás) és az ennek következtében létrejövő fokozott fájdalomérzet (hiperalgézia és allodínia) kialakulásáért.
1.4.3. A fájdalom leírása és kulturális vonatkozásai A fájdalom leírására szolgáló szókincsünk meglepően szegényes, a klinikai tapasztalatok szerint is a betegek többségének problémája van a fájdalommal kapcsolatos tünetek elmondásában. Az ílyen kifejezéseink többsége erőszakos cselekményekre utal (szúró, égető, fojtogató, metsző stb.). A jelen-ség oka valószínűleg az, hogy ritkán van, és főleg evolúciós és kulturális fejlődési szempontból ritkán volt szükség a fájdalom pontos leírására, hiszen a fájdalom funkciója nem elsősorban ez, hanem a megfelelő viselkedés kialakítása. Ezért – jobb híján – korábbi tapasztalataink, illetve tanult vagy más módon szerzett (pl. olvasmányok, filmek) ismereteink alapján próbáljuk meg a leírást. Ez ismét csak hasonlít az emóciók leírásának nehézségeire, ami újra csak aláhúzza a fájdalomélmény emocionális jellegét. A kifejezések, illetve a leírás pontossága a fájdalom jellegétől és erősségétől is függ. Minél erősebb a fájdalom, annál pontosabb a leírás, a bőr-, illetve izomfájdalmak leírása pontosabb, mint a mélyfájdalomé, a legkevésbé pontos (sőt gyakran teljesen bizonytalan, esetleg nem zsigeri területeken jelentkező) a zsigeri fájdalomé. Melzack és Torgerson (1971) szerint a kifejezések lehetnek érzékelési (pl. időbeliség, erősség, ingermodalitás – pl. lüktető, felvillanó, szúró, égető, tompa), indulati (érzelmi, büntetésre utaló, feszültséget vagy vegetatív változást jelző – pl. idegesítő, fárasztó, émelyítő, félelmetes, kegyetlen), illetve értékelő (szenvedést leíró, elviselhetőséget jelző – pl. enyhe, rettenetes, komisz, kibírhatatlan) jellegűek. A leírás pontosságát kulturális hatások is torzítják, egyes etnikumok (pl. a déli népek) felnagyítják, mások (pl. az északiak) bagatellizálni igyekeznek az élmények visszaadását.
287 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom Ami a kulturális különbségeket általánosságban illeti, a nociceptív ingerek érzékelésében nem találhatók lényeges eltérések, vagyis az alapvető fájdalmi mechanizmusokat a kulturális hatások kevéssé befolyásolják; ez még a kapumechanizmust kontrolláló gyors kognitív rendszerre is többé-kevésbé igaz. Jelentős eltérések mutatkoznak azonban a fájdalomtűrésben, illetve a fájdalmi reakciók megjelenésében. Minthogy ez utóbbi függ a fájdalom Jelentésétől” (ti. attól, hogy a fájdalmas inger a károsító hatáson kívül másról, például egy kellemetlen helyzetről vagy veszélyes környezetről is hordoz-e információt), az adott kontextustól, az egyéni tapasztalatoktól és az elvárásoktól is, a szociokulturális szokások, kulturális sztereotípiák hatása jól érvényesülhet. Érdekes, hogy ebben a vonatkozásban csak mesterséges laboratóriumi helyzetekből származó adatok állnak rendelkezésünkre, szisztematikus, tudományos vizsgálatot természetes körülmények között ez idáig nem nagyon végeztek. Az inkább anekdotikus jellegű kulturális antropológiai leírásokból azonban az mégis egyértelműen megállapítható, hogy vannak általános különbségek (pl. a szülés közbeni fájdalmi kommunikációban), és vannak speciális eltérések is. Ez utóbbiak többnyire kiemelt jelentőségű, alaposan előkészített életeseményekkel kapcsolatosak (pl. beavatási szertartások), és igen gyakran valamilyen drog adásával (kábító- és/vagy ajzószerek, fájdalomcsökkentő hatású teák, szesztartalmú italok stb.) is kiegészítik a kultrális hatást. Az antropológiai és viselkedési megfigyelések egyaránt arra utalnak, hogy a fájdalom értékelése, sőt bizonyos mértékig az affektív komponensek is tanulhatók, illetve a reakciók tanulással módosíthatók. Egy alapvető mintát valószínűleg mindenki gyermekkorában sajátít el, amelyet azután az egyéni tapasztalat, különösen a jelentősebb életesemények, módosíthatnak. Az alapminta kialakulásában kiemelt jelentőségű a család, elsősorban a szülők hozzáállása, amely szinte imprintingszerűen vésődik bele a fejlődő idegrendszeri hálózatba. Ez az alapminta akkor is megmarad, ha az egyén más kultúrkörnyezetbe kerül, noha az új környezet módosíthat rajta.
1.4.4. A fájdalom kialakulása, a fájdalmi reakciók Kimondott fájdalomérzet csak egy meghatározott küszöbérték felett jön létre, kellemetlen élmények azonban ennél gyengébb, de károsító jellegű ingerek esetén is kialakulhatnak. Ezt a testérzékelés három szintje segítségével érthetjük meg: - testérzet (szomesztézia), amely a fiziológiás ingerek estében alakul ki (lásd fentebb); • köztesérzet (metesztézia), amely bizonytalan, többnyire – de nem kizárólag – kellemetlen belső élményeket takar, a keletkező kellemetlen érzetet nevezhetjük diszkomfortnak (a kellemeset esetleg komfortnak?); • fájdalomérzet (algesztézia), amikor valódi fájdalomélmény alakul ki. Az egyelőre nem eldöntött kérdés, hogy itt diszkrét érzékfajtákról vagy egy folytonos tartományról (kontinuum) van-e szó, de a pszichofiziológiai elemzések inkább ez utóbbira utalnak. A nociceptív inger hatása a receptorokon három lépcsőben érvényesül: 1. az inger eléri és ingerületbe hozza a receptort; 2. a sérült sejtekből és az ingerelt receptorokból különböző kémiai anyagok szabadulnak fel; 3. a felszabadult anyagok hatására helyi vérbőség és duzzadás (tumor), hőmérséklet-emelkedés (calor) és pirosság (rubor) alakul ki, illetve létrejön a fájdalomérzet (dolor). Az ezt követő időszakban – az ingerületvezetést, illetve -feldolgozást magában foglaló késleltetés után – kialakul a viselkedési reakció, melynek egyes elemei is sorban jelennek meg: megrezzenés és arousalnövekedés, orientáció és felderítés, figyelem, izomreakciók, védelmi pozíció felvétele és védelmi akciók, zsigeri reakciók, endogén fájdalomcsillapító anyagok felszabadulása, végül a tudatos élmény keletkezése és (ember esetében) esetleg verbalizálása. A fájdalmi reakció nagysága és kiterjedése függ az inger jellegétől, valamint a belső állapottól is (Wall 2003). Pontszerű sérülések (pl. tűszúrás) többnyire csak helyi reakciókat indukálnak, míg a kiterjedtebb károsodás (pl. rándulás, nagy felületű sérülés, törés, belső szervek elváltozása stb.) az egész szervezetet érintő viselkedési választ generálnak. Érdemes itt is megjegyezni, hogy a reakció nem mindig arra a területre irányul, ahol az inger valójában érte a szervezetet; különösen igaz ez a zsigeri hatások esetében, ahol a fájdalom gyakran az azonos gerincvelői szegmentum által beidegzett bőr- vagy izomterületre vetül (referált vagy áttolt fájdalom; 13.9-10. ábra; Ádám 1998, Bárdos 2003).
288 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
13.9. ábra. A belső szervek vetülése a testfelületre – elülső testfél
13.10. ábra. A belsõ szervek vetülése a testfelültere – hátsó testfél Ha az inger rövid, az ingerület és az agyi aktivitás is rövidesen lecseng, ha azonban a károsító hatás tartósan fennmarad, mint helyi gyulladás vagy mélyebb sérülés esetében, az idegi hálózatok reakciómintázata átalakul. A hosszabban fennálló inger perifériás vagy centrális szenzitizációt indukálhat, ami az idegsejtek fokozódó érzékenységét jelenti. Ha helyi gyulladás is kialakul a receptorok körül, azok túlérzékennyé válnak (hiperszenzitivitás), aminek következtében gyengébb ingerek is erős fájdalmat keltenek, ezt nevezik elsődleges hiperalgéziának. Ha kiterjedt felületet ért a sérülés (pl. égés, horzsolás stb.), a központi fogadó neuronok is túlérzékennyé válnak, ilyenkor a környező területek ingerlése is erős fájdalmat okoz, ez a másodlagos hiperalgézia. Végül, ha a sérülés perifériás idegrostokat érint (pl. neuropátiákban), akkor nem fájdalmas jellegű behatások, vagyis szokásos ingerek (nyomás, dörzsölés, esetleg az egyszerű érintés) is fájdalmat keltenek, ez az allodínia. A hiperszenzitivitás, hiperalgézia és allodínia a patológiás fájdalomjelenségek körébe tartoznak, hiszen a fájdalom tartós, többnyire már nem indokolt fennmaradását, illetve az indokoltnál sokkal intenzívebb fájadalmat okoznak,
289 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom és számos kórkép vezető vagy járulékos tünetét képezik. Mivel túlérzékenységet az agyból leszálló rostok is létrehozhatnak, patológiás fájdalom pszichés úton is keletkezhet (lásd alább). A fájdalom fennmaradása különböző időtartamot ölelhet fel, eszerint van: • akut fájdalom (maximum 6 hét), • tartós (félakut) fájdalom (6 héttől 6 hónapig), • krónikus fájdalom (6 hónapnál hosszabb), • krónikus periodikus fájdalom (többször visszatérő fájdalmas epizódok), - krónikus progresszív fájdalom (6 hónapnál hosszabb, állandóan fokozódó jelleggel). A természetes úton keletkező fájdalomtól megkülönböztetendő az indukált fájdalom, amikor laboratóriumi vagy kísérleti körülmények között, mesterségesen alkalmazott ingerekkel váltanak ki fájdalmat. Ebben a helyzetben a vizsgált személy többnyire tisztában van azzal, hogy nincs aktuális veszélyhelyzet, továbbá hogy az ingerlés bármikor megszakítható. Emiatt a fájdalom keletkezésének számos eleme, például a váratlanság, az erős emóciók, a memórianyomok aktiválása, a kontextuális tényezők stb. egészen mások, vagy még inkább hiányoznak, ezért a keletkező fájdalom, amit ráadásul általában már előre lát a vizsgálati személy, sokkal kisebb és kevésbé félelmetes is. Ezekkel a különbségekkel érdemes tisztában lenni, hiszen a fájdalomra vonatkozó adatok jelentős része indukált fájdalmi helyzetből származik, ezért klinikai relevanciája korlátozott. A fájdalmi helyzetekben kialakuló reakció többféle lehet (Wall 2003): • a fájdalomfenyegetésre adott válasz (pl. elhúzódás, összegörnyedés), • a károsító ingerre való reakció az ingerlés helyén (az inger eltávolítása, az esetleges seb összenyomása, a sérült felület nyalogatása), • a fájdalomélmény kiváltotta reakció (dörzsölés, jajgatás, sírás, a végtag rázogatása, ütögetése). Ezek nemcsak időben és térben eltérőek, hanem mechanizmusuk is különbözik: a fenyegetésre adott válasz tisztán kognitív úton keletkezik, és külső objektumra irányul, vagy ahhoz viszonyul; a közvetlen ingerre adott válasz többnyire reflexes jellegű, és közvetlenül követi a károsító hatást; míg a fájdalomélmény által keltett válasz jelentős késleltetéssel alakul ki, az egész rendszert érinti, és gyakran jelentős belső komponensekkel is jellemezhető. Néhány, a fájdalomválaszra jellemző viselkedésmintázat: • az általános aktivitás csökkenése (passzivitás, behúzódás egy védett helyre), • nyugtalanság (ide-oda mozgások, végtagrázás), • testtartási változások (pl. összegörnyedés), • mozgási eltérések (sántítás, oldalazó mozgás, végtag leszorítása), illetve szokatlan mozgásminták (kacsázás, hajlított végtaggal végzett manipulációk, fej suta tartása), • táplálék- és folyadékfelvétel csökkenése (anorexia, anodipszia), • csökkent általános önápolás (grooming) a sérült vagy beteg területre irányuló fájdalomcsökkentő viselkedéssel párosulva (dörzsölés, szorítás, vakarás stb.), • speciális arckifejezések, hangadás (jajgatás, nyöszörgés, szitkozódás), • érzelmi reakciók (pl. visszahúzódás vagy éppen agresszió). A viselkedési mintázat a fájdalom jellegétől és tartamától is függ, akut fájdalom esetén más, mint krónikus esetben; ennek diagnosztikus értéke is lehet. Az akut fájdalommal együtt járó viselkedésmintázat elsősorban izgal- mi-szorongó jellegű, krónikus fájdalomban inkább passzív-depresszív karakterű.
290 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
1.4.5. A tartós és a krónikus fájdalom A fájdalom alapvető funkciója a riasztás, a szervezet számára ez jelzi, hogy a működésben valamilyen súlyos, károsító vagy azzal fenyegető esemény történik. Ez a funkció azonban csak az akut fájdalom esetén értelmes, a több hónapig vagy éppen évig megmaradó fájdalomhoz ilyen funkció általában nem rendelhető, a krónikus fájdalmat ezért mindenképpen kórosnak kell tekinteni. A hosszan fennálló fájdalom a figyelem állandó magához vonzásával zavarja a normális pszichés működést, ami fokozza a fájdalomérzetet, még jobban magára irányítja a figyelmet, és kialakul egy ördögi kör (Almeida et al. 2004, Wall 2003). E kör megszakítása (pl. relaxációval, kondicionálással vagy ellenkondicionálással, hipnózissal, mozgásterápiákkal stb.) hatékonyan csökkenti, gyakran meg is szünteti a krónikus fájdalmat. A hosszú tartamú fájdalomkórképek abban is eltérnek az akut fájdalomtól, hogy egészen mások a viselkedési velejáróik. A fokozott szorongás, erős izgalmi állapot, az intenzív zsigerműködés helyett egy passzív, depresszív jellegű, visszahúzódó és alacsony energizáltságú viselkedés alakul ki, gyakran jön létre az úgynevezett „használatlansági szindróma” is, amikor az adott végtagot vagy testrészt az ember nem használja, ami funkciócsökkenéshez, sőt esetleg sorvadáshoz is vezethet. A krónikus fájdalom lehet kezelhető és nem kezelhető; ez utóbbiak például a rákos vagy idegsorvadás eredetű, illetve a mentális betegségekhez (pl. a depresszióhoz vagy skizofréniához) tartozó fájdalmak (a nem kezelhetőség a fájdalomra magára, és nem feltétlenül az alapbetegségre vonatkozik; ez azt jelenti, hogy a fájdalom közvetlenül nem szüntethető meg, amíg az alapbetegség fennáll). Krónikus fájdalom származhat valamilyen traumából, például balesetből, erőszakos cselekményből (poszttraumatikus fájdalom vagy kauzalgia), vázizom- rendszeri zavarokból (pl. gerinc- és hátfájdalom, fejfájások), műtéti utóhatásokból (pl. rosszul összeforrt sebekből, összenőtt szervek feszüléséből stb. – ez a iatrogén fájdalom), agyi folyamatok zavaraiból (centrális, talami- kus eredetű fájdalom, fantomvégtag-fájdalom), valamint idegműködési zavarokból (neuropátiák, neuralgiák). A tartós és krónikus fájdalmi kórképek kezelését az is nehézzé teszi, hogy ilyen jellegű tünetek szomatizá- ciós rendellenességként, illetve pszichoszomatikus tünetként is kialakulhatnak (Bárdos 2003), ami egészen más megközelítést igényel(ne). Egyelőre még elég nehéz a hosszú tartamú fájdalomkórképek differenciáldiagnosztikája, de vannak már hasznos módszerek az elkülönítésre. További zavaró tényező az, hogy a tartósan fennálló fájdalom szociokulturális megterhelést is jelent, mind a beteg, mind a környezete számára, ami szintén ördögi körbe vonhatja a tünetegyüttest, és hosszú tartamra rögzítheti az állapotot. A krónikus fájdalom kialakulásában számos pszichés tényező szerepét is kimutatták, ez átvezet bennünket a pszichogén jellegű fájdalmi kórképek tárgyalásához.
1.4.6. A fájdalom pszichés tényezői A pszichés tényezők megértéséhez érdemes visszalépni egy pillanatra a pszichofiziológiai szintre. Egy nociceptív inger által kiváltott ingerület nagysága többé-kevésbé egyértelmű függvénye az inger tulajdonságainak, és minden egyes károsító hatás esetében egy konkrét ingerküszöb rendelhető hozzá. Ezt nevezik fájdalomküszöbnek. A fájdalomküszöb meglepően állandónak mutatkozik, mind az egyének, mind a csoportok vonatkozásában, sőt transzkulturális értelemben is (vagyis minden népcsoportban, kultúrában, és azokon belül is minden közösségben, és azok minden egyedében), tehát valószínűleg alapvetően egy biológiai tulajdonság. Van azonban a fájdalom esetében egy másik határérték is, az elviselhetőség határa – ezt nevezik fájdalomtoleranciának. A tolerancia, szemben a küszöbbel, még egyénen belül sem állandó, pláne nem rögzített populációs vagy kulturális szinten. Ahogy korábban már volt róla szó, a toleranciát számos belső-külső környezeti tényező, szubjektív állapotváltozás, kognitív folyamat, illetve szociokulturális hatás és sztereotípia befolyásolja, ezért ebben igen nagy az egyének közti variabilitás. A fájdalomérzet mértéke (fájdalompercepció) és a fájdalominger nagysága között nincs egyértelmű megfeleltetés: a percepció függ az éberségi szinttől (arousal), a szorongás fokától, az esetleges depresszív állapot szintjétől, a figyelemtől, az elvárásoktól és a tapasztalatoktól is, emellett nyílt és rejtett információk (az ingerforrás természete és jellemzői, a hozzájuk tapadó egyéb ismeretek – például egy darázs esetében), valamint kontextuális ingerek (cue-k, elsősorban a környezet jellemző ingerei – az előbbi példánál maradva, egy darázsfészek jelenléte) is befolyásolják. Az említetteken kívül befolyással bírnak még a szuggesztiók, a megküzdési stílus (lásd alább), továbbá az esetleges betegségelőnyök is (tehát hogy a fájdalom megléte a személynek bizonyos szociális előnyöket, például több figyelmet, törődést, feladatok alóli felmentést, részvétet stb. hozhat). A sokféle tényező közül kiemelkedik a figyelem (erről már volt szó korábban), továbbá az elvárhatóság (expektancia, illetve anticipáció).
291 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom A pszichés folyamatok magasabb szinteken is érintik a fájdalom percepcióját. Központi struktúrák közvetítésével hat a szorongás, amely a fájdalomérzés egyik leghatékonyabb modulátora. Fontos a kognitív stílus (a gondolkodásifolyamatok, a problémamegoldó képesség milyensége), továbbá a személyiségjellemzők közül a szomatizációs hajlam, a katasztrofizálás és a hipervigilancia. A szomatizáció olyan tünetek megélését jelenti, amelyek a valóságban nem léteznek, és tévesen tulajdonítja őket a személy valamilyen betegségnek; a tünetek gyakran a másként nem megmutatható belső problémák kifejezésére szolgálnak (például a derék- és hátfájás számos esete). A katasztrofizá- lás az egyes események – adott esetben a fájdalom – eltúlzott értékelését, a következményektől való irreálisan erős félelmet jelenti (például egy izomrándulás esetén az adott végtag rákos elfajulásától való félelem), míg a hipervigilancia a túlzott, már igen gyenge ingerekre is erős reakciót produkáló válaszkészséget jelent (kis fájdalom esetén is erős jajgatást, sírást, félelmet). A fájdalommal kapcsolatos pszichés jelenségek egy másik körét alkotja a fájdalommal való megküzdés. Ez magában foglal kognitív stratégiákat éppúgy, mint viselkedési stratégiákat, hatékonysága fontos vízválasztó a funkcionális, illetve patológiás fájdalom között. Patológiás irányba tolhatják el a megküzdést a betegek fájdalommal kapcsolatos hiedelmei, továbbá a már említett katasztrofizálás egyaránt. Mindkét jelenség rontja a fáj- dalmi állapothoz való alkalmazkodást, és rögzíti a fájdalmas állapotot. A betegeknek nemcsak magával a fájdalommal, hanem számos, az állapothoz szorosan vagy lazán kapcsolódó egyéb jelenséggel is meg kell küzdeniük, beleértve az egészségügyi ellátás különböző stresszeit, a családi és más szociokulturális státus zavarait vagy a kialakuló – látszólagos vagy valódi – fogyatékosságot (diszabilitást). Mindez gyakran vezet oda, hogy a krónikus fájdalmi betegben depresszív állapot, esetenként valódi depresszió alakul ki, és ezzel együtt – vagy önál-lóan is – félelem alakul ki benne (ez utóbbi különösen gyerekekre jellemző, de a fájdalmi állapotokban gyakran észlelhető regresszió következtében felnőttekben is kialakulhat). Mindez könnyen vezethet jellegzetes betegség-magatartás kialakulásához, amely hosszú időre fixálhatja és a terápiával szemben is ellenállóvá (rezisztenssé) teheti a fájdalmas állapotot (Gallon 1982). Már régóta felmerült, hogy mind a krónikus, mind a pszichés eredetű fájdalom esetleg személyiségfüggő volna. Ennek jellemzésére alkották meg a „fájdalomra hajlamos beteg” (pain-prone patient – PPP) fogalmát (Gallon 1982). Az ilyen betegre jellemző a bűntudatra való hajlam, a fájdalom kifejezésére jól reagáló szocio- kulturális háttér, a szenvedés-legyőzöttség érzése, az erős, kielégítetlen agresszív késztetések, a sajnálat vagy veszteség érzése, továbbá gyakori kockázati tényező a pszichiátriailag is értékelhető hisztériás neurózis és/vagy hipochondria, alacsonyabb intelligenciaszint, a nagy családméret, a testért való aggódás, illetve a rejtett konfliktusok fennállása. Mint minden más személyiségtípus esetén, itt sem dönthető el, hogy konstitucionális (tehát rögzített, beépült) személyiségjegyekről vagy inkább viselkedésmintázatról van-e szó, elképzelhető, sőt valószínű is valamiféle hajlam, kulturális hatások és egyéni életesemények együttes hatásaként létrejövő egyéni reakciómintázat kialakulása.
1.5. A nem nociceptív eredetű fájdalom Számos olyan fájdalmi kórkép ismert, amelyben fizikai sérülés nem mutatható ki, vagy a fájdalom keletkezésének vagy kiteljesedésének idején már nem áll fenn. Ezekre a kórképekre utal az IASP-definíció (430. o.) azon kitétele, hogy a fájdalom „vagy annak [ti. a szöveti sérülések] terminusaival írható le”, tudnillik hogy a beteg úgy számol be a fájdalomról, hogy azt valamely szövet sérüléseként írja le, amit azonban a valóságos helyzet nem támaszt alá. Ha tehát egy élményt a fájdalomra jellemző kifejezések segítségével írunk le, maga is fájdalmi jellegűvé válik, akkor is, ha valódi károsodás nem áll mögötte. Az így képződött élményeket nevezik pszichogén fájdalomnak (Gallon 1982, Merskey 1975). Ha feltesszük, hogy a fájdalom valamiképpen a szervezet működésének integritásában (működési és szerkezeti épségében) bekövetkező zavar jelzése (és nem kötjük magunkat szigorúan csak a fizikai sérülésekhez), akkor a pszichogén fájdalom mint jelző valódi funkcióval bírhat, hiszen a pszichés folyamatokban fennálló zavart jelzi. Ezt erősíti meg az a tény, hogy a pszichogén fájdalmi kórképekben gyakran tetten érhető az agyi fájdalommátrix elemeinek aktiválódása, azaz a pszichés eredetű fájdalom a már törzsfejlődésileg korábbi általános fájdalomérző rendszerre épült rá – tehát a fájdalom affektív-motivációs és kognitív-értékelő aspektusait tekintve valódi fájdalom. A klinikai diagnózis éppen ezért roppant nehéz, hiszen a betegek fájdalomélményeket írnak le, és persze erősen tagadják a pszichés háttérnek még a lehetőségét is (mivel ez utóbbinak erősen pejoratív jelentést tulajdonítanak). Fontos diagnosztikus jegye, hogy a pszichogén fájdalom általában nem ébreszti fel a beteget álmából (szemben a fizikai fájdalommal), általában kétoldali és szimmetrikus, továbbá gyakran állandó vagy éppen nagyon alkalmi (megint csak eltérően a fizikai fájdalomtól, amely többnyire egyoldali, gyakran lüktető és tartósan ismétlődő, jellemző napszakos ritmussal), és gyakran érint egyidejűleg több testtájat is. Jellemzően pszichogén kórkép a migrén, a tenziós (izomfeszülésből eredő) fejfájások, az arcidegzsába, a fibromialgia (megmagyarázhatatlan diffúz
292 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom izomfájdalmak) vagy a derék- és hátfájás számos esete (Wall 2003). Többségük az izomműködés és/vagy a keringési rendszer zavarainak közvetítésével alakul ki. A pszichogén fájdalomban még tetten érhetők élettani részfolyamatok, noha a pszichés tényezők már itt is túlnyomó szerepet játszanak. Vannak azonban olyan fájdalmi jelenségek is, amelyekben semmiféle élettani háttér nem található, csak pszichés jellegű zavar: ilyen a szociális fájdalom (Eisenberg-Lieberman 2004). Ebben az esetben a személyek közti viszony áll a fájdalom hátterében, és valóban csak a terminológia emlékeztet a fizikai fájdalomra. Ez a fájdalmi forma is a centrális fájdalommátrix aktivitását igényli (tehát nem valamiféle képzelt fájdalomról van szó). A szociális fájdalom fő kiváltó oka a szeparáció (az elszakadás érzése). Definíció szerint: a szociális fájdalom egy olyan kellemetlen élmény, amely egy jelentős másiktól vagy egy szociális csoporttól való aktuális vagy potenciális pszichés eltávolodás érzéséből származik. Ez magában foglalja a kötődésből eredő távolságérzetet (ti. azt, hogy elszakadt attól a személytől, akihez szorosan kötődik), de a felnőttek szeparációs érzéseit is (ez lényegében egy adott személyhez vagy közösséghez való tartozás megszűnésének érzése). Valószínű, hogy e fájdalmi formát az emlős- és főleg az emberi fejlődésben mutatkozó erős gondozási kényszer hozta létre az evolúció folyamán, és tartotta fenn mind a mai napig is. A szociális kizáródás erős negatív hatású stressz, jelentős motivációt és érzelmi megterhelést jelent, többek között redukálja az önbecsülést. A szociális, a pszichés és a fizikai fájdalom kölcsönösen facilitálhatják egymás megjelenését, azaz érzékennyé teszik a rendszert a többi fájdalmi forma iránt; ez érthető is, hiszen ugyanazokat a centrális mechanizmusokat aktiválják (centrális szenzitizáció). Végül említést kell tenni az úgynevezett mentális fájdalomról is (Merskey 1975). Szemben az előbbiekkel, ez nem valódi fájdalomjelenség, inkább metaforikus vagy allegorikus kifejeződési forma, amelyet – jobb híján – fájdalmi kifejezésekkel jelenítünk meg (13.11. ábra). Tipikus példája a gyász, amelyet – csakúgy, mint a mentális fájdalom más formáit – fájdalomcsillapítókkal egyáltalán nem lehet enyhíteni.
13.11. ábra. Mentális fájdalom – gyász
1.6. ÖSSZEFOGLALÁS 1. A testérzések fő formái a bőrérzékelés, a mozgásérzékelés (kinesztézia) és a szervérzékelés (viszcerocepció). Szoros kapcsolatban áll velük egy negyedik forma: a károsító ingerek érzékelése (nocicepció). 2. A bőrérzékelés több modalitást foglal magában: mechanikus érzékelés, hőérzékelés, fájdalomérzékelés. A bőrben többféle, részben polimodális receptor található, ezek eltérő folyamatokra érzékenyek. Egy részük gyorsan, más részük lassan adaptálódik, de kialakul a bőringerekre habituáció.
293 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom 3. Az érintés az érzékelés ontogenetikusan első fajtája, igen nagy felületen zajlik; ez a megismerés első eszköze. Az érintés kiemelt jelentőségű a kötődésben és a korai személyiségfejlődés folyamatában. Az érintés mennyisége és elfogadása kulturálisan meghatározott, továbbá szerepe van a vallási rítusokban is. 4. A mozgásérzékelés bemenetét a proprioceptorok adják, melyek az izmokban, inakban, illetve ízületekben vannak, de hozzájárul a bőrérzékelés is. A mozgásérzékelés funkciója a mozgásszabályozás biztosítása, a testtartás, illetve a testrészek egymáshoz való viszonyának monitorozása. 5. A szervérzékelés a zsigerekben szétszórva található viszceroceptorok segítségével jön létre, az ingerület a vegetatív idegekben fut. A zsigeri eredetű ingerek alapvetően a belső szabályozásban vesznek részt, ritkán kerülnek a tudatba. A zsigeri ingerek a viselkedést közvetett úton, állapotérzékelésen, a közérzeten, illetve más folyamatok módosítása révén befolyásolják, de – ritkán – tanulási folyamatokban is részt vesznek. 6. A fájdalom a károsító ingerek hatására vagy a szervezet működésének (beleértve a pszichés folyamatokat is) zavaraira utaló jelzés. 7. A károsító ingerek felvételére szolgáló folyamat a nocicepció, melynek receptorai a nociceptorok. A nociceptív ingerek a gerincvelői kapurendszeren át jutnak az agyba, a kapu nyitását a vastag és vékony idegrostok ak- tivációjának aránya és egy gyorsan vezető leszálló rendszer szabályozza. 8. A fájdalom feldolgozását végző agyi rendszer a fájdalommátrix, melynek laterális része a szenzoros-diszkriminatív, mediális része az affektív-motivációs, illetve a kognitív-értékelő dimenzióval kapcsolatos. 9. A fizikai fájdalom kiváltója valamilyen szöveti sérülés, gyulladás vagy idegi roncsolódás, a pszichogén fájdalom zömében pszichés eredetű, a szociális fájdalmat elsősorban izoláció és szeparáció váltja ki. A mentális fájdalom egyéb belső állapotok leírása a fájdalom szimbolikájával. 10. A nociceptorok érzékenyítése a perifériás, a gerincvelőé vagy az agysejteké a centrális szenzitizáció, eredménye a hiperszenzitivitás (túlérzékenység). A szenzitizáció következménye hiperalgézia (túlzott fájdalomérzékenység), illetve allodínia (nem fájdalmas ingerek fájdalmasként érzékelése) lehet.
1.7. ELLENŐRZŐ KÉRDÉSEK 1. Melyek a testérzés típusai? 2. Mi a mechanoreceptorok adekvát ingere? 3. Mire érzékenyek a hőreceptorok? 4. Melyek a szomatoszenzoros rendszer fő állomásai? 5. Milyen kulturális különbségek vannak az érintésben? 6. Mire szolgál a mozgásérzékelés? 7. Milyen mértékben tudatosodnak a zsigeri eredetű ingerek? 8. Mi a referált fájdalom? 9. Mi a fájdalomküszöb és a fájdalomtolerancia? 10.
Mi a különbség a fájdalomélmény és a fájdalomreakció között?
11.
Mi a nocicepció, és milyen fajtái vannak?
12.
Mi a hiperalgézia és az allodínia?
13.
Mi a kapuelmélet lényege?
14.
Mi a fájdalommátrix, melyek a fontosabb elemei?
15.
Mi a pszichogén, a szociális és a mentális fájdalom?
294 Created by XMLmind XSL-FO Converter.
13. FEJEZET – Testérzékelés és fájdalom
1.8. AJÁNLOTT OLVASMÁNYOK Atkinson – Hilgard 2005. Pszichológia. Osiris, Budapest. Berne, R. M. – Levy, M. N. 1996. Principles of physiology. Mosby, St. Louis. Carlson, N. R. 1998. Physiology of behavior. Allyn and Bacon, Boston. Goldstein, E. B. 2005. Blackwell handbook of sensation andperception. Blackwell Publishing, Malden. Rosenzweig, M. R. – Breedlove, S. M. – Leiman, A. L. 2002. Biologicalpsychology. Sinauer Associates Inc. Publ., Sunderland, MA. Sekuler, R. – Blake, R. 2000. Észlelés. Osiris, Budapest.
295 Created by XMLmind XSL-FO Converter.
17. fejezet - 14. FEJEZET –ؘKémiai érzékelés A kémiai anyagok érzékelése a szervezetben különböző helyeken zajlik, mivel kémiai ingerek származhatnak a külső, illetve a belső környezetből egyaránt. Ennek az érzékelési formának három modalitás felel meg: a szaglás, az ízlelés, illetve a kémiai viszcerocepció. Minthogy ez utóbbiról volt már szó korábban, itt csak az előbbi kettővel foglalkozunk részletesebben. A kémiai érzékelésre általában jellemző, hogy az ingert valamilyen vegyület, esetleg ion képezi, amely a receptorral kapcsolódva, ingerli azt. Ugyancsak közös sajátosságuk, hogy csak oldódni képes anyagok keltenek ingerületet, bár az oldószer különböző lehet. A receptorok többsége specifikus az adott anyagra, de jelenleg nem tudjuk megmondani, hányféle kémiai receptor létezik a szervezetben: számuk a néhány száztól a néhány tízezerig terjedhet. A kémiai ingerek ritkán tiszták, tehát többféle anyag van egyszerre jelen; ha csak két-három komponensből áll az inger, akkor esetleg el tudjuk őket különíteni, ennél többet azonban már ritkán. Egy három gyümölcsből álló saláta összetevőit például még elég jól szét tudjuk választani, de a négy-ötféle komponensből álló ételben többnyire már csak a legerősebb szagú alkotót ismerjük fel (ha egyáltalán felismerünk valamit). A közhiedelemmel ellentétben kémiai ingerként nemcsak szerves vegyületek, hanem számos szervetlen só is szolgálhat.
1. Szaglás A szaglás távoli illékony anyagok érzékelésére specializálódott (azaz kémiai telereceptor). Jelenleg nem rendelkezünk egységes elképzeléssel arról, hogy mely vegyületek alkalmasak szaganyagként, de általában zsírban (is) oldódó, kis molekulájú szerves anyagokról van szó. Noha a szaganyagok (olfaktoros ingerek) többségének valószínűleg van speciális receptora (ebből nagyon sokfélét találtak), úgy tűnik, az anyagok kémiai összetétele nem egyértelműen függ össze a szagminőséggel: eltérő szerkezetű vegyületeknek lehet hasonló szaga, illetve nagyon hasonló vegyületek egészen eltérő szagérzetet válthatnak ki.
1.1. A szagingerek átalakítása A szaglóreceptorok az orrmelléküregben elhelyezkedő szaglóhámban vannak (14.1. ábra). Ide az átlagos légvétel során nem vagy csak nagyon kis mennyiségben (kb. 10 százalék) jut levegő, ezért a szagokat inkább csak mélyebb légvételek esetén érezzük. Speciális légzőmozgás a szippantás, amelynek során a levegő csak az orrüregeit járja át, a légutak további részébe nem kerül; ez kifejezetten a szaglást szolgálja. Illatanyagok azonban nemcsak egyenes úton, az orrüreg bejáratán át, hanem belülről, a szájüregből is érkeznek, a garaton át (retro- nazális szaglás). Ezek az anyagok a táplálékból szabadulnak fel, és fontos kiegészítői az ízeknek: egy adott étel élvezeti értékének kialakításában mind az íz-, mind a szaganyagok részt vesznek (ezt írja le a zamat fogalma, amiről az ízlelés kapcsán lesz majd szó).
14.1. ábra. A szaglóhám elhelyezkedése az orrüregben A szaglóreceptorok elsődleges (primer) érzősejtek, azaz lényegében axonnal is rendelkező specializált idegsejtek, amelyek üreg felőli részén különleges csillók vannak; ez utóbbiak kötik meg a szaganyagot. A 296 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
szaglósejtek másik különlegessége, hogy élettartamuk körülbelül egy-két hónap, utána elpusztulnak. Helyüket a hám mélyebb rétegében lévő alapi (bazális) sejtek osztódással pótolják. A receptorsejtek között a receptorsejteket irányító és rögzítő támasztósejtek találhatók, illetve mirigysejtek, amelyek a felszínt borító nyákot termelik. A nyák igen sok kötőfehérjét tartalmaz, ezekhez kötődnek a bekerülő illatanyagok, és ezek szállítják őket a csillók felszínére (14.2. ábra).
14.2. ábra. A szaglóhám szerkezete A szaglósejteken kívül bizonyos mennyiségű szag felvételére a háromosztatú ideg (nervus trigeminalis) szabad idegvégződései is képesek (ezek tehát afferens érzőrostok végződései), ezek valószínűleg a károsító jellegű (pl. csípős, orrfacsaró stb.) ingerek hatására kerülnek ingerületbe; emellett befolyásolják a normál szagingerek érzékelését is. A járulékos szabad idegvégződések indítják a szaglással kapcsolatos reflexeket is (pl. fej elfordítása, levegő kifújása stb.), elsősorban azokat, amelyek a kellemetlen szaghatások kiküszöbölését szolgálják. A szaglórendszer az egyik legősibb érzőrendszer, ezt mutatja az is, hogy rostjai elsődlegesen nem kapcsolódnak át a talamuszban, szemben az összes többi érzőrendszerrel, melyek vetületei a talamusz közvetítésével érik el az elsődleges agykérgi érzőmezőket. Az alsóbbrendű állatokban a szaglógumó még az agy tömegének jelentős részét teszi ki, és mérete relatíve még mindig nagy az emlősök, különösen a ragadozók körében is. Egyedül a főemlősök és azon belül az ember esetében csökken a mérete jelentős mértékben. Érdemes azonban megjegyezni, hogy a szaglógumó mérete nem a receptorok minőségének, hanem inkább a számának csökkenésével korrelál; az ember sem érez valószínűleg sokkal kevesebb szagot, csak a szaglás érzékenysége és felbontása kisebb (vagyis valamivel töményebb illatokat ismerünk csak fel, illetve kevesebb szagot vagy szagintenzitást tudunk megkülönböztetni). Kimutatták, hogy a genom szinte valamennyi szaglóreceptor kódját tartalmazza, amit az állatok zömében megtalálunk, csakhogy ezeknek a géneknek egy jelentős része emberben inaktiválódik, soha nem készül róla kópia (tehát az adott receptor nem alakul ki). A szaglási funkció elszegényedése tehát másodlagos folyamat lehetett, amit vélhetőleg a többi érzőminőség, elsősorban a látás és a hallás kifejlődése idézhetett elő az evolúció során.
1.2. Szagok és illatok A szaglásról elsősorban egyes vegyületek kísérletes adagolásával szereztek eddig információt, de – mint említettük – egyelőre nem találtak megfelelő rendező elvet és mechanizmust. Vita van arról is, hogy léteznek-e alapszagok, amelyek a többi szagélmény kialakulásának bázisát képezik. Egyesek szerint akár húsz alapszag is létezhet, mások hetet azonosítottak: kámfor, pézsma, virág, borsmenta, éter, „büdös”, rothadó. Egyelőre egyik elképzelést sem sikerült bizonyítani, ezért könnyen lehet, hogy nincsenek is alapszagok. Erre mutat az is, hogy az így megnevezett szagok többsége természetes körülmények között nem „tiszta szag”, több illatból áll össze (mondjuk a borsmenta szagában benne van a „levélszag”, a „földszag”, a levelekre került szennyezés szaga és a növényben lévő többféle illatos anyag szaga is; ezeket ugyan tisztán nem érezzük, mert az erősebb és tömény mentolos illat elnyomja őket, de a szagélményt azért befolyásolják.
297 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
Többen próbálkoztak a szagokat valamiféle térbeli elrendezés segítségével osztályozni. Az ilyen osztályozás alapja valamilyen kémiai rokonság, fizikai tulajdonság hasonlósága, esetleg a keletkező élmény minősége lehet. Henning a newtoni színkörhöz hasonló elven szaghasábot készített, mely egy háromszög alapú, belül üres hasáb (14.3. ábra), és csúcsain az általa javasolt alapszagokat helyezte el. A hasáb felületein szerepelhettek az összetett szagok, amelyeket a csúcsokon lévő alapszagok (pl. virág-, gyümölcs-, gyantás, fűszeres, büdös, égett) keverékeként vélt előállítani (ugyanúgy, ahogy a színeket keverhetjük ki az alapszínek segítségével). A későbbi kutatás ezt az elképzelést nem igazolta: egyrészt semmi sem bizonyítja, hogy ezek és ennyien volnának az alapszagok, másrészt – szemben a színekkel – a keverék szagok nem lesznek önálló, új szagminőségek (mint például a kék és sárga keverésével előálló zöld szín), hanem mindkét összetevő sajátosságait mutatják. Megpróbálták a szagokat más elven, térbeli skálázással is osztályozni (Schiffmann 1974). Itt a vizsgálati személyeknek az egyes illatok hasonlóságát kell megbecsülniük, és ezek alapján helyezik el őket egy többdimenziós térben (ezt nevezik szagtérnek). A vizsgálatok már két dimenziót elegendőnek találtak, ezek egyike a kellemesség mértéke (ez szinte minden érzőminőség esetében használható megkülönböztetés), de a másik dimenzió jellegét azóta sem sikerült meghatározni.
14.3. ábra. A Henning-féle szaghasáb Egy átlagember két, egyszerre adott illatanyagot még biztosan, hármat még bizonytalanul meg tud különböztetni, ennél többet azonban már nem. Érdekes viszont, hogy az illatkeverékek jóval erősebb percepciót (szagélményt) váltanak ki, mint az őket alkotó vegyületek egyenként, s az összetett, úgynevezett kompozit illatok érzékelése az összetevők tulajdonságainak sem egyértelmű függvénye: néha gyengébb összetevők is lehetnek dominánsak. Ennek egyik oka az, hogy az egyes anyagokra vonatkozó ingerküszöb és érzékenység nagyon eltérő, ebben egyelőre szintén nem sikerült egyértelmű törvényszerűséget felfedezni. Noha az egyes illatkomponenseket nem tudjuk egy kompozit szagból kiemelni, bizonyos keverékek jellegzetes szagérzetet keltenek egyben: kávéillat, cigarettaillat, narancsillat stb. Ezek valamiféle egységes entitást képviselnek, mert a kompozit illatok keverékében viszont fel tudjuk ismerni az egyes összetevőket (kávé + cigaretta).
17.1. táblázat A SZAGINGEREK FELVÉTELE Az érzősejtek axonja közvetlenül az agyba, a szaglógumóba (bulbus olfactorius) fut, ahol a mitrális sejtekkel szinaptizál (nevüket alakjukról kapták, püspöksüvegre – mitra – hasonlítanak). A szaglógumó rostjai, tehát a dendritek és axonok glomerulusokat, rosthálót alkotnak (glomus = gömb), ezek működési komplexként funkcionálnak (lásd az ábrát). Fiatalkorban csaknem nyolcezer glomerulus van, idősebb korban számuk alig haladja meg a kétezret. Egy-egy mitrális sejt körülbelül kétezer receptortól kap
298 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
A szaglógumó glomerulusainak vázlatos rajza axont, ezek azonban hasonló receptorokhoz csatlakoznak; eszerint körülbelül annyiféle glomerulus van, ahány szagreceptor. A szaglógumóban lévő egyéb sejtek is kapnak szinapszisokat az érzőneuronok felől, ezek általában módosító hatással rendelkeznek. A mitrális sejtek, valamint néhány interneuron különböző hormonokra is érzékeny (pl. inzulin, ösztrogén, neuropeptid-Y, dopamin stb.), ezen az úton is módosítható a szaglási bemenet (érzékenyítés, illetve gátlás is lehetséges). Valószínűleg ezzel kapcsolatos például a menstruációs ciklus során mutatkozó vagy a terhességi szagérzékenység. A szaglógumó neuronjaiból kiinduló nyúlványok (szaglópálya) alapvetően a halánték- (temporális) lebenyben található úgynevezett körtemagba (nucleus piriformis vagy piriformis kéreg), illetve az ugyanitt elhelyezkedő entorhinális kéregbe futnak, amelyek a szaglás elsődleges kérgi központjainak tekinthetők, de kap rostokat az amygdala is. Ez is a szaglórendszer sajátossága, hiszen a primer rostok nem kapcsolódnak át a talamuszban. Kimutattak szaglással kapcsolatos aktivációt az orbitofrontális kéregben is, ahova az elsődleges központokból – most már a talamusz közvetítésével – jut el az ingerület. Szaglási eredetű ingerület éri a limbikus rendszer különböző részeit is az amygdala felől, ami az érzelmek keletkezésében fontos, illetve a memória szerveződésében szereplő hippokampuszt is. Másodlagos rostok az érző agykéregre is vetülnek, szintén a talamusz közvetítésével. A szárazföldi állatoknak – a főemlősök kivételével – van egy járulékos szaglószerve is, az úgynevezett vomeronazális szerv. Ez is tartalmaz szaglóreceptorokat, de szerkezete egyszerűbb, és a receptorok száma is kisebb, mint a szaglóhámban. Ez a szerv főleg a feromonokra érzékeny, azokat igen kis koncentrációban is felismeri. Az axonok innen a járulékos szaglógumóba futnak, amely főleg az amygdala mediális részébe, majd onnan a hipotalamuszba vetül. Ez a rendszer alkotja az úgynevezett járulékos szaglópályát. Noha emberben nincs meg, maradványait – legalábbis funkcionális vizsgálatok alapján – mégis feltételezni lehet. A szagok elkülönítése (szagdetektálás, tehát az, hogy kijelentsük, egy, két vagy hány szagot érzünk) viszonylag kis koncentrációknál is lehetséges, ebben még az emberi orr is elég jó teljesítményt mutat. Ha azonban meg is kell nevezni az adott szagot (szagfelismerés), sokkal nagyobb koncentrációra van szükség, és ebben az emberi orr már sokkal gyengébb, mint más emlősállatok orra. Vannak bizonyos szagok, amelyeket könnyebben felismerünk, másokat nehezebben. Ez részben öröklődik, de nagyobb részben tanult: a gyakran és nagyobb töménységben észlelt szagokat később könnyebben és kisebb koncentrációban is azonosítani tudjuk (ismerősség). Valószínűleg ez az alapja annak, hogy az anyák csecsemőiket, a csecsemők az anyjukat szaguk alapján is megbízhatóan felismerik; ugyanezen alapulhat az, hogy az ember a saját ruháit a szaguk alapján kiválasztja mások ruhái közül, valamint hogy a női és férfiruhaneműket is el tudjuk különíteni pusztán szaglás
299 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
segítségével. A szagfelismerést ezenkívül az illatanyagok kémiai és fizikai minősége is befolyásolja, de a sokoldalú kutatások ellenére sem sikerült ebben eddig valamilyen rendszert találni. A szagérzékenységnek napszakos ritmusa van (ezért valószínűleg a szaglógumóra ható hormonok felelősek), idősebb korban gyengül (csökken a receptorok száma és érzékenysége is), továbbá a nők érzékenyebbek, mint a férfiak. Végül említést kell tenni a szagok erősségének észleléséről. Mint a többi érzékfajta esetében is, a szaglásnál is az az alapkérdés, hogy a szaganyagok koncentrációja és a keletkező szagérzet erőssége között milyen összefüggés van. A vizsgálatokat megnehezíti, hogy jelenleg nem tudjuk megmondani, pontosan hol kellene a szagok koncentrációját mérni: a levegőben vagy a szájüregben, vagy a nyálkahártyában, vagy a csillók membránjának felszínén? További nehézséget okoz, hogy a szaganyagok – mint láttuk – fehérjékhez kötve kerülnek a receptorra, és nem tudjuk, a kötés erőssége hogyan befolyásolja a receptorok ingerületét (például hogy milyen viszonyban vannak a szabad, illetve kötött anyagok). Mindezek figyelembevételével is úgy tűnik, hogy – más modalitásokhoz hasonlóan – a szagkoncentráció és a szagérzet nagysága között hatványfüggvény teremt kapcsolatot, melynek hatványkitevője 0,6 körül van (tehát az összefüggés itt sem egyenes arányosság). Fontos felismerés, hogy a légáramlás sebessége (pl. a szippantás) a szagintenzitás érzékelését nem változtatja meg, az állandó marad; ezt nevezik szagkonstanciának.
17.2. táblázat A SZAGOK KODOLASA Mint említettük, emberben kb. 500-1000-féle szaglóreceptor van, de egy átlagember is 5-8 ezer szagot tud megkülönböztetni; képzett szagvizsgálók (pl. parfümtesztelők, borkóstolók stb.) akár 10 ezer szagot is el tudnak különíteni. A kérdés az, hogyan lehet ennyiféle szagot ilyen kevésféle receptorral megkülönböztetni. A válasz az, hogy egy-egy szaganyag (odoráns) több receptorhoz is kötődik, méghozzá eltérő erősséggel és eltérő mértékű ingerületet keltve; tehát nem az egyes receptorfajták ingerülete hordozza az információt, hanem az aktiválási mintázat. Ez elsősorban a szaglógumóban keletkezik, ahol így a minőségbeli mintázatok térbeli mintázatokká alakulnak át; ezeket az agy valószínűleg a holográfiához hasonló módszerrel olvassa ki. Noha a receptorok szintjén jellemző specificitást nem sikerült találni, mert egy adott receptort több illatanyag is izgat, illetve egy anyag többféle receptorhoz is kötődik, vannak specifikus szagminőségek (de ezek élettani háttere egyelőre nem ismert). Ezt elsősorban a szagláskiesés (anozmia) speciális esetei igazolják, minthogy létezik olyan betegség, amelyben csak bizonyos szagok észlelése esik ki, másoké normális marad. Ez az állapot lehet tartós is, de el is múlhat a receptorképződés ciklusának végén; ez utóbbi esetben biztosan receptorszintű volt a hiba. Ennél lényegesen nagyobb baj, ha a szaglás teljesen kiesik (teljes anozmia), aminek következtében nemcsak a szaglásban, hanem az ízlelésben is zavar keletkezik (lásd a zamat fogalmát az ízlelésnél). Az anozmia ellentéteként fogható fel a szaghallucináció, amikor szagokat érzünk olyankor, ha az adott illatanyag nincs is jelen. Valószínű, bár nem bizonyított még, hogy ez valamilyen öntudatlan memóriafelidézési folyamat eredménye, de más mechanizmusok is elképzelhetők (pl. asszociációk). A szagélményt általában emocionális állapotváltozás is kíséri, amit például a magyar nyelv jól tükröz: a kellemes ingereket illatoknak, a kellemetleneket szagoknak mondjuk. Jegyezzük meg azonban, hogy ez nemcsak az anyagi minőség, hanem a koncentráció függvénye is: a szkatol nevű vegyület kis koncentrációban jázminillatú, töményen viszont a széklet szagát adja (vegyészprofesszorok kedvenc példája a bepárlás illusztrálására: jázminvirág kivonatát egy csészében a gázégőre helyezik a szünet elején, majd kimennek; a szünet félideje táján már penetráns bűz van a tanteremben). A szaglóreceptorok a tartósan fennálló ingerekhez elég gyorsan adaptálódnak, de a hozzászokás nemcsak perifériásan, hanem centrálisan is, tehát habituációval is létrejöhet. Az előbbi a receptorok szintjén alakul ki, fáradási jellegű, míg az utóbbi a központi idegrendszerben kialalakuló gátlás, amikor észlelés nincs, de a receptorfolyamatok és az ingerület vezetése normálisan működik. Valószínű, hogy az adaptáció minden anyagra kialakul, mégpedig igen gyorsan, de ugyanolyan gyorsan el is múlik, ha az anyagot eltávolítjuk (tehát például szippantás után is). Az adaptáció nem teljes, az észlelés kb. 30 százalékra csökken; ez azt jelenti, hogy a gyengébb szagokat már egyáltalán nem, az erősebbeket azonban – gyengébben – érezzük. A hasonló jellegű szagok egymás érzékelését gyengítik, ezt nevezik keresztadaptációnak (például a narancsillat csökkenti a mandarinillat észlelését). A környezetünkben állandóan jelen lévő szagokra viszont habituáció alakul ki, ezeket szinte sohasem érezzük, tehát akkor sem, ha az adott helytől (pl. a lakástól vagy a munkahelytől) átmenetileg eltávolodunk. A habituáció megszűnik, ha hosszabb időre más szagkörnyezetbe kerülünk (pl. utazáskor), de 300 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
sokkal gyorsabban újra kialakul, ha visszatérünk a megszokott környezetbe. Ugyanez a jelenség az oka annak, hogy az egyes kultúrákhoz (sőt szubkultúrákhoz) jellegzetes, a más kultúrából érkezők számára olykor furcsa vagy kellemetlen szagkörnyezet rendelhető. Mivel a szaglóreceptorok maguk is idegsejtek, nem tudni, a habituáció a szaglópálya melyik szintjén alakul ki; abból azonban, hogy megszűnése többé-kevésbé egy időben következik be az idegsejtek megújulásával, feltételezhetjük, hogy maguk a receptorok is szerepelnek benne.
1.3. Szaglás és viselkedés A szaglás különleges helyet foglal el az érzékek között, mert olyan tulajdonságokkal is rendelkezik, amikkel a többi érzék nem. Elsősorban is tartósan fennmarad, akkor is, ha az ingerforrás már eltűnt az adott élettérből (szagnyom), ezért nem kívánja meg az üzenő és a felvevő egyidejű jelenlétét (szemben minden más érzékkel). Másodszor, egyidejűleg több helyen is előfordulhat, ezért jó tájékozódási pontokat kínál (terület- és útvonaljezés); ezt használják ki például a kutyafélék a territórium kijelölésekor. Harmadszor, a forrástól távolodva intenzitása csökken, így a mozgás irányítására is alkalmas (szaggradiens). Végül negyedszer, az egyes ingerforrásokra jellemző szagkomplexek jól elkülöníthetők és azonosíthatók, így alkalmasak egyedek, csoportok, illetve objektumok azonosítására (szagminta). Három olyan tulajdonsága is van viszont, ami hátrányosan különbözteti meg a többi érzéktől: nehezen újul meg (a régebbi szagot nehezebb felülírni, mert a jelzés tartós), nincs textúrája (jellegzetes térbeli mintázata, lényegében nincs háromdimenziós szagtérkép), illetve nem elég nagy a felbontása (mint említettük, nehéz az egyes összetevőket megkülönböztetni); ez lehet az oka annak, hogy a vi- selkedéskontroll evolúciója során a kommunikációban jelentősen csökkent a szerepe a látással és a hallással szemben, amelyek jóval differenciáltabb közlést tesznek lehetővé. A szaglóműködés további fontos sajátossága az, hogy egyszerre aktiválja az emocionális és a memóriarögzítő rendszert (pl. az amygdalát és a hippokampuszt), ezért a szaganyagok igen könnyen aktiválják az érzelmi (emocionális) memórianyomokat. Ugyancsak ez lehet az oka annak, hogy a szagfelismerés inkább „Gestalt” jellegű, mint analitikus (tehát egy szagkeveréket a forrás azonosításával, és nem egy „szagként” ismerünk fel: kávéillat, és nem annak egyes aromái), az adott objektumot inkább azonosítani akarjuk általa, mint elemezni. Ez utóbbi sajátosságra vezethető talán vissza a megfelelő szaglási szókincs szegényes volta is, amit a nyelv utalásos megnevezéssel hidal át: „olyan a szaga, mint a piszkos zoknié”. A szaglás ősi jellegére utal az is, hogy bár sokféle emléket hívhatnak elő (ezek zöme erős érzelmi töltéssel rendelkezik), nagyon nehéz, csaknem lehetetlen emlékeinkből szagokat felidézni; ugyanakkor aktiválódó érzelmi emlékek (emocionális memória) magukkal hozhatnak szagélményeket is, és szagok kísérhetik az álmokat is. Végeredményben tehát a szagérzetek sokkal inkább emocionális, mint kognitív jellegűek, ami jól magyarázza azt, hogy viszonylag keveset tudunk a szagkörnyezetünről. A szagfeldolgozás és szagfelismerés a viselkedés szabályozásának fontos eszköze. Az állatok esetében mind a fajtárs azonosításában, mind a szexuális aktivitásban és utódgondozásban, mind pedig a táplálékkeresésben és azonosításban kulcsszerepe van. Az utóbbi két tevékenység a fogyasztási (konszummatív) viselkedés kategóriájába tartozik. A fogyasztási viselkedés általánosságban két fázisra osztható: a forrás (azaz a partner, illetve a táplálék) megkereséséből és megközelítéséből (ez a prekonszummatív fázis), illetve a szigorúan vett fogyasztásból (ez a konszummatív fázis, tehát az aktus, illetve az evés). Mindkét fázisban használ a szervezet különféle szenzoros információkat, melyek fajtája (azaz modalitása) fajtól és helyzettől is függ. Általánosságban nézve, a szagok szerepelnek mind a prekonszummatív, mind a konszummatív fázisban, tehát az objektum azonosításában és felkeresésében, illetve a – tágabban értelmezett – fogyasztási viselkedésben egyaránt. Ennek egyik legjobban vizsgált megjelenési formája a szexuális viselkedés. Az emlősállatok a szexuális partnert annak jellemző szaga alapján azonosítják, sőt a fogadóképességet is illatanyagok révén állapítják meg; ez tehát még azelőtt megtörténik, hogy a két egyed egymással kapcsolatba lépne (és igen távolról is működik). Még szintén a prekonszum- matív fázishoz tartozik a partner helyének azonosítása és annak megközelítése, ami a szaggradiens segítségével történik. Mindez a fő szaglórendszer két útvonalának (körtemag-orbitofrontális kéreg, illetve amygdala és hip- pokampusz) irányításával történik. Magát a konszummatív aktust, tehát a párzást már a másik, a járulékos szag- lórendszer vezérli, amely az előzőtől lényegében független: a szaglóhám vagy a szaglóideg roncsolása után az állat nem találja meg a párt, de ha a közelébe viszik, a párzás megindul (és ez fordítva is igaz). Ugyancsak fontos a szaglás az utódgondozásban. Az anya és az utód egyaránt szagról ismerik fel egymást, a „szagkép” imprintingszerűen íródik be az idegrendszerbe. Ha valamilyen manipulációval valamelyikük szagát megváltoztatják, a gondozási folyamat megszakad, az utód pedig elpusztul. Az ember esetében sokkal kisebb a szagok szerepe, mégis valószínű, hogy az állatoknál leírt mechanizmusok nagy többsége nálunk is működik. A párkapcsolatokban és a szexuális aktivitásban is működik a szaglás, tulajdonképpen erre épül az egész parfümipar. Igaz, ennek a szociális szaghatásnak nem mindig vagyunk 301 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
tudatában a többi inger domináló tudatosodása miatt, de ettől még működik. Vannak már ismereteink arról, hogy a párkapcsolatok minőségét, a szexuális életet befolyásolhatják, leginkább ronthatják a szagok, és hogy bizonyos illatanyagokkal az aktivitás fokozható. Az utódgondozás esetében is szerepelnek szagingerek, kimutatták, hogy az anyák megbízhatóan azonosítják csecsemőjüket, azok pedig anyjukat pusztán szaglás alapján. A vomerona- zális szerv maradványai nemcsak ezekben a funkciókban, hanem más élettani folyamatokban is szerepelhetnek, ilyen például az egy légtérben tartósan együtt élő nők menstruációs ciklusának szinkronizációja (az ilyen, egy másik szervezet működését befolyásoló szaganyagokat szokták feromonoknak hívni). Azt valójában nem tudjuk, hogy a szinkronizáció – általánosságban véve – jár-e valamilyen evolúciós előnnyel, talán a közös utódgondozás lehet ilyen; emberben valószínűleg egyszerűen ennek maradványairól lehet szó. A szaganyagok valószínűleg hipotalamikus mechanizmusok révén módosítják a ciklust (illetve hatnak más viselkedésekre), de ennek módját részletesen még nem ismerjük. Kiderült az is, hogy saját illatát az emberek többsége megbízhatóan felismeri (lehet esetleg ez is az önazonosság egyik tényezője), noha erre egyébként erős habituáció épül ki. Sok ember képes pusztán szagok alapján megállapítani, hogy az adott szag férfitől vagy nőtől származik-e, lehetséges, hogy erre genetikailag rögzített vagy egészen korai tanulási minták vannak az agyban. Végül azt is érdemes megemlíteni, hogy – és ez viszont az ember sajátja, bár gyökerei persze az állatokhoz nyúlnak vissza – a szagingereknek hedonikus (élvezeti) értéke is lehet, ami például az ételek kiválasztásánál, illetve a fogyasztás szabályozásánál lehet kritikus tényező (tehát bizonyos ételeket az illatuk alapján választunk, esetleg utasítunk el). A kellemes illatok jelentősen növelhetik, a kellemetlenek csökkenthetik vagy meg is gátolhatják az evést-ivást. A kellemetlen szagélmények olyan erősen beíródhatnak, hogy az adott szagot egy életre elkerüljük (szagaverzió, ami például romlott étel fogyasztását követő rosszullét eredményeként alakulhat ki). Vannak evolúciósan preferált (pl. a méz édeskés illata), illetve elkerülendő szagok (pl. a rothadt szag); ez igen gyors, szinte reflexes elkerülést tesz lehetővé. A szagpreferenciák létét jól használja ki a parfümipar, de más iparágak is (például azzal, hogy a műbőr termékeket valódi bőr illatával preparálják, vagy például nem túl illatos élelmiszertermékekbe – például répából készült lekvárba – gyümölcsaromákat kevernek; ezek etikai vonatkozásairól itt most nem ejtünk szót, de a fiziológiai vonatkozások jól működnek).
2. Ízérzékelés Az ízérzékelés (gusztatórikus vagy gusztátoros percepció) kontakt kémiai érzőfolyamat, az ingernek tehát érintkeznie kell az ízlelőfelszínnel. Helye kizárólag a szájüreg: elsősorban a nyelv (bár annak középső része érzéketlen az ízekre), továbbá a lágyszájpad, a torok és a garat. Egy adott étel íze azonban komplex, nemcsak íz, ennek a szónak a szűk értelmében; ezért szokás a teljes érzékletet zamatnak nevezni. A zamat (köznyelvben egy étel íze) az ízreceptorok és a szaglóreceptorok együttes működése révén valósul meg, ez utóbbiak talán fontosabbak is (egy alma és egy krumpli szinte azonos ízű, ha a szaglóreceptorok nem működnek). Ízérzés csak vízben oldódó vegyületek esetében lehetséges, mivel az anyagnak be kell oldódnia a nyálba.
2.1. Az ízelés mechanizmusa A receptorok az ízlelőszemölcsökben (papillák) találhatók, amelyek különböző számú ízlelőbimbót tartalmaznak (14.4. ábra). Egy ízlelőbimbóban kb. 25-50 receptorsejt található. A receptorsejtek – akárcsak a szaglásnál – cserélődnek, féléletidejük (az az idő, ami alatt a receptorok fele kicserélődik) 10-14 nap, azután újak lépnek a helyükbe. Az ízanyag kapcsolódását követően a receptor átvivőanyagot bocsát ki, a befelé futó (afferens) idegrost ennek hatására kerül ingerületbe.
14.4. ábra. Ízlelőbimbók a nyelv felületén 302 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
AZ IZINGEREK FELVÉTELE Háromféle ízlelőszemölcs van: gombaszerű (fungiformis), főleg a nyelv elején és oldalán; levélszerű, amely nyolc redőt tartalmaz a nyelv hátsó-oldalsó részén; és körülárkolt, elsősorban a nyelv hátsó részén. A gombaszerű receptor kevés (1-8), a többi sok ízlelőbimbót tartalmaz. Az ízlelőbimbók tetején nyílás van (ízlelőpórus), a receptorsejtek csillói nyúlnak bele, itt kötődnek az ízanyagok. A szemölcsök ízreceptorokon kívül mechanikai, hő- és nociceptorokat is tartalmaznak.
Az afferensek három agyidegben futnak az agy felé: a nyelv első feléből, a gombaszerű receptorokból az arcidegben (VII. agyideg), a hátsó-oldalsó részből (levélszerű és kö- rülárkolt szemölcsök) a nyelv-garat idegben (IX. agyideg), a szájpad és garat területéről a bolygóidegben (X. agyideg). Valamennyiük a zsigeri afferenseket is fogadó nucleus tractus solitariibe fut (NTS), ahonnan a tala- musz VPM magja következik, ami egy tipikus relémag. Az elsődleges ízérző terület az elülső operkuláris és inzuláris kérgen van, a másodlagos area pedig az orbitofrontális kéreg hátsó része. Az NTS-ből kap rostokat a hipotalamusz és az amygdala is.
2.2. Ízek A pszichofiziológiai vizsgálatok szerint léteznek alapízek. Hagyományosan négyet különböztetnek meg: édes, sós, keserű, savanyú; de újabban hozzáadtak egy ötödiket is, melynek neve umami. Hasonlóan a szagokhoz, Henning (1916) az ízek esetében is készített mértani ábrát az ízek osztályozásáról, amely egy tetraéder alakját vette fel (14.5. ábra). Később sokan megkérdőjelezték, hogy léteznek-e (és hogy ezek-e) az alapízek. A legfontosabb érv az, hogy – szemben a szagokkal – az alapízek között kimutatható szerkezeti és kémiai rokonság, nagyjából ismerjük azokat a fizikai-kémiai tulajdonságokat, amik a jellegért felelősek. Az édes íz elsősorban a cukrokra jellemző, alkoholos és aldehidvegyületek mutatják. Újabb vizsgálatok szerint lehetséges, hogy többféle édes íz van, de ennek részletei még tisztázatlanok. Macskaféle ragadozók nem éreznek édes ízeket, a rágcsálók és a majmok egy része viszont talán a poliszacharidok ízét is detektálni tudja (6. alapíz?). Az édes ízek iránti preferencia (illetve ennek hiánya) a táplálkozással van összefüggésben: a legtöbb állat és az ember számára is az édes íz cukortartalmú ételt jelez, ami a szervezet számára az elsődleges energiaforrás, fogyasztását tehát előnyben kell részesíteni; mivel a macskafélék főleg húst fogyasztanak, erre a preferenciára nincs szükségük. A keserű íz nem ennyire egyértelmű, nagyon valószínű, hogy többféle receptor is szerepel benne. Keserűek lehetnek egyes kétértékű kationok sói (pl. keserűsó), továbbá a növényi alkaloidák döntő többsége (pl. a kinin vagy a morfin); emellett számos más vegyület is. Az ilyen anyagok is felszíni receptorhoz kötődnek, és ugyanúgy működnek, mint az édes ízűek. Mivel a mérgező anyagok többsége keserű, ennek az íznek kiemelt jelentősége van a védekezésben. A sós íz egyértékű kationok sóira jellemző, legerősebben a nátriumion esetén, de a kálium- és lítiumsók, főleg a halogénekkel képzett vegyületeik, is sósak. A sós íz fontosságát az indokolja, hogy a nátriumnak és a káliumnak kiemelkedő szerepe van a membránpotenciál kialakításában és az ingerületi folyamatokban, forrásaik viszont szegényesek, ezért minden sós ízű étel potenciális n át r i u m – k á l i u m – forrásnak tekinthető.
303 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
14.5. ábra. A Henning-féle íztetraéder A savanyú íz szervetlen és szerves savakra jellemző; igazi savanyú ízt a nem tökéletesen disszociáló savak (pl. szénsav, citromsav stb.) adnak, a teljesen disszociálódók (sósav, kénsav) inkább maró hatásúak. Savanyú íze egyes gyümölcsöknek, illetve zöldségeknek lehet, ezek a táplálékválasztásban tölthetnek be speciális szerepet; valószínűleg ezért lett ebből is alapíz. Az ötödik, újabban felismert – és némileg még vitatott – íz az umami. Neve japánul ,jó ízt” jelent, magyarul általában húsíznek vagy fehérjeíznek mondják. Jellemzően a glutamát (és aszpartát) aminosavak váltják ki, ilyen ízű a tartósítószerként használt monosodium-glutamát (MSG) is, de például umamiízű a rukkola nevű fűszernövény is. Jelentősége nyilvánvalóan a húsfogyasztás szabályozásában van. Korábban – sok tankönyv ma is ezt tartalmazza – az alapízek érzékelését térbelileg elkülönítették a nyelven: elöl az édes, elöl-oldalt a sós, oldalt a savanyú és hátul a keserű ízt lokalizálták. Újabb, pontosabb vizsgálatok cáfolni látszanak ezt a felosztást, annál is inkább, mert szinte minden receptor reagál minden ízanyagra, legfeljebb egyesekre erősebben. Ennélfogva az ízérzés esetében sem lehet egyszerűen az egyes receptorok ingerületéből következtetni a beérkezett ízre (lineáris ingerület), hanem alapvetően a mintázatérzékelés lehet a fő mechanizmus, amely az egy időben aktiválódott receptorok együttes eloszlásának érzékelésén alapul; ezt csak módosítja az egyes receptorokról közvetlenül érkező ingerület. Tovább bonyolítja az észlelést, hogy az összetett ízek nem az egyedi ízek összegeként állnak elő; egyik íz gyakran elfedi a másikat, és új ízminőség is keletkezhet. Ennek tipikus példája az, amikor a kismama a csecsemő ételébe sok cukrot tesz. A veleszületett ízpreferencia miatt a baba könnyebben és nagyobb mennyiségben fogyasztja ezt az ételt, viszont nem tanulja meg a tápanyagokat az egyes ételekhez – például a vitaminokat a gyümölcsökhöz, a nyomelemeket a főzelékekhez – hozzárendelni. Ennek következményeként felnőttkorában minden belső szükségletet édes ételekkel próbál meg kielégíteni, ami az általános elhízás egyik legfontosabb oka.
2.3. Az ízek érzékelése Az ízek kimutatása viszonylag egyszerű feladat, a tiszta vizet az ízes víztől jól meg tudjuk különböztetni (ízdetektálás). Nehezebb a dolgunk akkor, ha azt is meg kell mondani, milyen ízanyagról van szó (ízazonosítás). Ehhez a különböző vegyületekből eltérő mennyiség szükséges, a legkevesebb a keserű anyagokból kell. Előfordul azonban, hogy egyes receptorok örökölt hiánya vagy hibája miatt bizonyos ízeket egyesek nem éreznek (ilyen például a vizsgálatokban használt fenil-tio-karbamid [PTC] nevű vegyület). Ez a hiányosság más ízanyagok esetében is (pl. az édes szacharin, a keserű koffein) előfordul, emiatt elég nagy különbségek lehetnek az egyes emberek között. Az ízérzet nagyságát befolyásolja a hőmérséklet, az élettani állapot (pl. éhség) vagy éppen a napszak; ezenkívül a nők érzékenysége itt is, mint a szaglásnál, nagyobb. Az ízérzet nagysága és az ízanyagok koncentrációja közötti viszonyról egyelőre keveset tudunk, de a szaglás vizsgálata során szerzett ismeretek alapján feltehető, hogy itt is hatványszerű az összefüggés. Valamivel többet vizsgálták azt, hogy két eltérő töménységű oldatot mekkora különbség esetén tudunk elkülöníteni (ízdiszkrimináció). Ehhez legalább 20-25 százalékos eltérés kell, vagyis ez a küszöb nagyon magas, messze magasabb, mint más érzékszervek esetében.
304 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
2.4. Izek és szagok Amikor a szájba étel kerül, izgatja az ízlelőbimbókat, ezáltal ízinger keletkezik. Ez azonban – önmagában – nem hasonlít ahhoz, amit az egyes ételek fogyasztásakor megszoktunk. Ennek az az oka, hogy a táplálék nemcsak vízben oldható, hanem illékony kémiai anyagokat is tartalmaz, amelyek a garaton keresztül az orrba, a szaglóhámra jutnak (lásd fentebb, a szaglásnál). Egy adott étel élvezeti értékét a kettő – tehát íz és szag – együtt biztosítja, ezt nevezik zamatnak. Ha a szagérzés kimarad, az étel ízetlennek tűnik; ez fordul elő náthás emberek esetében, továbbá egyes idős embereknél, erős dohányosoknál, bizonyos mérgezéseknél vagy erősen párolgó szerves anyagok belélegzése után. A szagok visszatérésével a zamatok is visszatérnek.
2.5. Ízlelés és viselkedés Akárcsak a kontakt receptorok többsége, az ízreceptorok is gyorsan adaptálódnak a tartósan jelen lévő ingerekhez, ez akár egy percen belül is lezajlik. Ha újra érezni akarjuk az ízt, cserélni kell az ízlelőbimbók környezetében lévő nyálat. Egy már jelen lévő, bekötődött ízanyag akadályozza a következő íz kialakulását, ezt öblítéssel lehet elősegíteni (ezért szoktak az ínyencek időnként igen kis mennyiségű folyadékot inni evés közben – tulajdonképpen öblítenek vele). Bár az ízek összetevőit jobban tudjuk azonosítani és megnevezni is, mint a szagokét, valójában többnyire szintén összetett ízeket érzékelünk. Egy adott ízanyag észlelt íze tehát függ a jelen lévő többi anyagtól is. Érdekes, hogy az előző íz módosítja a következő vegyület ízét, különösen, ha már adaptálódott hozzá a rendszer; ez különösen jól vizsgálható vízzel: édes íz után a tiszta víz keserű jellegű, keserű íz után édeskés, míg savanyú után sós jellegű, és fordítva. A jelenség kissé hasonlít a látórendszerben ismert negatív utóképhez, és talán a mechanizmusa is hasonló. Az ízeket általában minősítő címkével is ellátjuk: lehetnek kellemesek, kellemetlenek, illetve semlegesek. A kellemes ízű ételeket szívesen fogyasztjuk (preferencia), a kellemetleneket elkerüljük (averzió). Vannak örökölt, illetve tanult preferenciák: például az édes ízre erős, a sósra gyengébb pozitív, a savanyúra enyhébb, a keserűre erősebb negatív preferenciát öröklünk. Ezek a preferenciák azonban tanulással módosíthatók, ezt nevezik érzékcsúszásnak (alliesztézia). Az érzékcsúszás nemcsak tanulással jöhet létre, hanem a belső állapot változásai révén is, egy éhes állat erős pozitív preferenciát, mérsékelten jóllakottan nagyjából semleges érzéseket, túltelítetten pedig kifejezett averziót mutat az édes íz iránt; mindez az édesség mértékének érzetét nem befolyásolja, tehát nem arról van szó, hogy édesebbnek vagy kevésbé édesnek érezzük az ingert, csak arról, hogy kellemes-e vagy kellemetlen. A tanult preferenciaváltozások gyakran kellemetlen belső állapotváltozások következtében alakulnak ki, például akkor, ha a fogyasztott táplálék émelygést vagy hányingert okoz. Ezt nevezik ízkerülésnek, illetve ízaverziónak. Ezek kialakulásában valószínűleg fontos mechanizmus az, hogy az ízingerek és a belső szervi ingerek már az agytörzs szintjén összetalálkoznak, ami gyors és hatékony asszociatív tanulást tesz lehetővé, melynek elemi formájához az agykéreg nem is feltétlenül szükséges (magatartási szinten persze már nélkülözhetetlen). Az ízaverzió segít abban, hogy a betegséget okozó vagy mérgező ételeket az egyed elkerülje; egy olyan, igen gyors és tartósan fennmaradó tanulási mechanizmus, ami nélkülözhetetlen a megfelelő táplálkozási mintázat kialakulásában. Az ízek iránti preferencia egy speciális formája a neofóbia, vagyis az új ízektől való tartózkodás. Ez azt jelenti, hogy az egyed egy ismeretlen ízű táplálékból csak nagyon keveset fogyaszt, csak akkor tér vissza oda, ha nincsenek negatív következmények (ez például a patkányirtás legnagyobb problémája, mert a méregből a patkányok nem fogyasztanak eleget; a sikeres magyar módszer olyan, késői hatású és íz nélküli mérgeket használ, amik kijátsszák a neofóbiát). Az ízek (pontosabban inkább a zamatok) és különösen a tanult ízpreferenciák a táplálkozás hedonikus szabályozásának elsődleges tényezői. Az ételhez kevert különféle adalékanyagok – például fűszerek – és a többféle íz bonyolult keverése sokkal nagyobb mennyiségű táplálék elfogyasztását teszi lehetővé, mint ami a valódi szükséglet; ez ismét csak – akár a szaglás esetén – tipikus emberi jelenség. Az ízek, a szagokhoz hasonlóan, sok emlékképet hívhatnak elő, de – szemben a szagokkal – ezeket aktívan is fel tudjuk idézni. A legkönnyebb azonban – ez érthető is – a zamatok felidézése; azt elég megbízhatóan el tudjuk például dönteni, hogy újdonsült házastársunk főztje visszaadja-e az édesanyánk főzte ételek ízét.
2.6. ÖSSZEFOGLALÁS 1. Mint láthattuk, a kémiai érzékelésnek három alapformája van: szaglás, ízlelés, viszcerális kemorecepció. A szaglás a távoli forrásokból származó illékony, zsírban is oldódó anyagok által keltett érzéklet. Az ízlelés a szájüregbe kerülő, vízoldékony vegyületek keltette érzet. 305 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
2. A szaglásnál 7-20 alapszagot, az ízlelésnél 5 alapvető ízt határoztak meg. 3. A szaglóreceptorok elsődleges, az ízérző receptorok másodlagos érzősejtek. Az elsődleges szaglócentrum a halántéklebeny körtemagjában, az elsődleges ízérző centrum a limbikus kéreg operkuláris és inzuláris területén található. Mindkét kémiai érzékelési formára jellemző, hogy az ingerek általában összetettek, és hogy az észlelet elsősorban az afferens mintázat alapján jön létre. 4. A szaglás fontos szerepet játszik a táplálék, illetve a szexuális partner megtalálásában (prekonszummatív fázis), valamint a párzás megindításában és az utódgondozásban (konszummatív fázis). 5. Az ízérzés fő jelentősége a táplálékválogatás (prekonszummatív fázis), illetve a feldolgozási folyamatok megindítása (konszummatív fázis). A táplálék zamata az, ami elsősorban megszabja annak kívánatosságát; ez az ízek és szagok együtteséből áll elő.
2.7. KULCSFOGALMAK alapízek, alapszagok, érzékcsúszás, ízaverzió, ízérzés, ízlelőbimbók, ízpreferencia, kompozit illat, körtemag, szaglás, szaglógumó, szaglóhám, szaglóreceptor, telereceptorok, zamat
2.8. ELLENŐRZŐ KÉRDÉSEK 1. Milyen típusú sejt a szaglóreceptor? 2. Mi a szaglórendszer különlegessége más érzőpályákkal szemben? 3. Vannak-e alapszagok? 4. Mik az illatkeverékek, illetve kompozit szagok? 5. Mi a mintázatelvű érzékelés? 6. Hol vannak a szaglás központjai? 7. Milyen viselkedési folyamatokban szerepel a szaglás? 8. Hogyan jellemezhető az ízérzés? 9. Mik az ízlelőszemölcsök és az ízlelőbimbók? 10.
Hányféle alapízt ismerünk?
11.
Mitől függ az ételek zamata?
12.
Mi az ízpreferencia és az ízaverzió?
13.
Milyen viselkedési folyamatokban szerepel az ízérzékelés?
14.
Hasonlítsa össze a szaglás és az ízlelés jellemzőit!
2.9. AJÁNLOTT OLVASMÁNYOK Atkinson – Hilgard 2005. Pszichológia. Osiris, Budapest. Berne, R. M. – Levy M. N. 1996. Principles of physiology. Mosby, St. Louis. Carlson, N. R. 1998. Physiology of behavior. Allyn and Bacon, Boston. Goldstein, E. B. 2005. Blackwell handbook of sensation andperception. Blackwell Publishing, Malden. Rosenzweig, M. R. – Breedlove, S. M. – Leiman, A. L. 2002. Biologicalpsychology. Sinauer Associates Inc. Publ., Sunderland, MA.
306 Created by XMLmind XSL-FO Converter.
14. FEJEZET –ؘKémiai érzékelés
Sekuler, R. – Blake, R. 2000. Észlelés. Osiris, Budapest.
307 Created by XMLmind XSL-FO Converter.
18. fejezet - ÉSZLELÉS ÉS CSELEKVÉS Tizennégy fejezeten keresztül azzal foglalkoztunk, hogy miként is érzékeljük, észleljük a világot. Mindenütt azzal találkoztunk, hogy az érzékelőrendszer összetett működése és az érzékelési mintázatokat a tapasztalatoknak megfeleltető, a világot tanuló emberi agy miként képes hatékonyan szolgálni az alkalmazkodást. Az észlelést záró összefoglaló fejezet témája az, hogy a különböző modalitásokban tapasztaltak integrálására milyen lehetőségek vannak, miként szolgálja az észlelés a cselekvést, a cselekvés pedig az észlelést. Zárófejezetünk illusztrációjaként nem véletlenül választottunk egy olyan képet, amelynek észlelése csak nagyon kevesek számára felel meg a valóságnak. A többség meglévő tapasztalatai szerint észleli, azaz látja és értelmezi azt a képet, amelyet egy tudományos illusztrációkat készítő művész alkotott. Dana Berry (CfA/ NASA) nem valamilyen gigantikus szemet ábrázol, hanem a forró gáz forgása által létrehozott fekete lyukat. Valószínű, hogy azok a fizikus kutatók, akik láttak már olyan mintázatot, mint amilyet a kao- tikusan örvénylő fekete lyuk által generált eltérő energiatartományú fények alkotnak, fekete lyukként látnák ezt a képet. Az átlagos halandó azonban csak egy furcsa kinézetű szemet észlel. Észlelésünk referenciája ugyanis a megtapasztalt világ. A fekete lyuk egyébként bármily érthető a fizikusok számára, az átlagember számára nehezen felfogható. Ennek okaival a pszichológia Gondolkodás és nyelv kurzusai foglalkoznak, Általános pszichológia sorozatunknak pedig a harmadik kötete.
308 Created by XMLmind XSL-FO Converter.
19. fejezet - 15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés 1. Asszociáció és integráció az észlelésben 1.1. Együttjárás és együtthatás A környező világ észlelése az egyes modalitásokban egyszerre követi a valamennyi észlelőrendszerre általános, valamint az adott modalitásra specifikus törvényszerűségeket. Az észlelés jellemzőit a hagyományos megközelítésben, mint ahogy ez az eddigi fejezetekben is történt, modalitásonként tanulmányozza a pszichológia, azaz mindig csak egy adott érzékelési, észlelési minőséget vizsgál. Az egyes érzékleti modalitások egymástól elkülönülő tanulmányozása és az ismeretek elkülönített tárgyalása azonban nem jelenti azt, hogy az észlelés maga ne alapvetően multiszenzoros jelenség lenne. A pszichológiának semmiféle kétsége nem lehet arra vonatkozóan, hogy az észlelőrendszerek ne együtt, összehangoltan működnének annak érdekében, hogy a valamennyi modalitásra támaszkodva kivont információ biztosítsa azt, hogy a környezet ingereit, eseményeit a lehető leggyorsabban detektáljuk (észrevegyük), megbízhatóan azonosítsuk, és megfelelő választ adjunk rájuk. Még azokat az észlelt eseményeket is befolyásolhatják más szenzoros modalitásból származó információk, amelyek első benyomásra modalitásspecifikusnak tűnnek, mivel ezek a szenzoros interakciók nem tudatosak. Számos kísérleti adat azt mutatja, hogy valóban ritkán van tudomásunk arról, hogy aktuális észlelésünk multiszenzoros természetű lenne. A multiszenzoros feldolgozás észlelőrendszerünk működésében gyakran jobb, gyorsabb, máskor viszont újfajta észlelési minőséget eredményez. Az előbbiek inkább egymásra hatást jelentenek, azaz a feldolgozást könnyítő, gyorsító, serkentő folyamatokról van szó. Ezt modalitásközi jelzésnek, valamint modalitásközi facilitációnak nevezzük. Más esetekben viszont az inger-, illetve eseményjellemzők feldolgozása oly erőteljes, hogy az egyik modalitásban megjelenő ingertulajdonság befolyásolja, módosítja a másik modalitásban ugyanennek az ingernek, eseménynek a feldolgozását. Ebben az esetben beszélünk modalitásközi vagy multiszenzoros integrációról.
1.1.1. Modalitásközi facilitáció Jól ismert tény, hogy a figyelemnek olyan, egy váratlan inger, esemény felé fordulása, amely nyílt orientációs választ eredményez (bővebben lásd a figyelemmel foglalkozó fejezetekben), az észlelés javulásával, úgynevezett modalitásközi előnnyel jár. Ez nemcsak azt jelenti, hogy élesebben látjuk azt a vizuális ingert, ami felé fordulunk, hanem jobban is halljuk (vagy érezzük) az adott forrásból származó hangot (tapintást) (RordenDriver 1999). Ez a modalitásközi figyelemeltolódás azonnal megjelenik, tehát még azelőtt, hogy szenzoros receptoraink az ingerre irányultak volna. Ez annak köszönhető, hogy normál körülmények között a nyílt és rejtett orientáció között nagyon erős kapcsolat van, mindkettőt ugyanazok az agyi struktúrák kontrollálják. A kísérleti pszichológiában régóta jól ismert, hogy egy bejósolhatatlan vizuális inger megjelenése gyors és rövid ideig tartó serkentő (facilitáló) hatással van a látómezőben az előjelző ingerrel azonos helyen megjelenő célingerre (Posner-Cohen 1984). Hasonló modalitáson belüli facilitáció megfigyelhető a hallási, valamint a tapintási jelző- és célingerek között is. Hasonló facilitáció megfigyelhető egyes modalitások között is, azaz a modalitásközi jelző hatás úgy működik, hogy az egyik modalitás elindítja a másikban történő feldolgozást. Ez akkor lehetséges, ha létezik egy a modalitások feletti, úgynevezett szupramodális figyelmi mechanizmus. A modalitásközi facilitáció vizsgálatának egyik klasszikus feladattípusa a gyorsított ingerdetekciós feladat. Ezek a feladatok a klasszikus Posner-feladat (lásd a szövegdobozt a 472. oldalon; Posner-Cohen 1984) audiovizuális megfelelői. Az eredeti vizuális Posner-feladat lényege, hogy a kísérleti személyek az előttük lévő képernyőn előre nem jósolható téri helyen megjelenő jelzőingereket, majd ezeket követően célingereket látnak. A célingerre rövidebb az egy gomb lenyomásával mérhető válasz (RI: reakcióidő), ha nagyon rövid idő múlva (az eredeti kísérletben 0-100 ms) azonos helyen követi a jelzőingert. A modalitásközi ingerdetekciós feladat a korai kísérletekben nem hozta meg a várt eredményeket. A hallási detekció ideje érzéketlennek bizonyult a vizuális téri előjelzésre és fordítva. Ennek az egyik lehetséges oka az, hogy a korai kísérletekben olyan hangmagasságkülönbségeket használtak, amelyek a tonotópiára (részletesen lásd a hallási észlelés alapjelenségeinél), és nem a téri hallásra támaszkodó gyors detekciót tettek lehetővé.
309 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés A kezdeti kudarcok ellenére a gyorsított ingerdetekciós kísérletek egyik legelterjedtebben használt paradigmája a téri diszkriminációs feladat lett. Ward ma már klasszikusnak számító kísérleteiben (Ward 1994) arra kért gombnyomásos választ, hogy a külön feladatban adott hallási és vizuális célingerek a jobb vagy a bal oldalon jelentek-e meg. A téri megjelenése szerint nem jósolható hallási, illetve vizuális jelzőingereket használt, mégpedig eltérő ingerkezdetidőket (SOA [stimulus onset asymmetry = ingerkezdet-aszimmetria]: 100, 200, 550 ms) alkalmazva. Ward meglepő módon azt találta, hogy a legrövidebb ingerkezdet-aszimmetria esetében a vizuális jelzőinger facilitálta az azonos oldali (ipszilaterális) hallási célinger detektálását, ugyanez a hallási ingerrel elő- jelzett vizuális célingernél egyetlen ingerkezdet-aszimmetria esetében sem jelentkezett. Ez a jelenség, az úgynevezett audiovizuális aszimmetria ellentmondani látszik az egyszerűbb detekciós eredményeknek. Lehetséges, hogy Ward kísérleteiben az egyik oldalon adott válaszok előfeszítik és gátolják az azt követőket, illetve az ip- szilaterális előfeszítés a két modalitás eltérő szerveződése miatt erőteljesebb a vizuális modalitásban, ezért mutat a modalitásközi facilitáció aszimmetriát. Tény, hogy valamennyi azóta végzett, a kritikus változókra (válaszoldal, a jelzések téri távolsága, jósolhatóság) kiegyenlített kísérlet azt mutatta, hogy a modalitásközi facilitáció nem azonosan működik a két modalitásban.
1.1.2. Modalitásközi interakció A kísérleti adatok szerint a mozgásészlelésben erős modalitásközi integráció működik a mozgásnak a különböző észlelési modalitásokban megjelenő jelzőingerei között. A legkorábbi leírásban (Zapparoli-Reatto 1969) a stroboszkopikus mozgás észlelését különböző modalitásközi helyzetekben tanulmányozták. A beszámolók szerint a mozgás hallási és vizuális jelzőingereit a kísérleti személyek akkor is azonos mozgásirányhoz tartozónak észlelték, ha azok egyébként eltérő mozgásirányt jeleztek. A probléma csak az, hogy ezt másoknak nem sikerült megismételniük, ennek oka pedig az lehet, hogy az eredmények a résztvevők önbeszámolóin alapultak. A legtöbb olyan kísérletben, amelyben a mozgás különböző modalitású jelzőingereinek kölcsönhatását vizsgálták, a látszatmozgás-helyzetet alkalmazták (a látszatmozgásról már volt szó a Mozgásészlelés című fejezetben). A látszatmozgás tipikus alapfeltétele, hogy az események két eltérő téri helyen olyan időzítéssel jelenjenek meg, hogy a mozgás mint észlelési illúzió létrejöhessen. A modalitásközi interakciónak egyik gyakran alkalmazott esete az úgynevezett hasbeszélőhatás . A jelenséget Howard és Templeton (1966) azért nevezték el a jól ismert hasbeszélő-illúzió alapján, mert a térben egymástól távol lévő hangok és vizuális ingerek közös forráshoz rendelése hasonló ahhoz, mint amikor a hasbeszélő szájmozgás nélküli beszédét a kezében lévő, a beszéddel szinkronban mozgatott bábútól származó beszédként észleljük. Hasonló jelenséggel van dolgunk a televízió és a mozi esetében is, amikor a vizuális események középről, a hozzájuk tartozó hangok pedig oldalról vagy a téri környezetből érkeznek. A hangokat mégis a vizuálisan azonosított eseményekhez rendeljük, holott a legjobb minőséget adó házimoziknál sem lehetséges a teljes vizuális-akusztikus megfelelés. Az illúzió azonban még az egy-két hangszórót használó rendszereknél is létrejön, azaz az azonos forrásból érkező hangot a képernyőn megjelenő különböző szereplőkhöz rendeljük. Ez az észlelési illúzió azonnal szétesik, ha behunyjuk a szemünket, és így próbáljuk megállapítani a szereplő helyét. A hasbeszélőhatás statikus formájában (statikus hasbeszélőhatás) egyes hangok téri azonosítása történik, a hanggal azonos vagy eltérő irányban megjelenő vizuális ingerek megjelenésekor. A modalitásközi illúziók dinamikus változatának (dinamikus hasbeszélőhatás) vizsgálatára látszatmozgást létrehozó vizuális ingerek és hangláncolatok használhatók. Ezekben a mozgásirány megegyezését (kongruencia) és fázisazonosságát (szinkronitás) szokták változtatni. A dinamikus helyzetben a modalitásközi interakció négyszer olyan gyakori, mint a statikus helyzetben (Soto-Faraco-Kingston 2004). A hangforráshoz kapcsolódó vizuális információkról, a mozgásészlelés dinamikus jelzőingereiről szerzett tapasztalatok a multiszenzoros integráció kialakulásához vezetnek. A látás és hallás dinamikus eseményeinek multiszenzoros integrációját nemcsak az észlelési modalitások szenzorosan vezérelt interakciója működteti, hanem a tapasztalatra épülő elvárások is.
19.1. táblázat POSNER ÉS MCGURK A kísérleti pszichológiában a laboratóriumban vizsgált jelenségek gyakran szándékosan teremtenek olyan feltételeket, amelyekkel vizsgálhatóvá válnak olyan feldolgozási jellegzetességek is, amelyekkel a valódi környezetben nem találkozunk, nem találkozhatunk. Mint arról a törzsszövegben már szóltunk, a hetvenes évek végén, a nyolcvanas évek elején két olyan eljárást dolgoztak ki, amelyeket a kísérletezők gyakran használnak. Az egyiket a modalitásközi facilitáció, illetve a figyelmi jelenségek vizsgálatára, a másikat pedig a modalitásközi integráció természetének kifürkészésére használják leginkább. Az egyik a Posner-feladat, a másik pedig a McGurk-effektus vagy -illúzió.
310 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés
1. ábra. A klasszikus Posner-feladat sémája Az 1. ábrán a klasszikus Posner-feladat lépéseit mutatjuk be. A képernyőn először egy fixációs pont jelenik meg, majd attól balra az úgynevezett tesztinger (a). A kísérleti személynek két gomb áll rendelkezésére. Azt kell megnyomnia, ahol a tesztinger megjelenik (b). A feladat során a fixációs ponttól jobbra vagy balra (az ábrán balra) megjelenhet jelzőinger (c) vagy olyan inger, amely nem jelzi előre a megjelenése helyét (d). Ennek az eredetileg vizuális feladatnak a továbbfejlesztett változataival szokták a modalitásközi facilitációt vizsgálni. A feladatnak ma már sokféle változata van, az észlelési modalitások kölcsönhatásának vizsgálatán kívül a figyelemvizsgálatok egyik kedvenc alapparadigmája. A McGurk-illúzió vizsgálata akkor vált lehetővé, amikor először megjelentek azok a technikák, amelyek lehetővé tették, hogy a szájmozgáshoz igen pontosan szinkronizálják az akusztikailag azonos, ám a szájmozgásnak való megfelelés szerint igencsak eltérő hangokat (2. ábra). McGurk és MacDonald 1976-os Nature-cikke csak sokkal később vált a beszédészlelést, illetve a modalitásközi integrációt kutató pszichológusok egyik igen kedvelt paradigmájává. Az illúzió lényege, hogy az egymáshoz szinkronizált beszédhangok, mint a /ba/ és /ga/, a /da/ észlelését eredményezik (a). A számítógépes animáció elterjedésével megjelentek a pszichológiakísérletekben a beszélő fejek (Massaro
311 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés 1998). Ezekkel a beszélő fejekkel (b, c) ugyanúgy ki lehet váltani az illúziót, mint az élő beszélőről készített filmekkel, nagy előnyük viszont, hogy a minden zavaró faktort kizárni kívánó, precíz kísérletezés feltételeinek jobban megfelelnek.
2. ábra. McGurk-illúzió. a) Az illúzió létrejöttének sematikus rajza. b) Beszélő fej /ga/ hangnak megfelelő szájmozgással és a „hozzá tartozó” /ba/ hang. c) Beszélő fejek tipikus ajakállása négy különböző mássalhangzónál (Massaro 1998 nyomán)
1.1.3. Multiszenzoros integráció Mint láthattuk, az egyes modalitások kölcsönhatása különösen kifejezett az események forrásának azonosításában, a létrejövő interakciók természete pedig jól tanulmányozható az észlelési illúziók segítségével. Az eltérő modalitásokból származó szimultán ingerek serkentik, befolyásolják és módosítják a szenzoros feldolgozást, és ennek észlelési és viselkedéses következményei vannak. Ennek a kölcsönhatásnak egyik speciális esete a beszédészlelés. A beszédnek a hallási és vizuális modalitásban történő észlelése és ennek következményei a multiszenzoros integráció ideális és egyben prototipikus esetét jelenti. A beszédészlelés multiszenzoros természetének kísérleti vizsgálatában a mérföldkövet McGurk és MacDo- nald (1976) közleménye és az abban bemutatott, a pszichológiában azóta McGurk-effektusként ismertté vált jelenség jelentette (lásd a szövegdobozt). A klasszikus kísérletben a személyek egy szótagokat kiejtő személy arcát nézik. A személy szájmozgása a /ba/ és /ga/ hangsorok ejtésének felel meg. A szájmozgáshoz szinkronizált hangok azonban egyformák, mindegyik /ba/. A létrejövő hallási illúzió abban áll, hogy a kísérleti személyek által észlelt hang a /ga/ ajakállásnál /da/. Ha elvégezzük a kísérletet, a /ba/ szájmozgás, a hozzá tartozó /ga/ beszédhang helyzetben a létrejövő észlelési illúzió gyakran igencsak furcsa, ilyen például /bga/. McGurk és McDonald megelőzték korukat, legalábbis ami a modalitásközi integrációt illeti. A hetvenes években ugyanis elképzelhetetlennek tűnt, hogy a modalitások hasonló kölcsönhatása más területeken is lehetséges. Ma már viszont az észlelésben a multiszenzoros integráció a szabály, és nem a kivétel. Erre utal a hasbeszélő-illúzió és számos más olyan észlelési jelenség, amelyben a szenzoros fúzió és a modalitásspecifikus tapasztalat együtt formálja az észlelést. A beszédpercepció audiovizuális, azaz bimodális természetét számos kísérletben vizsgálták. A legismertebbek a Massaro-munkacsoport vizsgálatai (Massaro 2004). A beszédhangok kategoriális észlelésének vizsgálatával sikerült kimutatniuk, hogy a beszédhangok azonosítása a vizuális és hallási jellemzők alapján csaknem ugyanolyan jó, a mindkét modalitásra egyidejűleg támaszkodó bimodális észlelési teljesítmény viszont nem egyszerű addícióra, hanem egy újfajta észlelési minőséget eredményező integrációra utal. A beszédpercepcióban megjelenő integrációnak azonban, mint minden multiszenzoros integrációnak, időbeli szinkronizációs feltételei vannak. Természetes körülmények között nem fordulhat elő, hogy a beszéd hallási és vizuális jelzőingerei nincsenek szinkronban. A fény és a hang eltérő terjedése miatt ugyan már a szokásos beszélgetési távolságban is idői eltolódás van, ez azonban annyira parányi, hogy az észlelőrendszer számára nem jelent problémát. Ha például a beszélőtől körülbelül egy méterre tartózkodunk, hangja 80-90 milliszekundummal később jut el hozzánk, mint látványa, ez pedig a beszédészlelő rendszernek nem jelent problémát. A modern telekommunikáció azonban nagy távolságokat hidal át, ez pedig aszinkron audiovizuális információt biztosít. Az audiovizuális szinkron megbomlásának észlelését vizsgálva megállapítható, hogy az aszinkronitás detekciójának 312 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés magasabb a küszöbe, ha a beszélő hangja késik, mint amikor korábbi, mint a beszélő látványa. Előbbi esetben 260 ms, utóbbiban viszont 130 ms körüli a még észrevétlenül maradó idői eltérés (Dixon-Spitz 1980). Feltehetően a modalitásközi integrációnak köszönhetően az észlelőrendszer nagyobb időcsúszást visel el a szájmozgáshoz képest csúszó beszédhang esetében, mint más, források szerint összetartozó, de nem integrálódó hangoknál. Ugyanebben a kísérletben a kutatók azt is kimérték, hogy a kalapács és a hozzá tartozó koppanás mennyire lehet aszinkronban. Ez az idői eltérés 190 ms körüli a látványt követő és 75 ms az azt megelőző hang esetében. A beszédészlelő rendszerben a vizuális és a hallási modalitás közötti laza idői kapcsolódás meglepőnek tűnhet, ha arra gondolunk, milyen erős a szájmozgás és a szimultán beszédhang statisztikai együttjárása a tapasztalatunkban. Valószínű, hogy az idői eltérés a beszédpercepcióban azért nem okoz gondot, mert az eltérő idői tulajdonságokkal jellemezhető vizuális és akusztikus modalitás szinkronizálása a vizuális mozgásészlelés (kinematika) és a hangképzés motoros komponensének egymáshoz rendelésével működik (Greenberg-Arai, 2001).
1.2. Integráció és szupramodális beszédpercepció A beszédpercepciót biztosító modalitásközi integráció általánosabb elméletei a vizuális és akusztikus észlelés törvényszerűségeit nem tartják elegendőnek a megfigyelhető jelenségek magyarázatánál. Ezeknek közös eleme az a reprezentáció, amely az eltérő modalitásokban az azonos tárgyakról, eseményekről szerzett és ezeken keresztül integrált információkra épül. A beszédészlelésben érvényesülő integráció legalább három nagy elméleti keretben értelmezhető. Meltzoff és Moore (1997) aktív intermodális térképezés elméletére épülő beszédper- cepciós elképzelés szerint a nyelvi tapasztalatszerzés során a beszédnek egy modalitások feletti, szupramodális képviselete, reprezentációja alakul ki. Ez a reprezentáció mintegy túllép azokon a modalitásokon, amelyekből kivonva ő maga létrejön. A reprezentációnak az integráció szempontjából legfőbb tulajdonsága, hogy modalitások felettisége biztosítja az eltérő észlelőrendszerek segítségével szerzett információk integrációját. A Meltzoff-Moore-hipotézis (1997) az újszülöttek azon meglepő képességének a magyarázatára született, amely az arckifejezéseknek már néhány órával a születés utáni utánzásában jelenik meg. A szerzők szerint az észlelőben (és ez a babáknál is így van) a testrészek és azok viszonyának (például a fogak között kidugott nyelv) szupramodális reprezentációja alakul ki, amely majd az integráció keretéül szolgál valamennyi modalitás számára. A multiszenzoros integráció más magyarázatai szerint a beszédpercepcióban érvényesülő integrációt a hangképző szervek működését kísérő akciók (gesztusok) észlelése biztosítja. A beszédpercepció motoros elmélete (Liberman-Mattingly 1985) szerint a gesztusok reprezentációja a multiszenzoros agyi területek közvetítésével biztosítja a beszéd akusztikus és vizuális jellemzőinek integrációját. Az aktív intermodális térképezésnél ezt a szerepet a szupramodális reprezentáció tölti be. Mindkét elképzelés lényege, hogy az integrációt egy közös reprezentáció biztosítja. A Liberman-Mattingly-modell két lényeges elemre épít. Az egyik a beszédhangok kategoriális észlelése, azaz a reprezentációban az akusztikai eltérések nyelvi tapasztalattól függő felülírása. A folyamatos beszédben ezt a stabilitást a motoros gesztusok biztosítják, illetve az együtt hangzó beszédhangzók észlelése. Egy negyedik elképzelés azonban merőben eltér mindettől. Ebben (Massaro 1998) a hallási gesztusoknak akusztikus, a vizuálisaknak pedig elkülönülő vizuális reprezentációjuk van. Az integráció pedig ezen gesztusok együtt- járásának, azaz mentális asszociációjának a következménye.
2. Észlelés és cselekvés Valamennyi, az észlelést tárgyaló fejezetben azzal foglalkoztunk, hogy a világban előforduló tárgyakról, eseményekről, a bennünket érő hatásokról miként szerzünk információt, s ezeket azután miként használjuk a környezethez való alkalmazkodás során. Ennek a fejezetnek az elején azzal is megismerkedtünk, hogy a külvilágról szerzett, elemi szinten még eltérő modalitások szerint feldolgozott információt miként rendezzük egységes, a világot jól reprezentáló tárgy- és eseménymintázatba, miként integrálódnak ezek úgy, hogy a környezetben való eligazodásunkat segítsék. Láttuk, hogy a világ, és persze mi magunk is, a változás és a mozgás képességével rendelkezik. Észlelés és cselekvés ebben a dimenzióban egyetlen közös biológiai célt szolgál, a környezethez való minél jobb alkalmazkodást. A környezet uni- és multimodális észlelése, illetve a mozgás és cselekvés együtt biztosítják a környezetnek megfelelő adekvát viselkedést. A mozgás, az aktív, cselekvő észlelés információt nyújt a tárgyak-események legfontosabb tulajdonságairól. Mint korábban láthattuk, a mozgás és cselekvés segíti a háromdimenziós világ 313 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés újraalkotását, a látott vagy hallott tárgyak helyének azonosítását, a tárgyak felületének pontosabb megismerését, sőt gyakran a formák azonosítását is. A mozgás, a cselekvés számos célt szolgál: a tárgyak-események észrevételét, a tárgyak elkülönülését, tulajdonságainak pontosabb megismerését, a multiszenzoros integráció kialakulását, testünk és szemünk mozgásának vezetését, összehangolását. A cselekvés többnyire akkor tölti be ezeket a szerepeket, ha a környezet megismerése aktív keresés formájában zajlik. Ez történhet a főként adatvezérelt feldolgozásra támaszkodó, valamint a tudás- vagy koncepcióvezérelt cselekvés formájában is. A cselekvés olyan téri-idői esemény, amelynek során a magasan differenciált észlelőrendszereken belül és között kell az információt feldolgoznunk és összehangolnunk. A téri-idői információ megfelelő részleteit úgy kell átalakítanunk, összehangolnunk, hogy a környezethez való adekvát alkalmazkodás biztosítva legyen, és megfeleljen az adott információ felhasználásának. A cselekvést kiszolgáló mozgás ebben rendkívül fontos, enélkül igen nehéz elképzelni az életünket. Az érzékelés és észlelés tárgyalásának zárásaként azokat a cselekvéseket nézzük meg, amelyek segítenek annak a világnak a felfedezésében, amely az észlelés szempontjából is dinamikus.
2.1. Fizikai környezet – észlelés – tudás Az észlelés tárgyalásakor minden fejezetet azzal kezdtünk, hogy miként történik a receptorokban az információk átalakítása, mi jut el az agyba, és ott mi történik. Számos példával illusztráltuk azokat a folyamatokat, amelyek az észlelés alulról felfelé irányuló, adatvezérelt működését jellemzik. Ennek a működésnek a legszembetűnőbb jellegzetessége, hogy alapvetően az inger fizikai jellemzői határozzák meg, a feldolgozás információalapú. Vegyük észre azonban, hogy az észlelés pszichológiai modelljeiről szóló általános fejezetben és az egyes modalitások ismertetésében számos illusztráció szerepelt arról, hogy az észlelés maga csak részben adatvezérelt. Lapozzunk vissza a bevezető fejezethez, és látni fogjuk, hogy a pszichológia észleléselméletei alig több mint egy évszázad alatt milyen változáson mentek keresztül. Láthattuk, hogy a tanulás és tudás szerepe már igen korán felmerült. A tudás hatása az észlelésre felülről lefelé irányul. Azokkal a modellekkel, amelyeknek középpontjában a tudásvezérelt észlelés és cselekvés áll, már korábban megismerkedtünk. A felülről lefelé irányuló folyamatok sokféleképpen nyilvánulhatnak meg, befolyásolva ezzel a cselekvést, mégis felfedezhetők bizonyos törvényszerűségek. Tudásunk (pl. korábban észlelt tárgyak, események emléke) segítségével a tárgyakat és eseményeket korábbi tapasztalatainknak feleltetjük meg, ezek sajátosságai (tulajdonság, használat) alapján rendszert, kategóriákat alakítunk ki. Ezek elvont kategóriák, mentális képviseletük (reprezentációjuk) a felismerés meghatározó elemét alkotja. Tudásunk persze nem csupán az észlelést befolyásolja, hanem irányítja azt a figyelemnek nevezett szelektív folyamatot, amely, mint a figyelemmel foglalkozó következő fejezetekben látni fogjuk, egyes környezeti összetevők hatékonyságát felnagyítja, másokét pedig gyengítheti vagy akár blokkolhatja is. A felülről lefelé irányuló folyamatok – tudásunk – egy értelmezési kontextus biztosításával egészítheti ki a szenzoros bemenetet. Az értelmezés ilyenkor a kontextustól függ. Általában persze tudásunk alá van rendelve a szenzoros információnak, mégis számos esetben tudásunk veszi át a vezető szerepet, mintegy „felülírja” az érzékelésből származó információt. Ez leginkább akkor történik, ha a szenzoros információ gyenge, nem egyértelmű, nehezen megkülönböztethető, sőt esetleg nincs is szenzoros információ. Ez utóbbi helyzetben a belső jelzőingerek szerepe megnő. Ha egy inger nem látható vagy hallható tisztán, általában mindent elkövetünk annak érdekében, hogy a belső jelzőingereket felhasználva a külső ingerből információt nyerjünk ki, annak jelentést adjunk. Bruner és Potter (1964) ezt vizsgálta egy azóta sokat idézett vizuális felismerési feladatban. A kísérletben kétértelmű, homályos diaképeket használtak ingerként. A diaképeken különböző helyzetek és tárgyak voltak láthatók (pl. útkereszteződés felülnézetből). A kísérleti személyeknek leírást kellett adniuk a képekről; a leírások az eltérően homályos, illetve élesebbé váló képek esetében pontatlanok, de nem egyformán pontatlanok voltak. A diakép élesebbé válásával javult a felismerés. Bruner és Potter eredményei közül azonban nem ez a meglepő, hanem az, hogy a diákat a legelső bemutatáskor jellemző életlenség az éles képekre mutatott teljesítményt is befolyásolta. Ha kezdetben a kép nagyon homályos volt, a személyek egészen a teljes élességű kép bemutatásáig nem tudták a képen ábrázolt tárgyat felismerni. Ez nem jellemezte azt a helyzetet, amikor az először bemutatott kép csak alig volt életlen. Ennek az az oka, hogy az életlen kép expozíciójakor megjelenő értelmezés befolyásolta a későbbi észlelést is (ez a felülről lefelé irányuló folyamatok egyik változata). Azok tehát, akik kezdetben nagyon életlen képet láttak, sokáig ragaszkodtak a rossz értelmezéshez. Ebben az esetben tehát a felülről lefelé irányuló folyamat megakadályozza a helyes észlelést.
314 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés Potter 1966-ban, gyerekekkel megismételt kísérletei további változókra hívták fel a figyelmet. Azt találta, hogy a felismerési gyorsaság egyéni variációkat mutat, illetve jelentős a felismerésben használt stratégia életkor szerinti eltérése. Az idősebbek leírásait a következtetés és a kép egészének feldolgozása, a fiatalabbakét pedig a találgatás és a kép részeinek elemzése jellemezte. Úgy tűnik tehát, hogy az észlelési teljesítményt, illetve az értelemadást a tapasztalat erősen befolyásolta. Hasonló jelenséggel ismerkedhettünk meg a beszédészlelésről szóló fejezetben a fonémarestaurációs hatás esetében. Azt tartják, hogy a kétértelmű képek értelmezése az emberek motivációját és érdeklődését is elárulja. Ennek a nézetnek a leghíresebb képviselője a bécsi pszichiáter, Sigmund Freud volt. Freudnak A mindennapi életpszichopatológiája című, 1901-ben megjelent könyvében bemutatott példái főként a beszéd és az emlékezet területéről származnak. Freud a félreolvasásokat tipikus észlelési hibáknak tekintette. Az anekdota szerint maga Freud, lévén szenvedélyes műgyűjtő, gyakran olvasta félre azokat az üzletfeliratokat, amelyek hasonlítottak az „antikvitás” szóra. A tárgy- és alakészlelés tárgyalásánál számos példát láthattunk arra vonatkozóan, hogy a tapasztalattal szerzett ismerősség milyen erősen befolyásolja az észlelésünket. A gyakran emlegetett példa szerint a tapasztalt madárfigyelő több száz madarat is képes megkülönböztetni. Ennek mechanizmusai sokkal komplexebbek, mintsem hogy egyszerűen csak az ismerősség számlájára írhatnánk. Az észlelés differenciálódásában megjelenő új szerveződési sajátosság a kategorizáció. Ezt könyvünkben röviden már érintettük (a témával mélységében a Tanulás és emlékezet kurzusok foglalkoznak). Az előző fejezetekben már bemutattuk azokat a jelenségeket, amelyek az észlelés pontosságát segítő megkülönböztetést (diszkriminációt) jellemzik. Az észlelési megkülönböztetés egy átfogó fogalom, mégpedig annak a folyamatnak a jelölésére, amelynek során azokat a jegyeket és mintákat is meg tudjuk különböztetni, amelyeket korábban nem voltunk képesek (Gibson 1969).
2.2. Észlelés és a cselekvő ember Könyvünknek az észleléssel foglalkozó valamennyi fejezetében bemutatott ismeretek azt sugallják, hogy az észlelés elméleteinek mindenképpen meg kell tudniuk magyarázni azt, hogy egy élőlény miként is képes kapcsolatba lépni természetes környezetével. Valamennyi, az észlelés területén bemutatott kísérleti munka azt támasztja alá, hogy az észlelés aktív folyamat. Az aktív észlelés során a környezetben jelen lévő információt az észlelő közvetlenül veszi fel, mégpedig észlelési rendszerei segítségével. Az aktív észlelés fogalma egyben azt is jelenti, hogy maga az észlelés közvetlenül csatolt a cselekvéshez. Ennek tanulmányozása, mint láthattuk, gyakran nehézkes a laboratóriumi körülmények között. Ez különösen igaz, ha észlelési vizsgálatainkkal azt kívánjuk megérteni, hogy a környezet és az észlelés milyen kapcsolatban áll egymással. Láttuk, hogy az élőlény és a környezet kölcsönösen meghatározott, a környezet hat az észlelésre, az észlelés pedig befolyásolja, hogy miként dolgozzuk fel a környezetből származó információkat. Emlékezzünk Neisser észlelési ciklus modelljére, amely ezt a kölcsönhatást is igyekezett megragadni. Neisser elmélete azonban a kognitív pszichológia szemléletmódját tükrözi. Az észlelés környezeti érvényesség fókuszú, úgynevezett ökológiai elmélete és az abból táplálkozó elméletek a környezeti jellemzőknek az észlelésben jelentős szerepet tulajdonítanak. A környezet hatásainak elemzése azonban nem teszi egyszerűvé az észlelés tanulmányozását, hiszen a környezet elemei egymásra épülnek és egymásba ágyazottak (nesting). A tapasztalatszerzés során a környezettel interakcióban kialakuló tudás súlyozott reprezentációja a világnak, természetes tehát, hogy emiatt és még sok más miatt (pl. az érzékelőrendszer korlátai) a fizikai és az ökológiai környezet igen különböző lehet. A fizikai környezet nélkülözi azt a lényeges aspektust is, amely az ökológiainak elválaszthatatlan sajátja, ez pedig az idői dimenzió. Nem véletlen tehát, hogy a mai észlelésfelfogásban elsősorban észlelési eseményekről beszélünk (ezzel találkozhattunk a látásnál és a hallásnál is). Cselekvés és észlelés az ökológiai szemléletű észleléspszichológiában egy olyan sajátos egységet alkot, amely úgy működik, mint bármely szabályozórendszer. Az észlelés azonban rugalmas szabályozórendszer, amelyben a beállított érték és a mért érték összehasonlítása visszacsatolás útján az érték módosításához vezet. Az észleléscselekvés szabályozórendszerben az értékbeállítás a tapasztalatok hatására változik. A rendszer megértése egészében akkor lehetséges, ha belátjuk, hogy ebben a szabályozórendszerben a „mérés” nem köthető egyetlen tulajdonsághoz. Ez abból is következik, hogy a környezetnek minden eleme egyedi. Ezek az egyedi elemek sajátos integrált észlelési egységet adnak, hiszen a környezet elemei meghatározott módon strukturálják a fényt, a hangokat, a szagokat (pl. hangot ad a számítógép, esik az eső, földre pottyan az alma), illetve gyakran ezeket mind együtt. Az észlelőrendszerekben azonban elég jó rendezettség (pl. optikai rendezettség, hallási eseményszerveződés) működik. Ez úgy lehetséges, hogy az észlelést kiszolgáló működés funkcionálisan, és nem strukturálisan meghatározott. Az észlelés ennélfogva az élő szervezet globális teljesítménye, ennek kiszolgálása a különböző anatómiai struktúrák összehangolt működésével történik. Az észlelőrendszerek természetes környezetben aktívan fedezik fel (explorálják) környezetüket, így igen sokszor maguk keresik és szerzik az
315 Created by XMLmind XSL-FO Converter.
15. FEJEZET – A világ megértése: modalitások kölcsönhatása és a cselekvés információt, például mozgással, cselekvéssel vagy egy tárgy végigpásztázásával. Az észlelésben azonban számos olyan jelenséggel találkozhatunk, amelyben az eredményhez (nagyság-, mélység-összehasonlítások, becslések) pasz- szív megfigyeléssel és aktív explorációval is eljuthatunk. Ez akkor van így, amikor az észlelés döntést foglal magában. Ezek a kérdések messze visznek. Mindehhez szükséges azoknak az ismereteknek a megszerzése, amelyek a reprezentáció és a gondolkodás folyamatainak megértését lehetővé teszik. Mindenesetre az észlelésről szóló fejezetek zárásaként érdemes megjegyeznünk, hogy az észlelés megértését a pszichológia és társtudományainak (pl. idegtudomány) módszereivel végzett laboratóriumi kísérletek és az ökológiai validást fókuszba emelő észleléskutatások együtt teszik lehetővé.
2.3. ÖSSZEFOGLALÁS 1. Ebben a fejezetben bemutattuk, hogy a környezetünkhöz történő alkalmazkodás során az egyes érzékelési modalitások kölcsönhatása miként szolgálja az észlelést. Láttuk, hogy a multiszenzoros feldolgozás észlelőrendszerünk működésében jobb, gyorsabb vagy újfajta észlelési minőséget eredményez. A feldolgozást könnyítik, gyorsítják, serkentik az úgynevezett modalitásközi jelzések, valamint a modalitásközi facilitáció. 2. A környezetről több modalitásban szerzett tapasztalatok az inger-, illetve eseményjellemzők feldolgozását sajátosan befolyásolják. Ekkor az egyik modalitásban megjelenő ingertulajdonság befolyásolja, módosítja a másik modalitásban ugyanennek az ingernek, eseménynek a feldolgozását. Ebben az esetben beszélünk modalitásközi vagy multiszenzoros integrációról. 3. Visszautalva az észlelés egyes fejezeteiben megismert jelenségekre, megállapítottuk, hogy a cselekvés és az észlelés olyan sajátos egységet alkot, amely úgy működik, mint bármely szabályozórendszer. Az észleléscselekvés együttes olyan rugalmas szabályozórendszer, amelyben a beállított érték és a mért érték összahasonlítása visszacsatolás útján az érték módosításához vezet. Az észlelés-cselekvés szabályozórendszerben az értékbeállítás a tapasztalatok hatására változik
2.4. KULCSFOGALMAK aktív intermodális térképezés, facilitáció, modalitásközi jelzések, multiszenzoros integráció
2.5. ELLENŐRZŐ KÉRDÉSEK 1. Milyen hatása van a modalitásközi jelzéseknek az észlelésre? 2. Mikor jön létre modalitásközi vagy multiszenzoros integráció? 3. Keressünk példákat a mindennapi életből a modalitásközi integráció eseteire! 4. Miként befolyásolja cselekvésünk az észlelést? 5. Mi a szerepe a tudásnak az észlelésben? 6. Mit jelent az, hogy az észlelés aktív folyamat?
316 Created by XMLmind XSL-FO Converter.
20. fejezet - FIGYELEM, ÉBRENLÉT, ALVÁS
Az észlelésfejezetek bevezetéséhez képeket keresve többször is a szürrealizmushoz fordultunk. A figyelem működési jellegzetességeinek illusztrációjaként sok mindent választhatnánk. Olyan festményeket, amelyeknek sajátos motívumkiemelése vagy esetleg rendkívüli részletgazdagsága jól szemléltetheti, hogy a figyelem – vagy még inkább a figyelmi rendszer – milyen sokféleképpen működik. Találhatnánk olyan művészi alkotásokat, amelyek azt illusztrálják, hogy milyen az önkéntelen figyelem, a tárgyak-események felé fordulásnak mik a jellegzetességei, hogyan nyilvánul meg az emberi figyelem az arckifejezésekben, mozdulatokban. A figyelem és az ébrenléti állapot különböző szintjeinek együttes bemutatására már kevesebb illusztrációt találhatunk a vizuális művészetekben. A kötetünk zárófejezeteit alkotó, figyelemről szóló részeket az alvás és álom témáját tárgyaló fejezet követi. Olyan művész alkotását hívjuk tehát emlékeztető illusztrációként segítségül, akinek képein mindkettőt követhetjük: a szemlélőnél a vizuális figyelem jellegzetességeit, a mű értelmezésénél az álmok, az álomszerűség ábrázolásának művészi hatását. O Marc Chagall. Marc Chagall (1887-1985), akit a szürrealizmus egyik korai képviselőjének tekint, egy kis galíciai zsidó faluban, Vi- tyebszkben született. 1910-ben került Párizsba, művészete itt éri el csúcsát. Új hazájában is gyakran otthoni élményeit festi meg, sokszor álomszerű, költői víziókban. Chagall a művészettörténet szerint is nehezen sorolható be, hiszen nem tartozik az avantgárd egyik irányzatához sem. Művei azonban nagy hatással vannak két nagy irányzat, a szürrealizmus és az expresszionizmus képviselőire is. Sok festményét választhatnánk tehát a megismerőfunkciók illusztrálására, nem csupán a figyelemére. Képein jól követhetők például az önéletrajzi emlékek, az oroszországi élmények. Ezek az emlékképek azonban a festő szubjektív szűrőjén keresztül meseszerű fantáziavilággá alakulnak. A képek bizarrsága az álmok torzult világára, a tárgyak valóságfüggetlen
317 Created by XMLmind XSL-FO Converter.
FIGYELEM, ÉBRENLÉT, ALVÁS
nagysága a figyelmi szűrés működésére emlékeztethet minket. A művek a pszichológus számára több mélységben tárulnak fel, hiszen a szereplő emberek, állatok, tárgyak szimbolikus értelmet is nyernek. Marc Chagall itt bemutatott festménye egy önarckép, amely a vizuális figyelem természete szempontjából is igen érdekes alkotás. A kép kiemelkedő motívumát sokak számára a középtől kissé jobbra elhelyezkedő épület, a párizsi Notre Dame adja. Náluk, pláne, ha nem ismerik a festmény címét, ez ragadja meg elsőként a tekintetet. Mások számára a bal oldalon élénk színekben pompázó, gyakori Chagall-motívum, a kakas a kiugró tárgy, míg sokak számára a halványkék-lila-sárga művészarc. A képen számos további részletet találunk, amelyek felfedezése sokat elárul a szemlélő figyelmi műköCsillék déseiről. A kép egésze ugyanakkor álomszerű, valószínűtlen árnyalatokban lebeg. Hasonlóan ahhoz, mint amit időnként álmainkban látunk.
318 Created by XMLmind XSL-FO Converter.
21. fejezet - 16. FEJEZET – Figyelem: szelekció, téri figyelem Forgalmas utcán sétálva elkerüljük a szembejövőket. Amikor a kereszteződéshez érünk, rápillantunk a lámpára, és attól függően megyünk tovább, hogy milyen színű. Mindezekkel egy időben észlelőrendszerünket számos egyéb hatás is éri, melyek nem szükségszerűen befolyásolják viselkedésünket. Ha utólag megkérdeznénk, hogy néztek ki a szembejövő járókelők, milyen autók mentek el mellettünk, a válaszok igencsak bizonytalanok lennének. De nem mindig: ha az egyik autó egy tűzpiros Ferrari lenne, vagy legjobb barátunk jönne szembe, valószínűleg megállnánk, még akkor is, ha a lámpa zöld. Ebben a banális példában a figyelem kérdéskörének nem csekély része helyet kapott. Ingerekben gazdag környezetben akkor lehet hatékony a viselkedés, ha az észlelő- és a mozgásszervező rendszert nem terheli túl a beérkező információk tömege. A figyelmi működéseknek ez a szelekciós vonatkozása. Ugyanakkor a jövőre nézve nem lenne előnyös, ha egyes környezeti mozzanatok észlelése elmaradna, hiszen ezek akár fontosaknak is bizonyulhatnak. Ez a figyelem orientációs vonatkozása. Az érzékszervek perifériás részére, például a retinára egyaránt rávetülnek a környezetnek a pillanatnyi viselkedés szempontjából fontos és nem fontos (irreleváns) vonatkozásai. Tekintve, hogy az ember információfeldolgozási kapacitása véges, nem tudjuk a környezet valamennyi ingerét azonos súllyal feldolgozni. Ez akkor is így lenne, ha ez a kapacitás bőven meghaladná környezetünk változatosságát. Ekkor sem lenne valamennyi környezeti eseménynek azonos esélye arra, hogy az éppen lezajló viselkedést meghatározza. Ha ugyanis az események, ingerek mennyisége meghaladja a feldolgozórendszer kapacitását, a kapacitásért versengő ingerek közül előnyben részesülnek mindazok, amelyek a motivált viselkedés szempontjából lényegesek. Az észlelőműködés ez esetben úgy írható le, mint torzított verseny a feldolgozókapacitásért (Desimone- Duncan 1995). A kapacitásért folyó versenyben a torzítás azoknak a folyamatoknak a következménye, amelyeket figyelemnek nevezünk. Azok a versenyből kiszoruló események, melyek nem kapcsolódnak az éppen aktuális viselkedés szervezéséhez, ám mégis elfoglalják az információfeldolgozás mechanizmusait, önkéntelenül magukra vonják a figyelmet. Miért van szükség e torzított versenyre, ha az adott környezet nem különösebben gazdag eseményekben? Minden olyan esetben, amikor azonos időben két olyan esemény zajlik, melyek egymást kizáró választ kívánnak (például jobbra fordulnék, mert arra kellene mennem, balról viszont a barátom integet), figyelmi folyamatok meghatározzák a viselkedést (hiszen nem lehet egyszerre jobbra és balra fordulni). A figyelmi folyamatok ilyenkor nem az észlelésre, hanem a tevékenységre, akcióra hatnak. Az eddigieket megfogalmazhatjuk úgy is, hogy az események elindítják az információfeldolgozási folyamatok sorát, kezdve az érzékszervek elemi működésével, folytatódva az észlelés komplexebb folyamataiban. Tudjuk, hogy ugyanakkor aktív állapotban van az a belső modellrendszer, mely tartalmazza, „leírja” az adott környezet elvárható szerkezetét. A környezetnek és viselkedésnek ez a modellje mintegy megszabja a „verseny feltételeit”. A folyamatok előbbi csoportja „alulról felfelé”, az utóbbi pedig „felülről lefelé” hat, az előbbieket az ingerek vezérlik, az utóbbit a modellek. (Az adat-, illetve modellvezérelt folyamatok hatásával az észlelés átfogó elméleteinél már megismerkedhettünk.) Az ingervezérelt és modellvezérelt folyamatok kölcsönhatásából feldolgozási körök sokasága alakul ki. A figyelem pszichológiája tehát elsősorban azzal foglalkozik, hogy milyen mechanizmusokkal alakul ki a viselkedés szolgálatában álló észlelés, és milyen mechanizmusokkal szerveződik a konzisztens viselkedés. Így talán nem túlzás Titchener (1918/1988) megállapítása, miszerint „A figyelem a pszichológiai elmélet veleje... ”
1. A figyelem kutatásának története A kísérleti pszichológia kialakulásakor, a 19. század harmadik harmadától a figyelem a pszichológiai kutatások egyik központi tematikája volt. A kísérletezés Wilhelm Wundt laboratóriumából kiinduló iránya a tapasztalt megfigyelő élményeit elemezve a figyelem számos vonatkozását azonosította. A figyelem a pszichológia nagy teoretikusa, William James munkásságában is központi jelentőségű volt (lásd James 1890), ám mindezek ellenére e témakör hosszú időre kikerült a pszichológiai kutatások fő vonalából. Ennek okát abban szokták megjelölni, hogy a figyelem és a tudatosság vagy akár a figyelem és a mentális rendszer irányultsága, aktivitása igen nehezen választható el. A pszichológia viszont évtizedeken keresztül úgy próbált koherens rendszereket alkotni, hogy következetesen kerülte a tudatosság, a mentális irányultság, valamint az intencionalitás nehezen kezelhető kategóriáit. Mindez nem jelenti azt, hogy az uralkodónak tekinthető behaviorista pszichológia ne került volna szembe azokkal a kérdésekkel, melyekről a rövid bevezetésben szóltunk. Így amikor az ingerreakció kapcsolatok elemzésekor az a probléma merült fel, hogy egy adott ingerhez társított több reakció közül
319 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem melyik váltódik ki, a neobehaviorizmus nagy alakja, Hull is kénytelen volt olyan fogalmakat használni (pl. Hull 1943), melyeket mai terminológiával a torzított versenyhez köthetnénk. A modern figyelemkutatások a pszichológia gyakorlatából és a kommunikációs technika eredményeiből (és követelményeiből) erednek. A második világháború alatt az angol haditengerészetnek és légierőnek a német tengeralattjárók tevékenységének felderítésekor problémát okozott a megfigyelők pontatlansága. A teljesítmény alakulásakor a megfigyelők teljesítményeinek ingadozása alapvető kérdéssé vált. További szempont lett az emberi teljesítmény leírása az elektronikus kommunikáció és a kialakuló információelmélet fogalomrendszerében, amikor a személyek e kommunikációs rendszereket használták. A pszichológia terminológiájában így lényeges szerepet kapott a csatorna, az átviteli kapacitás, a zaj, a redundancia és hasonlók. A korszerű figyelemkutatás angol úttörőit e fogalomrendszer segítette abban, hogy a témakör a kialakuló kognitív pszichológia lényeges területévé válhatott. Az információfeldolgozási szemlélet fogalmi és gondolati rendszere a kognitív pszichológia számítógép-metaforájában teljesedett ki. Mindezek fényében nem meglepő, hogy a modern figyelemelméletek kiindulópontja, Broadbent szűrési modellje (pl. Broadbent 1958) egyben a kognitív pszichológia első általános modelljét is jelenti. A hatvanas-hetvenes években alakultak ki azok az információfeldolgozási teóriák, melyek a kognitív pszichológia gondolkodásmódját máig meghatározzák. Valamennyi ekkor alkotott modellnek jelentős mondanivalója van a figyelmi működésekről. Ezekben különböztették meg először az automatikus és kontrollált/figyelmi folyamatokat (pl. Shiffrin-Schneider 1977), a párhuzamosan folyó figyelemelőttes és az egymás utáni lépésekből álló figyelmi működéseket (pl. Neisser 1967), a feldolgozás egymást követő szakaszainak elkülönítési lehetőségeit (pl. Sternberg 1969) vagy az egyes feldolgozási műveletek kapcsolatának a szakaszok egymásutániságától eltérő egyéb elveit (pl. Eriksen-Eriksen 1974). Ezekről a klasszikus modellekről a későbbiekben részletesen is szólunk. A pszichológia történetének furcsasága, hogy a megismerési folyamatok (és így a figyelem) kutatása kezdetben keveset törődött a folyamatokat megalapozó élettani mechanizmusokkal, holott éppen ebben az időben született meg az idegtudományok egyik alapvető felfedezése. Moruzzi és Magoun 1949-ben írta le azt az agytörzsből eredő rendszert, mely az ingerlés modalitásától függetlenül összegzi a beérkező ingerület mértékét, és az ingerületi szintnek megfelelően serkenti az agykérgi működéseket. E rendszer működése a figyelem aktivációs vonatkozásaival kapcsolatban azonnal nyilvánvalóvá vált, a leírt agytörzsi felszálló aktiválórendszernek a figyel- mi szelekcióra gyakorolt hatása azonban csak később vált a figyelemelméletek meghatározó elemévé (Kahneman 1973). A figyelem kutatásának alakulásában lényeges szerepet játszott a „modalitásváltás”-nak is nevezhető témaváltás. Mint majd látni fogjuk, a figyelem kísérletes tanulmányozása a hallás területén indult el. A hatvanas évek közepétől azonban a hangsúly eltolódott a látás felé. Mindez komoly nyomot hagyott mind az elméletek alakulásában, mind a kutatások előterében álló tematikában. A figyelem klasszikus kérdése kezdetben az volt, hogy a figyelmi folyamatok milyen mélyen hatolnak be az információfeldolgozás folyamataiba. Befolyásolja-e a figyelem az észlelés alapfolyamatait, vagy csak a feldolgozás magasabb szintjeire hat? E vita, azaz a szűrés lehetősége a korai vagy a késői szakaszokban, a figyelem kutatásának egyik „örökzöld” témája maradt. A látási kísérletek dominanciáját több tényező motiválta. Az egyik ilyen a látáskutatások általános fejlődése, beleértve az idegtudományi vizsgálatokat. A látórendszer kutatását ugyanis jelentősen megkönnyíti a látással kapcsolatos agyi területek kiterjedése és hozzáférhetősége, szemben a lényegesen kisebb és sokkal nehezebben „megközelíthető” hallókéreggel. A másik tényezőt a számítógépes kísérletezés egyszerűsödése és emiatt fokozott térhódítása jelenti; a képernyő kiváló eszköznek bizonyult a látás kutatásában. A vizuális figyelem kutatásának egyik vezető területe a téri figyelem lett, mégpedig olyan alapvető kérdésekkel, mint az, hogy mekkora területre tudunk figyelni, vagy hány területre figyelünk, egyszerre csak egyre vagy többre is. A téri figyelemmel kapcsolatosan alakult ki az a figyelemnek az észlelésben betöltött szerepével foglalkozó, nagy hatású elmélet, mely szerint az észlelőrendszer egyes moduljainak (ezek funkciója a szín, a hely, a mozgás stb. elemzése) valósághű összekapcsolása a figyelem egyik meghatározó funkciója. A kísérleti pszichológia szinte valamennyi területén a kísérletezést versengő elméletek inspirálják. A téri figyelemnek a vizuális sajátságok összekapcsolásában betöltött szerepével kapcsolatban az alternatív nézet szerint a figyelmi folyamatok nem helyekre, hanem tárgyakra irányulnak, azaz a figyelmi folyamatok nem megelőzik, hanem követik az alakszintézis észlelési folyamatait. (Emlékezzünk arra, hogy erről a Tárgyak, formák és alakok észlelése című fejezetben többször is szó volt.) Nem nehéz felismerni, hogy e kettősségben a figyelmi folyamatoknak az információfeldolgozás „korai szemben késői” hatásának egy lehetséges újrafogalmazását láthatjuk. A vizuális figyelem kutatásának egy további, a nyolcvanas években kialakult vonulata avval a kérdéssel foglalkozik, hogy milyen környezeti hatások vonják magukra a figyelmet, illetve mennyire befolyásolják ezek 320 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem az önkéntelen folyamatok az éppen folyamatban lévő viselkedést. E terület is érinti a figyelem pszichológiájának egyik, jelentős múlttal büszkélkedő problémakörét, az ingerlésben rejlő konfliktusok figyelmi kezelését. A klasz- szikus kísérlet itt a Stroop-helyzet (összefoglalásként lásd MacLeod 1991), melyben a résztvevőnek meg kell neveznie, milyen színnel vannak nyomtatva a szavak. Ha a szó jelentése valamilyen szín, viszont a betűket egy másik színnel nyomtatták (pl. a ZÖLD szó piros színben jelenik meg), a válaszok lelassulnak. A konfliktuseljárásoknak számos változatát alakították ki, és ezek a gyakorlatban mint tesztfeladatok is használhatónak bizonyultak. A figyelem szelekciós vonatkozásai mellett ugyanis egyre fontosabb szerepet kapott a kutatásokban a figyelem magatartás-szabályozó szerepének elemzése, annak a végrehajtó működésnek a vizsgálata, mely biztosítja, hogy a mozgásszervező rendszer a környezetnek az alkalmazkodás szempontjából lényeges vonatkozásához kapcsolódjon. A figyelem kutatásának új lendületet adott a figyelmi folyamatokért felelős idegrendszeri mechanizmusok megismerése. A nyolcvanas évektől erősödött meg az a vonulat, mely a figyelmi zavarok neuropszichológiai elemzésével járult hozzá a fentebb bemutatott területeknek, a téri figyelemnek, a tárgyakhoz kötött figyelemnek és a központi végrehajtó működések idegrendszeri szervezésének megértéséhez. A pszichofiziológiai módszerek közül az eseményhez kötött agyi potenciálok módszere kezdetben a klasszikus „korai szemben késői” figyelmi szelekció kérdéskörében bizonyult döntő jelentőségűnek (a módszert az 1. fejezet Kiváltott potenciál és eseményhez kötött agyi potenciál című szövegdoboza ismerteti). E módszer ugyanis lehetőséget teremt arra, hogy pillanatról pillanatra elemezzük azt, hogy a különböző tényezők, így például a feladatok által megkívánt figyelmi hatások, miként befolyásolják az információfeldolgozás menetét. Ha a figyel- mi működések alacsonyabb szintű szenzoros területek működését is befolyásolhatják, ez komoly érvet jelent a szelekció korai „támadáspontjára”. E módszerek eredményei rámutatnak arra, hogy figyelmi tényezők az inger megjelenését követően már rövid idővel hatékonyak, azonban e módszerek kevéssé alkalmasak azoknak az idegrendszeri területeknek az azonosítására, melyek működése döntő jelentőségű a figyelmi működésekben. Az észlelőrendszer helyi zavarait elemző neuropszichológiai adatok mellett e kérdéskörben az áttörést a kilencvenes évektől alkalmazott modern képalkotó eljárások, a pozitronemissziós tomográfia (PET) és a funkcionális mágneses rezonanciás képalkotás (fMRI) jelentették (ezeket a módszereket részletesebben szintén az 1. fejezet ismerteti). Ezeknek az eljárásoknak a ma ismert legmodernebb változatai sem alkalmasak arra, hogy megfelelő idői felbontásban (ezredmásodpercek) kövessék a figyelmi folyamatok dinamikáját. Ugyanakkor ezekkel a módszerekkel lehetséges az egyes folyamatokban részt vevő agyi rendszerek lokalizációja. Jelenlegi tudásunk a figyelmi mechanizmusokról lényegében a klasszikus pszichológiai kísérletezés, a neuropszichológiai eredmények, az eseményhez kötött agyi aktivitás, a modern képalkotó eljárások és az elemző (sejtek vagy sejtcsoportok aktivitását vizsgáló) idegélettani kutatások integrációjából származik. A figyelem témakörének sajátos furcsasága, hogy azok a kérdéskörök, melyek a mindennapi beszédben a „figyelem” szóhoz kapcsolódnak, és amelyekben a figyelem kísérletes vizsgálata elindult, a modern figyelemkutatásokban némileg háttérbe szorultak. Ha az iskolában a gyerek „nem figyel”, ez általában azt jelenti, hogy valami mással foglalkozik, mint amit a tanár szeretne, talán azért, mert egy idő után már „nem köti le” a tananyag. Ha egy idő után a vezérlőterem operátora nem reagál a jelzésekre, „figyelme lankad”. E példák a figyelem fenntarthatóságára, illetve aktivációs vonatkozására utalnak. E területen, mint említettük, az alapvető kísérleteket a második világháború környékén végezték. Az elemző eljárásokban lényeges szerepet játszottak a szignáldetek- ciós elmélet nyomán kialakult számítások (lásd a Pszichofizika című fejezetben), melyek segítségével elválasztható volt a feldolgozórendszer érzékenységének változása a választ befolyásoló döntési feladatoktól. Az aktivitás és a teljesítmény kapcsolatát jellemző Yerkes-Dodson-törvény (a teljesítmény az aktivitás növekedésével emelkedik, majd elérve egy maximális értéket, csökkenni kezd, a maximum pedig könnyebb feladatoknál magasabb aktivitás mellett adódik, mint nehezebbeknél) pedig még a modern figyelemkutatásokat megelőző időkből, egerek diszkriminációs kísérleteinek eredményeiből származik (YerkesDodson 1908). A teljesítménytől független vegetatív idegrendszeri változások (a bőr elektromos változásai, a keringési rendszer változásai stb.) elemzésében a hatvanas-hetvenes évekre kialakultak a sztenderd eljárások, és hasonló mondható el az agyi elektromos változások aktivitásfüggő elemzéséről (az éberségtől függő elektroencefalográfiás [EEG] módszerekről lásd az 1. fejezetben a szövegdobozt). Bár a számítástechnika ezeken a területeken megváltoztatta az adatfeldolgozási lehetőségeket, alapvető újdonságokkal e terület nem szolgált. Az új, érdekes, váratlan ingerekre megjelenő aktivitásváltozás, az orientációs reakció kutatása a hatvanashetvenes években élte fénykorát. Jevgenyij Nyikolajevics Szokolov ekkor közölte azt a nagy hatású elméletét (Sokolov 1960), mely az idegrendszer modellkialakító működésén és a beérkező ingereknek a modelltől való eltérésén alapul. A teória szerint e diszkrepancia alakítaná ki azt a reakcióegyüttest, mely gyors (fázisos) idegrendszeri változásokból, a vegetatív működések megváltozásából és az ingerfelvételt segítő mozgásos reakciókból áll. Ebben az időszakban az állatkísérleteken alapuló tanulási (kondicionálási) modellek határozták meg a pszichológiai gondolkodást. Szokolov modellje is ebben a keretben alakult ki, és szintén az 321 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem elemi tanulási folyamatok élettani mechanizmusainak elemzésével összekapcsolva fejlesztette tovább az elméletet Grastyán Endre (lásd Vereczkei et al. 1965). A figyelem kutatása így szorosan összekapcsolódott az idegtudományokkal. Mint láttuk, e kapcsolat a későbbiekben lazult, és igen szorossá újra csak a jelen időszakban vált. Magának a kérdéskörnek, az éppen folyó viselkedéshez nem kapcsolódó ingerek hatásának igen finom elemzése – erre már utaltunk – a vizuális figyelem kutatásának egyik központi kérdésköre.
2. A laboratóriumi kísérletezés és a valóság A figyelmi működésekkel kapcsolatos egy-egy kísérletet elolvasva sokakban felmerül a kérdés, mi közük van ezeknek az eljárásoknak a valósághoz. A laboratórium elsötétített szobájában a képernyőn egyszerű alakzatok jelennek meg, a résztvevők pedig válaszgombokat nyomogatnak, „gyorsan, de pontosan”. A kísérletezésnek mégis köze van a valósághoz, hiszen az a célja, hogy modellezze a mindennapokban előforduló helyzeteket. Az egyes helyzetekben előálló jelenségek (esetünkben a figyelmi jelenségek) pedig akkor elemezhetők, ha alaposan megvizsgáljuk azoknak a változóknak a hatásait, melyek befolyásolják a résztvevők teljesítményeit. Egy-egy jellegzetes szituáció modellezését nevezzük kísérleti paradigmának. Amikor a feladat például az, hogy egy objektumot meg kell találni a zavaró objektumok között, keresési paradigmáról beszélünk. A valóságban ilyen feladat, amikor meg kell találnunk autónkat egy bevásárlóközpont parkolójában. A keresést irányíthatja az autó színe, formája stb. A laboratóriumi modell ennek „kísérleti mása”: a résztvevőnek az a feladata, hogy jelezze olyan gyorsan, ahogy csak tudja, hogy a megjelenő képernyőn van-e piros kör. A próbák sorozatában a piros kör, a célinger megjelenésekor az egyik gombot kell lenyomni, ha viszont az adott próbában nincs célinger, akkor a másikat. A képernyőn azonban megjelenhetnek piros négyszögek, zöld körök és zöld négyszögek is. Ezek zavarhatják a piros kör megtalálását. Abból, hogy a zavaró ingerek különböző típusai, a zavaró ingerek száma stb. miként befolyásolja a gombnyomáshoz szükséges időt (ez a reakcióidő), következtetni lehet azokra a belső folyamatokra, melyek a figyelem e működését irányítják. A kísérletek egy másik típusa a szűrési paradigma. Itt azt a helyzetet modellezi a kutató, amikor a viselkedés szempontjából fontos inger forrását kell elkülöníteni más ingeregyüttesekétől egy tárgyakban (objektumokban) gazdag környezetben. A klasszikus példa a „koktélpar- ti”-helyzet. Emlékezzünk arra, hogy erről a helyzetről és észlelési következményeiről a hallási tárgyak szétválasztásával kapcsolatban már szó volt a hallási objektumokról szóló fejezetben. Jusson eszünkbe, hogy a helyzet neve azt a feldolgozási kihívást jelöli, amikor egy teremben sok ember beszélget, többnyire kisebb csoportokban, és a kialakult hangzavarban kell beszélgetőpartnerünk szövegét megérteni. Ez – mint látni fogjuk – az információfeldolgozó rendszert komoly feladat elé állíthatja. A laboratóriumi modellben, a dichotikus hallgatási kísérletben (erről röviden szó volt a hallási észleléssel kapcsolatban) a résztvevők fülhallgatón keresztül jobb és bal fülükben eltérő szövegeket hallanak. Feladatuk lehet például az egyik szöveg folyamatos visszamondása. A kísérletező megvizsgálhatja, miként befolyásolja a másik fülbe adott szöveg a figyelt szöveg visszaadását, vagy vizsgálhatja, hogy a nem figyelt szövegből mire emlékszik a kísérlet résztvevője. Példaként álljon még itt a de- tekciós paradigma. A keresési paradigmához hasonlóan a résztvevőknek ilyenkor is a célinger megjelenését kell jelezniük reakcióidő-helyzetben. A célinger a képernyő olyan helyén jelenik meg, melyre egy figyelmeztető inger általában helyesen, de időnként megtévesztően utal. Kérdés lehet, hogy a figyelmeztetés helyessége (vali- ditása) hogyan befolyásolja a célinger megjelenésére adott reakció idejét. E paradigma azt a helyzetet modellezi, amikor valószínűsítjük, honnan érkezhetnek fontos jelzések, és figyelmünket erre a területre összpontosítjuk. A figyelem pszichológiájának bemutatásakor a főbb paradigmák eredményei szolgáltatják az alapanyagot a figyelmi mechanizmusok megismeréséhez. Az „eredmények” általában két fő csoportba oszthatók. Az egyik a már említett reakcióidő. E mérce használata mögött az a feltételezés húzódik, hogy a hatékony figyelmi működések megakadályozzák, hogy a feldolgozórendszer a fontosak kárára „nem odavaló” információkkal is foglalkozzon. Sőt a figyelmi folyamatok akár serkenthetik is a feladat szempontjából fontos információkat feldolgozó mechanizmusok működését. A nem figyelt ingerek zavaró hatása miatt viszont többletlépésekre lehet szükség, ami lassítja a reakcióidőt. A mércék másik típusa a válaszok pontossága, a hibázások száma. A figyelmi működések kikapcsolhatják az ingerek alternatív értelmezését, csökkenthetik a „nem odavaló” kapcsolatok hatékonyságát, így csökkenhet a hibázások száma. A gyorsaság és a pontosság igen gyakran fordított viszonyban áll egymással: minél gyorsabbak a válaszok, annál több a hiba. Ezért a teljesítmény jellemzésekor e kapcsolatra tekintettel kell lenni. A reakcióidő-adatok általában akkor értelmezhetők, ha változásuk nem jár a pontosság (pl. hibaszám) változásával. Egy további általános megjegyzés a pontosság és a reakcióidő kapcsolatáról: a reakcióidő-adatok általában csak akkor értelmezhetők, ha a hibaszám nem túl magas. 15-20 százalék hibázásnál már komoly okunk van feltételezni, hogy a résztvevők nem alkalmazkodtak a „gyors, mindazonáltal pontos” teljesítés kritériumához. A teljesítményeknek e két alapvető jellemzése számos változatot alakított ki. Így a hibázások esetében olyan mérési lehetőség is van, ahol a teljesítményt tartják azonos szinten, miközben az ingerlés 322 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem sajátságait változtatják: különböző feltételek esetében milyen hosszan kell az ingert adni, hogy a hibaszám például 25 százalék maradjon. Ateljesítmény elemzését egészítik ki a pszichofiziológiai adatok, azaz mindazok, amelyeket a már említett eseményhez kötött potenciálok vagy más idegtudományi módszerek segítségével mérünk.
3. Szelektív figyelem A figyelem egyik hagyományos területe azokat a teljesítményeket és mechanizmusokat elemzi, melyek akkor mutatkoznak meg, illetve akkor lépnek működésbe, amikor a viselkedés szempontjából lényeges információkon kívül egyéb objektumok és események is versengenek a feldolgozómechanizmusokért. A terület klasszikus kutatása a hallással kapcsolatban kezdődött el, a fentebb vázolt ,,koktélparti”-helyzet modellezésével, azaz a dichotikus kísérletekkel. Cherry (1953) klasszikus kísérletében a résztvevők egyszerre két szöveget hallgattak. Az egyik a jobb, a másik a bal fülbe érkezett, az egyikre figyelni kellett, a másikra nem. A figyelmi szelekció követelményét úgy biztosították, hogy a figyelt szöveget folyamatosan vissza kellett mondani. Az ilyen eljárást visszhangzási (shado- wing) technikának nevezik. Ilyenkor a leggyakrabban az érdekli a kutatót, hogy a nem figyelt szövegből mit vesz észre (valójában mit képes felidézni) a résztvevő. Az eredmények szerint nem sokat. Észreveszi, ha a női beszélő helyett férfi folytatja a szövegmondást, viszont nem veszi észre, ha a beszélő átvált egy másik nyelvre. Sőt még az is észrevétlen marad, ha a magnetofonról visszafelé kezdik el lejátszani a beszédet. Úgy tűnik, mintha a nem figyelt ingerforrás feldolgozása megrekedt volna az elemi fizikai sajátságok kiértékelésénél.
3.1. Korai vagy késői szelekció A dichotikus kísérletek egy további tanulságával Broadbent (1958) kísérlete szolgált. Itt a résztvevőnek figyelnie kellett az összes, tehát a mindkét fülébe adott ingerekre. Az ingerek ebben a kísérletben olyan számok voltak, melyek párokban jelentek meg, az egyszerre adott számpárok egyik tagja a jobb, a másik pedig a bal fülbe érkezett. A feladat szerint a számpárokból kialakított sorozatot követően a résztvevőnek vissza kellett mondania a hallott számokat, mégpedig tetszés szerinti sorrendben. Az ilyen kísérletek ugyan az emlékezeti terjedelem vizsgálatának körébe tartoznak, a vizsgálat különlegessége a figyelmi folyamatok tekintetében mégis az, hogy Bro- adbent eljárása új szempontot hoz be a figyelemvizsgálatokba. Ebben a kísérletben a megosztott terjedelmet elemezte, hiszen az ingerek egyik fele az egyik, másik fele pedig a másik oldalról érkezett. A visszamondás során elvileg két szélsőséges eset lehetséges. Az egyik az lenne, hogy először visszamondják az egyik számpárt, majd a másikat, és így tovább. A másik szélsőséges lehetőség szerint először az egyik, majd a másik fülbe érkező ingerek következnének. A válaszokban túlnyomó többségbe került az utóbbi eset. Broadbent egy fontos következtetést vont le a visszhangzási és a megosztott terjedelmi kísérletekből: a figyelmi szelekció mint szűrőmechanizmus működik. A szűrő átengedi a figyelt ingereket, a nem figyelt ingerek viszont fennakadnak rajta. A nem figyelt szöveg elemei azonban nem vesznek el azonnal: egy tárolórendszerben időlegesen megőrződnek, és amikor a szűrő átvált a másik fülre, ennek a tárolónak a tartalmát elő lehet hívni. Ennek a tartalékoló („puffer”) emlékezetnek a tárolási ideje meglehetősen rövid. Ezt az mutatja, hogy a megosztott terjedelmi kísérletekben a személyek lényegesen kevesebb számról szoktak arról az oldalról beszámolni, melynek ingereit később kezdik visszamondani. Az a tény pedig, hogy a visszhangzási kísérletekben a személyek csak az inger alapvető fizikai sajátságait veszik észre, arra utal, hogy a szűrő az információfeldolgozás egy korai szakaszában működik. A korai szűrésre egy olyan szakaszban kerül sor, amelyben a szövegek jelentésével kapcsolatos információk még nem kerültek feldolgozásra. A fentiek alapján Broadbent elméletét a szelektív figyelem korai szűrési modelljének nevezik. A modellt sematikusan az 16.1. ábra mutatja.
323 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem
16.1. ábra. Broadbent korai szűrési modelljének vázlata. A szelektív szűrő egy olyan korlátozott kapacitású rendszert véd a túlterheléstől, mely a szenzoros tárolás és a feldolgozás magasabb szintje között van. Ha a szenzoros tárban („puffer”-tárolóban) lévő információ még hozzáférhető, a szűrő váltásával lehetőség van az eredetileg nem figyelt anyag feldolgozására A Broadbent-modell egy igen fontos alkalmazkodási szempontot vesz tekintetbe: a figyelmi szelekcióra azért van szükség, mert túl sok hatás éri a szervezetet. Azért kell közülük választani, mert a túlterhelés éppen a fontos mozzanatok megfelelő kezelését tenné lehetetlenné. A modell egy további feltételezése szerint a megismerési rendszernek azok a szakaszai különösen érzékenyek, amelyeknek a kapacitása korlátozott. E korlátot a feldolgozás „üvegnyakának” (a palack nyaka mint szűk keresztmetszet) szokták nevezni. Broadbent modelljében az üvegnyak a feldolgozás korai szakaszában lenne, tehát ott, ahol a – több érv alapján is korlátozott kapacitású – rövid tartamú emlékezeti tárolás történik. A szűrő szerepe így az lenne, hogy ezt a tárolási rendszert védje a túlterheléstől. A korai szűrés igen elegáns modellje azonban nehezen magyaráz meg számos kísérleti tényt. Morey már 1959ben felfigyelt arra, hogy a dichotikus kísérletekben a szokásos visszhangzási eljárás résztvevői igen gyakran észreveszik, ha saját nevüket hallják a nem figyelt szövegben. Bár e korai kísérletek eredményeit, mindenekelőtt módszertani problémák miatt, kétségbe lehet vonni, a sajátnév-hatás valódi és megbízhatóan demonstrálható jelenség. Wood és Cowan (1995) modernebb és persze módszertanilag is kifogástalan kísérletezéssel hasonló eredményt kapott, mint Morey. Morey 1959-es vizsgálatában a személyek 33, a későbbi, Wood és Cowan által végzettben pedig 35 százaléka számolt be a saját neve elhangzásáról. Azt mondhatjuk tehát, hogy a broad- benti szűrő „lyukas”. A korai szűrési elmélet a „megosztott terjedelem” vizsgálatokban kapott eredmények szempontjából is problematikusnak bizonyult. Grey és Wedderburn (1960) szótagpárokat adtak a két fülbe, méghozzá úgy, hogy a pár tagjai együttesen értelmes szót alkottak. Amikor például az egyik fülbe a ré szótag érkezne, a másikba apa szótag, a következő párok pedig re és tek, majd a spe és nót szótagok lennének, a beszámoló, ellentétben Broadbent kísérleti tapasztalataival, nem „fülek szerint” történne. A kísérletben részt vevők a répa, a retek és a spenót szavakat mondanák vissza. Az észlelésbe tehát „beavatkozik” az ingeranyag jelentése. A jelentés meghatározó szerepére utalnak Treisman (1960) megfigyelései. Kísérleteiben a vizsgálati személyek visszhangzási feladatban vettek részt. Az ingeranyag olyan értelmes szöveg volt, melyet úgy szerkesztettek meg, hogy a szöveg egy ponton átvándoroljon a másik fülbe. Egy ilyen helyzetben a jobb fülbe például az alábbi szöveg érkezhet: „Az űrhajósok a súlytalanság állapotában csak kisszámú nézőt érdekeltek.” A bal fülbe pedig ez: „A díjnyertes filmek azonban különleges műanyag palackokból ittak. ” A visszhangzási kísérletek korábbi adatai alapján nem várnánk annak a gyakori hibának a megjelenését, amelyet az jellemez, hogy a résztvevők a tartalom szerint folytatták a szöveget, azaz „fület váltottak”. (Olvassuk el megfelelő sorrendben a normál és dőlt betűs mondattöredékeket, azonnal látjuk, hogy hol is van a mondatok természetes folytatódása!) A résztvevők azonban néhány szó után rájönnek a hibára, és visszatérnek a figyelemnek a feladatban megszabott irányára. A tapasztalt figyelmi váltás viszont csak úgy lehetséges, ha a nem figyelt üzenet jelentése is feldolgozásra kerül. A nem figyelt ingerek tehát „betörhetnek” a korlátozott kapacitású rendszerbe, feldolgozásuk mégsem – hacsak nem kivételezett ingerek, mint például a résztvevő neve – vetekszik a figyelt ingerekével. Nem alakul ki róluk tartós emlékezeti reprezentáció. Erre utal Treisman (1964) egy további megfigyelése. A kísérleti helyzet itt is dichotikus hallgatás volt. E kísérletben azonban a résztvevőknek ugyanazt a szöveget adták mindkét fülükbe, 324 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem csak nem ugyanakkor. Mint egy énekkari kánonban, a két fülbe adott szöveg késett egymáshoz képest. A késésnek alapvetően két esete lehetséges: vagy a figyelt fülbe érkező szöveg jön előbb, vagy a nem figyelt fülbe érkező. A kérdés az volt, hogy feltűnik-e a személyeknek az azonosság. Ha igen, akkor a nem figyelt fülbe adott szöveg esetében is meg kell történnie a jelentés szerinti feldolgozásnak. Az eredmények szerint akkor lehet észrevenni a szövegek hasonlóságát, ha a késés nem halad meg egy kritikus időtartamot. Ez az időtartam azonban nem azonos a késés kétféle irányában: ha a nem figyelt szöveg jön előbb, a kritikus időtartam lényegesen alacsonyabb. A nem figyelt szöveget tehát gyorsan elfelejtjük. A korai szűrés elmélete e tények nyomán úgy módosult, hogy a szűrés nem minden-vagy-semmi jellegű. A szelekció úgy működik, hogy a nem figyelt jelek feldolgozása kevésbé intenzív a figyeltekéhez képest, azaz a működés csillapítás, nem pedig szűrés (Treisman 1960), bár a szelekció ettől még „korai” marad. Az információfeldolgozás folyamategyüttesében a szelekciónak egyéb lehetősége is van. A korai szelekció alternatívája, hogy a nem figyelt ingerekről is kialakul a jelentés, azonban ennek nem vagyunk tudatában. Következésképpen nem is tudunk erről beszámolni. Az információfeldolgozás „üvegnyaka” e lehetőség szerint az információfeldolgozó folyamatok késői része, olyan folyamatokkal kapcsolatos, melyek megszabják, mi kerüljön a hosszú tartamra tároló emlékezeti rendszerbe, miről legyenek élményeink, illetve mi irányítsa a magatartást. E késői szelekciós elméletet Deutsch és Deutsch (1963), illetve Norman (1968) nevéhez szokták kötni. A dichoti- kus kísérletek területén a késői szelekcióra példa Lewis (1970) eredménye. A nem figyelt fülbe időnként olyan szavakat adott, melyek a jelentés szintjén álltak kapcsolatban a figyelt szöveggel. Amikor ilyen szavak érkeztek, a figyelt szöveg visszamondása lelassult. MacKay (1973) eredménye szerint a figyelt fülbe adott kétértelmű mondatok jelentésének értelmezését befolyásolta a nem figyelt fülbe adott szavak jelentése. A korai és késői szűrés lehetősége között a hagyományos kísérletezés nem tudott dönteni. Lényegében valamennyi vizsgálattal kapcsolatban felmerültek módszertani vonatkozású ellentmondások. MacKay eredményét például Newstead és Dennis (1979) tette kétségessé. Amikor a nem figyelt fülbe is folyamatos szöveg érkezett, azaz a kritikus szavak nem egyenként, hanem egy mondat részeként jelentek meg, nem mutatkozott meg a Mac- Kay által leírt hatás. Egy további kísérletben Corteen és Wood (1972) egyes szavakat elektromos áramütéssel társított, és ezáltal e szavak mint a veszélyt jelző ingerek fokozott aktivitást, és ezen keresztül ennek vegetatív idegrendszeri mutatóját, a bőr elektromos vezetésének fokozódását váltották ki. A bőrvezetéses válasz (GBR) akkor is megjelent, amikor e szavak a dichotikus kísérletek során a nem figyelt fülbe érkeztek. Dawson és Schell (1982) vizsgálatai szerint azonban ezek az eredmények sem problémamentesek. E szavak megjelenésekor ugyanis a visszamondás időnként lelassult, megakadt. Az elemzések szerint az áramütéssel társított szavak csak ezekben az esetekben váltottak ki vegetatív választ. Az eredmények ilyenkor úgy magyarázhatók, hogy a dichotikus helyzetben a figyelem időről időre átkapcsol a nem figyelt ingerekre. A bőrvezetéses válasz ezek szerint csak akkor jelent meg, amikor a kritikus szavak éppen ezekre a szakaszokra estek. Döntő érveket a vagy-vagy jellegű kérdésfeltevés fogalmi keretében az egyre komplexebb kísérletek sem szolgáltattak (lásd Johnston-Dark 1982). A továbblépést azok a vizsgálatok jelentették, melyekben olyan kérdéseket tettek fel, hogy milyen feltételek mellett szólhatnak bele a felülről lefelé ható (modellvezérelt) folyamatok az észlelési folyamatokba, azonos szelekciós elvek érvényesülnek-e különböző modalitások (látás és hallás) esetében, és milyen mechanizmusok biztosítják a szelekció különböző típusait.
3.1.1. Szelekciós jelenségek a hallásban A feltételekkel kapcsolatosan pszichofiziológiai vizsgálatok eredményeit idézzük. Eseményhez kötött agyi potenciálok (EKP) segítségével a hallókéreg aktivitását több olyan kísérletben vizsgálták, melyek a koktélpartihelyzet dichotikus modelljét a pszichofiziológiai kísérletezés lehetőségei szerint módosították. A módosítás lényege abból fakad, hogy az EKP-módszer alkalmazásakor szükség van az esemény megjelenési idejének pontos meghatározására. A hagyományos dichotikus kísérletekben azonban a szövegek folyamatosan érkeznek, az EKP-méréshez viszont adott időzítéssel megjelenő (tranziens) ingerek, elterjedt szóhasználattal: események kellenek. A szelektív figyelmet vizsgáló akusztikus EKP-kísérletekben általában rövid hangingereket alkalmaznak, melyek – dichotikus ingerlés esetében – véletlenszerűen érkeznek a jobb és a bal fülbe. A résztvevő feladata az, hogy az instrukciónak megfelelő fülbe érkező hangokra figyeljen, és – általában reakcióidő-helyzetben – jelezze, amikor ott egy előre meghatározott inger érkezik. Az elrendezés általában olyan, hogy e célingerek viszonylag ritkán jelennek meg a gyakori (sztenderd) ingerek között. A nem figyelt fülbe hasonló ingerek érkeznek, azaz gyakori (sztenderd) és ritka, ebben az esetben eltérőnek (deviáns) nevezett ingerek. A kísérlet során felváltva, hol a jobb oldali, hol a bal oldali ingerekre kell figyelni. A figyelmi szelekció szempontjából döntő összehasonlításnál azokat az eseményhez kötött potenciálokat hasonlítják össze, melyeket 325 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem a két helyzetben azonos sztenderd hangingerek váltanak ki. A sztenderd ingerek tehát az egyik elrendezésben a figyelt, a másikban pedig a nem figyelt fülbe érkeznek (Hillyard et al. 1973). A módszert alkalmazó nagyszámú kísérletből az a következtetés vonható le, hogy a korai szelekcióra utaló hatás, azaz a szenzoros vagy kötelező EKP-komponens (N1, lapozzunk vissza a módszerismertetéshez [52-53. o.], ha nem emlékszünk rá) méretének (ezt neveztük amplitúdónak) csökkenése az akusztikus szelektív figyelem esetében adott feltételek tejesülése mellett jelenik meg. Az N1 csökken, ha: 1. a hangok gyorsan követik egymást, 2. könnyű eldönteni, hogy az inger a figyelt „csatornán” vagy a nem figyelten érkezik (ilyen eset a jobb szemben bal fül, amit még kiegészíthet az is, hogy jelentősen eltér a két fülbe érkező hangok magassága). A figyelt csatornán belül azonban igen nehéz eldönteni, hogy a hang a sztenderd ingerek közé tartozik-e, vagy célinger. Ilyen helyzet például, ha csak a rövidebb hangokra kell válaszolni, de a hangok hosszúsága között nincs nagy eltérés (Woldorff-Hillyard 1991). E kísérleti helyzetben a feladat megoldása akkor is nehéz lenne, ha a nem figyelt oldalról (a nem figyelt fülbe) egyáltalán nem érkeznének ingerek. Ha viszont a nem figyelt fülbe is érkezik inger, a két fülbe érkező hangok megkülönböztetése viszonylag könnyű feladat. Hagyjuk el most a laboratóriumot rövid időre, és gondoljuk el, mi történik egy valóságos koktélpartin. Amint arról a hallási objektumok észleléséről szóló fejezetben szó volt, a különböző forrásból érkező hanghullámok összegződéséből a dobhártyán olyan komplex nyomásváltozási mintázat alakul ki, amelyben nem különül el a „fontos” a „nem fontos”-tól. Mint azt a hallási észlelésnél megismerhettük, a szétválasztás a hallási feldolgozórendszer feladata. Ez a szétválasztás alapvetően az egyes hangfolyamok szabályszerűségére épít (emlékezzünk a hallási színtérelemzésről tanultakra). Az elemzés során kialakuló modellünk határozza meg a figyelmi feldolgozást: a feladat szempontjából fontos hangfolyam szabályszerűségeit keresi vissza a feldolgozórendszer a beérkező komplex együttesből. A nem figyelt beszélgetések sorsa attól függ, hogy a feldolgozórendszer képes-e, és ha igen, milyen eredménnyel képes annyi modellt működtetni egyszerre, hogy a nem figyelt ingernek is megmaradjon valamilyen hatása. Szelekciós jelenségek a látásban Most nézzük meg, miként érvényesülnek a szelekciós jelenségek a vizuális modalitásban. A vizuális rendszer feladata látszólag egyszerűbb. A fény egyenes vonalban terjed, így az érzékelőrendszer perifériáján, a retinán megőrződnek a téri viszonyok: az egyes objektumok így elkülönülnek egymástól. Ráadásul a látószerv közismerten úgy épül fel, hogy a szemmozgató apparátus az éles látás területére azokat az objektumokat irányíthatja, melyek a pillanatnyi viselkedés szolgálatában állnak. Egyszerűen kifejezve: oda nézünk, ahova figyelünk. Mint az lenni szokott, a helyzet ennél azért jóval bonyolultabb. Két alapvető kérdés is felmerül: 1. Szükségszerűen oda nézünk-e, ahova figyelünk (és fordítva)? 2. A vizuális világ hierarchikusan beágyazott, azaz a kérdés az, hogy „Mit látunk? Az erdőt, a fát, az ágat, a levelet?”. Ha az erdőre figyelünk, ez azt jelenti-e, hogy egyben az ágra is figyelünk? Vagy ha az ágra figyelünk, a figyelem kiterjed-e az egész fára, és netalán magára az erdőre? Ha például a figyelem szelektíven a hierarchia egy szintjére irányul, a perceptuális rendszer központi mechanizmusainak kell megvalósítania azt, hogy a feldolgozás során az aktuális viselkedés szempontjából lényeges szint részesüljön előnyben.
3.2. Figyelem és fixáció, implicit és explicit figyelmi váltás Az előzőekben feltett első kérdést (Ahova nézünk, oda figyelünk, és fordítva, ahova figyelünk, oda nézünk?) rögtön válasszuk két részre. Először nézzük meg, igaz-e, hogy ahova nézünk, oda figyelünk? Mack és Rock (1998) kísérlete könnyen meggyőz arról, hogy ez nem így van. A kísérletükben részt vevőknek az volt a feladatuk, hogy döntsék el, a látómezőben felvillanó kereszt függőleges vagy vízszintes vonala hosszabb-e. Kéthárom ilyen bemutató próba után következett a kritikus próba. Ekkor a kereszt mellett megjelent egy fekete vagy színes idom, vagy egy mozgó vonal, miközben a feladat ugyanaz volt, mint a megelőző próbákban. E kritikus próba után a résztvevőket megkérdezték, láttak-e valamit a kereszten kívül, akármit, ami az előző próbában nem volt a képernyőn. A vizsgálat különböző változatait az első közlés óta eltelt évek során mintegy 5000 személlyel végezték el. Az eredmények azt mutatják, hogy a résztvevők mintegy negyede egyáltalán nem vette észre a megjelenő mintát. Ezt a jelenséget nevezzük nemfigyelési vakságnak. Még ennél is furcsább, hogy a kísérletnek egy olyan változatában, amelyben a kereszt nem ott volt, ahova a személyeknek fixálniuk kellett, a minta viszont igen, a nemfigyelési jelenség még intenzívebbnek bizonyult. A fixációs pontban megjelenő színes foltot a résztvevők háromnegyede ennek ellenére sem vette észre. Ajelenség klasszikus demonstrációja Neisser (1979) nevéhez fűződik, aki az akusztikus koktélparti-jelenség vizuális megfelelőjét igyekezett előállítani. Ebben a kísérletben két videojelenetet másoltak össze. Mindkettőben három-három személy vett részt, és mindkettőben egy kosárlabdát dobáltak egymásnak. A két jelenet szereplőit annak alapján lehetett megkülönböztetni egymástól, hogy eltérő színű trikót viseltek. A vizsgálat résztvevőjének az volt a feladata, hogy az egyik „csapatot” figyelje, és minden olyan alkalommal nyomjon meg egy gombot, 326 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem amikor a játékosok a labdát átpasszolják egy másik csapattagnak. Mintegy fél perc elteltével egy női alak, kinyitott sárga esernyővel, átsétált a színen. Ez ugyan így leírva kiugró eseménynek tűnhet, a kísérletben részt vevő huszonnyolc személy közül azonban mindössze hatan számoltak be az esernyős nőről. A többiek észre sem vették ezt a változást, holott abban az esetben, ha nem kellett figyelni az egyik jelenetet, az esernyős nőt mindenki észlelte. Neisser „esernyős nő”- kísérletének eredménye „meglepő és mulatságos”. Kevésbé vidám azonban Haines (idézi O’Regan 2001) eredménye. Haines gyakorlott pilótákat vizsgált szimulátorban. A feladatot úgy alakították ki, hogy a leszállási manőver közben a kifutópálya kellős közepén megjelent egy repülőgép. Az elvárások szerint a pilóta ilyenkor azonnal beszünteti a leszállást. Nyolc pilóta közül azonban kettő, mintha mi sem történt volna, leszállt a kifutópályát elálló repülőn keresztül. Amikor videón bemutatták nekik a leszállást, rémületükben visz- szavonulásukat fontolgatták. E jelenségkör – ahogy nevezték – „a vizuális figyelem sötét oldala” (Chun-Marois 2002), később még vissza is térünk rá. Kérdésünk második része arról szólt, hogy figyelhetünk-e máshová, mint ahova fixálunk. E kérdésre a válasz határozottan igenlő. A figyelem explicit váltásáról beszélünk akkor, amikor a látótér egy területére fixálunk, majd szemünk egy másik pontra irányul, mert ott van az az objektum, ami felkeltette figyelmünket. A figyelem implicit váltása viszont akkor következik be, amikor a fixáció nem változik, mégis máshova figyelünk. A figyelem implicit áthelyezésének, s így a fixáció és a figyelem elválasztott hatásának vizsgálatát Posner (pl. Posner et al. 1978) módszere terjesztette el (a Posner-paradigmával egy más aspektusból már foglalkoztunk a multimodális integrációról szóló fejezetben). Ha emlékszünk rá, e kísérleti paradigmában az ingerek száma kicsi. Az eredeti vizuális változatban a résztvevőknek egy adott területre kell irányítaniuk a figyelem fókuszát – és nem máshova. A feladat tehát a téri fókuszált figyelmi működéseket vizsgálja. A feladatnak két típusa van. Mindkét esetben a személy a mező közepére fixál. Ezután centrális jelzőinger esetében a mező közepén jelzés jelenik meg a feladat szempontjából releváns inger valószínű helyéről (például egy nyíl jelzi, hogy 80 százalék valószínűséggel a jobb oldalon jelenik meg a célinger). A célinger megjelenése egyszerű detekciós feladatot követelhet (például a szürke négyszög kivilágosodik, és erre a reakcióidő-feltételben gombnyomásos választ kell adni), de lehet diszkriminációs feladat is (például az egyik lehetséges betű esetén az egyik, a másik esetén a másik gombot kell megnyomni). A feladat e változatában a személy akaratlagosan helyezi át a figyelmi fókuszt a nagy valószínűséggel releváns helyre. Kontrollként olyan helyzet szolgál, ahol a jelzőinger arra utal, hogy egyenlő valószínűséggel jelenik meg a célinger a lehetséges helyeken. A feladat másik típusa periferiális jelzéseket használ. A próba itt is a fixációval kezdődik. A mezőben ezután egy feltűnő változás mutatkozik (például a két oldalon látható szürke négyszögek egyike, a jelzőinger kivilágosodik). Ezt követően megjelenik a célinger (a feladat itt is detekció vagy diszkrimináció). E változatban a jelzőinger önkéntelenül magára vonja a figyelmet, a célinger így vagy egy figyelt, vagy egy nem figyelt területre esik. A Posner-paradigma két típusának vázlatát a 16.2. ábra mutatja. Az eredmények arra utalnak, hogy a kontrollhelyzethez képest a reakcióidő csökken akkor, ha a figyelmeztető inger valid, azaz a célinger azon a helyen jelenik meg, amelyre a jelzőinger utal, viszont növekszik az invalid, azaz másutt megjelenő jelzőinger esetében. A viselkedés szintjén így a fokális téri figyelem a nyereség-veszteség elvén működik. A figyelt területen a feldolgozás hatékonyságának ára van, a feldolgozás lassulása következik be, mégpedig a nem figyelt területeken megjelenő ingerek rovására.
21.1. táblázat A FIGYELMI SZELEKCIÓ IDEGRENDSZERI MECHANIZMUSAI A vizuális rendszer kérgi szerveződésében alapvető az információfeldolgozás két fő iránya. E kérdéskört az észlelés pszichológiája részletesen is tárgyalja, de fontossága miatt a vizuális figyelemmel kapcsolatosan is foglalkoznunk kell vele. A két nagy irány (feldolgozó kör vagy áramlás) egyike, a dorzális rendszer a mediális temporális (MT), majd a hátsó temporális területek felé irányul, működését a dorzo- laterális prefrontális kéreg befolyásolja. E rendszer a téri lokalizációval, mozgásokkal foglalkozik. Ezt egyszerűsítve gyakran „Hol?” rendszernek nevezik (lásd a Mozgásészlelés című fejezetet). A másik, a ventrális rendszer az alsó temporális területek felé irányul, és a ventrolaterális prefrontális kéreggel van kapcsolatban (pl. Ungerleider-Mishkin 1982). E rendszer feladata a tárgyazonosítás, így „Mi?” rendszernek szokták nevezni (bővebben lásd a tárgyészlelésről és a tárgyreprezentációról szóló fejezetet). (A látórendszer ventrális és dorzális áramlatának „Mi” és „Hol” rendszerként való megfogalmazása alternatívájaként Goodale [Goodale-Milner 1992, Goodale 2001] felveti, hogy helyesebb lenne e két rendszert mint a „percepció” és az „akció” rendszerét meghatározni. Az előbbi a néző helyzetétől független, részletes reprezentációkat alkotna, míg az utóbbi a személyközpontú 327 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem térből kiindulva határozná meg a tárgyakra irányuló cselekvéseket. E felfogásban is döntő a két rendszer összehangolt működése a cél irányította viselkedésben, azaz e dichotómia sem tételez fel valamiféle „tisztán kognitív” észlelőrendszert. A továbbiakban azonban megmaradunk az inkább leíró jellegű „Mi” és „Hol” metaforánál.) A két rendszer működése egymással a legkülönbözőbb szinteken összekapcsolódik, továbbá szoros kapcsolatban áll a talamikus területekkel (így a szelekciós folyamatokban lényeges pulvinar maggal), valamint a szemmozgások szerveződésében működő területekkel, így az akaratlagos működésekben lényeges frontális szemmezővel, illetve a reflexes mozgások szervezésében közreműködő középagyi területekkel (colliculus superior). A téri figyelemben természetesen alapvetően szerepet játszanak azok a dorzális rendszerhez kapcsolódó területek, amelyekre a talamusz is befolyást gyakorol. A figyelmi hatásokkal kapcsolatban lényeges eredmények születtek a vizuális rendszer V4 területének vizsgálatakor. A V4-sejtek receptív mezeje lényegesen nagyobb (20-100-szorosa) a látórendszer alacsonyabb szintjein (V1, V2) lévő sejtek receptív mezőjénél. (Emlékezzünk, a látás alapfolyamatainál már megtanultuk, hogy a receptív mező a látómezőnek az a területe, amelyen egy inger az éppen vizsgált sejt aktivitásában változást idézhet elő.) E receptív mező mérete szokványos olvasási távolságból nagyjából megfelel egy szokványos betű méretének. A V4 sejtjei retinotópiásak. A V4 sejtjeinek működésében számos figyelmi hatás demonstrálható. Moran és Desimone (1985) klasszikus kísérletében majmok egy késleltetett összemérési feladatot végeztek. Felvillantottak egy mintaingert, majd egy idő után olyan azonos vagy eltérő inger következett, amelyet ugyanazon a helyen jelenítettek meg. A kísérletben a majom akkor kapott jutalmat, ha az azonos ingerekre gyorsan reagált. Egyes próbákban zavaró ingereket is adtak a mező más területére. Ezek nem befolyásolták a majom válaszát: sikeres volt a vizuális szelekciós működés. Az irreleváns ingerekre a V4-sejtekben az aktivitás lényegesen kisebb volt, mint a releváns ingerekre (a csökkenés a 60 százalékot is elérte). Ez a csökkenés azonban csak akkor jött létre, amikor a receptív mezőben volt egy figyelt inger is. Ha például a sejt érzékeny volt egy piros vonalra, és azt nem a célinger helyén adták, de a receptív mezején belül, a tüzelés erre az ingerre csökkent. Ha viszont a receptív mezőn kívül volt a zavaró inger, a sejt tüzelése nem változott a zavaró inger hatására. Következésképpen az egyes sejtek között nem mutatkozott gátló kölcsönhatás a V4-ben. A negatív hatás akkor mutatkozott meg, ha mind a releváns, mind pedig az irreleváns hely a sejt receptív mezején belül volt. A V4 esetében tehát a téri figyelem úgy működik, hogy a receptív mezon belüli irreleváns területekről gátlódik az információátvitel. A mechanizmus így szűrésnek (gyengítésnek) tűnik, nem pedig a releváns ingerek szelektív facilitációjának. Más volt a helyzet olyan kísérletekben, ahol a célinger és a zavaró inger valamilyen nehezen elkülöníthető sajátságban tért el (a diszkrimináció így intenzív figyelmi működést kívánt), és az ingereket egyenként adták. Spitzer és munkatársai (1988) a szín- és az iránydiszkrimináció nehézségét változtatva úgy találták, hogy a sejtek hangolási görbéje (az érzékenység változásának mértéke attól függően, hogy mennyire optimális az inger vonalainak iránya az adott sejt ingerlése szempontjából) szűkül, ha a diszkrimináció nehezebb. Azaz a sejt ilyenkor szelektívebben reagál. Haenny és munkatársai (1988) eredményei szerint a tanulmányozott 192 V4sejt fele erősen reagált akkor, ha a majom olyan orientációjú rácsmintát kapott, amilyenre az előzetes jelzőinger utalt, azonban gyengén, ha másmilyen volt a rács orientációja. Ha olyan diszkriminációs kísérletet végeztek, ahol a kisebb intenzitású inger volt a célinger (halványabb, kisebb, lassabb mozgású) a V4 sértése jelentősen lerontotta a teljesítményt. Ha viszont az intenzívebb inger volt a célinger, akkor nem. LaBerge (1995) interpretációja szerint a V4 területre érkeznek azok a talamikus (a pulvinar magból eredő) hatások, melyek a gyenge, de releváns inger esetében a hatást erősítik. A téri figyelem rendszeréhez tartozik a szemmozgások szabályozásában szereplő colliculus supe- rior és a talamikus területek is. A téri lokalizációval kapcsolatos információk a poszterior parietális kéregben valószínűleg egy nagyobb terület sejtjeinek hálózatában elosztottan reprezentálódnak, nem topográfiailag követve az egyes téri helyeket, mint például az elsődleges látókéregben (a V1-ben). La- Berge (1995) modellje szerint a poszterior parietális kéregben a lokalizáció finomítását, azaz a hálózatok érzékenyebbé tételét (élesítését) a talamuszból érkező aktivitás végzi. A poszterior parietális kéreg téri információt kódoló sejtjei információt küldenek a frontális szemmezőbe és a dorzolaterális kéreg munkaemlékezet-funkciót végző területeibe csakúgy, mint a szemmozgásokat irányító colliculus superior felé és a mozgásokat vezérlő (elülső) kérgi területekhez. A colliculus superior azáltal, hogy a figyelemfelkeltő ingerekre a frontális szemmezőkkel és a poszterior parietális kéreggel együtt irányítja a szemmozgásokat, továbbá kapcsolatban van más szenzoros rendszerekkel is, a téri figyelemnek jelentős tényezője. Ez hozzájárulhat a szakkádok közötti információfelvétel serkentéséhez is. 328 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem
A prefrontális kéreg és a poszterior parietális kéreg viszonyában Goldman-Rakic és munkatársai (1993) kutatásai mutatták ki a szoros funkcionális együttműködést. A kísérletben késleltetett okulomo- toros választ kívánó feladatot adtak. Az állatoknak szemmozgásokat kellett végezniük a vizuális célingerre, melyet néhány másodperccel korábban villantottak fel. Egyszerre regisztráltak sejtaktivitást a poszterior parietális kéregben és a prefrontális kéregben. Találtak olyan sejtpárokat a két képletben, melyek hasonló kisülési mintázatot mutattak az ingereket követően. Voltak olyan párok, melyek a téri helyzet kijelölésekor sültek ki együtt, voltak olyanok, melyek a késleltetés néhány másodperce alatt, végül voltak olyanok, amelyek a célzott szemmozgások idején. A talamusz szerepét a vizuális figyelmi folyamatokban többször is kiemeltük. Talamikus hatások a kéreg egyes részeiben aktivitásnövekedést okozhatnak. Ennek megfelelően a pulvinarban a PET-mód- szerekkel aktivitásnövekedést lehet regisztrálni olyan figyelmi feladatokban, ahol a célinger és a zavaró ingerek igen közel helyezkednek el egymáshoz, és így a feladat nagymértékben igényel fokális figyelmet (LaBergeBuchsbaum 1990). E talamikus területek működését valószínűleg a prefrontális területek (közvetett, a poszterior parietális kéreg bevonásával) befolyásolják. E hatások igen intenzívek lehetnek, és nem csupán a perceptuális feldolgozásra lehetnek hatással, hanem a zavaró ingerek által serkentett motoros válaszokat is gátolhatják. Megakadályozhatják továbbá olyan, általában figyelemfelhívó ingerek hatását, mint amilyenek a hirtelen megjelenő környezeti ingerek (Bacon-Egeth 1994). A kép nem lenne teljes, ha nem említenénk meg, hogy e figyelmi mechanizmusokra hatással vannak az aktivitást általánosan befolyásoló modulációs rendszerek. Posner (1993) a következő mechanizmust tételezi fel. Majomkísérletek eredményei szerint a téri vizuális rendszer fentebb említett területei, a poszterior parietális lebeny és a talamusz pulvinar magja erős inputot kap a locus coeruleusból, így valószínűsíthető, hogy ez a rendszer jelentős mértékben noradrenalin-hatás alatt áll. A hatás aszimmetrikus: lényegesen nagyobb a jobb, mint a bal féltekében. Abban az esetben, ha a noradrenalin-rendszernek ezt a hatását blokkolják (Clark et al. 1989), a téri figyelem szelektivitása csökken: Posner-típusú figyelmi kísérletekben az invalid ingerek esetében ilyenkor kisebb lesz a reakcióidő-növekedés, mint a szokásos. A figyelem akaratlagos és önkéntelen fókuszálása egy lényeges szempontból különbözik: az önkéntelen folyamatok lényegesen gyorsabbak. A gyorsaság úgy mérhető, hogy a jelzőinger és a célinger megjelenése közötti időtartamot (ingerkezdeti aszimmetria) változtatják. A periferiális jelzőingerek már 80-100 ms ingerkezdeti aszimmetria esetében hatékonyak, a centrális jelzőingerek viszont csak kb. 200 ms elmúltával.
16.2. ábra. A téri figyelem Posner-paradigmájának vázlata. Az ábra felső része a centrális jelzőinger változatotmutatja, ahol a célinger valószínű helyét szimbolikus jelzőinger mutatja. Az ábra alsó része a periferiális jelzőinger változat, ahol a jelzőinger automatikus figyelemváltást eredményez Az akusztikus szelektív figyelem vizsgálatához hasonlóan a fokális vizuális figyelem vizsgálatában is elterjedt az EKP-módszerek használata. Az eseményhez kötött agyi potenciálokat alkalmazó feladatokban a vizsgált személytől, hasonlóan a viselkedéses vizsgálatokhoz, azt kérik, hogy középre fixáljon. Az ingerek azonban két oldalon jelennek meg, az egyik oldalon a figyelt ingerek, a másikon pedig a nem figyeltek. A módszer „hagyományos” változatában egy-egy ingersorozaton belül a figyelt ingerek mindvégig ugyanott voltak. A feladatban a figyelt helyre érkező ingerek közül a ritkán bemutatott célingerekre kellett választ adni, a gyakori (sztenderd) ingerekre viszont nem. Több vizsgálatban a teljesítménymérési eljáráshoz közelebb álló módszert használtak, azaz minden egyes próbában külön-külön jelezték a célinger megjelenésének valószínű helyét. E kísérletekben – az akusztikus szelektív figyelmi kísérletekhez hasonlóan – összehasonlították, milyen eltérések vannak a figyelt és a nem figyelt területre adott sztenderd ingerek között. Az eredmények a téri fokális figyelem 329 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem észlelésen belüli hatására utaltak. A nem figyelt területre érkező ingerekhez képest a figyelt területre érkezők nagyobb aktivitást váltottak ki, mégpedig viszonylag korán, az inger megjelenését követően 80-110 ezredmásod- perccel. Az eseményhez kötött agyi potenciálok megnövekedett amplitúdójú P1 elnevezésű (lásd az idegtudományi módszereket leíró bevezető fejezetben, 52-53. o.) hullámösszetevője a látórendszer viszonylag alacsony szintjeinek (prestriatális kéreg) aktivitásával áll kapcsolatban. Hasonló hatásra utal egy valamivel későbbi hullámnak, az N1 komponensnek a figyelmi helyzetben megfigyelhető nagyságváltozása (pl. Mangouon-Hillyard et al. 1988). Az EKP-módszerrel végzett vizsgálatok azon túlmenően, hogy megmutatták a fokális figyelem viszonylag korai, s így vélhetően a perceptuális feldolgozás megváltozásán keresztül érvényesülő hatását, arra is rámutattak, hogy a nyereség-veszteség viselkedéses hatása hátterében valószínűleg eltérő mechanizmusok rejlenek. A semleges helyzethez képest a figyelmi területen az N1 komponens megnő, viszont a nem figyelt területen nem csökken. A P1 komponens azonban a figyelt területen a kontrollhoz képest nem nő, viszont a nem figyelt területen csökken (Luck et al. 1994).
3.3. Gátlási folyamatok a figyelmi szelekcióban A figyelmi szelekció többféle mechanizmussal befolyásolhatja az ingerek versengését a feldolgozási kapacitásokért. Lehetséges például olyan serkentési folyamatok működtetése is, melyek erősítik, kiemelik bizonyos információknak a hatékonyabb feldolgozását. Az is lehetséges azonban, hogy a nem figyelt ingerek feldolgozása elakad valahol a feldolgozás során (ez lenne a szigorúan vett korai vagy késői szűrés). Működhet továbbá egy olyan mechanizmus is, mely nem blokkolja az irreleváns ingerek feldolgozását, hanem feldolgozza, de gátlás alá helyezi őket. Ebben az esetben a nem figyelt ingerek rögződnének az emlékezet valamely rendszerében, de e reprezentáció gátlás alá kerülne. Több kísérlet eredményei is rámutatnak erre a hatásra. A jelenség, amely ennek a gátlásnak a létezésére utal, a negatív előfeszítés. Ennek lényege Tipper és munkatársai (1991) egyik kísérletével illusztrálható. A résztvevőknek célingerként mindennapi tárgyakat mutattak, és ezeket olyan gyorsan kellett megnevezniük, ahogy csak tudták. A 16.3. ábrán bemutatott változatban a célinger a mező közepén (a fixációs pontban) volt, miközben mellette megjelent egy másik ábra is. Más kísérletekben a két ábrát egymásra rajzolták, mégpedig két különböző színnel, a feladat pedig az adott színnel rajzolt ábra megnevezése volt (például a zöld színnel rajzolt ábrákat kellett megnevezni, a másik ábra pedig pirossal volt rajzolva).
16.3. ábra. Negatív előfeszítési helyzet. A feladat a középső ábra megnevezése, vokális reakcióidő-helyzetben. A kontrollpár esetében a zavaró és a célingerek között nincsen kapcsolat. Az elutasított ismétlése esetében a pár első tagjának zavaró ábrája megegyezik a pár második tagjának célingerével A vizsgálatban a próbák párosával követték egymást, a kritikus változó a párok közötti viszony volt. A szokásos terminológia szerint a próbapár első tagját előfeszítő (priming) ingernek nevezik, a pár másik tagja pedig a próbainger. A párok egyik típusában az ingerpár valamennyi ábrája eltérő volt (két eltérő célinger és két eltérő zavaró inger; kontrollfeltétel). A párok egy másik típusában viszont a pár első tagjának zavaró ingere a pár második tagjában célingerré vált. Így e párokban az elutasított ábrát ismételték meg. Az ilyen és ehhez hasonlító kísérletek általános tanulsága az, hogy az elutasított ismétlés esetében a reakcióidő megnő. Amikor tehát egy olyan inger követel figyelmet, melyet előzőleg „ki kellett szűrni”, nem egyszerűen az történik, hogy az előzetesen zavaró inger feldolgozása valahol elakad. Ennél többről van szó: az emlékezeti reprezentáció gátlás alá kerül. (Az emlékezet gátlási folyamataival bővebben más kurzus, tankönyvként pedig a Csépe-Győri-Ragó [szerk.]: Általános pszichológia. 2. Tanulás és emlékezés kötete foglalkozik.) A negatív előfeszítés jelensége
330 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem nemcsak objektumok reprezentációjára alakulhat ki, hanem helyekre is. Ehhez olyan elrendezést alakítanak ki, amelyben a résztvevőknek a célinger helyét kell megtalálniuk, ám az előző próbában ezen a helyen zavaró inger volt (Tipper-McLa- ren 1990). Vegyük észre, hogy a negatív előfeszítési hatás a késői szelekciós működés tipikus példája: ahhoz, hogy a jelenség létrejöjjön, az előzőleg zavaró ingert azonosítani kellett. Az azonosításnak el kell érnie a jelentés szintjét, mivel a negatív előfeszítő hatás akkor is érvényesül, ha az elutasított ismétlésben az ingerek nem egyeznek meg egymással, hanem csak jelentésalapú (szemantikai) kapcsolatban (rokonságban) állnak egymással (Tipper-Driver 1988).
3.4. Interferencia és figyelmi szelekció A figyelmi szelekcióra akkor is szükség van, amikor egyetlen objektum észlelése többféle, egymást kölcsönösen kizáró választendenciát aktiválhat. A Stroop-paradigma egyik változatát, melyben színeket kellett megnevezni, miközben a színes betűkből összeállított szó jelentése egy másik szín volt, már említettük. A paradigmának az első leírás óta számos változatát alakították ki. A téri változatban például egy téglalapot mutatnak be, és felette vagy alatta egy szó jelenik meg. A feladat annak jelzése – reakcióidő-helyzetben -, hogy a szó a téglalap alatt vagy felett volt-e. Mármost abban az esetben, ha a téglalap alatt a FELETTE szó vagy felette az ALATTA szó jelenik meg (inkompatibilis próbák), a reakcióidő lassul azokhoz a szavakhoz képest, amelyek nem jelölnek téri helyzetet, és még jobban ahhoz a helyzethez képest, amikor a szó téri helyre utaló jelentése és a pozíció kompatibilis (a Stroop-kísérletekről összefoglalóul lásd MacLeod 1991). A Stroop-feladat tipikus változataiban jellemző a hatás aszimmetriája. Ha megfordítják a feladatot, azaz el kell olvasni a bemutatott szót, nem mutatkozik inkompatibilitási hatás: a betűk színe vagy a szó helyzete a téglalap pozíciójához képest nem lassítja a válaszokat. A magyarázatok legegyszerűbb lehetőségét a versenymodell adná. Kompatibilis helyzetben, feltételezve, hogy a jelentés szerinti feldolgozás gyorsabb, ennek eredménye előbb éri el a válaszszervezés rendszerét. Inkompatibilis esetben viszont a helyes válaszhoz egy központi rendszer korrekciós működésére van szükség. Valóban, azokban a kísérletekben, melyekben Stroop-helyzetet használva elemezték az agyi aktivitást, úgy találták, hogy az inkompatibilis próbákban azokon a területeken is nő az aktivitás (pl. elülső cinguláris kéreg) mely területeknek hasonló szerepet tulajdonítanak (pl. MarkelaLerenc et al. 2004, Milham et al. 2001). A versenymodell azonban több támogató eredmény ellenére is túl egyszerűnek látszik. Hiába végeztek például olyan kísérleteket, amelyekben lelassították a jelentés szerinti feldolgozást (nehezebben olvashatóvá tették a szavakat), a hatás nem fordult meg. A Stroop-hatás elképzelhetően nem egyszerűen mennyiségi eltéréseken (a feldolgozási sebesség különbsége) alapul, hanem a viselkedésszervezés két szintjének kölcsönhatásán. Az egyik esetben a kapcsolatok automatizálódtak. Felnőtt, gyakorlott olvasó személyeknél ilyen kapcsolat van például a szó írott alakja és jelentése között: nem tudunk egy (mindenekelőtt ismert) szót akár csak rövid időre is úgy megnézni, hogy ne olvasnánk el. A másik kapcsolat viszont speciálisabb: viszonylag ritkán kerülünk olyan helyzetbe, amikor például viselkedésünk geometriai alakzatok és betűsorok téri viszonyain alapul. Az ilyen kapcsolatok reprezentációja munkaemlékezeti aktivitást, figyelmi feldolgozást igényel (Glaser-Glaser 1989). Az információfeldolgozás e két típusával később még részletesen foglalkozunk.
16.4. ábra. Az Eriksen- (zaj/kompatibilitási) paradigma vázlata. A feladat választásos reakcióidő. A kompatibilis próbában a zavaró karakterek megegyeznek a célingerrel, az inkompatibilis feltételben a zavaró karakterek az alternatív célingerek, a kontrollfeltételben a zavaró karakterek nem szerepelnek célingerként Figyelem, ébrenlét, alvás Míg a Stroop-feladatban egyetlen objektum sajátságai okoznak interferenciajelenségeket (itt válaszadási konflikust), egy másik szelektív figyelmi paradigma azt teszi lehetővé, hogy szétválasszuk a versengő válaszokhoz vezető ingereket. E kísérleti elrendezés több, a későbbiekben tárgyalandó kérdéskör szempontjából is lényeges. A zaj/kompatibilitási eljárást Eriksen (pl. Eriksen-Eriksen 1974) dolgozta ki, ennek egyik változatát mutatja be vázlatosan a 16.4. ábra. A feladat során a résztvevőnek választásos reakcióidő-helyzetben kell arról döntenie, hogy a mező közepén (ezt fixációs pont jelzi) lévő betű két bemutatási lehetősége (példánkban S és H) közül melyik jelenik meg. A résztvevőnek az a feladata, hogy az egy-egy betűnek megfelelő gombok egyikét nyomja meg, illetve jobbra vagy balra mozgasson egy billentyűt. A feladat végrehajtása során azonban e betűk
331 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem (célingerek) mellett megjelennek további, zavaró ingerek is. A kontrollfeltételben ezeknek semmi közük sincs a célingerekhez, jelenlétük egyfajta „semleges zaj”. A kompatibilis feltételben a további betűk megegyeznek a célingerrel, az inkompatibilis feltételben viszont olyan betűk a zavaró ingerek, melyek a kísérleti próbák sorozatában alternatív célingerként szerepelnek. E paradigma általános eredménye szerint az inkompatibilis feltételben a reakcióidő a kontrollfeltételhez képest nő, a kompatibilis feltételben viszont csökken. Egyelőre azt a következtetést vonhatjuk le az eredményekből, hogy a figyelmi szelekció nem azt jelenti, hogy a feldolgozórendszer „eltünteti” a mező irreleváns részét akkor, amikor már előbb rendelkezett az arra vonatkozó információval, hogy a vizuális mezőnek melyik a fontos, és melyik a nem fontos része. Ez azt jelenti, hogy az irreleváns információ is eljuthat a válaszszervezés szintjére, és befolyásolhatja a válasz megjelenésének gyorsaságát. A kérdés az, hogy mikor jut el, és mikor nem.
3.5. Szelekció és terhelés A figyelmi szelekció szűrési mechanizmusa az alkalmazkodást segítő, rugalmas működés, az információfeldolgozó rendszer terheléséhez igazodik. Ha nagyobb a terhelés, a szűrés következtében kevésbé érvényesülnek a zavaró ingerek. Ha viszont kisebb a terhelés, a szűrőmechanizmus kevésbé szigorú lesz. Illusztrációként Lavie (1995) azon kísérlete szolgálhat, mely az Eriksen-kísérlet (zaj/kompatibilitás paradigma) egy változata. A kísérletben azt elemezték, hogy a zavaró inger (a vizuális mezőben a célingerrel együtt megjelenő betű, amely az alternatív válaszhoz kötődik) hatása hogyan változik a terheléstől függően. Az alacsony terhelés esetén az Erik- sen-típusú feladatban a célingertől távolabb egyetlen olyan zavaró inger volt, mely az alternatív válaszhoz kapcsolódott. A magas terheléses feltételben a célinger mellett ezenkívül még több, semleges (egyik válaszhoz sem kötődő) betű is megjelent. Ebben az esetben az ingerekben gazdagabb mezőből kellett kiválasztani a feladatban releváns betűt. Az eredmények érdekessége, hogy magasabb terhelésnél a reakcióidő az alacsony terhelési helyzetben mérhetőhöz képest kisebb mértékben emelkedett az alternatív válaszhoz kötődő zavaró inger hatására. Úgy tűnik, mintha magasabb terhelésnél a figyelmi szelekció hatására már gyengült volna a vizuális mező távolabbi területeinek hatása, így azoknak a zavaró ingereknek a hatása is, amelyek a célingertől távolabb voltak. Hasonló eredmény adódott akkor is, amikor a terhelés nem perceptuális jellegű volt, hanem a mező közepén megjelenő ingerekkel bonyolultabb feladatot kellett végezni. E feladatokban a válasz jellegét nem egyetlen karakter határozta meg. A célinger mellett megjelent egy további jelzés is, mely arról tájékoztatott, hogy kell-e egyáltalán reakciót adni, vagy sem (stopszignál). E helyzetben szintén csökkent a mező valamivel távolibb részén megjelenő zavaró ingerek hatása. A szűrés mértékét a feladat reprezentációs rendszere és ezen keresztül a központi végrehajtó rendszer (ez anatómiailag a frontális struktúrákat jelenti) befolyásolja. Ezt a szempontot illusztrálják azok a kísérletek (Lavie – De Fockert 2005), melyekben a munkaemlékezet rendszerét egy másik feladattal is terhelték. A személyeknek az Eriksen-típusú feladat próbáit megelőzően, egy emlékezeti feladat során különböző ingereket kellett megjegyezniük, az emlékezeti teljesítményt pedig időről időre tesztelték. Ilyenkor a perceptuális terhelés hatására nem csökkent a zavarási hatás, azaz a végrehajtó rendszer mintegy „el volt foglalva” az emlékezeti feladattal.
3.6. A téri figyelem kiterjedése Az eddigiek alapján az a kép rajzolódik ki, hogy a téri figyelem hatására valamely terület „privilegizált” helyzetbe kerül, tehát azok az objektumok, melyek e területre vetülnek, előnyben részesülnek az információfeldolgozás folyamán. A téri figyelmet már William James is úgy jellemezte, mint valamiféle reflektorfényt, mely megvilágítja a vizuális tér egy kisebb területét. A terheléssel változó szelekciós hatás azonban megmutatta, hogy a téri figyelem kiterjedése bonyolultabb szabályozás alatt áll annál, mint amit a reflektorfény-metafora meg tud ragadni. A reflektor fénye ugyanis azonos távolságban azonos méretű területet világít meg, bár a reflektor fényét különböző helyekre lehet irányítani. A téri figyelmi terület azonban nem állandó. Ha a körülmények úgy kívánják, a figyelt terület szűkebb, ha viszont a helyzet azt követeli, a terület nagyobb. A figyelem e sajátsága kapcsán a zoomlencse-metafora megfelelőbb lehet, mint a reflektorfény. A „látószög” változtatható, de ennek az ára a felbontóképesség csökkenése lenne a nagyobb figyelmi terület esetében (Eriksen – St. James 1986). Valahogy úgy, mint a digitális kamera esetében: a pixelek száma állandó, így abban az esetben, ha nagyobb a látószög, egy-egy pixel a valóság egy nagyobb darabját reprezentálja, mint akkor, ha szűkítjük a látószöget. Azonban a változó látószögű lencse is csupán metafora. A téri figyelemnek olyan sajátosságai is vannak, amelyek nem jellemzik az ilyen objektíveket.
332 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem LaBerge (1983) kísérletsorozata rámutat a zoomlencsejellegű működés lényegére, de a hasonlat határaira is. Kísérletei meglehetősen komplexek, mivel a résztvevők egyetlen sorozaton belül két feladathoz tartozó próbákat végeztek el. Az egyik feladatnak az volt a szerepe, hogy beállítsa a figyelt terület nagyságát, a másiknak pedig az, hogy tesztelhetővé váljon, ez a beállítás valóban megtörtént-e. A figyelt területet beállító feladatnak két változata volt: az egyik széles, nagyobb kiterjedésű figyelmi területet igényelt, a másik pedig leszűkítette a figyelmi területet. Nagyobb figyelt területet kívánt az a feladat, melyben a résztvevőknek (reakcióidőhelyzetben) arról kellett dönteniük, hogy egy ötbetűs szó személynév vagy sem, mivel itt tekintetbe kellett venni azt az egész területet, melyet öt betű foglalt el. Amikor viszont arról kellett dönteni, hogy egy öt karakterből álló sorban a középső egy meghatározott betű-e vagy sem, a figyelt mező leszűkült egyetlen karakterre. Voltak tehát olyan sorozatok, ahol – ha a figyelmi fókusz mérete egyáltalán változhat – a figyelt terület várhatóan nagyobb, és olyanok, ahol kisebb. E feladat próbái közé beiktatták annak a másik feladatnak a próbáit, amely azt tesztelte, hogy tényleg változik-e a figyelt terület nagysága. Ezekben vagy öt + jel jelent meg egy sorban (+ + + + +), vagy négy + jel és egy szám (pl. + 7 + + +). A résztvevő akkor adott gombnyomásos választ, ha a sorban valahol megjelent a szám. Azt várjuk, hogy amennyiben az információfeldolgozás gyorsabb a figyelt területen, a szélesre beállított figyelmi terület esetében mindegy, hogy középen vagy a karaktersor szélén jelenik-e meg a szám. Ekkor ugyanis így is, úgy is a figyelt területre esik. Ez azt is jelenti viszont, hogy szűk figyelt mező estében csak a középső karakter kerül a figyelem fókuszába. Ilyenkor várható, hogy a középen megjelenő számra gyorsabb lesz a reakcióidő, mint a széleken megjelenő számokra. Az eredmények pontosan így alakultak. Szófelismerési feladatba keverve a számdetekciót, a reakcióidő azonos volt, bárhol jelent meg a szám a + jelek között. Amikor viszont azonosítani kellett a középső betűt, a reakcióidő a + + 7 + + esetben volt a legrövidebb, valamivel hosszabb a + 7 + + + esetben, és a leghosszabb a + + + + 7 próbákban, azaz a pozícióreakcióidő függvény V alakot mutatott (16.5. ábra).
16.5. ábra. LaBerge (1983) kísérletének vázlata. A beállító feladat hatására szélesebb (szóazonosítás) vagy szűkebb (betűazonosítás) figyelmi fókusz alakul ki. Ezt teszteli a számdetekciós feladat. Az eredmények szerint széles figyelmi fókusz esetén a szám helye nem befolyásolja a reakcióidőt, szűk fókusz esetén viszont a reakcióidő függ a szám helyétől A figyelt terület nagysága tehát változhat, ahogy ezt a zoomlencse-metafora jellemzi, de a feldolgozás hatékonysága a figyelt területen belül sem egyenletes: a leghatékonyabb feldolgozás területét egy olyan sáv veszi körül, ahol a hatékonyság fokozatosan csökken. Ez a jellegzetesség túlmutat a zoomlencse-metaforán. LaBerge és Brown (1989) a téri figyelmet inkább egy olyan változtatható sávszélességű szűrőhöz hasonlították, amely a középponttól távolodva egyre csökkenti a feldolgozás hatékonyságát (kisebb az áteresztés). A figyelmi terület e változékonysága tehát egyaránt függ a mentális terheléstől, valamint a feladat által megszabott fókuszálási követelményektől. A téri figyelmi modellek tehát alkalmasak arra, hogy kezeljék a bevezetőben említett egyik kérdést: hogyan lehetséges, hogy figyelhetünk az erdőre, de figyelhetünk a fára vagy a faágra is. A téri figyelem jellegét illusztráló metaforáknak van egy közös sugallatuk: a figyelt terület megszakítás nélküli, egyetlen, a vizuális mező összefüggő részére terjed ki. De valóban így van-e? Tudunk-e egyszerre két olyan területre figyelni, melyeket nem figyelt rész választ el? E kérdés megválaszolásában ismét az Eriksen-feladat egy változata segít. E változatban a feladat nem választásos reakcióidő (pl. S vagy H betű volt-e a célinger), hanem összemérési feladat. Ilyenkor egy ingerpárt mutatnak be, és a résztvevőknek reakcióidő-helyzetben azt kell eldönteniük, hogy a pár tagjai azonosak-e vagy különbözőek. Az Eriksen-feladatra alkalmazva leggyakrabban olyan elrendezést használnak, amelyben két összevetendő betű között egy irreleváns betű helyezkedik el. Az „azonos” próbákban két helyzetet lehet összevetni: azt, amelyben az irreleváns betű 333 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem megegyezik a célingerekkel (három azonos karakter), és azt, amelyben nincs ilyen egyezés, azaz a képernyőn nem csupa azonos betű van, a helyes válasz mégis az „azonos” (Eriksen-Schultz 1979). A figyelt terület megszakíthatóságát Kramer és Hahn (1995) e kísérleti típusban vizsgálták, és az volt a kérdésük, hogy van-e olyan helyzet, amelyben a két releváns inger közötti zavaró karakternek nem érvényesül a zavaró hatása. Úgy találták, hogy igen. A kognitív pszichológiai kísérletezés gyakoribb ingerbemutatási eljárásakor az ingerek egy üres mezőben villannak fel, tehát mint új objektumok jelennek meg. Van azonban az ingerbemutatásnak egy másik lehetősége is. Ilyenkor gyunk megosztani a figyelem fókuszába eső területet. Az új objektumok megjelenésének kiemelkedő szerepét az önkéntelen figyelmi folyamatok tárgyalásakor később még részletesen elemezzük.
16.6. ábra. Ingeradás új objektum megjelenése nélkül. A képernyőn a későbbi ingerek valamennyi lehetséges szegmentuma jelen van. Maga az inger úgy alakul ki, hogy egyes szegmentumok eltűnnek Figyelem, ébrenlét, alvás
3.7. ÖSSZEFOGLALÁS 1. A figyelem modern kutatásai az információelmélet kialakulásával és a gyakorlat követelményei miatt váltak alapvető témává a pszichológiában. 2. Az ingerekben gazdag környezetből az információfeldolgozó rendszernek ki kell emelnie azokat a mozzanatokat, melyek lényegesek az adott motivált viselkedés szempontjából. E követelmény a figyelmi szelekció. Ugyanakkor a váratlan, de potenciálisan jelentős események feldolgozására is alkalmasnak kell lennie a figyelem rendszerének. 3. Szelektív figyelmi folyamatok az információfeldolgozás korai szakaszában és a válaszok szerveződésének szintjén egyaránt működnek. 4. A vizuális figyelem egyik lényeges vonása a látótér egy adott területének kiemelt feldolgozása. E figyelt terület mérete nem rögzített, nagyságát a viselkedés szabályozásának követelményei lényegesen befolyásolják. 5. A figyelmi folyamatok serkentő hatásával párhuzamosan azokon a területeken, melyekre nem irányul figyelem, gátlási működések tapasztalhatók. Gátlási jelenségek akadályozzák azoknak a tárgyaknak a feldolgozását is, melyek előzetesen figyelt tárgyak feldolgozását zavarták.
3.8. KULCSFOGALMAK Broadbent-modell, dichotikus hallgatási kísérlet, fokális figyelem, negatív előfeszítés, szűrőmechanizmus, vissz- hangzási technika
3.9. ELLENŐRZŐ KÉRDÉSEK 334 Created by XMLmind XSL-FO Converter.
16. FEJEZET – Figyelem: szelekció, téri figyelem 1. Mi jellemzi a dichotikus ingeradást? 2. Miért nevezik Broadbent elméletét korai szelekciós modellnek? 3. Milyen érvek szólnak a csillapítási modell mellett? 4. Milyen pszichofiziológiai eredmények szólnak a figyelmi folyamatok korai hatása mellett? 5. Mi a negatív előfeszítési hatás? 6. Miben jelentkezik a Stroop-paradigma aszimmetriája? 7. A téri figyelem áthelyezésének milyen két fő típusa van? 8. Hogyan változik a téri figyelem a terhelés hatására? 9. Melyek a téri figyelem reflektorfény-metaforájának határai? 10.
Milyen körülmények között lehetséges két egyidejű figyelmi fókusz?
335 Created by XMLmind XSL-FO Converter.
22. fejezet - 17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény 1. A figyelem és a tárgyak A téri figyelemnek jelentős szerepet tulajdonítanak a valósághű észlelésben. Azt az elméletet, amely a figyelemnek ezt a szerepét magyarázza és a működés jellegzetességeit foglalja össze, Treisman nyomán sajátságintegrációs elméletnek nevezzük (pl. Treisman-Gelade 1980). Megjegyezzük, hogy a magyar nyelvű publikációkban gyakran szinonimaként használatos a tulajdonság-, illetve vonásintegráció kifejezés is (az angol feature megfelelőjeként). Emlékezzünk, kötetünk észlelésfejezeteiben sokszor foglalkoztunk azzal, hogy az egyes ingersajátságok feldolgozásában hányféle alrendszer működik. A látás feldolgozófolyamatainál szó esett a színekre, irányokra, téri lokalizációra stb. érzékeny alrendszereknek, „moduloknak” az észlelésben játszott szerepéről. Részletesen szó volt arról is a Tárgyak, formák és alakok észlelése című fejezetben, hogy e vonásérzékeny alrendszerek kimenetének össze kell kapcsolódniuk a tárgyészlelésben. Azt a kérdést, hogy az agy ezt miként, milyen mechanizmusok segítségével valósíthatja meg, összekapcsolási (binding) problémának nevezzük. Treisman sajátságintegrációs modellje szerint a környezetnek megfelelően, tehát valósághűen, a figyelem fókuszában kapcsolódnak össze az egyes modulokban végzett feldolgozás eredményei. Mivel az elmélet a vizuális figyelem egyik kiemelkedően sokat elemzett paradigmájára, a vizuális keresésre épít, először ezt az eljárást mutatjuk be. A paradigma alapváltozatában a vizuális mezőben egyszerre több objektum jelenik meg. A résztvevőnek azt kell jeleznie, hogy egy előre meghatározott objektum szerepel-e a képernyőn látottak között. A vizuális keresés két alapvető típusát, valamint a kísérletek tipikus eredményeinek sémáját a 17.1. ábra mutatja be. A keresési feladatban mérhető az az idő, amely a döntéshez kell, de vizsgálható annak a hatékony ingertartamnak a hossza is, amely egy adott teljesítményszint eléréséhez szükséges. A hatékony ingerhossz úgy állítható be, hogy a kép bemutatását a feldolgozást megakasztó, elfedő inger vagy maszk követi. A maszk hatására a kép eltűnése után az utóhatások nem állnak a feldolgozórendszer rendelkezésére (pl. Ber- gen-Julesz 1983). Ha olyan célinger jelenlétéről kell dönteni, mely valamely sajátságában eltér a zavaró ingerektől (például zárt alakzat, szemben a két vonalból álló zavaró ingerekkel), akkor a teljesítményt (a legtöbb kísérletben a reakcióidőt) nem befolyásolja a zavaró elemek száma. A 17.1. ábra bal oldala a sajátságkeresés ilyen eredményét mutatja. (A „különböző” válasz gyakran hosszabb időt igényel, mint az „azonos”, ennek okaival itt nem foglalkozunk.) A másik esetben, a konjunkciós keresésnél a sajátságok együttese határozza meg a célingert. A 17.1. ábra jobb oldalának példájában a célinger esetében az egyik vonal felezi a másikat (T betű), és ennek jelenlétét kell detektálni azonos sajátságok más együttesei között (a két vonal az egyik végéhez közel találkozik a másikkal). A keresési teljesítmény ilyenkor a zavaró ingerek számával csökken (nő a reakcióidő). A zavaró ingerek számának függvényében a reakcióidő növekedése kétszer akkora, ha a válasz negatív (nem volt jelen a célinger), mint akkor, ha jelen volt.
17.1. ábra. A vizuális keresés két típusa. A sajátságkeresés esetén a célingernek van olyan sajátsága, mely nincs meg a zavaró elemeknél. A konjunkciós keresésnél az elemek azonosak, csak kapcsolódásuk tér el. Az ábra alsó részén a tipikus eredmények láthatók: sajátságkeresés esetén a zavaró elemek számával a reakcióidő nem változik, konjunkciós keresésénél viszont a reakcióidő (a szeriális önbefejező modellnek megfelelően) nő Az eredmények ilyen együttesét egyszerűen magyarázza a szeriális önbefejező információfeldolgozási mechanizmus. A mezőben megjelenő elemek feldolgozása egymás után (szeriálisan) történik, és akkor ér véget, 336 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény amikor a feldolgozórendszer megtalálja a célingert. Ha egy ingersorozat reakcióidőinek átlagát számítjuk ki, akkor az átlagba minden beleszámít, azaz azok az esetek, amikor a találat szinte azonnali, azok, amelyeknél ehhez az egész mezőt végig kell pásztázni, valamint azok, amelyeknél a találat a középső értékhez közeli. Az átlag így az elemek felénél lesz. Mindig végig kell azonban pásztázni a „felfedezéshez” az egész mezőt akkor, ha nincs a mezőben célinger. A megvizsgált elemek száma tehát átlagában duplája a „pozitív” próbákénak, ez pedig az elemszám-reakcióidő görbe kétszeres meredekségéhez vezet. Treisman sajátságintegrációs elmélete szerint az észlelés folyamatában kezdetben specializált, az egyes ingersajátságokra érzékeny modulok reagálnak. A modulok működése egyidejű. E rendszerekben reprezentálódik a szín, a kontúrok iránya, a nagyság, a téri elhelyezkedés stb. Erre utalnak azok az idegtudományi adatok is, amelyekről az észleléssel foglalkozó fejezetekben már szó volt. Láthattuk, hogy ezekben a rendszerekben az inger egyes sajátságait „térképek” reprezentálják: színtérkép, iránytérkép stb. A téri helyzet térképének azonban különleges szerepe van. (Ennek komplexitását felidézendő, visszalapozhatunk a Tér- és mélységészlelés című fejezethez). A téri térképen a rendszer valamennyi sajátság helyét regisztrálja. Treisman „vezértérképnek” (master map) nevezte azt a térképet, amelyen rögzíteni lehet és össze lehet kapcsolni azokat a sajátságokat, melyekre a figyelem irányul. (A térkép szó némileg kétértelmű. A szín-, irány- stb. térképeknél a szó metaforikus használata nyilvánvaló. A vezértérkép, lévén téri reprezentáció, egy lépéssel közelebb van a szó konkrét értelméhez. Olyan reprezentációként képzelhető el, ahol a tulajdonságváltozások helye reprezentálódik.) A téri vezértérképnek azon a területén, melyre a figyelmi fókusz irányul, a sajátságok mintegy „összeragadva” alakítják ki a tárgyak reprezentációit. Mivel a téri figyelmi folyamat szekvenciálisan pásztázza a vezértérképet, a konjunkciós keresés kísérleti elrendezésében kialakul a jellemző szeriális önbefejező folyamatra utaló eredmények rendszere. Mi történik viszont a sajátságkeresés esetében, amikor a zavaró elemek számának nincs hatása a reakcióidőre? A téri figyelmi működés nélkül a sajátságok összekapcsolása nem megy ugyan végbe, azonban a sajátságtérkép inhomogenitása (a sajátságok téri eloszlásában változás van) elindítja a válaszszervezési folyamatokat. Treisman erre vonatkozó modelljét a 17.2. ábra mutatja.
17.2. ábra. Treisman sajátságintegrációs modelljének vázlata. A sajátságmappákon reprezentált tulajdonságok a téri figyelem hatására kapcsolódnak össze A helyek szerinti pásztázás folyamatára utalnak Treisman (1986) kísérleti eredményei. Abban az esetben, ha konjunkciós keresésnél a célinger helyét előre jelezték, a reakcióidő lecsökkent. Amikor viszont a jelzéssel ellentétben másutt volt a célinger (invalid jelzés), a keresési idő nem nőtt a jelzés nélküli helyzethez képest. A magyarázat az, hogy invalid jelzésnél és jelzés nélküli helyzetben egyaránt szükség van a szeriális letapogatási folyamatra. A sajátságintegrációs elméletet alátámasztják az illuzórikus konjunkciókkal kapcsolatos megfigyelések. Azokon a területeken, melyekre nem irányul téri figyelem, az objektumok sajátságegyütteséről gyakran hibásan számolnak be a kísérleti személyek: az egyik objektum valamely sajátsága egy másik objektum valamely sajátságával kapcsolódik össze. Az illuzórikus konjunkció jelenségét legjobban Treisman és Schmidt (1982) kísérlete illusztrálja. A személyeknek rövid időre bemutattak két számot és három színes betűt. Az elsődleges feladat a számok azonosítása volt, de ezután meg kellett mondaniuk, milyen betűket láttak, és ezek milyen színűek voltak. E másodlagos feladatban a hibázások száma nem volt csekély, ám a hibázások nem véletlenszerűen jelentkeztek: általában olyan betűkről számoltak be, melyeket valójában bemutattak, és a színek
337 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény is megfelelőek voltak, csak éppen nem a megfelelő betűhöz kapcsolódtak. A hibák tehát a sajátságok kombinációjában mutatkoztak meg. Treisman elméletének újabb változatai (pl. Treisman 1993) több irányban fejlesztették tovább az eredeti modellt. Ezek egyik megállapítása, hogy a sajátságok összekapcsolásával egy olyan emlékezeti reprezentációs forma, a „tárgymappa” (objectfile; Kahneman et al. 1992) jön létre, melyben együtt tárolódnak a sajátságok. Ezek az együtt tárolt sajátságok megőrzik állandóságukat a tárgyak mozgása és apró módosulása esetében is (ha röptében egy madár eltűnik egy fa mögött, majd egy repülő jön elő helyette, alaposan meglepődünk). Az elmélet szerint a tárgymappákban tárolt sajátságegyüttesnek még nincs jelentése (nem kategorizált). A felismerés folyamatában a tárgymappák tartalma kerül összemérésre a szemantikus emlékezetben lévő egységekkel. Az elmélet továbbfejlesztéseiben azokat az eredményeket is figyelembe vették, melyek arra utalnak, hogy a konjunkciós keresésnél nem minden esetben szeriális önbefejező feldolgozás történik. Az adatok értelmezésekor felvetődött, hogy a vizuális mező figyelmi pásztázása nem véletlenszerű. Befolyásolhatja a zavaró ingerek csoportosulása (több zavaró inger együttesen, egyszerre utasítható el; Duncan-Humphreys 1987). Wolfe irányított keresési modellje szerint serkentő hatások érhetik a „vezértérkép” olyan helyeit, ahol a célingerek megjelenése valószínűsíthető (pl. Wolfe 1994). E modellben az egyes ingersajátságok, attól függően, hogy mennyire emelkednek ki a vizuális mező egyéb sajátságai közül, kialakítanak egy aktivitási hierarchiát. A keresés sorrendje az aktivitási hierarchiát követi, a legnagyobb aktivitástól kezdődően a kevésbé aktívak felé haladva. Az aktivitást két tényező határozza meg: a sajátság fizikai tulajdonságainak eltérése a többitől, valamint a feladat által meghatározott fontosság (relevancia). Így konjunkciós keresésnél e felülről lefelé irányuló hatás a célingerek valamennyi sajátságát serkenti, ami az ilyen objektumokat előbbre hozza a keresés folyamatában. A sajátságintegráció elmélete szerint a téri figyelem megelőzi az alakképződést. Az ingersajátságok összekapcsolódhatnak figyelmi folyamatok nélkül is, legalábbis akkor, ha a vizuális mezőben e sajátságok összekapcsolódását nem zavarják hasonló sajátságokkal rendelkező objektumok. A téri figyelem eddig bemutatott eredményei alapján úgy tűnhet, hogy a figyelem meghatározója a látómezőnek valamilyen szögfokokkal vagy akár „magassági és szélességi koordinátákkal” megadott része. A figyelmi működések azonban nem csupán helyekre irányulhatnak, a figyelmet a vizuális mező tárgyai is irányíthatják. Erre utalnak azok a vizsgálatok, melyek eredményei szerint az alakszerveződés elemi folyamatai megelőzhetik a figyelmi szelekció folyamatait. Ez annyit jelent, hogy tárgyak (objektumok) jelenlétében a figyelmi folyamatok nem szükségszerűen téri koordináta-rendszer szerint szerveződnek, azaz a figyelt terület ilyenkor nem a tárgyaktól függetlenül működő „reflektorfény”, hanem a figyelt terület az adott tárgy(ak) által elfoglalt terület, illetőleg maga a tárgy. Azok a kísérletek, melyek eredményei a tárgyakhoz kötődő figyelem megnyilvánulására utalnak, ingerként általában kevés és jól meghatározható objektumot mutatnak be. A tárgyakhoz kötődő figyelem mindmáig legtöbbet idézett demonstrációja Duncan (1984) kísérlete. Ennek a kísérletnek az eredményei azt jelzik, hogy ugyanazoknak a vizuális sajátságoknak a feldolgozása hosszabb bemutatási időt igényel, ha ezek a sajátságok több objektumnak a részei, mint akkor, amikor csak egynek. A tipikus kísérleti helyzetben a személyeknek rövid időre olyan ingereket mutattak be, mint amilyenek a 17.3. ábra a) részén láthatók. Az ingerek két „objektumot” tartalmaznak: egy téglalapot és egy vonalat. A kísérlet során mindkét objektum esetében két tulajdonság változott. A téglalap lehetett hosszú vagy rövid, továbbá a nyílás lehetett a bal vagy a jobb oldalon. A vonal dőlhetett előre vagy hátra, továbbá állhatott pontokból vagy vonalkákból. Az ingereket rövid időre mutatták be, és a detekciós teljesítményt (hibázások száma) vizsgálták. Az egyik feladat az volt, hogy a személyek egyetlen kitüntetett tulajdonságról számoljanak be (például melyik oldalon van a lyuk). A másik feladatban már két tulajdonságról kellett beszámolni. Ebben az esetben a két tulajdonság vagy egyetlen objektumhoz kapcsolódott (például milyen a vonal iránya, és milyen elemekből áll), vagy két objektum között oszlott meg (például milyen a vonal iránya, és hosszú vagy rövid-e a téglalap). Az eredményekből kitűnt, hogy 1. ha két tulajdonság egyetlen objektumon van, akkor a beszámolási teljesítmény két sajátság esetében nem rosszabb, mint egy esetében; 2. ha a két tulajdonság azonos objektumhoz tartozik, jobb a beszámolási teljesítmény, mint akkor, ha két objektum között oszlik meg ugyanaz a két tulajdonság. Tekintve, hogy a két objektumot nem a hely határozta meg (egymást átfedték a mezőben), feltételezhető, hogy a figyelmet nem a lokalizáció, hanem az alak befolyásolta. Vecera és Farah (1994) kísérleti eredményei megerősítették azt a feltételezést, hogy az objektumalapú szelekciót nem téri hatások közvetítik. Ezt úgy vizsgálták, hogy a két objektumot elválasztották egymástól; az egyik a látómező egyik, a másik a látómező másik oldalán jelent meg. Ha a teljesítményben a téri közvetítés a meghatározó, az várható, hogy nőni fog az egyetlen objektum előnye. Ilyen hatás nem jelentkezett. Hasonló eredményt kaphatunk olyankor, amikor nem a detekció pontosságát, hanem a reakcióidőt mérjük (Czigler-Balázs 1998).
338 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény A téri és az objektumokhoz kötődő figyelem együttes hatását mutatja Egly, Driver és Rafal (1994) vizsgálata. A kísérlet alapja a téri figyelem tárgyalásánál bemutatott egyik paradigma: a vizuális mező egy területén perifériás jelzőinger jelenik meg, és azt vizsgálják, nő-e ezen a területen a detekciós reakcióidő. A kísérleti elrendezés jellegzetességeit a 17.3. ábra b) része szemlélteti. A feladat során a vizuális mezőben folyamatosan két objektum, két hosszúkás téglalap volt látható. A jelzőinger az egyik téglalap egyik sarkának világosságváltozása volt. Amennyiben az ingerek erre a területre kerültek, az e valid jelzést követő célingerek rövidebb reakcióidőt eredményeztek. Igazán érdekes eredmény az invalid helyek esetében mutatkozott. Ekkor ugyanis annak ellenére, hogy a helyek azonos távolságra voltak a jelzőingertől, rövidebb volt a reakcióidő akkor, amikor a jelzett objektum másik sarkában jelent meg a célinger, mint akkor, amikor magán a másik objektumon.
17.3.ábra. A tárgyhoz kötődő figyelem két kísérleti demonstrációjának vázlata. a) Duncan (1984) kísérlete, ahol két egymásra rajzolt objektum tulajdonságairól kellett beszámolni. 1. Egy objektum egy tulajdonságának detekciója. 2. Egy objektum két tulajdonságának detekciója. 3. Két objektum egy-egy tulajdonságának detekciója. b) Egly és munkatársai (1994) kísérlete, ahol a téri figyelem hatását „felülírja” a tárgyhoz kötött figyelem. 1, 2, 3 – A tesztinger lehetséges helye A vizuális objektumok esetében a sajátságok azonosítását megelőzi maguknak az objektumoknak a reprezentációja. Ehhez meggyőző érvekkel szolgálnak a Pylyshyn és Storm (1988) által végzett többszörös tárgykövetési vizsgálatokból származó adatok. E kísérletekben a vizuális mezőben több (8-24) azonos, egyszerű tárgy (pl. kör, pont) jelenik meg. Ezekből néhánynak azonban átmenetileg megváltozik valamilyen sajátsága, és ezért hirtelen megkülönböztethetővé válik a többitől (például e körök vagy pontok néhányszor felvillannak). Ezek a kijelölt objektumok. Ezután valamennyi, most már újra azonos objektum összevissza mozog a képernyőn. A vizsgált személy feladata az, hogy a kijelölt objektumokat kövesse. Valamennyi idő (pl. 10 s) elteltével felvillan az egyik objektum, a vizsgált személynek pedig el kell döntenie, hogy ez az objektum a kijelöltek közé tartozik-e vagy sem. Pylyshyn és Storm (1988) eredményei szerint 10 azonos objektum közül 5 követése sikeres lehet. Az objektumok mennyisége és a mozgások sebessége alapján nem valószínűsíthető, hogy a figyelmi fókusz pillanatról pillanatra, egyedenként regisztrálja és raktározza az objektumok helyét. Így ami tárolódhat, az maximum öt individuális objektum, azaz olyan objektum, ami megtartja azonosságát (nem keveredik össze a többivel).
22.1. táblázat 339 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény
NEUROPSZICHOLÓGIAI VIZSGÁLATOK A TÁRGYAKHOZ ÉS AZ OBJEKTUMOKHOZ KÖTÖTT FIGYELEMRŐL A központi idegrendszer helyi sérüléseinek hatását elemző neuropszichológiai vizsgálatok a figyelmi működések szerveződésének számos sajátságára mutatnak rá. Az elsődleges vizuális kéreg féloldali sérülésekor a lézióval ellenoldalon szenzoros károsodás mutatkozik: az érintett látótérben megjelenő fényfelvillanásokat az ilyen betegek detektálják. Mindazonáltal e hemianopiás betegek – különösen akkor, ha a parafoveális területek megtartottak – viszonylag jól kompenzálhatják a sérülést. Bár nem tanácsos, de vannak olyan betegek, akik károsodásuk ellenére autót is vezetnek. E személyek viszonylag jó kompenzációs működésével szemben azok a sérültek, akiknél a temporoparietális területek érintettek, gyakorta az életvezetést befolyásoló súlyos tüneteket mutatnak, a vizuális neglektet. A neglekt előfordulása lényegesen gyakoribb a jobb oldal sérülésekor, mint a bal oldali esetében. Komoly esetben a beteg teljesen elhanyagolja a sérüléssel ellenkező oldalt. (Emlékeztetünk az idegrendszer felépítésében domináns ellenoldali beidegződésre: a jobb oldali működések a központi idegrendszerben a bal oldalhoz kapcsolódnak, és fordítva.) Olyan eset is volt, hogy akkor, amikor látogatója ezen az oldalon állt, nem fordult felé, nem ette meg az ételt a tányér sérüléssel ellentétes oldaláról, nem borotválkozott az egyik oldalon, és így tovább. Az ábra jellegzetes neglektes rajzokat mutat. A neglekt enyhébb formája, a kioltás (extinkció) rávilágít, hogy e sérülés a figyelmi rendszert érinti. A kioltás egyik demonstrációjánál a beteget arra kérik, hogy fixálja a vizsgálat vezetőjének arcát, és számoljon be arról, milyen tárgyat mutatnak be az egyik, és milyen tárgyat a másik vizuális mezőben. A beteg viszont gyakorta beszámol a lézióval ellenoldali tárgyról, ha azt önmagában mutatják be. Ha viszont a lézióval azonos oldalon is bemutatnak egy tárgyat, az ellenoldali tárgyról nem tud beszámolni, a másik tárgy „kioltja” az észlelést. Több ilyen beteggel végzett vizsgálat arra utal, hogy a sérülés megakadályozza, hogy a figyelem áthelyeződjön a sérüléssel ellentétes oldalra, mivel a figyelem nem válik le az ép terület által reprezentált területről. Több neglektes beteg vizsgálata során olyan eredmények mutatkoztak, melyek rámutatnak arra is, hogy a neglekt mögött egy igen bonyolult rendszer károsodása állhat. Kimutatták, hogy egyes neglek- tes betegek képesek megmondani, hogy az ellenkező oldalon (kontralaterálisan) bemutatott tárgyak azonosak-e az azonos oldalon (ipszilaterálisan) bemutatott tárgyakkal, holott azt nem tudták, mi is a kontralaterálisan bemutatott tárgy (Pierrot-Deseilligny et al. 1991). A megfigyelések arra utaltak, hogy több enyhe neglekt esetében a kioltás könnyebben kiváltható, ha az azonos oldalon bemutatott tárgy megegyezik az ellenkező oldalon bemutatott objektummal. Az azonos sajátságok ilyen hatását formálisabb kísérletek is megmutatták (Baylis et al. 1993). Voltak olyan megfigyelések is, melyek szerint nem a fizikai hasonlóság fokozta a kioltás valószínűségét, hanem a tárgyak funkcionális hasonlósága. Például egy kisebb fehér műanyag villa és egy nagyobb fémvilla bemutatásakor csak a sérüléssel azonos oldali evőeszközt észlelte a neglektes beteg. Berti és Rizzolatti (1992) eredményei szerint a kioltott tárgy befolyásolhatja az ipszilaterálisan bemutatott tárgy feldolgozását. A vizsgálatban vonalas rajzokat kellett osztályozni. Ha ezeket az ipszi- laterális oldalra adták, miközben a másik oldalra is adtak rajzokat, a két rajz kategoriális azonossága abban az esetben is serkentette a kategorizálást, ha a személy a kioltás miatt nem tudott beszámolni az ellenoldali képről. Szinte minden könyv idézi Marshall és Halligan (1988) esetét. A bal oldali neglektes betegnek két házat mutattak be, melyek közül a bal oldali lángolt. A személy ezt nem vette észre, a két házat azonos nak ítélte. Mégis, arra a kérdésre, hogy melyikben lakna, a jobb oldali házat választotta. A bemutatott kísérletek, megfigyelések, esetek arra utalnak, hogy a kialvásnál a gátlási folyamatok a feldolgozás egy magasabb szintjére hatnak. Egy olyan szintre, melyet már bonyolult feldolgozás előzött meg, viszont az erre a szintre ható gátlási folyamatok megakadályozzák a tudatosulást. A feldolgozás eredménye viszont, ha nem is tudatosul, hatást gyakorolhat a válaszszervezés rendszereire. Erre mutatunk be egy példát. Cohen és munkatársai (1995) Eriksen-paradigmában vizsgáltak neglektes betegeket. Az irreleváns (zavaró) ingerek vagy a neglektes, vagy az ép látótérfélbe kerülhettek. A kísérlet eredménye egyértelműen mutatta, hogy a neglektes területre adott ingerek befolyásolták a reakcióidőt, azaz megtörtént a feldolgozásuk, és ennek eredménye hozzájárult a válaszrendszer hangolásához. Neurális terminusokban: a válaszkód aktiválása nem követeli a parietális területek épségét; mentális terminusokban: a hatáshoz nem szükséges, hogy a személy tudatában megjelenjen az irreleváns inger. Több beteg esetében bebizonyosodott, hogy a neglektnél nem egyszerűen arról van szó, hogy a téri figyelem hiánya egyes területekről megakadályozza az információfeldolgozást. A téri referenciakereten kívül tárgyhoz kötődő referenciakeretek is befolyásolják a neglekt hatásait. Driver és Halligan (1991) vizsgálata mutatja, miről is van szó. A neglektes betegnek arról kellett döntenie, hogy két ábra azonos-e vagy sem. Találtak olyan neglektes beteget, akinél a minták hossztengelye szerint mutatkoztak meg a megítélés tévedései, nem pedig a látótér jobb vagy bal oldala 340 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény szerint. Behrmann és Tipper (1994) olyan tárgyalapú neglektről számolt be, amelyben az eredetileg a sérüléssel ellenoldali neglekt átvándorolt az azonos oldalra. Az ingerábra két vonallal összekötött kör volt (mint egy súlyzó). Eredeti orientációban ez az ábra vízszintes volt. A sérüléssel ellenoldali (a neglektes) kört jelezték, majd az ábra forogni kezdett úgy, hogy 1,7 másodperc alatt 180 fokot fordult, azaz ami eredetileg a bal oldalon volt, az a jobb oldalra került. Mi várható akkor, ha a célinger ilyenkor jelent meg? Ha a neglekt egyszerűen valamelyik oldalhoz tartozik, akkor a célingerre a forgás után nem kellene hosszabb válasznak lennie, hiszen a célinger nem esett neglektes területre. Ennek ellenére megnőtt a válasz ideje: mintha az eredetileg neglektes területre eső ábrarész „magával hurcolta volna” a neglektet. Az ilyen jelenség azonban nem minden neglektes esetben áll elő (Farah et al. 1990). Általában véve, a lokális sérülések hatásai szinte minden beteg esetében más és más területeket érintenek, így a tünetek is változnak. A modern rehabilitációs módszereknek köszönhetően pedig szerencsére a súlyos tünetek gyakran lényegesen enyhíthetők.
Neglektes beteg rajzai. A feladat a rajz kiegészítése volt. A bal oldalon a beteg az ép oldalnak megfelelő részt rajzolt. A jobb oldalon az ábra belső részének kiegészítése a meglévő rajz ismétlése (A rajzokat Verseghi Anna bocsátotta rendelkezésünkre, amiért köszönetet mondunk) A tárgyhoz kötődő figyelem az élmények szintjén is megjelenik. Sohn és munkatársai (2004) pszichofizikai kísérletben demonstrálták, hogy a tárgyhoz kötött figyelem ilyenkor a tárgyat kialakító részletek globális szerveződésén alapul, és nem a szomszédos egységek összekapcsolódásán (lokális kapcsolatokon). A kísérletben ponthalmazok mozogtak. A pontok pirosak vagy zöldek voltak. A résztvevőknek vagy az egyik, vagy a másik ponthalmazt kellett figyelniük. Az egyik kísérleti feltételben a két szín határozta meg a pontok mozgását: az azonos színű ponthalmazok mozgása egyezett. Ilyenkor a személyek két mozgó, átlátszó felületet látnak. A másik esetben pontpárok mozogtak együtt. Ekkor lokálisan alakulhatott volna ki kapcsolat a mozgás és a szín között. A személyek ilyenkor egyetlen mozgó felületet látnak. A kísérletben azt vizsgálták, hogy a mozgó pontokhoz való adaptáció után (a ponthalmazokat hosszabb ideig kellett nézni) milyen mozgásutóhatás áll elő. Amikor a személyek két felületet észleltek, az utóhatást, a mozgásiránnyal ellentétes látszólagos mozgást vagy vízeséshatást (bővebben szó volt róla a Mozgásészlelés című fejezetben) a figyelt színnel mozgó halmaz iránya határozta meg. Amikor viszont a kísérleti személyek csak egy felületet észleltek, a figyelt színnek nem volt hatása. Az utóhatás meghatározója így a globális együttjárás volt.
2. Az információfeldolgozás folyamata Az eddigiekben viszonylag szabadon használtunk olyan kifejezéseket, mint korai, késői, a feldolgozás párhuzamosan működő vagy szeriális szakasza, a jelentés kialakulásának stádiuma és hasonlók. Mindez azt a képzetet keltheti, hogy az emberi információfeldolgozás olyan egymást követő szakaszok sora, amelyekre teljesül, hogy az egyik szakasz akkor kezdődik el, amikor az előtte lévő befejeződik. E szakaszelméleti gondolkodás mélyen beivódott a pszichológiába, és kétségtelen sikereket ért el. E modellt úgy ábrázolhatjuk, hogy egymás utáni feldolgozási szakaszok váltják egymást, ahol a bemenő inger (input) egyre bonyolultabb tulajdonságaira derül fény. Ha például a DOB szót kell elolvasni, először csak vonalak és irányok, a vonalak metszéspontjai kerülnek feldolgozásra, majd pedig a három zárt alakzatnak megfelelő „reprezentáció” aktiválódik. Ezt követné az alakzatok betűként való azonosítása, majd pedig a lexikai emlékezet aktivációja. Ezután következne a jelentés – vagy még inkább a jelentések – megtalálása, majd a lehetséges jelentések közül azoknak a kiválasztása, amelyek megfelelnek a kontextusnak, és így tovább, esetleg egészen odáig, hogy a résztvevő kezéből kirepül egy labda. (Az olvasás feldolgozási folyamatainak pszichológiai és idegtudományi eredményei szerint azonban ez nem egészen így van. Ezzel bővebben a megismerőrendszer magasabb szintjeit magukban foglaló kurzusok foglalkoznak, az Altalánospszichológia tankönyvnek [szerk. Csépe-Győri-Ragó] pedig a 3. kötete, a Nyelv és gondolkodás.) Hogy ki-ki milyen szakaszokban képzeli el a folyamatot, meglehetősen elméletfüggő, tekintsük akár a sor legelejét, akár a végét. Az információfeldolgozás egyik ilyen 341 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény sémájával mint Broadbent szelektív figyelmi modelljével ismerkedhettünk meg, ahol a szenzoros tár, a puffermemória, a korlátozott kapacitású rendszer, majd a tartósabb emlékezeti rendszer követte egymást. Az észlelőrendszerek bemutatása, mint a kötet korábbi fejezeteiben láthattuk, hasonló sémákkal történik, ilyen lehet a tárgyak azonosítása a V1→ V2 → V4 → IT úton. Az egyes területeken egyre bonyolultabb a feldolgozás. Akár a „kognitív”, akár az „idegtudományos” sémát tekintjük, ezek – elveiket tekintve – igazak is, meg nem is. Amennyiben a sémákat úgy tekintjük, hogy olyan feltételezéseket fogalmaznak meg, hogy minek kellene történnie egy adott feladat elvégzésének érdekében, a séma megfelelő illusztrációja lehet a kutató elgondolásainak. A sémarajzok azonban azt a látszatot kelthetik, hogy a folyamatok lefolyásáról, egymásutánjáról is informálnak. Az egymásutánra való utalás még akkor is félrevezető lehet, ha a sémák visszajelentő (feedback) utakat tartalmaznak. Az idegtudomány sémáinál nyilvánvaló a visszajelentéses hurkok megjelenése, hiszen például a látórendszerben a „felülről lefelé” irányuló rostok mennyisége nagyobb, mint az „alulról felfelé” irányu- lóké. A kapcsolatok két irányát hagyományosan úgy fogják fel, hogy a visszahatás nem más, mint korrekciós lehetőség vagy kiegészítő működés a speciális esetekre. Egyre nyilvánvalóbb azonban, hogy ez a szerep lényegesebb, mint azt a szakaszelméletek feltételezik.
2.1. A szakaszelmélet A szakaszelmélet kísérletes megalapozása Donders (1886/1969) vizsgálataira és ezek értelmezésére vezethető vissza. Az alábbiakban egy a Donders-kísérletekkel rokon eljárást ismertetünk, és bemutatjuk annak értékelését is. Az első kísérleti feltételben időnként felvillan egy zöld fényfolt. Arra kérjük a vizsgált személyt, hogy a felvillanáskor – amilyen gyorsan csak tud – nyomjon meg egy gombot. Ez az egyszerű reakcióidő(E-RI) feladat. A kísérletben mért reakcióidő két tényezőből tevődik össze: a fény hatásának idejéből az észlelőrendszerre (input-idő: I) és a válasz megszervezésének idejéből (output-idő: O). A második kísérleti feltételben megjelenhetnek piros fényfoltok is. Ezekre nem kell reakcióidő-választ adni. Az ilyen eljárást szelektív reakcióidő (SZ-RI) feladatnak nevezzük (nevezik egyébként „go/no go” feladatnak is). Az I és O időn kívül itt egy további szakasz működik. El kell dönteni, hogy a fény piros volt-e vagy zöld (döntési idő: D). A harmadik feltétel még ennél is bonyolultabb. A résztvevőnek két gombja van, az egyiket a piros, a másikat a zöld fény megjelenésekor kell lenyomni, azaz a helyzet választásos reakcióidő (V-RI). E feladatban egy újabb szakasz működik, ki kell választani az ingernek megfelelő választ (kiválasztási szakasz: K). A fentieknek megfelelően az alábbi összefüggések érvényesek: E-RI = I + O, SZ-RI = I + D + O, V-RI = I + D + K + O. Ha rendelkezésre állnak a mérések eredményei, a kivonásos módszerrel látszólag lehetőségünk van a belső folyamatok időtartamának kiszámítására. Ugyanis az SZ-RI – E-RI különbség a döntési folyamat idejét, a V-RI – SZ-RI különbség pedig a válasz kiválasztásának idejét mutatja. A pszichológia tehát értékes adatokhoz jutott: reakcióidő-mérésekkel meg tudjuk állapítani, hogy mennyi ideig tartanak egyes mentális folyamatok. Donders elképzelését sokan és joggal bírálták. Két döntő ellenérv is van. Először, semmi sem bizonyítja, hogy az egyes szakaszok időtartama független a feladattól. Például nem biztos, hogy a döntési szakasz azonos lenne a szelektív és a választásos feladatban. Másodszor, a kutató nézetrendszerén kívül eleve semmi sem bizonyítja, hogy milyen szakaszokból tevődik össze egy feldolgozási folyamat (például azt, hogy a szelektív reakcióidő valóban az „I, D és O” szakaszból áll). Ez így van még akkor is, ha maga a kiinduló feltételezés egyébként egyáltalán nem abszurd. Ez a második probléma az elsőnél jóval súlyosabb. Így tehát meg kell állapítsuk, hogy Donders modellje és kivonásos eljárása ezen a módon nem működik. A modern szakaszelméletet és vizsgálatának módszerét, az additívfaktor-eljárást Sternberg (1969/1981) dolgozta ki. A modern szakaszelmélet „kevésbé ambiciózus”, mint Dondersé. Nem vállalkozik például arra, hogy megmondja, mennyi ideig tart egy-egy szakasz, és arra sem vállalkozik, hogy egy adott feladat esetében pontosan megállapítsa, mely szakaszokból áll a feldolgozás. Amire vállalkozik, az „csupán” annyi, hogy meghatározza, a kísérlet eredményét befolyásoló tényezők ugyanarra a szakaszra hatnak-e vagy sem. Ha több tényezőről is kiderül, hogy ugyanarra a szakaszra hat, akkor e hatások jellege alapján nevet lehet adni az adott szakasznak. Ha például kiderül, hogy olyan tényezők, mint egy betűsor rövidebb vagy hosszabb idejű bemutatása, a betűtípus jobb vagy rosszabb olvashatósága, továbbá a betűsornak a gyakoribb vagy ritkább bemutatása azonos szakaszra hat, akkor ennek a szakasznak nevet adhatunk, hívhatjuk például „kódolásnak”.
342 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény A Sternberg-féle szakaszelmélet alapját az additívfaktor-módszerrel kapott kísérleti eredmények jelentik. Tegyük fel, hogy egy információfeldolgozási feladat (például: „Ha a szó a téglalap felett van, a jobb oldali gombot kell lenyomni, ha alatta, a bal oldalit”) több szakaszból áll, és ezek között szerepel a és b szakasz is. Ha egy mérési sorozatot végzünk, a reakcióidőt mérések átlagaként kapjuk meg, ahol az átlaghoz egy szórás(variancia-) érték tartozik. Ehhez a variabilitáshoz hozzájárul a és b variabilitásának összege (továbbá egyéb olyan szakaszoké is, amelyekkel most nem foglalkozunk). Változtassunk egy kísérleti feltételt, legyen az egyik feltétel esetében a szavak olvashatósága jó, a másikban rossz (például elmosódottak a betűk). Nevezzük ezt az I. változónak. Változtassunk meg egy másik tényezőt is, például azt, hogy a kísérleti próbák egy részében a szó jelentése ellentétes a hely megjelölésével, más részében pedig azzal egyező (mint ahogy a Stroop-jelenségnél láttuk). Nevezzük ezt a II. változónak. Kísérletünkben így négy feltételünk lesz: jó olvashatóság/szójelentés-hely kompatibilitás, jó olvashatóság/szójelentés-hely inkompatibilitás, rossz olvashatóság/szójelentés-hely kompatibilitás, rossz olvashatóság/szójelentés-hely inkompatibilitás. Feltéve, hogy változóinknak volt valamilyen hatása, többféle eredményt kaphatunk. A 17.4. ábra bemutatja az elvi lehetőségeket. Az ábra bal oldala egy olyan helyzetet mutat, amelyben a két változó hatása összegződik (additív). A két tényező változásából eredő variabilitás ilyenkor összeadódik: az eredményekből számított varianciaanalízisben az I. és a II. változó esetében is szignifikáns főhatást kapunk. A középső diagram azt az esetet mutatja, amikor az I. változó egyik szintje esetében a II. változó hatása kisebb, mint az I. változó másik szintjén (például a rossz olvashatóság esetében csökken az inkompatibilitás hatása). Elvileg lehetséges lenne a jobb oldalon látható helyzet is, az egyik tényező változásával a másik tényező hatása ellenkezőjébe fordul. Ha varianciaanalíziseket számolunk, az utóbbi két esetben I. és II. interakciója szignifikáns lesz, azaz az I. és II. tényező hatására jelentkező variabilitás nem független egymástól. Az additívfaktor-logika a következő: ha két változó ugyanarra a szakaszra hat, hatásuk interakcióban mutatkozik meg, ha viszont két különböző szakaszra, a hatások additívak lesznek. A szakaszelmélet e modern formája alapján a beavatkozások jellegének megfelelően meg lehet határozni egyes szakaszok jellemzőit és azt is, hogy valamilyen tényező hatása mely más tényezők hatásával rokon abból a szempontból, hogy azonos szakaszra hatnak. A szakaszelmélet e modern változatával a kognitív pszichológia több területen ért el sikereket, legalábbis a modell ésszerű használata esetén (Broadbent 1984).
17.4. ábra. A szakaszmodellnek megfelelő vizsgálat illusztrációja. A bal oldalon olyan eredmények sémája látható, ahol a két változó hatása egymástól független. Az additív hatás arra utal, hogy a két változó különböző szakaszokra hat. Középen olyan eredmények láthatók, ahol az egyik változó hatása a másik változó egyik szintjén kisebb, a másik szintjén nagyobb (a két változó interakciója). A jobb oldali eredmények szerint az egyik változó a másik változó egyik szintjén ellenkezőleg hat, mint a másikon (keresztezett interakció). A középső és a jobb oldali eredmények a szakaszelmélet szerint arra utalnak, hogy a két változó eltérő szakaszt befolyásol
2.2. Folyamatos feldolgozás A szakaszmodell azonban nem az egyetlen lehetőség az információfeldolgozás jellemzésére. Egy adott folyamat részeredményei még e folyamat befejezése előtt továbbkerülhetnek, és valamilyen más folyamat inputjaként szolgálhatnak. Így több folyamat egyszerre is működhet, sőt a feedbackhatások nyomán újabb és újabb feldolgozási körök indulhatnak el. Az ilyen modellt folyamatos feldolgozási modellnek nevezik. A szakaszmodell ellentéte egy olyan folyamatos feldolgozási modell, melyben minden aktivitás azonnal továbbításra kerül. Miller (1982) rámutatott arra, hogy e két véglet között olyan modellek is kialakíthatók, amelyekben a továbbítás nem azonnali, hanem a részfolyamatok bizonyos adagjai (csomagjai) jutnak el a feldolgozás egy következő részrendszerébe. Ma már vannak olyan kísérleti eredmények, amelyek éppen ennek a közbülső működésnek a realitására utalnak.
343 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény Az idegtudományi kutatások eredményeinek értelmezésében a folyamatos feldolgozási modell nem számít idegennek. Egy példa: a vizuális rendszerben az elsődleges (striatális) kéreg (V1) a prestriatális területek aktivitásának kezdetét követően ismételten aktivitásba kerül. A visszatérőfeldolgozással magyarázzák azt a jelenségkört, amelynek során egy később megjelenő inger megakadályozza a korábbi észlelését (visszaható maszkolás). A feldolgozási körök illusztrációjára a közös kezdési paradigmát (Di Lollo et al. 1993) mutatjuk be. A személy feladata, hogy egy négyzet (célinger) bemutatása után mondja meg, a jobb vagy a bal oldalon látott-e benne megszakítást (17.5. ábra). A négyzettel egy időben megjelenik egy olyan keretjellegű ábra is (maszk), amely körbeveszi a négyszöget, de mind a négy oldalán van megszakítás. Ha a célinger és a maszk egyszerre tűnik el, a feladatot a résztvevők megoldják, mivel a maszkon belül látják a négyszöget. Ha viszont a maszk továbbra is a képernyőn marad, a feladatot nem tudják megoldani, mivel a célinger egyáltalán nem látszik. A jelenség hátterében az állhat, hogy a hosszabb ideig jelen lévő inger hatására az általa kiváltott ingerületi körök blokkolják a rövidebb inger által kiváltott és egyre kisebb intenzitású körök hatását. Így a rövidebb ideig bemutatott inger hatása nem éri el azt a feldolgozottságot, amely szükséges a tudatos észlelés kialakulásához.
17.5. ábra. Di Lollo és munkatársai (1993) kísérletének vázlata. Amikor a maszk hosszabb ideig látható, mint a célinger, a célinger nem látható. A jelenség a több körben zajló információfeldolgozási működés illusztrációja A példa az észlelés „genezisén belül” mutatta be a folyamatos feldolgozás elvét. Érvényesül azonban ez az elv a célinger kiválasztásának folyamatában is, a viselkedés meghatározására irányuló szelekciós működésekben. A példa itt a már sokszor bemutatott Eriksen-paradigma. Mint erről többször szó volt, a kísérletben a célingerek mellett megjelenő és az alternatív válaszhoz tarozó ingerek jelenlétében a reakcióidő jelentősen nő. E növekedés ahhoz a feltételhez képest is megmutatkozik, amelyben az irreleváns betűk hasonlítanak a célingerhez, viszont nem szerepelnek mint alternatív célingerek (például ha a H és az S a két célinger, az SSHSS együttesre a reakcióidő hosszabb, mint a KKHKK együttesre). A növekedést így nem lehet egyszerűen a téri szelekciós működések hiányával magyarázni. A folyamatos feldolgozási elv szerint az inger bemutatásától a válasz megjelenéséig tartó folyamat során az ingeregyüttesről egyre több információ áll rendelkezésre. A folyamat ahhoz hasonlítható, mint amit a fényképek nagyításakor a sötétkamrában figyelhetünk meg. Először csak diffúz foltokat látunk az előhívótálban, majd ezek egyre differenciáltabbá válnak, és felismerhetők lesznek az egyes objektumok, illetve ezek részletei. Az Eriksen-féle zaj/kompatibilitás kísérlet esetében a feldolgozás során a betűk egyes sajátságainak, ezek kombinációinak, az egyes egységek kialakulásának stb. kell megtörténnie. Abban az esetben, ha a részeredmények azonnal befolyásolni kezdik a válaszszervezési mechanizmusokat (előfeszítési folyamat), a korai szakaszban az alternatív válasz is komoly előfeszítést kap, hiszen a vizuális mező számos olyan sajátságot tartalmaz, amely a másik válasz ingereihez tartozik (például az S betű görbületei, ha a célinger a H). A két válasz megszervezése egymással kölcsönösen gátló kapcsolatban van, ezért az alternatív válasz előfeszítése kezdetben gyengíti a helyes válasz előfeszítését. Ahogy az észlelés folyamata előrehalad, úgy válik dominánssá a helyes válasz, és amennyiben ez az aktivitás elér egy kritikus értéket (küszöböt), létrejön a nyílt motoros reakció. Mint látható, e folyamatban időben nem válik el a kódolás és a válaszszervezés folyamata, azaz nem mondhatjuk, hogy a következő szakasz akkor kezdődik el, amikor a megelőző befejeződött. Eriksen-paradigmában mérték a mozgatórendszernek azokat a finom működéseit, melyek megelőzik a mozgásos választ, így a mozgás kezdete előtti, a motoros kéreg működéséhez kapcsolódó agyi aktivitást, továbbá az izmok elektromos aktivitását (elektromiogram, EMG). E kísérletben (Coles et al. 1985) kiderült, hogy az inkompatibilis próbákban a helyes válaszhoz tartozó mozgásszervezési aktivitást igen gyakran megelőzi a helytelen válasz előfeszítésére jellemző aktivitás. Nem az történik tehát, hogy előbb eldől, mi a célinger, majd
344 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény megkezdődik a mozgásos válasz megszervezése, hanem a feldolgozási körök során fokozatosan alakul ki, mi a helyes és mi a téves reakció az adott helyzetben. Itt említjük meg a feldolgozórendszer és az e rendszer működésének átélésével kapcsolatos alapvető összefüggést (pontosan ennek hiányát): nincs közvetlen hozzáférésünk azokhoz az információfeldolgozási folyamatokhoz, melyek megalapozzák a reakcióinkat.
3. Automatikus és figyelmi folyamatok, a figyelem megosztása Bár mentális működéseink részleteihez nincs közvetlen hozzáférésünk, a mindennapokban átéljük, hogy egyes működések több, más működések kevesebb „mentális erőfeszítést” igényelnek. A gyakorlott vezető automatikusan vált sebességet, és (általában) automatikusan követi a táblák jelzéseit, alkalmazkodik a közlekedési szabályokhoz. A korábbiakban már tárgyaltunk olyan inger-válasz kapcsolatokat, melyek szinte megakadályozha- tatlanul aktiválódnak. Ilyen volt egy szó jelentése a gyakorlott olvasónál (lásd a Stroophatást), vagy még ennél is nyilvánvalóbb volt a hallott szó jelentésének aktivációja. (Sokan szeretnénk átélni, hogy milyen is lehet a magyar nyelv a nyelvet nem beszélő külföldi számára, de ez nem sikerül, mivel nem tudunk eltekinteni attól, hogy értjük a beszédet.) Egyes folyamatokra így azt mondhatjuk, hogy automatikusak, más folyamatok pedig igénylika figyelem mechanizmusait. Az automatikus és figyelmi folyamatok megkülönböztetése a megismerési folyamatok pszichológiájában általános. Az automatikus folyamatok elvégezhetők egymással párhuzamosan, nem igényelnek feldolgozási kapacitást, teljesítményük a további gyakorlással már jelentősen nem változik (Hasher-zacks 1979). Van, aki ezt a listát kiegészíti még azzal, hogy a figyelmi folyamatok a tudatos kontrollhoz kapcsolódnak, az automatikus folyamatok viszont nem (Posner-Snyder 1975). Van olyan felfogás is, mely szerint a teljes automaticitás, illetve a teljes figyelmi kontroll egy kontinuum két végpontja, köztük az automaticitás különböző fokozatai helyezkednek el (Kahneman-Chajczyk 1983). Arra is fel kell hívnunk a figyelmet, hogy az automaticitásnak két szintjéről beszélhetünk. A mikroszint azt jelenti, hogy az információfeldolgozás bizonyos részfolyamatai automatikusan lezajlanak, azaz adatvezéreltek. Ezeket a folyamatokat nevezhetjük preattentív folyamatoknak. Ilyen az alak-háttér szétválasztása a látásnál vagy a beérkező ingeregyüttes szabályszerűségeitől való eltérés detekciója. Makroszinten már a folyamategyüttesek működnek automatikusan. Ilyen volt az autóvezetéssel vagy a szójelentés azonosításával kapcsolatos példa. Az automatikus és figyelmi folyamatok megkülönböztetésére olyan módszereket kell találni, melyek a teljesítmények szintjén elkülöníthetővé teszik azt, hogy a folyamat automatikus-e vagy sem. Már eddig is találkoztunk azzal a lehetőséggel, hogy a folyamatok magyarázatában az operacionális (műveletekkel történő) meghatározásra támaszkodjunk. A vizuális keresési feladatnál például ilyennel találkoztunk akkor, amikor azt elemeztük, hogy a zavaró ingerek számának növekedésével miként nőtt egyes esetekben a reakcióidő (konjunkciós keresés), míg máskor ez nem történt meg (sajátságkeresés). A vizuális keresési feladatok alkalmazása a figyelmi és kontrollált folyamatok elkülönítésére Shiffrin és Schneider (1977) nevéhez fűződik. A ma már klasszikusnak számító kísérletsorozatban a vizuális keresési feladatot az emlékezeti keresési (letapogatási) feladattal kombinálták. A feladatban a személyeknek néhány (1-4) betűt kellett megjegyezniük, majd ezt követően olyan tesztingereket kaptak, amelyeken néhány (1-4) betű és szám volt. A reakcióidő-mérést szolgáló két gomb egyikét akkor kellett lenyomni, ha a tesztegyüttesben szerepelt olyan betű (legalább egy), amely tagja volt valamelyik megjegyzendő ingeregyüttesnek is. (A feladat emlékezeti keresési [Sternberg 1969/1981] vonatkozása, hogy egy emlékezetben tartott együttesben kellett megtalálni a célingert. A vizuális letapogatási vonatkozás pedig abból adódik, hogy a tesztegyüttes több elemből állt, köztük az esetleges célingerből.) Az eredmények szerint a reakcióidő az emlékezeti együttes nagyságával egyenes arányban nőtt (ez várható az emlékezeti keresési kísérletek eredményeinek alapján), valamint nőtt a bemutatott karakterek számának növekedésével is (ez várható a vizuális letapogatási kísérletekből). A kísérleteknek azonban nem ez a lényeges eredménye. Az igazán érdekes az, hogy a reakcióidő növekedéséhez csak a betűk száma járult hozzá, a számoké nem. Ha például a tesztegyüttesben két betű és két szám volt, a reakcióidő rövidebb volt, mint akkor, amikor négy betű szerepelt, de egyetlen szám sem. Ha viszont két betű volt jelen, de nem volt szám, a reakcióidő nem volt lényegesen rövidebb, mint akkor, amikor a két betűn kívül számok is jelen voltak. Elvégezhető azonban a Shiffrin-Schneider-kísérletnek egy olyan változata is, amelyben a megjegyzendő lista vegyesen tartalmaz számokat és betűket. Azt fogjuk találni, hogy ebben az esetben a számok is és a betűk is részt vesznek a reakcióidő kialakításában. Miért van ez így? Az előző esetben a számok feldolgozása másként történhetett, mint a betűké. A számokat párhuzamosan lehetett feldolgozni (és elutasítani, mint a feladat szempontjából felesleges elemeket). Az utóbbi esetben viszont a számok feldolgozása is igényelte a részletes azonosítást, a letapogatási folyamatot. Az első esetben a számok feldolgozása automatikus volt, a második
345 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény esetben viszont figyelmi (kontrollált). A számok automatikus feldolgozása azért volt lehetséges, mert a számok és a betűk formájának azonosításában az írástudó felnőtt óriási gyakorlattal rendelkezik. Amikor például Shiffrin és Schneider csak betűket használt, viszont a próbák hosszú során keresztül a betűknek csak egy csoportja szerepelhetett mint célinger, más betűk viszont nem (azaz kialakult a betűk kategorizációja: a relevánssal szemben az irreleváns betűk csoportja), a nem releváns betűk száma végül már nem befolyásolta a reakcióidő-eredményeket. Ehhez az automatizálódási folyamathoz azonban több mint 2000 próbára volt szükség. A mindennapi életben gyakori, hogy egyszerre többféle tevékenységet is végzünk. Nézzük a filmet, és esszük a pattogatott kukoricát. Vezetjük az autót, és beszélgetünk a partnerünkkel. A kísérletezés még ennél nehezebb eseteket is vizsgált, például gyakorlott zongoristák kottából játszottak ismeretlen darabot, miközben hangosan ismételték a közben hallott szövegeket (Allport-Antonis-Reynolds 1972). Vannak azonban olyan helyzetek is, amikor abbahagyunk egy tevékenységet, hogy sikeresen elvégezzünk egy másikat. Autóvezetési példánkat folytatva: ha szemben feltűnik egy kamion, melyet éppen egy sportkocsi előz, azonnal abbahagyjuk a beszélgetést. A fenti esetekben a figyelmet megosztottuk, vagy a figyelmet fókuszáltuk. (Valamivel pontosabb lenne az a megfogalmazás, hogy a tevékenységet osztjuk meg, vagy egyetlen tevékenységre összpontosítunk.) A figyelem megoszthatósága a pszichológiának gyakorlati és elméleti szempontból egyaránt érdekes kérdésköre. A figyelem korai szűrési elmélete, mint láttuk, feltételezte, hogy a feldolgozás „szűk keresztmetszete” a folyamat elején van. A szűk keresztmetszet mindenekelőtt az észlelésben nem engedi azt meg, hogy egyszerre több feldolgozási folyamat menjen végbe. Ebből a szempontból a késői szelekciós elméletek sem mások: kétségbe vonják a valódi megoszthatóság lehetőségét, hiszen ezek a modellek is szűk keresztmetszetet („üvegnyakat”) feltételeznek, csak másutt. Természetesen ezek az elméletek is kezelni tudják a figyelem megosztásának azokat a mindennapi eseteit, melyeket fentebb bemutattunk. Egyszerűen arra hivatkoznak, hogy e feladatok lehetőséget teremtenek az időosztásos működésre: a korlátozott kapacitású rendszert egyszer az egyik, máskor a másik feladat használja, azaz váltakozva kezeli az egyik vagy másik feladathoz tartozó elemeket. Hogy van-e figyelmi megosztás akkor, amikor nincs lehetőség ilyen váltásokra, speciális vizsgálatokat követel, melyekről rövidesen szó lesz. Előbb azonban álljunk még meg egy kicsit a figyelem „üvegnyak”-elméleteinél. Ezek egy olyan gondolatrendszert képviselnek, amely azt tételezi fel, hogy a feldolgozás folyamatai között van olyan, melyben egyszerre csak korlátozott számú (vagy egyenesen egyetlen) működés történhet. Lehetséges azonban egy másik megközelítés is. Eszerint a korlát nem strukturális természetű abban az értelemben, hogy valamely folyamathoz kötött, hanem a korlát magában a feldolgozásban érvényesül, azaz az egész folyamategyüttesnek van valamekkora kapacitása. Ez az összkapacitás oszlik meg az adott pillanatban elvégzett (elvégzendő) mentális műveletek között. Modern formában ezt az elméletet Kahneman (1973) fejtette ki. Eszerint az, amit mentális erőfeszítésnek élünk meg, nem más, mint a kapacitás használata. A rendelkezésre álló kapacitást pedig újra és újra el kell osztani a pillanatnyi követelményeknek megfelelően. Visszatérve korábbi példánkra: amikor a szembejövő kamion láttán az autóvezető abbahagyja a beszélgetést, mentális kapacitását visszavonja a társalgástól, mégpedig azért, hogy így nagyobb kapacitása legyen az autóvezetésben. Felmerül azonban a kapacitáselmélettel kapcsolatban két sarkalatos kérdés. Egyrészt, mitől függ az, hogy mekkora a kapacitás? Másrészt, igényel-e az információfeldolgozásnak valamennyi részfolyamata mentális kapacitást, vagy vannak olyan folyamatok, amelyek függetlenek a figyelmi rendszertől? Az első kérdés az éberség és a figyelem kapcsolatát érinti. Kahneman elmélete szerint a kapacitás az éberség függvénye: minél nagyobb a pillanatnyi aktivitásunk, annál nagyobb az elosztható kapacitás. A második kérdés az automatikus és figyelmi folyamatok megkülönböztetésének témaköréhez tarozik. A kiinduló alaptétel az, hogy az automatikus folyamatok működéséhez nincs szükség mentális kapacitásra. A fentiek értelmében a kapacitáselméletek lehetségesnek tarthatják a valódi figyelemmegosztást, a figyelmi folyamatok párhuzamos működését. Ha ugyanis két (vagy több) tevékenység együttesen nem igényel többet, mint a pillanatnyilag rendelkezésre álló összkapacitás, akkor párhuzamosan folyhatnak, azaz a figyelem megosztható közöttük. Lehetséges az egyidejű feladatvégzés akkor is, ha az egyik feladat automatikus, azaz nem igényel kapacitást. (Ez utóbbi lehetőség természetesen az „üvegnyak”-elméletekben is szerepel. A megfogalmazás ekkor így szólhat: az automatikus feldolgozás nem használja a korlátozott kapacitású rendszert.) Természetesen a kapacitáselmélet sem tagadja, hogy vannak olyan esetek, amikor két feladat egyidejűleg nem végezhető. Ekkor a megosztást olyan korlátok akadályozzák, melyek nem a mentális kapacitással kapcsolatosak. Közhelynek tűnhet, de mégis meg kell említeni, hogy nem lehet egyszerre két, egymást kizáró mozgást végezni. Az viszont már nem magától értetődő, hogy lehet-e ilyenekre egyszerre előkészülni. Létezhetnek továbbá olyan 346 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény esetek is, amikor a feldolgozórendszer valamelyik területén egyszerre két működést kell végezni, és e két működés összekeveredik. Az ilyen szerkezeti kölcsönhatások sem tartoznak a mentális kapacitás korlátjának körébe. Ezekre az esetekre az adatátviteli korlát jellemző, és nem a források korlátja (Norman-Bobrow 1975). Amennyiben a megosztás „figyelmi” működések között történik, a személy eldöntheti, hogy a két egyidejűleg adott feladat közül melyik feldolgozására fordít nagyobb kapacitást (egyszerűbben: melyiket tekinti fontosabbnak). Kísérleti körülmények között lehet ilyen utasításokat adni: „Figyeljen egyformán az A és a B feladatra!”, de lehet alkalmazkodni még egy ilyen instrukcióhoz is: „Helyezze figyelme nagyobb részét, mintegy 80 százalékát az A, kisebb részét, mintegy 20 százalékát a B feladatra!” Ha változtatják az instrukciót, megvizsgálható, hogy a feladatok milyen mértékben befolyásolhatják egymást attól függően, hogy melyikre figyelünk jobban. Ha teljesen függetlenül végezhető két feladat, akkor az egyikre fektetett nagyobb figyelmi kapacitás nem csökkenti a teljesítményt a másik feladatban. Ha viszont a két feladat azonos kapacitáson osztozik, az egyik feladat nagyobb teljesítményével párhuzamosan a másik feladatban a teljesítmény csökken. A kettős feladatok módszerével a figyelem megosztásának mértékét pontosan lehet jellemezni (Sperling-Melchner 1978). Gyakorlás hatására lényegesen növekedhet a teljesítmény két feladat egyidejű végrehajtásakor. A klasszikus demonstráció Spelke, Hirst és Neisser (1977) kísérlete. A vizsgálatban részt vevő személyek négy hónapon keresztül gyakoroltak, az összidőt tekintve több mint három napnak megfelelő ideig. Az egyik feladat történetek olvasása volt, a másik diktált szöveg leírása. Eleinte a két feladat egyidejű végrehajtása nehezen ment. Az olvasási sebesség nagyon lassú volt, és rossz volt az írás teljesítménye. Másfél hónap elmúltával viszont a személyek a normális szintnek megfelelően voltak képesek megérteni az elolvasott történetet, és jó volt az írásos feladatban is a teljesítmény. Ekkor még a leírt szövegből keveset dolgoztak fel. További gyakorlás után viszont már megértették a leírt szöveget is: észrevették az azonos jelentéstani kategóriába tartozó szavakat, a rímeket, és arra is képesek voltak, hogy szólisták diktálása esetében nem magukat a diktált szavakat írták le, hanem azokat a kategórianeveket, melyekbe az egyes szavak tartoztak. A teljesítmény e javulásában jelentős szerepe lehetett annak, hogy a feldolgozás számos vonatkozása automa- tizálódott. További lehetőség a már ismertetett időosztásos működés, illetve a kapacitások esetleges jobb elosztása. A környezet sajátságainak regisztrációja nem szükségszerűen korlátozódik a viselkedés szabályozásában szereplő ingerekre. E kérdéskör fejezetünk vissza-viszatérő kérdése. Megjelenik a figyelmi szelekcióval kapcsolatosan, megjelenik majd a figyelem automatikus váltásával kapcsolatosan, és természetesen az automatikus működéseket irányító ingeregyüttessel kapcsolatosan is. Avval a lényeges kérdéssel, hogy milyen „adatbázis” áll rendelkezésre a nem figyelt ingerekről, és milyen ismereteink vannak az ilyen ingereket tároló rendszerről, több kutatási terület foglalkozik. A nemtudatosuló észlelés kérdései túlmutatnak e fejezet témakörén. A környezet szabályszerűségeit automatikusan regisztráló rendszerről, illetve az ilyen szabályszerűségeket megszegő ingerek hatásairól a későbbiekben (A figyelem sötét oldala) lesz szó.
4. A figyelem önkéntelen váltása, orientáció Amikor a vonaton megszólal egy utas mobiltelefonja, nyolc-tíz ember „felkapja a fejét”. Mi is történik ilyenkor? Tevékenységünket felfüggesztjük, a hang irányába fordulunk, és a szervezet számos pontján időlegesen az aktiváció növekedésére jellemző hatások jelentkeznek. A változásoknak ezt az együttesét orientációs reakciónak nevezzük. Szokolov munkássága nyomán (pl. Sokolov 1960, 1963) úgy összegezhetjük e folyamatsort, hogy a szervezet érzékenysége ilyenkor megnő azokra a környezeti eseményekre, melyek a reakciót kiváltják. Mint írja, „a reakció annak jele, hogy az idegrendszer detektálta az ingerlés megváltozását, tehát az ingert megkülönböztette egy másiktól” (Sokolov 1963, 272.). Az orientációs reakció olyan változás, mely a szervezet egészét érinti. Az orientációval kapcsolatban az egyik leggyakrabban felvetődő kérdés, hogy tulajdonképpen mi is váltja ki. Szokolov modellje szerint az orientációs reakció hátterében olyan folyamat áll, melyben a környezetről kialakult idegrendszeri modell olyan hatással szembesül, mely eltér a modelltől. Az orientáció így a kialakult modellen, azaz elemi tanulási folyamatokon alapul. Grastyán (lásd Vereczkei et al. 1965) e megfogalmazást úgy pontosította, hogy két modell ütközik össze, az egyik az éppen adott inger-válasz kontextus, a másik pedig egy olyan modell, mely nem illeszkedik e kontextusba. Egy kés az ebédlőasztalon nem vonja magára a figyelmet, egy tornacipő viszont igen. Az éttermi főnök finomabb modelljéhez viszont az sem illeszkedik, ha halkés van a húsételre váró vendég tányérja mellett, vagy ha a kés nincs a megfelelő oldalon. Az orientációs reakciót kiváltó sajátságokat Berlyne (1960) kollatív változóknak nevezte, utalva evvel arra, hogy ezeket a sajátságokat a tapasztalatok „ragasztják rá” az ingerekre. Kollatív változó az inger váratlansága, részeinek össze nem illése (madárfejű oroszlán), valamint a kontextusként szolgáló ingerekhez képest összetettebb jellege. Az ilyen 347 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény ingereket általában érdekesnek tartjuk. A kísérleti esztétika egyik klasszikus témája az ilyen sajátságok hatásainak értelmezése a művészi alkotások területén. Az orientációt szintén folyamatok sorának kell tekinteni. A modellek eltérésének detekciója csak a kezdet. Ezt követi az információ felvételét segítő mozgásos reakciók együttese és az információfeldolgozási folyamatokban az áttérés az automatikus folyamatokról a kontrollált, a munkaemlékezetet igénybe vevő folyamatokra (Öhman 1979), majd ez utóbbi kapcsán az orientációt kiváltó változás fontosságának értékelése (Maltzman 1979). Azt gondolnánk, hogy az intenzív környezeti változások mindig magukra vonják a figyelmet. E tekintetben különbség van az egyes ingermodalitások között. A hangok világában ez valóban így lehet, és így lehet egy változás nélküli vizuális mezőben is, ha éppen nincs semmiféle feladatunk. A homogén háttértől eltérő alakzatok „kiugranak a képből”, felfigyelünk rájuk (17.6. ábra). Lényegesen bonyolultabb viszont a helyzet az ingerekben gazdag vizuális mezőben, valamint az olyan helyzetben, amikor a feladat fokális figyelmi működést igényel. Ezt a helyzetet demonstrálta az előző fejezetben bemutatott nemfigyelési vakság jelensége. A figyelem önkéntelen váltását meghatározó körülmények vizsgálata a figyelem kutatásának előterében álló témakör, amit a kérdés gyakorlati fontossága is indokol. Az elterelő ingerek hatása problémát okozhat olyan területeken, ahol gyors beavatkozásokra van szükség (tipikus példa az autóvezetés), máskor viszont éppen az a cél, hogy vizuális objektumok vonják magukra a figyelmet (például a reklámban).
17.6. ábra. Kirívósági (pop-out) hatás: a mező eltérő elemekből álló része automatikusan elkülönül a többitől Az önkéntelen figyelmi váltások vizsgálatában alkalmazott tipikus eljárás a Posner-típusú téri figyelmi kísérletekből származtatható. Mint láttuk, az ilyen kísérletekben a célinger helyét előzetesen jelzik. Előállítható olyan helyzet is, amikor a célingert megelőző inger nem informál a célinger helyéről. Jonides (1981) kísérlete tipikus példa. A vizsgálatban a mintegy három szögfok nagyságú kör kerületének megfelelően, nyolc lehetséges hely egyikén jelentek meg betűk. A feladat az volt, hogy az egyik célinger (L betű) megjelenésekor a bal, a másik célinger (R betű) megjelenésekor a jobb oldali gombot kell lenyomni. A célingert megelőzte egy nyíl megjelenése, ami vagy a mező közepén volt (centrális jelzés), vagy a mező perifériáján (a célinger megjelenésének egyik lehetséges helyén). Az irreleváns ingerek hatása szempontjából a kísérletnek az a változata érdekes, amikor a jelzőinger 12,5 százalék valószínűséggel mutatta a célinger majdani helyét, azaz teljesen véletlenszerű volt, hogy hova mutat. A résztvevők egyik csoportjának azt az instrukciót adták, hogy figyeljenek a jelzőingerekre, a másik csoportnak pedig azt, hogy nem érdemes a jelzőingerekkel törődni, mivel véletlenszerű a kapcsolata a célinger megjelenésének helyével. Amikor a résztvevők figyelték a jelzőingert, a centrális és a periferiális jelzésnek is megmutatkozott a hatása. A próbáknak abban a kisebb hányadában, amikor a nyíl a célinger helyére mutatott, a reakcióidő rövidebb volt, és csökkent a hibázások száma. Amikor az instrukció arról szólt, hogy nincs kapcsolat a jelzés és a célinger helye között, a centrális jelzésnek (azaz az akaratlagos figyelmi áthelyezésnek) megszűnt a hatása, a periferiális ingeré viszont megmaradt. Johnson és Yantis (1992) egy hasonló kísérletben még jobban kiélezte a helyzetet: a résztvevők tudták, hogy ott, ahova a jelzés mutat, az adott próbában biztosan nem jelenik meg a célinger. Ennek ellenére az ilyen feltételben a reakcióidő hosszabb volt a periferiális jelzések megjelenésekor, mint nélkülük. A zavaró hatás tehát megjelent. Maximális a hatás, ha a célinger mintegy 200250 ezredmásodperccel követi a zavaró ingert (NakayamaMackeben 1989). Az ingerekben szegény mezőben megjelenő objektum tehát magára vonja a figyelmet.
22.2. táblázat -
348 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény
ORIENTÁCIÓ, CÉLINGER-DETEKCIÓ ÉS AZ ESEMÉNYHEZ KÖTÖTT AGYI ELEKTROMOS AKTIVITÁS Egyszerűbb figyelmi modellhelyzetet talán el sem lehet képzelni annál, mint amilyen az az eljárás, amelynek során kétféle ingert adnak, például két jól megkülönböztethető ábrát. Az egyik gyakrabban jelenik meg (sztenderd inger), a másik ritkábban. A ritka ingerre (célinger) reakcióidő-választ kell adni. Az ilyen eljárást nevezik oddball-paradigmának. Ha regisztrálják az agyi elektromos változást, a célinger a megjelenését követő 300-500 ms elteltével kivált egy hullámot. Mivel e hullám pozitív, és megelőzi két pozitív hullám, P3 hullámnak nevezik (lásd még az idegtudományi módszerek ismertetését a kötet elején). A P3b hullám amplitúdója (nagysága) függ a célinger valószínűségétől: ez minél kisebb, annál nagyobb ez a komponens. A P3 így objektív mércéje annak, hogy az információfeldolgozó rendszer milyen valószínűséget tulajdonít az eseménynek. Minél bonyolultabb a feladat, a P3 annál később jelenik meg. A példában említett egyszerű diszkriminációs feladat például kisebb latenciával váltja ki e hullámot, mint egy olyan feladat célingere, ahol az egyik inger férfinév, a másik női, és a férfinevekre kell válaszolni (McCarthyDonchin 1981). A P3 latenciája – szemben a reakcióidő mérésével – nem függ a válaszszervezés folyamataitól, így lehetőséget nyújt arra, hogy adatokat szerezzünk az információfeldolgozás idejének növekedésére vagy csökkenésére (pl. Coles et al. 1985). Míg a P3 a feladathoz kapcsolódó figyelmi feldolgozás mutatója, egy másik pozitivitás az önkéntelen figyelmi folyamatok esetében jelenik meg. E hullámot P3a-nak nevezik (a célingerhez kötődő P3 pontosabb megjelölése P3b), és legegyszerűbben olyan kísérletekben regisztrálható, ahol a sztenderd és a célingereken kívül egy olyan ritka inger is szerepel, amelyik jelentősen eltér az előbbiektől. Például a kétféle egyszerű képhez képest egy színes tájkép. Míg a célingerekhez kötődő P3b a fej hátulsó (parietális) területei felett a legnagyobb, a P3a a fej elülső területein. Az orientációra jellemző összetevő így olyan frontális területek működéséhez kötődik, melyek részt vesznek a központi végrehajtó működésekben. Az agy elektromos aktivitásának elemzésével több olyan hullám is azonosítható, mely az információfeldolgozás különböző folyamataival áll kapcsolatban. Ilyen a szelekciós működésekre jellemző hullám, a hibázások detekcióját jelző hibanegativitás vagy a várakozási állapotokra jellemző hullámforma és így tovább. Az agyi elektromos aktivitás elemzése így fontos adatokkal szolgál az információfeldolgozás folyamatáról. Ezek az elektromos változások különösen értékesek olyan helyzetekben, ahol nincs mérhető viselkedéses válasz, mint például a feladatban nem szereplő, de orientációt kiváltó válaszok esetében. Az ábra erre mutat példát.
Eseményhez kötött potenciálok sztenderd, cél- és újdonságingerre. A sztenderd inger értelmetlen fekete-fehér ábra volt, 80 százalék előfordulási valószínűséggel. A célinger, melyre gombnyomásos választ kellett adni, egy
349 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény másik, de könnyen megkülönböztethető fekete-fehér ábra volt, mely 10 százalék valószínűséggel jelent meg. Az események további 10 százaléka minden alkalommal más és más színes pillangó volt. Az újdonságingerek és a célingerek egyaránt kiváltottak késői pozitív hullámokat, azonban az újdonságingerre kiváltott válasz a fej elülső (frontocentrális), a célingerekhez kötődő válasz pedig a parietális területei felett volt a legnagyobb. A célingerekre adott válasz maximumát (csúcslatencia) később érte el, és hosszabban fennmaradt (Czigler és Pató publikáltan kíséretéből. Fordítsuk meg most a helyzetet. Az eddigiekben ugyanis nem a célingerek indították el az önkéntelen figyel- mi folyamatot, hanem a vizuális mezőben megjelenő egyéb ingerek. Olyan helyzet is előfordulhat azonban, amikor maguk a célingerek vonják magukra a figyelmet. Ebben a helyzetben a célinger eltér a zavaró ingerektől, és erre a „magányos” ingerre (Pashler 1998) kell választ adni. Ilyen helyzettel is találkoztunk, méghozzá a vizuális keresési feladatnál, a sajátságokra irányuló keresés esetében. A kérdés jelen esetben az, hogy csökkenti-e a célingerre adott válasz idejét, ha a célingernek van egy olyan tulajdonsága, mely eltér a vizuális mező többi ingerétől, azonban ez a tulajdonság nem szabja meg, hogy az ingerre milyen választ kell adni (ezt az inger egy további sajátsága határozza meg). A kérdésre Hillstrom és Yantis (1994) kísérlete ad választ. A feladat annak eldöntése volt, hogy a betűk között szerepel-e egy adott karakter (van-e közöttük S betű) Az S lehetett ugyanolyan típusú, mint a többi, lehetett más színű, más világosságú, lehetett felvillanás olyan betűk között, melyek a korábban bemutatott szegmentumkialvásos módszerrel (16.6. ábra) jelentek meg. Az eredmények szerint csak akkor csökkent a reakcióidő, ha a célinger abban tért el a többitől, hogy az felvillant a mezőben, azaz mint új objektum jelent meg, a többi inger viszont szegmentumkialvással, azaz mint egy meglévő objektum változása. Az új objektum feltűnése tehát magára vonhatja a figyelmet, különösen akkor, ha ez egy feladat célingere lehet. A feladatreprezentáció és az inger tulajdonságainak kapcsolatát hangsúlyozza a feladatfüggő figyelmi megragadás elmélete (Folk et al. 1992). Az elmélet szerint azok a sajátságok vonják magukra a figyelmet, melyek megegyeznek a feladatreprezentációban rögzített tulajdonságokkal. Illusztrációként két kísérletet mutatunk be, az egyikben a jelzőingerek és a célingerek kapcsolatát vizsgálták, a másikban pedig a feladat szempontjából lényegtelen változások detekcióját. Folk és munkatársainak (1992) vizsgálata ismét a téri figyelem Posner-típusú paradigmájának egy speciális esete. A kísérlet vázlatát a 17.7. ábra mutatja. A részt vevő személy középre fixált, az ingerek megjelenésének lehetséges helyét pedig négy négyzet jelezte. A feladat az volt, hogy a személy döntsön a két lehetséges célinger között (+ vagy =). Az egyik esetben (szín feltétel) a célinger piros volt, a másik három négyzetben viszont fehér színű + vagy = jelent meg. A másik, a felvillanásos feltételben egyetlen négyzetben jelent meg ábra: felvillant a + vagy az = jel. A célingerek megjelenését jelzőinger előzte meg. Ez színes fénypontokból állhatott az egyik esetben, melyek az egyik négyszög körül jelentek meg, míg a másik három körül fehér fénypontok voltak. A másik esetben a jelzőinger fényfelvillanásos volt: az egyik négyzet körül fénypontok villantak fel. Így összesen négy kísérleti helyzet volt: szín jelzőinger – színfeladat, szín jelzőinger – felvillanásos feladat, felvillanásos jelzőinger – felvillanásos feladat, felvillanásos jelzőinger – színfeladat. Egyes sorozatokban a jelzőingerek 100 százalék valószínűséggel mutatták a célinger helyét, más sorozatokban viszont a validitás 0 százalék volt. Az eredmények szerint döntő jelentősége van a jelzés és a feladat kompatibilitásának: a színjelzés hatására a színfeladatban tért el a 100 százalékos és 0 százalékos validitás esetében a reakcióidő, felvillanásos jelzőinger feladatban viszont a felvillanásos feladatban.
350 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény 17.7. ábra. Folk és munkatársai (1992) kísérletének vázlata. A bekapcsolási jelzőinger bekapcsolási célinger esetében befolyásolja a reakcióidőt, a szín jelzőinger pedig szín célinger esetében. A kísérlet a feladatfüggő figyelmi megragadás példája A feladatfüggő megragadás másik példája a nemfigyelési vakság egyik demonstrációja. Most és munkatársai (2005) kísérletében a képernyőn lévő keretben fekete és fehér körök és négyzetek vándoroltak, mégpedig véletlenszerű irányban. Az idomok időnként nekiütköztek a keretnek. A személyek feladata az volt, hogy számolják, az egyik alakzat példányai (egyes próbákban a körök, más próbákban a négyzetek) hányszor ütköznek a falnak. Néhány bevezető próba után következett a kritikus próba: egy szürke kör (tehát egy olyan idom, melynek a színe nem egyezett a többi elem színével) átvonult a mező közepén (17.8. ábra). Azok a személyek, akik a köröket figyelték, azaz olyan alakzatokat, amelyek formája egyezett az átvonuló idoméval, 80 százalékban észrevették az átvonuló szürke kört. Akik viszont a négyszögeket, azok csak 7 százalékban.
17.8. ábra. Most és munkatársai (2005) kísérletének vázlata. A nemfigyelési vakság olyan esetben mutatkozott meg, amikor az irreleváns objektum formája eltért a célingerekétől. A kísérlet a feladatfüggő figyelmi megragadás Az önkéntelen figyelemmel kapcsolatos eredmények tehát úgy foglalhatók össze, hogy az ingerszegény mezőben megjelenő új objektum általában magára vonja a figyelmet. A többitől eltérő (magányos) inger is felkelti a figyelmet (számos kísérlet eredménye szerint többnyire akkor, ha a feladat maga is egy a többitől eltérő inger keresésére irányul), továbbá a feladatreprezentáció és a megjelenő ingerek sajátságainak viszonya lényegesen befolyásolja az önkéntelen figyelem irányulását.
4.1. Téri figyelem és szemmozgások Az eddigiekben olyan téri figyelmi kísérletekről volt szó, amelyekben a figyelem „rejtett” orientációját vizsgálták. E kísérletekben a szemmozgásokat vagy úgy akadályozták meg, hogy instrukciókban kérték a résztvevőket, hogy a kísérleti próba egész ideje alatt egy pontra fixáljanak (számos vizsgálatban ezt szemmozgás-regisztrálással ellenőrizték), vagy olyan rövid idő telt el a jelzőinger és a célinger bemutatása között, hogy nem volt lehetőség szemmozgásokra. (A szokványos szakkádikus szemmozgások latenciaideje 200 ms körül van.) Mi történik akkor, ha szabad szemmozgásokat végezni, vagy éppenséggel megkívánt a szemmozgás a célinger felé? Theeuwes és munkatársai (1998) kísérletében éppen ilyen helyzetet vizsgált. A személyeknek arról kellett dönteniük, hogy a célinger C vagy fordított C, de a karakterek olyan kicsik voltak, hogy a helyes megoldás szemmozgásokat igényelt acél ingerek felé. A lehetséges ingerek helyét a már többször említett 8-as alakzatok mutatták, melyek egy-egy körön belül voltak. A megfelelő szegmentumok eltűnésével (azaz új objektum megjelenése nélkül) alakult ki a C vagy tükörképe. A célinger helyét úgy jelölték, hogy a többi helyen megváltozott a 8-as alakzatot körülvevő kör színe, a majdani célinger helyén viszont azonos maradt. A kritikus próbákban a helykijelölő körökön kívül egy újabb kör villant fel a célingerrel egyszerre. Ez az ingermegjelenés önkéntelenül magára irányíthatta a figyelmet. A figyelemfelkeltő objektum a célingert magában foglaló kör mellett, máskor attól 90 fokra (ha például a célinger a 3 órának megfelelő helyen volt, akkor a 6 órának megfelelő helyen) vagy a mezőben átellenes területen jelenhetett meg. A felvillanó irreleváns inger a rekcióidőt 60-70 ezredmásodperccel meghosszabbította, és ami feltűnő volt, a próbák 40-50 százalékában az első szemmozgásirány a felvillanó kör irányába mutatott. E kísérleti típus érdekessége, hogy a személyek általában nemcsak azt nem vették észre, hogy bármiféle szemmozgást végeztek volna a felvillanó kör irányába, de gyakran azt sem észlelték, hogy egyáltalán megjelent az irrelev áns inger. Az eredmény a gyakorlat szempontjából egyáltalán nem közömbös. A pozitív oldalon: lehet, hogy valamiféle emlékezeti reprezentáció kialakul a nem figyelt ingerekről, például egyes autópályák 351 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény mellett elhelyezett óriásreklámokról. A negatív oldal: ugyan észre sem vesszük, ezek a képek jelentősen befolyásolhatják reakcióink gyorsaságát kritikus forgalmi helyzetekben.
4.2. A figyelem sötét oldala A vizuális figyelem sötét oldalának (Chun-Marois 2002) nevezhetjük a nem figyelt környezeti mozzanatok kimaradását az észlelt világból. A dichotikus kísérletek bőven szolgáltak ilyen esetekkel, azonban a vizuális területen a nemfigyelési vakság jelenségét általában meglepőbbnek találjuk, hiszen amit nem veszünk észre, „a szemünk előtt” történik. A nemfigyelési vakságról korábban már szó volt. Simons és Levin (1997) terepvizsgálat jellegű demonstrációival idézzük fel, milyen, szinte a „kandikamera”-műsorokba illő jeleneteket okozhat a figyelem hiánya. Tegyük fel, hogy egy idegen megállít valakit az utcán, és megkérdezi, miként lehet eljutni valahova. Mialatt magyarázunk, két munkás közeledik egy ajtóval, és elmegy közöttünk. Amíg az ajtó eltakarja az idegent, egy másik idegen lép a helyére. Az embereknek mintegy fele nem veszi észre a cserét. „Nem figyelte meg” a másik embert, pedig közelről beszélt vele. A nem figyelt változások detekcióját, pontosabban annak hiányát számos eljárásban vizsgálták. Blackmore és munkatársai (1995) kísérletében a látótérben helyet változtató képekre kellett szemmozgásokat végezni (a foveán tartani a képeket). A szemmozgások alatt jelentéktelennek éppen nem nevezhető részletek változtak meg a képeken. A résztvevők teljesítménye mégis elég gyenge volt az azonosság/eltérés megítélésében. A jelenségkört változási vakságnak nevezik. Rensink és O’Regan (pl. O’Regan et al. 1996, Rensink et al. 1997) több eljárását alakított ki e jelenség vizsgálatára. Az egyikben két kép váltakozva jelenik meg rövid időre, a felvillanások között kis szünettel (ekkor a képernyő szürke). A két kép majdnem azonos, de van közöttük némi eltérés, például az egyiken a bal felső sarokban három, a másikban négy pálmafa van. A szekvenciát hosszan nézik az emberek, míg észreveszik a változást. Ha viszont egyszer észreveszik, többé „nem lehet nem észrevenni”. Egy másik módszernél rövid időre megjelennek a képen „pacák” (kis szabálytalan foltok), és ezalatt a képen megváltozik egy tárgy. A személyek e változást általában nem veszik észre. Meg kell jegyezni, hogy abban az esetben, ha a képek között nem lenne rövid szürke szakasz, vagy nem jelenne meg paca, a változások azonnal szembetűnnének: a változások helyén a kontraszt-kontúr-szín hirtelen (tranziens) megváltozása ilyenkor a figyelmet magára vonja. A szünet és a paca viszont éppen a képre irányuló figyelmi folyamatokat szünteti meg egy rövid időre. A változás ilyenkor észrevétlen marad. A változási vakság jelenségének magyarázatai igen tanulságosak a figyelem elmélete szempontjából. O’Re- gan (1992) értelmezése szerint a képekről nem alakult ki olyan emlékezeti reprezentáció, mely a változás detekcióját lehetővé tenné. Az észlelőrendszernek ugyanis nincs is szüksége ilyen reprezentációk kialakulására, hiszen a stabil vizuális világ állandóan rendelkezésre áll „ott kinn”. Emlékezeti reprezentáció csak ott alakul ki, ahol figyelmi folyamatok működnek, e folyamatok pedig néhány (átlagosan négy), a munkaemlékezet kapacitásának megfelelő egységre korlátozódnak. Simons és munkatársai (2002) interpretációja ennél kevésbé szélsőséges. A részletes reprezentáció kialakul ugyan, az egymást követő képek reprezentációi azonban a figyelem hiányában nem kerülnek összehasonlításra. Számos bizonyíték létezik ugyanis arra, hogy figyelmi folyamatok hiányában is kialakul olyan reprezentáció, amely befolyásolhatja a későbbi viselkedést. (E „tünékeny reprezentációk” részletesebb elemzését lásd Czigler 2004, 2005.) Illusztrációként egyetlen kísérlet eredményét említjük. DeSchepper és Treisman (1996) vizsgálatában értelmetlen ábrák egyidejűleg bemutatott párjáról kellett megállapítani, hogy azok azonosak-e vagy különbözőek. Az ábrapár egyik tagja színes volt, és zavaró ingerként egy más színű ábra is rá volt rajzolva. Az összehasonlítás szempontjából releváns ábrát a szín jelezte (például piros, a zavaró ábra pedig például zöld volt). Hasonló ingerek esetében Rock és Gutman (1981) kimutatta, hogy a zavaró ábrákat az összemérési sorozat esetében a résztvevők nem képesek azonosítani. Mármost vizsgálatában egyes ábrák, melyek először mint zavaró ábrák jelentek meg („rossz színűek” voltak), a későbbiekben mint összehasonlító ingerek szerepeltek („jó színűek” voltak). Az ilyen kísérleti elrendezésben érvényesül a korábban bemutatott negatív előfeszítési hatás: a korábban zavaró ábrák az összemérésben meghosszabbodott reakcióidőt eredményeznek. Különösen meglepő, hogy e hatás hosszabb ideig fennmarad: ha az ábra zavaró ingerként való bemutatását húsz próbával követi célingerként való megjelenése, még mindig érvényesül a negatív előfeszítési hatás. DeS- chepper és Treisman (1996) olyan személyeket is talált, akiknél a hatás a következő napra is áthúzódott. A változási vakság magyarázatának harmadik lehetősége szerint kialakul a részletes reprezentáció, sőt megtörténik a változás detekciója is, a figyelmi folyamatok hiányában azonban ennek eredménye rejtve marad. Hatása mégis megmutatkozhat. Az implicit változásdetekció illusztrációjaként Thornton és Fernandez-Duque (2000) illetve Fernandez-Duque és Thornton (2003) kísérletét mutatjuk be. A kísérlet vázlatát a 17.9. ábra mutatja. A feladatban el kellett dönteni, hogy egy rövid időre bemutatott téglalap függőleges volt-e vagy vízszintes. A kísérletben nyolc kis téglalapot mutattak be, majd szünet követezett, amit újabb nyolc téglalap bemutatása követett. E bemutatás időrendje megfelelt a változási vaksági kísérletekének, ezért abban az esetben, 352 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény ha az egyik téglalap orientációja megváltozott, ezt a személyek gyakran nem vették észre. A második nyolcas egység bemutatását követte a tulajdonképpeni teszt, amikor a nyolcból az egyik négyszög világossága megváltozott. A résztvevő feladata az volt, hogy jelezze reakcióidő-helyzetben, hogy a négyszög (tesztinger) függőleges vagy vízszintes. Az eredmények szerint a változás befolyásolta a döntést, még akkor is, ha a személy a változásról nem tudott beszámolni. Amikor a tesztinger megegyezett a változás eredményével (például függőlegesből vízszintes lett, és a tesztinger is vízszintes volt), a hibázások száma csökkent, a reakcióidő pedig rövidebb lett. Ez a (pozitív) előfeszítési hatás helytől független volt, tehát a tesztingernek nem kellett hozzá ugyanott lenni, mint a változás helyének.
17.9. ábra. Thornton és Fernandez-Duque (2000, Fernandez-Duque–Thornton 2003) kísérletének vázlata Az implicit változásdetekció és egy olyan automatikusan működő emlékezeti rendszer, amely regisztrálja a környezet szabályszerűségeit és az ezektől való eltérést, pszichofiziológiai kísérletezéssel tárható fel. Ha a vizsgált személyt leköti valamilyen feladat, például videojátékot játszik, vagy olvas egy érdekes könyvet, a háttérben szóló hangokra egy idő múlva nem figyel. Ha e háttérhangok szabályszerűségeitől eltérő hang érkezik, az kivált egy agyi elektromos hullámot, melyet eltérési negativitásnak (EN; lásd még a hallás pszihológiájával foglalkozó fejezetet) nevezünk (Naatanen et al. 1978). Annak a szabályszerűségnek, melynek megsértése kiváltja az eltérési negativitást, reprezentálódnia kellett az akusztikus szenzoros emlékezetben. Az EN tehát alkalmas arra, hogy megmutassa, melyek azok a környezeti szabályszerűségek, melyek regisztrációjához nincs szükség figyel- mi folyamatokra (összefoglalásként lásd Czigler, 2003a). Több kísérlet eredménye mutatja, hogy ilyen szabályszerűség az ingerek váltakozása (például magas-mély-magas-mély-...), ahol az ismétlődés (például két magas hang egymás után) kiváltja ezt a hullámot. A 17.10. ábra „szabálytalan” ismétlődésre megjelenő EN-t mutat. Ha egy hosszabb inger magas, a rövidebb mély, viszont ennek a szabálynak a sértésekor a hosszabb hang mély (vagy a rövidebb magas), szintén regisztrálható ez az agyi hullám. Ilyenkor a szabály megsértése a két sajátosság szokatlan együttese. Az automatikusan tárolt szabályszerűségek tehát nem egyszerűen az egyes ingersajátságokra (hangmagasság, hangerő, ingerlés helye) korlátozódnak, hanem az akusztikus eseményekre, akusztikus objektumokra. Mivel a hangeseményekre jellemzőek az időbeli szabályosságok (a hangmagasság, hangerő gyors, de szabályos változásai), nem meglepő, hogy az automatikus tárolórendszer akusztikus eseménycsomagokat állít elő, melyek mintegy 200 ms hosszúságú adagokban tárolják a beérkező hangegyütteseket. Legyen például egy hangsorozatra jellemző, hogy milyen a hangok intenzitása, valamint az, hogy a hangmagasság a hang kezdete után röviddel megváltozik (például mélyebb lesz). Ha a hangerő és magasság iránya megváltozik (hangosabb és magasabb lesz), e változás egyetlen EN-t vált ki, ha a magasság változása 200 ms-on belül van (egyetlen esemény az intenzitás és a magasság változása). Ha viszont a magasság változása 200 ms-nál hosszabb idővel követi az intenzitás változását, két EN regisztrálható. Ilyenkor az automatikus rendszer külön eseményként tárolja a két változást (17.10. ábra). A figyelemre tehát – legalábbis a hangok világában – nincs szükség ahhoz, hogy egy „primítív intelligencia” regisztrálja a világ eseményeit. Mi lehet a szerepe egy ilyen rendszernek? Egyrészt a valósághű észleléshez szükség van egy viszonyítási rendszerre. Másrészt (és a figyelem témaköre szempontjából ez a lényeges), ha a szabályszerűségektől való eltérés elér egy kritikus szintet, működésbe léphetnek a figyelmi mechanizmusok – mint ezt az előzőekben láthattuk.
353 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény
17.10. ábra. Szabályosan váltakozó ingerek sorozatában megjelenő ritka ingerekkel kiváltott agyi elektromos válaszok. Az ábra bal oldalán a homloklebeny felett elhelyezett elektródákkal regisztrált eseményhez kötött potenciálok (EP) láthatók. A vastag vonal a szabálytalan ismétlődésekkel kiváltott válasz, a vékony vonal a szabályosan váltakozó ingerekre regisztrált EP. A jobb oldalon a vastag vonal a két EP különbsége (különbségpotenciál). A vékony vonal a fül mögött elhelyezett elektródákkal regisztrált különbségpotenciál. Míg a homloklebeny felett a szabályosság hatása egy negatív hullám, azaz a jellegzetes eltérési negativitás (EN), a fül mögötti elektródák esetében a különbség egy pozitív hullám. E polaritásfordulás jellemző az EN összetevőre (Horváth et al. 2001 nyomán) Sokáig kétséges volt, hogy a látás esetében van-e hasonló, „figyelem nélküli primitív intelligencia”. Az újabb kísérletek eredményei azonban pozitívak: a szín és irány szokatlan összekapcsolása figyelmi folyamatok nélkül is kivált vizuális eltérési negativitást (Czigler 2004), és megjelenik e hullám akkor is, amikor a színek szabályos váltakozása helyett a színes inger ismétlődik (Czigler et al. 2006). A környezet szabályszerűségeinek e figyelmi folyamatok nélküli követése két szempontból is lényeges. A figyelt ingerek észlelésekor a valósághű észleléshez szükség van a háttér információira. Másrészt a szabályosság megsértése indítja azt a folyamatsort, mely a figyelem önkéntelen váltásához és az orientáció egyéb összetevőinek megjelenéséhez vezet.
4.3. Figyelmi pislogás Amikor egy adott inger figyelmi feldolgozása időlegesen igénybe veszi a feldolgozórendszert, a később érkező ingerek észlelésében zavar keletkezhet. E jelenséget figyelmi pislogásnak nevezzük. Az elnevezés arra utal, hogy a pislogás időlegesen lezárja a fény útját, a figyel- mi működés pedig lezárja az információfeldolgozásét. A jelenség bemutatására a gyors vizuális szeriális ingeradás módszere alkalmas. Ilyenkor a feladatban szereplő képek rövid ideig (~ 100 ms) jelennek meg, és szünet nélkül követik egymást. Egy tipikus kísérletben a személyeket arra kérik, hogy rövidebb (15-20 ingerből álló) sorozat bemutatása után mondják meg, a lehetséges célingerek melyike szerepelt a sorozatban. Vogel és munkatársai (1998) kísérletében például a képek többsége fekete színű betűsor (pl. ZHOTXAB) volt. Szerepelt azonban a sorozatban egy számokból álló sor (pl. 55555555) is, ez volt az első célinger, és egy értelmes szó is, mely betűk közé volt rejtve (pl. CNKÉZSL), a második célinger. A résztvevőknek be kellett számolniuk a számsorról, és meg kellett mondaniuk, mi volt a szó. Az ilyen és ehhez hasonló kísérletek tipikus eredménye, hogy a második célingerre a teljesítmény visszaesik, ha az első célingert 200-400 ezredmásodperccel követi. (Ha közvetlenül követi, a teljesítmény jó lehet, és akkor is jó, ha két célinger között 3-4 közömbös inger volt.) Különösen érdekesek azok az eredmények, melyek arra utalnak, hogy azoknak a célingereknek is van implicit hatásuk, melyekről a személyek nem képesek beszámolni. Shapi- ro és munkatársai (1997) például kimutatták, hogy az ilyen ingerek jelentése előfeszítő hatást gyakorolhat későbbi ingerek feldolgozására. A figyelmi pislogás hátterében tehát egy olyan mechanizmus állhat, melynek működése során kialakul az inger jelentése, azonban a következő inger megjelenése megakadályozza azt a folyamatsort, mely az explicit emlékezeti regisztrációhoz (mondhatjuk, a tudatosuláshoz) vezethet (ChunPotter 1995).
5. Fenntartott figyelem és aktiváció 5.1. Vigilancia Mennyi ideig tudunk figyelni valamire? A kérdés lényeges, hiszen megszabja a teljesítményt számos munkahelyen, a sportban, de akár az előadóművésznek vagy tanárnak is tekintettel kell(ene) lennie arra, hogy mennyi ideig érdemes igénybe venni hallgatóságát. A kérdés annyiban pontosítható, hogy ilyenkor azt elemezzük, hogy mennyi ideig tartható fenn a magas szintű teljesítmény, amikor nincs szükség jelentősebb fizikai erőfeszítésre, a figyelmi folyamatok pedig bizonyos előre meghatározott környezeti eseményekre és a velük kapcsolatos akciókra irányulnak. A pszichológiában e témakör a vigilancia kutatási területéhez kapcsolódik. A vigilancia terminus Head angol neurológustól származik, aki a (fiziológiailag) maximális 354 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény hatékonyság állapotát nevezte így. Mackworth (1970) nyomán a vigilanciát olyan állapotnak tekintjük, mely biztosítja, hogy bizonyos kis intenzitású, véletlenszerű időpontban megjelenő környezeti jelzésekre meghatározott módon válaszoljunk. A kutatások zömét régebben, az 1960-70-es években végezték, de maguk az adatok és a következtetések máig nem veszítették el aktualitásukat. Mint az előző fejezet történeti bevezetőjében írtuk, a figyelem modern kutatásai alkalmazott területeken kezdődtek, és az egyik ilyen témakör éppen a fenntartott figyelem volt. Újabban sokkal inkább a hatékonyságot megalapozó idegrendszeri működés (az aktiválórendszerek) megismerésében újulnak meg az ismeretek, e kérdéskör azonban túlmutat témánkon. A hosszabb ideig fenntartandó figyelem (pontosabban a teljesítmény) elemzésére olyan feladatokat dolgoztak ki, melyek modellezték a hosszabb ideig fenntartott figyelmet igénylő munkaköröket. Erre a különböző eljárások közül ma is leggyakrabban a Mackworth-féle óratesztet alkalmazzák. E tesztben egy fehér homogén háttér előtt mutató jár körbe. A mutató másodpercenként egyet ugrik, egy körforgás alatt 100 normál ugrást végez. Időnként azonban előfordulnak kétszeres ugrások is. A vizsgálatban részt vevő személy feladata ezeknek a dupla ugrásoknak a jelzése gombnyomási válasz formájában. Az alapkísérletben fél óra leforgása alatt 12 ilyen ugrás jelent meg, az ugrások közötti időtartam 45 és 180 másodperc között változott. Egy ülés több ilyen sorozatból állt, és mintegy két órán keresztül tartott. Az órateszt mellett alkalmaztak a klasszikus vizsgálatokban (lásd Mackworth 1970) egy olyan feladatot is, melyben kör alakú zöld ernyőn kis folt jelent meg, hasonlóan a radar képernyőjéhez, valamint egy akusztikus tesztet, melyben 18 másodpercenként hangok szólaltak meg. Néha a hang hosszabb volt, mint a sztenderd, a résztvevőknek ezeket kellett jelezniük. Mindhárom feladatra jellemző volt, hogy a részt vevő személyek teljesítménye a második félórában rosszabb volt, mint eleinte. Ezt további teljesítménycsökkenés követte, ennek aránya azonban már kisebb volt. Az óratesztben például négy félórás sorozatban 25 tisztiiskolásnál a találati arány 0,84, 0,74, 0,72, illetve 0,71 volt. Ezt a hatást nevezik a vigilancia csökkenésének. A korai kutatások során megfigyelték azt is, hogy a hatások csökkennek, ha a találatokról, illetve a téves riasztásokról visszajelzést adnak (sajnos ez az „éles” helyzetekben nem megy), és akkor is, ha a félórás sorozatok között 30 félórás szüneteket tartottak. Ezeket a klasszikus eredményeket Mackworth (1969, 1970) könyvei foglalják össze. A fenti teljesítménycsökkenés akkor mérhető jól, ha hosszabb szakaszokra (a teljes félórára) átlagolják az egyéni teljesítményt, majd kiszámítják a csoport átlagát. A teljesítmény azonban már a munka kezdete után röviddel csökkenni kezd. Az órateszt egyik változatát alkalmazva Jerison (idézi Davies-Parasuraman 1982) 36 személy adatait abból a szempontból elemezte, hogy a személyek hány százaléka jelezte az első, a második stb. jelzőingert (szignált). Az ilyen „finom felbontású” elemzés szerint a teljesítmény az első félórán belül is jelentősen csökken, a csökkenés üteme viszont fokozatosan esik. A vigilanciafeladatokban a teljesítményt hagyományosan a találati aránnyal fejezik ki. Alkalmazzák ezenkívül a reakciók latenciaidejét, továbbá azokban a feladatokban, ahol a detektálandó inger mindaddig tart vagy ismétlődik, míg a megfigyelő nem reagál, a teljesítményt jellemzi a szignál hosszúsága, illetve ismétlődéseinek száma. A vigilanciafeladatoknál a jelek kihagyása mellett a hibázások másik típusát az alaptalan válaszok alkotják. Így a teljesítményben tekintetbe kell venni a téves riasztásokat is (Braoadbent 1971). A találati és téves riasztási arányok egyidejű elemzése a szignáldetekciós elmélet (lásd a pszichofizikai fejezetet) keretében lehetséges, ahol a találati arányok és a téves riasztási arányok ismeretében kiszámítható, hogy milyen érzékeny a feldolgozási rendszer, valamint mennyire hajlamos a lehetséges válaszok valamelyikét előnyben részesíteni (torzítási hajlam). E két tényező egymástól nem függ, vigilanciahelyzetekben mindkettő változhat, tehát elkülönített kezelésük maximálisan indokolt. A vigilanciafeladatokban mutatkozó teljesítménycsökkenés több tényező hatásának eredője. Csökkenti a teljesítményt a visszajelzések hiánya (a helyes válaszokat nem követi megerősítés vagy a hibás válaszokat hibajel). A vigilanciatesztek választ nem kívánó (sztenderd) ingereire kialakuló válaszgátlás kiterjedhet az ilyen ingerektől csak kissé különböző, de választ követelő ingerekre, így ezekre is csökken a válaszhajlam (Broadbent 1958, 1971). Szintén Broadbent (1971) vetette fel, hogy a figyelem időleges csökkenésében, a figyelmi blokkok jelentkezésében szerepet játszhat a figyelmi szelektivitást biztosító szűrő labilitása. Az alkalmazkodó viselkedés szempontjából ugyanis fontos, hogy időről időre a feldolgozórendszer „mintát vegyen” a környezetből, azaz átváltson az eredetileg nem figyelt információforrásokra. E váltások kapcsán a feladathoz tartozó ingerek detekciója elmaradhat. A tényezők egy következő csoportja a teljesítmény csökkenését ahhoz az általános aktivitásiszint-csökkenéshez köti, mely a kísérleti helyzet ingerszegény jellegéből adódik (Mackworth 1969). Szintén Mackworth (1969) vetette fel, hogy a vigilanciafeladatokban a teljesítmény változásai kapcsolatba hozhatók a habituáció jelenségeivel is. A habituáció itt annyit jelent, hogy ismételt ingerlés hatására számos reakció (idegrendszeri, vegetatív, viselkedéses) intenzitása csökken. Mackworth szerint ugyan a környezeti ingerekre gyorsabb a habituáció, mint a feladatban szereplő ingerekre, de ahogy az idő múlik, ezek az ingerek is habituálódnak. Deese 355 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény (1955) a teljesítménycsökkenés okaként felveti a várakozások, elvárások változásainak szerepét. E magyarázat szerint a jelek kis gyakorisága döntő tényező a teljesítmény alakulásában. A kísérleti ülés korai szakaszában fokozatosan alakulnak ki az elvárások. Eleinte a személy nagyobb jelgyakoriságot vár. Ahogy „idomul” a helyzethez, úgy csökkennek a várakozások. A várakozás csökkenése a kísérlet elején a legnagyobb, és ez ilyenkor jelentősebben csökkenti a teljesítményt. A vigilanciafeladatokban mutatkozó teljesítménycsökkenésben szerepet játszhat a résztvevők csökkenő motivációja is. Smith (1966) szerint a „periodikusan részt vevő” személyek nem dolgoznak mindig teljes kapacitással. A feladat monoton jellege ilyen személyeknél a belső (intrinsic) motivációt csökkenti. A külső motiváló tényezők (például az eredmények ismerete) így megnövelhetik a teljesítményt – ami számos kísérlet eredményeiben meg is mutatkozik. A különböző feladatokban a teljesítménycsökkenés mértéke lényegesen eltér. Az eltérések közül több feloldódik akkor, ha megfelelően csoportosítva értékelik a vigilanciafeladatokat. A csoportosításnál szempontként szerepelhet a) az ingerek modalitása, b) az ingerlés bonyolultsága, c) a szignálok gyakorisága és d) a detekciós válaszhoz szükséges diszkrimináció módja. Levine és munkatársai (1971) számos feladat elemzése alapján általánosan releváns szempontnak tartották, hogy a feladat az egymás után érkező ingerek diszkriminációját követeli-e, vagy egy adott ingert ki kell-e emelni a háttérből. Az idő előrehaladtával a tapasztalatok szerint főleg az első esetben csökken a teljesítmény. Davies és Parasuraman (1982) nyomán az első csoportba tartoznak a vizuális területről azok a feladatok, melyekben szaggatott fényingerlésnél az intenzitás vagy az időtartam változását kell jelezni, vagy műszermutatók kilengése esetében az eltérő kimozdulások jelzése. Akusztikus feladat e csoportban szaggatott ingereknél szintén az intenzitás- vagy időtartam-változás, vagy például hangosan adott számsor esetén a szabályosság megváltozásának jelzése. A második csoport vizuális feladata például betűsorok esetében egy adott, több elemből álló szekvencia jelzése, egyidejű foltok bemutatásakor az esetleges eltérő színű, nagyságú stb. folt jelzése, vagy kis intenzitású fényingerek detekciója. Hangok esetében a folyamatos vagy szaggatott zajba ágyazott hang megjelenésének detekci- ója, a folyamatos zaj megszakadásának jelzése tartozik ebbe a csoportba. A vigilanciafeladatokban a teljesítmény csökkenését (a szignáldetekciós elmélet terminusait használva) okozhatja az érzékenység csökkenése, de okozhatja a válaszkritérium szintjének változása is. Bár a vigilanciafelada- tok hasonlítanak a szignáldetekciós helyzetekre, maguk a számítások sokszor nem egyszerűek, mivel kicsi a releváns események gyakorisága. Mindazonáltal az elvégzett szignáldetekciós számítások szerint az a nézet alakult ki, hogy az idő múlásával a kritériumszint emelkedik. A teljesítményben ez úgy jelentkezik, hogy a találati arány és a téves riasztási arány egyaránt csökken. Ez azonban a helyzet alapos egyszerűsítése. Broadbent és Gregory (1963, Broadbent 1971) adatai szerint az idő előrehaladtával a kritérium- szint csak akkor nő, ha már kezdetben is elég magas volt. További bonyodalom, hogy a kritériumszint alakulása attól is függ, hogy milyen a jelgyakoriság. Baddeley és Colquhoun (1969) eredményei szerint a nagyobb jelgyakoriság alacsonyabb kritériumszinttel jár együtt. Drury és Addison (idézi Davies-Parasuraman 1982) valóságos munkahelyzetben is talált ilyen tendenciát. Amikor megnőtt a selejtes munkadarabok száma, csökkent a minőségellenőrök kritériumszintje. A vigilanciahelyzetek között vannak olyanok is, ahol az érzékenység csökken. Míg az órateszt hagyományos formájában az érzékenység csökkenése nem mutatható ki, a vizsgálati módszert kissé megváltoztatva megfigyelhető az érzékenység csökkenése. Mackworth (1970) egyik kísérletében a folyamatosan mozgó mutató megállását kellett jelezni, nem az ugró mutató szokásosnál nagyobb ugrását. A különbség úgy fogalmazható meg, hogy a szokásos eljárásban a megfigyelő időzíthette a megfigyelés pillanatát (a mutató szabályos időközönként ugrott), a módosított változatban nem, mivel itt a detektálatlan megállás bármely pillanatban bekövetkezhetett. Van egy további tényező is, mely meghatározhatja az érzékenységet. Ez az ingerek összgyakorisága (például az óratesztben a szimpla plusz dupla ugrások időegységre eső száma). Minél nagyobb a gyakoriság, annál valószínűbb az érzékenység csökkenése az idő függvényében. Végezetül, számos vigilanciafeladatot elemezve Parasuraman (1979) arra a megállapításra jutott, hogy a legkevésbé akkor csökken az érzékenység, ha az események össz- gyakorisága kicsi, és nem kíván emlékezeti működést annak eldöntése, hogy az ingerre kell-e válaszolni, vagy sem, tehát azokban a feladatokban, ahol a jelet a háttértől kell megkülönböztetni. Láthattuk, hogy a vigilanciakísérletekben a teljesítményt, a teljesítmény változásainak okait és a feladatok különböző típusaiban a várható változásokat kimerítően elemezték. A magyarázó elvek sokasága alapján úgy tűnik, nem lehet egykönnyen olyan okot találni, mely egységesen magyarázza az összes teljesítményváltozást. Sokkal valószínűbb, hogy abban a helyzetben, amikor a teljesítmény magas szintjét hosszabb ideig fenn kell tartani, ez a törekvés számos vonatkozásában akadályokba ütközik.
5.2. Éberség és teljesítmény 356 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény A vigilanciakísérletekben mutatkozó teljesítménycsökkenést, mint láttuk, kapcsolatba hozták az aktivitás, az éberség csökkenésével, a korábbiakban pedig az orientációs válasz kapcsán került szóba az aktiváció időleges növekedése. De mi is az az aktiváció, az aktivitási szint? Mindennapos tapasztalat, hogy a semmittevés álmosító, ha feszültek vagyunk, „túlpörögtünk”, nem tudunk a munkára figyelni, de nem tudunk akkor sem, ha ebéd után inkább szundítanánk egyet. Az éberséget, aktivációt biztosító idegrendszeri mechanizmusok felfedezése olyan fontos szerepet töltött be a kísérleti pszichológia történetében, amit talán csak a reflexelv múlt felül. Az aktivációt biztosító rendszer felfedezése (Moruzzi-Magoun 1949) meghatározóan befolyásolta a pszichológiai gondolkodást. Az aktiváló hatások egy része a külső környezetből származik, de hasonlóan befolyásolják az agykérgi aktivitást a belső környezetből származó hatások is. Az észlelőrendszer, a belső környezet állapotát jelző rendszer és a motivált viselkedést szervező (közte a mozgató-) rendszer egységes működését Grastyán (1983, 6-8.) leírása összegzi: „Nyilvánvalóvá vált, hogy az aktiváló hatás nem korlátozódik a mesencephalikus formatio reticularisra [középagyi hálózatos állomány – Cz. I.], hanem annak a hatalmas működési komplexusnak a sajátsága, melyeta limbicus rendszer fogalma jelöl. Ezzel az aktiváló hatást mutató területek, legalábbis topológiai szempontból, fedésbe kerülnek azokkal a területekkel, melyek a korábbi évtizedek kutatásai során úgy váltak ismertté, mint a szervezet belső miliőjét szabályozó homeosztatikus rendszer és egyúttal az emóciók egyik legmagasabb idegi szubsztrátuma. E felismerés elvi jelentősége abban rejlik, hogy alapot ad arra a feltételezésre, hogy az aktiváció elektrofiziológiai mechanizmusai magatartási vetületben azokat a funkciókat jelentik, amelyeket a pszichológiai szemlélet motivációs folyamatokként tart számon. Abból a tényből, hogy az aktivációs rendszer egybeesik a belső miliő állapotát tükröző, illetve azt szabályozó homeosztatikus rendszerekkel, lehetővé válik a következtetés, hogy a neocortex információprocesszáló folyamatait nem aspecifikus, indifferens ébresztő hatás hozza működésbe, hanem egyúttal egy, a szervezet aktuális állapotát tükröző információ is.” Az idézet arra hívja fel a figyelmet, hogy az aktivációs rendszerek működése nem tekinthető a konkrét viselkedés tartalmától, jellegétől független működésnek. Az aktiváció, az éberség, a vigilancia fogalmak mint pszichológiai konstrukciók azonban éppen nemspecifikus jellegük hangsúlyozásán keresztül váltak a pszichológiában népszerűvé. A megismerési folyamatok pszichológiájában e kérdést általában el szokták hanyagolni, mégpedig abból a feltételezésből kiindulva, hogy a kísérletben a személyek az instrukciónak megfelelően, motiváltan és éberen vesznek részt, egy-egy kísérleti ülést pedig úgy szerveznek meg, hogy az éberség szintje az ülés folyamán állandó maradjon. Hogy azután ez valóban így van-e vagy sem, gyakran nem derül ki, mert a kísérletezők ezt sokkal ritkábban ellenőrzik, mint gondolnánk. A specifikus aktiválórendszer felfedezését megelőzően már a harmincas években (Duffy 1932) felvetődött, hogy a „viselkedés intenzitása” elhelyezhető egy olyan kontinuum mentén, mely a mély alvástól a felfokozott izgalom állapotáig terjed, s a hatékony teljesítmények a kontinuum bizonyos részéhez kötődnek. A kapcsolat jellege azonban még ennél is régebben ismert. Yerkes és Dodson (1908) egerekkel végzett diszkriminációs kísérletekben úgy találta, hogy az elektromos áramütés intenzitásának növelése a teljesítményt egy szintig növeli, viszont az áramütés intenzitásának további fokozásával a teljesítmény csökken. Felismerték, hogy az optimális érték függ a diszkrimináció nehézségétől: ha a feladat nehezebb, az optimum alacsonyabb, ha a feladat könnyebb, az optimum magasabb. Ha a sokk intenzitását aktiváló tényezőnek tekintjük, és az összefüggést általánosítjuk, a 17.11. ábrának megfelelő összefüggést, a Yerkes-Dodson-törvényt kapjuk.
357 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény 17.11. ábra. A Yerkes–Dodson-törvény. Az aktivációs szint függvényében az optimum egyszerű feladatok esetében magasabb, mint bonyolultabb feladatoknál A Yerkes-Dodson-törvénynek megfelelő kísérleti eredmények száma tekintélyes. Broadbent (1971) eredményei szerint például a zaj mint éberségi szintet növelő tényező könnyű feladatokban a teljesítményt növeli, bonyolultabb feladatokban viszont rontja. Az aktivációs magyarázat szerint az előbbi esetben a zaj az aktivációt az optimum felé nyomja, az utóbbi esetben viszont már túl nagy lesz az aktiváció, nagyobb, mint az optimum, azaz az összefüggés fordított U alakú. A fordított U alakú összefüggés tesztelésének van egy gyakorlati problémája. Mint arra Eysenck (1982) felhívta a figyelmet, ha egy vizsgálatban az aktivitási szintnek nem elég széles skáláját állítják be, a legkülönbözőbb eredmények „megfelelnek” majd a feltételezésnek. Előfordulhat, hogy az aktiváció valamennyi szintje az optimum alatt, esetleg éppen az optimumot átfogva, vagy éppenséggel azon túl volt, így az eredmények széles skáláját meg lehet magyarázni egy görbe vonalú összefüggéssel. További módszertani nehézség, hogy az aktivációs szintet nem könnyű jellemezni. Az első lehetőség: elfogadhatjuk, hogy vannak olyan tényezők, melyek kapcsolata szoros az aktivációval, és e tényezőnek a nagyobb értékei nagyobb aktivációval járnak (az összefüggés monoton). Két példa: a fehér zaj intenzitásának emelésével az aktiváció nő; magasabb szorongási érték esetében magasabb az aktiváció. Egy másik lehetőség, hogy az aktivitási szintet valamilyen fiziológiai változó (bőr elektromos vezetése, EEG stb.) segítségével jellemzik, és a teljesítményt e változó függvényében értékelik. Az első lehetőséget annak kapcsán mutatjuk be, hogy milyen magyarázatok születtek az összefüggés görbevonalúságára. Easterbrook (1959) vetette fel, hogy az éberségi szint és a teljesítmény viszonyát szelektív figyelmi tényezők alakítják ki. Minél magasabb az aktivitási szint, annál szűkebb a figyelmi fókusz. A hatékony teljesítéshez sem a túl szűk, sem a túl tág szelekciós mező nem előnyös. Ezt az összefüggést árnyalja a feladat nehézsége. Bonyolultabb feladatok esetében több mozzanatra kell tekintettel lenni, ezért itt előnyösebb az alacsonyabb aktivitás esetén jelentkező szélesebb figyelmi beállítódás. Egyszerű feladatok esetében viszont a koncentráltabb figyelem lehet előnyös. E magyarázatot kísérletesen úgy lehet ellenőrizni, hogy egyszerre két feladatot adnak, és valamiképpen befolyásolják az aktivitás szintjét. Ha az instrukcióban megadják a két feladat közötti fontossági sorrendet, akkor feltételezhető, hogy az aktivitási szint emelkedésével egy ponton túl a teljesítmény a kevésbé fontos (másodlagos) feladatban csökken, mivel a figyelmi folyamatok fokozatosan az elsődleges feladatra vonatkozó információra korlátozódnak. A kettős feladat módszerének más eredményei is megfelelnek azonban az Easterbrook-féle magyarázatnak. Ha az első feladatban a teljesítmény nő, a másodlagosban pedig változatlan marad, lehetséges, hogy a másodlagos feladatban választott teljesítménymutatók nem elég érzékenyek. Az is lehet viszont, hogy az aktivitás emelkedésével nő a rendelkezésre álló mentális kapacitás (Kahneman 1973), és az elsődleges feladatban ez okozza a teljesítmény növekedését. Ha a másodlagos feladatban a teljesítmény csökken, az elsődlegesben pedig nem változik, az elsődleges feladat érzékenysége kérdőjelezhető meg, és így tovább. Eysenck (1982) mintegy negyven olyan vizsgálat eredményét elemezte, amelyben a kettős feladat módszerét alkalmazták, és amelyben a közölt eredmények az aktivitási szint változásai szerint elemezhetőek voltak. Az eredmények többsége megfelelt a figyelmi feltételezésnek. Feltűnő volt azonban, hogy az aktivációra ható tényezők nem azonos hatással voltak a két feladat teljesítményének viszonyára. Amikor az aktivációs szint a büntetés (általában elektromos áramütés) nagysága miatt változott, az elsődleges feladatban sohasem nőtt a teljesítmény az aktivitás emelkedésével, a szorongási szint emelkedésével pedig egyetlen esetben találtak csak teljesítményjavulást az elsődleges feladatban (Kausler et al. 1959). A jutalom növelésével emelt aktiváció hatására viszont nőtt a teljesítmény az elsődleges feladatban, és az esetek tekintélyes részében ilyen hatással volt a zaj szintjének növelése is. Az eredményekből levonható egyik következtetés az lehet, hogy az „aktivitási szint” nem egységes jelenség, amennyiben az áramütés és a szorongás nem ugyanarra a rendszerre hat, mint a jutalmazás vagy akár a zaj szintje. E lehetőséget az aktivitást megalapozó idegrendszeri mechanizmusok elemzése messzemenően igazolja (pl. Claridge 1967, Robbins-Everitt 1995). Mint korábban utaltunk rá, az aktivitással együtt változó fiziológiai mutatók olyan független változóként szerepelhetnek, melyek alkalmasak lehetnek az aktivációs szint jellemzésére. Szintén az aktivitási szint mutatója az EEG-mintázat változása. E mutatók tárgyalására e helyütt nem térünk ki (lásd Czigler 2003a), csupán alkalmazásuk egy fontos szempontjára hívjuk fel a figyelmet. Ha az aktivitás emelkedik, általában fokozódik a szimpatikus idegrendszer tónusa. A vegetatív mutatók és a viselkedéses aktivitás kapcsolata azonban közel sem egyszerű. Lacey (1967) kísérletei mutattak rá arra, hogy egyrészt személyről személyre változik, mely mutatók érzékenyek az aktivitás változására, másrészt az egyes aktivitást fokozó helyzetek is különböznek abban, hogy milyen a vegetatív mutatók változása egymáshoz képest. Vannak olyan helyzetek, amikor egyes mutatók a szimpatikus tónus fokozódását jelzik, mások viszont ennek ellenkezőjét. Ezt a jelenséget irányszéttartásnak nevezik. Példaként Davis (1957) megfigyelését idézhetjük. Mikor férfiaknak aktfotókat mutattak, a pulzusszám csökkent, egyéb mutatók viszont a szimpatikus dominancia irányában változtak. Libby, Lacey és Lacey (idézi Kahneman 1973) 358 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény személyeinek az volt a feladatuk, hogy csoportosítsanak képeket annak alapján, hogy azokat érdekesnek, közepesen érdekesnek vagy érdektelennek találták. E kísérletben a szívritmus lassulása a pupilla tágulásával járt együtt, és az irányszéttartás mértéke annál nagyobb volt, minél érdekesebbnek ítélték a képeket. A szívritmus csökkenését kiváltó helyzetek között szerepel az előkészület állapota. Tipikus példája az ilyen helyzetnek, amikor a futó az „Elkészülni!” vezényszó után várja a rajtpisztoly hangját. Kísérleti modellként közismert az előrejelzéses reakcióidő-feladat. Ilyen helyzet a klasszikus averzív kondicionálás is (ezt részletesen az Altalános pszichológia [szerk. Csépe-Győri-Ragó] 2. kötete tárgyalja), amikor a feltételes inger után elkerülhetetlen büntetés következik. A várakozási helyzetekben a vázizommozgások mértéke általában kicsi. A váz- izommozgások csökkenése és a szívritmus csökkenése nincs ok-okozati kapcsolatban: Obrist és munkatársainak 1. adatai szerint a mozgások akkor is csökkennek, ha atropin hatásaként megakadályozzák a szívritmus csökkenését. A szívritmus csökkenése valószínűleg gátlási állapot megnyilvánulása. Egyéb olyan helyzetekben is leírták a szívritmus lassulását, ahol gátlási tényezők valószínűsíthetők. Ilyen a már bemutatott és válaszinterferenciával járó Stroop-helyzet. Elliot és munkatársai (1970) e helyzetben a szívritmus lassulását mérték. A lassulás tehát olyan helyzetek jellemzője, ahol az aktiváció időleges emelkedése a végrehajtó rendszer időleges gátlásával jár. Ugyanakkor fizikai vagy mentális erőfeszítéssel (problémamegoldás, verbális válasz előkészítése) járó helyzetekben a szívritmus a többi mutatóhoz hasonlóan a szimpatikus dominancia irányában változik (Cam- pos-Johnson 1966). A szívritmus változásainak alakulásából – általánosabb szinten – azt a következtetést vonhatjuk le, hogy az aktiváció inkább mintázat, azaz több, egymástól ok-okozati értelemben nem függő tényező összessége, nem pedig valamilyen egységes reakció. Az aktiváció napi ingadozása számos teljesítményben megmutatkozik. (Erről később más szempontból szó lesz még az Alvás és álom című fejezetben.) Itt röviden annyit említünk meg, hogy a teljesítmény közepes nehézségű feladatokban (számos vigilanciafeladat, kártyaszortírozási feladat) a reggeli óráktól kezdődően fokozatosan javul (Blake 1967, Kleitman 1973). A teljesítmény e változása kapcsolatot mutat a testhőmérséklet napi változásával, és a vegetatív idegrendszer és a hormonális rendszer több mutatója is hasonló változást mutat. Érdekes viszont, hogy az emlékezeti teljesítmények más napi ciklus szerint változnak. Folkard és munkatársai (1976) emlékezeti letapogatási kísérletben úgy találták, hogy a teljesítmény alacsony emlékezeti terhelés mellett a nap folyamán nő, magasabb terhelés mellett viszont csökken. Jobbak a reggeli értékek olyan feladatok esetében is, ahol az ingerek nagy gyakorisággal jelennek meg (Bonnet-Webb 1978). A teljesítmény napi változásai azonban jelentős egyéni eltéréseket mutatnak. A felnőtt népesség mintegy 45 százaléka kifejezetten előnyben részesíti a nap valamelyik szélső időszakát, azaz a korai vagy a késői napszakot (Horne-osterberg 1977), tehát reggeli (pacsirta-) vagy esti (bagoly-) típus, míg a többiek kevésbé érzékenyek a napszakos változásokra (bővebben lásd a 18. fejezet Napszakos aktivitásmintázatok, baglyok és pacsirtákcímű szövegdobozát). A „reggeli” és „esti” preferencia megmutatkozik a teljesítményben is, főleg az észlelési folyamatok hatékonyságában. Hor- ne és munkatársai (1980) minőségellenőrzést modellező vizsgálatukban például úgy találták, hogy a hibák felfedezése a napszakos preferencia szerint változik, a helytelenül hibásnak minősített esetek száma viszont nem mutatott hasonló napszakos eltérést. Az aktivitás legalapvetőbb napszakos változása természetesen az alvás-ébrenléti ciklus. Ennek változásai, valamint az aktiválórendszereket befolyásoló számos farmakológiai hatás (izgató- és nyugtatószerek hatásai) már kívül esnek e fejezet témakörén. Erről majd a következő, az alvásról és álomról szóló fejezetben lesz szó.
5.3. ÖSSZEFOGLALÁS 1. A figyelmi folyamatoknak lényeges szerepük van abban, hogy az egyes ingersajátságok a valóságnak megfelelően kapcsolódjanak össze tárgyakká. Ugyanakkor a figyelem egyes tárgyakra is irányulhat, és ekkor a tárgynak több tulajdonságát is kiemelten kezeli a figyelmi rendszer. 2. Az információfeldolgozás folyamatában a kiértékelésnek vannak olyan részfolyamatai, melyek az ingerlés egyszerűbb, és vannak olyanok, melyek az ingerlés összetettebb vonatkozásaival foglalkoznak. Ezek nem szükségszerűen szerveződnek egymást követő szakaszokba. A feldolgozás részeredményei is befolyásolhatják a reakciók szervezésének rendszerét. 3. Az információfeldolgozás kezdeti (főként érzékelési) folyamatai, valamint alapos gyakorlás után egyes összetettebb folyamatok nem igényelnek korlátozott kapacitású figyelmi működéseket. Ezek az automatikus folyamatok. Amikor egyszerre több eseménnyel foglalkozik a megismerőrendszer, a magas szintű teljesítményt automatikus folyamatok tehetik lehetővé. 359 Created by XMLmind XSL-FO Converter.
17. FEJEZET – Figyelem: információfeldolgozás, teljesítmény 4. Váratlan ingerek orientációs reakciót váltanak ki. Az orientáció kapcsán időlegesen nő az aktiváció általános szintje, és az orientációt kiváltó események észlelését serkentő folyamatok működnek. 5. A tudatosság és a figyelem viszonya összetett. Nem figyelt események befolyásolhatnak későbbi viselkedéseket, és rövid időre részleteikben is rögzülhetnek az emlékezet rendszerében. 6. Az éberség, aktiváció szintje meghatározza a viselkedés hatékonyságát. A teljesítménynek nem kedvez sem a túl alacsony, sem pedig a túl magas aktivációs szint. Az aktiváció optimuma egyszerűbb feladatoknál magasabb, mint bonyolultabbaknál.
5.4. KULCSFOGALMAK figyelmi blokk, figyelmi pislogás, folyamatos feldolgozási modell, habituáció, irányított keresési modell, kollatív változó, mentális erőfeszítés, preattentív folyamatok, sajátságintegrációs elmélet, szakaszelmélet, YerkesDodson-törvény
5.5. ELLENORZO KÉRDÉSEK 1. Hogyan függ a zavaró ingerek számától a sajátságkeresés, és hogyan a konjunkciós keresés? 2. Mi az illuzórikus konjunkció jelensége? 3. Hogyan érinti egy objektum különböző sajátságainak detekcióját a tárgyra irányuló figyelem? 4. Hogyan határozható meg a szakaszelmélet? 5. Mi a folyamatos feldolgozás elve? 6. Mi különbözteti meg az automatikus és figyelmi folyamatokat? 7. Hogyan vizsgálható, hogy megosztható-e két feladat között a figyelmi kapacitás? 8. Milyen összetevőkből áll az orientációs reakció? 9. Hogyan mutatható ki, hogy nem vesszük észre, hogy a megjelenő objektumok irányába szemmozgásokat végzünk? 10.
Milyen módszerekkel mutatható ki vizuális ingerek implicit emlékezeti reprezentációja?
11. Milyen pszichofiziológiai eredmények utalnak környezeti szabályszerűségek regisztrációjára a szenzoros emlékezetben? 12. Hogyan igazolható, hogy a vizuális pislogás időtartamában is megtörténik az ingerek jelentésének feldolgozása? 13.
Milyen magyarázatai vannak a vigilancia csökkenésének?
14.
Hogyan változik az optimális aktivitási szint a feladatok nehézségétől függően?
15.
Milyen érvek szólnak az aktiválórendszer egységessége ellen?
360 Created by XMLmind XSL-FO Converter.
23. fejezet - 18. FEJEZET – Alvás és álom Mivel írhatnánk le egy képzeletbeli kívülálló számára az alvás állapotát? A mozdulatlansággal? Az érzékszervi működések felfüggesztődésével? A pihenéssel és újjáépüléssel? Az álmokkal? Vajon mit értene meg ebből egy a mi viselkedésünket tanulmányozó földönkívüli? Megértené-e az éjszakánként mozdulatlanul pihenő, mégis álmatlan ember panaszait? Értené-e az álmodozás és az álmodás közötti különbségek mibenlétét? Mit gondolna azokról az anyákról, akik éjszakánként gyermekük legkisebb rezdülésére is azonnal megfelelő módon reagálnak? Mely kritériumoknak kell teljesülniük ahhoz, hogy alvásról, és ne ébrenlétről beszéljünk? Természetesen mi emberek mindannyian érezzük, hogy mi is az alvás, és miben különbözik az ébrenléttől. A szubjektív igazságok azonban nem mindig állják ki a gyakorlat próbáját. A Föld felszíne például – kisebb egyenetlenségektől eltekintve – határozottan laposnak tűnik, a tudományosan igazolt forma azonban lehetővé teszi a Föld körüli utazást is. Ehhez hasonló, persze kisebb horderejű példa az, amikor laboratóriumi körülmények között, műszerekkel is igazolhatóan az alvás állapotából ébresztett ember úgy érzi, hogy az ébresztés nem volt ébresztés, hiszen ő nem is aludt. Ha ezt a személyt a laboratóriumi körülmények helyett a volán mögött képzeljük el, a fenti, akadémikusnak tűnő okoskodás súlyos következményt hordozó gyakorlati színezetet is kap. Az alvás tudományos vizsgálatának modern korszakát 1953-tól számítják, amikor a gyakori szemmozgások jelenlétével és élénk álomtevékenységgel jellemezhető alvásállapotot elnevezték REM-alvásnak (az angol Rapid Eye Movements, azaz gyors szemmozgások kifejezés kezdőbetűi alapján), és elkülönítették a gyors szemmozgásoktól mentes és álomtevékenységben szegényesebb NREM- (non-REM-) alvásfázistól (AserinskyKleitman 1953, Rechtschaffen-Kales 1968). Az alvás élettani folyamatainak és lélektani jellemzőinek kutatási hagyományait ez a felismerés közös pszichofiziológiai keretbe helyezte, és egyben rámutatott arra, hogy a kétféle alvásállapot embernél hozzávetőlegesen 90 perces ciklusokban váltja egymást, az alvás tehát valamiképpen egy ritmikus folyamat. A modern alváskutatás eredményei sorra tárták fel az alvásciklusok jellegzetes két fázisa közötti különbségeket, valamint az ezek egymásutániságának élettani szabályozásáért felelős rendszer elemeit (18.1. ábra). A legfontosabbnak látszó különbségek egyértelműen az agyi elektromos tevékenység, az agyi anyagcsere és az agyi véráramlás tekintetében rajzolódnak ki. A NREM-alvásfázis lassú hullámú, hagyományosan inaktivitásnak tekinthető agyi elektromos tevékenységgel, csökkent anyagcserével és véráramlással, míg a REM-fázis ezek ellenkezőjével jellemezhető (Pace-Schott-Hobson 2002). Mindez megerősíti azokat a laboratóriumi ébresztéses kísérletekben szerzett tapasztalatokat, amelyek szerint a NREMalvásfázisból ébresztett kísérleti alanyok rövidebb, tartalmilag szegényebb, illetve emlékezés- és gondolatszerűbb élményekről számoltak be, mint a REM-fázisból ébresztettek. A REM-fázisból ébredők hosszú, tartalmi részletekben bővelkedő, hallucinációszerű szellemi tevékenységre utaló beszámolókat adtak. Mindehhez társul még az a különbség is, hogy a NREM-alvás alatti élmények legtöbbször ismétlődő jellegűek, a REM-alvásbeliek viszont nem ilyenek.
361 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
18.1. ábra. A NREM- és a REM-alvás, illetve a NREM-alvás különbözõ stádiumainak váltakozásai az idõ függvényében egy átlagosnak mondható éjszakai alvás során (a vízszintes tengelyen az alvással töltött órák vannak feltüntetve). A szövegdobozokban a tipikusnak mondható élettani változások irányára vonatkozó információ (↑– fokozódás, ↓ – csökkenés, → – nincs változás) az ébrenléthez viszonyítva értendõ A REM-hez köthető élményeket az jellemzi, hogy a régmúlt emlékeit a friss élményekkel kapcsolják össze, igen változatos formában (Hobson et al. 2000). Mindez arra engedte következtetni a kérdéssel foglalkozó kutatókat, hogy a REM-fázisok olyan, a mozdulatlanság leple alatt maradó testi-lelki aktivitással kísért periódusok, amelyeknek az alvás más részeihez képest kiemelt, az ébrenlét vonatkozásában pedig jelentős szerepük van. Bár ennek a megközelítésnek ma is igen sok híve van, egyre nyilvánvalóbb, hogy a két alvásfázis különbségeinek keresése sokáig háttérbe szorította azoknak az igen lényeges közös elemeknek a felismerését, amelyek az alvás mint viselkedésesen egységes állapot meghatározó sajátosságai.
1. Érzékelés és észlelés alvás alatt 1.1. Jelentőségspecifikus ingerfeldolgozás alvásban: képalkotó vizsgálatok A környezettel való kapcsolat, illetve a személy környezetére irányuló tudatosság mindkét alvásállapotban jelentősen háttérbe szorul, de nem szűnik meg teljes mértékben. Az alvás egyik legfontosabb tulajdonsága az ébreszthetőség. Ezt a hétköznapi megfigyelések mellett a kísérleti eredmények is bizonyítják, hiszen az alvó néven szólítása gyakrabban vezet ébredéshez, mint egy jelentőséget nélkülöző, de azonos erősségű hanggal való ingerlése. A jelentőségspecifikus agyi aktivitástöbblet a név elhangzása és a jelentőséget nélkülöző inger elhangzása közötti agyi aktivitásmintázatokban mutatkozó különbség kiszámításával lehetséges. Mindez az agy helyi oxigénfelhasználásában bekövetkező változások eltéréséből fMRI-vel (funkcionális mágneses rezonanciás képalkotó eljárás, bővebben lásd az Érzékelés, észlelés, környezet című fejezet szövegdobozában.) követhető nyomon. Ébrenlét állapotában a személy saját nevének elhangzásakor a halántéklebenyi agytekervény középső területén és az orbitofrontális kéregben mérhető oxigénfelhasználás lényegesen megnő a jelentőséget nélkülöző inger megjelenését kísérő agyi aktivitáshoz képest. Bár a NREM-alvásban az ébrenlétben tapasztaltakhoz képest gyökeres módosulások figyelhetők meg az agyi aktivitásmintázatokban a jelentőségteljes és a jelentőséget nélkülöző ingerek hatására is, a különbség, azaz a jelentőségspecifikusság hatása változatlan. Ez a specifikus hatás a középső halántéklebenyi és orbitofrontális területek sajátnév-indukált aktivációjában ölt testet (Portas et al. 2000). Egészen más változásokkal jellemezhető NREM-alvásban és ébrenlétben a személyes jelentést vagy sürgető jelzésértéket nélkülöző, ismétlődő ingereket kísérő agyi aktivitás. Alvásban ezek az ingerek az agykérgi oxigénfelhasználás csökkenését váltják ki. Ébrenlétben ugyanezen ingerek alkalmazása nyomán, a hallókéreg területén fokozódó oxigénfelhasználás tapasztalható (Czisch et al. 2004). A jelentés nélküli ingerek alkalmazása 362 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
nyomán tehát egyfajta oxigénfelhasználásban mért aktivitáscsökkenést figyeltek meg az alvó emberek agykérgében. Ugyanezeknek az ingereknek a hatására az agykéregben ébrenlét alatt helyi aktivitásfokozódás mutatkozik. Ezek a kísérletek egyértelműen bizonyítják, hogy a környezeti ingerek szelektív feldolgozása – legalábbis a hangingerek tekintetében – bizonyos formában és bizonyos mélységig az alvó agy jellegzetes működésmódja.
1.2. Az alvás alatti ingerfeldolgozás mélysége: kiváltott válaszok Az alvás egyik jól ismert és az élővilágban széles körben elterjedt jellemzője a szemhéjak lezárása, ami a környezetből eredő látási ingerek feldolgozásának erős gátja. Ehhez hozzávehetjük az ember és más nappal aktív fajok egyedeinek azon preferenciáját, hogy sötétben aludjanak. Ez szintén arra utal, hogy a látás és az alvás egymást kizáró dolgok. Az ember, aki környezetéből származó információinak jelentős hányadát látás útján szerzi, mégis életének egy jelentős részét alvással, tehát olyan állapotban tölti, amelyben ezt a képességét nem használ(hat)ja. Mindazonáltal a felvillanó fényingereket, különböző hangingereket, tapintási ingereket és fájdalmas ingereket alvás alatt is érzékeljük. A kiváltott válaszok technikájával (lásd az 1. fejezetben) szerzett általános tapasztalat, hogy mindezeknek az ingereknek a feldolgozása az elsődleges agykérgi érzékszervi mezők szintjén megtörténik. A kiváltott válaszok korai komponenseinek változása jól tükrözi, hogy az ingerfeldolgozás az ébrenléthez képest csak enyhén gátlódik. Nagyobb mértékű változás elsősorban ezt követően, azaz a másodlagos feldolgozástól kezdődően jelenik meg (Kakigi et al. 2003). Az akusztikus kiváltott válaszok tanulmányozása arra utal, hogy az alvó agy lassúbb és elnagyoltabb formában ugyan, de képes az automatikus ingerdetekcióra, sőt akár a megfelelő orientációs válasz mozgósítására is, amennyiben az inger fokozottan újszerű. A hanginger reprezentációjának kialakulására és annak a szenzoros memóriában való tárolására is van bizonyíték, jóllehet ezek a folyamatok jóval kisebb hatékonysággal valósulnak meg alvásban, mint ébrenlétben. Ezek alapján az is nyilvánvaló, hogy az akusztikus környezetben bekövetkező nagyobb változások tudat- vagy figyelemelőttes (preattentív) formában leképeződnek az alvó agy működésében, lehetővé téve az ébredés mechanizmusainak szükség szerinti mozgósítását (Atienza et al. 2001). Annak, hogy az agy a hallási környezetet alvás alatt is pásztázza, számos idegtudományi bizonyítéka van. Ennek az ébredés szempontjából lényeges elemi mechanizmusnak az előzményei állatkísérletekben is kimutathatók (Csépe et al. 1987). A hangingerek jelentőségének alvás alatti központi idegrendszeri képviseletét a korábban bemutatott funkcionális mágneses rezonancián alapuló bizonyítékok mellett a kiváltott válaszokkal szerzett tapasztalatok is alátámasztják. Az alvó személy saját neve nagyobb fokú központi idegrendszeri mozgósítást eredményez, mint más nevek, és ez a kiváltott válaszokkal is követhető. Azt is sikerült igazolni, hogy az alvó személyeknek akusztikusan adott, jelentésükben (szemantikusan) össze nem illő szavak is jellegzetes agyi választ eredményeznek. Ez azt jelenti, hogy az alvás alatti agyi aktivitásmintázat nem egyszerűen a saját név ismerős és érzelmi jelentőséggel bíró ingermintázatának köszönhető, hanem annak, hogy egy sekélyebb jelentésalapú feldolgozásra alvásban is sor kerülhet (Bastuji et al. 2002). NREM-alvásban az akusztikus ingerek hatására gyakran nagyfeszültségű EEG-hullámok generálódnak, amelyek többnyire a K-komplexusok vagy vertexmeredek tranziensek különböző formáit öltik, és szabad szemmel is jól megfigyelhetőek (18.2. ábra). A személy saját neve vagy a különös ingerek nagyobb valószínűséggel váltanak ki K-komplexusokat, mint a közömbös vagy szokványos ingerek. A kiváltott válaszok és a kiváltott K-komplexusok közötti összefüggések vizsgálatának fő tanulsága, hogy a K-komplexus egyfajta tudatelőttes információfeldolgozási folyamat jele, amelynek során a kiváltó inger és kontextusa függvényében mérlegelhetővé válik az alvás folytatása vagy annak megszakítása (Halász 1993) és (tegyük hozzá) utóbbi esetben értelemszerűen a megfelelő viselkedéses válasz mozgósítása.
363 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
18.2. ábra. Vertex- (fejtető-) meredek tranziens és K-komplexus EEG-képe emberi alvásban. A vertexmeredek tranziensek elsősorban az alvás kezdetén az 1-es vagy 2-es stádiumban figyelhetőek meg. A K-komplexusok preferált megjelenési helye a 2-es stádiumú alvás. Mindkét hullámforma spontán is megjelenhet, de ingerekkel is előhívható, egyszerre képezik az alvás alatti információfeldolgozás jelét és az alvás instabilitásának mutatóját
1.3. Az alvás mint válogatás A jelentőségteljes ingerek hatására bekövetkező szelektív ébredés és agyi aktiváció, valamint a fokozottan újszerű ingerek preferált feldolgozása arra utal, hogy az alvás egyfajta erőteljes válogatást jelent a jelentést hordozó és viszonylag kevés jelentéssel bíró ingerek között. Érzékelési szempontból ez azt jelenti, hogy az alvás az ébrenléttől abban különbözik, hogy alvásban csak a kiemelt jelentőséggel bíró ingereket dolgozzuk fel, illetve esetenként azokra reagálunk. Ennek lehetősége folyamatosan biztosított, hiszen az információfeldolgozás kezdeti stádiumáig mindig eljut az agyi feldolgozás (Bódizs-Csóka 2006).
23.1. táblázat AZ ALVÁS-EEG PSZICHOLÓGIAI ALKALMAZÁSA Hans Berger német pszichiáter felfedezésének és technikai újításának köszönhetően a fejbőrre helyezett felvevő elektródák segítségével vizsgálhatóvá vált az ember agyi elektromos tevékenysége (electroen<;cefalogram – EEG; lásd az Érzékelés, észlelés környezet című fejezetben). Az eredeti cél a lelki-szellemi folyamatok közvetlen mérése volt, hiszen maga Berger is pszichiáterként tevékenykedett. Az ezzel kapcsolatos kezdeti kudarcokat követő, napjainkban tapasztalható felélénkülés részben a számítógépes elemző eljárások elterjedésével magyarázható (Rajna 2006). Az egyik, pszichofiziológiailag jól megragadható és gyakorlati alkalmazással is kecsegtető kérdés az egyéni pszichológiai vagy viselkedésbeli különbségek EEG-vel történő mérése. Újabban ennek a kérdésfelvetésnek a nyomán az alvás-EEG-vel kapcsolatban is születtek figyelemre méltó eredmények. Ennek előzménye az a megállapítás, miszerint az alvás-EEG szinte ujjlenyomatszerűen stabil és egyénre specifikus mintázatú, vélhetőleg az egyéni központi idegrendszeri felépítés tükre (Finelli et al. 2001, De Gennaro et al. 2005). Egy vizsgálat szerint a parahippokampális agyi régiókból elvezetett, mély NREM-fázisokban mért 0-1,25 Hz-es elektromos tevékenység egyéni mértéke pozitívan korrelál a vizuális emlékezeti teljesítménnyel (Bódizs et al. 2002). Másrészt idős személyekben a homloklebenyi területek fölött NREM-alvásban mért 0,5-1 Hz-es EEG-tevékenységnek az egyéni mértéke együttjárást mutat egyes, a végrehajtó működést mérő mutatókkal (ilyen a szófolyékonyság [adott főnévhez hány értelmesen kapcsolódó igét tudunk adott idő alatt felsorolni], illetve a London-torony-teszt [hány lépésben tudunk egy adott korongsorrendhez eljutni a rendelkezésre álló oszlopokon elhelyezett korongokból kiindulva] megoldása). Ezekben a végrehajtó működést mérő funkciókban a megfelelő teljesítmény a homloklebenyek ép működése mellett lehetséges (Anderson-Horne 2003). Az elektrofiziológiai szakirodalomban a NREM-alvás alatti 1 Hz-nél lassúbb EEG-hullámokat lassú oszcillációnak nevezik (lásd az ábrát). Erről az oszcillációról kimutatták, hogy az agykéregben keletkezik, és tükrözi a szinaptikus jelátvitel hatékonyságát (Amzica-Steriade 1995). Egy másik NREM-al- vásra jellemző EEG-hullámról, az alvási orsóról (lásd az ábrát) kimutatták, hogy annak gyakorisága és intenzitása pozitívan korrelál az általános kognitív és tanulási képességekkel (Bódizs et al. 2005, Schabus et al. 2006). Az alvási orsók keletkezése szoros kapcsolatban áll a lassú oszcillációéval, és feltehetőleg szintén a kéreg, illetve a kéreg és a talamusz közötti szinaptikus átvitel hatékonyságát tükrözi. Feltételezik, hogy az alvási orsók az alvás ideje alatti emlékezeti konszolidációnak is pozitív mutatói. Ennek megfelelnek azok a vizsgálati eredmények, amelyek az éjszakai alvási orsók száma és az emlékezeti megőrzés hatékonysága közötti összefüggést támogatják (Clemens et al. 2005, 2006). Ezek az eredmények tulajdonképpen a normál populációra terjesztik ki azokat a klinikai neurológiai megfigyeléseken alapuló közleményeket, amelyek az alvási EEG hasonló mutatóiban találták rendkívül alacsonynak a mentális retardációban szenvedő gyerekeket és szellemi leépülésben lévő időseket (Shi- bagaki 2005, Petit et al. 2004). Kezdeti megfigyelések szerint az alvás alatt rögzített EEG a személyiség nem kognitív vonatkozásairól is nyújthat érdekes információt, bár e tekintetben még lényegesen kevesebb ismerettel rendelkezünk. Az az ébrenlét állapotában feltárt összefüggés, miszerint az alfa-hullámok féltekei aszimmetriája kapcsolatba hozható a negatív emocionalitásra való hajlammal, az alvás ideje alatti alfa-aktivitásra vonatkozóan is megállja a helyét (Schmidt et al. 2003). Ezek a megfigyelések arra utalnak, hogy az alvás-EEG egyéni ujjlenyomata differenciálpszichológiai jelentőséggel bíró információkat hordozhat.
364 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
Lassú oszcilláció és alvási orsó EEG-képei embernél. A lassú oszcilláció elsősorban, de nem kizárólag a 3-as és 4-es stádiumú alvásban jelenik meg. Jellemzője, hogy egy ciklusa tovább tart 1 másodpercnél (< 1 Hz-es frekvenciájú), továbbá hogy az agykéregben keletkezik, és a kérgi kapcsolatok révén válik az EEG-vel mérhető kiterjedt hullámtevékenységgé. Az alvási orsózás leggyakoribb megjelenési helye az alvás 2-es stádiuma. Egy ciklusa 1/15-1/12 másodpercig tart (12-15 Hz-es). Az orsó nevet a kezdetben növekvő, majd csökkenő amplitúdójú hullámcsomag formája miatt kapta. Az EEG-vel mérhető orsózás feltételezhetően tükrözi a kérgi, valamint a kéreg és a talamusz közötti kapcsolatok funkcionális hatékonyságát
1.4. Mikroébredések az alvásfolyamatban Egyes alvásra jellemző EEG-mintázatok (K-komplexusok, vertexmeredek tranziensek) alvás közbeni ingerléssel is előhívhatóak (Halász 1993). Az alvásra jellemző agyi elektromos tevékenységmintázatok némelyikének ingerléssel való kiválthatósága az alvásnak mint agyi állapotnak egy nehezen érthető tulajdonsága, amely az alvás alatti mikroébredések kérdését viták kereszttüzébe sodorta. A kérdés ellentmondásosságának eredetét ezeknek az alvásjelenségeknek a kétarcúságában kereshetjük. Egyrészt, az előzetes alvásmegvonással vagy gyógyszerekkel fokozható alvásmélység a K-komplexusok gyakoriságának és amplitúdójának növekedésével jár. Hasonló különbség figyelhető meg fiatal és idős személyek alvása között is: a mély alvás nagyobb arányával jellemezhető fiatal személyek alvásában több és nagyobb amplitúdójú K-komplexus figyelhető meg, mint a sekélyebb alvással jellemezhető idősek alvásában. Másrészt, ingerléssel is fokozható a K-komplexusok gyakorisága, ez pedig ellentmondani látszik az előbbi megfigyeléseknek. A K-komp- lexusokat mindezek miatt tekinthetjük az alvás jeleinek és az ébredés irányába történő elmozdulás jeleinek is. Fölmerül tehát néhány nyilvánvaló kérdés. Mit tükröznek a K-komplexusok? Mély alvást vagy (külső, illetve belső ingerek által) megzavart alvást? Ha valakinek az alvás-EEG-jében sok K-komplexust látunk, mondhatjuk-e, hogy mélyen aludt, vagy inkább fogadjuk el azt a feltételezést, hogy alvását valami megzavarta? Ebből a szempontból különösen fontos, hogy miként ítéljük meg a mikroébredéseket. Mikroébredésnek a viselkedéses ébredéshez nem vezető, néhány másodpercig tartó inkomplett ébredési reakciókat nevezzük. Az Amerikai Alvászavar-társaság például nem tekinti mikroéb- redésnek a K-komplexusokat. Ezzel szemben magyar és olasz kutatók egymástól függetlenül arra a következtetésre jutottak, hogy az ingerekkel mozgósítható alvásszerű jelenségek a mikroébredések kontinuumának olyan pontjait jelentik, amelyek közelebb vannak az alvás folytatásához, mint a valódi viselkedéses ébredéshez (Halász et al. 2004). Ebben a felfogásban a mikroébredések egyszerre mozgósítják az alvás fenntartásának idegélettani rendszerét és az ébredés mechanizmusait. Az alvásszerű összetevők megjelenése leginkább az erőteljes alváskésztetés periódusaiban valószínű. Ez azonban nem jelenti azt, hogy ne lennének egyidejűleg ébredési jelek is jelen a reakcióban (például szívritmus-fokozódás vagy más vegetatív jelek). A fázisos alvásszerű EEG-jelek gyakorisága tehát az alvás instabilitásának mutatója, amelynek gyakorlati jelentősége az álmatlanságban szenvedő személyek alvásminőségének felmérésében, valamint más, az alvással összefüggő idegrendszeri zavarok feltérképezésében van. A K-komplexusok az alvás alatti információfeldolgozás jelei is, hiszen magukban foglalják az akusztikus kiváltott válaszok több komponensét is. Ez azt jelenti, hogy az információfeldolgozás és az ébredés (arousal) ugyanannak az éremnek a két oldalán helyezkednek el. Az ébredés mindig attól függ, hogy mit eredményez az alvás alatti információfeldolgozás, az információfeldolgozást azonban az ébredés mértéke is meghatározza (Halász 1993).
2. Alvás és biológiai órák 2.1. Homokóra-mechanizmus az alvásszabályozásban
365 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
Az alvás számos biológiai időzítéssel kapcsolatos folyamat szabályozó hatása alatt áll (18.3. ábra). Az időzítést biológiai órák biztosítják. Ezek közül az egyik legismertebb egy olyan homokóra-mechanizmus, amely az alvás mélységét (a NREM-alvás ideje alatt mérhető 4 Hz-nél alacsonyabb frekvenciájú EEG-hullámok intenzitását) az előzetesen ébren töltött időhöz igazítja. Ezt a homokóra-mechanizmust a szakirodalomban az alvás homeosztatikus szabályozásaként tartják számon. Lényegét röviden így foglalhatnánk össze: minél többet vagyunk ébren, annál mélyebben fogunk ezt követően aludni, ez pedig az alacsony frekvenciájú EEG-aktivitáson kívül az ébredési küszöbben (mély alvás = nehéz ébreszthetőség) is kifejezésre jut (Dijk et al. 1987). Feltételezhető, hogy az alvás homeosztatikus szabályozása az ébrenlét alatti, használattól függő idegrendszeri folyamatokkal és azok kémiai sajátosságaival kapcsolatos (Krueger-Obál 2003). Erre utalnak azok az adatok, amelyek szerint egyes agyi régióknak az ébrenlét ideje alatti szelektív igénybevétele a megfelelő régió alvás alatti intenzívebb delta-EEG-aktivitását (1^ Hz) vonja maga után. Az a megfigyelés, miszerint ez a használattól függő helyi alvásmélység-fokozódás pozitív kapcsolatban áll az illető agyi terület alvást követő és pszichológiai kísérletek révén mérhető funkcionális hatékonyságával, az alvás helyreállító szerepét bizonyítja (Huber et al. 2004). Ébrenlét ideje alatt a legnagyobb igénybevételnek kitett agyi terület többnyire a homloklebenyeket foglalja magában, ezért az alvás kedvező hatása, illetve az alvásmegvonás negatív következményei többnyire a frontális funkciókkal kapcsolatos jelenségek. A frontális lebenyek a figyelem fenntartásának és összpontosításának, a zavaró ingerek által kiváltott hatások gátlásának, a viselkedés és a beszéd tervezésének, a munkamemóriának és a hajlékony, eredeti gondolkodásnak a letéteményesei. Ezek a funkciók mind jelentős és csak alvás által visszafordítható zavart szenvednek alvásmegvonás hatására (Horne 1993). A homokóra-mechanizmusnak a REM-alvásra is hatása van, hiszen a REM-fázisok ideje alatti gyors szemmozgások gyakorisága a teljes alvásepizód hosszúságával pozitívan korrelál, vagyis minél inkább kialudtuk magunkat, annál több szemmozgásunk lesz egységnyi REM-alvásidőre számítva (Aserinsky 1969). A szemmozgások gyakorisága az álmok élénkségének egyik legbiztosabb mutatója, valószínűleg ezért is fokozza az álmok felidézésének valószínűségét az alvásidő növelése (Schredl-Fulda 2005). Jóllehet a homeosztatikus alvásszabályozás – legalábbis szokványosnak mondható körülmények között – elsősorban a NREM-alvással összefüggésben megnyilvánuló jelenség, a homokóra-mechanizmus a REM-alvásra is hatással lehet. Ha a REMalvás kialakulását ébresztésekkel gátolják, a kimaradt REM-fázisok az ezt követő zavartalan alvás idején részben pótlódnak. Egyéjszakai vagy annál kevesebb alvás elmaradása esetén elsősorban a NREM-alvás mélysége fokozódik, a homokóra-mechanizmus tehát a mély NREM-alvás pótlását helyezi előtérbe. Minél hosszabb ideig marad el az alvás, annál nagyobb fokú és egyben sürgetőbb a kimaradt REM-fázisok pótlása, ez pedig az alvásmegvonás mértékével arányosan egyre inkább átveszi a vezető szerepet a homokóramechanizmusban. Tartós, többnapos alváskimaradást tehát igen magas REM-arányú alvás követ, ami arra utal, hogy a REM-alvás pótlása ezen a fokon előbbre való a NREM-alvásénál (Rechtschaffen et al. 1999).
2.2. Napszakos alváshajlandóság: a cirkadián ritmus Egy másik biológiai óra az alvást napszakos viszonylatban időzíti. Ez az időzítés az embernél és más nappal aktív fajok egyedeinél a sötét periódusra, azaz az éjszakára történik. Az alváshajlandóság éjszakai fokozódása és nappali csökkenése annak a napszakos, más szóval cirkadián ritmusnak az eredménye, amely számos belső elválasztású mirigy működését és neurotranszmitterek felszabadulását befolyásolja. Szelektív szerepe van a REM-alvás időzítésében is. Ennek köszönhető, hogy a REM-fázisok a reggeli órákban érik el maximális hoszszúságukat és megjelenési valószínűségüket. Ha időzónaváltás miatt saját, korábbi időviszonyokhoz alkalmazkodott cirkadián ritmusunk nappali szakaszában vagyunk kénytelenek aludni, a REM-fázisok, a szokásostól eltérően, az alvás kezdetén – a korábbi időzóna szerinti reggeli órákban – lesznek a leghosszabbak. A cirkadián ritmus nemcsak a REM-alvás hosszát, hanem az álmodást is befolyásolja. A reggeli és délelőtti órákban bekövetkező alvást hosszabb, képi elemekben gazdagabb, régmúlt események emlékeire való gyakoribb utalásokkal jellemezhető álmok kísérik, mint az esti órákban vagy az éjszaka kezdetén kialakuló álmokat. Fontos megjegyezni, hogy ezek az álmodással kapcsolatos cirkadián hatások a REM-fázisok hosszának kontrollja mellett, sőt valamelyest a NREM-fázisokban is megjelennek (Nielsen 2004). A cirkadián ritmust egy ritmusgeneráló (pacemaker) tartja fenn, ami a hipotalamusz látóideg-kereszteződés fölötti magjában található. Molekuláris mechanizmusát tekintve a cirkadián ritmus negatív visszacsatolások révén jön létre. Ezek lényege, hogy egyes génekben olyan fehérjék szintéziséhez szükséges információ van kódolva, amely fehérjék bizonyos szintet elérve leállítják saját termelésük folyamatát. E fehérjék termelésének és a termelés leállását követő lebomlásának ciklusa hozzávetőlegesen 24 óra (Richardson 2005). A cirkadián pacemaker, ellentétben a homokóra-mechanizmus által biztosított homeosztatikus alvásszabályozás hajlékonyságával, ellenálló a változással szemben. Ez azt eredményezi, hogy a napszaki ritmus fokozatosan, sokszor csak hetek alatt képes az időzóna-átlépés vagy tartós éjszakai műszak miatti új fényviszonyokhoz és társadalmi követelményekhez alkalmazkodni. A napszakos alvásmegoszláshoz köthető a kora délutáni álmosság 366 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
jelensége is. Ez az úgynevezett biológiai nappal középső részén elhelyezhető átmeneti alváshajlandóság-fokozódás vagy – amennyiben lehetőség nyílik rá – viszonylag folyamatos alvás. Fénymentes helyiségekben végzett kísérletek tanúsága szerint a külső időre vonatkozó támpontok hiányában a lassú EEG-hullámokkal jellemezhető mély alvásepizódok spontán megoszlása kétcsúcsú, azaz a kora délutáni és a késő éjszakai órák köré csoportosul (Hayashi et al. 2002). A jelenség minden valószínűség szerint belsőleg vezérelt, szintén a látó ideg-kereszteződés fölötti mag funkciójához kötött, és a szakirodalomban cirkaszemidián ritmusként ismert. A kora délutáni alvásban keletkező álmok erőteljesen függenek attól, hogy kialakul-e REM-fázis a kérdéses alvásepizódban. Valamennyi alvásstádiumból ébresztve kaptak mentális tevékenységre utaló beszámolókat, de REM-fázisban ezek szignifikánsan hosszabbak voltak más alvásfázisokból származó beszámolókhoz képest (Palagini et al. 2004).
2.3. Az alvásciklusok és az ultradián ritmus Az alvás NREM- és REM-fázisainak váltakozását egy ultradián ritmus vezérli, aminek periódusa fajspecifikus, embernél hozzávetőlegesen 90 perc. Felnőtt ember esetében a 90 perces alvásciklusok többnyire NREM-fázissal indulnak. Képi elemekben gazdag, élénk álomtevékenység viszont elsősorban, bár nem kizárólagosan, a REMfá- zisokhoz kapcsoltan jelenik meg. Minél több REM-alvásra jellemző élettani jegyet mutat egy állapot, annál inkább jellemzi az álomszerű élmények megjelenése (Nielsen 2000). Nyilvánvaló különbségei ellenére, élettani vonatkozásban az 1. stádiumú alvás hasonlít a REM-fázishoz, ami magyarázattal szolgálhat arra, hogy miért jelennek meg ebben az állapotban az úgynevezett hipnagóg hallucinációk (elalvás körüli látomások). Az álmodás formai sajátosságaiban megfigyelhető ultradián ritmus egy szinuszgörbéhez hasonló lefutású folyamat. Az álomszerűségben megfigyelhető csúcsok a REM-fázisokra lokalizálódnak, de az átmenetek sokkal inkább folyamatosak, mint lépcsőzetesek vagy ugrásszerűek (Nielsen 2004). A NREM- és a REM-alvás váltakozását agytörzsi neuroncsoportok kölcsönhatása idézi elő. Az idegélettani szabályozás része, hogy a REM-alvás idején megszűnik a szelektív figyelem, a tanulás és a viselkedésszabályozás jelenségeiben részt vevő egyes agytörzsi és hipotalamikus neuroncsoportok aktivitása. Ezek a neuroncsoportok ébrenlét ideje alatt és kisebb mértékben NREM-alvásban is aktívak, központi idegrendszeri hatásaikat monoaminok felszabadítása révén fejtik ki. A REM-alvás aktivált jellegét egy másik idegingerületeket átvivő anyag, az acetilkolin nagymértékű felszabadulása okozza. Az acetilkolin magas és a legtöbb monoamin alacsony szintje nagy valószínűséggel összefüggésben állhat az álmoknak több olyan formális sajátosságával, mint amilyenek a hallucinációs jelleg, a bizarrság, a tartalmi folytonosságban bekövetkező gyakori törések stb. Az álmodás formális jegyeit a REM-alvás neurokémiájával magyarázó elmélet az aktiváció-szintézis nevet viseli. Ez az elmélet az álmodás hajtóerejét az agytörzs acetilkolinnal közvetítő idegsejtjeinek az előagyra gyakorolt serkentő hatásával magyarázza. Ez az elmélet aktiváció része. Az álmok keletkezése ennek a kaotikus serkentésnek a monoaminok szabályozó hatását nélkülöző előagy általi szintézise (Hobson et al. 2000). Az éjszakai alvás idején NREM-REM váltakozást generáló ultradián ritmus egyes megfigyelések szerint napközben is tetten érhető, amennyiben a környezet egyhangú, illetve az álmosság előrehaladott fokú. A NREM-REM ciklus nappali megfelelőjének azonosítására Nathaniel Kleitman újszülöttek spontán táplálkozási ritmusát figyelte meg, a ciklust pedig alap nyugalom-aktivitás ciklusnak nevezte el. Az alap nyugalom-aktivitás ciklus jellegzetes mutatói felnőtt embereknél a nappali álmosság és alváshajlandóság, a képzeleti tevékenység, a kognitív teljesítmény, illetve az EEG-aktivitás mintázatának változása. Meg kell azonban jegyezni, hogy ezzel kapcsolatban számos egymásnak ellentmondó kutatási eredmény is napvilágot látott. Bár legerősebb empirikus bizonyítékokkal az alváshajlandóság 90 perces ingadozására vonatkozóan rendelkezünk, ezek is elsősorban előrehaladott álmosság állapotára, monoton körülmények közötti kifejeződésére vonatkoznak (Nielsen 2004).
2.4. A biológiai órák kölcsönhatása és az alvás Az egyes biológiai órák jellegzetes hatással vannak egymás működésére is. Korábban említettük, hogy a cirkadián ritmus a reggeli órákban maximalizálja a REM-alvás mennyiségét, s ez egyben a cirkadián és az ultradián ritmus kölcsönhatásának példája. Ezenkívül a homokóra-mechanizmus által előidézett alvásmélység-fokozódás enyhe alvásmegvonás körülményei között késleltetheti a REM-fázis megjelenését, vagyis a homeosztatikus alvásszabályozás és az ultradián ritmus is összefüggenek egymással. Többnapos alvásmegvonás viszont az ultradián ciklusok REM-fázisainak meghosszabbodását vonja maga után. A cirkaszemidián ritmus által kijelölt kora délutáni periódus alvással töltése tehát jelentősen tehermentesíti a homokóra-mechanizmust, csökkentve ezáltal az éjszakai alvásmélységet és alvásigényt.
23.2. táblázat -
367 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
NAPSZAKOS AKTIVITASMINTAZATOK, BAGLYOK ES PACSIR TÁK Az embert többé-kevésbé stabilan jellemzi cirkadián ritmusának fázisa, vagyis belső, napszakos biológiai órájának állása és a külsőleg, a Föld saját tengelye körüli forgása révén meghatározott idő közötti viszony. Egyesek biológiai órája – részben alkati-genetikai adottságukból kifolyólag – korábban jelez hajnalt és napestét, mint mások órája. Másfelől legalább ugyanannyi cirkadián pacemaker (ritmusgeneráló szerkezet) késik is, mint amennyi siet. Pacsirtáknak vagy reggeli típusoknak nevezik azokat az embereket, akik reggel vagy délelőtt éberebbek, mint délután vagy este, reggel korábban ébrednek, de este korábban is fekszenek le az átlagosnál. Ezzel szemben a baglyok vagy esti típusok este éberek, későn fekszenek le, és reggel későn is ébrednek föl, ha tehetik. Nem meglepő, hogy a baglyok és a pacsirták különböznek a cirkadián pacemaker által vezérelt élettani mutatók napszakos megoszlásában is. Így például a pacsirtáknál a testhőmérséklet napszakos ritmusai korábban érik el csúcsukat és mélypontjukat, mint a baglyoknál (Bailey-Heitkemper 2001). A legtöbb kognitív feladatban nyújtott teljesítmény napszakfüggősége is az elvártnak megfelelően alakul: a pacsirtáknál reggeli, a baglyoknál pedig esti teljesítménymaximumok figyelhetőek meg (Natale et al. 2003). Továbbá a baglyok sikeresebben alkalmazkodnak az éjszakai munkához, mint a pacsirták. Pszichológiai jellemzők tekintetében a baglyokat magasabb fokú impulzivitás és újdonságkeresés jellemzi, mint a pacsirtákat, akik viszont a kitartásban és a szabályszerű életvitelben jeleskednek (Caci et al. 2004, Caci et al. 2005, Monk et al. 2004). Egy brit felmérés szerint nem igazolható az a Benjamin Franklin által megfogalmazott bölcselet, amely szerint a korai fekvés és korai kelés egészségesebbé, gazdagabbá (lásd még a magyar „Ki korán kel, aranyat lel” közmondást) és bölcsebbé teszi az embert (Gale-Martyn 1998). Sőt az amerikai hadseregben végzett vizsgálatok szerint enyhe pozitív irányú összefüggés van az intelligencia és az esti típusba tartozás között, bár ennek megerősítése, illetve magyarázata egyelőre várat magára (Roberts-Kyllonen 1999). A napfénynek erőteljes hatása van a cirkadián ritmusokra. Érdekes megfigyelés, hogy ez a hatás már az anyaméhben is érvényesülni látszik (minden valószínűség szerint az anya szervezetében a napfény hatására bekövetkező változásokon [melatonin szintje]) keresztül. Legalábbis erre utal az a megfigyelés, miszerint a nyáron született gyerekek közül kevesebb lesz később pacsirta, ami különösen fiúgyerekek esetében érvényesül nagyobb valószínűséggel (Natale et al. 2002). Ez a nemi különbség egybecseng azzal, amit felnőttkorban a születéskori dátumtól függetlenül is megfigyelhetünk. Eszerint ugyanis a nők körében nagyjából kiegyenlített a bagoly-pacsirta arány, a férfiak között azonban kevesebb pacsirta van, mint amennyi bagoly (Natale-Danesi 2002). Ez kapcsolatban állhat a cirkadián pacemaker anatómiai alapjának nemi kétalakúságával. Ennek egyik alapvető vonása, hogy a nők látóideg-kereszteződés fölötti magja nagyobb térfogatú, mint a férfiaké. A nemi kétalakúság valamiképpen a nemi orientáció irányával is mutathat összefüggést, mivel homoszexuális férfiaknál a látóideg-kereszteződés fölötti mag nőies jegyeket mutat (Swaab-Hofman 1995), másrészt statisztikailag a napszakos aktivitásmintázatuk is nőiesen, pacsirta irányba tolódott a heteroszexuális referenciacsoporthoz képest (Hall-Kimura 1993). Az alkati adottságok mellett a napszakos aktivitáseloszlásra irányuló preferencia az életkortól is függ. A gyerekek cirkadián ritmusának fázisa a pacsirtától a bagoly irányba változik kb. húszéves korig. Ezt követően a tendencia megfordul, és újra a pacsirta irányba változik. Lányoknál korábban következik be a változás, és a szociológiai tényezők meglepően kevés befolyást gyakorolnak a folyamatra, ezért a változás irányának megfordulásáról feltételezik, hogy ez a serdülőkor végének (biológiai érés befejeződése) egyik jele (Roenneberg et al. 2004). A cirkadián ritmus fázisában mutatkozó egyéni eltérések részben genetikai meghatározottságúak (Vink et al. 2001). A terhesség ideje alatt az anyát érő fény feltételezhető hatásáról már szóltunk. A fény közvetlen hatása viszont azért fontos kérdés, mert az eddig ismert legnagyobb léptékű cirkadián fázisváltások, a természetes hatások közül, ezzel kapcsolatosak. A napfény vagy kisebb mértékben a kültéri szórt fény, vagy a fényterápia keretében alkalmazott erőteljes és a hagyományos beltéri világítást nagyban meghaladó fény (~ 5000 lux) reggel vagy délelőtt a cirkadián ritmus előbbre tolódását (pacsirta irányú elmozdulást) vonja maga után. Ennek ellenkezője figyelhető meg késő délutáni vagy esti fényhatás esetében. Fontos megjegyezni, hogy fiatal felnőttkorban a cirkadián ritmus késésre hajlamos, ezért a szegényes fényviszonyok ebben az életkorban bagolytípusú napszakos aktivitáspreferencia fokozatos előtérbe kerülését idézik elő. Időskorban ennek ellenkezője is előfordulhat.
368 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
3. Alvás, álmok, emlékezés Az alvás és az emlékezés összefüggésével kapcsolatos vizsgálódásokat több, egymástól független tényező is motiválja. Az egyik ilyen tényezőt a tanultak emlékezetben való megőrzésére vonatkozó megfigyelések jelentik. Ezek szerint a tanultak emlékezetben való megőrzése hatékonyabb az alvás ideje alatt, mint ébrenlétben (Jenkins-Dallenbach 1924). Az álmokban igen gyakran fellelhető emlékezeti utalások létezése, továbbá az álomtartalmak illanékonysága, gyors felejtése szintén az alvás és az emlékezés sajátos kapcsolatára világít rá (Niel- sen-Stenstrom, 2005).
3.1. Alvás és emlékezeti rögzülés Állatkísérletes eredmények bizonyítják, hogy a tapasztalatok hatására az agyi neuronok között kialakult szinaptikus kapcsolatok az érintett idegsejtek jellegzetes kisülésmintázatai formájában nyomot hagynak az agyműködésben. Ez a nyom az eredeti kiváltó esemény és annak kontextusa hiányában is fenntarthatja önmagát, mégpedig egy olyan jellegzetes kisülésmintázat ismétlődése által, amely ébrenlétben és alvásban is megfigyelhető (Ribeiro et al. 2004). Embereknél fMRI-vel sikerült kimutatni, hogy egy új tanulási próba során jelentkező agyi aktivitásmintázat a tanulást követően másfajta kognitív tevékenység végrehajtása közben is megismétlődik, elősegítve ezzel az agyi funkcionális kapcsolatok megszilárdulását és a korábban tanultak rögzülését (Peigneux et al. 2006). Az agyi kisülésmintázatok megismétlődése az alvásban is folytatódhat, sőt az ekkor észlelt reaktiváció mértéke egyben pozitív mutatója a későbbi, ébrenlétben mért emlékezeti teljesítménynek is (Peigneux et al. 2004). Ez azt jelenti, hogy az alvás az érzékszervi működésekkel ellentétben nemhogy nem gátolja az emlékezeti rögzülést (konszolidációt), hanem bizonyos tanulási feladatok esetében még fokozza is.
18.3. ábra. Alvás és biológiai órák. Különböző biológiai órák és összesített hatásaik az alváshajlandóságra. Az ultradián ritmus a NREM- és a REM-alvás váltakozása formájában vesz részt a szabályozásban. A napközbeni ultradián ritmicitást a vonatkozó adatok ellentmondásossága miatt csillapított formában adtuk az összképhez, ami a homeosztatikus, a cirkadián, a cirkaszemidián és az ultradián ritmusokat ábrázoló függvények összege
3.1.1. Alvás és explicit memóriarögzülés
369 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
Az alvás emlékezeti megőrzésre vagy rögzülésre gyakorolt hatásai függenek a tanulás és az alvás között eltelt időtől, az emlékezeti folyamat jellegétől (explicit versus implicit memória), valamint az alvás összetételétől. Az elalvás előtti 8-10 percben zajló események rögzülésének hatékonysági foka annál alacsonyabb, minél korábban következett be az alvás a tanuláshoz képest (Wyatt-Bootzin 1994). Ezen az időkereten túl az alvás emlékezeti megőrzésre gyakorolt hatása viszont már kedvező, de legalább semlegesnek mondható. Többé-kevésbé általános tapasztalat, hogy a tanultak felelevenítése hatékonyabb, ameny- nyiben a tanulás és a tesztelés között alvásra került sor (Stickgold 2005, Tucker et al. 2006). A konszolidáció esetleges alvásspecifikus fokozódásának, illetve az interferencia (az emlékezeti tartalmak egymást gyengítő hatása, egymással való ütközése) alvás alatti csökkenésének kísérleti elkülönítése több nehézségbe is ütközik. Az erre vonatkozó próbálkozások egyaránt szolgálnak bizonyítékkal az alvásspecifikus konszolidációt támogató elképzelésekre (Idzikowski 1984, Gais et al. 2006) és az interferenciaelméletekre (Wixted 2004, Ellenbogen et al. 2006) is. Az explicitmemória-feladatok közül az érzelmileg terhelt ingeranyag megjegyzése, illetve a téri tanulási (virtuális városban való tájékozódás elsajátítása) feladatokban mérhető teljesítmény mutatott erőteljesebb összefüggést az alvással. Wagner és munkatársai (2001) kimutatták, hogy az érzelmileg terhelt szövegek emlékezeti megőrzését a REM-alvásban gazdag alvásperiódusok hatékonyabban biztosítják, mint az ébrenlét. Ez az eredmény azért is kiemelt figyelmet érdemel, mert összhangban van azokkal az állatkísérleti bizonyítékokkal, amelyek mind a REM-alvás memóriakonszolidáció szempontjából kedvező hatására utalnak (Smith 1995). Az állatkísérletekben ugyanis értelemszerűen csak megfelelő motivációs alapú (jutalmazás/büntetés), tehát érzelmileg is jelentős tanulást lehet vizsgálni. A virtuális városban való tájékozódás elsajátítása ugyanakkor – más explicitmemória-feladatoktól eltérőenNREM-alvás hatására jelentkező teljesítményfokozódást mutat, ez pedig az aktív konszolidációra utaló eredmény (Peigneux et al. 2004).
3.1.2. Alvás és implicit memóriarögzülés Az implicit memória konszolidációs fázisában gyakorlás hiányában megjelenő rejtett teljesítményfokozódás összefügg az alvással. A vizuális textúradiszkrimináció, valamint a motoros és vizuomotoros készségek legkülönbözőbb formái órákkal a gyakorlás befejezését követően is hatékonyabbá válhatnak. Mindez elsősorban az ez idő alatt bekövetkezett alvásnak tulajdonítható (Stickgold 2005). A hangmintázatok (diszkriminációs) elsajátításának teljesítménye viszont az éber pihenés állapotában is fokozódhat, mégpedig az alvásban tapasztalttal egyenlő mértékben. Ez arra utal, hogy az implicit tanulási próbák esetében sem hagyható figyelmen kívül az alvás ideje alatt csökkenő interferencia hatása. Sajnos a legtöbb vizsgálat igen kevés figyelmet fordít erre a problémára (Gottselig et al. 2004). Az is lehetséges, hogy a hallási észlelésre támaszkodó tanulás különbözik ebből a szempontból a vizuálistól, illetve a motorostól. Kevésbé egyértelmű, hogy mely alvásszakaszok vesznek részt az alvás ideje alatti késleltetett teljesítményfokozódás folyamatában. A vizuális textúradiszkriminációnak a gyakorlást követő teljesítményfokozódásában a mély NREM-alvás, valamint ezt követően a REM-ben gazdag szakaszok is szerepet játszanak. A motoros tanulásban érzékelhető késleltetett teljesítményfokozódás elsősorban a 2-es stádiumú alvással mutat összefüggést, bár ettől eltérő eredmények is születtek. Több olyan tényezőt is ismerünk viszont, amely egyértelműen befolyásolja az implicit tanulásra jellemző alvásspecifikus teljesítményfokozódást. Az egyik ilyen a tanultak explicit kódolása. Például, ha a kísérleti személyekkel a tanulás előtt szóban közlik, hogy a megválaszolandó ingerek felvillanása egy meghatározott mintázat szerint fog történni, a személyek hajlamosak lesznek felfedezni és meg is jegyezni a mintázatot. Ebben az esetben a tanulási fázist követő rejtett teljesítményfokozódás kizárólag akkor jön létre, ha alvás követi a tanulást. A közlés hiányában a tanulást alvás és ébrenlét is követheti, mindkét esetben tapasztalható a teljesítményfokozódás (Robertson et al. 2004). Egy másik tényező a tanulást közvetlenül követő interferencia. Amennyiben a kísérleti személyeknek egymást követően két, azonos mozgáselemekből építkező, de eltérő mozgásszekvenciából álló készséget kell elsajátítaniuk, az alvásfüggő teljesítményfokozódás csak a kivitelezés gyorsaságában fog jelentkezni, pontosságában nem (Walker et al. 2003).
3.2. Álmok és emlékezés Az álmokban gyakran megjelennek az elmúlt napok eseményei, az álomtartalmakban ezekre vonatkozó nyílt utalások fedezhetők fel. Ezeket az utalásokat Freud (1900/ 1986) napi maradványoknak nevezte. A napi maradványok álombeli felbukkanása jellegzetes időbeli lefutást mutat: leggyakoribbak az elmúlt egy-két nap eseményeire, valamint az egy héttel az álom előtti eseményekre vonatkozó napi maradványok. Az egy héttel késleltetett napi maradványok gyakrabban vonatkoznak helyszínekre, személyek közötti (interperszonális)
370 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
érintkezésekre, pozitív érzelmekre és megoldott problémákra, mint az azonnaliak (Nielsen 2004). Ez azonban korántsem jelenti azt, hogy ennél régebbi emlékek ne bukkanhatnának föl az álmokban. Az önéletrajzi emlékezésben és az álmok emlékezeti utalásaiban egyaránt megfigyelhető a serdülő- és a fiatal felnőttkor (10-19 év) eseményeinek átlagon felüli gyakorisága (Grenier et al. 2005). Vagyis az álombeli és az ébrenlétbeli emlékezés azonos „nyersanyagból” építkezik. Fontos megjegyezni, hogy az ébrenlétbeli és álombeli emlékezés jellegében alapvetően eltér egymástól. Egyrészt az álom itt és most élménye nem tartalmazza az emlék múltbeliségének tudatát, másrészt maguk az emlékek is leggyakrabban kontextusukból kiragadva és egy új narratív struktúrában szerepeltetve jelennek meg az álomképekben. Tekintve, hogy az epizodikus emlékezés lényege az információk téri-idői kontextussal való tárolása és előhívása, az álombeli dekontextualizált önéletrajzi utalások az epizodikus memória és az álmodás funkcionális disszociációjaként foghatóak föl (Fosse et al. 2003). A poszttraumás stressz szindróma egyik tünete éppen az eredeti kontextussal együtt felidézett epizodikus emléknyom ismétlődő rémálom formájában történő átélése, ezért feltételezhető, hogy az álmodás és az epizodikus emlékezés normál üzemmódban elvárható funkcionális disszociációja zavart szenved ebben a kórképben (Stickgold 2002). Álmok vagy többé-kevésbé álomszerű élmények nemcsak REM-alvásban, hanem az alvás bármely szakaszában keletkezhetnek, természetesen különböző intenzitással és valószínűséggel. Kiemelt figyelmet érdemelnek az alvás kezdetén tapasztalt és kísérleti ébresztések hiányában feledésbe merülő álomélmények, amelyek intenzitásukban és érzékszervi élénkségük tekintetében vetekszenek a REM-alvás álmaival. Az epizodikus emlékezés az alváskezdeti álmodásban, az úgynevezett hipnagóg hallucinációkban sem vesz részt. Erre utal az a kísérleti eredmény, mely szerint az epizodikus memóriájukban súlyos károsodást szenvedő amnéziás páciensek hipnagóg hallucinációiban is megjelennek egy az elalvás előtt sokat gyakorolt számítógépes játék (Tetris) képi elemei akkor is, ha magára a játékra, tehát a képek eredetére a páciensek már egyáltalán nem emlékeznek (Stickgold et al. 2000). A fentiek alapján nyilvánvalónak tűnik, hogy az álomképek emlékezeti forrásai nem mindig fedik fel önmagukat egyértelműen. A pszichoanalitikus módszer ezért a szabad asszociáció technikáját találta hasznosnak a rejtettnek tekintett utalások felismerésében (Freud 1900/1986). Az álomtartalom elemeire adott szabad asszociációkat később kognitív pszichológiai olvasatban is az álmok emlékezeti forrásainak tekintették, igaz, egyben eltekintettek azok személyes jelentésétől, és inkább epizodikus és szemantikus emléknyomként csoportosították őket. Ennek eredménye, hogy a NREM-alvásban keletkezett szubjektív élmények sokkal gyakrabban hívtak elő szabad asszociációként epizodikus emléknyomokat, mint a REM-beli élmények, amelyekben a szemantikus asszociációk domináltak (Baylor-Cavallero 2001). Ez újabb megerősítése az álmodás (REM-beli szubjektív élmények) és az epizodikus memória különállásának. A szemantikus emlékezeti források között azonban igen gyakran találtak olyan elemeket, amelyek a személynek önmagára vonatkozó általános tudásával függenek öszsze. Ezt az általános tudást absztrakt énreferenciának nevezzük (pl. habosan szeretem a kávét). Mindebből következik, hogy a REM-beli álmodás valamiképpen a személy önmagára vonatkozó tudását integrálja olyan új és a napi maradványok formájában megjelenő emlékezeti benyomásokkal, amelyek módosíthatják ezt a tudást vagy annak érzelmi színezetét. Az álmok jelentése körüli, immár örökösnek tetsző akadémikus vita nem mindig veszi figyelembe azt a nem éppen elhanyagolható vonatkozást, miszerint minden emléknek vagy emlékezeti utalásnak személyes jelentésszínezete is van. Ezért az a kérdés, hogy van-e az álmoknak jelentése, nyilvánvalóan igennel válaszolható meg. Hogy ennek megfejtésében a pszichoanalízisre vagy másra kell-e hagyatkozni, az már nem dönthető el ilyen egyértelműen.
3.3. ÖSSZEFOGLALÁS 1. Érzékelési szempontból az alvás a környezeti ingerek rendkívüli módon szelektív feldolgozásának állapotait jelenti, amely állapotokban csak a kiemelt jelentőséggel bíró ingerek feldolgozása történik meg. 2. Az alvásállapotok két nagy csoportja fiziológiailag NREM- és REM-alvás formájában különül el, melyek időzítését és lefolyását egymással kölcsönhatásban álló biológiai órák sokasága vezérli. 3. Az alvás az emlékezeti rögzülés aktív fázisa, továbbá egyes emlékezeti folyamatok esetében alvásspecifikus konszolidációra utaló összetevők is fellelhetőek. 4. Az álmok az emlékezeti felidézés sajátos formái, amelyekben az epizodikus memóriafolyamatok háttérbe szorulnak, és a személyes tudásrendszer képi megjelenítése kerül előtérbe.
371 Created by XMLmind XSL-FO Converter.
18. FEJEZET – Alvás és álom
3.4. KULCSFOGALMAK cirkadián ritmus, homeosztatikus alvásszabályozás, napi maradványok, NREM-alvás, REM-alvás, ultradián ritmus
3.5. ELLENŐRZŐ KÉRDÉSEK 1. Milyen élettani mutatók különböztetik meg a NREM-alvást a REM-alvástól? 2. Milyen módszerekkel tanulmányozható az alvás ideje alatti érzékelés és észlelés? 3. Milyen élettani mutatói vannak az alvás homeosztatikus szabályozásának? 4. Hogyan függ az álmodás a cirkadián ritmusoktól? 5. Mik a hipnagóg hallucinációk, és melyek a legfontosabb jellemezőik? 6. Hogyan kapcsolódik az implicit memória az alvás kérdésköréhez? 7. Milyen összefüggés van az epizodikus memória, az álmodás és a poszttraumás stresszbetegség között?
3.6. AJÁNLOTT OLVASMÁNYOK Bódizs Róbert 2000. Alvás, álom, bioritmusok. Medicina, Budapest. Bódizs Róbert 2002. Az alvás és jelenségköre. In: Pléh Csaba – Gulyás Balázs – Kovács Gyula (szerk.): Kognitív idegtudomány. Osiris, Budapest, 601-618. Bódizs Róbert – Szendi Gábor 2005. Éberség, tudat, normális és megváltozott tudatállapotok. In: Kopp Mária – Berghammer Rita (szerk.): Orvosi pszichológia. Medicina, Budapest, 43-67. Hobson, J. A. 1988. The dreaming brain. Basic Books, New York. Novák Márta (szerk.) 2000. Alvás- és ébrenléti zavarok diagnosztikája és terápiája. Okker, Budapest. Szűcs Anna 2003. Narcolepsia (Ablak az alvásra). Akadémiai Kiadó, Budapest.
3.7. AJÁNLOTT HONLAPOK http://www.sleephomepages.org/ (Alvás-homepage-ek) http://www.sleephomepages.org/sleepsyllabus/ (Alvássillabusz) http://sommeil.univ-lyon1.fr/index_e.html – (Alvás, álmok és éberség) http://www.lboro.ac.uk/departments/hu/groups/sleep/ (Loughborough Alváskutató Központ) http://psych.ucsc.edu/dreams/ (Az álmok mennyiségének tanulmányozása) http://www.npi.ucla.edu/sleepresearch/ (Alváskutató Központ, The Siegel Lab.) http://www.unizh.ch/phar/sleep/ (Zürichi Egyetem Farmakológiai és Toxikológiai Intézetének Pszichofarmakológiai és Alváskutatási Szekciója)
372 Created by XMLmind XSL-FO Converter.
24. fejezet - Glosszárium ablakprobléma A mozgásirány érzékelésének problémája, mely arra utal, hogy egy apró ablakon, így például egyetlen receptív mezőn belül, nem egyértelmű a mozgásirányra vonatkozó információ. abszolút hallás Az a képesség, hogy egy lejátszott zenei hangot megnevezzünk, vagy bármilyen megnevezett hangot leénekeljünk. abszolút küszöb A legkisebb, még éppen érzékelhető ingererősség egy adott ingertartományon (pl. hangerősség) belül. Az érzékelési küszöbök valószínűségi jellegűek, az egy adott valószínűséggel (hagyományosan 50 százalék, azaz átlagosan négy esetből háromszor) még érzékelhető ingernagyságot nevezik abszolút küszöbnek. absztrakt énreferenciák A személy saját magáról szóló általános tudása, mely nem köthető közvetlenül egy konkrét eseményhez vagy történéshez, de szóban közölhető (deklarálható) tudás formájában rendelkezésre áll. A fogalom bevezetését az álomtartalmakra adott szabad asszociációk csoportosítási kísérlete eredményezte. acetilkolin Az agytörzsben és egyes előagyi idegsejtekben termelődő idegingerületátvivő anyag, amelynek többnyire az egész kéregre kiterjedő serkentő hatása van (felfedezése a kémiai ingerületátvitel első bizonyításához kapcsolódik – Otto Löwi). adaptáció A receptorok azon tulajdonsága, hogy tartós ingerlés esetén gyorsan lecsökken és megszűnik az aktivitásuk. adaptív eljárások Olyan küszöbmérési módszerek, melyekben egy bizonyos próbában adott inger erőssége a személy előző próbákban adott válaszainak függvénye. adatvezérelt (bottom-up) észlelés Lásdközvetlen észlelés. additív faktor Két vagy több tényező egyidejű változtatásának hatását elemezve abban az esetben, ha a két tényező hatása független, arra lehet következtetni, hogy ezek hatásukat más információfeldolgozási részfolyamatokra (szakaszokra) fejtik ki. Kölcsönhatásuk (interakciójuk) viszont arra utal, hogy azonos szakaszra hatnak. additív (összeadó) színkeverés A fizikai színkeverés egyik formája, melyben fényforrások kibocsátott fényét adjuk össze, például két vetítőből különböző színű fényeket vetítünk egy fehér vetítővászonra. adekvát inger Az az ingerfajta, amire egy receptor a legalacsonyabb küszöbértékkel reagál; egyes receptoroknak több adekvát ingerük is lehet, akkor polimodálisnak nevezik őket. affordancia A tárgyak észlelésének olyan eleme, amely a használati tulajdonságokat kapcsolja hozzá az észlelt jellemzőkhöz. A James Gibson által bevezetett, a közvetlen észlelést meghatározó affordancia a környezet fizikai információihoz kapcsolódó tárgyaffordanciából és a tárgyakhoz kapcsolható akciók lehetőségéből, az úgynevezett akcióaffordanciából áll. agykérgi mozgásvakság Az agykéreg sérülése révén jelentkező perceptuális zavar, melyben a sérült nem képes mozgást érzékelni a látómezőben. Az e zavarban szenvedő számára a világ állóképek lassan egymást követő sorozatából áll. agykérgi nagyítás A retinakép agykérgi reprezentációját a fovea túlreprezentációja, felnagyítása jellemzi. Ez annyit jelent, hogy relatíve több idegsejt dolgozza fel a foveából érkező információt, mint a retina perifériájáról érkezőt. akciós potenciál A nyugalmi potenciált meghaladó elektromos feszültségváltozás, mely az inger hatására a sejtmembránon kialakuló ionmozgás következménye. Az ingerlés hatására kialakuló akciós potenciál mint üzenet továbbítódik, tehát az axonokon vezetődik tovább. akkomodáció A szem alkalmazkodása a tárgytávolsághoz, éles retinális kép biztosítása érdekében. Az akkomodáció során a szemizmok a szemlencse domborulatának változtatásával szabályozzák a szem fókusztávolságát. akkord Különböző hangmagasságú hangok egyidejű megszólalása. akromatikus színek A szürke árnyalatai, a fehér és a fekete színek. 373 Created by XMLmind XSL-FO Converter.
Glosszárium
akromatopszia A színlátás agykérgi sérülésből eredő elvesztése. A V4 kéregterület sérülése okozza. aktiváció-szintézis hipotézis Az álmodás neurobiológiai koncepciója, mely szerint az álmok az agytörzs acetilkolinnal működő idegsejtjeinek aktivitásában gyökereznek, melyeket a monoaminerg szabályozást nélkülöző előagy szintetizál álomélménnyé. aktív intermodális térképezés Meltzoff és Moore elmélete, amely szerint a nyelvi tapasztalatszerzés során a beszédnek egy modalitások feletti, úgynevezett szupramodális képviselete, reprezentációja alakul ki. akusztikai-fonetikai varianciaprobléma Az a tény, hogy a beszédhangok akusztikai megvalósulása és a fonémák reprezentációja között nincs egy az egyben megfelelés. akusztikus reflex A középfül izmainak összehúzódása a hangrezgések tompítása céljából úgy, hogy a dobhártya megfeszül, és a hallócsontocskák mozgása korlátozódik. alaki tulajdonság (Gestaltqualitat) A sajátos egészek úgynevezett „részidegen” vagy részektől független, azok feletti és azoknál magasabb rendű tulajdonsága. alakkonstancia Lásd konstancia. alaphang A komplex hangokat alkotó szinuszhullámok közül a legalacsonyabb frekvenciával rendelkező. Alapfrekvenciának is nevezik. alapízek Öt olyan tiszta ízinger, amit mindenki egyformán érzékel: édes, sós, savanyú, keserű, umami. alap nyugalom-aktivitás ciklus Nathaniel Kleitman által kidolgozott koncepció, melynek lényege, hogy a NREM-REM alternáció egy ősi nyugalom-aktivitás ritmus maradványa, ez a ritmus pedig ma is tetten érhető egyes élettani és pszichológiai mutatók idősorában. alapszagok Olyan szagok, amelyeket mindenki egyformán érzékel; számuk 7-20 körül lehet, létük vitatott. alliesztézia Lásd érzékcsúszás. allodínia Nemnociceptoros ingerek fájdalmas észlelése. Ames-szoba Olyan eltorzított alakú és berendezésű szoba, mely egyetlen pontból, a falán fúrt lyukon keresztül torzítatlan, tégla alakú szobának látszik. amplitúdó Az akusztikus jel adott időpontban érvényes hangnyomása. A jel oszcillografikus képében a jel null vonaltól való pozitív és negatív irányú kitérése. Mértékegysége a decibel (dB). Lásd még intenzitás. amplitúdómetszet-ábrázolás Adott időpillanatban az akusztikus jelet alkotó összetevők frekvencia- és amplitúdóértékeinek megjelenítése. Más néven spektrális ábrázolás. anomaloszkóp A színtévesztés vizsgálatára szolgáló műszer, melyben a személynek piros és zöld fényekből kell egy sárga árnyalatot kikevernie. arányskála Olyan nagyságskála, melyben az egyes skálaelemek közti különbségek nagyság szerint összehasonlíthatók egymással, és a skálának van abszolút nulla pontja. A darabszámok, vagy hogy mennyi pénzünk van, arányskálával jellemezhetők. artefaktum Mérés, illetve kísérlet során módszertani hibából, átgondolatlanságból vagy figyelmetlenségből eredő olyan eredmény, mely félrevezető értelmezéshez is vezethet. artikuláció A beszédképző szervek folyamatos és automatikus mozgatása a beszéd előállításához. artikulációs csatorna A hangszalagoktól a szájnyílásig terjedő hangképző terület, amely a beszédhangok végső formáját hozza létre. A garat-, orr-, szájüreg, illetve az ezekben található egyéb szervek (fogak, nyelv, ajkak stb.) alkotják. audiovizuális aszimmetria A hallási és vizuális ingereknek az ingerdetekcióban, illetve a modalitásközi facilitációban tetten érhető feldolgozási eltérése. beigazítási módszer Küszöbmérési eljárás, melyben a személy maga állítja be a számára legkisebb, még érzékelhető ingert vagy a két inger közötti legkisebb, még érzékelhető különbséget.
374 Created by XMLmind XSL-FO Converter.
Glosszárium
beszédészlelés A beszédhangok és hangkapcsolatok azonosításának folyamata. beszédhang A beszéddel kapcsolatos akusztikai információ. beszédpercepció motoros elmélete Liberman és Mattingly elmélete, amely szerint a beszédpercepcióban érvényesülő integrációt a hangképző szervek működését kísérő akciók (gesztusok) észlelése biztosítja. beszédprodukció A beszédhangok létrehozásának folyamata. binaurális Két füllel való hallgatás. Vö. monaurális. binaurális felfedés Annak a képességnek a csökkenése, hogy a két füllel hallott elfedő zaj képes a csak egy füllel hallott másik hangot elfedni. binaurális idegsejtek Olyan kérgi idegsejtek, amelyek mindkét fülből kapnak bemenetet. Fontos szerepet játszanak a hanglokalizáció idegrendszeri megvalósításában. binokuláris diszparitás A két szem retinális képein az egyes tárgyak viszonylagos helyzetében jelentkező, a tárgyak és a szemlélő távolságától függő eltolódások, melyek a látvány két különböző pontból történő szemléléséből következnek. binokuláris (kétszemes) jelzőmozzanat A környezet tárgyainak térbeli elhelyezkedéséről szóló azon információ, melynek észleléséhez két szemmel való (binokuláris) látás szükséges. binokuláris látás Két szemmel való látás. binokuláris parallaxis A két szem retinális képeinek eltérése, ami a látvány két különböző pontból történő szemléléséből következik. biológiai mozgás érzékelése A mozgó élőlények formájának és összetett mozgásmintázatainak érzékelésére specializálódott képesség. bőr-Én Pszichoanalitikus fogalom a testhatárokkal és testfelülettel kapcsolatos énfunkció leírására. bőrérzékelés A bőrben lévő receptorok által keltett érzékelés (mechanikai, hő-, nociceptív). Broadbent-modell A figyelemi szelekció és egyben az információfeldolgozás úttörő elképzelése. Feltételezése szerint a korlátozott kapacitású rövid tartamú tárolás túlterhelését védi a szelekciót megvalósító szűrőműködés. Az eredeti modell számos későbbi kísérleti eredményt nem magyaráz, így a figyelem pszichológiájában számos alternatív modellt dolgoztak ki. camera obscura Sötét kamra, lyukkamera: olyan zárt doboz vagy szoba, melynek egyik falán fúrt kisméretű lyukon keresztül érkező fénysugarak a szemközti falon kirajzolják a környezet fordított (központosan tükrözött) képét. cirkadián ritmusok A szervezet hozzávetőleg 24 órás biológiai ritmusai, amelyek az alvás, illetve az ébrenlét átmeneti eltolódása esetén sem módosulnak azonnal. cirkaszemidián ritmus Az alvás, illetve az alváshajlandóság 12 órás ciklusokban fölerősödő tendenciája, ami kora délután és késő éjszaka csúcsosodik. CT Számítógépes tomográfia, azaz röntgenképek sorozatának rekonstrukciójára épülő képalkotó eljárás, illetve az ezzel alkotott szerkezeti kép. csapok Széles alapú, elkeskenyedő csúcsú (tölcsérre emlékeztető) fotoreceptorok a retinában. A látható fény széles hullámhosszára érzékenyek, a pontos hullámhossz a csap típusától függ. A csapok legnagyobb sűrűségben a sárgafolton található, a nappali látásra és a színlátásra specializálódott fotoreceptorok. csoportosítás A felismerést szolgáló olyan folyamat, amelynek során az azonosított sajátságok perceptuálisan összetartozóvá válnak, észlelési tárgyként elkülönülnek. dallam A zenei hangok szekvenciális szerveződése, amelyet egységes mintázatként észlelünk. dallamsüketség Dallamok felismerésének, egyszerű dalok visszaéneklésének, illetve dallamokban a hamis hangok detektálásának zavara, miközben egyéb észlelési feladatokban nincs probléma.
375 Created by XMLmind XSL-FO Converter.
Glosszárium
decibel (dB) A hang amplitúdójának mértékegysége. Olyan viszonyszám, amit minden esetben egy alapértékhez kell viszonyítanunk. delta-EEG-aktivitás A NREM-alvás egyik EEG-jegye, ami az 1-4 Hz-es frekvenciájú hullámokat foglalja magában, és az alvás mélységének, illetve az előzetesen ébren töltött időnek a mutatója. dermatoma Egy gerincvelői szegmentumhoz tartozó bőrterületek összessége, melyre a zsigeri fájdalom kivetülhet. deután zavar A színtévesztés egy formája, a deuteranomália és a deuteranópia összefoglaló neve. deuteranomália A színtévesztés egy formája, melynél a közepes hullámhossztartományra érzékeny csapok érzékenységi tartománya a látható fénytartomány hosszú hullámú vége felé tolódott el. deuteranópia A színtévesztés egy formája, melynél a közepes hullámhossztartományra érzékeny csapok érzékenységi tartománya egybeesik a hosszú hullámtartományra érzékeny csapokével, tehát működés szempontjából háromféle helyett csak kétféle csaposztály található a retinában. diatonikus Olyan hangskála, amely hét egész hangból áll. dichotikus hallgatási helyzet Olyan hallgatási helyzet, melyben a két fülbe különböző információk érkeznek. dichotikus hallgatási kísérlet A jobb és a bal fülbe eltérő verbális vagy nemverbális ingeranyagot adva, lehetőség van figyelmi folyamatok elemzésére. A feladat vagy az egyik fülbe érkező ingeranyag feldolgozását igényli (szelektív figyelmi vizsgálatok esetén), vagy (megosztott figyelmi vizsgálatok esetén) mindkét ingeranyagét. dinamikai tartomány Egy hallóidegsejt esetében az a hangerőtartomány, amelyre válaszolni képes. Lényegében a hangerőküszöb és a telítődési pont közötti tartomány. disszonancia Több egyidejűleg megszólaló hang kellemetlen hangzása. Vö. konszonancia. dorzális látópálya Az agykérgi fő látópályák egyike. A látás segítségével végrehajtott mozgásvezérlésben van fontos szerpe, ezért „akció”-rendszernek is hívják. döntési kritérium A szignáldetekciós elmélet egyik paramétere, mely azt határozza meg, hogy a személy (vagy mesteséges érzékelőrendszer, pl. radar) egy adott időpontban milyen erős ingertől kezdve dönt úgy, hogy jött jel, azaz az adott pillanatban érzékelt bemenet a figyelt jel és a háttérzaj együttesének eredménye (s nem csak a háttérzaj, a figyelt jel nélkül). duplexelmélet A hallási lokalizáció elmélete, amely szerint az interaurális időkülönbség segítségével az alacsony frekvenciájú hangokat, az interaurális hangerőkülönbség segítségével pedig a magas frekvenciájú hangokat lokalizáljuk. dúr A diatonikus hangrendszer máig legfontosabb hangsora, melynek uralma a klasszikus és a populáris zenében a moll hangsorral együtt szinte kizárólagos. Legfontosabb jellegzetessége a kezdőhangtól számított nagy terc. A dúr hangsor a C hangtól elindulva a zongora fehér billentyűin eljátszható. EEG Elektroencefalográfia, elektroencefalogram. Az agy spontán elektromos aktivitásának mérésére szolgáló eljárás, illetve az ezzel a módszerrel létrehozott regisztrátum. egyenlő hangosságú szintvonalak Hangintenzitásgörbék, amelyek különböző frekvenciájú hangoknál azonos hangosságérzetet keltenek. egyszerű reakcióidő Egyfajta inger megjelenésére adott válasz (általában gombnyomás formájában). EKG Elektrokardiográfia, elektrokardiogram. A szívizom működését kísérő elektromos aktivitás elvezetésére szolgáló eljárás, illetve az elektromos aktivitás regisztrátuma. EKP Eseményhez kötött agyi potenciál, azaz az ingerekhez, események által kiváltott, azokhoz időben szinkronizált bioelektromos jel. elektroencefalográfia Lásd EEG. elektrokardiográfia Lásd EKG. elektromágneses sugárzás Elektromosan töltött anyag rezgése (oszcillálása) által termelt energia. A fény az elektromágneses sugárzásnak csak egy szűk tartományát alkotja. elektromiográfia Lásd EMG. elkülönülés A felismerést szolgáló olyan differenciálási folyamat, amelyben az észlelés egymástól eltérő elemei azonosításra kerülnek.
376 Created by XMLmind XSL-FO Converter.
Glosszárium
ellenszínelmélet A színlátás azon elmélete, mely az ellenszínjelenségek magyarázatára jött létre. Az ellenszínelmélet az idegrendszerben két kromatikus csatornát tételez föl: a piros-zöld, illetve a kék-sárga csatornát, s ezek aktivitásának kombinálódása segítségével magyarázza a pszichológiai színkeverés jelenségeit. ellenszín-szerveződés A látható színek azon tulajdonsága, hogy bizonyos alapszínek egymással megfelelő arányban fizikailag keverve akromatikus színt (fehéret, szürkét) hoznak létre. Az opponens tiszta színek (piros és zöld; sárga és kék) pszichológiailag viszont nem keverednek egymással (nem láthatunk sárgáskéket vagy zöldespirosat). előfeszítő (prime-) inger Minden olyan inger, amely valamilyen ingert, eseményt megelőzve, annak feldolgozását befolyásolja, módosítja. elsőbbségi hatás Ha két rövid hang elég gyorsan követi egymást, és emiatt összeolvadnak egyetlen hanggá, akkor az összeolvadt hang lokalizációját az első hang iránya határozza meg, függetlenül attól, hogy a második hang milyen irányból jött. első vázlat David Marr fogalma a téri tulajdonságok reprezentációjának kialakulására. Az első vázlat a vizuális bemenet kétdimenziós tulajdonságainak reprezentációja, a második vázlat pedig az első vázlatból konstruált, már nem kétdimenziós, de még nem téri vázlat. Mindkét vázlat referenciája az észlelő maga. eltérési negativitás Az eseményhez kötött potenciálok egyik összetevője. Akkor jelenik meg, ha a beérkező inger megsért valamilyen, az akusztikus szenzoros emlékezetben tárolt szabályszerűséget. A hullám, melynek részösszetevői a hallókéregből és a frontális lebenyből erednek, az eltérés automatikus detekcióját jelzik, mivel megjelennek akkor is, ha a vizsgálat résztvevője nem figyel a kiváltó ingerekre. EMG Elektromiográfia, elektromiogram. Az izmok elektromos aktivitásának mérésére szolgáló eljárás, illetve az aktivitás regisztrátuma. Emmert-törvény Adott retinális méretű kép mellett a tárgy észlelt mérete arányos a tárgy (észlelt, feltételezett) távolságával. epikritikus Észlelési küszöb feletti inger. érzékcsúszás (alliesztézia) Az ízek hedonikus értékének, kellemességének megítélésében a belső állapottól függő, illetve tanulás által módosított eltolódás. érzékelés A környezet fizikai jeleinek átalakításától az aktivitásmintázatnak az agyig történő továbbítását és elsődleges feldolgozását jelölő kifejezés. érzékenység A szignáldetekciós elmélet egyik paramétere, mely azt határozza meg, hogy a személy (vagy mesteséges érzékelőrendszer, pl. radar) adott találati valószínűségéhez mekkora téves riasztási valószínűség tartozik – egy adott típusú inger figyelése esetén. érzékszerv Olyan, a környezet fizikai jeleinek felfogására kialakult szerv, amelyben a fizikai jeleket idegimpulzusokká átalakító felfogókészülékek, a receptorok találhatók. érzetfüggvény Olyan függvény, mely adott, egyetlen dimenzióval jellemezhető ingerkontinuum (pl. hőmérséklet) és a hozzá tartozó érzetek közötti leképezés. Az érzetfüggvényekkel kapcsolatban az a cél, hogy ingerek és érzetek viszonya matematikai összefüggés formájában legyen kifejezhető. érzőmező Lásd receptív mező. érzőminőség Egy modalitáson (pl. látás, bőrérzékelés) belül megkülönböztethető, jellegében eltérő érzékelésfajta. eseményhez kötött agyi potenciál Lásd EKP. észlelés Olyan, az elme működéséhez köthető pszichológiai folyamat, amelynek során az érzékleti mintázatokat a környezet ingereihez, eseményeihez rendeljük hozzá. észlelési többlet Az érzékelés és az észlelés közötti minőségi különbséget jelölő kifejezés. Lényege, hogy az érzékelés biológiai alapfolyamat, amelyhez képest az észlelés a tapasztalás, gyakorlás eredményeként több és minőségében is más. Ennek megragadására William James a diszkrimináció fogalmát használja. facilitáció Feldolgozási folyamatok serkentése. Lásd még modalitásközi facilitáció.
377 Created by XMLmind XSL-FO Converter.
Glosszárium
fájdalom aspektusai A fájdalomérzet három összetevője (szenzoros-diszkriminatív, affektív-motivációs, kognitív-értékelő). fájdalomélmény A fájdalompercepció szubjektív, emocionális jellegű, egyéni eleme. fájdalomküszöb Az a minimális inger, amely már ingerli a nociceptorokat, illetve fájdalomérzetet kelt. fájdalommátrix A fájdalom központi feldolgozásában részt vevő agyi struktúrák hálózata. fájdalomreakció A nociceptív ingerekre adott viselkedési reakció (elemei mozgás, mimika, zsigeri változások, verbalizáció). fájdalomtolerancia Az a maximális fájdalmi ingererősség, amit az egyén éppen el tud viselni. fázis Egy periodikus hullám fázisa a teljes periódusnak az a része, amely egy adott ponthoz képest a periódusból már eltelt. fázisszinkronizáció A hallóidegsejtek azon jellemzője, hogy kisüléseik egybeesnek a hanghullám bizonyos változásaival. Fechner-elv A Weber-Fechner-féle érzetfüggvényhez vezető egyik alapvető elgondolás, mely szerint amikor az inger egy LÉK-nyivel (legkisebb érzékelhető különbség) emelkedik, a hozzá tartozó érzet mindig egységnyivel emelkedik. Bár nagyobb ingerhez a Weber-elv szerint nagyobb LÉK-ek tartoznak, a Fechner-elv azt mondja ki, hogy a LÉK-ekhez tartozó érzetnövekmény ennek ellenére ugyanakkora marad. fejhez kötött átviteli függvény (FKAF) A hang spektrális tartalmának megváltozása a fülkagyló és a fej viszszaverődési és elnyelési hatásai következtében. felharmonikusok Egy periodikus hang olyan frekvenciakomponense, amely az alaphang egész számú többszöröse. felismerés Az érzékelési mintázat és a környezet tárgyainak megfeleltetése során az azonosítás és differenciálás folyamata. Működési feltételei az elkülönülés és a csoportosítás. felületi reflektancia A felületek szelektív fényvisszaverési képessége: a legtöbb felület a hullámhossztól függően különböző arányban veri vissza a beeső fényt. A fehér, szürke, illetve fekete felületek a hullámhossztól függetlenül azonos arányban verik vissza a beeső fényt. felületi visszaverődés Lásd felületi reflektancia. feromonok Más egyedek viselkedésének módosítása céljából kibocsátott szaganyagok. figyelemmegosztás Olyan követelmény, illetve ezek laboratóriumi modellje, melyben egyszerre több viselkedéshez tartozó környezeti mozzanatot kell tekintetbe venni. figyelmi blokk Hosszabb ideig tartó, figyelmi működést igénylő tevékenységek során a teljesítményben időleges csökkenések jelentkeznek. Gyakorlati jelentősége miatt a „figyelemtesztek” jelentős csoportja elemzi a teljesítmény e változását. figyelmi pislogás Figyelmi feldolgozást igénylő vizuális ingerek rövid időre ( ~ 400-500 ms) megakadályozzák a következő inger rögzítését az emlékezeti rendszerben. A jelenség vizsgálata rámutat a figyelmi folyamatok szerveződésének idői sajátságaira és a tartós emlékezeti reprezentáció kialakulásának feltételeire. fixáció A tekintet megállapodása egy adott tárgyon, vizuális ingeren. fizikai színkeverés Fények keverésének (additív színkeverés) és festékek, illetve szűrők keverésének (szubtraktív színkeverés) összefoglaló neve. FKAF Lásd fejhez kötött átviteli függvény. fMRI Mágneses tér hatására az élő szervezetet alkotó molekulák atommagjai által kibocsátott elektromágneses jelek mérésén alapuló eljárás, illetve az ennek alapján az agy működését szemléltető kép. fokális figyelem A figyelem koncentrált irányítása egy adott területre vagy objektumra. Ellentéte az a helyzet, amikor a figyelem eloszlik az egész vizuális mezőben, illetve a hallási térben. folyamatos feldolgozási modell A modell feltételezése szerint az információfeldolgozás részfolyamatai már e folyamatok befejeződése előtt befolyásolnak egyéb folyamatokat, köztük a válaszszervezés mechanizmusait. A szakaszelmélet alternatívája. 378 Created by XMLmind XSL-FO Converter.
Glosszárium
folytonosság illúziója Ha az egymást követő, de egymástól elkülönülő, gyors hangmagasság-változást mutató hangok közötti szüneteket zajjal töltjük ki, akkor a hangok észlelése megváltozik: egyetlen folytonos és hangmagasságában lassan változó hangot fogunk hallani, feltéve, hogy a zaj tartalmaz olyan frekvenciákat, amilyeneket a hang. fonéma Általános tulajdonságok alapján azonosnak észlelt beszédhangok mentális reprezentációja, a beszédnek azon legkisebb eleme, amely egy adott nyelvben jelentésmegkülönböztető szereppel rendelkezik. fonémadöntés A beszédhangoknak a megfelelő fonémákkal történő azonosítása. fonémarestaurációs hatás Ha egy szóból kitörlünk egy fonémát, és a helyét zajjal elfedjük, akkor ezt általában nem vesszük észre, és nem tudjuk megmondani, hogy melyik beszédhang hiányzott. formáns Csúcs a beszédhang spektrumában. Az artikulációs csatorna működése révén létrejövő felharmonikus, amely a beszédhang fontos akusztikai jellemzője. formánsátmenet A formánsok gyors változása, amelyet a beszédképző szervek egyik pozícióból a másikba való mozgása okoz. fotopigmentek A fotoreceptorokban található fényérzékeny molekulák, úgynevezett látófestékek. A fotopigmentek moleklái a fény hatására megváltoztatják alakjukat (izomerizálnak). A felszabaduló energia megváltoztatja a fotoreceptorok elektromos állapotát. fotoreceptorok A szem ideghártyájában (retina) található, fotopigmentet (fényérzékeny festék) tartalmazó, kétféle típusú (lásd csapok, pálcikák) idegvégződések. A fényelnyeléskor felszabaduló energia a receptorokban elektromos állapotváltozáshoz vezet. Fourier-elemzés A matematika azon ága, mely összetett függvények és jelek reprezentációját tanulmányozza egyszerű alaphullámokra való lebontás révén. Az elmúlt két évszázad során rengeteg alkalmazásra talált a jelfeldolgozás, a kvantummechanika és az idegtudomány terén. fovea A retina közepén található sárgafolt középső elvékonyodó, emiatt gödörszerűen bemélyedő része. Itt a legélesebb a látás. frekvencia Az időegység alatti rezgések száma. Mértékegysége a hertz (Hz). frekvenciaelmélet A hangmagasság feldolgozásának az az elmélete, amely szerint az alaphártya egységesen rezeg a hangra adott válaszként, a hangnyomásváltozásokkal szinkronban. frekvenciahangolási görbe Egy hallóidegsejt különböző hangfrekvenciákra mutatott érzékenységét ábrázoló görbe. frekvenciakomponens A komplex hangokat alkotó szinuszhullámok egyike. Frekvencia-összetevőnek is nevezzük. frontális sík A hallási tér azon síkja, amely a két fül hallójáratán és a fejtetőn halad keresztül, és a hanglokalizáció fent-lent dimenzióját határozza meg. galvanikus bőrreakció Lásd GBR. gazdagodás Olyan minőségi változás, amelynek során a környezet ingereinek, eseményeinek ismétlődő, változatlan, úgynevezett invariáns tulajdonságait kivonjuk. A kifejezést az észlelés pszichológiájába James Gibson vezette be. GBR Galvanikus bőrreakció, a bőr elektromos vezetőképességének galvanométerrel mért változása. geon Geometrikus ikon rövidítése. A komponensalapú tárgyfelismerés-modellek alapegysége. Gestalt Lásd alaki tulajdonság. Gestalt-elmélet Az első olyan pszichofizikai modell, mely a látott kép tárgyakká szerveződését írja le. gyorsított ingerdetekciós feladat Olyan kísérleti elrendezés, amelyben gyorsan megjelenő ingereket kell detektálni. Az ilyen feladatban lehet a jelzőingerek tulajdonságjellemzőinek a reakcióidőt módosító hatását vizsgálni. Lásd még Posner-feladat. 379 Created by XMLmind XSL-FO Converter.
Glosszárium
gyors vizuális szeriális ingeradás Rövid ideig (~ 100 ms) szünet nélkül bemutatott képek sorozata. Alkalmazásával lehetőség van olyan emlékezeti reprezentációk vizsgálatára, melyek nem tudatosulnak, de hatással vannak a későbbi információfelvételre, és rámutatnak számos figyelmi folyamat idői szerveződésére. gyűjtősejtek A retina olyan speciális idegsejtjei, amelyek a fotoreceptorokból származó információt dolgozzák fel. habituáció A monoton ingerek tudatosodásának aktív gátlása, a központi idegrendszerben zajló folyamat, amely az ingerek felvételét nem zavarja. Ingerek ismételt megjelenésekor csökkennek az ingerekkel kiváltott aktivációs folyamatok. A habituáció elemi tanulási folyamat, melynek alapját gátlási mechanizmusok alkotják. Kifejezett habituációs folyamatok mutatkoznak a vegetatív idegrendszeri hatásokban, így a bőr elektromos aktivitásában és a szívritmusban, de megmutatkoznak habituációs változások az agyi elektromos tevékenységben is. hallási események Akusztikus történések az akusztikai környezetben, lényegében az egyes tárgyak által kibocsátott hangok. hallási lánc A hallási események mentális reprezentációja. hallási színtérelemzés Az egy időben hallható, több forrásból származó hangok szétválasztása és különálló hallási láncokra bontása. hallási szűrők Olyan sávszűrők, amelyek feltételezhetően a periferiális hallórendszerben működnek. A szűrők jellegzetességeit az elfedési kísérletekkel lehet vizsgálni. hallhatósági függvény A hallásnál a küszöbintenzitás ábrázolása a teszthang frekvenciájának függvényében. hangerő-burkológörbe A hangerő változását követő görbe, amely az egyes időpontokban maximális amplitúdóértékeket köti össze. hangköz Két hang egymástól való hangmagasságbeli távolsága, amely a zenében meghatározott arányokat takar. hanglokalizáció A hallási tárgyak helyzetének és irányának meghatározása. hangossági szint Egy hang hangossági szintje, melyet phonban mérünk, az a hangerőszint, amely egy 1 kHz-es hanggal azonos hangosságúnak hallható. hangszín A hangok azon minősége, amely alapján az azonos hangossággal, hangmagassággal és hosszúsággal rendelkező komplex hangok megkülönböztethetők egymástól. Egyszerűbben: a hangszín a hang minőségére vonatkozik. hangtér Az egy oktávon belüli tizenkét lehetséges hang hierarchikus szerveződése. haptikus érzékelés A tárgyakról az érzékelő felület (ujjaink vagy ajkunk) mozgatása révén kialakított térbeli információ; vonatkozhat a tárgy alakjára, nagyságára, illetve felületének mintázatára is. harmonikussági alapelv A spektrális csoportosítás azon elve, mely szerint a hallórendszer hajlamos azokat a harmonikusokat csoportosítani, amelyek feltételezhetően egy alaphanghoz tartoznak. hasadási határ Az a határ, ami alatt nem lehet az egymást követő hangokat külön áramlatban hallani. hasbeszélőhatás A modalitások kölcsönhatására létrejövő illúzió, amelynek lényege, hogy térben egymástól távol lévő akusztikus és vizuális ingereket közös ingerforráshoz rendelünk. határok módszere Fechner által kidolgozott küszöbmérési eljárás, melyben csökkenő, illetve növekvő ingersorozatok alapján becslik a személy érzékelési küszöbeit. helyelmélet A hangmagasság feldolgozásának az az elmélete, amely szerint az alaphártya különböző részei különböző hangfrekvenciákra reagálnak. helykonstancia Lásd konstancia. hiányzó alaphang jelensége Egy sor összetett harmonikus frekvencia esetén az alapfrekvenciát akkor is halljuk, ha azt fizikailag eltávolították. hiperalgézia Enyhe nociceptív ingerek erős fájdalomként való érzékelése.
380 Created by XMLmind XSL-FO Converter.
Glosszárium
hiperszenzitivitás Perifériás vagy centrális nociceptív neuronok fokozott érzékenysége és aktivációja. hipnagóg hallucinációk Az elalvás környékén megtapasztalt látomások, melyek általában felejtés áldozatául esnek. Hold-illúzió A szemlélők többsége számára a horizont közelében az észlelhető mérettel rendelkező égitestek – a Hold és a Nap – nagyobbnak és közelibbnek látszanak, mint a zeniten. A jelenségre nincs kielégítő, konzisztens magyarázat. homeosztatikus alvásszabályozás Az alvás azon tulajdonsága, mely az alvás mélységét és egyéb jellemzőit az előzetesen ébren töltött időhöz, illetve az azalatt végrehajtott agyi tevékenység intenzitásához igazítja. homogenitás A színegyezés azon tulajdonsága, hogy két fizikailag különböző, de színben egyező (metamerikus) fény intenzitásbeli többszörösei is színben egyezőek lesznek. horizontális sík A hallási tér azon síkja, amely a két fül hallójáratán és a szemeken halad keresztül, és a hanglokalizáció elöl-hátul dimenzióját határozza meg. horopter A látótérnek a fixált pontra illeszkedő képzeletbeli felülete, melynek pontjai a két szemből azonos szög alatt látszanak, és a két retina egymásnak megfelelő pontjaira vetülnek. A horopteren – és vékony környezetében – lévő tárgyat sztereofúzió eredményeként egyetlen tárgyként észleljük, míg a horoptertől távoliakat megkettőzve látjuk. hozzáférhetőség Az ingerek, események értelmezhetősége az észlelés során aszerint változik, hogy az egyes ingerminőségeknek milyen az előfordulási valószínűsége. A kifejezés Jerome Brunertől származik. hozzátartozóság (kizáró allokáció) Csoportosítási elv, mely szerint egy hangot, illetve frekvenciakomponenst egyszerre csak egy tárgyhoz, vagyis hangforráshoz lehet hozzárendelni. Ha egy hangot egyszer már felhasználtunk egy adott hallási lánc csoportosítására, akkor azt több lánchoz nem rendelhetjük hozzá. hullámhossz Annak az útnak a hossza, amelyet a sugárzás egyes hullámok (rezgések) között, azaz egyik csúcstól a másikig megtesz. Elektromágneses sugárzásnál (ilyen a fény) a hullámhosszt a kibocsátó anyag oszcillálásának üteme határozza meg. A fény hullámhosszát nanométerben mérjük. A szín észlelése a fény különböző hullámhosszaival kapcsolatos. hullámhossz-érzékenység A retina fényérzékeny receptorainak, a csapoknak, illetve a pálcikáknak a működését jellemző érték. Azt fejezi ki, hogy egy adott fényhullámhosszal rendelkező fotont mekkora valószínűséggel nyel el az adott receptor. idői koherenciahatár Az a határ, ami felett a hangokat már nem lehet egy hallási áramlatba szerveződőnek hallani. IHK Lásd interaurális (fülek közötti) hangerőkülönbség. IIK Lásd interaurális (fülek közötti) időkülönbség. illúzió Észlelési tévedés, melyben az észlelet nem fedi a valóságot. illuzórikus konjunkció A téri fokális figyelem hiányában egyes ingersajátságok nem a valóságnak megfelelően szerveződnek objektumokká (felcserélődhetnek az egyes objektumok színei, formái). A jelenséget a téri figyelem formaészlelésben betöltött szerepének illusztrációjára használják. illuzórikus szótag Lásd magánhangzószekvencia-illúzió. illuzórikus (szubjektív) kontúr Olyan körvonal, kontúr, melynek alapjául nem szolgál semmifajta fizikai paraméterbeli kontraszt. indukciós szín A szimultán kontrasztjelenségek esetén egy adott célfelület színárnyalata, amelynek változását észleljük különböző háttérszínek hatására. Hagyományosan szürkét használnak indukciós színnek, ám újabb megfigyelések szerint kromatikus indukciós színekkel erősebb kontraszthatás érhető el, mint akromatikusakkal. inferior temporális kéreg (IT) A halántéklebeny alulsó mediális részén található, unimodálisan vizuális kéreg, mely a ventrális rendszer utolsó vizuális állomása. ingerhatás-hipotézis A perceptuális elhárítás hatásmechanizmusa, amelynek lényege, hogy a tudatos észlelés elmaradásának oka nem az érzékelő-, hanem a válaszrendszerhez köthető. ingerület Neurális impulzusok sorozata intenzitás A hangterjedés irányára merőleges egységnyi felületen időegység alatt átáramlott energiamennyiség.
381 Created by XMLmind XSL-FO Converter.
Glosszárium
Mértékegysége a watt/négyzetméter (W/m2). Lásd még amplitúdó. interaurális (fülek közötti) hangerőkülönbség (IHK) A két fülbe érkező hang intenzitásának különbsége, a hanglokalizáció egyik támpontja. interaurális (fülek közötti) időkülönbség (IIK) A hanghullámok két fülbe érkezése közötti időkülönbség, a hanglokalizáció egyik támpontja. intervallumskála Olyan nagyságskála, melyben az egyes skálaelemek közti különbségek nagyság szerint összehasonlíthatók egymással, de a skálának nincs abszolút nulla pontja. Példa a naptári dátumok. Két dátum közt eltelt időmennyiség összevethető két másik dátum között eltelt idővel, de az egyes időpontok arányáról nincs értelme beszélni). introspekció Önmegfigyelés. A korai pszichológia elfogadott módszere a saját benyomások, élmények alapján történő ismeretrendszerezésben. irányított keresési modell Feltételezi, hogy több elemet tartalmazó ingermezőben a viselkedés szempontjából lényeges objektum detekciója két folyamat kölcsönhatásának eredményeként jön létre. Az egyiket az inger fizikai sajátságai határozzák meg (alulról felfelé irányuló folyamatok), a másikat pedig a feladat releváns ingereinek (célingerek) sajátságai (felülről lefelé irányuló folyamatok). Az egyes elemekre irányuló téri figyelmi folyamatok során a keresési sorrendet a két tényező együttes hatása szabja meg. irányszelektív idegsejtek A mozgásirányra szelektív módon válaszoló idegsejtek. irányszéttartás Az aktivitás változásakor az egyes vegetatív idegrendszeri mutatók attól függően változnak, hogy az aktivitás változása milyen okból következik be. Várakozási helyzetben például a szívműködés lassul, a bőr elektromos vezetése viszont nő, azaz van olyan vegetatív változás, mely a szimpatikus hatás csökkenését, más mutató viszont a növekedését mutatja. Más esetben viszont a változás azonos irányú. irányulásszelektív Az elsődleges látókéreg idegsejtjeinek vonalirányulásra való érzékenysége. Egyes idegsejtek csak egy-egy vonalirányra fognak tüzelési frekvenciájuk megváltoztatásával válaszolni. IT Lásd inferior temporális kéreg. ízaverzió Kellemetlen belső állapothoz korábban társított ízek elkerülése. ízérzés A szájba kerülő vízoldékony anyagok által keltett érzet. ízkerülés Lásd ízaverzió. ízlelőbimbók Az ízérzékelés szervei, bennük találhatók az ízreceptorok. ízpreferencia Egyes ízek előnyben részesítése a táplálkozás során. járulékos kisülések elmélete Az az elképzelés, miszerint a mozgásérzékelésben annak is szerepe van, hogy a saját mozgásainkat – a mozgásparancsra vonatkozó járulékos kisülések formájában – érzékeljük. jellemző frekvencia Az a hangfrekvencia-érték, amelynél egy adott idegsejt hangerőküszöbe a legalacsonyabb, vagyis az a frekvencia, amelyre az idegsejt a legérzékenyebb. Julesz-féle véletlen-pont- (random-dot) sztereopár Kizárólag binokuláris diszparitásinformációt hordozó, véletlen mintázatú sztereopár. kapuelmélet A nociceptív ingerek gerincvelői feldolgozásának és továbbításának mechanizmusára vonatkozó elmélet (Melzack és Wall). kategoriális észlelés Olyan észlelés, amely esetében azokat az ingereket, amelyek külön kategóriába tartoznak, jobban meg tudjuk különböztetni, mint azokat az ingereket, amelyek azonos kategóriába tartoznak. A kategoriális észlelés a beszédhangok esetében nagyon jellemző, de más ingerek esetében is előfordul. kétszemes látás Az egészséges szemek két, kismértékben különböző képének együttes feldolgozására, az azonos tárgyakat ábrázoló, összetartozó képrészletek térbeli összerendezésére épülő látás. kettős feladatok módszere A kísérleti pszichológia számos területén alkalmazható eljárásban párhuzamosan két feladatot végeztetnek a résztvevőkkel, és elemzik e két feladat teljesítményének kölcsönhatásait. A megosztott figyelem vizsgálatánál e kölcsönhatások megmutatják, hogy a két feladat azonos információfeldolgozási mechanizmusokat (kapacitásokat) igényel-e, vagy a feladatok egyike igényel-e
382 Created by XMLmind XSL-FO Converter.
Glosszárium
egyáltalán figyelmi kapacitást. Az emlékezet vizsgálatában főként a munkaemlékezet egyes összetevőit elemzik e módszer segítségével. kettős látás A fixált pontnál és egyben a horopternél jelentősen közelebb, illetve távolabb elhelyezkedő tárgyak képét a látórendszer nem kapcsolja össze, ezeket megkettőzve látjuk. keverék színek Azon színárnyalatok, melyek két másik (alap-) szín keverékének tűnnek számunkra. kifejezett tetrakromázia A tetrakromát (négy retinális csaptípuson alapuló) színlátás azon fajtája, melyben az idegrendszer mind a négy csaposztály jelét megkülönbözteti egymástól. kinesztézia Mozdulatok, mozgások, a testhelyzet változásainak érzékelése. kiváltott potenciál (KP) Ingerekhez, eseményekhez időben kötött, nagyobb neuroncsoport szinkrón aktivitásához köthető jel. A KP kifejezést elsősorban az elemi szenzoros válaszok vizsgálatában, a klinikai gyakorlatban használjuk, az EKP-t pedig a pszichológiában és társtudományaiban (kognitív idegtudomány). Kkomplexusok Elsősorban az alvás 2-es stádiumában, de a teljes NREM-fázisban előforduló nagy amplitúdójú, a háttértevékenységből kiemelkedő, többfázisos lassú EEG-hullámok, melyek spontán módon vagy külső ingerlés hatására is megjelenhetnek. koartikuláció (kontextusfüggő átszerveződés) Egy beszédhang akusztikai jellemzőinek megváltozása attól függően, hogy előtte vagy utána milyen hangok állnak. kollatív változók Olyan ingersajátságok, melyek nem a fizikai tulajdonságokon alapulnak, hanem az ingerek váratlanságán, szokatlanságán. komfortérintés Egy másik egyén (vagy egyed) megnyugtatása érintés által. komplex hang Több különböző frekvenciájú szinuszhullámot tartalmazó hang. komponensalapú felismerés modell (RBC-elmélet) A tárgyfelismerés egyik strukturális elmélete, mely a tárgyak részeinek (geonok) és a köztük lévő összefüggéseknek a fontosságát hangsúlyozza. kompozit illat Több elemi illatanyagból összeálló illat vagy szag; általában egy entitásként érzékeljük. koncepcióvezérelt (top-down) észlelés Lásd közvetett észlelés. konjunktív (egyirányú) szemmozgás A két szemgolyót azonos irányban elmozdító mozgások. Tárgyak követését ez a szemmozgás jellemzi. Lásd még vergens (ellentétes irányú) szemmozgás. konstancia (nagyság-, alak-, hely, mozgás-, szín-, világosság-) A látórendszernek az a képessége, hogy a teljes környezet értékelése alapján az egyes tárgyakat a maguk méretében, alakjában, helyén, mozgásában és színében észleljük, nagyban függetlenül a retinákra érkező kép nagyságától, alakjától, mozgásától és színétől. konstans ingerek módszere Fechner által kidolgozott küszöbmérési eljárás, melyben véletlenszerűen elrendezett ingersorozatok alapján becslik a személy érzékelési küszöbeit. konstruktív észlelés Lásd közvetett észlelés. konszonancia Több egyidejűleg megszólaló hang összeolvadása és kellemes hangzása. Vö. disszonancia kontakt receptor Olyan receptor, amelynek az ingerforrással érintkeznie kell ahhoz, hogy aktiválódjon. kontextuselmélet Edward Bradford Titchener elmélete, amely szerint az észlelés olyan esemény, amelynek alapja az érzéklethez hozzátapadó mentális folyamat. kontextusfüggő átszerveződés Lásd koartikuláció. kontrasztszínek Azok a színek (pl. a barna és a fekete), melyek csak más színek háttere előtt láthatóak. konvergencia A szemek azon képessége, hogy mindkét szemmel ugyanarra a pontra nézzenek, azaz a nézett tárgy távolságának megfelelően változtassák a nézési irányok által bezárt szöget. korai szűrési modell Emlékezeti teória, mely feltételezi, hogy szelekciós folyamatok működnek az észlelés során, azaz az információfeldolgozás folyamatsorának elején. körtemag A limbikus rendszerhez tartozó ősi kéregterület, a szaglás elsődleges központja (nucleus piriformis). követő szemmozgások Folyamatos, nem ballisztikus szemmozgások. A követő szemmozgások a mozgó tárgyak észlelésében fontos szerepet töltenek be. közös sors elve A spektrális csoportosítás azon elve, mely szerint az észlelőrendszer azokat a hangokat fogja csoportosítani, amelyek egyszerre változnak meg. közvetett észlelés Az észlelés során a szenzoros ingerek az észlelést szolgáló következtetéseknek csak alapját jelentik, az észlelés maga számítási műveletek eredménye. A környezeti ingerek (input) a világ tárgyairól és eseményeiről pontatlan információval szolgálnak, ezért az észlelés kognitív műveletekre, számításokra támaszkodik.
383 Created by XMLmind XSL-FO Converter.
Glosszárium
közvetlen észlelés A környezet valamennyi ingere közvetítő folyamatok nélkül is hozzáférhető az észlelő számára. Ennek alapja az, hogy a környezeti ingerek az észleléshez szükséges összes információt rendezetten és egyértelmű formában hordozzák. A közvetlen észlelés elméleteiben a mentális folyamatoknak vagy nincs szerepük, vagy nem tudatos döntéseket, értelmezéseket szolgálnak. közvetlen nagyságbecslés Pszichofizikai eljárás, melyben az ingerek nagyságának eltérését a kísérleti személyek közvetlen becsléssel állapítják meg. KP Lásd kiváltott potenciál. Krause-féle végtest Főleg a szövet hűlésére érzékeny, a bőrfelszín közelében lévő hőreceptor. kritikus sáv Korlátozott frekvenciatartomány, amely elfedi a tesztfrekvenciát. A kritikus sáv a tesztfrekvenciát feldolgozó idegsejtek hangolási frekvenciáját tükrözi. kromatikus A diatonikus skála kibővítése félhangokkal, amely így tizenkét hangot tartalmaz. kromatikus színek Azok a színek, melyek a piros vagy zöld, illetve sárga vagy kék árnyalatait tartalmazzák – lehetnek tiszta színek vagy keverék színek. Valamennyi szín kromatikus, kivéve a fehéret, a feketét és a szürke árnyalatait. kromatikus válaszfüggvények Az ellenszínelmélet által feltételezett úgynevezett ellenszíncsatornák (piros-zöld, illetve sárga-kék opponens csatorna) válaszai a fényhullámhossz függvényében, melyeket a színkioltási kísérletekből kapunk meg. krónikus fájdalom A hat hónapnál tovább folyamatosan fennálló fájdalom. kronoszkóp Inger és az arra adott válasz mérésére szolgáló, a számítógépek megjelenése előtt használt mérőeszköz. küklopszi (cyklopikus) szem A térlátásbeli – Julesz Bélától származó – értelmezésben a két szem között elhelyezkedő, sztereolátásra képes, hipotetikus szem. (Egyéb értelmezésben fejlődési rendellenességként kialakuló, egybeolvadt két szem.) különbségi küszöb (legkisebb érzékelhető különbség — LÉK) Két inger közötti legkisebb, még érzékelhető különbség, adott valószínűségi szint mellett. (Például 90 százalékos valószínűséggel nagyobb ingerkülönbséget érzékelünk csak, mint 70 százalékos valószínűséggel.) küszöb alatti észlelés A cselekvést meghatározó észlelési teljesítmény olyan ingerekre, tárgyakra jön létre, amelyekről az észlelőnek nincs tudása. laterális gátlás Olyan mechanizmus, melynek révén az idegsejtek pontosabban meg tudják határozni az inger eredetét. Amikor például a bőrt egy kis helyen ingereljük, sok szenzoros idegsejt kerülhet izgalmi állapotba, s mire a jel az agykéregbe ér, pusztán serkentő kapcsolatok révén, már a bőrfelszín jelentős részének ingerléséről kaphat az agy információt. A laterális gátlás révén az ingerlés helyéről pontosabb információ érkezik az agyba. látóideg-kereszteződés fölötti mag A hipotalamusz egyik neuroanatómiai rendszere, amely nevét lokalizációjáról kapta, funkciója viszont a cirkadián ritmusok generálása és koordinálása. látószög A nézett tárgytól a két szem irányába húzott két egyenes – azaz a két szem nézési iránya – által bezárt szög. látszólagos (stroboszkopikus) mozgás Amikor egy ingert adott helyen felvillantunk, s utána egy térileg különböző helyen is, a két felvillanást mozgás érzete kísérheti. legkisebb érzékelhető különbség Lásd különbségi küszöb. légtávlat A fényspektrum kék oldalának a levegő molekuláin való fokozott szóródásán alapuló monokuláris téri jelzőmozzanat, mely a távoli tárgyak színének kékülésében és a képélesség csökkenésében jelentkezik. LÉK Legkisebb érzékelhető különbség. Lásd különbségi küszöb. lépcsőmódszer A Fechner által kidolgozott klasszikus küszöbmérési eljárások egyik továbbfejlesztett változata, melyben az ingerek csökkenő vagy növekvő sorrendjét a személy válaszának megváltozása fordítja meg. Például, ha igen kicsi, de egyre erősödő ingereket adunk, akkor, amint a személy először jelzi, hogy érzékelte az ingert, csökkenteni kezdjük az ingererősséget. Ezután, amint a személy nemleges választ ad, újra növelni kezdjük, stb.
384 Created by XMLmind XSL-FO Converter.
Glosszárium
lineáris perspektíva A tárgyak és közök látszólagos méretének csökkenése a távolság növekedésével. LOC Laterális okcipitális komplexum. Az emberi agy nyakszirti és halántéklebenyének alulsó részén található, tárgyak bemutatására érzékeny terület. M sejt A retinális ganglionsejtek egyik fajtája. (Az M a magnus = nagy szó rövidítése.) Az M sejtek jó idői, s gyengébb téri felbontóképességgel rendelkeznek, s a magnocelluláris pálya, elsősorban a dorzális rendszer bemenetét képezik. macula Lásd sárgafolt. magánhangzószekvencia-illúzió (illuzórikus szótag) Ha nagyon rövid magánhangzócsoportokat (pl. négy magánhangzóból álló szekvenciákat) gyors egymásutánban mutatunk be, akkor nem különálló fonémákat hallunk, hanem mássalhangzókat is tartalmazó szótagokat. mágneses rezonanciás képalkotás Lásd MRI. magnetoencefalográfia Lásd MEG: maradványhang Egy harmonikus komplex hang esetén a hang észlelt magasságához, vagyis az alaphanghoz közeli hang, amelynek azonban nem szükséges jelen lennie az adott hangmagasság észleléséhez. maszkolás Egy inger hangerejének csökkenése egy másik, erősebb inger mellé helyezése miatt. Elfedésnek is nevezik. McGurk-effektus Beszédhang és a hozzá szinkronizált, de tőle eltérő beszédhangnak megfelelő szájmozgás látványakor létrejövő észlelési illúzió. A jelenség alapja a beszédhangok feldolgozásakor működő modalitásközi integráció. mechanizmusillúziók Richard L. Gregory kifejezése azoknak az észlelési csalódásoknak a jelölésére, amelyeknek keletkezéséért a látórendszer élettani tulajdonságai felelősek. mechanoelektromos transzdukció A hanginger átalakítása idegi impulzussá. mechanorecepció Mechanikai ingerek (deformáció, mozgások stb.) érzékelése. mediális sík A hallási tér azon síkja, amely a fej középvonalán halad át, és mindkét fültől azonos távolságra található. MEG Magnetoencefalográfia, magnetoencefalogram. A spontán agyi elektromos aktivitás körül kialalakuló mágneses változások (fluxus) mérésére szolgáló eljárás, illetve az ezzel a módszerrel nyert regisztrátum. Meissner-testecskék A bőr felszíne közelében található, gyorsan adaptálódó, pontszerű érzőmezővel rendelkező mechanoreceptorok. mentális erőfeszítés A figyelem pszichológiájában nehezen meghatározható, de szinte elkerülhetetlenül alkalmazott fogalmi konstrukció. Utal a figyelmi feldolgozás lehetőségeinek összességére (mentális kapacitás) és annak átélésére. A fő nehézséget a mérése jelenti, amennyiben nem határozhatók meg egyértelműen azok a független változók, melyekkel jellemezni lehet, és így azok az eljárások sem, melyek egyértelműen mutatják mértékét. mentális fájdalom Valamilyen kellemetlen vagy szomorú állapot megjelenítése allegorikus vagy metaforikus formában a fájdalomra jellemző kifejezések használatával (pl. gyász). Merkel-korongok A bőr alaprétegében található, lassan adaptálódó és pontszerű érzőmezővel rendelkező mechanoreceptorok, amelyek a felszíni mozgásokra, illetve a gyors változásokra érzékenyek. metamerek Fizikailag különböző, de színben azonos ingerek: fényforrások vagy fényvisszaverő felületek. metrikus lüktetés (metrum) A hangsúlyos és hangsúlytalan ritmikai elemek szabályos váltakozása, amely egy hierarchikus szerveződést alkot. metrum Lásd metrikus lüktetés. mikroébredések Az alvásfolyamat átmeneti instabilitását jelző, agyi elektromos tevékenységben észlelhető, de viselkedéses ébredéssel nem járó reakciók, melyekben ébrenlét- és/vagy alvásszerű elemek egyaránt előfordulhatnak. mikroszakkádok A szemgolyók állandó apró, rezgésszerű mozgásai. A mikroszakkádok a retinakép frissítését szolgálják. minimális párok Egyetlen fonémában különböző szavak. Például kéz és kész. 385 Created by XMLmind XSL-FO Converter.
Glosszárium
modalitásközi facilitáció Az egyik érzékleti modalitásban megjelenő inger feldolgozása serkenti a másikban megjelenők feldolgozását. modalitásközi jelzés Egyik érzékleti modalitásban megjelenő inger, esemény könnyíti, gyorsítja, serkenti a másik modalitásban őt követően megjelenő inger feldolgozását. moll A klasszikus zenének a dúr mellett a másik legfontosabb hangsora. Jellegzetessége a bővített szekund hangköz. monaurális Egy füllel való hallgatás. Vö. binaurális. Mondrian-ábrák Egymást átfedő, színes négyzetekből, téglalapokból, illetve más egyszerű geometriai alakzatokból álló ábrák, melyeket a színkonstanciával kapcsolatos vizsgálatokban használnak. monoaminok Az agyi neuromodulátorok, illetve hormonok egyik csoportja, melynek legfontosabb képviselői az adrenalin, a noradrenalin, a szerotonin, a dopamin és a hisztamin. monokromatikus fény Olyan fény, amely csak egyetlen, igen szűk hullámhossztartományban tartalmaz fotonokat. monokuláris (egyszemes) jelzőmozzanat A környezet tárgyainak térbeli elhelyezkedéséről szóló azon információ, melyet egy szemmel – azaz egyik szemünket letakarva – is észlelünk. motoros elmélet Azon elképzelés, mely szerint a beszédhangok feldolgozása során szoros kapcsolat van a beszédhangok produkciója és percepciója között. mozgásérzékelés (kinesztézia) A test egyes tájainak elmozdulását, illetve az egész test mozgását (izom, ín, ízületi változások) érzékelő folyamat. mozgási parallaxis Azonos sebességgel, egymással párhuzamosan mozgó tárgyak közül a távolabbi lassabban, a közelebbi gyorsabban halad a látómezőben. Mozgó szemlélő esetében ugyanez vonatkozik a mozdulatlan tárgyakra. mozgási utóhatás Miután egy egy irányba mozgó ingert körülbelül egy percig szemlélünk, s egy álló ingerre nézünk, az álló inger az ellenkező irányba látszik elmozdulni. mozgáskonstancia Lásd konstancia. MRI Mágneses rezonanciás képalkotó eljárás, illetve az ezzel létrehozott szerkezeti kép. Az alaptechnika továbbfejlesztésével lehetséges a funkcionális képalkotás, az fMRI. multiszenzoros integráció Eltérő modalitású ingerjellemzők olyan összekapcsolódása, amelynek hatására az egyik modalitás befolyásolja, megváltoztatja a másik modalitásban a feldolgozást. nagymamasejt Az úgynevezett pontificiális neuron vagy kardinális sejt alternatív elnevezése. Olyan, csak hipotetikusan létező neuron, mely kizárólag egy adott tárgy, dolog, jelenség (pl. a nagymamánk) bemutatására kerül ingerületbe. nagyságkonstancia Lásd konstancia. napi maradvány Az álmokban fellelhető és a közelmúlt eseményeire vonatkozó utalások. narkotikus leszálló rendszer Belső (endogén) opiátokat kibocsátó agyi eredetű leszálló rendszer, amely a gerincvelőben megakadályozza a nociceptív ingerek felvételét, ezért fájdalomcsillapító hatású. negatív előfeszítés Egy környezeti esemény (inger) reprezentációjának teljesítményrontó hatása egy időben következő inger feldolgozására. A hatás főleg akkor nyújt módszertani segítséget, ha e hatás implicit, azaz az előfeszítő inger reprezentációja a kísérlet résztvevője számára tudatosan nem hozzáférhető. nemfigyelési vakság A látómezőben potenciálisan észlelhető események tudatos észlelésének hiánya. Akkor jön létre, amikor egy figyelt esemény, eseménysor figyelmi feldolgozást igényel. Ha a résztvevőt az előzetesen nemfigyelési vaksággal járó eseményről tájékoztatjuk, az esemény újabb bekövetkezésekor észleli az eseményt. nemnarkotikus leszálló rendszer A fájdalomingerek továbbítását befolyásoló, nem endogén opiátokkal működő agyi eredetű leszálló rendszer; egyes elemei fájdalomcsillapító, mások fájdalomfokozó hatásúak. nemparaméteres eljárások Ismeretlen alakú érzetfüggvény esetén pusztán az érzékelési küszöbök kimérésére szolgáló eljárások. 386 Created by XMLmind XSL-FO Converter.
Glosszárium
nemtudatos következtetések Hermann von Helmholtz által bevezetett kifejezés azoknak a folyamatoknak a jelölésére, amelyek során az érzékleteket korábbi tapasztalataink alapján értelmezzük. nocicepció A szövetkárosító hatású ingerek keltette ingerület. nominális skála Olyan skála, mely nagyságrend szerint nem, csak azonosság-különbözőség szerint osztályoz. Például a telefonszámok nominális skálán osztályozzák az előfizetőket. NREM-alvás Gyors szemmozgásoktól mentes, alacsony, de megtartott izomtónussal és alacsony frekvenciájú agyi elektromos tevékenységgel jellemezhető alvásállapot, amelyben álomszerű képek helyett gyakrabban jelennek meg gondolatszerű lelki aktusok. okcipitális lebeny Az agykéreg nyakszirti lebenye, mely a látás talán legfontosabb területét, az elsődleges látókérget foglalja magában. oktáv Olyan hangköz, amely nyolcadik diatonikus hang különbséget jelöl. Az oktáv hangközt alkotó hangok frekvenciaaránya 2 : 1. oktávazonosság Az a jelenség, hogy az oktávkapcsolatban álló hangok hasonlónak tűnnek. okulomotoros mikropszia/makropszia Közeli pontra nézve a valóságosnál kisebbnek, míg távoli pontra nézve a valóságosnál nagyobbnak észleljük a tárgyakat. ordinális skála Olyan skála, mely nagyságrend szerint osztályoz (nagyság szerinti rangsort állít föl), de a skálaelemek közti külöbségek nincsenek benne értelmezve. Például egy szavalóverseny helyezettjei közötti rangsor. ortogonális bázis Egy vektortér alapvető dimenzióit, irányait rögzítő, egymásra merőleges egységvektorok. A színkeverés esetén három olyan monokromatikus fény ad ortogonális bázist, melyekből kettőt keverve sohasem kaphatjuk meg a harmadik színét (pl. 450, 540 és 610 nm). oszcillogram A hang által keltett légnyomásváltozás az idő függvényében feltüntetve. összekapcsolási (binding-) probléma Az észlelőrendszer egyes sajátságok feldolgozására specializálódott mechanizmusai (modulok) eredményeit az észlelőrendszer objektumokká egyesíti. A pszichológiai és idegtudományi kutatások lényeges területe annak feltárása, hogy miként történik meg ez a folyamat. összetett reakcióidő Lásd választásos reakcióidő. P sejt A retinális ganglionsejtek egyik fajtája. (A P a parvus = kis szó rövidítése.) A P sejtek jó téri, s gyengébb idői felbontóképességgel rendelkeznek, s a parvocelluláris pálya, s elsősorban a ventrális rendszer bemenetét képezik. Pacini-testek A bőr mélyebb rétegeiben, az ízületekben, a hashártyában, a nemi szervekben található, igen gyorsan adaptálódó receptor, amelyet az idegvégződés körül található hagymahéjszerű végkészülék jellemez. Gyors mozgásokra, illetve vibrációra érzékeny. pálcikák Vékony, pálcika alakú fotoreceptorok a retinában. A pálcikák szűk hullámhosszra érzékenyek, és a sárgafolton kívül a legnagyobb az előfordulásuk. Szürkületi látásra specializálódott fotoreceptorok. Panum-mező Egymásnak megfelelő pontok retinális környezete; az erre eső, kissé eltérő (diszparáló) képrészletek között létrejön a sztereofúzió. A Panum-mező mérete határozza meg a sztereomélységet. paraméteres eljárások A pszichofizika azon módszerei, melyeket általános, ismert alakú pszichometriai függvények pontos alakjának meghatározására (azaz paramétereik kimérésére) használnak. percepciós bázis Az egyes nyelvekre jellemző, a nyelv elsajátítása során, tanulás révén létrejövő mechanizmus, amely az akusztikus információt (beszédhangok) fordítja le a perceptuális egységek mentális reprezentációjára (fonémák). Egyfajta szűrőként működik, vagyis csak azokat a beszédhangokat tudjuk feldolgozni, amelyek léteznek a saját nyelvünkben is.
387 Created by XMLmind XSL-FO Converter.
Glosszárium
perceptuális ciklus Ulrich Neisser komplex észleléselmélete, amelyben az észlelés dinamikus folyamat, és egyben állandó változás eredménye. A ciklus elemei a környezet észlelési feltérképezése (exploráció), a tapasztalat, a reprezentációk és sémák kialakulása és ezek egymásra ható működése. perceptuális elhárítás A pszichoanalízis szótárából átvett kifejezés, amely azt jelöli, hogy az érzelmileg telített, feszültséget keltő környezeti ingerek tudatos észlelése elmarad. perceptuális készenlét Jerome Bruner által bevezetett fogalom, amely azt fejezi ki, hogy a környezet jelzőingereinek osztályozása az egyén szükségletei szerint változik. perceptuálismágnes-hatás Az a jelenség, hogy beszédhang-prototípushoz közeli hangok esetében csökkennek a beszédhangok között észlelt különbségek, a prototípushoz nem hasonlító hangok esetében viszont nőnek. Vagyis a prototípus mintegy mágnesként vonzza a hozzá hasonlító hangokat. perceptuális szegregáció A tárgylátás alapvető lépése, mely szerint az adott tárgyat annak hátterétől, valamint az együtt megjelenő tárgyakat egymástól elkülönítjük. perceptuális tanulás Az észlelésben a korábbi tapasztalatokat közvetítő tanulási folyamatok érvényesülnek. Két fő megközelítési irányzatának fókuszában az észlelésben érvényesülő tanulás, illetve az észlelés útján megszerezhető tudás áll. periakveduktális szürkeállomány Az agykamrák és az azokat összekötő agyvezeték (akveduktusz) alját borító, idegsejtekből álló sejtrétréteg; többek között a legjelentősebb leszálló fájdalomcsillapító rendszer indul innen. perspektíva Távlat. PET Pozitronemissziós tomográfia. Az agy egyes területeinek megváltozott működéséről (fokozott anyagcsere) számítógépes program segítségével aktivitási térképet készítő eljárás. polulációs kód Az a neuronális kódolási elképzelés, mely szerint nem egyes idegsejtek, hanem idegsejtek nagyobb populációi kódolják az inger egyes tulajdonságait (pl. a mozgásirányt). Posner-feladat Olyan, vizuális célingerek detekcióját vizsgáló feladat, amelyben a jelzőingerek téri megjelenési helyét vizsgáljuk. Lásd még gyorsított ingerdetekciós feladat. pozitronemissziós tomográfia Lásd PET. preattentív A figyelem pszichológiájában kétféle értelemben használt kifejezés. Egyrészt azoknak a folyamatoknak az összessége, melyek az információfeldolgozás olyan, korai szakaszaiban működnek, melyek megelőzik a modellvezérelt figyelmi folyamatok működését. Másrészt mindazon folyamatok összessége, melyek automatikusan mennek végbe, és nem igényelnek figyelmi kapacitást. Mindkét esetben a konstrukció kifejezetten elméletfüggő, amennyiben a figyelem különböző teóriái más és más módon határozzák meg e folyamatok körét. primer (elsődleges) érzőreceptor Olyan receptor, amelyet valódi, axonnal rendelkező idegsejtek alkotnak. Embernél ilyenek a szaglóreceptorok. primer fény A színkeveréshez használt monokromatikus fények neve. Trikromát színlátás esetén három megfelelően választott primer fényből (azaz ortogonális bázisból) a látható színek nagy része kikeverhető. proprioceptorok A mozgásszervekben (izmok, inak, ízületek) lévő mechanoreceptorok. protán zavar A színtévesztés egy formája, a protanomália és a protanópia összefoglaló neve. protanomália A színtévesztés egy formája, melynél a hosszú hullámhossztartományra érzékeny csapok érzékenységi tartománya a látható fénytartomány közepe felé tolódott el. protanópia A színtévesztés egy formája, melynél a hosszú hullámhossztartományra érzékeny csapok érzékenységi tartománya egybeesik a közepes hullámtartományra érzékeny csapokével, tehát működés szempontjából három- helyett csak kétféle csaposztály található a retinában. protopátiás Észlelési küszöb alatt maradó ingerhatás.
388 Created by XMLmind XSL-FO Converter.
Glosszárium
prototípus Egy adott kategóriára leginkább jellemző perceptuális mintázatokkal rendelkező elem. pszeudofon Álmikrofon: olyan eszköz, amely felcseréli a két fülbe érkező akusztikus információt, és a jobbról jövő hangot a bal fülbe, a balról jövőt pedig a jobb fülbe vezeti. pszeudo-izokromatikus táblák A színtévesztés vizsgálatára szolgáló eszközök, melyeken színes pöttyökből álló ábrákon kell különböző számjegyeket és betűket kiolvasni. pszichoakusztika A hangok szubjektív észlelésével foglalkozó tudomány. pszichofizikai függvény Egy adott ingerdimenzió értékei és valamely hozzájuk tartozó érzettulajdonság (pl. az érzet erőssége vagy abszolút küszöbe) közötti függvény. (Ingertulajdonság ^ érzettulajdonság típusú függvény.) pszichogén fájdalom Olyan fájdalmi kórkép, amelyben a fájdalomnak nincs (vagy nincs elégséges) fizikai oka, a fájdalom pszichés úton keletkezik. pszichológiai színkeverés A színlátás azon jelensége, hogy négy kromatikus alapszín (piros, zöld, sárga és kék) közül azok, melyek nem ellenszínek, az érzékleti élmény szintjén keverednek egymással. Például a lila szín a piros és a kék pszichológiai keveréke: bizonyos mértékig vöröses, bizonyos mértékig zöldes. pszichometriai függvény A küszöbök mérésekor előálló függvény, mely különböző ingernagyságokhoz azt a valószínűséget rendeli, amellyel egy adott ingerre pozitív („Igen” vagy helyes) válasz jelenik meg. (Inger ^ válaszvalószínűség típusú függvény.) RBC-elmélet Lásd komponensalapú felismerés modell. receptív mező Egy receptor által ellátott terület (pl. bőr, tér) nagysága és határának minősége (mennyire éles vagy elmosódott a mező széle). A receptív felület (vizuális neuron esetében a látott tér) azon része, ahonnan érkező információ befolyásolja (serkenti vagy gátolja) a neuron működését. Egy szenzoros idegsejt receptív mezője az a tér (pl. retinaterület), melyen belül ingerlést alkalmazva az idegsejt kisülési frekvenciája megváltozik (csökken vagy nő). A receptív mező fogalma az agykéregre is kiterjeszthető. receptor Az érzékszervekben található, a környezetből származó fizikai jeleket idegimpulzusokká átalakító felfogókészülék. régi plusz új” szabály A spektrális csoportosítás azon elve, mely szerint, ha az éppen hallható frekvenciakomponensek között van egy olyan csoport, amelyik valamilyen okból egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor érdemes ezeket egy láncba csoportosítani. Reichardt-detektorok A mozgásirányt érzékelő idegsejtek, melyek a feltételezések szerint az idői késleltetés elve alapján képesek erre. rejtett tetrakromázia A tetrakromát (négy retinális csaptípuson alapuló) színlátás azon fajtája, melyben az idegrendszer a négy csaptípus válaszai közül kettőét – azokét, melyek érzékenysége a legközelebb áll egymáshoz – nem különbözteti meg egymástól. relatív hallás Az a képesség, hogy egy hangközt anélkül meghatározzunk, hogy tudnánk pontosan, mely hangok közötti hangközről van szó. REM-alvás Gyors szemmozgásokkal, rendkívül alacsony izomtónussal és ébrenlétszerű agyi elektromos tevékenységgel jellemezhető alvásállapot, amelyben többnyire intenzív álomtevékenység folyik. reprezentáció Az észlelési folyamatok eredményének olyan absztrakt képviselete, amely sémákba rendeződik. retinális ganglionsejtek A retinában elhelyezkedő idegsejtfajta, mely a fotoreceptoroktól több idegsejtfajtán (bipoláris, amakrin, horizontális) átkapcsolódva kap információt. A gerincesretina fotoreceptorainak kimenete a ganglionsejtek révén válik az agy felé küldött akciós potenciállá. A ganglionsejtek mielinnel borított axonja alkotja a látóideget. retinális kép A tárgyakról a retináig eljutó fényeloszlás. A fényeloszlás minősége és intenzitása befolyásolja a retináról továbbított idegi információt és ennek végeredményeként az észlelést. retinexelmélet A színkonstancia egyik elmélete, mely Edwin Land nevéhez fűződik. 389 Created by XMLmind XSL-FO Converter.
Glosszárium
retinotópia A látott képnek a látórendszerbeli idegi reprezentációja, mely megőrzi az eredeti retinális kép elrendezettségét. Jelentése pontról pontra való vetülés. A látótér egy adott pontját kódoló neuron mellett elhelyezkedő neuronok a látótér szomszédos pontjait kódolják. retinotopikus térkép A retinakép agykérgi reprezentációja megőrzi a retinakép topológiai összefüggéseit, tehát ami a retinán szomszédos pontokban volt reprezentálva, az az agykéregben is szomszédos idegsejtek által lesz reprezentálva. rezonanciaelv Az a jelenség, hogy egy tárgy rezgésbe jön akkor, ha egy olyan hangot szólaltatunk meg a közelében, amely tartalmaz a tárgy rezgési frekvenciájának megfelelő frekvenciakomponenst. Minden tárgy rendelkezik saját rezgési frekvenciával – ezzel rezeg az adott tárgy, ha mozgásba jön. ritmus Bizonyos események szabályos időbeli szerveződése. rtg Röntgensugarat használó vizsgálóeljárás, illetve az ezzel készített szerkezeti kép. Ruffini-testek A bőr mélyében elhelyezkedő, hő- és nyomásérző receptorok. sajátnév-hatás A figyelmi szelekciót vizsgáló kísérletek eredményei szerint a résztvevő saját nevét gyakran észreveszi akkor is, ha az olyan szöveg része, melyre nem figyel. sajátságintegrációs elmélet A teória a téri figyelmi működéseknek kiemelt szerepet tulajdonítva feltételezi, hogy az elemi ingersajátságok (szín, irány stb.) feldolgozásának eredményei a figyelmi területekre irányuló folyamatok működésével integrálódnak. A téri figyelmi folyamatoknak ezért alapvető szerepük van a tárgyak valósághű észlelésében. sárgafolt (macula) A retinának az a központi területe, amelyen a látás a többi területhez képest sokkal élesebb. A sárgafolt középső, elvékonyodó része a fovea. sortűzelmélet A hangmagasság feldolgozásának az az elmélete, amely szerint az alaphártya idegsejtjei lépcsőzetesen bekapcsolódva és a hangnyomásváltozásokkal szinkronban tüzelve kódolják a hangmagasságot. spektrális ábrázolás Lásd amplitúdómetszet-ábrázolás. spektrális energiaeloszlás A fények hullámhosszak szerinti energiaeloszlása. spektrális szerveződés A hangok vertikális szerveződése, vagyis az egyszerre hallható hangok hallási láncba szerveződése, illetve elkülönülése. spektrális tartalom A spektrális tartalom arra vonatkozik, hogy hány és milyen típusú harmonikust tartalmaz egy adott hang. Lényegében ez határozza meg egy komplex hang hangszínét. spektrogram Egy hang frekvenciaösszetételét az idő függvényében ábrázoló grafikon. SPL (SoundPressure Level) Hangnyomásszint. Egy olyan hang hangereje dB-ben kifejezve, amelyet egy nemzetközileg meghatározott alapértékhez viszonyítanak. Az alapérték 20 mPa-nak felel meg. spontán aktivitás Az idegsejtek külső ingerlés nélküli aktivitása. spontán tempó Egyénenként változó jellemző tempó, amit úgy mérhetünk le, ha arra kérünk valakit, hogy tapsoljon vagy kopogjon egyenletesen hosszabb időn keresztül. Stevens-elv Az érzetfüggvényekkel kapcsolatos általános elv, mely szerint egyenlő ingerarányok egyenlő érzetarányokat hoznak létre. Számos inger-, illetve érzetkontinuumra igaznak bizonyult. Stevens-féle érzetfüggvény Érzet(x) = cxb típusú, vagyis hatványfüggvény alakú érzetfüggvény. Ha egy érzetfüggvényre érvényes a Stevens-elv, akkor az az érzetfüggvény hatványfüggvény alakú. stratégiaillúziók Richard L. Gregory kifejezése azoknak az észlelési csalódásoknak a jelölésére, amelyeknek keletkezéséért a vizuális környezet állandóságát biztosító, a tapasztalatokra támaszkodó mentális műveletek felelősek. Stratton-szemüveg A vizuális környezetet vertikálisan megfordító szemüveg. Nevét a retinális kép, a helyváltoztatás és a vizuális észlelés összefüggéseit kutató kísérletezőről, Strattonról kapta. stroboszkopikus mozgás Lásd látszólagos mozgás. 390 Created by XMLmind XSL-FO Converter.
Glosszárium
szabad asszociáció A pszichoanalitikusok által kidolgozott technika, melynek során a páciens vagy vizsgálati személy a kiinduló ingerről először eszébe jutó gondolatot vagy emléket közli. A módszer feltételezi a spontán gondolatáramlást korlátozó kritikai attitűd háttérbe szorítását vagy meghaladását. szabad idegvégződés A gerincvelő előtt, még a környéki idegrendszerben lévő érzősejt nyúlványának csupasz, velőshüvely nélküli végződése a bőrben és más szövetekben, amely általában érzőfunkciót lát el. szaglás Illékony, zsírban (is) oldódó vegyületek által keltett, telereceptoros kémiai érzet. szaglógumó A szaglópálya első átkapcsolódása, a szaglási ingerek feldolgozása itt kezdődik (bulbus olfactorius). szaglóhám A felső orrüregben található, erősen nedvesített csillós hám, itt találhatók a szaglóreceptorok. szaglóreceptor Az illékony anyagok által ingerelt kémiai receptor a szaglóhámban, axonnal és felületi csillókkal rendelkező primer érzéksejt. szakaszelmélet Az információfeldolgozás modellje, mely feltételezi, hogy egy részfolyamat csak akkor kezdődik el, amikor a megelőző folyamat már befejeződött. Alternatívája a folyamatos feldolgozási modell. szakkád A szemek igen gyors, ugrásszerű (ballisztikus) mozgása az egyik fixációs pontról a másikra történő váltáskor. A szakkádok teszik lehetővé a perifériáról a foveára történő váltást, jellegzetes mozgások a vizuális keresés, pásztázás során. A szakkádok sajátos mintázatot mutatnak olvasáskor. Lásd még fixáció. szakkádikus elnyomás A szakkádikus szemmozgások alatt a vizuális rendszer nem vesz fel új információt, a fixációk során szerzetteket az agy őrzi meg, majd rakja össze képpé. A szakkádikus elnyomás aktív idegi folyamat, nem önmagában a szem mozgása okozza. számítógépes tomográfia Lásd CT. szegmentációs probléma Az egyes beszédhangok között nincs éles határ, vagyis az akusztikai input folyamatos, a beszédhangokból létrejövő fonémareprezentációk viszont különállók és diszkrétek. szekvenciális szerveződés A hangok horizontális szerveződése, vagyis az egymást követő hangok hallási láncba szerveződése, illetve elkülönülése. szelektív adaptáció Adott inger tulajdonságaira (pl. téri frekvenciájára) való válasz, mely az inger sokszori ismétlése vagy sokáig való bemutatása esetén érzékenységcsökkenésben mutatkozik meg. Az adaptáció szelektív lehet, tehát csak a bemutatott téri frekvenciájú szinuszrácsra jelentkezik, s a többi téri frekvencián nem. szelektív reakcióidő Többféle megjelenő inger közül csak egyfélére kell választ adni. Ezt „go/no go” feladatnak is nevezzük. szenzibilizáció A nociceptorok (fájdalomreceptorok) ingerküszöbének csökkenése, amelyet elsősorban helyben felszabaduló kémiai anyagok idéznek elő; következménye fokozott helyi fájdalomérzékenység lehet. szenzoros kódolás Az ingerek átfordítása akciós potenciálok mintázatába. szervérzékelés (viszcerocepció) A belső szervekben, zsigerekben keletkező ingerek érzékelése. Gyakran nem tudatosodik, vagy csak diffúz formában, illetve többnyire állapotészlelés alakjában tudatosodik (pl. éhség). szignáldetekciós elmélet A jelátvitel műszaki kutatásában kialakított, de a humán információfeldolgozásban is sikeresen alkalmazott teória, melyet zajos körülmények között a jelek vételének jellemzésére alakítottak ki. Módszerei segítségével elválasztható az átviteli rendszer érzékenysége és az a bizonyossági szint, amelynek elérése esetén a feldolgozórendszer a jel meglétét jelzi. szimultán kontraszt A látott színek érzékenysége a környezet, háttér színére. Az egyes tárgyak észlelt színét saját reflektanciájuk (fénykibocsátásuk) és a környezetüké együtt határozza meg. színegyezési függvények A színegyezési kísérletekből kapható értékek, melyek a különböző spektrális energiaeloszlású fények látható színek szempontjából való egyezését írják le. Trikromát színlátás esetén három színegyezési függvény van, ezek a három csap érzékenységi görbéinek lineáris transzformációi. Ha két fény azonos színegyezési függvényértékekkel rendelkezik, akkor a trikromát megfigyelők számára azonos színűnek látszanak.
391 Created by XMLmind XSL-FO Converter.
Glosszárium
színhasonlósági tér A látható színek három dimenziója (árnyalat, telítettség, világosság) szerinti hasonlósági tér. A három dimenzió lehet a piros-zöld ellenszínpár, a sárga-kék ellenszínpár és a világosság is. színkioltás Kromatikus színárnyalatok (vöröses, zöldes, sárgás, kékes) semlegesítése adott fényingerben olyan másik fény segítségével, amely a semlegesítendő árnyalat ellenszíne. Például egy fény vöröses árnyalatát zöld fény hozzákeverésével lehet eltüntetni. A színkioltási eljárás eredményeként kapjuk a kromatikus válaszfüggvényeket. színkonstancia A színlátás azon tulajdonsága, hogy a változó megvilágítás ellenére a tárgyak színét nagymértékben állandónak látjuk. színkör A látható spektrum színeinek egy körön való elrendezése. Az elrendezés sorrendjét a spektrumban való színsorrend határozza meg, valamint az, hogy a spektrum két végének színei (vörös és ibolya) jobban hasonlítanak egymásra, mint a spektrum közepén található színekre (elsősorban a zöldre, sárgára, illetve kékre). színlátás Látásunk azon képessége, hogy a különböző hullámhosszú fények, illetve különböző hullámhosszvisszaverési képességgel rendelkező felületek között feltűnő különbségeket észlelünk. Evolúciós funkciója feltehetőleg a tárgydiszkrimináció, illetve a térben való tájékozódás hatékonyabbá tétele (pl. piros bogyók zöld levelek között; vöröses sziklák és zöld lombkorona gyors elkülönítése; stb.). színmélység A különböző színekhez kapcsolódó távolságillúzió: a kékes felületeket a valóságosnál távolabbinak, a vöröseseket közelebbinek észleljük. színtévesztés A színlátás örökletes zavara, mely a retina fényhullámhossz-receptorai, a csapok normálistól eltérő (egymással túlzottan átfedő) érzékenységéből – illetve egyes csaptípusok hiányából – ered. szinuszhullámú beszéd Olyan mesterségesen létrehozott beszédhangok, amelyek nem tartalmazzák azok komplex harmonikusszerkezetét, és nem tartalmazzák a hangszalagok rezgése által megvalósuló zöngét. szociális fájdalom Az izoláció, illetve szeparáció által keltett centrális fájdalomérzet; nociceptív inger nincs jelen. szomesztézia Lásd testérzés. szőrtüsző A szőrszálak eredési helye a bőrben, amely a szőrszálak növekedési zónáján kívül különféle mirigyeket is tartalmazhat, és a felszín felé nyitott. sztereofúzió A két szem kissé különböző (diszparáló) képeinek mentális egyesítése térbeli, mélységben tagolt alakzattá. sztereolátás Binokuláris diszparitáson alapuló mélységészlelés. sztereomélység A horoptert is magában foglaló sáv térbeli vastagsága, melyen belül a sztereofúzió létrejön. A sztereomélység a Panum-mező méretétől függ. sztereopár Egy látvány két képe, mely a két szem pozíciójának megfelelő helyről készül, és a tárgyakat a térbeli távolságuktól függő viszonylagos eltolódással (diszparitással) ábrázolja. szubglottális (hangrés alatti) nyomás A hangrés zárt állapota esetén a tüdőből kiáramló levegő feltorlódása a hangszalagoknál. szubjektív egyenlőség pontja A Fechner-féle beigazítási módszerrel különbségi küszöb mérésénél kapott azon pontok, ahol egy személy, saját beállítása szerint, éppen egyenlőnek érzékel két ingert. szubjektív ritmizáció Az a tendencia, hogy az egyébként teljesen azonos idői távolságban lévő, teljesen azonos hangokat kettesével vagy négyesével csoportosítva észleljük. szubliminális észlelés Lásd küszöb alatti észlelés. szubtraktív (kivonó) keverés Festékek, illetve fényáteresztő anyagok színének keverése. Ilyenkor a komponensek egymás színét szűrik, így lesz például a kék és sárga festékek keveréséből zöld. szummáció Összegződés, az idegi impulzusok összegződése egy adott idegsejtben. szuperpozíció Ha adott két pár színében páronként egyező fény, mondjuk P1 egyezzen P^-vel, és Q1 egyezzen Ö2-vel, akkor P1 + Q1 is egyezik P2 + Q2-vel. szűrőmechanizmus Olyan feltételezett figyelmi működés, mely biztosítja, hogy csak egyes környezeti mozzanatok (ingerek) hatása kerüljön feldolgozásra, vagy csak ezek szerepeljenek a viselkedés szabályozásában, ezeket tárolja a hosszú tartamú emlékezet. A szűrőn „fennakadó” ingerek feldolgozása elakad. taktilis Érintő, érintési jellegű (általában „taktilis inger” formában használják). taktilis manipuláció Lásd tapintás.
392 Created by XMLmind XSL-FO Converter.
Glosszárium
tapintás (taktilis manipuláció) Az érintésnek az a formája, amely a megismerést szolgálja; aktív folyamat, amely igényli a figyelem fókuszálását a megérintett objektumra. tárgytulajdonság-térkép Geometrikus hasonlóságon alapuló térkép a halántéklebenyben. Az adott kategóriákra maximálisan aktiválódó neuronok csoportjai szétszórtan, jól meghatározható topográfiával helyezkednek el. tartalékoló (puffer-) emlékezet olyan feltételezett tárolási forma, mely időlegesen tehermentesít korlátozott kapacitású feldolgozómechanizmusokat. telereceptorok olyan receptorok, amelyek távoli ingerforrásokból származó ingerek felfogására specializálódtak. telítődési pont Az a hangerőérték, amely felett egy adott hallóidegsejt nem mutat nagyobb aktivitást a hangerő növekedésére. tempó Időegység alatti ritmikai elemek száma. téri frekvencia A matematikában, fizikában és a mérnöki tudományokban a téri frekvencia bármely, a térben periodikusan ismétlődő struktúra tulajdonsága. A téri frekvencia annak a mértéke, hogy egy adott egységen (pl. egy méteren) belül hányszor ismétlődik a struktúra (vagyis hány ciklus jut egy méterre). A látáskutatásban gyakran használt szinuszrácsok téri frekvenciáját látószögfokban fejezzük ki (azaz hány ciklus jut egy látószögfokra). téri jelzőmozzanat A környezet tárgyainak térbeli elhelyezkedéséről szóló elemi információ. termorecepció A szövetek hőmérséklet-változása által keltett érzet. testérzés (szomesztézia) A test felületéről, illetve belsejéből származó ingerek által keltett érzetek (bőr-, mozgás-, szervérzékelés). tetrakromázia Négyféle, fényelnyelési tartomány szempontjából különböző fotopigment (érzékelősejt) jelenléte a retinában. A feltételezés szerint rejtett tetrakromáziánál a négyből a két egymáshoz legközelebb eső érzékenységű receptor válaszát az idegi feldolgozás nem különbözteti meg; kifejezett tetrakromáziánál igen. tévesztési kúp Azon téri pontok összessége, amelyek ponteciálisan ugyanazt az interaurális idő- vagy hangerőkülönbséget adnák, és emiatt a lokalizációjuk nem egyértelmű. thigotrópia Érintés, tapintás általi megismerési folyamat, főleg csecsemők esetében nevezik így. tiszta hang olyan hang, amely esetén a hangnyomás időben történő változása egy szinuszfüggvénnyel írható le.Nevezik egyszerű, szinusz- vagy síphangnak is. tiszta színek Azok a színek, melyek nem tűnnek számunkra két másik árnyalat keverékének. Négy tiszta színkategória van: piros, zöld, sárga és kék (ezek telítettség és világosság szerint változhatnak). A tiszta zöld például sem nem kékes, sem nem sárgás; a tiszta kék sem nem vöröses (ti. lilás), sem nem sárgás (ti. narancs). tonális szerveződés A különböző hangmagasságú hangok által a dallamban, illetve akkordokban betöltött szerepek összessége és rendszere. tonika A tonalitás vagy hangnem meghatározója, egy adott hangnemű hangsor első hangja. tonotópiás szerveződés A preferált frekvenciák sorba rendeződése az alaphártya hossza mentén, illetve hasonló szerveződés a hallórendszer egészében (hallóideg és hallókéreg). többszörös tárgykövetési vizsgálat A vizsgálati módszerben több mozgó objektumot kell figyelni, melyek egyikének vagy egy alcsoportjának valamely sajátságáról kell a résztvevőnek beszámolni. A módszer alkalmas a rövid tartamú tárolás kapacitásának vizsgálatára. transzdukció A receptorban történő átalakítási folyamat, amelynek eredményeként a fizikai jelek az idegrendszer számára feldolgozható idegimpulzusokká alakulnak át. tranziens Átmeneti, nem folyamatos. tritán zavar Az R csappigment érzékenységének a spektrum közepe felé tolódásából eredő zavar (tritanomália), illetve az R csap hiánya (tritanópia) együttes neve. A kék-sárga színmegkülönböztetés zavara. tritanomália Az R csappigment érzékenységének a spektrum közepe felé tolódásából eredő színlátászavar. A kék-sárga színmegkülönböztetést érinti.
393 Created by XMLmind XSL-FO Converter.
Glosszárium
tritanópia Az R csappigment hiánya okozta színlátászavar. A kék-sárga színmegkülönböztetés hiányát okozza. tudat alatti észlelés Lásd küszöb alatti észlelés. tükrözéselmélet A közvetlen észlelés klasszikus elmélete, egyik leghíresebb képviselője Kardos Lajos. Az elmélet szerint az érzéklet és az érzékelt tárgy között megfeleléses viszony van, a tükrözési folyamat közege az idegrendszer. Az érzékletek nem csupán közvetítik a valóságot, hanem hasonlítanak is arra, illetve együtt változnak az érzékelt tárggyal. ultradián ritmus Egy napnál rövidebb periódusú biológiai ritmus, az emberi alvás esetében az alvásciklusok 90 percenkénti ismétlődése, illetve a NREM- és a REM-alvás váltakozása. umami A hús ízére emlékeztető alapíz; a glutamát nevű vegyület adja leginkább. univariancia A színlátás receptorainak azon működési elve, hogy e receptorok csak a különböző energiájú fotonok elnyelési valószínűségében különböznek egymástól. Egy receptor akármilyen energiájú fotont nyel is el, mindig azonos módon válaszol. utazóhullám-elmélet A hangmagasság feldolgozásának az az elmélete, amely szerint a hangok a csiga folyadékában nyomásváltakozást idéznek elő, amelyek egy utazóhullámot eredményeznek. Az utazóhullám az alaphártya bizonyos helyén hoz létre maximális elmozdulást, és ez a hely határozza meg a hang észlelt magasságát. ütem Az a zenei egység, amely két leginkább hangsúlyos ritmikai elem közé esik. vakfolt A retina azon része, amelyen a gyűjtősejtek idegrostjai az agy felé elhagyják a retinát. Ezen a területen nem látunk. vaklátás (blindsight) A látótérfél adott területének kiesését követően a tárgyak a tudatos észlelés hiánya ellenére befolyásolják a cselekvést, a beteg a tárgyak egyes tulajdonságaira adekvátan reagál. választásos (összetett) reakcióidő Többféle ingerre eltérő válaszokat kell adni (általában az egyes ingerkategóriákhoz rendelt különböző válaszgombok lenyomásával). valószínűségi értékelés elmélete Az észlelés során a jelzőingerek kiértékelése a korábbi tapasztalatokra épülő statisztikus, nem tudatos (implicit) ismeretek bevonásával történik. Az elmélet kidolgozója Egon Brunswick. valószínűségi változó olyan változó, amelynek értékei időben változnak, méghozzá véletlenszerűen. Az értékek sokasága a várható értékkel, illetve a szórással jellemezhető. változási vakság A vizuális mezőben bekövetkező változások detekciójának hiánya olyan esetben, amikor e változások detektálhatók lennének, ha figyelmi folyamatok irányulnának azokra a területekre, ahol változás áll be. A vizuális figyelem vizsgálatánál számos technikát alakítottak ki elemzésére, melyek között szerepelnek a figyelem elvonásával járó, terepvizsgálat jellegű eljárások és laboratóriumi módszerek. várakozási csalódás A várt és a valódi ingerminőség eltérése miatt megjelenő becslési hiba. A tárgyak súlya és a súlyt előjelző ingerminőség eltérése esetén megjelenő alulbecslés első beszámolói Egon Brunswicktól származnak. vázlat Lásd első vázlat. ventrális látópálya Az agykérgi fő látópályák egyike. Az inkább emberre jellemző vizuális percepcióhoz kötődő funkciókat látja el, ezért „percepció”-rendszernek is hívják. Elsősorban a tárgyak maradandó tulajdonságainak kódolása, emlékezeti rögzítése, a nyelvi rendszerhez való kapcsolása a feladata. vergens (ellentétes irányú) szemmozgás A két szemgolyót eltérő, egész pontosan ellentétes irányban mozgató szemmozgások. Közeli tárgyak fixációját ez a szemmozgás jellemzi. Lásd még konjunktív (egyirányú) szemmozgás. veridikus folyamat A környezet ingereinek, eseményeinek feldolgozása valósághű. versenymodell Egyidejű (szimultán) információfeldolgozási folyamatok közül a gyorsabb végeredményt eredményező folyamat határozza meg a magatartást, illetve az élmények tartalmát. vertexmeredek tranziensek Az alvás kezdeti szakaszában megj elenő és a fejtetőre lokalizálódó, spontán megjelenő vagy ingerindukált EEG-hullámok, melyek amplitúdóban (50-150 pV) kiemelkednek a háttértevékenységből, és többnyire éles formátumúak. Nevüket jellegzetes elvezetési helyükről, a fejtetőn az orrnyerget a tarkódombbal, illetve a két fül melletti bemélyedéseket összekötő vonalak kereszteződésében lévő pontról (vertex) kapták.
394 Created by XMLmind XSL-FO Converter.
Glosszárium
vezető érzékleti modalitás A környezet és az organizmus közötti információtovábbításban kiemelkedő szerepű, a többi érzékelési típusnál (modalitás) meghatározóbb érzékelési típus. Az embernél és még sok más élőlénynél ilyen a látás. Vieth-Müller-kör A két szem és a fixált pont által meghatározott kör: azon pontok mértani helye, melyek a két szemből azonos szög alatt látszanak; a horopter értelmezése a geometriai optika szerint. (A magassági szög irányában kiterjesztve tóruszfelületet alkot.) A valódi horopter a Vieth-Müller-körön (tóruszon) kívül fekszik. világosságkonstancia A színlátás azon tulajdonsága, hogy a változó megvilágítás ellenére a tárgyak világosságát (szürke, fekete, fehér) nagymértékben állandónak látjuk. virtuális hangmagasság Lásd maradványhang. viszcerocepció Lásd szervérzékelés. viszceroceptorok A zsigerekben lévő receptorok (mechano-, kemo-, termo- és nociceptorok). visszhangzási (shadowing) technika A szelektív figyelem úttörő kutatásaiban alkalmazott alapvető módszer. Dichotikus hallgatási helyzetben a résztvevők az egyik üzenetet (szöveget) folyamatosan hangosan ismétlik,ami biztosítja ennek az ingeregyüttesnek a figyelmi feldolgozását. A másik, nem figyelt üzenetről rendelkezésre álló információ tesztelésével lehetőség van a figyelmi szelekció számos jellemzőjének megismerésére. vizuális kulcs Az a fizikai paraméter, mely a tárgy és háttere közötti kontraszt alapját képezi. Weber-Fechner-féle érzetfüggvény Olyan érzetfüggvény, melyre érvényes a Weber-elv és a Fechner-elv általánosított formája is. Ebben az esetben az érzetfüggvény érzet(x) = s \og(x) + t alakú, vagyis logaritmusfüggvény. Weber-törvény Az az összefüggés, hogy a különbségi küszöb nagysága arányos annak az alapingernek a nagyságával, amelyhez képest a különbségérzékelést vizsgáljuk. Például, ha egy ingertartományon belül 10 egység erős ingerre 1 egység növekmény kell a különbség megbízható (mondjuk 75 százalékos) érzékeléséhez, akkor 100 egységnyi alapinger esetén már 10 egység növekmény kell ugyanehhez. Yerkes-Dodson-törvény A teljesítmény változását írja le az aktivitási szint függvényében. Az összefüggés „fordított U” alakú, azaz a teljesítmény mind alacsony, mind túl magas aktivitási szint esetén alacsonyabb, mint egy közbülső szinten. Az optimum függ a feladattól: egyszerű feladatoknál alacsonyabb, mint bonyolultabbaknál. zaj Összetett hang, amelynek számos alkotó frekvenciája van, és ezek kombinálódva véletlenszerű hullámformát alkotnak. zamat A táplálék élvezeti értékét adó érzet, az ízek és szagok együttese. zönge A hangszalagok által közrefogott hangrés gyors, periodikus nyitása és zárása révén létrejövő hang, amely a beszédhangok alapját képezi.
395 Created by XMLmind XSL-FO Converter.
25. fejezet - Hivatkozott irodalom Ádám, G. 1998. Visceral Perception: Essay on the Doorstep of Cognition. Plenum Press, New York. Adelson, E. H. – Bergen, J. K. 1985. Spatio-temporal energy models for the perception of motion. Journal of the Optical Society of America, 2, 284-299. Allport, D. A. – Antonis, B. – Reynolds, P. 1972. On the division of attention: A disproof of the single chan- nel hypothesis. Quarterly Journal of ExperimentalPsychology, 24, 225-235. Almeida, T. F. – Roizenblatt, S.- lufik, S. 2004. Afferent pain pathways: a neuroanatomical review. Brain Research, 12, 40-56. Amzica, F. – Steriade, M. 1995. Disconnection of intracortical synaptic linkages disrupts synchronization of a slow oscillation. Journal of Neuroscience, 15, 4658-4677. Anderson, C. – Horne, J. A. 2003. Prefrontal cortex: links between low frequency delta EEG in sleep and neuropsychological performance in healthy, older people. Psychophysiology, 40, 349-357. Anzieu, D. 1989. Theskin ego. Yale University Press, New Haven. Aserinsky, E. 1969. The maximal capacity for sleep: rapid eye movement density as an index of sleep sati- ety. Biological Psychiatry, 1, 147-159. Aserinsky, E. – Kleitman, N. 1953. Regularly occuring periods of eye motility and concomitant phenomena during sleep. Science, 118, 273-274. Atienza, M. – Cantero, J. L. – Escera, C. 2001. Auditory information processing during human sleep as revealed by event-related brain potentials. Clinical Neurophysiology, 112, 2031-2045. Bacon, W. F. – Egeth, H. E. 1994. Overriding stimulus-driven attentional capture. Perception andPsychophysics, 55, 485-496. Baddeley, A. D. – Colquhoun, W. P. 1969. Signal probability and vigilance: A reapprasial of the „signal ra- te” effect. British Journal of Psychology, 60, 165-178. Bailey, S. L. – Heitkemper, M. M. 2001. Circadian rhythmicity of cortisol and body temperature: morningness-eveningness effects. Chronobiology International, 18, 249-261. Bárdos György 2003. Pszichovegetatívkölcsönhatások. Scolar Kiadó, Budapest. Bárdos György 2006. Az élet árnyoldalai: fájdalom, öregedés, halál. Scolar Kiadó, Budapest. Bárdos György – Deák-Fogarasi Éva 2003. Megérintett, hogy megérintett. Les Nouvelles Esthétique (magyar kiadás), 2, 26. Bartels, A. – Zeki, S. 2000. The architecture of the color centre. European Journal of Neurosciences, 12, 172193. Barucha, J. – Krumhansl, C. L. 1983. The representation of harmonic structure in music: hierarchies of stability as a function of context. Cognition, 13(1), 63-102. Bastuji, H. – Perrin, F. – Garcia-Larrea, L. 2002. Semantic analysis of auditory input during sleep: studies with event related potentials. International Journal of Psychophysiology, 46, 243-255. Batteau, D. W. 1967. The role of the pinna in human localization. Proceedings of the RoyalSociety of London. Series B. Biological Sciences, 168(11), 158-180. Baumgartner, G. 1960. Indirekte Gröfienbestimmung der rezeptiven Felder der Retina beim Menschen mit- tels der Hermannschen Gittertauschung. Pflügers Archív für diegesamtePhysiologie, 272, 21-22.
396 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Baylis, G. – Rafal, R. – Driver, J. 1993. Attentional set determines extinction following parietal lesion. Journal of Cognitive Neuroscience, 5, 453-466. Baylor, D. A. – Nunn, B. J. – Schnapf, J. L. 1987. Spectral sensitivity of the cones of the monkey Macaca fascicularis. Journal of Physiology, 390, 145-160. Baylor, G. W. – Cavallero, C. 2001. Memory sources associated with REM and NREM dream reports throughout the night: a new look at the data. Sleep, 24, 165-170. Behrmann, M. – Tipper, S. P. 1994. Object-based visual attention: Evidence from unilateral neglect. In: Umilta, C. – Moscovitch, M. (Eds.): Attention and performanceXV. MIT Press, Cambridge, Mass. Békésy, G. v. 1960. Experiments in hearing. McGraw-Hill, New York. Békésy György 1978. Önéletrajzi jegyzetek. Ford.Kunfalvi Rezső. Fizikai Szemle, 28, 281-293. Bergen, J. R. – Julesz, B. 1983. Parallel versus serial processing in rapid pattern discrimination. Nature, 303, 696-698. Berlyne, D. E. 1960. Conflict, arousal and curiosity. McGraw-Hill, New York. Berti, A. – Rizzolatti, G. 1992. Visual processing without awareness: Evidence from unilateral neglect. Journal of Cognitive Neuroscience, 4, 345-351. Biederman, I. 1987. Recognition by components: a theory of human image understanding Psychological Review, 94, 115-147. Bimler, D. – Kirkland, J. – Jacobs, R. 2000. Colour-Vision Tests Considered as a Special Case of Multidimensional Scaling. Color Research and Application, 25, 160-169. Blackmore, G. B. – Nelson, K. – Trosciansko, T. 1995. Is the richness of our visual word an illusion? Transsaccadic memory for complex scenes. Perception, 24, 1075-1085. Blake, M. J. F. 1967. Time and day effects in a range of tasks. PsychonomicScience, 4, 349-350. Blakemore, C. – Campbell, F. W. 1969. Adaptation to spatial stimuli. Journal of Physiology, 200, 11-13. Blasdel, G. G. 1992. Orientation selectivity, preference, and continuity in monkey striate cortex. Journal of Neuroscience, 12, 3139-3161. Block, N. 1995. On a confusion about a question of consciousness. Behavioral andBrain Sciences, 18, 227-287. Block, N. – Flanagan, O. – Güzeldere, G. 1997. The Nature of Consciousness. The MIT Press, Cambridge, London. Blum, G. S. 1955. Perceptual defense revisited. Journal of Abnormal andSocialPsychology, 51, 24-29. Bódizs, R. – Békésy, M. – Szűcs, A. – Barsi, P. – Halász, P. 2002. Sleep-dependent hippocampal slow acti- vity correlates with waking memory performance in humans. Neurobiology of Learning and Memory, 78, 441-457. Bódizs Róbert – Csóka Szilvia 2006. Ébrenlét és alvás: módosult tudatállapotok és tudatállapot-módosulások. In: Halász Péter (szerk.): Tudat és tudatzavarok. Melinda Kiadó (in press), Budapest. Bódizs, R. – Kis, T. – Lázár, A. S. – Havrán, L. – Rigó, P. – Clemens, Z. – Halász, P. 2005. Prediction of general mental ability based on neural oscillation measures of sleep. Journal of Sleep Research, 14, 285-292. Bonnet, M. H. – Webb, W. B. 1978. The effect of repetition of relevant and irrelevant tasks over day and night work periods. Ergonomics, 21, 999-1005. Brainard, D. H. – Wandell, B. A. 1986. Analysis of the Retinex Theory of color vision. Journal of the Op- tical Society of America A, 3, 1651-1661.
397 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Bregman, A. S. 1990. Auditory scene analysis: The perceptual organization of sound. MIT Press, Cambridge, Mass. Bregman, A. S. – Campbell, J. 1971. Primary auditory stream segregation and perception of order in rapid sequences of tones. Journal of Experimental Psychology, 89(2), 244-249. Bregman, A. S. – Pinker, S. 1978. Auditory streaming and the building of timbre. Canadian Journal of Psychology, 32(1), 19-31. Bregman, A. S. – Rudnicky, A. I. 1975. Auditory segregation: Stream or streams? Journal of Experimental Psychology. Human Perception and Performance, 1(3), 263-267. Broadbent, D. E. 1958. Perception andcommunication. Pergamon Press, London. Broadbent, D. E. 1971. Decision andstress. Academic Press, London. Broadbent, D. E. 1984. The Maltese cross: A new simplistic model for memory. Behavioral and Brain Sciences, 7, 55-94. Broadbent, D. E. – Gregory, M. 1963. Vigilance considered as statistical decision. British Journal of Psychology, 54, 309-323. Bruner, J. S. 1957/2004. A perceptuális készenlétről In: Pléh Csaba – Boross Ottilia (szerk.): Bevezetés a pszichológiába. Osiris, Budapest, 236-265. Bruner, J. S. – Potter, M. C. 1964. Interference in visual recognition. Science, 144, 3617, 424-425. Brunswick, E. 1955. Representative design and probabilistic theory in a functional psychology. Psychological Review, 62, 193-217. Brunswick, E. – Herma, H. 1951. Probability learning of perceptual cues in the establishment of a weight illusion. Journal of Experimental Psychology, 41, 281-290. Brysbaert, M. – Vitu, F. 1998. Word skipping: Implications for theories of eye movement control in reading. In: Underwood, G. (Ed.): Eye guidance in reading andsceneperception. Elsevier Science, Amszterdam, 125-147. Burton, M. 1972. Semantic Dimensions of Occupation Names. In: Romney, A. K. – Shepard, R. N. – Ner- love, S. B. (Eds.): Multidimensionalscaling. Seminar Press, New York. Bülthoff, H. H. – Edelman, S. 1992. Psychophysical support for a two-dimensional view interpolation theory of object recognition. Proceedings of the National Acadademy of Science (USA), 89, 60-64. Byrne, A. 2005. Inverted Qualia. The StanfordEncyclopedia of Philosophy. Summer. Zalta, E. N. (Ed.): URL =
398 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Cheesman, J. – Merikle, P. M. 1984. Priming with and without awareness. Perception andPsychophysics, 36, 387-395. Cherry, E. C. 1953. Some experiments on the recognition of speech with one and two ears. Journal of Acoustical Society of America, 28, 975-979. Chun, M. M. – Marois, R. 2002. The dark side of visual attention. Current Opinions in Neurobiology, 12, 184189. Chun, M. M. – Potter, M. C. 1995. A two-stage model for multiple target detection in rapid serial visual presentation. Journal of Experimental Psychology: Human Perception and Performance, 21 , 109-127. Claridge, G. J. 1967. Personality and arousal: A psychophysiological study of psychotic disorders. Perga- mon Press, New York. Clark, C. R. – Geffen, G. M. – Geffen, L. B. 1989. Cathecolamines and the cover orientation of attention in humans. Neuropsychologia, 27, 131-139. Clemens, Z. – Fabó, D. – Halász, P. 2005. Overnight verbal memory retention correlates with the number of sleep spindles. Neuroscience, 132, 529-535. Clemens, Z. – Fabó, D. – Halász P. 2006. Twenty-four hours retention of visuospatial memory correlates with the number of parietal sleep spindles. NeuroscienceLetters, 403, 52-56. Cohen, A. – Ivry, R. – Rafal, R. – Kohn, C. 1995. Response code activation by stimuli in the neglected visual field. Neuropsychology, 9, 165-173. Coles, M. G. H. – Gratton, G. – Bashore, T. R. – Eriksen, C. W. – Donchin, E. 1985. A psychophysiological investigation of the continuoius flow model of human information processing. Journal of Experimental Psychology: Human Perception and Performance, 11, 529-533. Cornsweet, T. N. 1962. The staircase-method in psychophysics. American Journal of Psychology, 75, 485-491. Corteen, R. S. – Wood, B. 1972. Automatic responses to shock-associated words in an unattended channel. Journal of Experimental Psychology, 94, 308-313. Czigler István 2003a. Pszichofiziológia: Megismerés és aktiváció. Kossuth Egyetemi Kiadó, Debrecen. Czigler István 2003b. Analitikus és szintetikus figyelmi folyamatok. In: Pléh Csaba – Kovács Gyula – Gulyás Balázs (szerk.): Kognitív idegtudomány. Osiris Kiadó, Budapest, 235-254. Czigler István 2004. Tünékeny reprezentációi. In: László János – Kállai János – Bereczkei Tamás (szerk.): A reprezentáció szintjei. Gondolat Kiadó, Budapest, 11-21. Czigler István 2005. A figyelem pszichológiája. Akadémiai Kiadó, Budapest. Czigler, I. – Balázs, L. 1998. Object-related attention: an event-related potential study. Brain and Cogniti- on, 38, 113-124. Czigler, I. – Weisz, J. – Winkler, I. 2006. Repeated visual stimuli may elicit mismatch event-related poten- tial response. Neuroscience Letters (in press). Czisch, M. – Wehrle, R. – Kaufmann, C. – Wetter, T. C. – Holsboer, F. – Pollmacher, T. – Auer, D. P. 2004. Functional MRI during sleep: BOLD signal decreases and their electrophysiological correlates. Euro- pean Journal of Neuroscience, 20, 566-574. Csépe Valéria 2006. Az olvasó agy. Akadémiai Kiadó, Budapest. Csépe, V. – Karmos, G. – Molnár, M. 1987. Evoked potential correlates of stimulus deviance during wakefulness and sleep in cat – Animal model of mismatch negativity. Electroencephalography and clinical Neurophysiology, 66, 571-578.
399 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Csépe Valéria – Győri Miklós – Ragó Anett (szerk.): Általános pszichológia. 3. Nyelv és gondolkodás. Előkészületben. Daly, E. M. – Lancee, W. J. – Polivy, J. 1983. A Conical Model for the Taxonomy of Emotional Experience. Personality and Social Psychology, 45, 443-457. Davies, D. R. – Parasuraman, R. 1982. The psychology of vigilance Academic Press, London. Davis, H. – Silverman, S. R. 1960. Hearinganddeafness. Holt, Rinehart and Winston, New York. Davis, R. S. 1957. Response patterns. Transactions of the New York Academy of Sciences, Series 2, 19, 731-735. Dawson, M. E. – Schell, A. M. 1982. Electrodermal responses to attended and nonattended significant stimuli during dichotic listening. Journal of Experimental Psychology: Human Perception and Performance, 8, 315-324. De Gennaro, L. – Ferrara, M. – Vecchio, F. – Curcio, G. – Bertini, M. 2005. An electroencephalographic fingerprint of human sleep. Neuroimage, 26, 114-122. Deese, J. 1955. Some problems in the theory of vigilance. Psychological Review, 62, 359 -368. Dehaene, S. 2005. Neural correlates of switching from auditory to speech perception. NeuroImage, 24(1), 21-33. Dehaene-Lambertz, G. – Pallier, C. – Serniclaes, W. – Sprenger-Charolles, L. – Jobert, A. – DeMarco, P. – Pokorny, J. – Smith, V. C. 1992. Full-spectrum cone sensitivity functions for X-chromosome- linked anomalous trichromats. Journal of the Optical Society of America A, 9, 1465-1476. Demcsákné Kelen Ilona 1982. A pszichoszomatikus zavarok gyermek és ifjúkorban. Aesculap Medicina Könyvkiadó, Budapest. Descartes, R. 1644. L’Homme. Paris. DeSchepper, B. – Treisman, A. 1996. Visual memory for novel shapes: implicit coding without attention. Journal of Experimental Psychology: Learning, Memory and Cognition, 22, 27-42. Desimone, R. – Duncan, J. 1995. Neural mechanisms of selective visual attention. AnnualReview of Neuroscience, 18, 193-222 Desimone, R. – Gross, C. G. 1979. Visual areas in the temporal cortex of the macaque. Brain Research, 178, 363-380. Deutsch, D. 1975. Two-channel listening to musical scales. The Journal of the Acoustical Society of America, 57(5), 1156-1160. Deutsch, J. A. – Deutsch, D. 1963/1984. A figyelem: Néhány elméleti megfontolás. In: Barkóczi Ilona (szerk.): Figyelem. Szöveggyűjtemény. Tankönyvkiadó, Budapest. DeValois, R. L. – DeValois, K. K. 1997. Neural Coding of Color. In: Byrne, A – Hilbert, D. R. (Eds.): Readings on Color. Vol. 2. The Science of Color. The MIT Press, Cambridge, Mass., 93-140. Dewar, K. M. – Cuddy, L. L. – Mewhort, D. J. K. 1977. Recognition memory for single tones with and without context. Journal of Experimental Psychology: Human Learning and Memory, 3, 60-67. DeYoe, E. A. – van Essen, D. C. 1988. Concurrent processing streams in monkey visual cortex. Trends in Neurosciences, 11, 219-226. Di Lollo, V. – Bishoff, W. F. – Dixon, P. 1993. Stimulus-onset asymmetry is not necessary for motion perception or metacontrast masking. Psychological Science, 4, 260-263. Dijk, D. J. – Beersma, D. G. – Daan, S. 1987. EEG power density during nap sleep: reflection of an hourg- lass measuring the duration of prior wakefulness. Journal of BiologicalRhythms, 2, 207-219. Dixon, N. – Spitz, L. 1980. The detection of audiovisual desynchrony. Perception, 9, 719-721.
400 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Donders, F. C. 1886/1969. On the speed of mental processes. Acta Psychologica, 62, 359-368. Dowling, W. J. – Fujitani, D. S. 1971. Contour, interval, and pitch recognition in memory for melodies. Journal of the Acoustical Society of America, 49(2), Suppl. 2, 524. skk. Driver, J. – Halligan, P. W. 1991. Can visual neglect operate in object centered co-ordinates? An affirmative case study. Cognitive Neuropsychology, 8, 475-496. Duffy, E. 1932. The relationship between muscular tension and quality of performance. American Journal of Psychology, 44, 535-546. Duncan, J. 1984. Selective attention and the organization of visual information. Journal of Experimental Psychology: General, 113, 501-517. Duncan, J. – Humphreys, G. W. 1989. Visual search anv visual similarity. Psychological Review, 96, 433458. Durlach, N. I. 1963. Equalization and cancellation theory of binaural masking-level difference. Journal of the Acoustical Society of America, 35, 1206-1218. Easterbrook, J. A. 1959. The effect of emotion on cue utilization and the organization of behavior. Psychological Review, 66, 183-201. Egly, R. – Rafal, R. – Driver, J. – Starreveld, Y. 1994. Hemispheric specialization for object-based attention in a split-brain patient. Psychological Science, 5, 380-383. Eimas, P. D. – Corbit, J. D. 1973. Selective adaptation of linguistic feature detectors. Cognitive Psychology, 4(1), 99-109. Eisenberger, N. I. – Lieberman, M. D. 2004. Why rejection hurts: a common neural alarm system for physi- cal and social pain. Trends in Cognitive Sciences, 8, 294-300. Ellenbogen, J. M. – Hulbert, J. C. – Stickgold, R. – Dinges, D. F. – Thompson-Schill, S. L. 2006. Interfering with theories of sleep and memory: sleep, declarative memory, and associative interference. Current Biology, 16, 1290-1294. Elliott, R. – Bankart, B. – Light, R. 1970. Differences in the motivational significance of heart rate and pal- mar conductance: Two tests of a hypothesis. Journal of Personality and Social Psychology, 14, 166172. Eriksen, B. A. – Eriksen, C. W. 1974. Effects of noise letters upon the identification of a target letter in a nonsearch task. Perception andPsychophysics, 16, 143-149. Eriksen, C. W. 1957. Personality. AnnualReview of Psychology, 8, 185-210. Eriksen, C. W. – Schultz, D.W. 1979. Information processing in visual search: A continuous flow concep- tion and experimental results. Perception and Psychophysics, 25, 249-263. Eriksen, C. W. – St. James, J. D. 1986. Visual attention within and around the field of focal attention: A zoom lens model. Perception and Psychophysics, 40, 225 -240. Eysenck, M. W. 1982. Attention andarousal Springer, Berlin. Farah, M. J. – Brunn, J. L. – Wong, A. B. – Wallace, M. A. – Carpenter, P. A. 1990. Frames of reference for allocating attention to space: evidence from neglect syndrome. Neuropsychologia, 28, 335-347. Fernandez-Duque, D. – Thornton, I. M. 2003. Explicit mechanisms do not account of implicit localization and identification of change: An empirical replay to Mitroff et al. (2002). Journal of Experimental Psychology: Human Perception and Performance, 29, 846-858. Field, T. 2003. Les bienfaits du toucher. Éditions Payot & Rivages, Paris. Field, T. M. 1998. Massage therapy effects. American Psychologist, 53, 1270-1281.
401 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Finelli, L. A. – Achermann, P. – Borbély, A. A. 2001. Individual ’fingerprints’ in human sleep EEG topography. Neuropsychopharmacology, 25, S57-S62. Fletcher, H. 1940. Auditory patterns. Reviews of Modern Physics, 12, 47-65. Fodor, J. 1983. Modularity of Mind. MIT Press, Cambridge, Boston, Mass. Folk, C. L. – Remington, R. W. – Johnston, J. C. 1992. Involuntary covert orienting is contigent on attentio- nal control settings. Journal of Experimental Psychology: Human Perception and Performance, 18, 1030-1044. Folkard, S. – Knauth, P. – Monk, T. L. – Rutefranz, J. 1976. The effect of memory load on the circadian variation performance efficiency under rapidly rotating shift system. Ergonomics, 19, 479-488. Fonyó Attila 1999. Az orvosi élettan tankönyve. Medicina, Budapest. Fosse, M. J. – Fosse, R. – Hobson, J. A. – Stickgold, R. J. 2003. Dreaming and episodic memory: a functio- nal dissociation? Journal of Cognitive Neuroscience, 15, 1-9. Fraisse, P. 1963. The psychology of time Harper, New York. Fraisse, P. 1982. Rhythm and tempo. In: Deutsch, D. (Ed.): The psychology of music Academic Press, New York, 149-180. Freud, S. 1900/1986. Alomfejtés. Helikon, Budapest. Freud, S. 1901/1958. A mindennapi életpszichopatológiája. 3. kiadás, Bibliotheka, Budapest. Fujisaki, H. – Kawashima, T. 1971. A model of the mechanisms for speech perception – quantitative analysis of categorical effects in discrimination. Annual Report of the Engineering Research Institute, Fa- culty of Engineering, University of Tokyo, 30, 59-68. Fujita, I. 2002. The inferior temporal cortex: Architecture, computation, and representation. Journal of Neurocytology, 31, 359-371. Gage, J. 1993. Colour and Culture: practice andmeaning from antiquity to abstraction. Thames and Hud- son, London. Gais, S. – Lucas, B. – Born, J. 2006. Sleep after learning aids memory recall. Learning and Memory, 13, 259262. Gale, C. – Martyn, C. 1998. Larks and owls and health, wealth, and wisdom. British Medical Journal, 317, 1675-1677. Gallon, R. L. (Ed.) 1982. The Psychosomatic Approach to Illness. Elsevier Biomedical, New York, 177194. Geier, J. – Séra, L. – Bernáth, L. 2004. Stopping the Hermann grid illusion by simple sine distortion.ECVP 2004, abstract. Gibson, E. J. 1969. Principles of perceptual learning and development. Houghton Mifflin Company, Boston. Gibson, J. J. 1979. The ecological approach to visual perceptions. Houghton Mifflin, Boston. Gilchrist, A. – Kossyfidis, C. – Bonato, F. – Agostini, T. – Cataliotti, J. – Li, X. – Spehar, B. – Annan, V. – Economou, E. 1999. An Anchoring Theory of Lightness Perception. Psychological Review, 106, 795834. Glaser, W. R. – Glaser, M. O. 1989. Context effects in Stroop-like word and picture-processing. Journal of Experimental Psychology: General, 118, 14-42. Goldman-Rakic, P. S. – Chafee, M. – Friedman, H. 1993. Allocation of function in distributed circuits. In: Ono, T. – Squire, L. R. – Raichle, M. E. – Perrett, D. I. – Fukuda, M. (Eds.): Brain mechanisms of perception and memory: from neuron to behavior. Oxford University Press, New York, 187-201.
402 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Goldstein, J. L. 1973. An optimum processor theory for the central formation of the pitch of complex tones. The Journal of the Acoustical Society of America, 54(6), 1496-1516. Goodale, M. A. 2001. Different spaces and different times for perception and action. Progress in Brain Research, 134, 313-331. Goodale, M. A. – Milner, A. D. 1992. Separate visual pathways forperception and action. Trends in Neuroscieces, 15, 20-25. Gósy Mária 2004. Fonetika, a beszéd tudománya. Osiris, Budapest. Gósy Mária 2005. Pszicholingvisztika. Osiris, Budapest. Gottselig, J. M. – Hofer-Tinguely, G. – Borbély, A. A. – Regel, S. J. – Landolt, H. P. – Rétey, J. V. – Achermann, P. 2004. Sleep and rest facilitate auditory learning. Neuroscience, 127, 557-561. Grastyán Endre 1983. Az érték neurobiológiai megközelítése. Kézirat, 31. Green, D. M. – Swets, J. A. 1966. Signal detection theory andpsychophysics. John Wiley & Sons, New York. Greenberg, S. – Arai, T. 2001. The relation between speech intelligibilty and the complex modulation syts- tem. Proceedings of the 7th European Conference on Speech Communication and Technology. Aal- borg. Gregory, R. L. 1973/2004. A megtévesztett szem. In: Pléh Csaba – Boross Ottilia (szerk.): Bevezetés a pszichológiába. Osiris, Budapest, 193-235. Grenier, J. – Cappeliez, P. – St-Onge, M. – Vachon, J. – Vinette, S. – Roussy, F. – Mercier, P. – Lortie-Lussier, M. – de Koninck, J. 2005. Temporal references in dreams and autobiographical memory. Memory and Cognition, 33, 280-288. Grey, J. A. – Wedderburn, A. A. 1960. Grouping strategies with simultaneous stimuli. Quarterly Journal of Experimental Psychology, 12, 180-184. Gross, C. G. – Rocha-Miranda, C. E. – Bender, D. B. 1972. Visual properties of neurons in inferotemporal cortex of the macaque. Journal of Neurophysiology, 35, 96-111. Haenny, P. E. – Maunsell, J. H. R. – Schiller, P. 1988. State dependent activity in monkey visual cortex: II. Retinal and extraretinal factors in V4. Experimental Brain Research, 69, 245-259. Halász, P. 1993. Arousals without awakening—dynamic aspect of sleep. Physiology and Behavior, 54, 795-802. Halász, P. – Terzano, M. – Parrino, L. – Bódizs, R. 2004. The nature of arousal in sleep. Journal of Sleep Research, 13, 1-23. Hall, J. A. – Kimura, D. 1993. Homosexuality and circadian rhythms. Neuropsychopharmacology, 9, 126. Hanson, D. R. – Fearn, R. W. 1975. Hearing acuity in young people exposed to pop music and other noise. Lancet, 2(7927), 203-205. Hardin, C. L. 1995. Color Subjectivism. In: Goldman, A. (Ed.): Readings in Philosophy and Cognitive Science. The MIT Press, Cambridge, Mass., 493-507. Harlow, H. F. 1958. The nature of love. American Psychologist, 13, 673-685. Harmon, L. D. – Julesz, B. 1973. Masking in visual recognition: Effects of two-dimensional filtered noise. Science, 180, 1194-1197. Hasher, L. – Zacks, R. T. 1979. Automatic and effortful processes in memory. Journal of Experimental Psychology: General, 108, 356-388. Hayashi, M. – Morikawa, T. – Hori, T. 2002. Circasemidian 12 h cycle of slow wave sleep under constant darkness. Clinical Neurophysiology, 113, 1505-1516.
403 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Head, H. 1920. Studies in Neurology. Oxford University Press, London. Helmholtz, H. L. F. von 1911. Physiological Optics. 3rd ed. Vol. 2. Ed. Southall, J. P. C. Optical Society of America, Rochester, 1924. Újranyomtatva: Dover, New York, 1962. Helmholtz, H. L. F. von 1954. On the sensations of tone as a psychological basis for the theory of music. Dover New York. Henning, H. 1916. Der Geruch. Barth, Leipzig. Hering, E. 1920. Grundzüge der Lehre vom Lichstinn. Springer, Berlin. Hermann Imre 1984. Az ember ősi ösztönei. Magvető Kiadó, Budapest. Hermann, L. 1870. Eine Erscheinung simultanen Contrastes. Pflügers Archivfür die gesamte Physiologie, 3, 1315. Hess, R. F. – Hayes, A. – Field, D. J. 2003. Contour integration and cortical processing. Journal of Physiology, 97, 105-119. Hillstrom, A. P. – Yantis, S. 1994. Visual motion and attentional capture. Perception and Psychophysics, 55, 399-411. Hillyard, S. A. – Hink, R. F. – Schwent, W. L. – Picton, T. T. 1973. Electrical signs of selective attention in the human brain. Science, 182, 177-180. Hobson, J. A. – Pace-Schott, E. F. – Stickgold, R. 2000. Dreaming and the brain: toward a cognitive neuroscience of conscious states. Behavioral and Brain Sciences, 23, 793-842. Hofman, P. M. – Van Riswick, J. G. – Van Opstal, A. J. 1998. Relearning sound localization with new ears. Nature Neuroscience, 1(5), 417-421. Horne, J. A. 1993. Human sleep, sleep loss and behaviour. Implications for the prefrontal cortex and psychiatric disorder. British Journal of Psychiatry, 162, 413-419. Horne, J. A. – Brass, C. G. – Pettitt, A. N. 1980. Circadian performance differences between morning and evening types. Ergonomics, 23, 29-36. Horne, J. A. – Osterberg, O. 1977. Individual differences in human circadian rhythms. Biological Psychology, 5, 179-190. Horváth, J. – Czigler, I. – Sussman, E. -Winkler, I. 2001. Simultaneously active pre-attentiva representa- tions of local and global rules for sound sequences in the human brain. Cognitive Brain Research, 12, 131-144. Houtgast, T. 1976. Subharmonic pitches of a pure tone at low S/N ratio. The Journal of the Acoustical Society of America, 60(2), 405-409. Houtsma, A. – Goldstein, J. 1972. The central origin of the pitch of complex tones: Evidence from musical interval recognition. The Journal of the Acoustical Society of America, 51, 520-529. Howard, I. P. – Templeton, W. B. 1966. Human spatial orientation. Wiley, London. Hubel, D. H. – Wiesel, T. N. 1959. Receptive fields of single neurones in the cat’s striate cortex. Journal of Physiology, 148, 574-591. Hubel, D. H. – Wiesel, T. N. 1968. Receptive fields and functional architecture of monkey striate cortex. Journal of Physiology, 195, 215-243. Huber, R. – Ghilardi, M. F. – Massimini, M. – Tononi, G. 2004. Local sleep and learning. Nature, 430, 78-81. Hull, C. L. 1943. Principles of behavior. Appleton, New York.
404 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Humphreys, L. F. 1939. Generalization as a function of method of reinforcement. Journal of Experimental Psychology, 25, 361-372. Hunt, R. G. W. 1982. A model of colour vision for predicting colour appearance. Color Research and Application, 7, 95-112. Huron, D. 1998. An Ear for Music: A Course in Psychomusicology. Columbus, OH. Hurvich, L. M. 1969. Hering and the scientific establishment. American Psychologist, 24, 497-514. Hurvich, L. M. 1981. Color Vision. Sinauer Associates, Sunderland, Mass. Hurvich, L. M. – Jameson, D. 1955. Some quantitative aspects of an opponent-colors theory. II. Brightness, saturation, and hue in normal and dichromatic vision. Journal of the Optical Society of America, 45, 602-616. Idzikowski, C. 1984. Sleep and memory. British Journal of Psychology, 75, 439-449. ISO 26:2003. Acoustics – Normal equal-loudness-level contours (ISO Standard). Izmailov, C. A. – Sokolov, E. N. 1991. Spherical model of color and brightness discrimination. Psychologi- cal Science, 2(4), 249-259. Jackendoff, R. – Lerdahl, F. 2006. The capacity for music: what is it, and what’ s special about it? Cognition, 100(1), 33-72. Jakab, Z. 2000. Ineffability of qualia: a straightforward naturalistic explanation. Consciousness and Cognition, 9(3), 329-351 James, W. 1890. The principles of psychology. Henry Holt, New York. Jameson, D. – Hurvich, L. M. 1955. Some quantitative aspects of an opponent-colors theory: I. Chromatic responses and spectral saturation. Journal of the Optical Society of America, 45, 546-552. Jameson, D. – Hurvich, L. M. 1968. Opponent-response functions related to measured cone photopigments. Journal of the Optical Society of America, 58, 429-430. Jameson, K. – D’Andrade, R. 1997. It’s not really red, green, yellow, blue: an inquiry into perceptual color space. In: Hardin, C. L. – Maffi, L. (Eds.): Color categories in thought andlanguage. Cambridge Uni- versity Press, Cambridge, 295-319. Jameson, K. A. – Highnote, S. M. – Wasserman, L. M. 2001. Richer color experience in observers with multiple photopigment opsin genes. Psychonomic Bulletin & Review, 8(2), 244-261. Jeffress, L. A. 1948. A place theory of sound localization. Journal of Comparative andPhysiological Psychology, 41, 35-39. Jenkins, J. G. – Dallenbach, K. M. 1924. Obliviscence during sleep and waking. American Journal of Psychology, 35, 605-612. Johansson, G. 1973. Visual perception of biological motion and a model for its analysis. Perception & Psychophysics, 14, 201-211. Johnson, J. C. – Yantis, S. 1992. Failure to process unattended objects: The search for boundary conditions. Bulletin of the Psychonomic Society, 28, 525-527. Johnston, W. A. – Dark, V. J. 1982. In defense of intraperceptual theories of attention. Journal of Experimental Psychology: Human Perception and Performance, 8, 407 -421. Jonides, J. 1981. Voluntary versus automatic control over the mind’s eye’s movement. In: Long, J. B. – Baddeley, A. D. (Eds.): Attention and Performance IX. Erlbaum, Hillsdale, 243-265. Jordan, G. – Mollon, J. D. 1993. A study of women heterozygous for color deficiencies. Vision Research, 33, 1495-1508. 405 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Kahneman, D. 1973. Attention andeffort Prentice Hall, New York. Kahneman, D. – Chajczyk, D. 1983. Tests of the automaticity of reading: Dilution of Stroop effects by col- orirrelevant stimuli. Journal of Experimental Psychology: Human Perception and Performance, 9, 497–509. Kahneman, D. – Treisman, A. M. – Gibbs, B. 1992. The reviewing of object files: Object-specific integ- ration of information. Cognitive Psychology, 24, 175-219. Kakigi, R. – Naka, D. – Okusa, T. – Wang, X. – Inui, K. – Qiu, Y. – Tran, T. D. – Miki, K. – Tamura, Y. – Nguyen, T. B. – Watanabe, S. – Hoshiyama, M. 2003. Sensory perception during sleep in humans: a magnetoencephalograhic study. Sleep Medicine, 4, 493-507. Kanizsa, G. 1976. Subjective contours. Scientific American, 234, 48-52. Kardos Lajos 1970. Általános pszichológia. Tankönyvkiadó, Budapest. Katz, D. 1989. The world of touch. Lawrence Erlbaum, New York. Kausler, D. H. – Trapp, E. O. – Brewer, C. L. 1959. Intentional and incidental learning under high and low emotional drive levels. Journal of Experimental Psychology, 58, 452 -455. Kavanau, J. L. 1997. Origin and evolution of sleep: roles of vision and endothermy. Brain Research Bulletin, 42, 245-264. Klatt, D. H. 1979. Speech perception: A model of acoustic-phonetic analysis and lexical access. Journal of Phonetics, 7, 279-312. Kleitman, N. 1963. Sleep andwakefulness. Chicago University Press, Chicago. Koelsch, S. – Siebel, W. A. 2005. Towards a neural basis of music perception. Trends in Cognitive Sciences, 9(12), 578-584. Kovács, G. – Sáry, G. – Köteles, K. – Chadaide, Z. – Tompa, T. – Vogels, R. – Benedek, G. 2003. Effects of surface cues on the macaque inferior temporal cortical responses. Cerebral Cortex, 13, 1047-3211. Kovács, G. – Vogels, R. – Orban, G. A. 1995. Selectivity of macaque inferior temporal neurons for partially occluded shapes. Journal of Neuroscience, 15, 1984-1997. Kovács, I. 1996. Gestalten of today: Early processing of visual contours and surfaces (a review). Behaviou- ral Brain Research, 82(1), 1-11. Kovács, I. 1996. Gestalten of today: Early processing of visual contours and surfaces. Behavioural Brain Research, 82, 1-11. Kovács, I. – Julesz, B. 1993. A closed curve is much more than an incomplete one: Effect of closure in figu- reground segmentation. Proceedings of the National Acadademy of Science (USA), 90, 7495-7497. Kovács, I. -Julesz, B. 1994. Perceptual sensitivity maps within globally defined visual shapes. Nature, 370, 644646. Kramer, A. F. – Hahn, S. 1995. Splitting the beam: distribution of attention over noncontiguous regions of the visual field. Psychological Science, 6, 381-386. Krueger, J. M. – Obál, F., Jr. 2003. Sleep function. Frontiers in Biosciences, 8, d511-d519. Krumhansl, C. L. 2000. Rhythm and pitch in music cognition. Psychological Bulletin, 126(1), 159-179. Krumhansl, C. L. – Keil, F. C. 1982. Acquisition of the hierarchy of tonal functions in music. Memory and Cognition, 10(3), 243-251. Krumhansl, C. L. – Kessler, E. J. 1982. Tracing the dynamic changes in perceived tonal organization in a spatial representation of musical keys. Psychological Review, 89(4), 334-368.
406 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Krumhansl, C. L. – Shepard, R. N. 1979. Quantification of the hierarchy of tonal functions within a diatonic context. Journal of Experimental Psychology: Human Perception and Performance, 5(4), 579-594. KSH 2003. Morbiditási adattár. Kuffler, S. 1952. Neurons in the retina: organization, inhibiton and excitation problems. Cold Spring Harb. Symp. qant Biology, 17, 281-292. Kuhl, P. K. 1991. Human adults and human infants show a „perceptual magnet effect” for the prototypes of speech categories, monkeys do not. Perception & Psychophysics, 50, 93-107. Kuhl, P. K. – Miller, J. D. 1975. Speech perception by the chinchilla: Voiced-voiceless distinction in alveo- lar plosive consonants. Science, 190(4209), 69-72. LaBerge, D. 1983. The spatial extent of attention to letters and words. Journal of Experimental Psychology: Human Perception and Performance, 9, 371-379. LaBerge, D. 1995. Attentionalprocessing. Harvard University Press. LaBerge, D. – Brown, V. 1989. Theory of attention operations in shape identification. Psychological Review, 96, 101-124. LaBerge, D. – Buchsbaum, M. S. 1990. Positron emission tomographic measurements of pulvinar activity during attention task. Journal of Neuroscience, 10, 613-619. Lacey, J. I. 1967. Some response patterning and stress: Some revisions of activation theory. In: Appley, M. H. – Trimbull, R. (Eds.): Psychological stress. Appleton-Century-Crofts, New York. Lamme, V. A. 1995. The neurophysiology of figure-ground segregation in primary visual cortex. Journal of Neurosciences, 15, 1605-1615. Lavie, N. 1995. Perceptual load as a necessary condition for selective attention. Journal of Experimental Psychology: Human Perception and Performance, 21, 451-468. Lavie, N. – De Fockert, J. 2005. The role of working memory in attentional capture. Psychonomic Bulletin and Review, 12, 669-674. Lee, T. S. – Nguyen, M. 2001. Dynamics of subjective contour formation in the early visual cortex. Proceedings of the National Acadademy of Science (USA), 98, 1907-1911. Levine, J. M. – Romashko, T. – Fleishman, E. A. 1971. Evaluation of an abilities classification system for integrating and generalizing human performance research findings: An application of vigilance tasks. Journal of Applied Psychology, 58, 149 -157. Levitin, D. J. – Rogers, S. E. 2005. Absolute pitch: perception, coding, and controversies. Trends in Cognitive Sciences, 9(1), 26-33. Lewis, J. L. 1970. Semantic processing of unattended message using dichotic listening. Journal of Experimental Psychology, 85, 225-228. Liberman, A. M. – Cooper, F. S. – Shankweiler, D. P. – Studdert-Kennedy, M. 1967. Perception of the speech code. Psychological Review, 74(6), 431-461. Liberman, A. M. – Delattre, P. C. – Cooper, F. S. – Gerstman, L. J. 1954. The role of consonant-vowel transitions in the perception of stop and nasal consonants. Psychological Monographs, 68(8). Liberman, A. M. – Harris, K. S. – Hoffman, H. S. – Griffith, B. C. 1957. The discrimination of speech so- unds within and across phoneme boundaries. Journal of Experimental Psychology, 54(5), 358-368. Liberman, A. M. – Mattingly, I. G. 1985. The motor theory of speech perception revised. Cognition, 21, 1-36. Liberman, I. Y. – Shankweiler, D. – Fischer, F. W. – Carter, B. 1974. Explicit syllable and phoneme segmentation in the young child. Journal of Experimental ChildPsychology, 18(2), 201-212. 407 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Liberman, M. C. 1978. Auditory-nerve response from cats raised in a low-noise chamber. The Journal of the Acoustical Society of America, 63(2), 442-455. Liberman, M. C. 1982. The cochlear frequency map for the cat: Labeling auditory-nerve fibers of known characteristic frequency. The Journal of the Acoustical Society of America, 72(5), 1441-1449. Lindsley, D. B. 1960. Attention, consciousness, sleep and wakefulness. In: Field, J. (Ed.): Handbook of Physiology. Sect. 1, Vol. 3. American Physiological Society, Washington, 1553-1594. Livingstone, M. – Hubel, D. 1988. Segregation of form, color, movement, and depth: Anatomy, physiology, and perception. Science, 240, 740-749. Locke, S. – Kellar, L. 1973. Categorical perception in a non-linguistic mode. Cortex; A JournalDevotedto the Study of the Nervous System and Behavior, 9(4), 355-369. Lotto, B. R. – Purves, D. 2000. An empirical explanation of color contrast. Proceedings of the National Academy of Sciences, 97, 12834-12839. Luck, S. J. – Hillyard, S. A. – Moulouma, M. – Woldorff M. G. – Clark, V. P. – Hawkins, H. L. 1994. Ef- fects of spatial cuing on luminance detectability: Psychophysical and electrophysiological evidence for early selection. Journal of Experimental Psychology: Human Perception and Performance, 21, 887904. MacAdam, D. L. 1942. Visual sensitivities to color differences in daylight. Journal of the Optical Society of America, 32, 247-274. MacIntosh, S. P. 1961. Perceptibility of emotional and nonemotional stimuli with a forced-choice method. Dissertation Abstracts, 21, 2784-2785. Mack, A. – Rock, I. 1998. Inattentionalblindness. MIT Press, Cambridge, Mass. MacKay, D. 1973. Aspects of the theory of comprehension, memory and attention. Quarterly Journal of Experimental Psychology, 25, 22-40. Mackworth, J. F. 1969. Vigilance and habituation: A neuropsychological approach. Hammondsworth, Penguin, Mackworth, J. F. 1970. Vigilance and attention: A signal detection approach. Penguin, Hammondsworth. MacLeod, P. 1991. Half a century of research on the Strop effect: An integrative review. Psychological Bulletin, 109, 163-203. Malach, R. -Levy, I. – Hasson, U. 2002. The topography of high-order human object areas. Trends in Cognitive Science, 6, 176-184. Maloney, L. T. 1986. Evaluation of linear models of surface spectral reflectance with small numbers of parameters. Journal of the Optical Society of America A, 3(10), 1673-1683. Maloney, L. T. 2002. Illuminant estimation as cue combination. Journal of Vision, 2, 493-504. Maloney, L. T. 2003. Surface Color Perception and Environmental Constraints. In: Maloney, L. T. – Wan- dell, B. A. 1986. Color constancy: a method for recovering surface reflectance. Journal of the Optical Society of America A, 3, 29-33. Mausfeld, R. – Heyer, D. (Eds.) 2003. Colour Vision: FromLight to Object. Oxford University Press, Ox- ford. Maltzman, I. 1979. Orienting reflex and significance: A replay to O’gorman. Psychophysiology, 16, 274382. Mangouon, G. R. – Hillyard, S. A. 1988. Spatial gradients of visual attention: Behavioral and electrophysilogical evidence. Electroencephalography and Clinical Neurophysiology, 70, 417-428. Mangouon, G. R. – Hillyard, S. A. – Luck, S. J. 1993. Electrocortical subtrates of visual selective attention. In: Meyer, D. E. – Kornblum, S. (Eds.): Attention and PerformanceXIV. MIT Press, Cambridge, Mass.
408 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Marcel, A. J. 1983. Conscious and unconscious percxeption: Experiments on visual masking and word recognition. Cognitive Psychology, 15, 197-237. Markela-Lerenc, J. – Ille, N. – Kaiser, S. 2004. Prefrontal-cingulate activation during executive control: which comes first? Cognitive Brain Research, 18, 278-287. Marr, D. 1982. Visio. Freeman, San Francisco. Marr, D. – Nishihara, H. K. 1978. Representation and recognition of the spatial organization of three dimensional structure. Proceedings of the Royal Society London, Ser. B 200, 269-294. Marshall, J. C. – Halligan, P. W. 1988. Blindsight and insight in visuo-spatial neglect. Nature, 336, 766767. Marton L. Magda 1975. A tanulás szerepe az emberi észlelésben. In: Marton L. Magda (szerk.): A tanulás szerepe az emberi észlelésben. Gondolat, Budapest, 5-41. Marton Magda – Szirtes József – Breuer Péter 1984. A környezet valószínűségi értékelése és az átlagolt agyi potenciál II. Valószínűség-becslés és a lambda válaszok késői összetevői. Pszichológia, 4, 21-47. Massaro, D. W. 1998. Perceiving talking faces: From speech perception to a behavioralpriciple. MIT Press, Cambridge, Mass. Massaro, D. W. 2004. From multisensory integration to talking heads and language learning. In: Calvert, G. A. – Spence, C. – Stein, B. E. (Eds.): The handbook of multisnesoryprocesses. MIT Press, Cambridge, Mass., 153188. Matin, E. 1974. Saccadic suppression: A review and analysis. PyschologicalBulletin, 81, 899-917. McCarthy, G. – Donchin, E. 1981. A metric of thougt: A comparison of P300 latency and reaction time. Science, 211, 77-80. McGurk, H. – MacDonald, J. 1976. Hearing lips and seeing voices. Nature, 264, 746-748. Meltzoff, A. – Moore, M. K. 1997. Explaining facial imitation: a theoretical model. Early Development and Parenting, 6, 179-192. Melzack, R. 1977. A fájdalom rejtélye. Gondolat, Budapest. Melzak, R. – Torgerson, W. S. 1971. On the language of pain. Anesthesiology, 34, 50-59. Mérő László 1986. A többdimenziós skálázás alapelvei. Pszichológia, 399-433. Mérő László 1987. A pszichológiai skálázás matematikai alapjai. Tankönyvkiadó, Budapest. Merskey, H. 1975. Psychological aspects of pain. In: Weisenberg, M.: Pain. Clinical and Experimental Perspectives. C.V. Mosby, Saint Louis. Metzinger, T. (Ed.) 1995. ConsciousExperience. Imprint Academic, Schöningh. Milham, M. P. – Banich, M. T. – Webb, A. – Barad, V. – Cohen, N. J. – Wszalek, T. – Kramer, A. F. 2001. The relative involvement of anterior cingulated and prefrontal cortex in attentional control depends on nature of conflict. Cognitive Brain Research, 12, 467-473. Miller, D. L. 1997. Beyond the elements: investigations of hue. In: Hardin, C. L. – Maffi, L. (Eds.): Color categories in thought and language. Cambridge University Press, Cambridge, 151-162. Miller, J. 1982. Discrete versus continuous state models of human information processing: In search for par- tial output. Journal of Experimental Psychology: Human Perception and Performance, 8, 273-296. Mishkin, M. – Ungerleider, L. – Macko, K. A. 1983. Object vision and spatial vision: two cortical pathways. Trends in Neurosciences, 6, 414-417. Mollon, J. – Jordan, G. 1997. On the nature of unique hues. In: Dickinson, C. – Murray, I. – Carden, D. (Eds.): John Dalton’s colour vision legacy. Taylor and Francis, London, 381-392. 409 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Mollon, J. D. 2000. Cherries among the Leaves: The Evolutionary Origins of Color Vision. In: Davis, S. (Ed ): Color Perception: Philosophical, Psychological, Artistic and Computational Perspectives. Oxford University Press, New York, Oxford, 10-30. Mollon, J. D. 2003. Thomas Young and the trichromatic theory of color vision. In: Mollon, J. D. – Pokorny, J. – Knoblauch, K. (Eds.): Normal andDefective Colour Vision. Oxford University Press, Oxford, UK. Monk, T. H. – Buysse, D. J. – Potts, J. M. – DeGrazia, J. M. – Kupfer, D. J. 2004. Morningness-eveningness and lifestyle regularity. Chronobiology International, 21, 435-443. Montagu, A. 1971. Touching: The human significance of the skin. Columbia Univ. Press, New York. Montagu, A. 1979. Lapeau et le toucher. Édition du Seuil, Paris. Moog, H. 1976. The development of musical experience in children of pre-school age. Psychology of Mu- sic, 4(2), 38-45. Moore, B. C. J. 1997. An introduction to the psychology of hearing. 4th ed. Academic Press, San Diego. Moore, B. C. – Raab, D. H. 1974. Pure-tone intensity discrimination: Some experiments relating to the „near-miss” to Weber’s law. The Journal of the Acoustical Society of America, 55(5), 1049-1054. Moore, B. C. – Rosen, S. M. 1979. Tune recognition with reduced pitch and interval information. The Quar- terly Journal of Experimental Psychology, 31(2), 229-240. Morais, J. – Cary, L. – Alegria, J. – Bertelson, P. 1979. Does awareness of speech as a sequence of phones arise spontaneously? Cognition, 7(4), 323-331. Moran, J. – Desimone, R. 1985. Selective attention gates visual processing in the extrastriate cortex. Scien- ce, 229, 782-784. Morey, N. 1959. Attention in dichotic listening: Affective cues and the influence of instruction. Quarterly Journal of Experimental Psychology, 11, 56-60. Moruzzi, G. – Magoun, H. W. 1949. Brain stem reticular formation and activation of the EEG. Electroencephalography and ClinicalNeurophysiology, 1, 455-473. Most, S. B. – Scholl, B. J. – Clifford, E. R. – Simons, D. J. 2005. What you see is what you set: sustained inattentional blindness and the capture of awareness. Psychological Review, 112, 217-242. Movshon, J. A. – Adelson, E. H. – Gizzi, M. S. – Newsome, W. T. 1985. The analysis of movingvisual patterns. In: Chagas, C. – Gattas, R. – Gross, C. (Eds.): Pattern recognition mechanisms. Springer-Verlag, New York, 117-151. Naatanen, R. – Gaillard, A. W. K. – Mamtysalo, S. 1978. Early selective attention effect in evoked potential reinterpreted. Acta Psychologica, 42, 313-329. Nagy, A. L. – MacLeod, D. I. A. – Heynemann, N. E. – Eisner, A. 1981. Four cone pigments in women heterozygous for color deficiency. Journal of the Optical Society of America, 71(6), 719-722. Nakayama, K. – Mackeben, M. 1989. Sustained and transient components of focal visual attention. Vision Research, 29, 1631-1647. Natale, V. – Adan, A. – Chotai, J. 2002. Further results on the association between morningness-evening- ness preference and the season of birth in human adults. Neuropsychobiology, 46, 209-214. Natale, V. – Alzani, A. – Cicogna, P. C. 2003. Cognitive efficiency and circadian typologies: a diurnal study. Personality andIndividualDifferences, 35, 1089-1105. Natale, V. – Danesi, E. 2002. Gender and circadian typology. Biological Rhythm Research, 33, 261-269. Navon, D. 1977. Forest before trees: the precedence of global features in visual perception. Cognitive Psychology, 9, 353-383. Neisser, U. 1967. Cognitive Psychology. Appleton-Century-Crofts, New York.
410 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Neisser, U. 1976. Cognition and Reality: Principles and Implications of Cognitive Psychology. W. H. Fre- eman & Co, San Francisco. Neisser, U. 1979. The control of information pickup in selective looking. In: Pick, A. D. (Ed.): Perception and its development: A tribute to Eleanor J. Gibson. Erlbaum, Hillsdale, NJ, 201-219. Neisser, U. 1984. Megismerés és valóság. Gondolat, Budapest. Newstead, S. E. – Dennis, I. 1979. Lexical and grammatical processing of unshadowed message: A re-examination of the Mackay effect. Quarterly Journal of Experimental Psychology, 31, 477-488. Nielsen, T. A. 2000. A review of mentation in REM and NREM sleep: „covert” REM sleep as a possible reconciliation of two opposing models. Behavioral and Brain Sciences, 23, 851-866. Nielsen, T. A. 2004. Chronobiological features of dream production. Sleep MedicineReviews, 8, 403-424. Nielsen, T. A. – Stenstrom, P. 2005. What are the memory sources of dreaming? Nature, 437, 1286-1289. Nisbett, R. – Wilson, T. 1977. Telling more than we can know. Psychological Review, 84, 231-259. Nordby, K, 1990. Vision in a complete achromat: a personal account. In: Hess, R. F. – Sharpe, L. T. – Nord- by, K. (Eds.): Night Vision: Basic, clinical and applied aspects. Cambridge University Press, 290-315. Norman, D. A. 1968. Toward a theory of memory and attention. Psychological Review, 75, 522-536. Norman, D. A. – Bobrow, D. G. 1975. On data-limited and resource-limited processes. Cognitive Psycho- logy, 7, 44-64. Norwich, K. H. 1993. Information, Sensation and Perception. Academic Press, San Diego, London. O’Regan, J. K. 1992. Solving the ’Real’ mysteries of visual perception: The word as an outside memory. Canadian Journal of Psychology, 46, 461-488. O’Regan, J. K. – Noe, A. 2001. A sensorimotor account of vision and visual consciousness. Behavioral and Brain Sciences, 24, 939-967. O’Regan, J. K. – Rensink, R. – Clark, J. J. 1996. „Mud splashes” render pictire changes invisible. Investiga- tive Ophthalomology and Visual Science, 37, S213. Obrist, P. A. – Webb, D. M. – Sutterer, J. R. – Howard, J. L. 1970. Cardiac deceleration and reaction time: an evaluation of two hypotheses. Psychophysiology, 6, 696-706. Öhman, A. 1979. The orienting response, attention and learning: An information-processing perspective. In: Kimmel, H. D. – van Olst, E. H. – Orlebeke, J. F. (Eds.): The orienting reflex in humans. Erlbaum, Hillsdale, NJ, 443-471. Pace-Schott, E. F. – Hobson, J. A. 2002. The neurobiology of sleep: genetics, cellular physiology and subcortical networks. NatureReviews Neuroscience, 3, 591-605. Palagini, L.- Gemignani, A. – Feinberg, I. – Guazzelli, M. – Campbell, I. G. 2004. Mental activity after early afternoon nap awakenings in healthy subjects. Brain Research Bulletin, 63, 361-368. Palmer, A. R. – Evans, E. F. 1979. On the peripheral coding of the level of individual frequency components of complex sounds at high sound levels. In: Creutzfeldt, U. – Schreich, H. – Schreiner, C. (Eds.): Hea- ring mechanisms and speech. Springer-Verlag, Berlin. Palmeri, T. J. – Gauthier, I. 2004. Visual object understanding. Nature Reviews Neuroscience, 5, 1-13. Pap János 2002. Hang, ember, hang. Vince Kiadó, Budapest. Parasuraman, R. 1979. Memory load and event rate control sensitivity decrements in sustained attention. Science, 205, 924-927.
411 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Pashler, H. E. 1998. The psychology of attention. MIT Press, Cambridge, Mass. Patterson, R. D. 1976. Auditory filter shapes derived with noise stimuli. The Journal of the Acoustical So- ciety of America, 59(3), 640-654. Peigneux, P. – Laureys, S. – Fuchs, S. – Collette, F. – Perrin, F. – Reggers, J. – Phillips, C. – Degueldre, C. – Del Fiore, G. – Aerts, J. – Luxen, A. – Maquet, P. 2004. Are spatial memories strengthened in the hu- man hippocampus during slow wave sleep? Neuron, 44, 535-545. Peigneux, P. – Orban, P. – Balteau, E. – Degueldre, C. – Luxen, A. – Laureys, S. – Maquet, P. 2006. Offline persistence of memory-related cerebral activity during active wakefulness. PLoS Biology, 4, E100. Peretz, I. – Ayotte, J. – Zatorre, R. – Mehler, J. – Ahad, P. – Penhune, V. – Jutras, B. 2002. Congenital Amusia: A Disorder of Fine-Grained Pitch Discrimination. Neuron, 33, 185-191. Peterhans, E. – von der Heydt, R. 1989 Mechanisms of contour perception in monkey visual cortex. II. Contours bridging gaps. Journal of Neurosciences, 9, 1749-1763. Petit, D. – Gagnon, J. F. – Fantini, M. L. – Ferini-Strambi, L. – Montplaisir, J. 2004. Sleep and quantitative EEG in neurodegenerative disorders. Journal of Psychosomatic Research, 56, 487-496. Pierrot-Deseilligny, C. – Rivaud, S. – Gaymard, B. 1991. Cortical control of reflexive visually-guided saccades. Brain, 114, 1473-1485. Pisoni, D. B. 1975. Auditory short-term memory and vowel perception. Memory & Cognition, 3, 7-18. Plomp, R. – Levelt, W. J. M. 1965. Tonal consonance and critical bandwidth. Journal of the Acoustical Society of America, 38, 548-560. Portas, C. M. – Krakow, K. – Allen, P. – Josephs, O. – Armony, J. L. – Frith, C. D. 2000. Auditory proces- sing across the sleep-wake cycle: simultaneous EEG and fMRI monitoring in humans. Neuron, 29, 991-999. Posner, M. I. 1993. Attention before and after the decade of brain. In: Mayer, D. E. – Kornblum, S. M. (Eds.): Attention and Performance XIV. MIT Press, Cambridge, Mass. Posner, M. I. – Cohen, Y. 1984. Components of visual orienting. In: Bouma, H. – Bouwhuis, D. G. (Eds.): Attention and performance: Control of language processes. Erlbaum, Hillsdale, NJ, 531-556. Posner, M. I. – Nissen, M. S. – Ogden, W. C. 1978. Attended and unattended processing modes: The role of set for spatial localization. In: Pick, H. L. – Salzman, E. J. (Eds.): Models ofperceiving and processing information. Erlbaum, Hillsdale, New York. Posner, M. I. – Petersen, S. 1990. The attention system in the human brain. Annual Review of Neurosci- ence, 13, 25-42. Posner, M. I. – Snyder, C. R. R. 1975. Facilitation and inhibition in the processing of signals. In: Rabbitt, P. M. – Dornic, S. (Eds.): Attention and Performance V. Academic Press, New York, 669-681. Poulton, E. C. 1979. Models for biases in judging sensory magnitude. Psychological Bulletin, 86(4), 777803. Price, D. D. 1988. Psychological and neural mechanisms of pain. Raven, New York. Pylyshyn, Z. W. – Storm, R. W. 1988. Tracking multiple independent targets: Evidence for a parallel trac- king mechanism. Spatial Vision, 3, 179-197. Quinn, P. C. – Rosano, J. L. – Wooten, B. R. 1988. Evidence that brown is not an elemental color. Percep- tion and Psychophysics, 43, 156-164. Raffman, D. 1988. Toward a cognitive theory of musical ineffability. Review of Metaphysics, 41, 685-706. Raffman, D. 1995. On the Persistence of Phenomenology. In: Metzinger, T. (Ed.): Conscious Experience. Imprint Academic, Schöningh, 293-308.
412 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Rajna Péter 2006. Mégis Hans Bergernek lesz igaza? Adatok a korszerű klinikai electroencephalographia pszichiátriai jelentőségéhez. Orvosképzés, 81, 37-48. Rasch, R. A. 1978. The perception of simultaneous notes such as in polyphonic music. Acustica, 40, 21-33. Rauschecker, J. P. – Tian, B. 2000. Mechanisms and streams for processing of „what” and „where” in audi- tory cortex. Proceedings of the National Academy of Sciences of the United States of America, 97(22), 1180011806. Rayner, K. 1999. What have we learned about eye movements during reading? In: Klein, R. M. – McMul- len, P. A. (Eds ): Converging Methods for UnderstandingReading andDyslexia MIT Press, Cambridge, 23-56. Rechtschaffen, A. – Bergmann, B. M. – Gilliland, M. A. – Bauer, K. 1999. Effects of method, duration, and sleep stage on rebounds from sleep deprivation in the rat. Sleep, 22, 11-31. Rechtschaffen, A. – Kales, A. (Eds): 1968. A Manual of Standardized Terminology, Techniques and Scoring System for Sleep Stages of Human Subjects. UCLA, Brain Information Service, Los Angeles. Reichardt, W. 1961. Autocorrelation: A principle for the evaluation of sensory information by the central nervous system. In: Rosenblith, W. A. (Ed.): Sensory Communication. Wiley, New York. Remez, R. E. – Rubin, P. E. – Pisoni, D. B. – Carrell, T. D. 1981. Speech perception without traditional speech cues. Science, 212(4497), 947-949. Remland, M. S. – Jones, T. S. – Brinkman, H. 1995. Interpersonal distance, body orientation and touch: Effect of culture, gender and age. Journal of Social Psychology, 135, 281-297. Rensink, R. – O’Regan, J. K. – Clark, J. J. 1997. To see or not to see: The need for attention to perceive changes in scenes. Psychological Science, 8, 368-373. Ribeiro, S. – Gervasoni, D. – Soares, E. S. – Zhou, Y. – Lin, S. C. – Pantoja, J. – Lavine, M. – Nicolelis, M. A. 2004. Long-lasting novelty-induced neuronal reverberation during slow-wave sleep in multiple foreb- rain areas. PLoS Biology, 2, E24. Richardson, G. S. 2005. The human circadian system in normal and disordered sleep. Journal of Clinical Psychiatry, 66, Suppl 9, 3-9. Ritsma, R. J. 1963. Existence region of the tonal residue. II. The Journal of the Acoustical Society of America, 34, 1241-1245. Robbins, T. W. – Everitt, B. J. 1995. Arousal systems and attention. In: Gazzaniga, M. S. (ed.-in-chief): The cognitive neurosciences. MIT Press, Cambridge, Mass., 703-720. Roberts, R. D. – Kyllonen, P. C. 1999. Morningness-eveningness and intelligence: early to bed, early to rise will likely make you anything but wise! Personality andIndividual Differences, 27, 1123-1133. Robertson, E. M. – Pascual-Leone, A. – Press, D. Z. 2004. Awareness modifies the skill-learning benefits of sleep. Current Biology, 14, 208-212. Rock, I. – Gutman, D. 1981. The effect of inattention and form perception. Journal of Experimental Psychology: Human Perception and Performance, 7, 275-285. Roenneberg, T. – Kuehnle, T. – Pramstaller, P. P. – Ricken, J. – Havel, M. – Guth, A. – Merrow, M. 2004. A marker for the end of adolescence. Current Biology, 14, R1038-R1039. Rorden, C. – Driver, J. 1999. Does auditory attention shift int he direction o fan upcoming saccade? Neuropsychologia, 37, 357-377. Rosenzweig, M. R. – Breedlove, S. M. – Leiman, A. L. 2002. Biological psychology. Sinauer Associates Inc. Publ., Sunderland, Mass. Rousselet, G. A. – Thorpe, S. J. -Fabre-Thorpe, M. 2004. How parallel is visual processing in the ventral pathway? Trends in Cognitive Science, 8, 363-370. 413 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Sacks, O. 2004. A színvak festő esete. In: Uő: Antropológus a Marson. Osiris, Budapest, 19-59. Sáry, G. – Vogels, R. – Kovács, G. – Orban, G. A. 1995. Responses of monkey inferior temporal neurons to luminance-, motion-, and texture-defined gratings. Journal of Neurophysiology, 73, 1341-1354. Savin, H. B. – Bever, T. G. 1970. The nonperceptual reality of the phoneme. Journal of Verbal Learning and Verbal Behavior, 9(3), 295-302. Schabus, M. – Hodlmoser, K. – Gruber, G. – Sauter, C. – Anderer, P. – Klosch, G. – Parapatics, S. – Saletu, Klimesch, W. – Zeitlhofer, J. 2006. Sleep spindle-related activity in the human EEG and its relation to general cognitive and learning abilities. European Journal of Neuroscience, 23, 1738-1746. Schiffmann, S. S. 1974. Psychochemical correlates of olfactory quality. Science, 185, 112-117. Schmidt, L. A. – Cote, K. A. – Santesso, D. L. – Milner, C. E. 2003. Frontal electroencephalogram alpha asymmetry during sleep: stability and its relation to affective style. Emotion, 3, 401-407. Schooneveldt, G. P. – Moore, B. C. 1989. Comodulation masking release (CMR) as a function of masker bandwidth, modulator bandwidth, and signal duration. The Journal of the Acoustical Society ofAmerica, 85(1), 273-281. Schouten, J. F. 1940. The residue and the mechanism of hearing. Proceedings, Koninklijke Nederlandse Akademie Van Wetenschappen, 43, 991-999. Schredl, M. – Fulda, S. 2005. Dream recall and sleep duration: state or trait factor. Perceptual and Motor Skills, 101, 613-616. Scott, S. K. – Johnsrude, I. S. 2003. The neuroanatomical and functional organization of speech perception. Trends in Neurosciences, 26(2), 100-107. Sekuler, R. – Blake, R. 2000. Észlelés. Osiris, Budapest. Shapiro, K. L. – Driver, J. – Ward, R. – Sorensen, R. E. 1997. Priming from the attentional blink: A failure to extract visual tokens but not visual types. Psychological Science, 8, 95-100. Shaw, E. A. 1974. Transformation of sound pressure level from the free field to the eardrum in the horizon- tal plane. The Journal of the Acoustical Society of America, 56(6), 1848-1861. Shepard, R. N. 1962. Analysis of proximities: Multidimensionsl Scaling with an Unknown Distance Func- tion. Psychometrika, 27, 219-246. Shepard, R. N. 1997. The Perceptual Organization of Colors: An Adaptation to Regularities of the Terrest- rial World? In: Byrne, A. – Hilbert, D. R. (Eds.): Readings on Color.Vol. 2. The Science of Color. The MIT Press, Cambridge, Mass., 311-356. Shepard, R. N. – Metzler, J. 1971. Mental rotation of three-dimensional objects. Science, 171, 701-703. Shepherd, A. J. 1999. Remodelling color contrast: implications for visual processing and color representa- tion. Vision Research, 39, 1329-1345. Shibagaki, M. 2005. Delta and spindle components in the integrated EEG during nocturnal sleep for infants with developmental disabilities. Perceptual and Motor Skills, 101, 811-818. Shiffrin, R. M. – Schneider, W. 1977. Controlled and automatic human information processing: II. Perceptual learning, automatic attending and general theory. Psychological Review, 84, 127-190. Simons, D. J. – Chabris, C. F. – Schnur, T. 2002. Evidence for preserved representations in change blind- ness. Consciousness and Cognition, 11, 78-97. Simons, D. J. – Levin, D. T. 1997. Change blindness. Trends in Cognitive Sciences, 1, 261-267. Singer, W. 1994. The organization of sensory-motor representations in the neocortex: A hypothesis based on temporal coding. Attention and Performance, 15, 77-107. 414 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Sivik, L. 1997. Color systems for cognitive research. In: Hardin, C. L. – Maifi, L. (Eds.): Color categories in thought andlanguage. Cambridge University Press, 163-193. Smith, C. 1995. Sleep states and memory processes. BehaviouralBrain Research, 69, 137-145. Smith, R. L. 1966. Monotony and motivation: A theory of vigilance. Dulnop and Associates, Los Angeles. Sohn, W. – Papathomas, T. V. – Blasari, E. – Vidnyánszky, Z. 2004. Object-based cross-feature attentional modulation from color to motion. Vision Research, 44, 1437 -1443. Sokolov, E. N. 1960. Neuronal models and the orienting reflex. In: Brazier, M. A. B. (Ed.): The central nervous system and behavior. Josiah Macy Foundation, New York. Sokolov, E. N. 1963. Perception and the conditioned reflex. MacMillan, New York. Solomon, J. A. – Pelli, D. 1994. The visual filter mediating letter identification. Nature, 369, 395-397. Soto-Faraco, S. – Kingston, A. 2004. Multisensory integration of dynamic information. In: Calvert, G. A. – Spence, C. – Stein, B. E. (Eds.): The handbook of multisnesory processes. MIT Press, Cambridge, Mass., 49-67. Spelke, E. – Hirst, W. – Neisser, U. 1977. Skills of divided attention. Cognition, 4, 215-230. Sperling, G. – Melchner, M. J. 1978. The attention operating characteristics: Examples from visual search. Science, 202, 315-318. Spitzer, H. – Desimone, R. – Moran, J. 1988. Increased attention enhances both behavioral and neuronal performance. Science, 240, 338-340. Sternberg, S. 1969/1981. Memórialetapogatás: A reakcióidő-kísérletekben megnyilvánuló mentális folyamatok. American Scientists, 57, 421-457. In: Czigler István (szerk.): A tanulás és emlékezés pszichológiája. Szöveggyűjtemény II. Tankönyvkiadó, Budapest. Sternheim, C. E. – Boynton, R. M. 1966. Uniqueness of perceived hues investigated with a continuous judgmental technique. Journal of Experimental Psychology, 72, 770-776. Stevens, K. N. – House, A. S. 1963. Perturbation of vowel articulations by consonantal context: An acousti- cal study. Journal of Speech andHearing Research, 6, 111-128. Stevens, S. S. 1956. The direct estimation of sensory magnitude – Loudness. American Journal of Psychology, 69, 1-25. Stevens, S. S. 1957. On the psychophysical law. Psychological Review, 64(3), 153-181. Stevens, S. S. 1960. Psychophysics of sensory function. American Scientist, 48, 226-252. Stevens, S. S. 1975. Psychophysics: An introduction to its perceptual, neurel, and social prospects. John Wiley & Sons, New York. Stevens, S. S. – Newman, E. B. 1934. The localization of pure tones. Proceedings of the National Academy of Sciences of the United States of America, 20( 11), 593-596. Stickgold, R. 2002. EMDR: a putative neurobiological mechanism of action. Journal of Clinical Psychology, 58, 61-75. Stickgold, R. 2005. Sleep-dependent memory consolidation. Nature, 437, 1272-1278. Stickgold, R. – Malia, A. – Maguire, D. – Roddenberry, D. – O’Connor, M. 2000. Replaying the game: hypnagogic images in normals and amnesics. Science, 290, 350-353. Stockman, A. – MacLeod, D. I. A. – Johnson, N. E. 1993. Spectral sensitivities of the human cones. Journal of the Optical Society of America A, 10(12), 2491-2521. Stratton, G. M. 1897. Vision without inversion of the retinal image. Psychological Review, 463-481. 415 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Swaab, D. F. – Hofman, M. A. 1995. Sexual differentiation of the human hypothalamus in relation to gender and sexual orientation. Trends in Neurosciences, 18, 264-270. Tarr, M. J. – Bülthoff, H. H. 1995. Is human object recognition better described by geon-structural-descriptions or by multiple-views? Journal of Experimental Psychology, Human Percepteption and Perfor- mance, 21, 1494-1505. Theeuwes, J. – Kramer, A. F. – Hahn, S. – Irwin, D. E. 1998. Our eye do not always go where we want to them to go: Capture of the eye by new objects. Psychological Science, 9, 379-385. Thornton, I. M. – Fernandez-Duque, D. 2000. An implicit measure of undetected change. Spatial Vision, 14, 2144. Tipper, S. P – McLaren, J. 1990. Evidence for efficient visual selective attention in children. In: Enns, J. T. (Ed): The development of attention: research and theory. Elsevier, Amsterdam, 197-201. Tipper, S. P. – Driver, J. 1988. Negative priming between pictures and words in a selective attention task: evidence for semantic processing of ignored stimuli. Memory and Cognition, 16, 64-70. Tipper, S. P. – Weaver, B. – Cameron, S. – Brehaut, J. – Bastedo, J. 1991. Inhibitory mechanisms in identification and localization tasks – time course and disruption. Journal of Experimental Psychology: Learning, Memory and Cognition, 17, 681-692. Titchener, E. B. 1918/1988. A figyelem mint érzékleti tisztaság. In: Barkóczi Ilona (szerk.): Figyelem. Szöveggyűjtemény. Tankönyvkiadó, Budapest, 26-34. Titchener, E. S. 1909/1910. A textbook of psychology. Macmillan, New York. Treisman, A. M. – Gelade, G. 1980. A feature integration theory of attention. Cognitive Psychology, 12, 97-136. Treisman, A. M. 1960. Contextual cues in selective listening. Quarterly Journal of Experimental Psychology, 12, 242-284. Treisman, A. M. 1964. Verbal cues, language meaning in selective attention. American Journal of Psychology, 77, 206-219. Treisman, A. M. 1993 The perception of features and objects. In: Baddeley, A. D. – Weiskrantz, L. (Eds.): Attention: awareness, selection and control. Oxford University Press, Oxford, 5-35. Treisman, A. M. 1986. Features and objects in visual processing. Scientific American, 106, 115-117. Treisman, A. M. – Schmidt, H. 1982. Illusory conjunctions in the perception of objects. Cognitive Psychology, 14, 107-141. Treutwein, B. 1995. Minireview: Adaptive Psychophysical Procedures. Vision Research, 35, 2503-2522. Tucker, M. A. – Hirota, Y. – Wamsley, E. J. – Lau, H. – Chaklader, A. – Fishbein, W. 2006. A daytime nap containing solely non-REM sleep enhances declarative but not procedural memory. Neurobiology of Learning and Memory, in press. Ungerleider, L. G. – Mishkin, M. 1982. Two cortical systems. In: Ingle, D. J. – Goodale, M. A. – Mansfield, R. J. W. (Eds.): Analysis of visual behaviour. MIT Press, Cambridge, Mass., 549-586. Vaina, L. – Solomon, J. – Chowdhury, S. – Sinha, P. – Belliveau, J. W. 2001. Functional neuroanatomy of biological motion perception in humans. Proceedings of the National Acadademy of Science (USA), 98(20), 11656-11661. Vecera, S. – Farah, M. 1994. Does visual attention select objects or locations? Journal of Experimental Psychology: General, 123, 146-160. Velhagen, K. – Broschmann, D. 1992. Színlátásvizsgáló táblák. Medicina, Budapest.
416 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Vereczkei Lajos – Karmos György – Grastyán Endre 1965. A tájékozódási reakció idegélettani elemzése. Pszichológiai tanulmányok VII. Akadémiai Kiadó, Budapest, 123-129. Viemeister, N. F. 1988. Psychophysical aspects of auditory intensity coding. In: Edelman, G. M. – Gaél, W. E. – Cowan, W. A. (Eds.): Auditory function. Wiley, New York. Vink, J. M. – Groot, A. S. – Kerkhof, G. A. – Boomsma, D. I. 2001. Genetic analysis of morningness and eveningness. Chronobiology International, 18, 809-822. Vogel, E. K. – Luck, S. J. – Shapiro, K. L. 1998. Electrophysiological evidence for a postperceptual locus of suppression during the attentional blink Journal of Experimental Psychology: Human Perception and Performance, 24, 1656-1674. Wade, N. J. 1998. A Natural History of Vision. MIT Press, Cambridge, Mass. Wagner, U. – Gais, S. – Born, J. 2001. Emotional memory formation is enhanced across sleep intervals with high amounts of rapid eye movement sleep. Learning and Memory, 8, 112-119. Walker, M. P. – Brakefield, T. – Hobson, J. A. – Stickgold, R. 2003. Dissociable stages of human memory consolidation and reconsolidation. Nature, 425, 616-620. Wall, P. 2003. Fájdalom. A szenvedés tudománya. HVG Kiadó Rt., Budapest. Wallach, H. – Newman, E. B. – Rosenzweig, M. R. 1949. The precedence effect in sound localization. Journal of Experimental Psychology, 27, 339-368. Wallis, G. – Bülthoff, H. 1999. Learning to recognise objects. Trends in Neuroscience, 3, 22-31. Wandell, B. A. 1995. Foundations of vision. Sinauer Associates, Sunderland, Mass. Ward, L. M. 1994. Supramodal and modality-specific mechanisms for stimulus-driven shifts of auditory and visual attention. Canadian Journal of Experimental Psychology, 48, 242-259. Ward, W. D. 1954. Subjective musical pitch. Journal of the Acoustical Society of America, 26, 369-380. Ward, W. D. 1999. Absolute pitch. In: Deutsch, D. (Ed.): The psychology of music. Academic Press, New York, 265-298. Warren, R. M. – Gardner, D. A. – Brubaker, B. S. – Bashford, J. A. 1991. Melodic and nonmelodic sequen- ces of tones: Effects of duration on perception. Music Perception, 8, 277-289. Warren, R. M. 1970. Perceptual restoration of missing speech sounds. Science, 167(917), 392-393. Warren, R. M. – Obusek, C. J. – Farmer, R. M. – Warren, R. P. 1969. Auditory sequence: Confusion of patterns other than speech or music. Science, 164(879), 586-587. Weiskrantz, L. 1986. Blindsight: A Case Study andImplications. Oxford University Press, Oxford. Weiskrantz, L. 1990. Blindsight. A Case Study and Implications. Clarendon Press, Oxford. Wenzel, K. – Ábrahám, G. – Kovács, G. – Kucsera, I. 2000. Improving color vision for color deficient patients, In: Lakshminarayanan, V. (Ed.): OSA Trends in Optics andPhotonics. Vol. 35. Vision Science andItsApplications. Optical Society of America, Washington, DC, 333-336. Werner, J. S. – Wooten, B. R. 1979. Opponent chromatic mechanisms: Relation to photopigments and hue naming. Journal of the Optical Society of America, 69, 422-434. Wever, E. G. – Bray, C. W. 1937. The perception of low tones and the resonance-volley theory. Journal of Psychology, 3, 101-114. Wightman, F. L. – Kistler, D. J. 1989a. Headphone simulation of free-field listening. I. Stimulus synthesis. The Journal of the Acoustical Society of America, 85(2), 858-867.
417 Created by XMLmind XSL-FO Converter.
Hivatkozott irodalom
Wightman, F. L. – Kistler, D. J. 1989b. Headphone simulation of free-field listening. II. Psychophysical validation. The Journal of the Acoustical Society of America, 85(2), 868-878. Wish, M. – Seutsch, M. – Biener, L. 1972. Differences in Perceived Similarity of Nations. In: Romney, A. K. – Shepard, R. N. – Nerlove, S. B. (Eds.): MultidimensionalScalingII. Seminar Press, New York. Wixted, J. T. 2004. The psychology and neuroscience of forgetting. Annual Review of Psychology, 55, 235-269. Woldorff, M. G. – Hillyard, S. A. 1991. Modulation of early auditory processing during selective listening to rapidly presented tones. Electroencephalography and Clinical Neurophysiology, 79, 170-191. Wolfe, J. M. 1994. Guider search 2.0: A revised model of visual search. Psychonomic Bulletin and Review, 1, 202-238. Wood, N. – Cowan, N. 1995. The coctail party phenomenon revisited: How frequent are attention shifts to ones name in an irrelevant auditory channel. Journal of Experimental Psychology: Learning, Memory and Cognition, 21, 255-260. Woodworth, R. S. 1938. Experimental psychology. Holt, New York. Wyatt, J. K. – Bootzin, R. R. 1994. Cognitive processing and sleep: implications for enhancing job performance. Human Performance, 7, 119-139. Wyszecki, G. – Stiles, W. S. 2000. Color Science. J. Wiley, New York. Yarbus, A. 1967. Eye Movements and Vision. Plenum Press, New York. Yerkes, R. M. – Dodson, J. D. 1908. The relation of strength of stimulus to rapidity of habit-formation. Journal of Comparative Neurology of Psychology, 18, 456-482. Young, F. A. 1928. Auditory localization with acoustical transposition of the ears. Journal of Experimental Psychology, 11, 399-429. Young, T. 1802. On the theory of light and colors. Philosophical Transactions of the RoyalSociety of London, 92, 12-48. Zapparoli, G. C. – Reatto, L. L. 1969. The apparent movement between visual and acoustic stimulus and the problem of intermodal relations. Acta Psychologica, 29, 256-267. Zatorre, R. J. – Krumhansl, C. L. 2002. Mental models and musical minds. Science, 298(5601), 2138-2139. Zemplén, G. 2004. The history of light, color, and vision. Introduction, texts, problems. Bern Studies in the History andPhilosophy of Science.
418 Created by XMLmind XSL-FO Converter.