Det fusiforma ansiktsområdet: En modul i människans extrastrierade cortex som är specialiserad för ansiktsuppfattning

MATERIAL OCH METODER

Generell utformning. Den här studien bestod av tre huvuddelar. I del I sökte vi efter eventuella occipitotemporala områden som kan vara specialiserade för ansiktsuppfattning genom att inom varje försöksperson leta efter regioner i den ventrala (occipitotemporala) banan som reagerade signifikant starkare under passiv betraktelse av fotografier av ansikten än fotografier av diverse vanliga föremål. Denna jämförelse fungerade som en spanare, vilket gjorde det möjligt för oss att (1) anatomiskt lokalisera kandidatområden för ansikten inom enskilda försökspersoner, (2) fastställa vilka regioner, om några, som aktiveras konsekvent mellan olika försökspersoner och (3) specificera exakt vilka voxlar i varje försökspersons hjärna som skulle användas som försökspersonens tidigare definierade region av intresse (ROI) för de efterföljande testerna i delarna II och III.

Vi använde oss av en stimulusmanipulation med en passiv betraktningsuppgift (snarare än en uppgiftsmanipulation på identiska stimuli) eftersom uppfattningen av fovealt presenterade ansikten är en mycket automatisk process som är svår att få under viljemässig kontroll (Farah et al, 1995). Föreställ dig till exempel att du får veta att ett ansikte kommer att blinkas vid fixering i 500 msek och att du måste analysera dess visuella egenskaper på låg nivå men inte känna igen ansiktet. Om ansiktet är bekant blir det praktiskt taget omöjligt att undvika att känna igen det. När ansikten presenteras fovealt är det därför troligt att alla processer som är förknippade med ansiktsigenkänning kommer att inträffa oavsett vad uppgiften är, och det mest effektiva sättet att generera ett kontrollvillkor där dessa processer inte inträffar är att presentera ett stimulus som inte är ett ansikte (Kanwisher et al., 1996).

Resultaten i del I visade endast en region som aktiverades konsekvent hos alla försökspersoner för jämförelsen ansikten mot objekt; detta område fanns i den högra fusiforma gyrus (och/eller intilliggande sulci). Vi antog att detta område var specialiserat för någon aspekt av ansiktsuppfattning, och vi testade alternativ till denna hypotes med flera olika stimulusjämförelser i delarna II och III. I del II testades var och en av de fem försökspersoner som hade visat en tydlig fusiform ansiktsaktivering i del I på två nya stimulusjämförelser. I var och en av dem var de metodologiska detaljerna identiska med dem i försöken med ansikten mot objekt, och endast stimulusuppsättningarna skiljde sig åt. Vår första nya stimulusjämförelse i del II var mellan intakta tvåtoniga ansikten (som skapades genom tröskelvärdering av de fotografier som användes i del I) och förvrängda tvåtoniga ansikten där de svarta komponentregionerna arrangerades om för att skapa ett stimulus som inte går att känna igen som ett ansikte (se fig. 3b). Denna manipulering bevarade den genomsnittliga luminansen och vissa egenskaper på låg nivå hos de tvåtonade ansiktsstimuli och undvek att producera de ”klipp-och-klistra”-markeringar som har varit ett problem i scramblingprocedurerna i vissa tidigare studier; denna kontrast fungerade därför som ett grovt test av om ”ansiktsområdena” helt enkelt reagerade på de visuella egenskaper på låg nivå som finns i ansiktsstimuli men inte i andra stimuli än ansiktsstimuli. Vår andra stimuluskontrast – fotografier av ansikten i frontvy mot fotografier av hus i frontvy (se fig. 3c) – var utformad för att testa om ”ansiktsområdet” inte var involverat i ansiktsuppfattning i sig utan snarare i bearbetning och/eller åtskillnad mellan olika exemplar av en enda klass av objekt.

Fig. 3.

Resultat av del II. Vänster kolumn, exempel på stimuli som användes för jämförelsen mellan ansikten och objekt samt för de två efterföljande testerna. Centrala kolumnen, Områden som gav signifikant större aktivering för ansikten än kontrollstimuli för försöksperson S1. a, Jämförelsen mellan ansikten och objekt användes för att definiera en enda ROI (visas i grön kontur för S1), separat för varje försöksperson. Tidsförloppen i den högra kolumnen producerades genom att (1) medelvärdet av den procentuella signalförändringen över alla voxlar i en viss försökspersons ROI (med hjälp av de ursprungliga, oredigerade data) och sedan (2) medelvärdet av dessa ROI-medelvärden över de fem försökspersonerna. F och O i a anger ansikts- och objektsepoker, I och S i b anger intakta och förvrängda ansiktsepoker, och F och H i c anger ansikts- och handepoker.

Fig. 4.

Resultat av del III. Stimuluskontraster för varje test visas i den vänstra kolumnen. a, Ansikts-ROI:er definierades separat för varje försöksperson med hjälp av genomsnittet av två skanningar av ansikte mot objekt enligt beskrivningen för figur 3a. Den resulterande hjärnskivan med statistisk överlagring för en försöksperson (S10) visas i den mittersta kolumnen, och tidsförloppet för signalintensiteten som medelvärde över de fem försökspersonernas ROI:er visas till höger. Som beskrivits för figur 3a (del II) användes den ROI som specificerades på grundval av jämförelsen ansikten mot objekt för de två efterföljande jämförelserna av passiv betraktelse av trekvartsansikten mot händer (b) och den konsekutiva matchningsuppgiften på trekvartsansikten mot händer (c).

I del III testades en ny men överlappande uppsättning av fem försökspersoner som hade avslöjat tydliga kandidatområden för ansikten i del I på två nya jämförelser. (Försökspersonerna S1 och S2 deltog i både del II och III.) I den första nya jämförelsen tittade försökspersonerna passivt på fotografier av ansikten i trekvartsvy (alla var av personer vars hår var instoppat i en svart stickad skidmössa) jämfört med fotografier av människohänder (alla tagna från samma vinkel och i ungefär samma position). Denna jämförelse (se fig. 4b) var utformad för att testa flera olika frågor. För det första: Skulle responsen för kandidatansiktsområdet generaliseras till olika betraktelsevinklar? För det andra, är detta område involverat i att känna igen ansiktet på grundval av håret och andra yttre kännetecken på huvudet (Sinha och Poggio, 1996) eller på grundval av dess inre kännetecken? Eftersom de yttre egenskaperna till stor del var dolda (och mycket likartade mellan exemplen) i ansiktena med skidmössa, skulle ett svar från detta område på dessa stimuli tyda på att det i första hand är involverat i bearbetningen av de inre snarare än de yttre egenskaperna hos ansiktet. För det tredje gav användningen av mänskliga händer som kontrollvillkor också ett test av om ansiktsområdet skulle reagera på någon animerad eller mänsklig kroppsdel. I den andra nya jämförelsen presenterades samma stimuli (ansikten i trekvartsvy mot händer) medan försökspersonerna utförde en ”1-back”-uppgift där de sökte efter på varandra följande upprepningar av identiska stimuli (de tryckte på en knapp när de upptäckte en upprepning). För denna uppgift var ett 250 ms tomt grått fält placerat mellan varje 500 ms presentation av ett ansikte. Det grå fältet producerade sensoriska transienter över hela stimulus och krävde därmed att försökspersonerna förlitade sig på visuell information på högre nivå för att utföra uppgiften (Rensink et al., 1997). Eftersom 1-backsuppgiften var, om något, svårare för hand- än ansiktsstimuli, bör de förstnämnda engagera allmänna uppmärksamhetsmekanismer minst lika starkt som de sistnämnda, vilket utesluter varje redogörelse för större ansiktsaktivering för ansikten i termer av allmänna uppmärksamhetsmekanismer.

Testerna av varje försöksperson i delarna II och III utfördes på den grundläggande jämförelsen mellan ansikte och objekt från del I under samma session, så att resultaten från del I kunde användas för att generera de exakta ROI:erna för den aktuella försökspersonen för jämförelserna i delarna II och III. För de passiva betraktningsvillkoren instruerades försökspersonerna att bibehålla fixering på pricken när den var närvarande, och i övrigt att helt enkelt titta uppmärksamt på stimuli utan att utföra andra mentala spel samtidigt.

Subjekt:

Subjekt. Tester av 20 normala försökspersoner under 40 år genomfördes, och alla försökspersoner rapporterade normal eller korrigerad till normal syn och ingen tidigare neurologisk historia. Data från fem av dem utelämnades på grund av överdriven huvudrörelse eller andra artefakter. Av de återstående 15 personerna (9 kvinnor och 6 män) beskrev 13 deltagare sig själva som högerhänta och två som vänsterhänta. Alla 15 försökspersoner deltog i del I. (Försöksperson S1 kördes på del I många gånger under olika skanningssessioner utspridda över en sexmånadersperiod, både för att mäta test-retest-tillförlitligheten inom en försöksperson över olika sessioner och för att jämföra resultaten från del I med ett antal andra pilotstudier som genomfördes under denna period). Försökspersonerna S1, S2, S5, S7 och S8 från figur 2 kördes i del II, och försökspersonerna S1, S5, S9, S10 och S11 från figur 2 kördes i del III. Försökspersonerna S1-S10 beskrev sig själva som högerhänta, medan försökspersonerna S11 och S12 beskrev sig själva som vänsterhänta. De experimentella förfarandena godkändes av både Harvard University Committee on the Use of Human Subjects in Research och Massachusetts General Hospital Subcommittee on Human Studies; informerat samtycke erhölls från varje deltagare.

Fig. 2.

Börsta två rader, Anatomiska bilder överlagrade med färgkodade statistiska kartor från de 10 högerhänta försökspersoner i del I som visade regioner som producerade en signifikant starkare MR-signal vid betraktande av ansikten än objekt. För var och en av de högerhänta försökspersonerna (S1-S10) visas det snitt som innehåller den högra fusiforma ansiktsaktiveringen; för de vänsterhänta försökspersonerna S11 och S12 syns alla fusiforma ansiktsaktiveringar i de snitt som visas. Data från försökspersonerna S1 och S2 omskurna till sagittala, koronala och axiella snitt (överst till höger). Data från de tre försökspersoner som inte visade några regioner som reagerade signifikant starkare för ansikten än för objekt visas inte.

Stimuli. Exempel på de stimuli som användes i dessa experiment visas i figurerna 3 och 4. Alla stimuli var ∼300 × 300 pixlar stora och var fotografier i gråskala (eller fotografiliknande bilder), med undantag för de intakta och förvrängda tvåtoniga ansikten som användes i del II. Ansiktsfotografierna i delarna I och II var 90 ID-fotografier av nybörjare som erhållits med samtycke från medlemmar av Harvard-klassen 1999. De ansiktsfotografier i trekvartsvy som användes i del II var medlemmar av eller frivilliga vid Harvard Vision Sciences Lab. (För de flesta försökspersoner var inget av ansiktena bekant.) De 90 blandade objektsbilderna (och fotoliknande bilder) erhölls från olika källor och innehöll kanoniska vyer av bekanta objekt som en sked, ett lejon eller en bil. De 90 husfotografierna skannades in från en arkitekturbok och var obekanta för försökspersonerna.

Varje skanning varade 5 minuter och 20 sekunder och bestod av sex 30 sekunders stimulusepoker som varvades med sju 20 sekunders fixeringsepoker. Under varje stimulansepok i delarna I och II presenterades 45 olika fotografier fovealt med en hastighet av ett var 670 msek (med stimulus på i 500 msek och av i 170 msek). Stimulansperioderna alternerade mellan de två olika förhållanden som jämfördes, vilket visas i figurerna 1, 3 och 4. De 45 olika stimuli som användes i den första stimuleringsepoken var desamma som i den femte stimuleringsepoken; de stimuli som användes i den andra stimuleringsepoken var desamma som i den sjätte. Stimuli i del III var desamma i struktur och timing, förutom att (1) totalt 22 ansiktsstimuli och 22 handstimuli användes (där de flesta stimuli förekom två gånger i varje epok), och (2) intervallet mellan ansikts- eller handstimuli var 250 msek.

Fig. 1.

Resultat från försöksperson S1 i del I. Den högra hemisfären visas till vänster för dessa och alla hjärnbilder i detta dokument (utom de omskurna bilderna med beteckningen ”Axial” i fig. 2). Hjärnbilderna till vänster visar i färg de voxlar som gav en signifikant högre MR-signalintensitet (baserat på utjämnade data) under de epoker som innehöll ansikten än under de epoker som innehöll objekt (1a) och vice versa (1b) för 1 av de 12 skivorna som skannades. Dessa signifikansbilder (se färgnyckel till höger för denna och alla figurer i denna artikel) överlagras på en T1-viktad anatomisk bild av samma skiva. De flesta av de övriga 11 skikten visade inga voxlar som uppnådde signifikans på p < 10-3-nivån eller bättre i någon av jämförelsens riktningar. I varje bild visas ett ROI med gröna konturer, och tidsförloppet för den råa procentuella signalförändringen under skanningen på 5 minuter och 20 sekunder (baserat på oreglerade data och medeltal över voxlarna i detta ROI) visas till höger. Epoker under vilka ansikten presenterades indikeras av de vertikala grå staplarna markerade med F; grå staplar med O indikerar epoker under vilka olika objekt presenterades; vita staplar indikerar fixeringsepoker.

Stimulussekvenser genererades med hjälp av MacProbe-programvaran (Hunt, 1994) och spelades in på videoband för presentation via en videoprojektor under skanningarna. Stimuli bakåtprojicerades på en skärm av slipat glas och betraktades i en spegel över försökspersonens panna (den visuella vinkeln för stimuli var ∼15 × 15°).

MRI-förvärv. Skanningar utfördes med en 1,5 T MRI-skanner (General Electric Signa, Milwaukee, WI) vid Massachusetts General Hospital NMR Center (Charlestown, MA), med hjälp av ekoplanär avbildning (Instascan, ANMR Systems, Wilmington, MA) och en bilateral kvadraturmottagningsspole med enbart ytspole (tillverkad av Patrick Ledden, Massachusetts General Hospital NMR Center). Funktionsdata erhölls med hjälp av en asymmetrisk spinechosekvens (TR = 2 sek, TE = 70 msek, flipvinkel = 90°, 180° offset = 25 msek). Våra 12 6 mm skivor var orienterade parallellt med den nedre kanten av occipital- och temporalloben och täckte hela occipitalloben och större delen av temporalloben (se fig. 5). Huvudets rörelse minimerades med hjälp av en bettstång. Voxelstorleken var 3,25 × 3,25 × 6 mm. Detaljerna om vårt förfarande är de som beskrivs i Tootell et al. (1995), med undantag för vad som anges här.

Fig. 5.

Midsagittal anatomisk bild från försöksperson S1 som visar den typiska placeringen av de 12 skikt som användes i denna studie. Skivorna valdes så att de omfattade hela den ventrala ytan av occipitala och temporala loberna.

Dataanalys. Fem försökspersoner av de 20 skannade hade överdriven huvudrörelse och/eller rapporterade att de somnade under en eller flera körningar; data från dessa försökspersoner utelämnades från vidare analys. Rörelse bedömdes inom en körning genom att leta efter (1) en synlig förskjutning i den funktionella bilden från ett visst skikt mellan den första och sista funktionella bilden i en körning, (2) aktiverade regioner som krökte sig runt hjärnans kant och/eller bytte sida när tecknet för den statistiska jämförelsen vändes om och/eller (3) ramper i tidsförloppet för signalintensiteten från en enskild voxel eller en uppsättning voxlar. Rörelse mellan körningar bedömdes genom att visuellt inspektera de obearbetade funktionella bilderna för att se om formen på en hjärnskiva förändrades mellan körningar.

För de återstående 15 försökspersonerna utfördes ingen rörelsekorrigering. Pilotdata hade indikerat att signifikansen från en enskild körning ibland var svag, men blev mycket starkare när vi tog medeltal över två identiska körningar inom en försöksperson (dvs.när de två motsvarande värdena för varje voxel, ett från varje skanning, medelvärdesbildades tillsammans för var och en av de 160 bilderna × 12 skikt som samlades in under en enda skanning på 5 minuter och 20 sekunder). Vi körde därför varje test två gånger på varje försöksperson och gjorde ett medelvärde av de två körningarna av varje test. Data analyserades sedan statistiskt med hjälp av ett Kolmogorov-Smirnov-test, efter utjämning med en Hanning-kärna över ett 3 × 3 voxelområde för att åstadkomma en ungefärlig funktionell upplösning på 6 mm. Denna analys kördes på varje voxel (efter att ha införlivat en 6 sekunders fördröjning för uppskattad hemodynamisk fördröjning) och testade om MR-signalintensiteten i den voxeln var signifikant större under epoker som innehöll en klass av stimuli (t.ex. ansikten) än epoker som innehöll en annan klass av stimuli (t.ex. objekt). Aktiveringsområden visades i färgrepresentationer av signifikansnivån, överlagrade på högupplösta anatomiska bilder av samma skiva. Voxlar med signifikant aktivering inspekterades också visuellt genom att plotta tidsförloppet för den råa (oreglerade) signalintensiteten under skanningens 5 min 20 sek.

För att identifiera alla regioner inom de av oss valda skivorna och spolområdet som reagerade starkare på ansikten än på objekt i del I, samt deras Talairach-koordinater, anpassades varje försökspersonens anatomiska och funktionella data först till sitt eget Talairach-utrymme och analyserades sedan (med hjälp av programmet Tal-EZ av Bush et al, 1996) för att hitta alla regioner som gav en starkare signal för ansikten än för objekt på signifikansnivånp < 10-4 (okorrigerat för multipla jämförelser). Denna analys var avsedd som en spaning efter kandidatområden för ansikten och visade att den enda region där de flesta av våra försökspersoner uppvisade en signifikant större aktivering för ansikten än för objekt var i den högra fusiforma gyrus. Denna region blev därför fokus för våra mer detaljerade undersökningar i delarna II och III.

För varje försöksperson i delarna II och III identifierades en ansikts-ROI som bestod av alla sammanhängande voxlar i den högra fusiforma regionen där (1) MR-signalintensiteten var signifikant starkare under ansikts- än objektsepoker på p < 10-4-nivån, och (2) en visuell inspektion av de råa tidsförloppsdatan från denna voxel inte avslöjade några uppenbara ramper, spikar eller andra artefakter. För försöksperson S11, som var vänsterhänt och hade mycket stora och mycket signifikanta aktiveringar i både vänster och höger fusiform gyri, inkluderade den ROI som användes i del III båda dessa regioner.

För var och en av jämförelserna i del II och III medelvärdesberäknade vi först över de två körningarna från varje försöksperson och medelvärdesberäknade sedan över voxlarna i försökspersonens fördefinierade ROI för ansiktet (från del I) för att härleda tidsförloppet av den råa signalintensiteten i försökspersonens ROI. Därefter genomfördes ytterligare två analyser. För det första beräknades den genomsnittliga MR-signalintensiteten i varje försökspersons ROI för varje epok (genom att inom en försöksperson beräkna medelvärdet över alla voxlar i deras ROI och över alla bilder som samlats in under varje epok). De genomsnittliga MR-signalintensiteterna för varje försöksperson och stimulusepok ingick sedan i en trevägs ANOVA för alla försökspersoner (epoknummer × ansikte/kontroll × test) separat för delarna II och III. Faktorn epoknummer hade tre nivåer som motsvarade den första, andra och tredje epoken för varje tillstånd; testfaktorn hade tre nivåer för de tre olika stimulusjämförelserna (ansikten mot objekt/förvrängda mot intakta ansikten/ansikten mot hus för del II och ansikten mot objekt/passiva ansikten mot händer/1-back faces mot händer för del III). Dessa ANOVA:er gjorde det möjligt för oss att testa betydelsen av skillnaderna i signalintensitet mellan de olika ansikts- och kontrollförhållandena och även att testa om denna skillnad interagerade med epoknummer och/eller jämförelsetyp.

För det andra konverterade vi för varje försöksperson det obearbetade tidsförloppet av MR-signalintensiteten från den försökspersonens ansikts-ROI till ett tidsförlopp av procentuell signalförändring, med hjälp av den försökspersonens genomsnittliga signal över alla fixeringsepokerna i samma körningar (i ansikts-ROI:n) som en baslinje. Dessa tidsförlopp för den procentuella signalförändringen för varje försökspersons ROI i ansiktet kan sedan räknas som ett medelvärde för de fem försökspersoner som kördes på samma test för alla tester i delarna I till III. Genom att beräkna medelvärdet för varje försökspersons ROI och för alla data som samlades in under varje epok-typ fick vi fram en genomsnittlig procentuell signalförändring för face- och kontrollförhållandena för varje test. Förhållandet mellan den procentuella signalförändringen för ansikten och kontrollvillkoret för varje test ger ett mått på selektiviteten hos ROI:n för ansikten i förhållande till den stimuluskontrast som används i det testet.

MATERIAL OCH METODER

Lämna ett svar Avbryt svar