Materiales y Métodos
Diseño general. Este estudio tuvo tres partes principales. En la Parte I, buscamos cualquier área occipitotemporal que pudiera estar especializada en la percepción de caras, buscando dentro de cada sujeto regiones en la vía ventral (occipitotemporal) que respondieran significativamente más fuertemente durante la visualización pasiva de fotografías de caras que de fotografías de objetos comunes variados. Esta comparación sirvió como explorador, permitiéndonos (1) localizar anatómicamente las «áreas de caras» candidatas dentro de los sujetos individuales, (2) determinar qué regiones se activan de forma consistente entre los sujetos, si es que hay alguna, y (3) especificar con precisión los vóxeles en el cerebro de cada sujeto que se utilizarían como la región de interés (ROI) previamente definida de ese sujeto para las pruebas posteriores en las Partes II y III.
Empleamos una manipulación del estímulo con una tarea de visualización pasiva (en lugar de una manipulación de la tarea sobre estímulos idénticos) porque la percepción de las caras presentadas fovealmente es un proceso altamente automático que es difícil de poner bajo control volitivo (Farah et al., 1995). Imagínese, por ejemplo, que se le dice que una cara aparecerá en la fijación durante 500 mseg y que debe analizar sus características visuales de bajo nivel pero no reconocer la cara. Si la cara es familiar, será prácticamente imposible evitar reconocerla. Por lo tanto, cuando las caras se presentan en la zona foveal, es probable que se produzcan todos los procesos asociados con el reconocimiento de caras, independientemente de cuál sea la tarea, y la forma más eficaz de generar una condición de control en la que no se produzcan esos procesos es presentar un estímulo que no sea una cara (Kanwisher et al., 1996).
Los resultados de la Parte I mostraron sólo una región que se activó de forma consistente en todos los sujetos para la comparación de caras frente a objetos; esta área estaba en la circunvolución fusiforme derecha (y/o los surcos adyacentes). Nuestra hipótesis es que esta región está especializada en algún aspecto de la percepción de caras, y en las partes II y III probamos alternativas a esta hipótesis con varias comparaciones de estímulos diferentes. En la Parte II, cada uno de los cinco sujetos que habían revelado una clara activación fusiforme de la cara en la Parte I fue probado en dos nuevas comparaciones de estímulos. En cada una de ellas, los detalles metodológicos eran idénticos a los de las pruebas de caras frente a objetos, y sólo diferían los conjuntos de estímulos. Nuestra primera comparación de estímulos en la Parte II fue entre rostros de dos tonos intactos (creados por el umbral de las fotografías utilizadas en la Parte I) y rostros de dos tonos revueltos en los que las regiones negras componentes fueron reorganizadas para crear un estímulo irreconocible como un rostro (ver Fig. 3b). Esta manipulación preservó la luminancia media y algunas características de bajo nivel de los estímulos de caras de dos tonos y evitó producir las marcas de «cortar y pegar» que han sido un problema en los procedimientos de codificación de algunos estudios anteriores; este contraste, por lo tanto, sirvió como una prueba cruda de si las «áreas de cara» estaban simplemente respondiendo a las características visuales de bajo nivel presentes en los estímulos de cara pero no de no cara. Nuestro segundo contraste de estímulos -fotografías de caras vistas de frente versus fotografías de casas vistas de frente (ver Fig. 3c)- fue diseñado para probar si el «área de la cara» estaba involucrada no en la percepción de la cara per se, sino más bien en el procesamiento y/o la distinción entre cualquier ejemplar diferente de una sola clase de objetos.
Resultados de la Parte II. Columna de la izquierda, Ejemplares de estímulos utilizados para la comparación entre caras y objetos, así como para las dos pruebas posteriores. Columna central, Áreas que produjeron una activación significativamente mayor para las caras que para los estímulos de control para el sujeto S1. a, La comparación de caras frente a objetos se utilizó para definir una única ROI (mostrada en contorno verde para S1), por separado para cada sujeto. Los cursos de tiempo en la columna de la derecha se produjeron (1) promediando el porcentaje de cambio de señal a través de todos los vóxeles en el ROI de un sujeto dado (utilizando los datos originales sin suavizar), y luego (2) promediando estos ROI-medios a través de los cinco sujetos. F y O en a indican épocas de caras y objetos; I y S en b indican épocas de caras intactas y revueltas; y F y H en c indican épocas de caras y manos.
Resultados de la Parte III. Los contrastes de estímulo para cada prueba se muestran en la columna de la izquierda.a, Las ROIs de caras se definieron por separado para cada sujeto utilizando la media de dos escaneos de caras frente a objetos como se describe para la Figura 3a. El corte cerebral resultante con superposición estadística para un sujeto (S10) se muestra en la columna central, y el curso temporal de la intensidad de la señal promediada sobre las ROI de los cinco sujetos se muestra a la derecha. Como se describe en la Figura 3a (Parte II), la ROI especificada sobre la base de la comparación de caras frente a objetos se utilizó para las dos comparaciones posteriores de la visualización pasiva de caras de tres cuartos frente a manos (b), y la tarea de correspondencia consecutiva de caras de tres cuartos frente a manos (c).
En la Parte III, un conjunto nuevo pero superpuesto de cinco sujetos que habían revelado áreas candidatas claras de caras en la Parte I se probaron en dos nuevas comparaciones. (Los sujetos S1 y S2 participaron tanto en la Parte II como en la III.) En la primera comparación nueva, los sujetos vieron pasivamente fotografías de tres cuartos de caras (todas eran de personas con el pelo metido dentro de un gorro de esquí de punto negro) frente a fotografías de manos humanas (todas tomadas desde el mismo ángulo y aproximadamente en la misma posición). Esta comparación (véase la Fig. 4b) se diseñó para poner a prueba varias cuestiones diferentes. En primer lugar, ¿se generalizaría la respuesta del área facial candidata a diferentes puntos de vista? En segundo lugar, ¿está esta área implicada en el reconocimiento de la cara sobre la base del pelo y otros rasgos externos de la cabeza (Sinha y Poggio, 1996) o sobre la base de sus rasgos internos? Dado que los rasgos externos estaban en gran medida ocultos (y eran muy similares entre los ejemplares) en las caras con gorro de esquí, una respuesta de esta área a estos estímulos sugeriría que está implicada principalmente en el procesamiento de los rasgos internos en lugar de los externos de la cara. En tercer lugar, el uso de manos humanas como condición de control también proporcionó una prueba de si el área de la cara respondería a cualquier parte del cuerpo animada o humana. En la segunda comparación nueva, se presentaron los mismos estímulos (caras de tres cuartos frente a manos) mientras los sujetos realizaban una tarea de «1-back» buscando repeticiones consecutivas de estímulos idénticos (pulsando un botón cada vez que detectaban una repetición). Para esta tarea, se intercaló un campo gris en blanco de 250 mseg entre cada presentación sucesiva de 500 mseg de una cara. El campo gris producía transitorios sensoriales a lo largo de todo el estímulo y, por lo tanto, requería que los sujetos confiaran en información visual de nivel superior para realizar la tarea (Rensink et al., 1997). Dado que la tarea de 1 vuelta era, en todo caso, más difícil para los estímulos de manos que para los de caras, los primeros deberían involucrar los mecanismos atencionales generales al menos tan fuertemente como los segundos, descartando cualquier explicación de la mayor activación de las caras en términos de mecanismos atencionales generales.
Las pruebas de cada sujeto en las Partes II y III se ejecutaron en la comparación básica de caras versus objetos de la Parte I en la misma sesión, de modo que los resultados de la Parte I pudieran utilizarse para generar las ROI precisas para ese sujeto para las comparaciones en las Partes II y III. Para las condiciones de visión pasiva, se instruyó a los sujetos para que mantuvieran la fijación en el punto cuando éste estuviera presente, y para que, en caso contrario, se limitaran a mirar atentamente los estímulos sin realizar otros juegos mentales al mismo tiempo.
Sujetos. Se realizaron pruebas a 20 sujetos normales menores de 40 años, y todos los sujetos declararon tener una visión normal o corregida a normal y no tener antecedentes neurológicos. Los datos de cinco de ellos se omitieron debido al excesivo movimiento de la cabeza u otros artefactos. De los 15 sujetos restantes (9 mujeres y 6 hombres), 13 participantes se describieron como diestros y dos como zurdos. Los 15 sujetos participaron en la Parte I. (Al sujeto S1 se le aplicó la Parte I muchas veces en diferentes sesiones de exploración repartidas a lo largo de un periodo de 6 meses, tanto para medir la fiabilidad de la prueba en un mismo sujeto a lo largo de las sesiones como para comparar los resultados de la Parte I con una serie de otros estudios piloto realizados durante este periodo). Los sujetos S1, S2, S5, S7 y S8 de la Figura 2 se ejecutaron en la Parte II, y los sujetos S1, S5, S9, S10 y S11 de la Figura 2 se ejecutaron en la Parte III. Los sujetos S1-S10 se describieron como diestros, mientras que los sujetos S11 y S12 se describieron como zurdos. Los procedimientos experimentales fueron aprobados tanto por el Comité de la Universidad de Harvard sobre el Uso de Sujetos Humanos en la Investigación como por el Subcomité de Estudios Humanos del Hospital General de Massachusetts; se obtuvo el consentimiento informado de cada participante.
Dos filas inferiores, Imágenes anatómicas superpuestas con mapas estadísticos codificados por colores de los 10 sujetos diestros de la Parte I que mostraron regiones que produjeron una señal de RM significativamente más fuerte durante la visualización de caras que de objetos. Para cada uno de los sujetos diestros (S1-S10), se muestra el corte que contiene la activación facial fusiforme derecha; para los sujetos zurdos S11 y S12, todas las activaciones faciales fusiformes son visibles en los cortes mostrados. Los datos de los sujetos S1 y S2 se reparten en cortes sagitales, coronales y axiales (arriba a la derecha). No se muestran los datos de los tres sujetos que no mostraron ninguna región que respondiera significativamente más fuerte para las caras que para los objetos.
Estímulos. En las figuras 3 y 4 se muestran muestras de los estímulos utilizados en estos experimentos. Todos los estímulos tenían un tamaño de ∼300 × 300 píxeles y eran fotografías en escala de grises (o imágenes similares a fotografías), excepto las caras intactas y revueltas en dos tonos utilizadas en la Parte II. Las fotografías de rostros de las Partes I y II eran 90 fotografías de identificación de estudiantes de primer año obtenidas con el consentimiento de los miembros de la clase de Harvard de 1999. Las fotografías de caras de tres cuartos utilizadas en la Parte II eran de miembros o voluntarios del Laboratorio de Ciencias de la Visión de Harvard. (Para la mayoría de los sujetos ninguna de las caras era familiar.) Las 90 fotos de objetos variados (y fotos parecidas) se obtuvieron de varias fuentes e incluían vistas canónicas de objetos familiares como una cuchara, un león o un coche. Las 90 fotografías de casas fueron escaneadas de un libro de arquitectura y eran desconocidas para los sujetos.
Cada exploración duró 5 minutos y 20 segundos y consistió en seis épocas de estímulo de 30 segundos intercaladas con siete épocas de fijación de 20 segundos. Durante cada época de estímulo en las Partes I y II, se presentaron 45 fotografías diferentes en la zona foveal a un ritmo de una cada 670 mseg (con el estímulo encendido durante 500 mseg y apagado durante 170 mseg). Las épocas de estímulo se alternaban entre las dos condiciones diferentes que se comparaban, como se muestra en las figuras 1, 3 y 4. Los 45 estímulos diferentes utilizados en la primera época de estímulos eran los mismos que los utilizados en la quinta época de estímulos; los estímulos utilizados en la segunda época de estímulos eran los mismos que los utilizados en la sexta. Los estímulos de la Parte III fueron los mismos en cuanto a estructura y tiempo, excepto que (1) se utilizaron un total de 22 estímulos de cara y 22 estímulos de mano (la mayoría de los estímulos ocurrieron dos veces en cada época), y (2) el intervalo entre los estímulos de cara o mano fue de 250 mseg.
Resultados del sujeto S1 en la Parte I. El hemisferio derecho aparece a la izquierda en estas y en todas las imágenes cerebrales de este trabajo (excepto las imágenes reajustadas etiquetadas como «Axial» en la Fig. 2). Las imágenes cerebrales de la izquierda muestran en color los vóxeles que produjeron una intensidad de señal de RMN significativamente mayor (basada en datos suavizados) durante las épocas que contenían caras que durante las que contenían objetos (1a) y viceversa (1b) para 1 de los 12 cortes escaneados. Estas imágenes significativas (véase la clave de color a la derecha para ésta y todas las figuras de este artículo) se superponen a una imagen anatómica ponderada en T1 del mismo corte. La mayoría de los otros 11 cortes no mostraron vóxeles que alcanzaran la significación en el nivel p < 10-3 o mejor en cualquier dirección de la comparación. En cada imagen, se muestra un ROI delineado en verde, y el curso temporal del cambio de señal porcentual en bruto durante el escaneo de 5 minutos y 20 segundos (basado en datos no suavizados y promediados a través de los vóxeles en este ROI) se muestra a la derecha. Las barras grises verticales marcadas con una F indican las épocas en las que se presentaron caras; las barras grises con una O indican las épocas en las que se presentaron objetos variados; las barras blancas indican las épocas de fijación.
Las secuencias de estímulos se generaron utilizando el software MacProbe (Hunt, 1994) y se grabaron en una cinta de vídeo para su presentación mediante un proyector de vídeo durante las exploraciones. Los estímulos se retroproyectaron en una pantalla de cristal y se vieron en un espejo sobre la frente del sujeto (el ángulo visual de los estímulos era ∼15 × 15°).
Adquisición de la RMN. Las exploraciones se llevaron a cabo utilizando el escáner de RMN de 1,5 T (General Electric Signa, Milwaukee, WI) en el Centro de RMN del Hospital General de Massachusetts (Charlestown, MA), utilizando imágenes ecoplanares (Instascan, ANMR Systems, Wilmington, MA) y una bobina de superficie de recepción bilateral en cuadratura (realizada por Patrick Ledden, Centro de RMN del Hospital General de Massachusetts). Los datos funcionales se obtuvieron utilizando una secuencia de eco de espín asimétrico (TR = 2 segundos, TE = 70 mseg, ángulo de flip = 90°, offset de 180° = 25 mseg). Los 12 cortes de 6 mm se orientaron en paralelo al borde inferior de los lóbulos occipital y temporal y cubrieron la totalidad del lóbulo occipital y la mayor parte del lóbulo temporal (véase la Fig. 5). El movimiento de la cabeza se minimizó con una barra de mordida. El tamaño del voxel fue de 3,25 × 3,25 × 6 mm. Los detalles de nuestro procedimiento son los descritos en Tootell et al. (1995), excepto lo que se indica aquí.
Imagen anatómica medio sagital del sujeto S1 que muestra la colocación típica de los 12 cortes utilizados en este estudio. Los cortes se seleccionaron de forma que incluyeran toda la superficie ventral de los lóbulos occipital y temporal.
Análisis de datos. Cinco sujetos de los 20 escaneados tenían un movimiento excesivo de la cabeza y/o informaron de haberse quedado dormidos durante una o más carreras; los datos de estos sujetos se omitieron de los análisis posteriores. El movimiento se evaluó dentro de una serie buscando (1) un cambio visible en la imagen funcional de un corte dado entre la primera y la última imagen funcional de una serie, (2) regiones activadas que se curvaban alrededor del borde del cerebro y/o cambiaban de lado cuando se invertía el signo de la comparación estadística, y/o (3) rampas en el curso temporal de la intensidad de la señal de un solo vóxel o conjunto de vóxeles. El movimiento a lo largo de las series se evaluó inspeccionando visualmente las imágenes funcionales sin procesar para detectar cualquier cambio en la forma de un corte cerebral a lo largo de las series.
Para los 15 sujetos restantes no se llevó a cabo ninguna corrección de movimiento. Los datos piloto habían indicado que la significación de una sola serie era a veces débil, pero se volvía mucho más fuerte cuando se promediaba a través de dos series idénticas dentro de un sujeto (es decir.Cuando los dos valores correspondientes a cada vóxel, uno de cada exploración, se promediaron juntos para cada una de las 160 imágenes × 12 cortes recogidos durante una única exploración de 5 minutos y 20 segundos). Por lo tanto, ejecutamos cada prueba dos veces en cada sujeto, y promediamos las dos ejecuciones de cada prueba. A continuación, los datos se analizaron estadísticamente mediante una prueba de Kolmogorov-Smirnov, después de suavizarlos con un núcleo de Hanning sobre un área de voxel de 3 × 3 para producir una resolución funcional aproximada de 6 mm. Este análisis se ejecutó en cada vóxel (después de incorporar un retraso de 6 segundos para el retraso hemodinámico estimado), probando si la intensidad de la señal de RM en ese vóxel era significativamente mayor durante las épocas que contenían una clase de estímulos (por ejemplo, caras) que las épocas que contenían la otra (por ejemplo, objetos). Las áreas de activación se mostraron en representaciones de color del nivel de significación, superpuestas en imágenes anatómicas de alta resolución del mismo corte. Los voxeles de activación significativa también se inspeccionaron visualmente trazando el curso temporal de la intensidad de la señal cruda (no suavizada) durante los 5 min 20 seg de la exploración.
Para identificar todas las regiones dentro de nuestros cortes elegidos y el rango de la bobina que respondieron más fuertemente a las caras que a los objetos en la Parte I, así como sus coordenadas de Talairach, los datos anatómicos y funcionales de cada sujeto se ajustaron primero en su propio espacio de Talairach y luego se analizaron (utilizando el programa Tal-EZ de Bush et al., 1996) para encontrar todas las regiones que producían una señal más fuerte para las caras que para los objetos en el nivel de significaciónp < 10-4 (sin corrección de comparaciones múltiples). Este análisis tenía como objetivo buscar áreas candidatas para las caras y reveló que la única región en la que la mayoría de nuestros sujetos mostraba una activación significativamente mayor para las caras que para los objetos era la circunvolución fusiforme derecha. Por lo tanto, esta región se convirtió en el foco de nuestras investigaciones más detalladas en las Partes II y III.
Para cada sujeto en las Partes II y III, se identificó una ROI de caras que estaba compuesta por todos los vóxeles contiguos en la región fusiforme derecha en la que (1) la intensidad de la señal de RM era significativamente más fuerte durante las épocas de caras que de objetos en el nivel p < 10-4, y (2) una inspección visual de los datos del curso de tiempo en bruto de ese vóxel no reveló ninguna rampa obvia, picos u otros artefactos. Para el sujeto S11, que era zurdo y tenía activaciones muy grandes y altamente significativas tanto en el giro fusiforme izquierdo como en el derecho, la ROI utilizada en la Parte III incluía ambas regiones.
Para cada una de las comparaciones en las Partes II y III, primero promediamos los dos recorridos de cada sujeto y luego promediamos los vóxeles en la ROI facial predefinida de ese sujeto (de la Parte I) para obtener el curso temporal de la intensidad de la señal en bruto en la ROI de ese sujeto. A continuación, se llevaron a cabo otros dos análisis. En primer lugar, se calculó la intensidad media de la señal de RM en el ROI de cada sujeto para cada época (promediando dentro de un sujeto todos los vóxeles de su ROI y todas las imágenes recogidas en cada época). Las intensidades medias de la señal de RM para cada sujeto y época de estímulo se introdujeron en un ANOVA de tres vías entre sujetos (número de época × cara/control × prueba) por separado para las Partes II y III. El factor del número de épocas tenía tres niveles correspondientes a la primera, segunda y tercera épocas de cada condición; el factor de la prueba tenía tres niveles para las tres comparaciones de estímulos diferentes (caras frente a objetos/encuadrados frente a caras intactas/caras frente a casas para la Parte II y caras frente a objetos/caras pasivas frente a manos/caras de espaldas frente a manos para la Parte III). Estos ANOVAs nos permitieron comprobar la importancia de las diferencias en la intensidad de la señal entre las distintas condiciones de caras y de control y también comprobar si esta diferencia interactuaba con el número de épocas y/o el tipo de comparación.
En segundo lugar, para cada sujeto convertimos el curso temporal bruto de la intensidad de la señal de RM de la ROI de la cara de ese sujeto en un curso temporal de cambio de señal porcentual, utilizando la señal media de ese sujeto a través de todas las épocas de fijación en las mismas carreras (en la ROI de la cara) como línea de base. Estos cursos de tiempo de cambio de señal porcentual para el ROI de la cara de cada sujeto pudieron ser promediados a través de los cinco sujetos que fueron ejecutados en la misma prueba, para todas las pruebas en las Partes I a III. Al promediar el ROI de cada sujeto y todos los datos recogidos durante cada tipo de época, obtuvimos un cambio de señal porcentual medio para las condiciones de cara y de control para cada prueba. La relación del porcentaje de cambio de señal para las caras frente a la condición de control para cada prueba proporciona una medida de la selectividad de la ROI de la cara para el contraste del estímulo utilizado en esa prueba.