Genome-Wide Association Studies in Autism

Deși nu este învechită, abordarea genei candidate a fost depășită în importanță de studiul de asociere la nivel de genom (GWAS), la sfârșitul anilor 2000. Progresele în înțelegerea noastră în ceea ce privește variația comună a SNP în genomul uman, combinate cu dezvoltarea platformelor de genotipare bazate pe matrice de mare capacitate, au permis efectuarea de GWAS fără ipoteze. Aceste abordări permit interogarea a mai multe sute de mii de markeri SNP în întregul genom la mai multe mii de indivizi. Au fost efectuate multe GWAS care examinează riscul genetic al tulburărilor psihiatrice, inclusiv patru care examinează tulburările din spectrul autist.

Interpretarea unui semnal de asociere în GWAS utilizează, în general, abordări frequentiste, bazate pe pragul arbitrar de 1 la 20, sau P < 0,05,. Datorită numărului mare de SNP-uri testate simultan în GWAS, un prag convențional de semnificație statistică de P = 0,05, ar fi mult prea indulgent și ar duce la multe mii de rezultate fals pozitive. O corecție Bonferroni tradițională, prin care pragul de semnificație este ajustat în funcție de numărul de teste independente, sugerează un singur prag GWAS de ~ 1 × 10-8 până la 5 × 10-8 pentru studiile care utilizează markeri cu o frecvență a alelei minore mai mare de 5 % (Hoggart et al., 2008). Dacă se utilizează un prag mai mic al frecvenței alelei minore, atunci numărul de teste independente va crește și ar trebui aplicată o corecție mai strictă.

Wang și colegii (2009) au efectuat o GWAS bazată pe familie pe 780 de familii AGRE, o GWAS bazată pe control de caz pe 1.204 cazuri din colecția ACC (Autism Case-Control) și un număr suplimentar de 6.491 de controale CHOP (Children’s Hospital of Philadelphia) genotipate pe Illumina HumanHap550 BeadChip. Toți indivizii au fost definiți ca având ascendență europeană. Nici analiza pe bază de familie, nici cea de caz-control nu au dat rezultate semnificative pentru GW. O analiză combinată a produs o descoperire semnificativă pentru GW pe cromozomul 5p14.1 (rs4307059; P = 3,4 × 10-8) și un număr de semnale sugestive pe cromozomii 13q33.3, 14q21.1 și Xp22.32. O rundă de validare a regiunii cromozomului 5p14.1 a fost efectuată utilizând 477 de familii cu ascendență europeană din cadrul CAP (Collaborative Autism Project) bazat pe familie și 108 cazuri din studiul CART (Center for Autism Research and Treatment), împreună cu 540 de controale fără afecțiuni din Illumina iControlDB. Autorii evidențiază o replicare modestă până la puternică a semnalului de asociere pe cromozomul 5p14.1, cu un semnal de asociere maxim combinat în toate cele patru studii de 2,1 × 10-8 (rs4307059). Regiunea 5p14.1 evidențiată de Wang și colegii săi este un deșert de gene. Semnalul de asociere index (rs4307059) se află la aproximativ 1 Mb de genele cele mai apropiate, unde este aproximativ echidistant față de genele CDH9 centomerice și CDH10 telomerice.

Ma și colegii (Ma et al., 2009) au efectuat o GWAS bazată pe familie pe 438 de familii cu TSA din proiectul CAP cu un set de validare de 457 de familii din colecția AGRE. Toate probele au fost genotipate pe Illumina 1M Beadchip. Niciunul dintre markerii investigați nu s-a dovedit a fi semnificativ pentru GW în analizele de descoperire, validare sau combinate. Acest raport a fost o colaborare paralelă și reciprocă cu lucrarea publicată de Wang și colegii săi (descrisă mai sus), deși a folosit o matrice de genotipare de densitate mai mare. În ciuda diferențelor subtile în compoziția eșantioanelor din cele două rapoarte, autorii rețin un semnal de asociere puternic pe cromozomul 5p14.1. Asociațiile indexate de Ma și colegii săi în 5p14.1 nu sunt identice cu cele ale lui Wang și ale colegilor; cu toate acestea, ele apar în cadrul markerilor care prezintă un LD puternic cu acei markeri evidențiați de Wang și colegii săi. Deși aceste două rapoarte evidențiază regiunea 5p14.1, neindependența lor nu oferă un sprijin suplimentar pentru această regiune.

Weiss și colegii (2009) au efectuat o GWAS bazată pe familie într-o combinație de familii AGRE și NIMH genotipate pe array-ul Affymetrix 500K/5.0. Un total de 1.031 familii și 1.553 de descendenți afectați au fost utilizați pentru studiile de asociere. În scanarea inițială, autorii nu au găsit nicio asociere semnificativă pentru GW. Suplimentarea suplimentară a studiilor bazate pe familii a fost făcută cu un set de caz-control derivat din 90 de probanzi fără date despre părinți, care au fost ulterior împerecheați cu controale din colecția NIMH. Acest lucru a adunat un semnal suplimentar pentru cele mai bune rezultate. Un consorțiu de replicare de peste 2.000 de trio-uri a fost genotipat pentru 45 de SNP-uri în toate regiunile asociate de top. Consorțiul de replicare a inclus familii înscrise în Autism Genome Project Consortium, Homozygosity Mapping Collaborative for Autism, Massachusetts General Hospital, Children’s Hospital of Boston Autism Collection, Montreal Autism Collection, Finnish Autism Collection și altele. Singurul marker care a prezentat dovezi de replicare rezidă pe brațul scurt al cromozomului 5, la 5p15. Deși, la fel ca și cel al lui Ma și colegii (2009), acest raport are o suprapunere considerabilă cu familiile AGRE raportate de Wang și colegii (2009), Weiss și colegii nu au observat o asociere la 5p14.1. Asocierea de pe cromozomul 5p se află în imediata apropiere a TAS2R1. Gena TAS2R1 codifică un receptor cuplat cu proteina G care este implicat în recunoașterea gustului amar. Autorii evidențiază o genă candidată mai plauzibilă din punct de vedere biologic pentru TSA de aproximativ 80 kb telomerici, SEMA5A. SEMA5A codifică o genă importantă în ghidarea axonală care s-a dovedit a fi reglată în jos în cortexul lobului occipital, liniile celulare limfoblaste și limfocitele indivizilor cu autism.

În cele din urmă, a fost realizat un GWAS din AGP (Anney et al., 2010) folosind un design bazat pe familie și genotipat pe Illumina 1M Beadchip. Un total de 1 369 de familii, conținând 1 385 de descendenți afectați, au trecut controlul de calitate și au fost utilizate în analiza de asociere. Din analizele primare, a fost observată o singură descoperire semnificativă pentru GW pe cromozomul 20, la poziția 20p12, în cadrul locusului genei MACROD2 (rs414141463; P = 2,1 × 10-8). Un set de date de validare a fost extras din 595 de familii AGRE (1.086 de probandi) care nu erau deja prezente în analizele primare AGP. Pentru a spori puterea studiului, un eșantion de control suplimentar, colectat de la Study of Addiction Genetics (SAGE), a fost, de asemenea, genotipat cu ajutorul Illumina 1M Beadchip și a fost încorporat într-un design de caz-control cu probații AGP. Un sprijin statistic slab a fost observat pentru MACROD2 în eșantionul de validare AGRE, deși a arătat aceeași direcție a efectului pentru alela de risc. Analiza combinată a seturilor de date AGP, AGRE și SAGE arată toate un efect semnificativ pentru GW. Rolul MACROD2 este în mare parte necunoscut. Denumită anterior C20orf133, MACROD2 este una dintre cele mai mari gene din genom, cu o întindere de peste 2 Mb. MACROD2 (MACRO-domain containing 2) este denumită astfel din cauza domeniului MACRO din proteină. Acest domeniu este un modul de legare a ADP-ribozei (Karras et al., 2005) care a fost implicat în ADP-ribosilarea proteinelor, o modificare post-translațională importantă care are loc într-o varietate de procese biologice, cum ar fi repararea ADN-ului, transcripția, biologia cromatinei și formarea memoriei pe termen lung (Cohen-Armon et al., 2004). Dovezile directe au arătat că proteina MACROD2 are un rol în repararea ADN-ului (Timinszky et al., 2009) și posibile roluri în formarea heterocromatinei, modificarea histonelor și biologia sirtuinei (Chen et al., 2011; Hoff și Wolberger, 2005; Liou et al., 2005). De remarcat, semnalul de asociere observat în AGP, deși etichetat la gena MACROD2, rezidă într-o regiune intronică în apropierea unui ARN intragenic non-codificator de proteine NCRNA00186.

Când se examinează cele mai mari trei studii GWAS de până acum – cele ale lui Wang și colaboratorii (2009), Weiss și colaboratorii (2009) și Anney și colaboratorii (2010) – nu există niciun sprijin pentru loci evidențiați de fiecare manuscris în investigațiile ulterioare. Evaluările acestor studii sugerează că o combinație a acestor date ar duce la diminuarea semnalelor de asociere și la o pierdere a dovezilor, ceea ce le-ar face nesemnificative (Devlin et al., 2011). Prin urmare, concluzia acestor studii timpurii este că variația comună examinată pe matricile respective nu imprimă un efect modest asupra riscului de a dezvolta TSA.

Una dintre expresiile care a devenit frecvent aplicată la loci în cazul în care nu se reușește să se reproducă o anumită constatare este „blestemul învingătorului”. Acesta este un scenariu în care ‘câștigătorii’, sau rezultatele de top ale unui studiu, și-au obținut poziția în vârful grămezii prin evenimente oarecum favorabile în procedurile de eșantionare și experimentale (de exemplu, erori favorabile de genotipare). Se presupune că, în realitate, dimensiunea reală a efectului în populație se îndreaptă spre limitele mai conservatoare ale intervalelor de încredere pentru acești markeri. Pentru a identifica mai bine acei markeri influențați de blestemul învingătorului și, probabil, de blestemul învinsului, este important să reducem impactul acestor prejudecăți prin îmbunătățirea estimărilor noastre privind adevăratele dimensiuni ale efectului. Deși dimensiunea eșantionului va îmbunătăți puterea unui studiu de a observa un efect, acesta nu este singurul factor care poate face acest lucru. Alte influențe asupra puterii unui studiu de asociere genetică sunt pragul de semnificație, dezechilibrul de legătură între markerul test și markerul cauzal, frecvența alelelor markerului test și magnitudinea efectului.

În practică, se poate reuși să se reducă pragul necesar pentru a atinge semnificația prin reducerea poverii testelor multiple. Această abordare îndepărtează modelul de studiu de la abordarea GWAS fără ipoteze și se îndreaptă spre modele de testare a ipotezelor bazate pe gene și grupuri de gene specifice. De exemplu, s-ar putea prezice că genele implicate în ghidarea axonilor și sinapsele sunt importante în etiologia TSA. Examinarea doar a genelor implicate în aceste procese sau exprimate în aceste structuri ar reduce, de fapt, numărul de teste și povara ulterioară a testelor multiple.

Dezechilibrul de legătură, fenomenul prin care un marker este coeredat cu un alt marker, a fost utilizat pentru a identifica variantele de risc în boală fără a fi nevoie să se testeze direct adevăratul marker cauzal. În schimb, un marker care este puternic corelat cu varianta de risc poate fi examinat ca un proxy pentru varianta de risc. Microrețelele utilizate în cadrul GWAS sunt concepute pentru a acoperi întregul genom, profitând de dezechilibrul de legătură pentru a reduce redundanța markerilor și maximizând corelația cu markerii netipizați. Cu toate acestea, acest lucru nu duce la o acoperire perfectă a genomului și poate limita descoperirea sau intensitatea semnalului de asociere pentru adevărata variantă de risc. Pentru a reduce influența dezechilibrului de legătură, cercetătorii pot:

Examina direct mai mulți markeri prin intermediul unor microrețele mai dens populate (de ex, Illumina HumanOmni5-Quad care conține ~ 4,3 milioane de markeri);

Examinați în mod direct mai mulți markeri prin abordări de secvențiere care nu sunt limitate la liste de markeri predefinite;

Examinați indirect mai mulți markeri prin imputarea datelor lipsă (Marchini și Howie, 2010).

Abordările de imputare a genotipurilor sunt considerabil mai atractive pentru cercetătorii care examinează date pregenotipate, deoarece nu necesită costurile considerabile ale regenotipării. Rutinele de imputare a genotipurilor utilizează informații privind structura haplotipurilor unui panel de referință de indivizi genotipați pe un set mare de markeri pentru a deduce genotipurile lipsă în setul de date de testare. Pe lângă imputarea datelor parțial lipsă, aceste metode pot imputa markerii lipsă în studiile care utilizează date de la diferite platforme de genotipare, iar în proiectele bazate pe familii pot fi extinse la imputarea indivizilor lipsă (Li et al., 2009). Panourile de haplotipuri de referință derivate din proiectul HapMap (http://www.hapmap.org) și din proiectul 1.000 de genomuri (http://www.1000genomes.org) sunt disponibile în prezent pentru a crește acoperirea variației comune în GWAS. Aceste panouri de referință pot, în principiu, să crească acoperirea markerilor la mai mult de 20 de milioane de SNP-uri, deși cu cerințele unui timp de calcul non-trivial.

Teoretic, se poate încerca să se influențeze frecvența alelelor în populația de testare investigată și, la rândul său, să se mărească mărimea efectului prin examinarea unor populații clinice mai omogene. Prezentarea eterogenă a populației cu TSA evidențiază posibilitatea că ar putea exista un oarecare merit în identificarea indivizilor cu prezentări clinice similare pentru a îmbogăți, în mod presupus, studiul pentru identitate genetică. S-ar putea prezice că, la indivizii asemănători din punct de vedere clinic, este mai probabil ca bazele genetice să fie analoge, îmbogățind astfel, putativ, frecvența alelelor și mărimea efectului în populația testată. În această populație îmbogățită, este nevoie de mai puțini indivizi pentru a observa un efect decât într-o populație mixtă. În toată literatura de specialitate privind legăturile, genele candidate și GWAS, cercetătorii au explorat această abordare în grupuri de indivizi cu TSA cu o serie de constrângeri bazate pe ipoteze, inclusiv sexul, strămoșii și clasificatorii de diagnostic, cum ar fi nivelul de limbaj, funcția cognitivă și gruparea clinică și statistică a datelor privind trăsăturile (de ex, Anney et al., 2010; Liu et al., 2011; Salyakina et al., 2010), deși fără îmbunătățirea dorită a semnalului de asociere peste ceea ce ar fi fost de așteptat având în vedere sarcina crescută a testelor multiple.

În cele din urmă, după cum s-a menționat mai sus, se poate îmbunătăți puterea unui studiu prin creșterea numărului de indivizi examinați în cadrul studiului. O mega- și meta-analiză a datelor GWAS ASD disponibile este în prezent în curs de desfășurare ca parte a Grupului de lucru ASD al Psychiatric GWAS Consortium. Acest studiu include date de la familiile raportate în GWAS publicate, alături de alte familii și pacienți din Autism Genome Project, Simons Simplex Collection și Finnish Autism Collection. Analizele combinate vor include date de la aproximativ 5.600 de persoane cu TSA. Aceste colecții combinate vor oferi cea mai solidă examinare a genelor candidate de până acum. Mai mult decât atât, vor face acest lucru fără ambiguități față de neindependența studiilor. Natura colaborativă a domeniului geneticii TSA a dus adesea la partajarea resurselor între studii. Acest lucru este evidențiat de includerea, într-o măsură variabilă, a indivizilor din colecția AGRE (http://www.agre.org) fie în faza de descoperire, fie în faza de replicare a multor studii genetice. Mega-analizele care utilizează date genotipice brute au permis identificarea acestor indivizi și, de asemenea, a celor care s-au înscris în programe de cercetare în mai mult de un loc. Sursele de suprapunere criptică în eșantionare au potențialul de a conduce la interpretarea eronată a rezultatelor, cum ar fi asocierea umflată și falsa replicare. Prin urmare, combinarea seturilor de date poate oferi o imagine mai clară a implicării genelor candidate, fără confuzia neindependenței.

Lasă un răspuns

Adresa ta de email nu va fi publicată.