Mozog je složitý orgán obratlovců a skládá se z jednotlivých specializovaných buněk zvaných neurony. Neurony jsou mezi sebou propojeny synapsemi tvořícími složitou síť spojení. Spojení mezi neurony přenášejí signální impulsy, které nesou informace . Činnost mozku je většinou způsobena tímto souborem spojů.
Nedávné studie nezávisle na sobě prokázaly přísný vztah mezi souborem spojů, funkcemi mozku a vztahy mezi vznikem neurologických onemocnění a odchylkami mechanismu spojů vzhledem ke zdravým lidem . Například u Alzheimerovy choroby je zjištěna snížená konektivita a změny hipokampu , Parkinsonova choroba je spojena se změněnou konektivitou nebo u úzkostné poruchy je zjištěna zvýšená konektivita a změny amygdaly .
V důsledku toho zájem o modelování a analýzu celého systému mozkových elementů a jejich vztahů vedl k zavedení tzv. connectomiky, tj. studia connectomu označovaného jako soubor elementů a interakcí . Connectomika vychází z moderních technologií vyšetřování mozku, které jsou schopny pořídit jakýsi obraz mozkových spojení pacientů . Connectom lze analyzovat pomocí různých přiblížení, např. zaměřením na jednotlivé komponenty, tj. neurony a axony, nebo jejich seskupením do oblastí. Obvykle se analýza jednotlivých komponent definuje jako anatomická konektivita, zatímco analýza regionů se nazývá funkční konektivita, protože regiony obecně plní různé funkce.
Jedním z hlavních zdrojů pro získávání informací o konektivitě je magnetická rezonance (MRI) . Typický experiment MRI vytváří soubor snímků, které poskytují jak anatomické, tak funkční informace. První z nich tvoří axonální vlákna mezi korovými oblastmi, druhá poskytuje informace o funkční konektivitě, tj. aktivaci oblasti zájmu (ROI). Taková analýza se často provádí pomocí difuzního tenzorového zobrazování (DTI), které je specializovanou verzí difuzně váženého zobrazování magnetickou rezonancí (DWI nebo DW-MRI), a DTI se hojně využívá k mapování traktografie bílé hmoty v mozku prostřednictvím analýzy vzorců difuze molekul svazky nervových axonů. Anatomické struktury konektivity jsou primárně odvozovány aplikací algoritmů traktografie na data DTI. Data funkční konektivity jsou odvozena ze zobrazování funkční magnetickou rezonancí (fMRI). Snímky fMRI zobrazují aktivní oblasti mozku v daném okamžiku na základě úrovně spotřeby kyslíku v krvi. Získané sítě se nazývají funkční sítě. Kombinované použití těchto dvou technik slouží k určení struktury konektivity lidského mozku, jak je znázorněno na obr. 1.
Po získání je třeba data konektivity integrovat do vhodného modelu. Jedna z nejpoužívanějších reprezentací takových dat je dána teorií grafů, jejíž modely byly použity různými přístupy k získání klinicky relevantních informací . Teorie grafů zajišťuje možnost modelovat taková data do jednoho síťového modelu a následně možnost shrnout všechny charakteristiky do několika málo měřítek, což umožňuje pochopit uspořádání celé sítě i jednotlivých síťových prvků .
Na rozdíl od jiných druhů sítí je modelování konektivomů pomocí grafů otevřenou oblastí výzkumu, protože existuje mnoho možností definování uzlů, hran, které odpovídají různým měřítkům zobrazení. Například uzly mohou představovat neurony a hrany jejich axony . Zde se zaměříme na reprezentaci oblasti zájmu (ROI) jako uzlů a reprezentaci funkčních nebo anatomických spojení jako hran. Existují tři hlavní kategorie výzkumu aplikovaného na tyto sítě: (i) zdokonalení rekonstrukce grafů vycházejících ze snímků MRI, (ii) identifikace struktury sítí (tj. který teoretický model je základem uspořádání mozkových sítí), (iii) identifikace příslušných modulů, které lze využít k pochopení mozkových funkcí a jejich modifikací v případě onemocnění (např. pro včasnou detekci chorob). První a třetí problém se striktně opírají o definici rámce pro porovnávání grafů.
Přihlédneme-li například k prvnímu problému, je třeba poznamenat, že každý experiment s magnetickou rezonancí vytváří sérii snímků (buď z intra-subjektů, nebo inter-subjektů), které je třeba srovnat do prostorové oblasti. Při použití funkčních i strukturálních obrazů je koregistrace procesem zarovnání funkčních a strukturálních obrazů za účelem mapování funkčních informací do anatomického prostoru. Takto bude každá oblast odpovídat uzlu sítě s použitím atlasu k definování anatomicky významných oblastí .
Takový přístup však může vést ke značným nepřesnostem v případech abnormální anatomie (např. v přítomnosti nemocí) a raného vývoje mozku (např. u mozku dítěte). K řešení tohoto problému bylo nedávno navrženo použít parcelaci bez atlasu a konstruovat a porovnávat jednotlivé konektivomy pouze v prostoru sítě . Autoři v něm provádějí bezatlasovou parcelaci jako nejjemnější parcelaci, která ještě propojuje celý mozek a neponechává žádné izolované uzly. Poté seskupují subjekty do homogenních skupin a NA provádějí v rámci každé skupiny. Získá se součtová síť, která se mapuje na anatomii „referenčního mozku“.
Tato práce ukazuje možnost využití NA do pracovního postupu bez atlasové parcelace a staví před výzkumnou komunitu výzvu systematicky zkoumat výkonnost různých NA algoritmů, protože různé NA přístupy se široce uplatňují v molekulárně biologické analýze, ale dosud nebyly zkoumány ve vztahu k MRI konektivomice.
Techniky pro zarovnávání biologických sítí se dělí do dvou kategorií: (i) lokální zarovnání sítí hledá relativně malé podobné podsítě, které pravděpodobně představují konzervované funkční struktury, (ii) globální zarovnání sítí hledá nejlepší superimpozici celých vstupních sítí. Tyto přístupy však nelze snadno použít v problému zarovnávání connectomů. Důvod souvisí se strategií, na níž je založena metodika zarovnávání. Například lokální zarovnávače sítí, široce používané k sestavení zarovnání sítí proteinových interakcí (PIN) , berou jako vstup dvě sítě a seznam zárodečných uzlů, které slouží k sestavení počátečního grafu zarovnání (úplné podrobnosti o konstrukci grafu zarovnání viz níže). Tyto počáteční uzly se vybírají na základě biologického hlediska, jako jsou homologické vztahy mezi uzly PIN. Vzhledem k tomu, že uzly mozkových sítí představují ROI, nelze v případě konektivních sítí získat informace o homologii a pak nelze použít lokální zarovnání.
V tomto článku jsme vybrali šest existujících nejmodernějších algoritmů globálního zarovnání a tyto zarovnávače jsme otestovali na mozkových sítích získaných difuzní MRI. Testovány zde byly tyto algoritmy: MAGNA++ , NETAL , GHOST , GEDEVO , WAVE , Natalie2.0 . Tyto algoritmy jsou použity k sestavení zarovnání mezi sítěmi odvozenými z difuzní MRI mozku. Po sestavení zarovnání jsme porovnali výkonnost těchto algoritmů a vyhodnotili tuto robustnost.
Parcelace mozku
Zásadním krokem při analýze a makroskopickém mapování mozkové sítě je rozdělení mozku na rozsáhlé oblasti, známé také jako „proces parcelace“. Parcelace mozku spočívá v rozdělení mozku na soubor makroskopických, homogenních a nepřekrývajících se oblastí s ohledem na informace poskytované zpravidla technikami založenými na zobrazování magnetickou rezonancí (MRI) . Zejména MRI umožnila získat informace o anatomické konektivitě, funkční konektivitě nebo aktivaci související s úkolem. Různé důkazy ukazují, že parcelace mozku na homogenní oblasti není zdaleka definována, stejně jako definice okrajů a jejich umístění. V grafovém znázornění konektivity založené na parcelaci odpovídají uzly grafu oblasti mozku a hrany strukturálním nebo funkčním spojením mezi těmito oblastmi. Navzdory relativní jednoduchosti představuje aplikace teorie grafů na studium konektivomů některé zvláštní výzvy související se smysluplnou definicí uzlů a hran. Ideální model by měl reprezentovat skutečné subsystémy (jako uzly) a skutečné vztahy (jako hrany). Jak však bylo důkladně zkoumáno v , neexistuje jasný důkaz pro optimální definici uzlů i hran. Například ideální definice uzlů by měla seskupit množinu neuronů tak, aby maximalizovala funkční homogenitu uvnitř a maximalizovala funkční heterogenitu mezi různými uzly. Navíc by měla zohledňovat prostorové (a snad i časové) vztahy mezi uzly. Kromě definice je v současné době otevřenou výzvou také reprezentace hran, přičemž tento úkol souvisí s typem měřené konektivity a metodou použitou k její kvantifikaci. Jak bylo uvedeno výše, konektivita mozku se může vztahovat k různým aspektům organizace mozku, včetně (i) anatomické konektivity sestávající z axonálních vláken spojujících kortikální a subkortikální oblasti odvozené z difuzního zobrazování (viz obr. 2 (1)), a (ii) funkční konektivitu definovanou jako pozorované statistické korelace signálu závislého na hladině okysličení krve (BOLD) mezi oblastmi mozku.
To znamená, že volba parcelačního schématu má významný vliv na následnou analýzu. V současné době existují tři přístupy založené na parcelaci konektivity:
-
Parcelace mozku pomocí předem definovaných anatomických šablon. Tento přístup spočívá v registraci strukturálních snímků z MRI do anatomického atlasu na základě Brodmannových oblastí . Tímto způsobem je celý mozek rozdělen do označených oblastí podle různých označení oblastí šablon;
-
Parcelace mozku pomocí náhodně generovaných šablon . Pro náhodnou parcelaci se používají různé algoritmy, aby vznikly parcely přibližně stejné velikosti. Vygenerované šablony se tedy vyznačují přibližně stejně velkými oblastmi mozku, aby se zabránilo anatomickým zkreslením;
-
parcelace založená na konektivitě, jejímž cílem je vymezit oblasti mozku analýzou podobností ve strukturálních nebo funkčních vzorcích konektivity. Na základě představy, že oblasti s podobným profilem konektivity se podílejí na stejných analogických funkčních rolích, rozděluje parcelace založená na konektivitě malé zárodečné oblasti do největšího souboru funkčně homogenních oblastí mozku shlukováním zárodečných oblastí s podobnými profily konektivity.
Každá metoda však představuje určitá úskalí. Například registrace mozku studovaného subjektu do obecného mozku s definovanými Brodmannovými oblastmi vyvolává otázku přesnosti mapování. Ve většině případů se totiž hranice Brodmannových oblastí, původně definovaných pomocí cytoarchitektonických rozdílů mezi oblastmi mozku, neshodují s analyzovaným kortikálním povrchem.
Tento přístup je omezen variabilitou mezi subjekty a může být problematický zejména v souvislosti se zráním mozku. Navíc bylo prokázáno, že parcelace mozku pomocí předem definovaných anatomických šablon může negativně ovlivnit celou následnou analýzu zavedením zjevných zkreslení . V tomto článku se zaměřujeme na náhodné, bezatlasové definování uzlů u jednotlivých subjektů (viz obr. 2 (2)), které může umožnit plně síťově řízené studium mozku a porovnávání mozků různých subjektů a potenciálně i druhů .
Algoritmy globálního zarovnání sítí
Identifikace přesného mapování uzlů mezi bezatlasovými sítěmi může nabídnout významné podrobnosti o porovnávání mozků nebo struktury skupin subjektů, například zdravých versus nemocných subjektů. V biologických oborech bylo navrženo mnoho různých metod zarovnávání sítí .
Formálně je graf G definován jako G={V,E}, kde V je konečná množina uzlů a E je konečná množina hran. Nechť G 1={V 1,E 1} a G 2={V 2,E 2} jsou dva grafy, kde V 1,2 jsou množiny uzlů a E 1,2 jsou množiny hran, zarovnání grafů je takové mapování mezi uzly vstupních sítí, které maximalizuje podobnost mezi mapovanými entitami. Z teoretického hlediska spočívá problém zarovnání grafů v nalezení funkce zarovnání (nebo mapování) f:V 1→V 2, která maximalizuje nákladovou funkci Q. Podobnost mezi grafy je definována nákladovou funkcí Q(G 1,G 2,f), známou také jako kvalita zarovnání.
Nechť f je zarovnání mezi dvěma grafy G 1 a G 2, je-li dán uzel u z G 1, f(u) je množina uzlů z G 2, které jsou podle f zarovnány k u. Q vyjadřuje podobnost mezi dvěma vstupními grafy vzhledem ke konkrétnímu zarovnání f a formulace Q silně ovlivňuje strategii mapování.
Existují různé formulace Q, které spadají do následujících tříd:
Topologická podobnost:
Obvykle je nákladová funkce definována jako počet hran zachovaných pomocí f vzhledem k celkovému počtu hran ve zdrojové síti (G 1), což se také označuje jako správnost hran (EC) . EC tedy nebere v úvahu cílovou síť (G 2).
Další typickou mírou je indukovaná zachovaná struktura, ICS . Nechť D je počet hran v podsíti G 2 indukovaných na uzlech v G 2 zarovnaných na uzly v G 1, ICS f je poměr počtu hran zachovaných f k D.
kde D je |E(G 2)|.
IcS však selhává při penalizaci chybně zarovnaných hran v menší síti, protože bere v úvahu cílovou síť.
Nakonec skóre symetrické substruktury, S 3, bere v úvahu jedinečné hrany ve složeném grafu vzniklém překrytím dvou sítí.
Ukázalo se, že S 3 je lepší než stávající opatření, protože penalizuje jak zarovnání z řídkých oblastí grafu do hustých oblastí grafu, tak zarovnání z hustých oblastí grafu do řídkých oblastí grafu.
Podobnost uzlů: Tato funkce zohledňuje podobnost mezi mapovanými uzly. Uzly zarovnaných grafů si mohou být více či méně podobné. Zarovnání by tedy mělo zarovnat každý uzel jednoho grafu k nejpodobnějšímu uzlu druhého grafu za předpokladu funkce podobnosti uzlů, s(v 1,v 2)→R, v 1∈V 1, v 2∈V 2. Celkovým cílem je maximalizovat součet skóre s ohledem na srovnané uzly.
Hybridní přístupy: Některé nejnovější formulace Q zohledňují oba přístupy pomocí lineární kombinace.
Problém zarovnání sítě lze formulovat různými způsoby. Obecně lze zarovnání sítí klasifikovat jako lokální zarovnání nebo globální zarovnání.
Lokální zarovnání má za cíl nalézt více a nesouvisejících oblastí izomorfismu, tj. stejné struktury grafu, mezi vstupními sítěmi, přičemž každá oblast znamená mapování nezávisle na ostatních oblastech. Strategie se skládá z mapování nebo množiny mapování mezi podmnožinami uzlů tak, že jejich podobnost je maximální přes všechny možné podmnožiny. Tyto podsítě odpovídají zachovaným vzorcům interakcí, které mohou představovat zachovaný motiv nebo vzorec činností (přehled je k dispozici v ). Cílem globálního zarovnání je najít mapování, které by mělo pokrýt všechny uzly vstupních sítí, přičemž každý uzel sítě se přiřadí k jednomu uzlu ostatních sítí nebo se uzel označí jako mezera, pokud neexistuje žádná možná shoda. Tato strategie nebere v úvahu malé oblasti podobnosti, tj. konzervované motivy, ale snaží se najít konzistentní mapování mezi celou množinou uzlů sítí.
V této práci bylo pro sestavení globálního zarovnání mozkových sítí vybráno šest algoritmů globálního zarovnání. Dále uvádíme jejich stručný koncepční popis.
Oblíbenou existující metodou globálního zarovnání je MAGNA . MAGNA je globální zarovnávač sítí, který simuluje populaci zarovnání, která se vyvíjí v čase pomocí genetického algoritmu a funkce pro křížení dvou zarovnání do nadřazeného zarovnání. Protože genetický algoritmus simuluje evoluční proces řízený principem přežití nejsilnějšího, přežívají pouze zarovnání, tj. ta, která zachovávají nejvíce hran. MAGNA tedy postupuje do další generace, dokud nelze přesnost zarovnání dále optimalizovat. Nedávno bylo vyvinuto rozšíření algoritmu MAGNA nazvané MAGNA++.
Druhým zarovnávačem je NETAL , algoritmus pro globální zarovnání široce používaný pro sítě protein-proteinových interakcí. NETAL vytváří nejlepší globální zarovnání sítí použitím chamtivé metody založené na skórovací matici zarovnání, která je odvozena z biologických i topologických informací vstupních sítí.
Třetí algoritmus, GHOST , je globální párový zarovnávač sítí, který k měření topologické podobnosti mezi dílčími sítěmi používá nový spektrální podpis založený na topologii lokálního okolí. Myšlenka GHOST spočívá v kombinaci nové nové spektrální signatury s postupem seed-and-extend pro sestavení zarovnání.
Čtvrtým globálním zarovnávačem je GEDEVO , nový nástroj pro efektivní zarovnání grafů.
Základem metody GEDEVO je model Graph Edit Distance (GED), kdy je graf převeden do jiného grafu s minimálním počtem vložení a odstranění hran. GEDEVO tedy používá GED jako optimalizační model pro nalezení nejlepšího zarovnání.
Pátým algoritmem je WAVE obecná a nová strategie zarovnávání, jejímž cílem je optimalizovat zachování uzlů i hran při konstrukci zarovnání. WAVE se používá nad zavedenou nákladovou funkcí uzlu a vede k nové lepší metodě globálního zarovnání sítě tím, že upřednostňuje zachované hrany mezi uzly s podobnou nákladovou funkcí uzlu před těmi s nepodobnou nákladovou funkcí uzlu.
Posledním algoritmem je Natalie2.0 , metoda zarovnání sítě, která se na problém zarovnání sítě dívá jako na zobecnění kvadratického přiřazovacího problému a řeší jej pomocí technik z celočíselného lineárního programování.
.