An extensive assessment of network alignment algorithms for comparison of brain connectomes | BMC Bioinformatics

Mózg jest złożonym organem kręgowców i składa się z pojedynczych wyspecjalizowanych komórek zwanych neuronami. Neurony połączone są między sobą synapsami tworząc złożoną sieć połączeń. Połączenia między neuronami przenoszą impulsy sygnałowe, które niosą informację. Aktywność mózgu wynika głównie z tego zestawu połączeń.

Ostatnie badania wykazały w sposób niezależny ścisły związek pomiędzy zestawem połączeń, funkcjami mózgu i związkami pomiędzy występowaniem chorób neurologicznych i zmianami mechanizmu połączeń w odniesieniu do osób zdrowych. Na przykład w chorobie Alzheimera wykrywa się zmniejszoną łączność i zmiany w hipokampie, choroba Parkinsona wiąże się ze zmienioną łącznością lub w zaburzeniach lękowych stwierdza się zwiększoną łączność i zmiany w migdałku. W związku z tym zainteresowanie modelowaniem i analizą całego systemu elementów mózgu i ich relacji doprowadziło do wprowadzenia tzw. connectomics, czyli badania connectome, określanego jako zbiór elementów i interakcji. Connectomika opiera się na nowoczesnych technologiach badania mózgu, które są w stanie wykonać swoisty obraz połączeń mózgowych pacjentów. Connectomika może być analizowana z różnym przybliżeniem, np. poprzez skupienie się na pojedynczych elementach, tj. neuronach i aksonach, lub pogrupowanie ich w regiony. Zazwyczaj analiza pojedynczych komponentów jest określana jako łączność anatomiczna, podczas gdy analiza regionów nazywana jest łącznością funkcjonalną, ponieważ regiony pełnią różne funkcje.

Pośród innych, jednym z głównych źródeł pozyskiwania informacji o connectomie jest obrazowanie rezonansem magnetycznym (MRI). Typowy eksperyment MRI produkuje zestaw obrazów dostarczających zarówno informacji anatomicznych, jak i funkcjonalnych. Pierwszą z nich stanowią włókna aksonalne pomiędzy regionami korowymi, druga dostarcza informacji o funkcjonalnej łączności, tj. aktywacji regionów zainteresowania (ROI). Analiza taka jest często przeprowadzana przy użyciu obrazowania tensora dyfuzji (diffusion tensor imaging – DTI), które jest wyspecjalizowaną wersją obrazowania rezonansu magnetycznego ważonego dyfuzją (DWI lub DW-MRI), a DTI było szeroko stosowane do mapowania traktografii istoty białej w mózgu poprzez analizę wzorów dyfuzji cząsteczek przez wiązki aksonów neuronalnych. Struktury połączeń anatomicznych uzyskuje się głównie poprzez zastosowanie algorytmów traktografii do danych DTI. Dane dotyczące połączeń funkcjonalnych pochodzą z funkcjonalnego rezonansu magnetycznego (fMRI). Obrazy fMRI pokazują aktywne regiony mózgu w danym momencie, w oparciu o poziom zużycia tlenu we krwi. Uzyskane w ten sposób sieci nazywane są sieciami funkcjonalnymi. Połączone wykorzystanie tych dwóch technik służy do określenia struktury connectome ludzkiego mózgu, jak przedstawiono na Rys. 1.

Po uzyskaniu danych connectome należy zintegrować je z odpowiednim modelem. Jedną z najczęściej stosowanych reprezentacji takich danych jest teoria grafów, której modele zostały wykorzystane w różnych podejściach do ekstrakcji klinicznie istotnych informacji. Teoria grafów zapewnia możliwość modelowania takich danych w pojedynczy model sieciowy, a następnie możliwość podsumowania wszystkich cech w kilka miar, dając zrozumienie organizacji całej sieci, jak również poszczególnych jej elementów.

Odmiennie niż w przypadku innych rodzajów sieci, modelowanie połączeń za pomocą grafów jest otwartym obszarem badawczym, ponieważ istnieje wiele możliwości definiowania węzłów, krawędzi, które odpowiadają różnym skalom widzenia. Na przykład, węzły mogą reprezentować neurony, a krawędzie ich aksony. Tutaj skupiamy się na reprezentacji regionów zainteresowania (ROI) jako węzłów, oraz reprezentacji funkcjonalnych lub anatomicznych połączeń jako krawędzi. Istnieją trzy główne kategorie badań nad takimi sieciami: (i) poprawa rekonstrukcji grafów na podstawie obrazów MRI, (ii) identyfikacja struktury sieci (tj. jaki jest model teoretyczny leżący u podstaw organizacji sieci mózgowych), (iii) identyfikacja istotnych modułów, które mogą być wykorzystane do zrozumienia funkcji mózgu i ich modyfikacji w przypadku choroby (np. do wczesnego wykrywania chorób). Pierwszy i trzeci problem ściśle opierają się na zdefiniowaniu ram dla porównania grafów.

Rozważając, na przykład, pierwszy problem należy zauważyć, że każdy eksperyment MRI produkuje serię obrazów (zarówno wewnątrz- jak i między-podmiotowych), które muszą być wyrównane w dziedzinie przestrzennej. W przypadku wykorzystania zarówno obrazów funkcjonalnych, jak i strukturalnych, koregistracja jest procesem wyrównywania obrazów funkcjonalnych i strukturalnych w celu odwzorowania informacji funkcjonalnej w przestrzeni anatomicznej. W ten sposób każdy region będzie odpowiadał węzłowi sieci przy użyciu atlasu do definiowania anatomicznie znaczących regionów .

Niemniej jednak, takie podejście może prowadzić do znacznych niedokładności w przypadkach nieprawidłowej anatomii (np. w obecności chorób) i wczesnego rozwoju mózgu (np. w mózgu dziecka). Aby rozwiązać ten problem, zaproponowano ostatnio zastosowanie parcelacji bez atlasu oraz konstruowanie i porównywanie indywidualnych koneksomów tylko w przestrzeni sieciowej. Autorzy dokonują parcelacji bez atlasu jako najdokładniejszej parcelacji, która nadal łączy cały mózg, nie pozostawiając żadnych węzłów izolowanych. Następnie grupują badanych w homogeniczne grupy i w każdej z nich wykonują NA. Sieć sumaryczna jest otrzymywana i mapowana do anatomii „mózgu referencyjnego”.”

Taka praca demonstruje możliwość wykorzystania NA w procesie parcelacji bez atlasu i stawia przed społecznością badawczą wyzwanie systematycznego badania wydajności różnych algorytmów NA, ponieważ różne podejścia NA są szeroko stosowane w analizie biologii molekularnej, ale nie zostały jeszcze zbadane w odniesieniu do MRI connectomics.

Techniki wyrównywania sieci biologicznych dzielą się na dwie kategorie: (i) lokalne wyrównanie sieci wyszukuje stosunkowo małe podobne podsieci, które prawdopodobnie reprezentują konserwowane struktury funkcjonalne, (ii) globalne wyrównanie sieci poszukuje najlepszej superpozycji całych sieci wejściowych. Podejścia te nie mogą być jednak łatwo zastosowane w problemie wyrównywania połączeń sieciowych. Powodem tego jest strategia leżąca u podstaw metodologii wyrównywania. Na przykład, lokalne wyrównywarki sieciowe, szeroko stosowane do budowy sieci interakcji białek (PIN), przyjmują jako dane wejściowe dwie sieci oraz listę węzłów zalążkowych, służących do budowy wstępnego grafu wyrównawczego (patrz: pełne informacje na temat budowy grafu wyrównawczego). Te początkowe węzły są wybierane w oparciu o względy biologiczne, takie jak relacje homologiczne pomiędzy węzłami sieci PIN. Ponieważ węzły sieci mózgowych reprezentują ROI, informacja o homologii nie może być uzyskana w przypadku sieci konektomicznych i wtedy lokalne wyrównanie nie może być zastosowane.

W tej pracy wybraliśmy sześć istniejących algorytmów globalnego wyrównania i przetestowaliśmy te algorytmy na dyfuzyjnych sieciach mózgowych pochodzących z MRI. Testowane algorytmy to MAGNA++ , NETAL , GHOST , GEDEVO , WAVE , Natalie2.0 . Algorytmy te są stosowane do budowy dopasowań pomiędzy sieciami mózgów pochodzącymi z dyfuzyjnego rezonansu magnetycznego. Po zbudowaniu dopasowań, porównaliśmy wydajność tych algorytmów i oceniliśmy ich odporność.

Parcelacja mózgu

Niezbędnym krokiem w analizie i makroskopowym mapowaniu sieci mózgu jest podział mózgu na regiony o dużej skali, znany również jako „proces parcelacji”. Parcelacja mózgu polega na podziale mózgu na zbiór makroskopowych, jednorodnych i nienakładających się na siebie regionów w odniesieniu do informacji dostarczanych, ogólnie rzecz biorąc, przez techniki oparte na obrazowaniu rezonansem magnetycznym (MRI). W szczególności MRI pozwala na uzyskanie informacji na temat połączeń anatomicznych, połączeń funkcjonalnych lub aktywacji związanej z zadaniem. Różne dowody wskazują, że parcelacja mózgu na jednorodny region jest daleka od zdefiniowania, podobnie jak definicja krawędzi i ich umiejscowienie. W graficznej reprezentacji połączeń opartych na parcelacji, węzły grafu odpowiadają regionom mózgu, a krawędzie odpowiadają strukturalnym lub funkcjonalnym połączeniom pomiędzy tymi regionami. Pomimo względnej prostoty, zastosowanie teorii grafów do badania koneksomów stawia pewne szczególne wyzwania związane z sensownym definiowaniem węzłów i krawędzi. Idealny model powinien reprezentować prawdziwe podsystemy (jako węzły) i prawdziwe relacje (jako krawędzie). Jednakże, jak dogłębnie zbadano w , nie ma jasnych dowodów na optymalną definicję zarówno węzłów jak i krawędzi. Na przykład, idealna definicja węzła powinna grupować zbiór neuronów tak, aby zmaksymalizować jednorodność funkcjonalną wewnątrz i zmaksymalizować heterogeniczność funkcjonalną pomiędzy różnymi węzłami. Ponadto, powinna ona uwzględniać przestrzenne (i, miejmy nadzieję, czasowe) relacje pomiędzy węzłami. Poza definicją, reprezentacja krawędzi jest również obecnie otwartym wyzwaniem, a zadanie to jest związane z rodzajem mierzonej łączności i metodą stosowaną do jej kwantyfikacji. Jak wspomniano powyżej, łączność mózgu może odnosić się do różnych aspektów organizacji mózgu, w tym (i) łączności anatomicznej składającej się z włókien aksonalnych łączących regiony korowe i podkorowe, wywnioskowanej z obrazowania dyfuzyjnego (patrz Rys. 2 (1)), oraz (ii) łączności anatomicznej składającej się z włókien aksonalnych łączących regiony korowe i podkorowe, wywnioskowanej z obrazowania dyfuzyjnego (patrz Rys. 2 (2)). 2 (1)), oraz (ii) łączność funkcjonalną zdefiniowaną jako obserwowane statystyczne korelacje sygnału zależnego od poziomu utlenowania krwi (BOLD) pomiędzy regionami mózgu.

Czyli wybór schematu parcelacji ma istotny wpływ na późniejszą analizę. Obecnie istnieją trzy podejścia oparte na parcelacji connectome:

Parcelacja mózgu poprzez wykorzystanie predefiniowanych szablonów anatomicznych. Podejście to polega na rejestracji obrazów strukturalnych z MRI do atlasu anatomicznego opartego na obszarach Brodmanna. W ten sposób cały mózg jest dzielony na etykietowane regiony zgodnie z różnymi etykietami regionów szablonów;
Parcelacja mózgu przy użyciu losowo generowanych szablonów. Do losowej parcelacji stosuje się różne algorytmy, aby uzyskać działki o mniej więcej równej wielkości. W ten sposób, wygenerowane szablony charakteryzują się w przybliżeniu jednakowymi rozmiarami regionów mózgu, aby uniknąć anatomicznych uprzedzeń;
Parcelacje oparte na łączności, których celem jest wyznaczenie regionów mózgu poprzez analizę podobieństw w strukturalnych lub funkcjonalnych wzorcach łączności. Opierając się na założeniu, że regiony o podobnym profilu łączności są zaangażowane w te same analogiczne role funkcjonalne, parcelacja oparta na łączności dzieli małe regiony zalążkowe na największy zbiór funkcjonalnie jednorodnych regionów mózgu poprzez grupowanie zalążków o podobnych profilach łączności.

Jednakże każda z tych metod niesie ze sobą pewne pułapki. Na przykład, rejestracja mózgu badanej osoby do ogólnego mózgu z określonymi obszarami Brodmanna rodzi pytanie o dokładność mapowania. W rzeczywistości, w większości przypadków granice obszarów Brodmanna, pierwotnie zdefiniowane przy użyciu różnic cytoarchitektonicznych między regionami mózgu, nie pokrywają się z analizowaną powierzchnią korową.

Podejście to jest ograniczone przez zmienność międzypodmiotową i może być szczególnie problematyczne w kontekście dojrzewania mózgu. Ponadto wykazano, że parcelacja mózgu za pomocą predefiniowanych szablonów anatomicznych może mieć negatywny wpływ na wszystkie późniejsze analizy poprzez wprowadzenie oczywistych błędów. W tym artykule skupiamy się na losowym, wolnym od atlasu definiowaniu węzłów w poszczególnych obiektach (patrz Rys. 2 (2)), co może pozwolić na w pełni sieciowe badanie mózgu i porównywanie mózgów różnych podmiotów i, potencjalnie, gatunków .

Global network alignment algorithms

Identyfikacja dokładnego odwzorowania węzłów pomiędzy sieciami wolnymi od atlasu może zaoferować znaczące szczegóły na temat porównania mózgów lub struktury grup podmiotów, takich jak podmioty zdrowe versus chore. Wiele różnych metod wyrównywania sieci zostało zaproponowanych w dziedzinach biologicznych .

Formalnie, graf G jest zdefiniowany jako G={V,E}, gdzie V jest skończonym zbiorem węzłów, a E jest skończonym zbiorem krawędzi. Niech G 1={V 1,E 1} i G 2={V 2,E 2} będą dwoma grafami, gdzie V 1,2 są zbiorami węzłów, a E 1,2 są zbiorami krawędzi, wyrównanie grafu jest odwzorowaniem pomiędzy węzłami sieci wejściowych, które maksymalizuje podobieństwo pomiędzy odwzorowanymi jednostkami. Z teoretycznego punktu widzenia, problem wyrównania grafu polega na znalezieniu funkcji wyrównania (lub odwzorowania) f:V 1→V 2, która maksymalizuje funkcję kosztu Q. Podobieństwo między grafami jest określone przez funkcję kosztu, Q(G 1,G 2,f), zwaną również jakością wyrównania.

Pozwól f być wyrównaniem między dwoma grafami G 1 i G 2, biorąc pod uwagę węzeł u z G 1, f(u) jest zbiorem węzłów z G 2, które są wyrównane przez f do u. Q wyraża podobieństwo pomiędzy dwoma grafami wejściowymi w odniesieniu do konkretnego wyrównania f, a sformułowanie Q silnie wpływa na strategię odwzorowania.

Istnieją różne sformułowania Q, które dzielą się na następujące klasy:

Podobieństwo topologiczne: Grafy są wyrównane biorąc pod uwagę tylko topologię krawędzi, tak że idealne wyrównanie jest osiągnięte, gdy grafy wejściowe są izomorficzne.

Zwykle funkcja kosztu jest zdefiniowana jako liczba krawędzi zachowana przez f w odniesieniu do całkowitej liczby krawędzi w sieci źródłowej (G 1), zwana również poprawnością krawędzi (EC) . Dlatego EC nie bierze pod uwagę sieci docelowej (G 2).

$$ EC= \frac{(v_{1},v_{2})\in E_{1}| f(v_{1},v_{2})\in E_{2} }{|E_{1}|} $$

(1)

Inną typową miarą jest indukowana struktura konserwatywna (Induced Conserved Structure, ICS). Niech D będzie liczbą krawędzi w podsieci G 2 indukowanych na węzłach w G 2 wyrównanych do węzłów w G 1, ICS z f jest stosunkiem liczby krawędzi zachowanych przez f do D.

$$ ICS= \frac{|f(E_{1})| }{|E(G_{2})|} $$

(2)

gdzie D jest |E(G 2)|.

Jednakże ICS zawodzi w penalizacji źle ułożonych krawędzi w mniejszej sieci, ponieważ bierze pod uwagę sieć docelową.

Wreszcie, Symmetric Substructure Score, S 3, bierze pod uwagę unikalne krawędzie w grafie złożonym utworzonym przez nałożenie się dwóch sieci.

$$ S^{3}= \frac{|f(E_{1})| }{|E_{1}|+|E(G_{2})|-.|f(E_{1})|} $$

(3)

Wykazano, że S 3 jest lepszy od istniejących miar, ponieważ penalizuje zarówno dopasowania z regionów grafów nieliczbowych do regionów grafów gęstych, jak i dopasowania z regionów grafów gęstych do regionów grafów nieliczbowych.

Podobieństwo węzłów: Funkcja ta uwzględnia podobieństwo między odwzorowanymi węzłami. Węzły grafów wyrównanych mogą być mniej lub bardziej podobne do siebie. Zatem wyrównanie powinno wyrównać każdy węzeł jednego grafu do najbardziej podobnego węzła drugiego grafu, biorąc pod uwagę funkcje podobieństwa węzłów, s(v 1,v 2)→R, v 1∈V 1, v 2∈V 2. Celem ogólnym jest maksymalizacja sumy punktów uwzględniającej wyrównane węzły.

$$ NC=max {sum}_{v_{1}},v_{2}}=f(v_{1})s(v_{1},v_{2}}) $$

(4)

Podejścia hybrydowe: Niektóre ostatnie sformułowania Q uwzględniają oba podejścia poprzez kombinację liniową.

Problem wyrównania sieci może być sformułowany na różne sposoby. W ogólności, wyrównanie sieci może być sklasyfikowane jako wyrównanie lokalne lub globalne.

Przyrównanie lokalne ma na celu znalezienie wielu i niepowiązanych regionów izomorfizmu, tj. tej samej struktury grafu, pomiędzy sieciami wejściowymi, gdzie każdy region implikuje odwzorowanie niezależnie od innych regionów. Strategia ta polega na takim odwzorowaniu lub zbiorze odwzorowań pomiędzy podzbiorami węzłów, że ich podobieństwo jest maksymalne w stosunku do wszystkich możliwych podzbiorów. Podsieci te odpowiadają konserwatywnym wzorcom interakcji, które mogą reprezentować konserwatywny motyw lub wzorzec aktywności (streszczenie dostępne jest w ). Globalne wyrównanie ma na celu znalezienie odwzorowania, które powinno obejmować wszystkie węzły sieci wejściowych, kojarząc każdy węzeł sieci z jednym węzłem innych sieci lub oznaczając węzeł jako lukę, gdy nie ma możliwości dopasowania. Strategia ta nie bierze pod uwagę małych regionów podobieństwa, tj. konserwowanych motywów, lecz stara się znaleźć spójne odwzorowanie pomiędzy całym zbiorem węzłów sieci.

W niniejszej pracy do budowy globalnego wyrównania sieci mózgowych wybrano sześć algorytmów globalnego wyrównania. Poniżej przedstawiamy ich krótki opis koncepcyjny.

Popularną istniejącą metodą globalnego wyrównywania jest MAGNA . MAGNA jest globalnym wyrównywaczem sieci, który symuluje populację wyrównań, która ewoluuje w czasie poprzez zastosowanie algorytmu genetycznego i funkcji krzyżowania dwóch wyrównań w jedno nadrzędne. Ponieważ algorytm genetyczny symuluje proces ewolucji kierowany przez zasadę przetrwania najsilniejszego, przetrwają tylko te układy, które zachowują najwięcej krawędzi. W ten sposób MAGNA przechodzi do następnej generacji, aż do momentu, gdy dokładność wyrównania nie może być dalej optymalizowana. Ostatnio opracowano rozszerzenie algorytmu MAGNA o nazwie MAGNA++.

Drugim alignerem jest NETAL , algorytm globalnego wyrównywania szeroko stosowany do sieci interakcji białko-białko. NETAL buduje najlepsze globalne wyrównanie sieci poprzez zastosowanie metody zachłannej, opartej na macierzy punktacji wyrównania, która pochodzi zarówno z informacji biologicznych, jak i topologicznych sieci wejściowych.

Trzeci algorytm, GHOST , jest globalnym wyrównywaczem sieci parami, który wykorzystuje nową sygnaturę spektralną opartą na topologii lokalnego sąsiedztwa do pomiaru topologicznego podobieństwa między podsieciami. Idea stojąca za GHOST polega na połączeniu nowatorskiej sygnatury spektralnej z procedurą seed-and-extend do budowy wyrównania.

Czwarty globalny aligner to GEDEVO , nowatorskie narzędzie do wydajnego wyrównywania grafów.

Podstawą metody GEDEVO jest model Graph Edit Distance (GED), w którym graf jest przenoszony do innego przy minimalnej liczbie wstawień i usunięć krawędzi. Tak więc GEDEVO używa GED jako modelu optymalizacyjnego do znajdowania najlepszych wyrównań.

Piątym algorytmem jest WAVE, ogólna i nowatorska strategia wyrównywania, której celem jest optymalizacja zarówno zachowania węzłów jak i krawędzi podczas konstruowania wyrównania. WAVE jest stosowany na podstawie funkcji kosztu węzła i prowadzi do nowej, lepszej metody globalnego wyrównywania sieci poprzez faworyzowanie zachowanych krawędzi pomiędzy węzłami z podobną funkcją kosztu węzła w stosunku do tych z niepodobną funkcją kosztu węzła.

Ostatnim algorytmem jest Natalie2.0 , metoda wyrównywania sieci, która patrzy na problem wyrównywania sieci jako na uogólnienie problemu kwadratowego przyporządkowania i rozwiązuje go używając technik z programowania liniowego.

Parcelacja mózgu

Global network alignment algorithms

Dodaj komentarz Anuluj pisanie odpowiedzi