Het brein is een complex orgaan van gewervelde dieren en het is opgebouwd uit afzonderlijke gespecialiseerde cellen, neuronen genaamd. Neuronen zijn onderling verbonden door synapsen die een complex netwerk van verbindingen vormen. Verbindingen tussen neuronen dragen signaalimpulsen over die informatie overbrengen. De activiteit van de hersenen is grotendeels te danken aan deze reeks verbindingen.
Recente studies hebben op onafhankelijke wijze een strikte relatie aangetoond tussen de reeks verbindingen, de functies van de hersenen en de relaties tussen het ontstaan van neurologische ziekten en de variaties in de mechanismen van verbindingen ten opzichte van gezonde mensen. Bijvoorbeeld, in de ziekte van Alzheimer een verminderde connectiviteit, en de hippocampus veranderingen worden gedetecteerd , de ziekte van Parkinson wordt geassocieerd met veranderde connectiviteit , of in angststoornis een verhoogde connectiviteit en amygdala veranderingen wordt gevonden . Connectomics is gebaseerd op moderne technologieën van hersenonderzoek die in staat zijn een soort foto te maken van de hersenverbindingen van patiënten. Connectome kan worden geanalyseerd met behulp van verschillende zoom, b.v. door zich te richten op afzonderlijke componenten, d.w.z. neuronen en axonen, of door ze te groeperen in regio’s. Gewoonlijk wordt de analyse van afzonderlijke componenten gedefinieerd als anatomische connectiviteit, terwijl de analyse van regio’s functionele connectiviteit wordt genoemd omdat regio’s in het algemeen verschillende functies vervullen.
Een van de belangrijkste bronnen voor het afleiden van informatie over connectomen is Magnetic Resonance Imaging (MRI) . Een typisch MRI-experiment levert een reeks beelden op die zowel anatomische als functionele informatie verschaffen. De eerste wordt gevormd door axonale vezels tussen corticale regio’s, de tweede geeft informatie over de functionele connectiviteit, d.w.z. de activering van region of interest (ROI). Een dergelijke analyse wordt vaak uitgevoerd met behulp van diffusie tensor imaging (DTI), een gespecialiseerde versie van Diffusie-gewogen magnetische resonantie beeldvorming (DWI of DW-MRI), en DTI is uitgebreid gebruikt om witte stof tractografie in de hersenen in kaart te brengen door middel van de analyse van patronen van diffusie van moleculen door bundels van neurale axonen. De anatomische connectiviteitsstructuren worden hoofdzakelijk afgeleid door tractografie-algoritmen toe te passen op DTI-gegevens. Functionele connectiviteitsgegevens worden afgeleid uit functionele magnetische resonantiebeeldvorming (fMRI). De fMRI-beelden tonen actieve gebieden van de hersenen op een bepaald moment, gebaseerd op het zuurstofverbruiksniveau in het bloed. De verkregen netwerken worden functionele netwerken genoemd. Het gecombineerde gebruik van deze twee technieken wordt gebruikt om de structuur van het menselijke hersenconnectoom te bepalen, zoals weergegeven in fig. 1.
Eenmaal verkregen, moeten de connectoomgegevens worden geïntegreerd in een geschikt model. Een van de meest gebruikte representaties van dergelijke gegevens wordt gegeven door de grafentheorie, waarvan de modellen door verschillende benaderingen zijn gebruikt om klinisch relevante informatie te extraheren. Grafentheorie biedt de mogelijkheid om dergelijke gegevens te modelleren in een enkel netwerk model en vervolgens de mogelijkheid om alle kenmerken samen te vatten in enkele maatregelen, waardoor het begrip van de organisatie van het gehele netwerk, alsmede de individuele netwerk elementen.
In tegenstelling tot andere soorten netwerken, de modellering van connectomen met behulp van grafieken is een open onderzoeksgebied, omdat er veel mogelijkheden voor het definiëren van de knooppunten, de randen, die overeenkomt met verschillende schaal van standpunten. Bijvoorbeeld, kan knooppunten vertegenwoordigen neuronen en randen hun axonen. Hier richten we ons op de vertegenwoordiging van het gebied van belang (ROI) als knooppunten, en de vertegenwoordiging van functionele of anatomische verbindingen als randen. Er bestaan drie hoofdcategorieën van onderzoek toegepast op dergelijke netwerken: (i) de verbetering van de reconstructie van grafieken op basis van MRI-beelden, (ii) de identificatie van de structuur van netwerken (d.w.z. welk theoretisch model ten grondslag ligt aan de organisatie van het hersennetwerk), (iii) de identificatie van relevante modules die kunnen worden gebruikt om de hersenfuncties en hun wijzigingen in geval van ziekte te begrijpen (b.v. voor de vroege opsporing van ziekten). Het eerste en derde probleem berusten strikt op de definitie van een raamwerk voor de vergelijking van grafieken.
Bijv. het eerste probleem moet worden opgemerkt dat elk MRI-experiment een reeks beelden oplevert (hetzij van intra-subject, hetzij van inter-subject) die moeten worden uitgelijnd in een ruimtelijk domein. Wanneer zowel functionele als structurele beelden worden gebruikt, is coregistratie het proces van de uitlijning van functionele en structurele beelden om functionele informatie in de anatomische ruimte in kaart te brengen. Op die manier zal elke regio corresponderen met een knooppunt van een netwerk, waarbij gebruik wordt gemaakt van een atlas om anatomisch betekenisvolle regio’s te definiëren.
Niettemin kan een dergelijke benadering leiden tot aanzienlijke onnauwkeurigheden in gevallen van abnormale anatomie (b.v. in aanwezigheid van ziekten) en vroege hersenontwikkeling (b.v. in de hersenen van een kind). Om dit probleem aan te pakken, is onlangs voorgesteld om atlas-vrije parcellatie te gebruiken en te construeren en te vergelijken individuele connectomes alleen in het netwerk ruimte . In de auteurs voeren de atlas-vrije parcellatie als de fijnste parcellatie die nog steeds interconnect de hele hersenen, waardoor er geen knooppunten geïsoleerd. Vervolgens groeperen ze onderwerpen in homogene groepen en de NA wordt uitgevoerd binnen elke groep. De som netwerk wordt verkregen en in kaart gebracht om de anatomie van een “referentie-brein.”
Dit werk, toont de mogelijkheid om NA te gebruiken in de atlas-vrije parcellatie workflow en het stelt aan de onderzoeksgemeenschap de uitdaging om systematisch de prestaties van verschillende NA algoritmen verkennen, omdat verschillende NA benaderingen worden op grote schaal toegepast in de moleculaire biologie analyse, maar ze zijn nog niet onderzocht in relatie tot MRI connectomics.
De technieken voor de uitlijning van biologische netwerken vallen in twee categorieën: (i) de lokale netwerkuitlijning zoekt naar relatief kleine vergelijkbare subnetwerken die waarschijnlijk geconserveerde functionele structuren vertegenwoordigen, (ii) de globale netwerkuitlijning zoekt naar de beste superpositie van de gehele ingangsnetwerken. Deze benaderingen kunnen echter niet gemakkelijk worden toegepast in het connectoom uitlijningsprobleem. De reden hiervoor is gerelateerd aan de strategie die ten grondslag ligt aan de methodologie van uitlijning. Bijvoorbeeld, de lokale netwerk aligners, op grote schaal gebruikt om de uitlijning van eiwit-interactie netwerken (PINs) te bouwen, te nemen als input twee netwerken en een lijst van zaad knooppunten gebruikt om de initiële uitlijning grafiek te bouwen (zie voor volledige details over de bouw van de uitlijning grafiek). Deze initiële nodes worden geselecteerd op basis van biologische overwegingen, zoals homologatierelaties tussen nodes van PINs. Aangezien de knooppunten van de hersenen netwerken vertegenwoordigen ROI’s, kan de homologie informatie niet worden verkregen in het geval van connectome netwerken en dan, de lokale uitlijning kan niet worden toegepast.
In dit document hebben we zes bestaande state of the art globale uitlijning algoritmen geselecteerd en we hebben deze aligners getest op diffusie MRI-afgeleide hersenen netwerken. De hier geteste algoritmen zijn MAGNA++ , NETAL , GHOST , GEDEVO , WAVE , Natalie2.0 . De algoritmen worden toegepast om de uitlijningen tussen de diffusie MRI-afgeleide hersennetwerken te bouwen. Nadat de uitlijningen waren gebouwd, hebben we de prestaties van deze algoritmen vergeleken en deze robuustheid geëvalueerd.
Hersenverkaveling
Een essentiële stap in de analyse en macroscopische kartering van het hersennetwerk is de onderverdeling van de hersenen in grootschalige regio’s, ook wel bekend als “verkavelingsproces”. De verkaveling van de hersenen bestaat uit het verdelen van de hersenen in een reeks macroscopische, homogene en niet-overlappende regio’s met betrekking tot informatie die, in het algemeen, door technieken op basis van magnetische resonantie beeldvorming (MRI) . Vooral MRI heeft het mogelijk gemaakt informatie te verkrijgen over anatomische connectiviteit, functionele connectiviteit, of taakgerelateerde activatie. Verschillende bewijzen tonen aan dat de verkaveling van de hersenen in een homogeen gebied nog lang niet vastligt, evenmin als de definitie van de randen en hun plaatsing. In de grafische voorstelling van een op parcellatie gebaseerd connectoom, corresponderen de knopen van de grafiek met een hersengebied en de randen met structurele of functionele verbindingen tussen deze gebieden. Ondanks zijn relatieve eenvoud, de toepassing van de grafiektheorie op de studie van connectomes presenteert een aantal bijzondere uitdagingen met betrekking tot de zinvolle definitie van knooppunten en randen. Een ideaal model zou de ware subsystemen (als nodes) en de ware relaties (als edges) moeten weergeven. Zoals diepgaand onderzocht in , is er echter geen duidelijk bewijs voor de optimale definitie van zowel nodes als edges. Een ideale knooppuntdefinitie zou bijvoorbeeld een set neuronen moeten groeperen om de functionele homogeniteit binnen de verschillende knooppunten te maximaliseren en om de functionele heterogeniteit tussen de verschillende knooppunten te maximaliseren. Bovendien moet rekening worden gehouden met de ruimtelijke (en hopelijk temporele) relatie tussen de knooppunten. Naast de definitie is ook de representatie van de randen momenteel een open uitdaging, en deze taak hangt samen met het type gemeten connectiviteit, en de methode die wordt gebruikt om deze te kwantificeren. Zoals hierboven vermeld, kan connectiviteit van de hersenen verwijzen naar verschillende aspecten van de organisatie van de hersenen met inbegrip van (i) anatomische connectiviteit bestaande uit axonale vezels verbinden corticale en subcorticale regio’s afgeleid van diffusie beeldvorming (zie Fig. 2 (1)), en (ii) functionele connectiviteit gedefinieerd als de waargenomen statistische correlaties van het Bloed zuurstof niveau afhankelijke (BOLD) signaal tussen hersengebieden.
Dit betekent dat de keuze van het verkavelingsschema een aanzienlijke invloed heeft op de daaropvolgende analyse. Er bestaan momenteel drie op parcellatie gebaseerde connectoombenaderingen:
-
Parcellering van de hersenen met behulp van vooraf gedefinieerde anatomische templates. Deze benadering bestaat uit de registratie van de structurele beelden van MRI tot anatomische atlas op basis van de Brodmann gebieden . Op deze wijze worden de gehele hersenen onderverdeeld in gelabelde regio’s volgens de verschillende labels regio’s van de sjablonen;
-
Parcellering van de hersenen met behulp van willekeurig gegenereerde sjablonen . Voor de willekeurige verkaveling worden verschillende algoritmen toegepast om percelen van ongeveer gelijke grootte te produceren. De gegenereerde sjablonen worden dus gekenmerkt door hersenregio’s van ongeveer gelijke grootte om anatomische vertekeningen te voorkomen;
-
Op connectiviteit gebaseerde verkavelingen die tot doel hebben hersenregio’s af te bakenen door de overeenkomsten in structurele of functionele connectiviteitspatronen te analyseren. Gebaseerd op de notie dat regio’s met een vergelijkbaar connectiviteitsprofiel zijn betrokken bij dezelfde analoge functionele rollen, de connectiviteit-gebaseerde parcellering partities kleine zaad regio’s in een grootste verzameling van functioneel homogene hersengebieden door het clusteren van zaden met vergelijkbare connectiviteit profielen.
Echter, elke methode presenteert een aantal valkuilen. Bijvoorbeeld, de registratie van de hersenen van het bestudeerde onderwerp aan een generieke hersenen met gedefinieerde Brodmann gebieden roept de vraag op van de nauwkeurigheid van mapping. In feite, in de meeste gevallen, de grenzen van de Brodmann gebieden, oorspronkelijk gedefinieerd met behulp van cytoarchitectural verschillen tussen hersengebieden, komen niet overeen met de corticale oppervlak geanalyseerd.
Deze aanpak is beperkt door inter-subject variabiliteit en kan vooral problematisch zijn in de context van de hersenrijping. Bovendien is aangetoond dat de verkaveling van de hersenen met vooraf gedefinieerde anatomische sjablonen negatief kunnen alle daaropvolgende analyse beïnvloeden door de invoering van duidelijke biases . In dit artikel richten we ons op de willekeurige, atlas-vrije definitie van knooppunten in individuele onderwerpen (zie Fig. 2 (2)), die kan zorgen voor een volledig netwerk-gedreven studie van de hersenen en voor het vergelijken van hersenen van verschillende onderwerpen en, potentieel, soorten.
Globale netwerk alignment algoritmen
De identificatie van een nauwkeurige node mapping tussen atlas-vrije netwerken kan bieden belangrijke details over de vergelijking van de hersenen of de structuur van groepen van personen, zoals gezonde versus zieke proefpersonen. Veel verschillende netwerk alignment methoden zijn voorgesteld in biologische gebieden .
Formally, a graph G is defined as G={V,E}, where V is a finite set of nodes and E is a finite set of edges. Stel G 1={V 1,E 1} en G 2={V 2,E 2} zijn twee grafieken, waarbij V 1,2 verzamelingen knooppunten zijn en E 1,2 verzamelingen randen. Een grafiekuitlijning is de afbeelding tussen de knooppunten van de ingangsnetwerken die de overeenkomst tussen de in kaart gebrachte entiteiten maximaliseert. Vanuit theoretisch oogpunt bestaat het grafiekuitlijningsprobleem uit het vinden van een uitlijningsfunctie (of een afbeelding) f:V 1→V 2 die een kostenfunctie Q maximaliseert. De overeenkomst tussen de grafieken wordt gedefinieerd door een kostenfunctie, Q(G 1,G 2,f), ook bekend als de kwaliteit van de uitlijning.
Zie f als een uitlijning tussen twee grafieken G 1 en G 2, gegeven een knooppunt u uit G 1, dan is f(u) de verzameling knooppunten uit G 2 die onder f aan u zijn uitgelijnd. Q drukt de overeenkomst uit tussen twee input-grafieken met betrekking tot een specifieke uitlijning f en de formulering van Q beïnvloedt sterk de mapping-strategie.
Er bestaan verschillende formuleringen van Q die in de volgende klassen vallen:
Topologische Gelijkenis: Grafieken worden uitgelijnd door alleen de topologie van de randen in aanmerking te nemen, zodat de perfecte uitlijning wordt bereikt wanneer de inputgrafieken isomorf zijn.
Over het algemeen wordt de kostenfunctie gedefinieerd als het aantal randen dat door f behouden blijft ten opzichte van het totale aantal randen in het bronnetwerk (G 1), ook wel aangeduid als edge correctness (EC) . De EC houdt dus geen rekening met het doelnetwerk (G 2).
Een andere typische maat is de Induced Conserved Structure, ICS . Zij D het aantal randen in een subnetwerk van G 2 dat wordt geïnduceerd op de knooppunten in G 2 uitgelijnd op de knooppunten in G 1, dan is ICS van f de verhouding van het aantal door f geconserveerde randen tot D.
waarbij D is |E(G 2)|.
Het ICS faalt echter bij de bestraffing van verkeerd uitgelijnde randen in het kleinere netwerk, omdat het rekening houdt met het doelnetwerk.
Ten slotte houdt de Symmetrische Substructuur Score, S 3, rekening met de unieke randen in de samengestelde grafiek die ontstaat door de overlapping van twee netwerken.
S 3 heeft aangetoond superieur te zijn aan bestaande maatregelen, omdat het zowel afstemmingen van schaarse grafiekregio’s op dichte grafiekregio’s als afstemmingen van dichte grafiekregio’s op schaarse grafiekregio’s bestraft.
Gelijkenis tussen knooppunten: Deze functie beschouwt de gelijkenis tussen in kaart gebrachte knooppunten. Knooppunten van de uitgelijnde grafieken kunnen meer of minder op elkaar lijken. De uitlijning moet dus elk knooppunt van een grafiek uitlijnen op het knooppunt van de andere grafiek dat er het meest op lijkt, gegeven een knooppuntgelijksheidsfunctie, s(v 1,v 2)→R, v 1∈V 1, v 2∈V 2. De algemene doelstelling is om de som van de scores van de uitgelijnde knooppunten te maximaliseren.
Hybride benaderingen: Sommige recente formuleringen van Q houden rekening met beide benaderingen door lineaire combinatie.
Het netwerkuitlijningsprobleem kan op verschillende manieren worden geformuleerd. In het algemeen kan de netwerkuitlijning worden geclassificeerd als lokale uitlijning of globale uitlijning.
De lokale uitlijning is gericht op het vinden van meerdere en ongerelateerde regio’s van isomorfisme, d.w.z. dezelfde grafiekstructuur, tussen de invoernetwerken, waarbij elke regio een mapping impliceert, onafhankelijk van andere regio’s. De strategie bestaat uit de mapping of verzameling van mappings tussen deelverzamelingen van knooppunten zodanig dat hun gelijkenis maximaal is over alle mogelijke deelverzamelingen. Deze subnetwerken komen overeen met geconserveerde patronen van interactie die een geconserveerd motief of patroon van activiteiten kunnen vertegenwoordigen (een synopsis is beschikbaar in ). De globale uitlijning is gericht op het vinden van een mapping die alle knooppunten van de input-netwerken moet omvatten, waarbij elk knooppunt van een netwerk met een knooppunt van de andere netwerken wordt geassocieerd of het knooppunt als een hiaat wordt gemarkeerd wanneer er geen mogelijke overeenkomst bestaat. Deze strategie houdt geen rekening met kleine gebieden van overeenkomst, d.w.z. geconserveerde motieven, maar probeert een consistente afbeelding te vinden tussen de hele reeks knooppunten van de netwerken.
In dit werk werden zes globale uitlijningsalgoritmen gekozen om de globale uitlijning van hersennetwerken te bouwen. We geven hierna een korte conceptuele beschrijving.
Een populaire bestaande methode van globale uitlijning is MAGNA . MAGNA is een globaal netwerk aligner dat een populatie van alignments simuleert die in de tijd evolueert door toepassing van een genetisch algoritme en een functie voor de kruising van twee alignments in een superieure alignment. Omdat het genetisch algoritme het evolutionaire proces simuleert dat geleid wordt door het principe van “survival of the fittest”, overleven alleen uitlijningen, d.w.z. die welke de meeste randen behouden,. Zo gaat MAGNA door naar de volgende generatie, totdat de nauwkeurigheid van de uitlijning niet verder geoptimaliseerd kan worden. Onlangs is een uitbreiding van het MAGNA-algoritme ontwikkeld, MAGNA++ genaamd.
De tweede aligner is NETAL , een algoritme voor de globale uitlijning dat veel wordt gebruikt voor eiwit-eiwit interactienetwerken. NETAL bouwt de beste globale netwerk uitlijning door een greedy methode toe te passen, gebaseerd op de uitlijning scoringsmatrix, die is afgeleid van zowel biologische als topologische informatie van input netwerken.
Het derde algoritme, GHOST , is een globale paarsgewijze netwerk uitlijner die gebruik maakt van een nieuwe spectrale handtekening, gebaseerd op de topologie van de lokale buurt, om topologische overeenkomst tussen subnetwerken te meten. Het idee achter GHOST bestaat uit de combinatie van de nieuwe spectrale handtekening met de seed-and-extend procedure om de uitlijning op te bouwen.
De vierde globale uitlijner is GEDEVO , een nieuw gereedschap voor efficiënte grafiek uitlijning.
Aan de basis van de GEDEVO methode ligt het Graph Edit Distance model (GED), waarbij een grafiek in een andere grafiek wordt overgezet met een minimaal aantal rand invoegingen en verwijderingen. GEDEVO gebruikt dus het GED-model als optimalisatiemodel voor het vinden van de beste uitlijningen.
Het vijfde algoritme is WAVE, een algemene en nieuwe uitlijningsstrategie die tot doel heeft het behoud van zowel knooppunten als randen te optimaliseren bij het construeren van een uitlijning. WAVE wordt gebruikt bovenop een gevestigde knoopkostenfunctie en leidt tot een nieuwe superieure methode voor globale netwerkuitlijning, door de voorkeur te geven aan behouden randen tussen knooppunten met een vergelijkbare knoopkostenfunctie boven die met een ongelijke knoopkostenfunctie.
Het laatste algoritme is Natalie2.0 , een netwerkuitlijningsmethode, die het netwerkuitlijningsprobleem beschouwt als een veralgemening van het kwadratische toewijzingsprobleem en het oplost met technieken van integer lineair programmeren.