Le cerveau est un organe complexe des vertébrés et il est composé de cellules uniques spécialisées appelées neurones. Les neurones sont reliés entre eux par des synapses formant un réseau complexe de connexions. Les connexions entre les neurones transmettent des impulsions de signaux qui transportent des informations. L’activité du cerveau est principalement due à cet ensemble de connexions.

Des études récentes ont démontré de manière indépendante une relation stricte entre l’ensemble des connexions, les fonctions des cerveaux et les relations entre l’insurgence des maladies neurologiques et les variations des mécanismes de connexions par rapport aux personnes saines . Par exemple, dans la maladie d’Alzheimer une connectivité diminuée, et des changements de l’hippocampe sont détectés , la maladie de Parkinson est associée à une connectivité altérée , ou dans le trouble de l’anxiété une connectivité accrue et des changements de l’amygdale est trouvée .

Conséquemment, l’intérêt pour la modélisation et l’analyse de l’ensemble du système des éléments du cerveau et de leurs relations a conduit à l’introduction de la soi-disant connectomique, c’est-à-dire l’étude du connectome désigné comme l’ensemble des éléments et des interactions . La connectomique est basée sur les technologies modernes d’investigation du cerveau qui sont capables de prendre une sorte d’image des connexions cérébrales des patients. Le connectome peut être analysé à l’aide de différents zooms, par exemple en se concentrant sur des composants uniques, c’est-à-dire les neurones et les axones, ou en les regroupant en régions. Habituellement, l’analyse des composants uniques est définie comme connectivité anatomique, tandis que l’analyse des régions est appelée connectivité fonctionnelle parce que les régions remplissent en général des fonctions différentes.

Parmi les autres, l’une des principales sources pour dériver des informations sur les connectomes est l’imagerie par résonance magnétique (IRM) . Une expérience typique d’IRM produit un ensemble d’images fournissant des informations à la fois anatomiques et fonctionnelles. La première est constituée des fibres axonales entre les régions corticales, la seconde fournit des informations sur la connectivité fonctionnelle, c’est-à-dire l’activation de la région d’intérêt (ROI). Cette analyse est souvent effectuée à l’aide de l’imagerie du tenseur de diffusion (ITD), qui est une version spécialisée de l’imagerie par résonance magnétique pondérée en fonction de la diffusion (IRM-DW ou IRM-DW). L’ITD a été largement utilisée pour cartographier la tractographie de la substance blanche dans le cerveau par l’analyse des modèles de diffusion des molécules dans les faisceaux d’axones neuronaux. Les structures de connectivité anatomique sont principalement obtenues en appliquant des algorithmes de tractographie aux données de l’ITD. Les données de connectivité fonctionnelle sont dérivées de l’imagerie par résonance magnétique fonctionnelle (IRMf). Les images IRMf montrent les régions actives du cerveau à un moment donné, en fonction du niveau de consommation d’oxygène dans le sang. Les réseaux obtenus sont appelés réseaux fonctionnels. L’utilisation combinée de ces deux techniques permet de déterminer la structure du connectome du cerveau humain, comme le montre la figure 1.

Fig. 1
figure1

Construire un réseau représentatif à partir de données expérimentales : exemple de flux de travail. Des images d’IRM de diffusion ou fonctionnelle sont acquises pour un sujet selon l’étude à mener. Les IRM sont utilisées pour effectuer une parcellation du cerveau entier en sélectionnant une méthode appropriée. À partir de la parcellation du cerveau entier, le calcul des connexions est effectué et une matrice d’adjacence pondérée est construite. Ensuite, les poids de la matrice d’adjacence sont binarisés. Enfin, le réseau cérébral résultant est obtenu

Une fois obtenues, les données du connectome doivent être intégrées dans un modèle approprié. L’une des représentations les plus utilisées de ces données est donnée par la théorie des graphes, dont les modèles ont été utilisés par différentes approches pour extraire des informations cliniquement pertinentes . La théorie des graphes assure la possibilité de modéliser de telles données dans un modèle de réseau unique et ensuite la possibilité de résumer toutes les caractéristiques en quelques mesures, donnant la compréhension de l’organisation de l’ensemble du réseau ainsi que des éléments individuels du réseau .

Différemment d’autres types de réseaux, la modélisation des connectomes en utilisant des graphes est un domaine de recherche ouvert car il existe de nombreuses possibilités de définir les nœuds, les bords, qui correspondent à différentes échelles de vues. Par exemple, les nœuds peuvent représenter les neurones et les bords leurs axones. Nous nous concentrons ici sur la représentation des régions d’intérêt (ROI) en tant que nœuds, et sur la représentation des connexions fonctionnelles ou anatomiques en tant qu’arêtes. Il existe trois grandes catégories de recherches appliquées à de tels réseaux : (i) l’amélioration de la reconstruction des graphes à partir d’images IRM, (ii) l’identification de la structure des réseaux (c’est-à-dire quel est le modèle théorique qui sous-tend l’organisation du réseau cérébral), (iii) l’identification des modules pertinents qui peuvent être utilisés pour comprendre les fonctions cérébrales et leurs modifications en cas de maladie (par exemple pour la détection précoce des maladies). Le premier et le troisième problème reposent strictement sur la définition d’un cadre de comparaison des graphes.

En considérant, par exemple, le premier problème, il faut noter que chaque expérience d’IRM produit une série d’images (soit intra-sujet, soit inter-sujet) qui doivent être alignées dans un domaine spatial. Lorsque l’on utilise à la fois des images fonctionnelles et structurelles, le coregistration est le processus d’alignement des images fonctionnelles et structurelles pour cartographier les informations fonctionnelles dans l’espace anatomique. De cette manière, chaque région correspondra à un nœud d’un réseau en utilisant un atlas pour définir des régions anatomiquement significatives .

Néanmoins, une telle approche peut conduire à des inexactitudes substantielles dans les cas d’anatomie anormale (par exemple en présence de maladies) et de développement précoce du cerveau (par exemple dans le cerveau d’un enfant). Pour résoudre ce problème, il a été récemment proposé d’utiliser une parcellation sans atlas et de construire et comparer des connectomes individuels uniquement dans l’espace réseau. Les auteurs considèrent la parcellation sans atlas comme la parcellation la plus fine qui interconnecte encore l’ensemble du cerveau, sans laisser de nœuds isolés. Ensuite, ils regroupent les sujets en groupes homogènes et la NA est effectuée au sein de chaque groupe. Le réseau total est obtenu et cartographié sur l’anatomie d’un « cerveau de référence ».

Ce travail, démontre la possibilité d’utiliser NA dans le flux de travail de parcellation sans atlas et il pose à la communauté de recherche le défi d’explorer systématiquement la performance de différents algorithmes NA puisque différentes approches NA sont largement appliquées dans l’analyse de la biologie moléculaire, mais elles n’ont pas encore été explorées en relation avec la connectomique IRM.

Les techniques pour l’alignement des réseaux biologiques se divisent en deux catégories : (i) l’alignement de réseau local recherche des sous-réseaux similaires relativement petits qui sont susceptibles de représenter des structures fonctionnelles conservées, (ii) l’alignement de réseau global recherche la meilleure superposition de l’ensemble des réseaux d’entrée. Cependant, ces approches ne peuvent pas être facilement appliquées au problème de l’alignement du connectome. La raison est liée à la stratégie qui sous-tend la méthodologie d’alignement. Par exemple, les aligneurs de réseaux locaux, largement utilisés pour construire l’alignement des réseaux d’interactions protéiques (PIN), prennent en entrée deux réseaux et une liste de nœuds d’amorçage utilisés pour construire le graphe d’alignement initial (voir les détails complets sur la construction du graphe d’alignement). Ces nœuds initiaux sont sélectionnés sur la base de considérations biologiques, telles que les relations d’homologie entre les nœuds des PINs. Comme les nœuds des réseaux cérébraux représentent des ROIs, l’information d’homologie ne peut pas être obtenue dans le cas des réseaux connectomes et alors, l’alignement local ne peut pas être appliqué.

Dans cet article, nous avons sélectionné six algorithmes d’alignement global existants à l’état de l’art et nous avons testé ces aligneurs sur des réseaux cérébraux dérivés de l’IRM de diffusion. Les algorithmes testés ici sont MAGNA++ , NETAL , GHOST , GEDEVO , WAVE , Natalie2.0 . Les algorithmes sont appliqués pour construire les alignements entre les réseaux cérébraux dérivés de l’IRM de diffusion. Après la construction des alignements, nous avons comparé les performances de ces algorithmes et évalué cette robustesse.

Parcellation du cerveau

Une étape essentielle dans l’analyse et la cartographie macroscopique du réseau cérébral est la subdivision du cerveau en régions à grande échelle, également connue sous le nom de « processus de parcellation ». La parcellation du cerveau consiste à diviser le cerveau en un ensemble de régions macroscopiques, homogènes et non chevauchantes, en fonction des informations fournies, généralement, par des techniques basées sur l’imagerie par résonance magnétique (IRM) . L’IRM a notamment permis d’obtenir des informations sur la connectivité anatomique, la connectivité fonctionnelle ou l’activation liée à la tâche. Différents éléments de preuve démontrent que la parcellation du cerveau en région homogène est loin d’être définie, de même que la définition des bords et leur emplacement. Dans la représentation graphique d’un connectome basé sur la parcellation, les nœuds du graphique correspondent à une région du cerveau et les arêtes correspondent aux connexions structurelles ou fonctionnelles entre ces régions. Malgré sa relative simplicité, l’application de la théorie des graphes à l’étude des connectomes présente certains défis particuliers liés à la définition significative des nœuds et des arêtes. Un modèle idéal devrait représenter les véritables sous-systèmes (en tant que nœuds) et les véritables relations (en tant qu’arêtes). Cependant, comme nous l’avons étudié en profondeur dans , il n’y a pas de preuve claire de la définition optimale des nœuds et des arêtes. Par exemple, une définition idéale des nœuds devrait regrouper un ensemble de neurones afin de maximiser l’homogénéité fonctionnelle au sein des nœuds et de maximiser l’hétérogénéité fonctionnelle entre les différents nœuds. En outre, elle doit tenir compte de la relation spatiale (et, espérons-le, temporelle) entre les nœuds. Outre la définition, la représentation des bords est également un défi ouvert et cette tâche est liée au type de connectivité mesurée et à la méthode utilisée pour la quantifier. Comme nous l’avons mentionné plus haut, la connectivité cérébrale peut se référer à différents aspects de l’organisation du cerveau, notamment (i) la connectivité anatomique constituée de fibres axonales reliant des régions corticales et sous-corticales déduites de l’imagerie de diffusion (voir Fig. 2 (1)), et (ii) la connectivité fonctionnelle définie comme les corrélations statistiques observées du signal dépendant du niveau d’oxygénation du sang (BOLD) entre les régions du cerveau.

Fig. 2
figure2

Définition des (1) arêtes et (2) nœuds à l’aide d’une parcellation aléatoire sans atlas et en utilisant l’IRM de diffusion et la tractographie. Dans la première case, la reconstruction des arêtes est rapportée, tandis que dans la seconde, les deux types de parcellations du cerveau entier chez les nouveau-nés, les sujets de 6 mois et les adultes sont présentés. La première parcellation corticale est réalisée en fixant le nombre de nœuds d’aire égale à 95. La deuxième parcellation corticale est réalisée en fixant le nombre de nœuds d’aire égale à 1000. Dans cette dernière, il est possible de noter des régions déconnectées surlignées en vert

C’est-à-dire que le choix du schéma de parcellation a un impact significatif sur l’analyse ultérieure. Il existe actuellement trois approches du connectome basées sur la parcellation :

  1. Parcellation du cerveau en utilisant des modèles anatomiques prédéfinis. Cette approche consiste en l’enregistrement des images structurelles issues de l’IRM sur des atlas anatomiques basés sur les aires de Brodmann . De cette façon, le cerveau entier est subdivisé en régions étiquetées selon les différentes régions d’étiquettes des gabarits;

  2. Parcellation du cerveau en utilisant des gabarits générés aléatoirement . Pour la parcellation aléatoire, différents algorithmes sont appliqués pour produire des parcelles de taille à peu près égale. Ainsi, les modèles générés sont caractérisés par des régions cérébrales de taille approximativement uniforme afin d’éviter les biais anatomiques ;

  3. Parcellations basées sur la connectivité qui visent à délimiter les régions cérébrales en analysant les similitudes dans les modèles de connectivité structurelle ou fonctionnelle. Basée sur la notion que les régions ayant un profil de connectivité similaire sont impliquées dans les mêmes rôles fonctionnels analogues, la parcellation basée sur la connectivité partitionne les petites régions de semences en une plus grande collection de régions cérébrales fonctionnellement homogènes en regroupant les semences ayant des profils de connectivité similaires.

Cependant, chaque méthode présente des écueils. Par exemple, l’enregistrement du cerveau du sujet étudié sur un cerveau générique avec des aires de Brodmann définies pose la question de la précision de la cartographie. En effet, dans la plupart des cas, les limites des aires de Brodmann, définies à l’origine à partir des différences cytoarchitecturales entre les régions cérébrales, ne correspondent pas à la surface corticale analysée.

Cette approche est limitée par la variabilité inter-sujet et peut être particulièrement problématique dans le contexte de la maturation cérébrale. En outre, il a été démontré que la parcellation du cerveau avec des modèles anatomiques prédéfinis peut avoir un impact négatif sur toute l’analyse ultérieure en introduisant des biais évidents . Dans cet article, nous nous concentrons sur la définition aléatoire, sans atlas, des nœuds dans les sujets individuels (voir Fig. 2 (2)), ce qui peut permettre une étude du cerveau entièrement axée sur les réseaux et la comparaison de cerveaux de différents sujets et, potentiellement, d’espèces .

Algorithmes d’alignement de réseaux globaux

L’identification d’une cartographie précise des nœuds entre les réseaux sans atlas peut offrir des détails importants sur la comparaison des cerveaux ou la structure de groupes de sujets, tels que les sujets sains par rapport aux sujets malades. De nombreuses méthodes d’alignement de réseaux ont été proposées dans les domaines biologiques .

Formellement, un graphe G est défini comme G={V,E}, où V est un ensemble fini de nœuds et E est un ensemble fini d’arêtes. Soit G 1={V 1,E 1} et G 2={V 2,E 2} deux graphes, où V 1,2 sont des ensembles de nœuds et E 1,2 sont des ensembles d’arêtes, un alignement de graphes est le mappage entre les nœuds des réseaux d’entrée qui maximise la similarité entre les entités mappées. D’un point de vue théorique, le problème d’alignement de graphes consiste à trouver une fonction d’alignement (ou une mise en correspondance) f:V 1→V 2 qui maximise une fonction de coût Q. La similarité entre les graphes est définie par une fonction de coût, Q(G 1,G 2,f), également appelée qualité de l’alignement.

Let f est un alignement entre deux graphes G 1 et G 2, étant donné un nœud u de G 1, f(u) est l’ensemble des nœuds de G 2 qui sont alignés sous f sur u. Q exprime la similarité entre deux graphes d’entrée par rapport à un alignement spécifique f et la formulation de Q influence fortement la stratégie de mise en correspondance.

Il existe différentes formulations de Q qui se répartissent dans les classes suivantes :

Similitude topologique : Les graphes sont alignés en considérant uniquement la topologie des arêtes, de sorte que l’alignement parfait est atteint lorsque les graphes d’entrée sont isomorphes.

En général, la fonction de coût est définie comme le nombre d’arêtes conservées par f par rapport au nombre total d’arêtes dans le réseau source (G 1), également appelé exactitude des arêtes (EC) . Par conséquent, l’EC ne prend pas en compte le réseau cible (G 2).

$$ EC= \frac{(v_{1},v_{2})\in E_{1}| f(v_{1},v_{2})|\in E_{2} }{|E_{1}|} $$
(1)

Une autre mesure typique est la structure conservée induite, ICS . Soit D le nombre d’arêtes dans un sous-réseau de G 2 induit sur les nœuds de G 2 alignés sur les nœuds de G 1, ICS de f est le rapport du nombre d’arêtes conservées par f sur D.

$$ ICS= \frac{|f(E_{1})| }{|E(G_{2})|} $$
(2)

où D est |E(G 2)|.

Cependant, ICS échoue dans la pénalisation des arêtes mal alignées dans le plus petit réseau car il prend en compte le réseau cible.

Enfin, le Score de Substructure Symétrique, S 3, prend en compte les arêtes uniques dans le graphe composite créé par le chevauchement de deux réseaux.

$$ S^{3}= \frac{|f(E_{1})| }{|E_{1}|+|E(G_{2})|-|f(E_{1})|} $$
(3)

S 3 s’est avéré supérieur aux mesures existantes car il pénalise à la fois les alignements de régions de graphes clairsemés vers des régions de graphes denses et les alignements de régions de graphes denses vers des régions de graphes clairsemés.

Similitude des nœuds : Cette fonction considère la similarité entre les nœuds cartographiés. Les nœuds des graphes alignés peuvent être plus ou moins similaires les uns aux autres. Ainsi, l’alignement doit aligner chaque nœud d’un graphe sur le nœud le plus similaire de l’autre graphe étant donné une fonction de similarité des nœuds, s(v 1,v 2)→R, v 1∈V 1, v 2∈V 2. L’objectif global est de maximiser la somme des scores considérant les nœuds alignés.

$$ NC=max {sum}_{v_{1},v_{2}}=f(v_{1})s(v_{1},v_{2}) $$
(4)

Approches hybrides : Certaines formulations récentes de Q prennent en compte les deux approches par combinaison linéaire.

Le problème d’alignement de réseaux peut être formulé de différentes manières. En général, l’alignement de réseaux peut être classé en alignement local ou en alignement global.

L’alignement local vise à trouver des régions multiples et non liées d’isomorphisme, c’est-à-dire de même structure de graphe, entre les réseaux d’entrée, où chaque région implique un mapping indépendamment des autres régions. La stratégie consiste en un mappage ou un ensemble de mappages entre des sous-ensembles de nœuds tels que leur similarité est maximale sur tous les sous-ensembles possibles. Ces sous-réseaux correspondent à des modèles conservés d’interaction qui peuvent représenter un motif conservé ou un modèle d’activités (un synopsis est disponible dans ). L’alignement global vise à trouver une correspondance qui devrait couvrir tous les nœuds des réseaux d’entrée, en associant chaque nœud d’un réseau à un nœud des autres réseaux ou en marquant le nœud comme vide lorsqu’il n’existe aucune correspondance possible. Cette stratégie ne prend pas en compte les petites régions de similarité, c’est-à-dire les motifs conservés, mais tente de trouver une correspondance cohérente entre l’ensemble des nœuds des réseaux.

Dans ce travail, six algorithmes d’alignement global ont été choisis pour construire l’alignement global des réseaux cérébraux. Nous donnons ci-après une courte description conceptuelle.

Une méthode existante populaire d’alignement global est MAGNA . MAGNA est un aligneur global de réseaux qui simule une population d’alignements qui évolue dans le temps en appliquant un algorithme génétique et une fonction pour le croisement de deux alignements en un alignement supérieur. Comme l’algorithme génétique simule le processus d’évolution guidé par le principe de la survie du plus apte, seuls les alignements, c’est-à-dire ceux qui conservent le plus de bords, survivent. Ainsi, MAGNA passe à la génération suivante, jusqu’à ce que la précision de l’alignement ne puisse plus être optimisée. Récemment, une extension de l’algorithme MAGNA appelée MAGNA++ a été développée.

Le deuxième aligneur est NETAL , un algorithme d’alignement global largement utilisé pour les réseaux d’interaction protéine-protéine. NETAL construit le meilleur alignement global de réseaux en appliquant une méthode gloutonne, basée sur la matrice de notation de l’alignement, qui est dérivée à la fois des informations biologiques et topologiques des réseaux d’entrée.

Le troisième algorithme, GHOST , est un aligneur global de réseaux par paires qui utilise une nouvelle signature spectrale basée sur la topologie du voisinage local pour mesurer la similarité topologique entre les sous-réseaux. L’idée derrière GHOST consiste en la combinaison de la signature spectrale inédite avec la procédure seed-and-extend pour construire l’alignement.

Le quatrième aligneur global est GEDEVO , un outil inédit pour l’alignement efficace de graphes.

La méthode GEDEVO repose sur le modèle de distance d’édition de graphes (GED), où un graphe est transféré dans un autre avec un nombre minimal d’insertions et de suppressions d’arêtes. Ainsi, GEDEVO utilise le GED comme modèle d’optimisation pour trouver les meilleurs alignements.

Le cinquième algorithme est WAVE une stratégie d’alignement générale et nouvelle dont le but est d’optimiser à la fois la conservation des nœuds et des bords lors de la construction d’un alignement. WAVE est utilisé au-dessus d’une fonction de coût de nœud établie et il conduit à une nouvelle méthode supérieure pour l’alignement global de réseau, en favorisant les bords conservés entre les nœuds avec une fonction de coût de nœud similaire par rapport à ceux avec une fonction de coût de nœud dissemblable.

Le dernier algorithme est Natalie2.0 , une méthode d’alignement de réseau, qui considère le problème d’alignement de réseau comme une généralisation du problème d’affectation quadratique et le résout en utilisant des techniques de programmation linéaire en nombres entiers.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.