O cérebro é um órgão complexo de vertebrados e é composto de células únicas especializadas chamadas neurônios. Os neurônios são conectados entre eles através de sinapses formando uma rede complexa de conexões. As conexões entre os neurônios carregam pulsos de sinal que carregam informações . A atividade do cérebro deve-se principalmente a este conjunto de conexões.
Estudos recentes têm demonstrado de forma independente uma relação rigorosa entre o conjunto de conexões, as funções do cérebro e as relações entre a insurgência de doenças neurológicas e as variações dos mecanismos de conexões com respeito a pessoas saudáveis . Por exemplo, na doença de Alzheimer é detectada uma diminuição da conectividade e alterações no hipocampo, a doença de Parkinson está associada a uma conectividade alterada, ou no distúrbio da ansiedade é encontrada uma conectividade aumentada e alterações na amígdala .
Consequentemente, o interesse pela modelagem e análise de todo o sistema dos elementos cerebrais e suas relações levou à introdução da chamada connectomics, ou seja, o estudo do connectome referido como o conjunto de elementos e interações . A Connectomics é baseada em tecnologias modernas de investigação do cérebro que são capazes de tirar uma espécie de imagem das conexões cerebrais dos pacientes . Connectome pode ser analisado usando diferentes zoom, por exemplo, focando em componentes únicos, ou seja, neurônios e axônios, ou agrupando-os em regiões. Normalmente a análise de componentes únicos é definida como conectividade anatômica, enquanto a análise de regiões é chamada conectividade funcional porque as regiões estão em geral perfazendo diferentes funções.
entre as outras, uma das principais fontes para derivar informações sobre os conecomas é a Ressonância Magnética (RM) . Uma experiência típica de ressonância magnética produz um conjunto de imagens que fornecem tanto informação anatómica como funcional. A primeira é constituída por fibras axonais entre regiões corticais, a segunda fornece informações sobre a conectividade funcional, ou seja, a ativação da região de interesse (ROI). Tal análise é frequentemente conduzida através do uso de diffusion tensor imaging (DTI) que é uma versão especializada de Diffusion-weighted magnetic resonance imaging (DWI ou DW-MRI), e um DTI tem sido usado extensivamente para mapear a tractografia de matéria branca no cérebro através da análise de padrões de difusão de moléculas através de feixes de axônios neurais. As estruturas anatômicas de conectividade são derivadas principalmente através da aplicação de algoritmos de tractografia aos dados do DTI. Os dados de conectividade funcional são derivados da ressonância magnética funcional (fMRI). As imagens de fMRI mostram regiões ativas do cérebro em uma determinada instância, com base no nível de consumo de oxigênio no sangue. As redes obtidas são chamadas redes funcionais. O uso combinado destas duas técnicas é usado para determinar a estrutura do connectome do cérebro humano, como mostrado na Fig. 1.
Após obtidos, os dados do connectome precisam ser integrados em um modelo adequado. Uma das representações mais usadas de tais dados é dada pela teoria gráfica, cujos modelos têm sido usados por diferentes abordagens para extrair informações clinicamente relevantes . A teoria dos gráficos garante a possibilidade de modelar tais dados em um único modelo de rede e depois a possibilidade de resumir todas as características em poucas medidas, dando a compreensão da organização de toda a rede, bem como dos elementos individuais da rede .
Diferente de outros tipos de redes, a modelagem de connectomes usando gráficos é uma área de pesquisa aberta, uma vez que há muitas possibilidades de definir os nós, as bordas, que correspondem a diferentes escalas de vistas. Por exemplo, os nós podem representar os neurônios e bordas de seus axônios . Aqui focamos a representação da região de interesse (ROI) como nós, e a representação de conexões funcionais ou anatômicas como arestas. Existem três categorias principais de pesquisa aplicadas em tais redes: (i) a melhoria da reconstrução de gráficos a partir de imagens de RM, (ii) a identificação da estrutura das redes (ou seja, qual é o modelo teórico subjacente à organização da rede cerebral), (iii) a identificação de módulos relevantes que podem ser usados para entender as funções cerebrais e suas modificações em caso de doença (por exemplo, para a detecção precoce de doenças). O primeiro e o terceiro problema dependem estritamente da definição de uma estrutura para a comparação de gráficos.
Considerando, por exemplo, o primeiro problema, deve-se notar que cada experimento de RM produz uma série de imagens (tanto intra-subjetivas quanto inter-subjetivas) que precisam ser alinhadas em um domínio espacial. Ao utilizar imagens funcionais e estruturais, o co-registro é o processo de alinhamento das imagens funcionais e estruturais para mapear a informação funcional para o espaço anatômico. De tal forma, cada região corresponderá a um nó de uma rede usando um atlas para definir regiões anatomicamente significativas .
Antes disso, tal abordagem pode levar a imprecisões substanciais em casos de anatomia anormal (por exemplo, na presença de doenças) e desenvolvimento cerebral precoce (por exemplo, no cérebro da criança). Para resolver este problema, foi recentemente proposto o uso de parcelas livres de atlas e a construção e comparação de conectivos individuais apenas no espaço da rede. Nos autores, a parcelação livre de atlas é a melhor parcela que ainda interliga todo o cérebro, não deixando isolados nódulos. Em seguida, eles agrupam os sujeitos em grupos homogêneos, e NA é realizado dentro de cada grupo. A rede de soma é obtida e mapeada para a anatomia de um “cérebro de referência”
Este trabalho demonstra a possibilidade de usar NA no fluxo de trabalho de parcelamento livre de atlas e coloca à comunidade de pesquisa o desafio de explorar sistematicamente o desempenho de diferentes algoritmos de NA, já que diferentes abordagens de NA são amplamente aplicadas na análise de biologia molecular, mas ainda não foram exploradas em relação à conectividade da RMN.
As técnicas para o alinhamento de redes biológicas dividem-se em duas categorias: (i) o alinhamento de redes locais procura sub-redes relativamente pequenas e semelhantes que provavelmente representem estruturas funcionais conservadas, (ii) o alinhamento de redes globais procura a melhor sobreposição de todas as redes de entrada. Contudo, estas abordagens não podem ser facilmente aplicadas no problema do alinhamento do connectome. A razão está relacionada com a estratégia subjacente à metodologia de alinhamento. Por exemplo, os alinhadores de redes locais, amplamente utilizados para construir o alinhamento de redes de interação de proteínas (PINs), tomam como input duas redes e uma lista de nós de sementes utilizados para construir o gráfico de alinhamento inicial (ver para detalhes completos sobre a construção do gráfico de alinhamento). Estes nós iniciais são selecionados com base em considerações biológicas, tais como as relações de homologia entre nós de PINs. Como os nós das redes cerebrais representam ROIs, as informações de homologia não podem ser obtidas no caso de redes de connecome e então, o alinhamento local não pode ser aplicado.
Neste artigo selecionamos seis algoritmos de alinhamento global existentes e testamos estes alinhadores em redes cerebrais derivadas de ressonância magnética de difusão. Os algoritmos testados aqui são MAGNA++ , NETAL , GHOST , GEDEVO , WAVE , Natalie2.0 . Os algoritmos são aplicados para construir os alinhamentos entre as redes cerebrais de difusão derivadas de ressonância magnética. Após a construção dos alinhamentos, comparamos o desempenho destes algoritmos e avaliamos esta robustez.
Parcelamento cerebral
Uma etapa essencial na análise e mapeamento macroscópico da rede cerebral é a subdivisão do cérebro em regiões de grande escala, também conhecida como “processo de parcelamento”. A parcelação do cérebro consiste em dividir o cérebro em um conjunto de regiões macroscópicas, homogêneas e não sobrepostas em relação às informações fornecidas, geralmente por técnicas baseadas em ressonância magnética (RM) . Especialmente, a RM tem permitido obter informações sobre conectividade anatômica, conectividade funcional ou ativação relacionada a tarefas. Diferentes evidências demonstram que a parcelação do cérebro na região homogênea está longe de ser definida, assim como a definição das bordas e sua colocação. Na representação gráfica de um conector baseado na parcelação, os nós do gráfico correspondem a uma região cerebral e as bordas correspondem a conexões estruturais ou funcionais entre estas regiões. Apesar da sua relativa simplicidade, a aplicação da teoria dos gráficos ao estudo dos connectomas apresenta alguns desafios particulares relacionados com a definição significativa de nós e bordas. Um modelo ideal deve representar os verdadeiros subsistemas (como nós) e as verdadeiras relações (como bordas). No entanto, como profundamente investigado em , não há evidências claras para a definição ótima de ambos nós e bordas. Por exemplo, uma definição de nó ideal deve agrupar um conjunto de neurônios para maximizar a homogeneidade funcional dentro e para maximizar a heterogeneidade funcional entre diferentes nós. Além disso, ela deve levar em conta a relação espacial (e, espera-se, temporal) entre os nós. Além da definição, a representação das bordas também é atualmente um desafio aberto e esta tarefa está relacionada ao tipo de conectividade medida, e ao método utilizado para quantificá-la. Como mencionado acima, a conectividade cerebral pode se referir a diferentes aspectos da organização cerebral, incluindo (i) a conectividade anatômica que consiste em fibras axonais conectando regiões corticais e subcorticais inferidas a partir de imagens de difusão (ver Fig. 2 (1)), e (ii) conectividade funcional definida como as correlações estatísticas observadas do sinal do nível de oxigenação do sangue dependente (BOLD) entre regiões cerebrais.
Isto é, a escolha do esquema de parcelamento tem um impacto significativo na análise subseqüente. Actualmente existem três abordagens de parcelamento baseadas em connectome:
-
Parcelação do cérebro usando modelos anatómicos pré-definidos. Esta abordagem consiste no registo das imagens estruturais da ressonância magnética para o atlas anatómico com base nas áreas de Brodmann . Desta forma, todo o cérebro é subdividido em regiões rotuladas de acordo com as diferentes regiões rotuladas dos gabaritos;
-
Parcelação do cérebro através do uso de gabaritos gerados aleatoriamente . Para a parcelação aleatória são aplicados diferentes algoritmos para produzir parcelas de tamanho aproximadamente igual. Assim, os modelos gerados são caracterizados por regiões cerebrais de tamanho aproximadamente uniforme para evitar vieses anatômicos;
-
Parcelas baseadas em conectividade que visam delinear regiões cerebrais através da análise das semelhanças em padrões de conectividade estrutural ou funcional. Com base na noção de que regiões com um perfil de conectividade similar estão envolvidas nos mesmos papéis funcionais análogos, as parcelas baseadas na conectividade dividem pequenas regiões de sementes em uma maior coleção de regiões cerebrais funcionalmente homogêneas, agrupando sementes com perfis de conectividade similares.
No entanto, cada método apresenta algumas armadilhas. Por exemplo, o registro do cérebro do sujeito estudado a um cérebro genérico com áreas definidas de Brodmann levanta a questão da precisão do mapeamento. De fato, na maioria dos casos, as fronteiras das áreas de Brodmann, originalmente definidas usando diferenças citoarquitetônicas entre regiões cerebrais, não correspondem à superfície cortical analisada.
Esta abordagem é limitada pela variabilidade entre sujeitos e pode ser especialmente problemática no contexto da maturação do cérebro. Além disso, foi demonstrado que a parcelação do cérebro com modelos anatômicos pré-definidos pode impactar negativamente todas as análises subseqüentes, através da introdução de viés evidente. Neste trabalho, focalizamos a definição aleatória e livre de atlas de nós em indivíduos (ver Fig. 2 (2)), o que pode permitir um estudo completo do cérebro em rede e a comparação de cérebros de diferentes indivíduos e, potencialmente, de espécies .
Global network alignment algorithms
A identificação de um mapeamento preciso de nós entre redes livres de atlas pode oferecer detalhes significativos na comparação de cérebros ou estrutura de grupos de indivíduos, tais como indivíduos saudáveis versus indivíduos doentes. Muitos métodos diferentes de alinhamento de redes têm sido propostos em campos biológicos .
Formalmente, um gráfico G é definido como G={V,E}, onde V é um conjunto finito de nós e E é um conjunto finito de bordas. Que G 1={V 1,E 1} e G 2={V 2,E 2} sejam dois gráficos, onde V 1,2 são conjuntos de nós e E 1,2 são conjuntos de arestas, um alinhamento gráfico é o mapeamento entre os nós das redes de entrada que maximiza a similaridade entre as entidades mapeadas. Do ponto de vista teórico, o problema de alinhamento dos gráficos consiste em encontrar uma função de alinhamento (ou um mapeamento) f:V 1→V 2 que maximiza uma função de custo Q. A semelhança entre os gráficos é definida por uma função de custo, Q(G 1,G 2,f), também conhecida como a qualidade do alinhamento.
Deixe f ser um alinhamento entre dois gráficos G 1 e G 2, dado um nó u de G 1, f(u) é o conjunto de nós de G 2 que estão alinhados sob f para u. Q expressa a semelhança entre dois gráficos de entrada com respeito a um alinhamento específico f e a formulação de Q influencia fortemente a estratégia de mapeamento.
Existem diferentes formulações de Q que se enquadram nas seguintes classes:
Similaridade Topológica: Os gráficos são alinhados considerando apenas a topologia da borda, de modo que o alinhamento perfeito é alcançado quando os gráficos de entrada são isomórficos.
Usualmente, a função custo é definida como o número de bordas conservadas por f em relação ao número total de bordas na rede de origem (G 1), também referida como edge correctness (EC) . Portanto, o CE não leva em conta a rede de destino (G 2).
Outra medida típica é a Estrutura Conservada Induzida, ICS . Seja D o número de arestas em uma sub-rede de G 2 induzidas nos nós de G 2 alinhadas aos nós de G 1, ICS de f é a razão do número de arestas conservadas por f para D.
onde D é |E(G 2)|.
No entanto, o ICS falha na penalização de arestas desalinhadas na rede menor porque leva em conta a rede alvo.
Finalmente, a Pontuação da Substrutura Simétrica, S 3, leva em conta as arestas únicas no gráfico composto criado pela sobreposição de duas redes.
S 3 tem mostrado ser superior às medidas existentes, uma vez que penaliza tanto os alinhamentos de regiões esparsas para regiões densas do gráfico como os alinhamentos de regiões densas do gráfico para regiões esparsas do gráfico.
Similaridade de Nó: Tal função considera a similaridade entre nós mapeados. Os nós dos gráficos alinhados podem ser mais ou menos similares entre si. Assim o alinhamento deve alinhar cada nó de um gráfico ao nó mais similar do outro, dadas as funções de similaridade de nós, s(v 1,v 2)→R, v 1∈V 1, v 2∈V 2. O objetivo geral é maximizar a soma das pontuações considerando os nós alinhados.
Abordagens híbridas: Algumas formulações recentes de Q levam em conta ambas as abordagens por combinação linear.
O problema de alinhamento da rede pode ser formulado de várias maneiras. Em geral, o alinhamento da rede pode ser classificado como alinhamento local ou alinhamento global.
O alinhamento local visa encontrar múltiplas e não relacionadas regiões de isomorfismo, ou seja, a mesma estrutura gráfica, entre as redes de entrada, onde cada região implica um mapeamento independente de outras regiões. A estratégia consiste no mapeamento ou conjunto de mapeamentos entre subconjuntos de nós, de forma que sua similaridade seja máxima em todos os subconjuntos possíveis. Estas sub-redes correspondem a padrões conservados de interação que podem representar um motivo ou padrão conservado de atividades (uma sinopse está disponível em ). O alinhamento global visa encontrar um mapeamento que deve cobrir todos os nós das redes de entrada, associando cada nó de uma rede a um das outras redes ou marcando o nó como uma lacuna quando não existe uma possível correspondência. Esta estratégia não considera pequenas regiões de similaridade, ou seja, motivos conservados, mas tenta encontrar um mapeamento consistente entre todo o conjunto de nós das redes.
Neste trabalho, seis algoritmos de alinhamento global foram escolhidos para construir o alinhamento global das redes de cérebro. A seguir damos uma breve descrição conceptual.
Um método popular de alinhamento global existente é o MAGNA . MAGNA é um alinhador global de redes que simula uma população de alinhamentos que evolui ao longo do tempo aplicando um algoritmo genético e uma função para o cruzamento de dois alinhamentos em um alinhamento superior. Como o algoritmo genético simula o processo evolutivo orientado pela sobrevivência do princípio de ajuste, apenas os alinhamentos, ou seja, aqueles que conservam mais bordas, sobrevivem. Assim, o MAGNA passa para a geração seguinte, até que a precisão do alinhamento não possa ser mais optimizada. Recentemente, uma extensão do algoritmo MAGNA chamado MAGNA++ foi desenvolvido.
O segundo alinhador é NETAL , um algoritmo para o alinhamento global amplamente utilizado em redes de interação proteína-proteína. NETAL constrói o melhor alinhamento global de redes aplicando um método ganancioso, baseado na matriz de pontuação do alinhamento, que é derivado de informações biológicas e topológicas das redes de entrada.
O terceiro algoritmo, GHOST , é um alinhador global de redes em pares que usa uma nova assinatura espectral baseada na topologia da vizinhança local para medir a similaridade topológica entre sub-redes. A idéia por trás de GHOST consiste na combinação da nova assinatura espectral com o procedimento seed-and-extend para construir o alinhamento.
O quarto alinhador global é GEDEVO , uma nova ferramenta para o alinhamento eficiente de gráficos.
Baseando o método GEDEVO está o modelo Graph Edit Distance (GED), onde um gráfico é transferido para outro com um número mínimo de inserções e deleções de arestas. Assim, GEDEVO usa o GED como modelo de otimização para encontrar os melhores alinhamentos.
O quinto algoritmo é WAVE uma estratégia de alinhamento geral e inovadora que visa otimizar tanto a conservação do nó quanto a conservação da borda durante a construção de um alinhamento. WAVE é usado em cima de uma função de custo de nó estabelecida e leva a um novo método superior para alinhamento global da rede, favorecendo bordas conservadas entre nós com função de custo de nó semelhante àquelas com função de custo de nó diferente.
O último algoritmo é Natalie2.0 , um método de alinhamento de rede, que considera o problema de alinhamento de rede como uma generalização do problema de atribuição quadrática e o resolve usando técnicas de programação linear inteira.