Comparando Curvas de Sobrevivência

Estamos frequentemente interessados em avaliar se existem diferenças na sobrevivência (ou incidência acumulada de eventos) entre os diferentes grupos de participantes. Por exemplo, em um estudo clínico com um resultado de sobrevivência, podemos estar interessados em comparar a sobrevivência entre participantes recebendo um novo medicamento em comparação com um placebo (ou terapia padrão). Em um estudo observacional, podemos estar interessados em comparar sobrevivência entre homens e mulheres, ou entre participantes com e sem um fator de risco particular (por exemplo, hipertensão ou diabetes). Existem vários testes disponíveis para comparar a sobrevivência entre grupos independentes.

O Log Rank Test

O log rank test é um teste popular para testar a hipótese nula de não haver diferença na sobrevivência entre dois ou mais grupos independentes. O teste compara toda a experiência de sobrevivência entre grupos e pode ser pensado como um teste para verificar se as curvas de sobrevivência são idênticas (sobrepostas) ou não. As curvas de sobrevivência são estimadas para cada grupo, consideradas separadamente, usando o método de Kaplan-Meier e comparadas estatisticamente usando o teste de log rank. É importante notar que existem várias variações da estatística do teste de log rank que são implementadas por vários pacotes de computação estatística (por exemplo, SAS, R 4,6). Apresentamos aqui uma versão que está estreitamente ligada à estatística do teste de qui-quadrado e que compara com o número esperado de eventos em cada ponto do período de acompanhamento.

Exemplo:

Um pequeno ensaio clínico é executado para comparar dois tratamentos combinados em pacientes com câncer gástrico avançado. Vinte participantes com câncer gástrico estágio IV que consentem em participar do estudo são designados aleatoriamente para receber quimioterapia antes da cirurgia ou quimioterapia após a cirurgia. O resultado primário é a morte e os participantes são acompanhados por até 48 meses (4 anos) após a inscrição no estudo. As experiências dos participantes em cada braço do estudo são mostradas abaixo.

Chemoterapia antes da cirurgia		Chemoterapia após a cirurgia
Mês de Morte	Mês do Último Contato	Mês da Morte	> Mês do Último Contato
8	8	33	48
12	32	28	48
26	20	41	25
14	40		37
21			48
27			25
			> 43

Seis participantes no grupo de quimioterapia antes da cirurgia morrem no decurso do seguimento…em comparação com três participantes do grupo de quimioterapia após a cirurgia. Outros participantes de cada grupo são acompanhados durante vários meses, alguns até ao final do estudo aos 48 meses (no grupo de quimioterapia após a cirurgia). Usando os procedimentos descritos acima, primeiro construímos tabelas de vida para cada grupo de tratamento usando a abordagem Kaplan-Meier.

Tabela de vida para o grupo que recebe quimioterapia antes da cirurgia

Tempo, Meses	Número em risco Nt	Número de mortes Dt	Número Censurado Ct	Probabilidade de sobrevivência
0	10			1
8	10	1	1	0.900
12	8	1		0.788
14	7	1		0.675
20	6		1	0.675
21	5	1		0.540
26	4	1		0.405
27	3	1		0.270
32	2		1	0.270
40	1		1	0.270 >

Tabela de Vida para Grupos que Recebem Quimioterapia Pós-Cirurgia

Tempo, Meses	Número em risco Nt	Número de mortes Dt	Número Censurado Ct	Probabilidade de sobrevivência
0	10			1
25	10		2	1.000
28	8	1		0.875
33	7	1		0.750
37	6		1	0.750
41	5	1		0.600
43	4		1	0.600
48	3		3	0.600

As duas curvas de sobrevivência são mostradas abaixo.

Sobrevivência em Cada Grupo de Tratamento

Curvas de sobrevivência com quimioterapia antes ou após a cirurgia. >

As probabilidades de sobrevivência para o grupo de quimioterapia após a cirurgia são maiores do que as probabilidades de sobrevivência para o grupo de quimioterapia antes da cirurgia, sugerindo um benefício de sobrevivência. Entretanto, estas curvas de sobrevivência são estimadas a partir de pequenas amostras. Para comparar a sobrevida entre grupos podemos usar o teste de log rank. A hipótese nula é que não há diferença na sobrevivência entre os dois grupos ou que não há diferença entre as populações na probabilidade de morte em qualquer ponto. O teste de log rank é um teste não paramétrico e não faz suposições sobre as distribuições de sobrevivência. Em essência, o teste de log rank compara o número de eventos observados em cada grupo com o que seria esperado se a hipótese nula fosse verdadeira (i.e, se as curvas de sobrevivência fossem idênticas).

H0: As duas curvas de sobrevivência são idênticas (ou S1t = S2t) versus H1: As duas curvas de sobrevivência não são idênticas (ou S1t ≠ S2t, em qualquer momento t) (α=0,05).

A estatística de log rank é distribuída aproximadamente como uma estatística do teste do qui-quadrado. Há várias formas de estatística do teste, e elas variam em termos de como são computadas. Usamos o seguinte:

onde ΣOjt representa a soma do número de eventos observados no grupo j ao longo do tempo (por exemplo, j=1,2) e ΣEjt representa a soma do número esperado de eventos no grupo j ao longo do tempo.

As somas dos números observados e esperados de eventos são computadas para cada tempo de evento e somadas para cada grupo de comparação. A estatística do log rank tem graus de liberdade iguais a k-1, onde k representa o número de grupos de comparação. Neste exemplo, k=2 então a estatística do teste tem 1 grau de liberdade.

Para calcular a estatística do teste precisamos do número de eventos observados e esperados em cada tempo de evento. O número de eventos observados é da amostra e o número esperado de eventos é calculado assumindo que a hipótese nula é verdadeira (ou seja, que as curvas de sobrevivência são idênticas).

Para gerar o número esperado de eventos organizamos os dados em uma tabela de vida com linhas representando cada tempo de evento, independentemente do grupo em que o evento ocorreu. Também mantemos o controle da atribuição de grupos. Estimamos então a proporção de eventos que ocorrem em cada momento (Ot/Nt) usando dados de ambos os grupos combinados sob a hipótese de não haver diferença na sobrevivência (ou seja, assumindo que a hipótese nula é verdadeira). Multiplicamos essas estimativas pelo número de participantes em risco naquele momento em cada um dos grupos de comparação (N1t e N2t para os grupos 1 e 2 respectivamente).

Especificamente, calculamos para cada tempo de evento t, o número em risco em cada grupo, Njt (por exemplo, onde j indica o grupo, j=1, 2) e o número de eventos (mortes), Ojt ,em cada grupo. A tabela abaixo contém as informações necessárias para realizar o teste de classificação dos registros para comparar as curvas de sobrevivência acima. O grupo 1 representa o grupo de quimioterapia antes da cirurgia e o grupo 2 representa o grupo de quimioterapia após a cirurgia.

Dados para o teste de log rank para comparar as curvas de sobrevivência

Tempo, Meses	Número em risco no grupo 1 N1t	Número em risco no grupo 2 N2t	Número de eventos (Mortes) no grupo 1 O1t	Número de Eventos (Mortes) no Grupo 2 O2t
8	10	10	1	> 0
12	8	10	1	0
14	7	10	1	0
21	5	10	1	0
26	4	8	1	0
27	3	8	1	0
28	2	8	0	1
33	1	7	0	1
41	0	5	0	1

A seguir totalizamos o número em risco, Nt = N1t+N2t, em cada momento do evento e o número de eventos observados (mortes), Ot = O1t+O2t, em cada momento do evento. Em seguida, calculamos o número esperado de eventos em cada grupo. O número esperado de eventos é calculado em cada momento de evento da seguinte forma:

E1t = N1t*(Ot/Nt) para o grupo 1 e E2t = N2t*(Ot/Nt) para o grupo 2. Os cálculos são mostrados na tabela abaixo.

Números esperados de eventos em cada grupo

Tempo, Meses	Número em risco no grupo 1 N1t	Número em risco no grupo 2 N2t	Número total em risco Nt	Número de Eventos no Grupo 1 O1t	Número de Eventos no Grupo 2 O2t	Número Total de Eventos Ot	Número de Eventos previsto em Grupo 1 E1t = N1t*(Ot/Nt)	Número de Eventos previsto em Grupo 2 E2t = N2t*(Ot/Nt)
8	10	10	20	1	0	1	0.500	0.500
12	8	10	18	1	0	1	0.444	0.556
14	7	10	17	1	0	1	0.412	0.588
21	5	10	15	1	0	1	0.333	0.667
26	4	8	12	1	0	1	0.333	0.667
27	3	8	11	1	0	1	0.273	0.727
28	2	8	10	0	1	1	0.200	0.800
33	1	7	8	0	1	1	0.125	0.875
41	0	5	5	0	1	1	0.000	1.000

A seguir somamos os números de eventos observados em cada grupo (∑O1t e ΣO2t) e os números de eventos esperados em cada grupo (ΣE1t e ΣE2t) ao longo do tempo. Estes são mostrados na linha inferior da próxima tabela abaixo.

Números Totais Observados e Esperados de Observados em cada Grupo

Tempo, Meses	Número em risco no grupo 1 N1t	Número em risco no grupo 2 N2t	Número total em risco Nt	Número de Eventos no Grupo 1 O1t	Número de Eventos no Grupo 2 O2t	Número Total de Eventos Ot	Número de Eventos previsto em Grupo 1 E1t = N1t*(Ot/Nt)	Número de Eventos previsto em Grupo 2 E2t = N2t*(Ot/Nt)
8	10	10	20	1	0	1	0.500	0.500
12	8	10	18	1	0	1	0.444	0.556
14	7	10	17	1	0	1	0.412	0.588
21	5	10	15	1	0	1	0.333	0.667
26	4	8	12	1	0	1	0.333	0.667
27	3	8	11	1	0	1	0.273	0.727
28	2	8	10	0	1	1	0.200	0.800
33	1	7	8	0	1	1	0.125	0.875
41	0	5	5	0	1	1	0.000	1.000
				6	3		2.620	6.380

Agora podemos calcular a estatística do teste:

A estatística do teste é distribuída aproximadamente como qui-quadrado com 1 grau de liberdade. Assim, o valor crítico para o teste pode ser encontrado na tabela de Valores Críticos da distribuição Χ2.

Para este teste a regra de decisão é Rejeitar H0 se Χ2 > 3.84. Observamos Χ2 = 6,151, o que excede o valor crítico de 3,84. Portanto, nós rejeitamos H0. Temos evidências significativas, α=0.05, para mostrar que as duas curvas de sobrevivência são diferentes.

Exemplo:

Um investigador deseja avaliar a eficácia de uma breve intervenção para prevenir o consumo de álcool na gravidez. Mulheres grávidas com histórico de consumo pesado de álcool são recrutadas para o estudo e aleatorizadas para receber a intervenção breve focada na abstinência de álcool ou no pré-natal padrão. O resultado do interesse é a recidiva do consumo de álcool. As mulheres são recrutadas para o estudo com aproximadamente 18 semanas de gestação e acompanhadas durante o curso da gravidez até o parto (aproximadamente 39 semanas de gestação). Os dados são mostrados abaixo e indicam se as mulheres recaem ao beber e, em caso afirmativo, o tempo da primeira bebida medido no número de semanas a partir da aleatorização. Para as mulheres que não recaem, registramos o número de semanas a partir da aleatorização que elas estão livres de álcool.

Cuidado pré-natal padrão		> Intervenção do paciente
Relapso	Não há recapso	Relapso	Não há recapso
19	20	16	21
6	19	21	15
5	17	7	18
4	14		18
			>5

A questão de interesse é se existe uma diferença de tempo de recidiva entre as mulheres atribuídas aos cuidados pré-natais padrão em comparação com as atribuídas à intervenção breve.

Passo 1.

Estabelecer hipóteses e determinar o nível de significância.

H0: O tempo livre de recidiva é idêntico entre grupos versus

H1: O tempo livre de recidiva não é idêntico entre grupos (α=0.05)

Passo 2.

Selecionar a estatística de teste apropriada.

A estatística do teste para o log rank test é

Passo 3.

Configurar a regra de decisão.

A estatística do teste segue uma distribuição qui-quadrada, e assim encontramos o valor crítico na tabela de valores críticos para a distribuição Χ2) para df=k-1=2-1=1 e α=0.05. O valor crítico é 3,84 e a regra de decisão é rejeitar H0 se Χ2 > 3,84.

Passo 4.

Compute a estatística do teste.

Para calcular a estatística do teste, organizamos os dados de acordo com os tempos de evento (recidiva) e determinamos o número de mulheres em risco em cada grupo de tratamento e o número de recidivas em cada tempo de recidiva observado. Na tabela a seguir, o grupo 1 representa as mulheres que recebem o pré-natal padrão e o grupo 2 representa as mulheres que recebem a intervenção breve.

Tempo, Semanas	Número em risco – Grupo 1 N1t	Número em risco – Grupo 2 N2t	Número de recaídas – Grupo 1 O1t	> Número de recaídas – Grupo 1 Grupo 2 O2t
4	8	8	1	0
5	7	8	1	0
6	6	7	1	0
7	5	7	0	1
16	4	5	0	1
19	3	2	1	0
21	0	2	0	1

A seguir totalizamos o número em risco, , em cada momento de evento, o número de eventos observados (recaídas), , em cada momento de evento e determinar o número esperado de recaídas em cada grupo em cada momento de evento usando e .

Soma, então, os números de eventos observados em cada grupo (ΣO1t e ΣO2t) e os números de eventos esperados em cada grupo (ΣE1t e ΣE2t) ao longo do tempo. Os cálculos para os dados deste exemplo são mostrados abaixo.

Tempo, Semanas	Número no Grupo de Risco 1 N1t	Número no Grupo de Risco 2 N2t	Número total no Grupo de Risco Nt	Número de relapses Grupo 1 O1t	Número de relapses Grupo 2 O2t	Número total de relapses Ot	Número esperado de recaídas no grupo 1 >	Número esperado de recaídas no grupo 2
4	8	8	16	1	0	1	0.500	0.500
5	7	8	15	1	0	1	0.467	0.533
6	6	7	13	1	0	1	0.462	0.538
7	5	7	12	0	1	1	0.417	0.583
16	4	5	9	0	1	1	0.444	0.556
19	3	2	5	1	0	1	0.600	0.400
21	0	2	2	0	1	1	0.000	1.000
				4	3		2.890	4.110

Agora calculamos a estatística do teste:

Passo 5.

Conclusão. Não rejeite H0 porque 0,726 < 3,84. Não temos evidências estatisticamente significativas em α=0,05, para mostrar que o tempo de recidiva é diferente entre os grupos.

A figura abaixo mostra a sobrevivência (tempo livre de recidiva) em cada grupo. Observe que as curvas de sobrevivência não mostram muita separação, consistente com os achados não significativos no teste de hipóteses.

Tempo livre de recidiva em cada grupo

Ponto de tempo livre de recidiva em cada um dos dois grupos.

Como observado, há várias variações da estatística de classificação logarítmica. Alguns pacotes de computação estatística usam a seguinte estatística de teste para o teste de log rank para comparar dois grupos independentes:

onde ΣO1t é a soma do número de eventos observados no grupo 1, e ΣE1t é a soma do número esperado de eventos no grupo 1, tomado sobre todos os tempos de eventos. O denominador é a soma das variâncias do número esperado de eventos em cada tempo de evento, que é calculado da seguinte forma:

Existem outras versões da estatística do log rank, bem como outros testes para comparar funções de sobrevivência entre grupos independentes.7-9 Por exemplo, um teste popular é o teste Wilcoxon modificado que é sensível a diferenças maiores nos perigos mais cedo do que mais tarde no seguimento.10

retornar ao topo | página anterior | página seguinte

O Log Rank Test

Deixe uma resposta Cancelar resposta