We willen vaak nagaan of er verschillen zijn in overleving (of cumulatieve incidentie van voorvallen) tussen verschillende groepen deelnemers. In een klinisch onderzoek met een overlevingsuitkomst willen we bijvoorbeeld de overleving vergelijken tussen deelnemers die een nieuw geneesmiddel krijgen en deelnemers die een placebo (of standaardtherapie) krijgen. In een observationele studie kunnen we geïnteresseerd zijn in een vergelijking van de overleving tussen mannen en vrouwen, of tussen deelnemers met en zonder een bepaalde risicofactor (bv. hypertensie of diabetes). Er zijn verschillende tests beschikbaar om de overleving tussen onafhankelijke groepen te vergelijken.

De Log Rank Test

De log rank test is een populaire test om de nulhypothese te testen van geen verschil in overleving tussen twee of meer onafhankelijke groepen. De test vergelijkt de gehele overlevingservaring tussen groepen en kan worden opgevat als een test of de overlevingskrommen identiek (overlappend) zijn of niet. De overlevingskrommen worden voor elke groep afzonderlijk geschat met behulp van de Kaplan-Meier-methode en statistisch vergeleken met behulp van de log rank test. Het is belangrijk op te merken dat er verschillende varianten van de log rank test statistiek bestaan die door verschillende statistische rekenpakketten worden geïmplementeerd (b.v. SAS, R 4,6). Wij presenteren hier één versie die nauw verbonden is met de statistiek van de chi-kwadraattoets en die het waargenomen aantal voorvallen vergelijkt met het verwachte aantal voorvallen op elk tijdstip gedurende de follow-upperiode.

Voorbeeld:

Een kleine klinische studie wordt uitgevoerd om twee combinatiebehandelingen bij patiënten met gevorderde maagkanker te vergelijken. Twintig deelnemers met stadium IV-maagkanker die instemmen met deelname aan het onderzoek, krijgen willekeurig chemotherapie vóór de operatie of chemotherapie na de operatie. Het primaire resultaat is overlijden en de deelnemers worden gevolgd tot 48 maanden (4 jaar) na hun inschrijving voor de proef. De ervaringen van de deelnemers aan elke arm van de proef zijn hieronder weergegeven.

Overlijden

Chemotherapie vóór operatie

Chemotherapie na operatie

Maand van overlijden

Maand van overlijden

Maand van overlijden

Maand van laatste contact

Maand van overlijden

Maand van laatste contact

8

8

33

48

12

32

28

48

26

20

41

25

14

40

37

21

48

27

25

43

Zes deelnemers in de groep met chemotherapie vóór operatie overlijden in de loop van de follow-vergeleken met drie deelnemers in de chemotherapie na de operatie groep. Andere deelnemers in elke groep worden gedurende een verschillend aantal maanden gevolgd, sommige tot het einde van de studie op 48 maanden (in de chemotherapie na chirurgie groep). Met behulp van de hierboven geschetste procedures construeren wij eerst levenscycli voor elke behandelingsgroep volgens de Kaplan-Meier-methode.

Levensduur tabel voor groep die chemotherapie kreeg voor de operatie

Tijd, Maanden

Aantal risicogroepen

Nt

Aantal sterfgevallen

Dt

Aantal gecensureerde

Ct

Overlevingskans

0

10

1

8

10

1

1

0.900

12

8

1

0.788

14

7

1

0.675

20

6

1

0.675

21

5

1

0.540

26

4

1

0.405

27

3

1

0.270

32

2

1

0.270

40

1

1

0.270

Levensduur tabel voor groep die chemotherapie krijgt na operatie

Tijd, Maanden

Aantal risicogevallen

Nt

Aantal sterfgevallen

Dt

Aantal gecensureerde

Ct

Overlevingskans

0

10

1

25

10

2

1.000

28

8

1

0.875

33

7

1

0.750

37

6

1

0.750

41

5

1

0.600

43

4

1

0.600

48

3

3

0,600

De twee overlevingscurven zijn hieronder weergegeven.

Overleving in elke behandelingsgroep

Overlevingscurven met chemotherapie voor of na de operatie.

De overlevingskansen voor de chemotherapie na de operatiegroep zijn hoger dan de overlevingskansen voor de chemotherapie voor de operatiegroep, wat duidt op een overlevingsvoordeel. Deze overlevingskrommen zijn echter geschat op basis van kleine steekproeven. Om de overleving tussen groepen te vergelijken kunnen we de log rank test gebruiken. De nulhypothese is dat er geen verschil is in overleving tussen de twee groepen of dat er geen verschil is tussen de populaties in de kans op overlijden op enig moment. De log rank test is een niet-parametrische test en maakt geen veronderstellingen over de overlevingsdistributies. In wezen vergelijkt de logaranktest het waargenomen aantal voorvallen in elke groep met wat zou worden verwacht indien de nulhypothese waar zou zijn (d.w.z, als de overlevingskrommen identiek zouden zijn).

H0: De twee overlevingskrommen zijn identiek (of S1t = S2t) versus H1: De twee overlevingskrommen zijn niet identiek (of S1t ≠ S2t, op elk tijdstip t) (α=0,05).

De log rank statistiek is bij benadering verdeeld als een chi-kwadraat teststatistiek. Er zijn verschillende vormen van de teststatistiek, en zij verschillen in de wijze waarop zij worden berekend. Wij gebruiken de volgende vorm:

waarbij ΣOjt de som is van het waargenomen aantal voorvallen in de jde groep in de tijd (bv. j=1,2) en ΣEjt de som is van het verwachte aantal voorvallen in de jde groep in de tijd.

De sommen van het waargenomen en het verwachte aantal voorvallen worden berekend voor elke voorvaltijd en opgeteld voor elke vergelijkingsgroep. De log-rangstatistiek heeft vrijheidsgraden gelijk aan k-1, waarbij k het aantal vergelijkingsgroepen voorstelt. In dit voorbeeld is k=2, zodat de teststatistiek 1 vrijheidsgraad heeft.

Om de teststatistiek te berekenen hebben we het waargenomen en het verwachte aantal voorvallen op elk tijdstip van de gebeurtenis nodig. Het geobserveerde aantal gebeurtenissen is afkomstig van de steekproef en het verwachte aantal gebeurtenissen wordt berekend ervan uitgaande dat de nulhypothese waar is (d.w.z. dat de overlevingscurven identiek zijn).

Om de verwachte aantallen gebeurtenissen te genereren, ordenen wij de gegevens in een tabel met rijen die elk tijdstip van de gebeurtenis vertegenwoordigen, ongeacht de groep waarin de gebeurtenis zich heeft voorgedaan. Wij houden ook de groepstoewijzing bij. Vervolgens schatten wij de proportie voorvallen die zich op elk tijdstip voordoen (Ot/Nt) met gebruikmaking van gegevens van beide groepen gecombineerd onder de veronderstelling dat er geen verschil in overleving is (d.w.z. ervan uitgaande dat de nulhypothese waar is). Wij vermenigvuldigen deze schattingen met het aantal deelnemers dat op dat tijdstip risico loopt in elk van de vergelijkingsgroepen (N1t en N2t voor respectievelijk groep 1 en groep 2).

Specifiek berekenen wij voor elk tijdstip van de gebeurtenis t, het aantal dat risico loopt in elke groep, Njt (waarbij j de groep aangeeft, j=1, 2) en het aantal gebeurtenissen (sterfgevallen), Ojt , in elke groep. De onderstaande tabel bevat de informatie die nodig is om de log rank test uit te voeren om de bovenstaande overlevingskrommen te vergelijken. Groep 1 vertegenwoordigt de chemotherapie vóór de operatie groep, en groep 2 vertegenwoordigt de chemotherapie na de operatie groep.

Gegevens voor Log Rank Test om overlevingskrommen te vergelijken

Tijd, Maanden

Aantal risicogevallen in groep 1

N1t

Aantal risicogevallen in groep 2

N2t

Aantal voorvallen (sterfgevallen) in groep 1

O1t

Aantal voorvallen (sterfgevallen) in groep 2

N2t

Aantal voorvallen (sterfgevallen) in groep 1

O1t

Gebeurtenissen (Sterfgevallen) in groep 2

O2t

8

10

10

1

0

12

8

10

1

0

14

7

10

1

0

21

5

10

1

0

26

4

8

1

0

27

3

8

1

0

28

2

8

0

1

33

1

7

0

1

41

0

5

0

1

Vervolgens tellen we het aantal risicopersonen bij elkaar op, Nt = N1t+N2t, op elk tijdstip van de gebeurtenis en het aantal waargenomen voorvallen (sterfgevallen), Ot = O1t+O2t, op elk tijdstip van de gebeurtenis. Vervolgens berekenen wij het verwachte aantal voorvallen in elke groep. Het verwachte aantal voorvallen wordt op elk tijdstip van de gebeurtenis als volgt berekend:

E1t = N1t*(Ot/Nt) voor groep 1 en E2t = N2t*(Ot/Nt) voor groep 2. De berekeningen staan in onderstaande tabel.

Verwachte aantallen gebeurtenissen in elke groep

Tijd, Maanden

Aantal risicogroepen in groep 1

N1t

Aantal risicogroepen in groep 2

N2t

Totaal aantal risicogroepen

Nt

Aantal voorvallen in groep 1

O1t

Aantal voorvallen in groep 2

O2t

Totaal aantal voorvallen

Ot

Verwacht aantal gebeurtenissen in

Groep 1

E1t = N1t*(Ot/Nt)

Verwacht aantal gebeurtenissen in

Groep 2

E2t = N2t*(Ot/Nt)

8

10

10

20

1

0

1

0.500

0.500

12

8

10

18

1

0

1

0.444

0.556

14

7

10

17

1

0

1

0.412

0.588

21

5

10

15

1

0

1

0.333

0.667

26

4

8

12

1

0

1

0.333

0.667

27

3

8

11

1

0

1

0.273

0.727

28

2

8

10

0

1

1

0.200

0.800

33

1

7

8

0

1

1

0.125

0.875

41

0

5

5

0

1

1

0.000

1.000

Vervolgens tellen we de waargenomen aantallen gebeurtenissen in elke groep (∑O1t en ΣO2t) en de verwachte aantallen gebeurtenissen in elke groep (ΣE1t en ΣE2t) op in de tijd. Deze staan in de onderste rij van de volgende tabel.

Totaal waargenomen en verwachte aantallen waarnemingen in elke groep

Tijd, Maanden

Aantal risicogroepen in groep 1

N1t

Aantal risicogroepen in groep 2

N2t

Totaal aantal risicogroepen

Nt

Aantal voorvallen in groep 1

O1t

Aantal voorvallen in groep 2

O2t

Totaal aantal voorvallen

Ot

Verwacht aantal gebeurtenissen in

Groep 1

E1t = N1t*(Ot/Nt)

Verwacht aantal gebeurtenissen in

Groep 2

E2t = N2t*(Ot/Nt)

8

10

10

20

1

0

1

0.500

0.500

12

8

10

18

1

0

1

0.444

0.556

14

7

10

17

1

0

1

0.412

0.588

21

5

10

15

1

0

1

0.333

0.667

26

4

8

12

1

0

1

0.333

0.667

27

3

8

11

1

0

1

0.273

0.727

28

2

8

10

0

1

1

0.200

0.800

33

1

7

8

0

1

1

0.125

0.875

41

0

5

5

0

1

1

0.000

1.000

6

3

2.620

6,380

We kunnen nu de teststatistiek berekenen:

De teststatistiek is bij benadering verdeeld als chi-kwadraat met 1 graad van vrijheid. De kritische waarde voor de test kan dus worden gevonden in de tabel Kritische waarden van de Χ2-verdeling.

Voor deze test luidt de beslissingsregel: Verwerp H0 als Χ2 > 3,84. We zien dat Χ2 = 6,151, wat meer is dan de kritische waarde van 3,84. Daarom verwerpen wij H0. We hebben significant bewijs, α=0,05, om aan te tonen dat de twee overlevingskrommen verschillend zijn.

Voorbeeld:

Een onderzoeker wil de werkzaamheid evalueren van een korte interventie om alcoholgebruik tijdens de zwangerschap te voorkomen. Zwangere vrouwen met een voorgeschiedenis van zwaar alcoholgebruik worden voor de studie gerekruteerd en krijgen willekeurig ofwel de korte interventie gericht op onthouding van alcohol ofwel de standaard prenatale zorg. De uitkomst van de studie is terugval in drinken. Vrouwen worden bij een zwangerschapsduur van ongeveer 18 weken voor de studie gerekruteerd en gedurende de gehele zwangerschap gevolgd tot de bevalling (ongeveer 39 weken zwangerschap). De gegevens worden hieronder weergegeven en geven aan of vrouwen terugvallen in drinken en zo ja, het tijdstip van hun eerste drinkpauze gemeten in het aantal weken vanaf de randomisatie. Voor vrouwen die niet hervallen, noteren we het aantal weken vanaf de randomisatie dat ze alcoholvrij zijn.

Standaard prenatale zorg

Korte interventie

Terugval

Geen terugval

Terugval

Geen terugval

19

20

16

21

6

19

21

15

5

17

7

18

4

14

18

5

De vraag die van belang is, is of er een verschil is in de tijd tot terugval tussen vrouwen die zijn toegewezen aan de standaard prenatale zorg en vrouwen die zijn toegewezen aan de korte interventie.

  • Stap 1.

Hypothesen opstellen en significantieniveau bepalen.

H0: Terugvalvrije tijd is identiek tussen groepen versus

H1: Terugvalvrije tijd is niet identiek tussen groepen (α=0,05)

  • Stap 2.

Selecteer de juiste teststatistiek.

De teststatistiek voor de log rang-test is

  • Stap 3.

Stel de beslisregel op.

De teststatistiek volgt een chi-kwadraatverdeling, en dus vinden we de kritische waarde in de tabel met kritische waarden voor de Χ2-verdeling) voor df=k-1=2-1=1 en α=0,05. De kritische waarde is 3,84 en de beslisregel is om H0 af te wijzen als Χ2 > 3,84.

  • Stap 4.

Bereken de teststatistiek.

Om de teststatistiek te berekenen, ordenen we de gegevens naar gebeurtenis (terugval)tijd en bepalen we het aantal vrouwen dat in elke behandelingsgroep risico loopt en het aantal dat op elk waargenomen terugvaltijdstip terugvalt. In de volgende tabel staat groep 1 voor vrouwen die standaard prenatale zorg krijgen en groep 2 voor vrouwen die de korte interventie krijgen.

Tijd, Weken

>

Aantal risicogroepen – groep 1

N1t

Aantal risicogroepen – groep 2

N2t

Aantal recidieven – groep 1 O1t

Aantal recidieven – groep 2 O2t

Aantal recidieven – groep 1 O1t

Aantal recidieven – groep 2 O2t

Aantal recidieven. Groep 2 O2t

4

8

8

1

0

5

7

8

1

0

6

6

7

1

0

7

5

7

0

1

16

4

5

0

1

19

3

2

1

0

21

0

2

0

1

Vervolgens tellen we het aantal risicopersonen op, , op elk tijdstip, het aantal waargenomen voorvallen (hervallen), , op elk tijdstip en bepalen we het verwachte aantal hervallen in elke groep op elk tijdstip met behulp van en .

Wij tellen vervolgens de waargenomen aantallen voorvallen in elke groep (ΣO1t en ΣO2t) en de verwachte aantallen voorvallen in elke groep (ΣE1t en ΣE2t) op over de tijd. De berekeningen voor de gegevens in dit voorbeeld zijn hieronder weergegeven.

Tijd, Weken

Aantal risicogroep 1

N1t

Aantal risicogroep 2

N2t

Totaal aantal risicogroepen

Nt

Aantal recidieven

Groep 1

O1t

Aantal recidieven

Groep 2

O2t

Totaal aantal

van recidieven

Ot

Verwacht aantal recidieven in groep 1

Verwacht aantal recidieven in groep 2

4

8

8

16

1

0

1

0.500

0.500

5

7

8

15

1

0

1

0.467

0.533

6

6

7

13

1

0

1

0.462

0.538

7

5

7

12

0

1

1

0.417

0.583

16

4

5

9

0

1

1

0.444

0.556

19

3

2

5

1

0

1

0.600

0.400

21

0

2

2

0

1

1

0.000

1.000

4

3

2.890

4.110

We berekenen nu de teststatistiek:

  • Step 5.

Conclusie. Verwerp H0 niet omdat 0,726 < 3,84. We hebben geen statistisch significant bewijs bij α=0,05, om aan te tonen dat de tijd tot terugval verschilt tussen de groepen.

Onderstaande figuur toont de overleving (terugvalvrije tijd) in elke groep. Merk op dat de overlevingscurven niet veel scheiding vertonen, in overeenstemming met de niet-significante bevindingen in de hypothesetoets.

Relapse-Free Time in Each Group

Plot van de relapse-free time in elk van de twee groepen.

Zoals opgemerkt, zijn er verschillende variaties van de log rank statistic. Sommige statistische rekenpakketten gebruiken de volgende teststatistiek voor de log rank test om twee onafhankelijke groepen te vergelijken:

waarbij ΣO1t de som is van het waargenomen aantal voorvallen in groep 1, en ΣE1t de som is van het verwachte aantal voorvallen in groep 1, genomen over alle gebeurtenistijden. De noemer is de som van de varianties van de verwachte aantallen voorvallen op elk tijdstip, die als volgt wordt berekend:

Er zijn andere versies van de log rank-statistiek en andere tests om overlevingsfuncties tussen onafhankelijke groepen te vergelijken.7-9 Een populaire test is bijvoorbeeld de gemodificeerde Wilcoxon-test, die gevoelig is voor grotere verschillen in risico’s eerder dan later in de follow-up.10

terug naar boven | vorige pagina | volgende pagina

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.