Często jesteśmy zainteresowani oceną, czy istnieją różnice w przeżywalności (lub skumulowanej częstości występowania zdarzeń) pomiędzy różnymi grupami uczestników. Na przykład, w badaniu klinicznym z wynikiem przeżycia, możemy być zainteresowani porównaniem przeżycia pomiędzy uczestnikami otrzymującymi nowy lek w porównaniu do placebo (lub standardowej terapii). W badaniu obserwacyjnym może nas interesować porównanie przeżywalności między mężczyznami i kobietami lub między uczestnikami z określonym czynnikiem ryzyka (np. nadciśnieniem lub cukrzycą) i bez niego. Istnieje kilka dostępnych testów do porównywania przeżycia wśród niezależnych grup.

Test rang log

Test rang log jest popularnym testem do testowania hipotezy zerowej o braku różnicy w przeżyciu między dwiema lub więcej niezależnymi grupami. Test porównuje całe przeżycie między grupami i można o nim myśleć jako o teście, czy krzywe przeżycia są identyczne (nakładają się) czy nie. Krzywe przeżycia są szacowane dla każdej grupy, rozpatrywanej oddzielnie, za pomocą metody Kaplana-Meiera i porównywane statystycznie za pomocą testu log rank. Należy zwrócić uwagę, że istnieje kilka odmian statystyki log rank test, które są implementowane przez różne pakiety do obliczeń statystycznych (np. SAS, R 4,6). Przedstawiamy tutaj jedną wersję, która jest ściśle powiązana ze statystyką testu chi kwadrat i porównuje zaobserwowane do oczekiwanych liczby zdarzeń w każdym punkcie czasowym w okresie obserwacji.

Przykład:

Małe badanie kliniczne jest prowadzone w celu porównania dwóch terapii skojarzonych u pacjentów z zaawansowanym rakiem żołądka. Dwudziestu uczestników z rakiem żołądka w stadium IV, którzy wyrazili zgodę na udział w badaniu, zostaje losowo przydzielonych do otrzymywania chemioterapii przed operacją lub chemioterapii po operacji. Pierwszorzędowym wynikiem badania jest zgon, a uczestnicy są obserwowani przez okres do 48 miesięcy (4 lata) po włączeniu do badania. Doświadczenia uczestników w każdym ramieniu badania są przedstawione poniżej.

.

Chemoterapia przed operacją

Chemoterapia po operacji

Miesiąc Zgonu

Miesiąc ostatniego kontaktu

Miesiąc zgonu

Miesiąc ostatniego kontaktu

8

8

33

48

12

32

28

48

26

20

41

25

14

40

37

21

48

27

25

43

Sześciu uczestników w grupie otrzymującej chemioterapię przed zabiegiem operacyjnym zmarło w trakcie obserwacji w porównaniu z trzema uczestnikami w grupie otrzymującej chemioterapię przed zabiegiem operacyjnym.w porównaniu z trzema uczestnikami w grupie otrzymującej chemioterapię po operacji. Pozostali uczestnicy w każdej grupie są obserwowani przez różną liczbę miesięcy, niektórzy aż do końca badania w wieku 48 miesięcy (w grupie chemioterapii po operacji). Korzystając z procedur opisanych powyżej, najpierw konstruujemy tablice trwania życia dla każdej grupy leczenia przy użyciu podejścia Kaplana-Meiera.

Tabela życia dla grupy otrzymującej chemioterapię przed operacją

.

Czas, Months

Liczba osób zagrożonych

Nt

Liczba zgonów

Dt

Liczba ocenzurowanych

Ct

Prawdopodobieństwo przeżycia

0

10

1

8

10

1

1

0.900

12

8

1

0.788

14

7

1

0.675

20

6

1

0.675

21

5

1

0.540

26

4

1

0.405

27

3

1

0.270

32

2

1

0.270

40

1

1

0.270

Life Table for Group Receiving Chemotherapy After Surgery

.

Czas, Months

Liczba osób zagrożonych

Nt

Liczba zgonów

Dt

Liczba ocenzurowanych

Ct

Prawdopodobieństwo przeżycia

0

10

1

25

10

2

1.000

28

8

1

0.875

33

7

1

0.750

37

6

1

0.750

41

5

1

0.600

43

4

1

0.600

48

3

3

0,600

Dwie krzywe przeżycia przedstawiono poniżej.

Survival in Each Treatment Group

Krzywe przeżycia z chemioterapią przed lub po operacji.

Prawdopodobieństwa przeżycia dla grupy otrzymującej chemioterapię po operacji są wyższe niż prawdopodobieństwa przeżycia dla grupy otrzymującej chemioterapię przed operacją, co sugeruje korzyść w zakresie przeżycia. Jednakże, te krzywe przeżycia są szacowane na podstawie małych próbek. Aby porównać przeżycie między grupami, możemy użyć testu log rank. Hipotezą zerową jest, że nie ma różnicy w przeżyciu między dwiema grupami lub że nie ma różnicy między populacjami w prawdopodobieństwie śmierci w jakimkolwiek punkcie. Test logarytmiczny jest testem nieparametrycznym i nie przyjmuje żadnych założeń dotyczących rozkładów przeżycia. W istocie, test log rank porównuje zaobserwowaną liczbę zdarzeń w każdej grupie z tym, czego można by się spodziewać, gdyby hipoteza zerowa była prawdziwa (tj, gdyby krzywe przeżycia były identyczne).

H0: Dwie krzywe przeżycia są identyczne (lub S1t = S2t) versus H1: Dwie krzywe przeżycia nie są identyczne (lub S1t ≠ S2t, w dowolnym czasie t) (α=0.05).

Statystyka log rank jest w przybliżeniu dystrybuowana jako statystyka testu chi kwadrat. Istnieje kilka postaci tej statystyki testowej, a różnią się one sposobem obliczania. My używamy następującej:

gdzie ΣOjt reprezentuje sumę zaobserwowanej liczby zdarzeń w j-tej grupie w czasie (np., j=1,2) i ΣEjt reprezentuje sumę oczekiwanej liczby zdarzeń w j-tej grupie w czasie.

Sumy zaobserwowanych i oczekiwanych liczb zdarzeń są obliczane dla każdego czasu zdarzenia i sumowane dla każdej grupy porównawczej. Statystyka logarytmiczna rang ma stopnie swobody równe k-1, gdzie k oznacza liczbę grup porównawczych. W tym przykładzie k=2, więc statystyka testowa ma 1 stopień swobody.

Do obliczenia statystyki testowej potrzebujemy obserwowanej i oczekiwanej liczby zdarzeń w każdym czasie zdarzenia. Obserwowana liczba zdarzeń pochodzi z próby, a oczekiwana liczba zdarzeń jest obliczana przy założeniu, że hipoteza zerowa jest prawdziwa (tzn. że krzywe przeżycia są identyczne).

Aby wygenerować oczekiwaną liczbę zdarzeń, organizujemy dane w tabelę życia z wierszami reprezentującymi każdy czas zdarzenia, niezależnie od grupy, w której zdarzenie wystąpiło. Śledzimy również przypisanie do grupy. Następnie szacujemy proporcję zdarzeń, które występują w każdym czasie (Ot/Nt), wykorzystując dane z obu grup łącznie przy założeniu braku różnicy w przeżywalności (tj. zakładając, że hipoteza zerowa jest prawdziwa). Mnożymy te szacunki przez liczbę uczestników zagrożonych w tym czasie w każdej z grup porównawczych (N1t i N2t odpowiednio dla grup 1 i 2).

Specyficznie, obliczamy dla każdego zdarzenia w czasie t, liczbę zagrożonych w każdej grupie, Njt (np. gdzie j oznacza grupę, j=1, 2) i liczbę zdarzeń (zgonów), Ojt , w każdej grupie. Poniższa tabela zawiera informacje potrzebne do przeprowadzenia testu log rank w celu porównania powyższych krzywych przeżycia. Grupa 1 reprezentuje grupę otrzymującą chemioterapię przed operacją, a grupa 2 grupę otrzymującą chemioterapię po operacji.

Data for Log Rank Test to Compare Survival Curves

.

Time, Months

Number at Risk in Group 1

N1t

Number at Risk in Group 2

N2t

Number of Events (Deaths) in Group 1

O1t

Number of Events (Deaths) in Group 1

O1t

Number Zdarzeń (Zgonów) w Grupie 2

O2t

8

10

10

1

0

12

8

10

1

0

14

7

10

1

0

21

5

10

1

0

26

4

8

1

0

27

3

8

1

0

28

2

8

0

1

33

1

7

0

1

41

0

5

0

1

Następnie sumujemy liczbę zagrożoną, Nt = N1t+N2t, w każdym czasie zdarzenia oraz liczbę zaobserwowanych zdarzeń (zgonów), Ot = O1t+O2t, w każdym czasie zdarzenia. Następnie obliczamy oczekiwaną liczbę zdarzeń w każdej grupie. Oczekiwana liczba zdarzeń jest obliczana dla każdego czasu zdarzenia w następujący sposób:

E1t = N1t*(Ot/Nt) dla grupy 1 i E2t = N2t*(Ot/Nt) dla grupy 2. Obliczenia są przedstawione w poniższej tabeli.

Przewidywana liczba zdarzeń w każdej grupie

Czas, Months

Number at Risk in Group 1

N1t

Number at Risk in Group 2

N2t

Total Number at Risk

Nt

.

Liczba zdarzeń w grupie 1

O1t

Liczba zdarzeń w grupie 2

O2t

Totalna liczba zdarzeń

Ot

Oczekiwana liczba zdarzeń w

Grupa 1

E1t = N1t*(Ot/Nt)

Oczekiwana liczba zdarzeń w

Grupa 2

E2t = N2t*(Ot/Nt)

8

10

10

20

1

0

1

0.500

0.500

12

8

10

18

1

0

1

0.444

0.556

14

7

10

17

1

0

1

0.412

0.588

21

5

10

15

1

0

1

0.333

0.667

26

4

8

12

1

0

1

0.333

0.667

27

3

8

11

1

0

1

0.273

0.727

28

2

8

10

0

1

1

0.200

0.800

33

1

7

8

0

1

1

0.125

0.875

41

0

5

5

0

1

1

0.000

1.000

Następnie sumujemy obserwowane liczby zdarzeń w każdej grupie (∑O1t i ΣO2t) oraz oczekiwane liczby zdarzeń w każdej grupie (ΣE1t i ΣE2t) w czasie. Są one przedstawione w dolnym wierszu kolejnej tabeli poniżej.

Total Observed and Expected Numbers of Observed in each Group

Time, Months

Number at Risk in Group 1

N1t

Number at Risk in Group 2

N2t

Total Number at Risk

Nt

.

Liczba zdarzeń w grupie 1

O1t

Liczba zdarzeń w grupie 2

O2t

Totalna liczba zdarzeń

Ot

Oczekiwana liczba zdarzeń w

Grupa 1

E1t = N1t*(Ot/Nt)

Oczekiwana liczba zdarzeń w

Grupa 2

E2t = N2t*(Ot/Nt)

8

10

10

20

1

0

1

0.500

0.500

12

8

10

18

1

0

1

0.444

0.556

14

7

10

17

1

0

1

0.412

0.588

21

5

10

15

1

0

1

0.333

0.667

26

4

8

12

1

0

1

0.333

0.667

27

3

8

11

1

0

1

0.273

0.727

28

2

8

10

0

1

1

0.200

0.800

33

1

7

8

0

1

1

0.125

0.875

41

0

5

5

0

1

1

0.000

1.000

6

3

2.620

6.380

Możemy teraz obliczyć statystykę testową:

Statystyka testowa jest w przybliżeniu rozłożona jako chi kwadrat z 1 stopniem swobody. Zatem wartość krytyczną dla testu można znaleźć w tabeli Wartości krytyczne rozkładu Χ2.

Dla tego testu regułą decyzyjną jest odrzucenie H0, jeśli Χ2 > 3,84. Obserwujemy Χ2 = 6.151, co przekracza wartość krytyczną 3.84. W związku z tym odrzucamy H0. Mamy istotny dowód, α=0,05, wskazujący na to, że obie krzywe przeżycia są różne.

Przykład:

Badacz chce ocenić skuteczność krótkiej interwencji mającej na celu zapobieganie spożywaniu alkoholu w ciąży. Kobiety w ciąży, u których w przeszłości stwierdzono duże spożycie alkoholu, są rekrutowane do badania i randomizowane do otrzymania albo krótkiej interwencji skoncentrowanej na abstynencji od alkoholu, albo standardowej opieki prenatalnej. Interesującym wynikiem jest powrót do picia. Kobiety są rekrutowane do badania w około 18 tygodniu ciąży i obserwowane przez cały okres ciąży aż do porodu (około 39 tygodnia ciąży). Dane przedstawione poniżej wskazują, czy kobiety wracają do picia, a jeśli tak, to kiedy po raz pierwszy piją, mierzone w liczbie tygodni od randomizacji. W przypadku kobiet, u których nie nastąpił nawrót picia, odnotowujemy liczbę tygodni od randomizacji, w ciągu których nie piły alkoholu.

.

.

Standardowa opieka prenatalna

Krótka interwencja

Powrót

Bez nawrotu

Powrót

Bez nawrotu

Bez nawrotu

19

20

16

21

6

19

21

15

5

17

7

18

4

14

18

5

Przedmiotem zainteresowania jest to, czy istnieje różnica w czasie do nawrotu choroby między kobietami przydzielonymi do standardowej opieki prenatalnej w porównaniu z kobietami przydzielonymi do krótkiej interwencji.

  • Krok 1.

Postawić hipotezy i określić poziom istotności.

H0: Czas wolny od nawrotu jest identyczny między grupami vs

H1: Czas wolny od nawrotu nie jest identyczny między grupami (α=0,05)

  • Krok 2.

Wybrać odpowiednią statystykę testu.

Statystyka testowa dla testu logarytmicznego rang wynosi

  • Krok 3.

Ustalenie reguły decyzyjnej.

Statystyka testowa podąża za rozkładem chi kwadrat, a więc znajdujemy wartość krytyczną w tabeli wartości krytycznych dla rozkładu Χ2) dla df=k-1=2-1=1 i α=0,05. Wartość krytyczna wynosi 3,84 i regułą decyzyjną jest odrzucenie H0, jeśli Χ2 > 3,84.

  • Krok 4.

Oblicz statystykę testu.

Aby obliczyć statystykę testu, porządkujemy dane według czasu zdarzenia (nawrotu) i określamy liczby kobiet zagrożonych w każdej grupie leczenia oraz liczbę, która nawraca w każdym zaobserwowanym czasie nawrotu. W poniższej tabeli grupa 1 reprezentuje kobiety, które otrzymują standardową opiekę prenatalną, a grupa 2 reprezentuje kobiety, które otrzymują krótką interwencję.

.

Czas, Tygodnie

Liczba osób zagrożonych – Grupa 1

N1t

Liczba osób zagrożonych – Grupa 2

N2t

Liczba nawrotów – Grupa 1 Grupa 2 O2t

4

8

8

8

1

0

5

7

8

1

0

6

6

7

1

0

7

5

7

0

1

16

4

5

0

1

19

3

2

1

0

21

0

2

0

1

Następnie sumujemy liczbę zagrożonych, , w każdym czasie trwania zdarzenia, liczbę zaobserwowanych zdarzeń (nawrotów), , w każdym czasie trwania zdarzenia i określamy oczekiwaną liczbę nawrotów w każdej grupie w każdym czasie trwania zdarzenia, używając i .

Czas, Weeks

Number at Risk Group 1

N1t

Number at Risk Group 2

N2t

Total Number at Risk

Nt

Total Number at Risk

Nt

.

Liczba nawrotów

Grupa 1

O1t

Liczba nawrotów

Grupa 2

O2t

Ogólna liczba

nawrotów

Ot

Przewidywana liczba nawrotów w grupie 1

Przewidywana liczba nawrotów w grupie 2

4

8

8

16

1

0

1

0.500

0.500

5

7

8

15

1

0

1

0.467

0.533

6

6

7

13

1

0

1

0.462

0.538

7

5

7

12

0

1

1

0.417

0.583

16

4

5

9

0

1

1

0.444

0.556

19

3

2

5

1

0

1

0.600

0.400

21

0

2

2

0

1

1

0.000

1.000

4

3

2.890

4.110

Obliczymy teraz statystykę testową:

  • Krok 5.

Wniosek. Nie odrzucać H0, ponieważ 0,726 < 3,84. Nie mamy statystycznie istotnych dowodów przy α=0,05, aby wykazać, że czas do nawrotu jest różny między grupami.

Poniższy rysunek przedstawia przeżycie (czas wolny od nawrotu) w każdej grupie. Zauważ, że krzywe przeżycia nie wykazują dużej separacji, co jest zgodne z nieistotnymi wynikami testu hipotezy.

Czas wolny od nawrotu w każdej grupie

Plot czasu wolnego od nawrotu w każdej z dwóch grup.

Jak zauważono, istnieje kilka odmian statystyki log rank. Niektóre pakiety do obliczeń statystycznych używają następującej statystyki testu log rank do porównania dwóch niezależnych grup:

gdzie ΣO1t jest sumą zaobserwowanej liczby zdarzeń w grupie 1, a ΣE1t jest sumą oczekiwanej liczby zdarzeń w grupie 1 wziętej przez wszystkie czasy zdarzeń. Mianownik jest sumą wariancji oczekiwanych liczb zdarzeń w każdym czasie zdarzenia, która jest obliczana w następujący sposób:

Istnieją inne wersje statystyki log rank, jak również inne testy do porównania funkcji przeżycia pomiędzy niezależnymi grupami.7-9 Na przykład popularnym testem jest zmodyfikowany test Wilcoxona, który jest wrażliwy na większe różnice w zagrożeniach we wcześniejszym okresie obserwacji w porównaniu z późniejszym.10

powrót do góry | poprzednia strona | następna strona

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.