Často nás zajímá, zda existují rozdíly v přežití (nebo kumulativním výskytu událostí) mezi různými skupinami účastníků. Například v klinickém hodnocení s výsledkem přežití nás může zajímat porovnání přežití mezi účastníky, kteří dostávají nový lék, ve srovnání s placebem (nebo standardní léčbou). V observační studii nás může zajímat srovnání přežití mezi muži a ženami nebo mezi účastníky s určitým rizikovým faktorem a bez něj (např. hypertenze nebo diabetes). Pro porovnání přežití mezi nezávislými skupinami je k dispozici několik testů.

Test log rank

Test log rank je oblíbený test pro testování nulové hypotézy o neexistenci rozdílu v přežití mezi dvěma nebo více nezávislými skupinami. Test porovnává celou zkušenost přežití mezi skupinami a lze si jej představit jako test, zda jsou křivky přežití shodné (překrývají se), nebo ne. Křivky přežití se odhadují pro každou skupinu posuzovanou samostatně pomocí Kaplanovy-Meierovy metody a statisticky se porovnávají pomocí logaritmického testu. Je důležité poznamenat, že existuje několik variant statistiky log rank testu, které jsou implementovány různými statistickými výpočetními balíky (např. SAS, R 4,6). Zde uvádíme jednu z verzí, která úzce souvisí s testovou statistikou chí-kvadrát a porovnává pozorované a očekávané počty příhod v každém časovém bodě během sledovaného období.

Příklad:

Probíhá malá klinická studie, která porovnává dvě kombinace léčby u pacientů s pokročilým karcinomem žaludku. Dvaceti účastníkům s karcinomem žaludku ve stadiu IV, kteří souhlasí s účastí ve studii, je náhodně přidělena chemoterapie před operací nebo chemoterapie po operaci. Primárním výsledkem je úmrtí a účastníci jsou sledováni po dobu až 48 měsíců (4 roky) od zařazení do studie. Zkušenosti účastníků v jednotlivých ramenech studie jsou uvedeny níže.

Chemoterapie před operací

Chemoterapie po operaci

Měs. Úmrtí

Měsíc posledního kontaktu

Měsíc úmrtí

Měsíc posledního kontaktu

8

8

33

48

12

32

28

48

26

20

41

25

14

40

37

21

48

27

25

43

Šest účastníků ve skupině s chemoterapií před operací v průběhu sledování zemřelo.v porovnání se třemi účastníky ve skupině s chemoterapií po operaci. Ostatní účastníci v jednotlivých skupinách jsou sledováni různý počet měsíců, někteří až do konce studie ve 48 měsících (ve skupině s chemoterapií po operaci). Pomocí výše uvedených postupů nejprve sestavíme tabulky životnosti pro každou léčebnou skupinu pomocí Kaplanovy-Meierovy metody.

Tabulka životnosti pro skupinu dostávající chemoterapii před operací

Čas, Měsíce

Počet ohrožených

Nt

Počet úmrtí

Dt

Počet cenzurovaných

Ct

Pravděpodobnost přežití

0

10

1

8

10

1

1

0.900

12

8

1

0.788

14

7

1

0.675

20

6

1

0.675

21

5

1

0.540

26

4

1

0.405

27

3

1

0.270

32

2

1

0.270

40

1

1

0.270

Tabulka životnosti pro skupinu dostávající chemoterapii po operaci

Čas, Měsíce

Počet ohrožených

Nt

Počet zemřelých

Dt

Počet cenzurovaných

Ct

Pravděpodobnost přežití

0

10

1

25

10

2

1.000

28

8

1

0.875

33

7

1

0.750

37

6

1

0.750

41

5

1

0.600

43

4

1

0.600

48

3

3

0,600

Dvě křivky přežití jsou uvedeny níže.

Křivky přežití v každé léčebné skupině

Křivky přežití s chemoterapií před nebo po operaci.

Pravděpodobnosti přežití pro skupinu s chemoterapií po operaci jsou vyšší než pravděpodobnosti přežití pro skupinu s chemoterapií před operací, což naznačuje přínos pro přežití. Tyto křivky přežití jsou však odhadovány z malých vzorků. Pro porovnání přežití mezi skupinami můžeme použít logaritmický test. Nulová hypotéza zní, že mezi oběma skupinami není rozdíl v přežití nebo že mezi populacemi není rozdíl v pravděpodobnosti úmrtí v kterémkoli bodě. Log rank test je neparametrický test a nečiní žádné předpoklady o rozděleních přežití. V podstatě log rank test porovnává pozorovaný počet událostí v každé skupině s tím, co by se očekávalo, kdyby platila nulová hypotéza (tj, kdyby křivky přežití byly identické).

H0: Obě křivky přežití jsou identické (nebo S1t = S2t) versus H1: Obě křivky přežití nejsou identické (nebo S1t ≠ S2t, v libovolném čase t) (α=0,05).

Statistika log rank je přibližně rozdělena jako testovací statistika chí-kvadrát. Existuje několik forem této testové statistiky a liší se způsobem výpočtu. Používáme následující:

kde ΣOjt představuje součet pozorovaného počtu událostí v j-té skupině v čase (např. j=1,2) a ΣEjt představuje součet očekávaného počtu událostí v j-té skupině v čase.

Součty pozorovaného a očekávaného počtu událostí se počítají pro každý čas události a sčítají se pro každou srovnávací skupinu. Logaritmická statistika má stupně volnosti rovny k-1, kde k představuje počet srovnávacích skupin. V tomto příkladu je k=2, takže testovací statistika má 1 stupeň volnosti.

Pro výpočet testovací statistiky potřebujeme pozorovaný a očekávaný počet událostí v každém čase události. Pozorovaný počet událostí je ze vzorku a očekávaný počet událostí se vypočítá za předpokladu, že platí nulová hypotéza (tj. že křivky přežití jsou identické).

Pro vytvoření očekávaného počtu událostí uspořádáme data do tabulky životnosti s řádky představujícími každý čas události bez ohledu na skupinu, ve které k události došlo. Sledujeme také přiřazení ke skupině. Poté odhadneme podíl událostí, které se vyskytnou v každém čase (Ot/Nt), pomocí údajů z obou skupin dohromady za předpokladu, že není rozdíl v přežití (tj. za předpokladu, že platí nulová hypotéza). Tyto odhady vynásobíme počtem ohrožených účastníků v daném čase v každé ze srovnávacích skupin (N1t a N2t pro skupiny 1 a 2).

Konkrétně vypočítáme pro každý čas události t počet ohrožených v každé skupině, Njt (např. kde j označuje skupinu, j=1, 2) a počet událostí (úmrtí), Ojt ,v každé skupině. Následující tabulka obsahuje informace potřebné k provedení logaritmického testu k porovnání výše uvedených křivek přežití. Skupina 1 představuje skupinu s chemoterapií před operací a skupina 2 představuje skupinu s chemoterapií po operaci.

Údaje pro Log Rank test k porovnání křivek přežití

Čas, Měsíce

Počet ohrožených ve skupině 1

N1t

Počet ohrožených ve skupině 2

N2t

Počet událostí (úmrtí) ve skupině 1

O1t

Počet Událostí (úmrtí) ve skupině 2

O2t

8

10

10

1

0

12

8

10

1

0

14

7

10

1

0

21

5

10

1

0

26

4

8

1

0

27

3

8

1

0

28

2

8

0

1

33

1

7

0

1

41

0

5

0

1

Dále sečteme rizikový počet, Nt = N1t+N2t, v každém čase události a počet pozorovaných událostí (úmrtí), Ot = O1t+O2t, v každém čase události. Poté vypočítáme očekávaný počet událostí v každé skupině. Očekávaný počet událostí se vypočítá v každém čase události takto:

E1t = N1t*(Ot/Nt) pro skupinu 1 a E2t = N2t*(Ot/Nt) pro skupinu 2. Výpočty jsou uvedeny v následující tabulce.

Očekávané počty událostí v každé skupině

.

Čas, Měsíce

Počet ohrožených ve skupině 1

N1t

Počet ohrožených ve skupině 2

N2t

Celkový počet ohrožených

Nt

.

Počet událostí ve skupině 1

O1t

Počet událostí ve skupině 2

O2t

Celkový počet událostí

Ot

Očekávaný počet událostí ve

skupině 1

E1t = N1t*(Ot/Nt)

Očekávaný počet událostí ve

skupině 2

E2t = N2t*(Ot/Nt)

8

10

10

20

1

0

1

0.500

0.500

12

8

10

18

1

0

1

0.444

0.556

14

7

10

17

1

0

1

0.412

0.588

21

5

10

15

1

0

1

0.333

0.667

26

4

8

12

1

0

1

0.333

0.667

27

3

8

11

1

0

1

0.273

0.727

28

2

8

10

0

1

1

0.200

0.800

33

1

7

8

0

1

1

0.125

0.875

41

0

5

5

0

1

1

0.000

1.000

Dále sečteme pozorované počty událostí v každé skupině (∑O1t a ΣO2t) a očekávané počty událostí v každé skupině (ΣE1t a ΣE2t) v čase. Ty jsou uvedeny ve spodním řádku další tabulky níže.

Celkové pozorované a očekávané počty pozorovaných událostí v každé skupině

.

Čas, Měsíce

Počet ohrožených ve skupině 1

N1t

Počet ohrožených ve skupině 2

N2t

Celkový počet ohrožených

Nt

.

Počet událostí ve skupině 1

O1t

Počet událostí ve skupině 2

O2t

Celkový počet událostí

Ot

Očekávaný počet událostí ve

skupině 1

E1t = N1t*(Ot/Nt)

Očekávaný počet událostí ve

skupině 2

E2t = N2t*(Ot/Nt)

8

10

10

20

1

0

1

0.500

0.500

12

8

10

18

1

0

1

0.444

0.556

14

7

10

17

1

0

1

0.412

0.588

21

5

10

15

1

0

1

0.333

0.667

26

4

8

12

1

0

1

0.333

0.667

27

3

8

11

1

0

1

0.273

0.727

28

2

8

10

0

1

1

0.200

0.800

33

1

7

8

0

1

1

0.125

0.875

41

0

5

5

0

1

1

0.000

1.000

6

3

2.620

6,380

Nyní můžeme vypočítat testovací statistiku:

Testovací statistika je přibližně rozdělena jako chí-kvadrát s 1 stupněm volnosti. Kritickou hodnotu testu tedy nalezneme v tabulce Kritické hodnoty rozdělení Χ2.

Pro tento test platí rozhodovací pravidlo: Zamítnout H0, jestliže Χ2 > 3,84. V případě, že H0 > 3,84, je třeba zamítnout H0. Pozorujeme, že Χ2 = 6,151, což překračuje kritickou hodnotu 3,84. Proto H0 zamítáme. Máme významný důkaz, α=0,05, který ukazuje, že obě křivky přežití se liší.

Příklad:

Výzkumník chce vyhodnotit účinnost krátké intervence k prevenci konzumace alkoholu v těhotenství. Těhotné ženy s anamnézou silné konzumace alkoholu jsou zařazeny do studie a náhodně vybrány buď ke krátké intervenci zaměřené na abstinenci od alkoholu, nebo ke standardní prenatální péči. Sledovaným výsledkem je recidiva pití alkoholu. Ženy jsou do studie zařazeny přibližně v 18. týdnu těhotenství a jsou sledovány v průběhu těhotenství až do porodu (přibližně 39. týden těhotenství). Údaje jsou uvedeny níže a uvádějí, zda ženy znovu začaly pít, a pokud ano, čas jejich prvního napití měřený počtem týdnů od randomizace. U žen, u nichž k recidivě nedošlo, zaznamenáváme počet týdnů od randomizace, kdy jsou bez alkoholu.

.

Standardní prenatální péče

Krátká intervence

Recidiva

Žádná recidiva

Recidiva

Žádná recidiva

19

20

16

21

6

19

21

15

5

17

7

18

4

14

18

5

Zajímavou otázkou je, zda existuje rozdíl v době do relapsu u žen zařazených do standardní prenatální péče ve srovnání s ženami zařazenými do krátké intervence.

  • Krok 1.

Stanovte hypotézy a určete hladinu významnosti.

H0: Doba bez relapsu je mezi skupinami stejná oproti

H1: Doba bez relapsu není mezi skupinami stejná (α=0,05)

  • Krok 2.

Zvolte vhodnou testovací statistiku.

Testovací statistika pro logaritmický test je

  • Krok 3.

Nastavte rozhodovací pravidlo.

Testovací statistika se řídí chí-kvadrát rozdělením, a proto najdeme kritickou hodnotu v tabulce kritických hodnot pro rozdělení Χ2) pro df=k-1=2-1=1 a α=0,05.

Testovací statistika se řídí chí-kvadrát rozdělením. Kritická hodnota je 3,84 a rozhodovací pravidlo zní zamítnout H0, jestliže Χ2 > 3,84.

  • Krok 4.

Vypočtěte testovací statistiku.

Pro výpočet testovací statistiky uspořádáme data podle časů událostí (relapsů) a určíme počty ohrožených žen v každé léčebné skupině a počty žen, které relabují v každém sledovaném čase relapsu. V následující tabulce představuje skupina 1 ženy, které dostávají standardní prenatální péči, a skupina 2 ženy, které dostávají krátkou intervenci.

Čas, Týdnů

Počet ohrožených – skupina 1

N1t

Počet ohrožených – skupina 2

N2t

Počet relapsů – skupina 1 O1t

Počet relapsů -. Skupina 2 O2t

4

8

8

1

0

5

7

8

1

0

6

6

7

1

0

7

5

7

0

1

16

4

5

0

1

19

3

2

1

0

21

0

2

0

1

Dále sečteme ohrožený počet, , v každém čase události, počet pozorovaných událostí (relapsů), , v každém čase události a určíme očekávaný počet relapsů v každé skupině v každém čase události pomocí a .

Poté sečteme pozorované počty relapsů v každé skupině (ΣO1t a ΣO2t) a očekávané počty relapsů v každé skupině (ΣE1t a ΣE2t) v čase. Výpočty pro údaje v tomto příkladu jsou uvedeny níže.

.

Čas, Týdnů

Počet v rizikové skupině 1

N1t

Počet v rizikové skupině 2

N2t

Celkový počet v rizikové skupině

Nt

.

Počet relapsů

Skupina 1

O1t

Počet relapsů

Skupina 2

O2t

Celkový počet

relapsu

Ot

Očekávaný počet relapsů ve skupině 1

Očekávaný počet relapsů ve skupině 2

4

8

8

16

1

0

1

0.500

0.500

5

7

8

15

1

0

1

0.467

0.533

6

6

7

13

1

0

1

0.462

0.538

7

5

7

12

0

1

1

0.417

0.583

16

4

5

9

0

1

1

0.444

0.556

19

3

2

5

1

0

1

0.600

0.400

21

0

2

2

0

1

1

0.000

1.000

4

3

2.890

4.110

Nyní vypočítáme testovací statistiku:

  • Krok 5.

Závěr. Nezamítejte H0, protože 0,726 < 3,84. Nemáme statisticky významný důkaz při α=0,05, který by ukazoval, že se doba do recidivy mezi skupinami liší.

Na obrázku níže je znázorněno přežití (doba bez recidivy) v jednotlivých skupinách. Všimněte si, že křivky přežití nevykazují velké rozdělení, což odpovídá nesignifikantním zjištěním v testu hypotézy.

Doba bez relapsu v každé skupině

Kresba doby bez relapsu v každé ze dvou skupin.

Jak bylo uvedeno, existuje několik variant statistiky logaritmu. Některé balíky pro statistické výpočty používají následující testovací statistiku pro log rank test k porovnání dvou nezávislých skupin:

kde ΣO1t je součet pozorovaného počtu událostí ve skupině 1 a ΣE1t je součet očekávaného počtu událostí ve skupině 1 vzatý přes všechny časy událostí. Jmenovatel je součet rozptylů očekávaných počtů událostí v každém čase události, který se vypočítá takto:

Existují i další verze logaritmické statistiky a také další testy pro porovnání funkcí přežití mezi nezávislými skupinami.7-9 Oblíbeným testem je například modifikovaný Wilcoxonův test, který je citlivý na větší rozdíly v ohrožení na začátku oproti pozdějšímu sledování.10

zpět na začátek | předchozí stránka | další stránka

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.