Friedmanův test je neparametrický test používaný k testování rozdílů mezi skupinami, pokud je závislá proměnná alespoň ordinální (může být spojitá). Friedmanův test je neparametrickou alternativou jednocestné ANOVY s opakovanými měřeními (nebo kompletního blokového designu a zvláštním případem Durbinova testu). Pokud se data významně liší od normálně rozdělených, stává se tento test upřednostňovaným před použitím ANOVA.
Testovací procedura řadí každý řádek (blok) dohromady a poté uvažuje hodnoty řad podle sloupců. Data jsou uspořádána do matice s řádky B (bloky) a sloupci T (ošetření) s jednou operací v každé buňce matice.
Předpoklady
Jako téměř u každého statistického testu je třeba vzít v úvahu předpoklady. Zde si osvětlíme čtyři prvky, které je třeba vzít v úvahu:
- Existuje jedna skupina testovaných osob, které jsou měřeny při třech nebo více různých příležitostech.
- Skupina je náhodný vzorek z populace.
- Závislá proměnná je přinejmenším ordinální nebo spojitá (Likertovy škály, čas, inteligence, procento správnosti atd.)
- Vzorky nemusí být normálně rozděleny.
Stanovení hypotéz
Nulová hypotéza je medián účinků léčby populace jsou všechny stejné. Stručně řečeno, léčby nemají žádný účinek.
Alternativní hypotéza je, že účinky nejsou všechny stejné. Naznačuje, že existuje zřetelný rozdíl v účincích léčby.
Údaje, s nimiž pracujeme, odrážejí situaci, kdy chceme porovnat T léčebných postupů s N subjekty. Subjekty jsou do různých skupin přiřazeny náhodně. Srovnání probíhá v rámci každé skupiny, nikoliv mezi skupinami.
Testovací statistika
Srovnáváme seřazené výsledky ordinálních nebo spojitých dat, přičemž každému z řádků B nebo ošetření přiřadíme hodnotu pořadí od 1, 2 do T. Srovnání probíhá v rámci každé skupiny, nikoliv mezi skupinami.
Protože nulová hypotéza je, že léčby nemají žádný vliv na pořadí, měl by být součet pořadí pro každý sloupec (léčbu) stejný.
Celkový součet pořadí je BT(T+1)/2, tedy součet pořadí každé léčby, pokud je stejný, by měl být relativně blízký B(T+1)/2.
Součet pořadí pro každý sloupec (léčbu) by měl být stejný. Proto je testovací statistika funkcí součtu čtverců odchylek mezi součty pořadí ošetření (R1, R2, …, RT) a očekávanou hodnotou B(T+1)/2. Proto je testovací statistika funkcí součtu čtverců odchylek mezi součty pořadí ošetření (R1, R2, …, RT).
Testovací statistika, S, je
$$ \displaystyle\large S=\sum\limits_{t=1}^{T}{R_{t}^{2}-\frac{{{B}^{2}}T{{\left( T+1 \right)}^{2}}}}{4}}$$
Kritická hodnota
Nyní musíme porovnat testovací statistiku s kritickou hodnotou, abychom určili, zda se odchylky odchylují natolik, abychom mohli dojít k závěru, že ošetření nejsou všechna stejná. Zde se hodí software, například Minitab, R nebo jiný balík, který má tabulky zabudované.
Tady je tabulka s výjimkami pro tři nebo čtyři ošetření. Pokud má váš experiment více ošetření nebo velký vzorek, můžete kritickou hodnotu aproximovat pomocí chí-kvadrát rozdělení (o tom jindy).
Pro T = 3 pro různé hodnoty významnosti
N | α <.10 | α ≤.05 | α <.01 |
3 | 6.00 | 6.00 | – |
4 | 6.00 | 6.50 | 8.00 |
5 | 5.20 | 6.40 | 8.40 |
6 | 5.33 | 7.00 | 9.00 |
7 | 5.43 | 7.14 | 8.86 |
8 | 5.25 | 6.25 | 9.00 |
9 | 5.56 | 6.22 | 8.67 |
10 | 5.00 | 6.20 | 9.60 |
11 | 4.91 | 6.54 | 8.91 |
12 | 5.17 | 6.17 | 8.67 |
13 | 4.77 | 6.00 | 9,39 |
∞ | 4,61 | 5,99 | 9,21 |
k=4 pro různé hodnoty významnosti
.