O Teste Friedman é um teste não paramétrico usado para testar diferenças entre grupos quando a variável dependente é pelo menos ordinal (poderia ser contínua). O teste de Friedman é a alternativa não paramétrica à ANOVA unidirecional com medidas repetidas (ou o desenho completo do bloco e um caso especial do teste de Durbin). Se os dados forem significativamente diferentes dos normalmente distribuídos, este se torna o teste preferido em vez de usar uma ANOVA.
O procedimento de teste classifica cada linha (bloco) em conjunto, então considera os valores de classificação por colunas. Os dados são organizados em uma matriz com linhas B (blocos) e colunas T (tratamentos) com uma única operação em cada célula da matriz.
Premissas
Como em quase qualquer teste estatístico, há suposições a serem consideradas. Aqui vamos iluminar quatro elementos a considerar:
- Existe um grupo de sujeitos de teste que são medidos em três ou mais ocasiões diferentes.
- O grupo é uma amostra aleatória da população.
- A variável dependente é pelo menos uma ordinal ou contínua (escalas de Likert, tempo, inteligente, percentual correto, etc.)
- As amostras não precisam ser distribuídas normalmente.
Configurando as Hipóteses
A hipótese nula é a mediana dos efeitos do tratamento da população são todos iguais. Em resumo, os tratamentos não têm efeito.
A hipótese alternativa é que os efeitos não são todos iguais. Indicando que existe uma diferença discernível nos efeitos dos tratamentos.
Os dados com os quais estamos lidando refletem a situação em que queremos comparar os tratamentos T com N sujeitos. Os sujeitos são designados aleatoriamente para os vários grupos. A comparação está dentro de cada grupo e não entre grupos.
A estatística do teste
A comparação é dos resultados classificados dos dados ordinais ou contínuos, atribuindo um valor de classificação de 1, 2, a T para cada uma das filas B ou tratamentos.
Desde que a hipótese nula é a de que os tratamentos não têm efeito nas classificações, a soma da classificação para cada coluna (tratamento) deve ser igual a todos.
A soma total das classificações é BT(T+1)/2, assim a soma das classificações de cada tratamento, se igual, deve ser relativamente próxima de B(T+1)/2. Portanto, a estatística do teste é uma função da soma dos quadrados de desvios entre as somas dos postos de tratamento (R1, R2, …, RT) e o valor esperado de B(T+1)/2.
A estatística do teste, S, é
$$$ \displaystyle\large S===1}{t=1}^{T}{R_{t}^{2}-\T{{{{{B}^{2}}T{{{{esquerda( T+1 {2}}}}{4}}}$$
O valor crítico
Agora precisamos comparar a estatística do teste com o valor crítico para determinar o desvio são suficientemente desviantes para concluir que os tratamentos não são todos iguais. Aqui o software vem a calhar, como o Minitab, R, ou algum outro pacote que tem as tabelas embutidas.
Aqui está uma tabela de exceção para três ou quatro tratamentos. Se o seu experimento tiver mais tratamentos ou um tamanho de amostra grande você pode aproximar o valor crítico usando uma distribuição qui-quadrada (mais sobre isso em outro momento).
Para T = 3 para vários valores de significância
N | α <.10 | α ≤.05 | α <.01 |
3 | 6.00 | 6.00 | — |
4 | 6.00 | 6.50 | 8.00 |
5 | 5.20 | 6.40 | 8.40 |
6 | 5.33 | 7.00 | 9.00 |
7 | 5.43 | 7.14 | 8.86 |
8 | 5.25 | 6.25 | 9.00 |
9 | 5.56 | 6.22 | 8.67 |
10 | 5.00 | 6.20 | 9.60 |
11 | 4.91 | 6.54 | 8.91 |
12 | 5.17 | 6.17 | 8.67 |
13 | 4.77 | 6.00 | 9,39 |
∞ | 4,61 | 5,99 | 9,21 |
k=4 para vários valores significativos