Imagine a seguinte situação, você é um estudante de educação física e seu TCC é sobre a relação entre a glicose de uma pessoa com diabetes e a quantidade de exercício físico que ela pratica, mas na hora da coleta de dados as coisas acabam dando errado e dos 40 participantes selecionados, só apareceram 8. E agora? É possível fazer uma análise estatística só com esses poucos dados? A resposta para isso é SIM, podemos fazer uma análise com poucos dados e isso é graças ao método de análise não paramétrica.
O que é análise não paramétrica?
Em todos os problemas de estatísticas, assumimos que a distribuição da variável aleatória que foi coletada seja conhecida para algum parâmetro ou para alguma distribuição específica. Na prática, entretanto, a forma da nossa variável de estudo é quase sempre desconhecida. Por isso, é necessário conhecer alguns procedimentos que fujam dessas hipóteses relativas ao conhecimento da distribuição.
Com isso, a estatística não paramétrica chega para deixar de lado todos os pressupostos necessários na estatística paramétrica, que implica na não necessidade de uma amostra grande para aplicar os testes. Muitos desses testes são baseados em posto e rank, que é a posição do dado em relação aos outros, fazendo com que a aplicação dos testes seja mais fácil. OBS: Quando os pressupostos são considerados válidos, os testes paramétricos são sempre mais poderosos que seus correspondentes não paramétricos.
A seguir temos uma lista de alguns dos testes não paramétricos mais usados:
- Teste de Kolmogorov;
- Teste de Friedman;
- Teste de Mann-Whitney;
- Coeficiente de correlação de Spearman;
- Teste de Kruskal-Wallis.
Nesse post falaremos sobre o coeficiente de correlação de Spearman, que segue a mesma lógica da correlação de Pearson, mas possui a vantagem de possibilitar a comparação de diferentes tipos de variáveis com e sem distribuição normal.
Os coeficientes de correlação são métodos estatísticos para medir as relações entre variáveis e o que elas representam. Um coeficiente de correlação próximo de zero indica que não há relação entre as duas variáveis e quanto mais se aproximam de 1 ou -1, mais forte é a relação.
Exemplo aplicado
Temos uma amostra de 9 indivíduos onde foi coletado o nível de atividade física (1 – não pratica até 5 – prática diariamente) e o nível de asmático (1- asmático agudo até 4-asmático controlado)
Nível de atividade | Nível de asmático |
1 | 1 |
1 | 2 |
2 | 2 |
4 | 3 |
5 | 4 |
3 | 3 |
3 | 2 |
4 | 2 |
5 | 3 |
Calcular o posto de cada variável:
O posto da variável é a ordem que a variável está, isto é, basta você ordenar sua variável e ir colocando de 1 em 1 até marcar todos os postos. OBS: Se tiver mais de um valor repetido deve-se somar a posição de todas as variáveis e dividir pelo total de variáveis somadas.
Nível de atividade | Nível de asmatico | Posto de x | Posto de y |
1 | 1 | 1.5 | 1 |
1 | 2 | 1.5 | 3.5 |
2 | 2 | 3 | 3.5 |
4 | 3 | 6.5 | 7 |
5 | 4 | 8.5 | 9 |
3 | 3 | 4.5 | 7 |
3 | 2 | 4.5 | 3.5 |
4 | 2 | 6.5 | 3.5 |
5 | 3 | 8.5 | 7 |
Utilizar a fórmula:
onde d = posto de X – posto de Y, para cada observação.
Nível de atividade | Nível de asmatico | Posto de x | Posto de y | d |
1 | 1 | 1.5 | 1 | 0.5 |
1 | 2 | 1.5 | 3.5 | -2 |
2 | 2 | 3 | 3.5 | -0.5 |
4 | 3 | 6.5 | 7 | -0.5 |
5 | 4 | 8.5 | 9 | -0.5 |
3 | 3 | 4.5 | 7 | -2.5 |
3 | 2 | 4.5 | 3.5 | 1 |
4 | 2 | 6.5 | 3.5 | 3 |
5 | 3 | 8.5 | 7 | 1.5 |
temos então uma correlação de:
Ou seja, é possível concluir que o nível de atividade física está altamente relacionado com o nível de asmático.
0 comentário