Imagine a seguinte situação, você é um estudante de educação física e seu TCC é sobre a relação entre a glicose de uma pessoa com diabetes e a quantidade de exercício físico que ela pratica, mas na hora da coleta de dados as coisas acabam dando errado e dos 40 participantes selecionados, só apareceram 8. E agora? É possível fazer uma análise estatística só com esses poucos dados? A resposta para isso é SIM, podemos fazer uma análise com poucos dados e isso é graças ao método de análise não paramétrica.

O que é análise não paramétrica?

Em todos os problemas de estatísticas, assumimos que a distribuição da variável aleatória que foi coletada seja conhecida para algum parâmetro ou para alguma distribuição específica. Na prática, entretanto, a forma da nossa variável de estudo é quase sempre desconhecida. Por isso, é necessário conhecer alguns procedimentos que fujam dessas hipóteses relativas ao conhecimento da distribuição.

Com isso, a estatística não paramétrica chega para deixar de lado todos os pressupostos necessários na estatística paramétrica, que implica na não necessidade de uma amostra grande para aplicar os testes. Muitos desses testes são baseados em posto e rank, que é a posição do dado em relação aos outros, fazendo com que a aplicação dos testes seja mais fácil. OBS: Quando os pressupostos são considerados válidos, os testes paramétricos são sempre mais poderosos que seus correspondentes não paramétricos.

A seguir temos uma lista de alguns dos testes não paramétricos mais usados:

  • Teste de Kolmogorov;
  • Teste de Friedman;
  • Teste de Mann-Whitney;
  • Coeficiente de correlação de Spearman;
  • Teste de Kruskal-Wallis.

Nesse post falaremos sobre o coeficiente de correlação de Spearman, que segue a mesma lógica da correlação de Pearson, mas possui a vantagem de possibilitar a comparação de diferentes tipos de variáveis com e sem distribuição normal.

Os coeficientes de correlação são métodos estatísticos para medir as relações entre variáveis e o que elas representam. Um coeficiente de correlação próximo de zero indica que não há relação entre as duas variáveis e quanto mais se aproximam de 1 ou  -1, mais forte é a relação.

Exemplo aplicado

Temos uma amostra de 9 indivíduos onde foi coletado o nível de atividade física (1 – não pratica até 5 – prática diariamente) e o nível de asmático (1- asmático agudo até 4-asmático controlado)

Nível de atividadeNível de asmático 
11
12
22
43
54
33
32
42
53

Calcular o posto de cada variável:

O posto da variável é a ordem que a variável está, isto é, basta você ordenar sua variável e ir colocando de 1 em 1 até marcar todos os postos. OBS: Se tiver mais de um valor repetido deve-se somar a posição de todas as variáveis e dividir pelo total de variáveis somadas.

Nível de atividadeNível de asmaticoPosto de xPosto de y
111.51
121.53.5
2233.5
436.57
548.59
334.57
324.53.5
426.53.5
538.57

Utilizar a fórmula:

onde d = posto de X – posto de Y, para cada observação.

Nível de atividadeNível de asmaticoPosto de xPosto de yd
111.510.5
121.53.5-2
2233.5-0.5
436.57-0.5
548.59-0.5
334.57-2.5
324.53.51
426.53.53
538.571.5

temos então uma correlação de:

Ou seja, é possível concluir que o nível de atividade física está altamente relacionado com o nível de asmático.


0 comentário

Deixe um comentário

Avatar placeholder

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Open chat
Olá!
Como podemos te ajudar?