Qual estatistica fazer para comparar 3 grupos

Estudos com amostras pareadas são muito comuns nas mais diversas áreas do conhecimento, em especial na área da saúde. Esses estudos consistem em realizar mais de uma medida em uma mesma unidade amostral e verificar se houve diferença entre essas medidas, onde a primeira informação será pareada com a segunda informação, com a terceira e assim por diante.

Sendo assim, é de se esperar que as medidas de um mesmo indivíduo sejam similares, enquanto que as medidas de indivíduos distintos sejam diferentes. Dessa forma, as observações de um mesmo indivíduo são dependentes, o que faz com que o uso dos testes usuais de comparação de duas ou mais amostras não sejam adequados, uma vez que existe violação da suposição de independência das observações.

Então, quando e quais testes devemos utilizar para comparar amostras pareadas?

Testes utilizados para comparar duas amostras pareadas

Teste t pareado

Suponha um estudo onde os indivíduos foram submetidos a uma dieta e deseja-se verificar se houve diferença entre o peso antes e depois da dieta. Nesse caso, a variável de interesse é numérica e o objetivo é verificar se existe diferença significativa dessa variável entre dois grupos de interesse.

Assim como o teste t, o teste t pareado é paramétrico, ou seja, possui a suposição de que a variável de interesse seja normalmente distribuída.

O objetivo é o mesmo que o do teste t utilizado para comparar duas amostras, porém, a diferença é que no teste t pareado as amostras são dependentes. No caso acima, por exemplo, um mesmo indivíduo foi medido mais de uma vez – uma antes e outra depois da dieta.

Teste de Wilcoxon

O teste de Wilcoxon se apresenta como uma alterativa ao teste t pareado, ou seja, quando o objetivo também é verificar se existe diferença significativa de uma variável numérica entre dois grupos de interesse.

Mas quando utilizar o teste de Wilcoxon? Quando a suposição de normalidade da variável de interesse do teste t pareado é violada – o teste de Wilcoxon é um teste não-paramétrico.

Sendo um teste não-paramétrico, podemos o comparar com o teste de Mann-Whitney, porém, a diferença é que no teste de Mann-Whitney as amostras são independentes e no teste de Wilcoxon as amostras são dependentes.

Teste de McNemar

Suponha agora um estudo onde cães diagnosticados com leishmaniose foram divididos em dois grupos: sintomáticos e assintomáticos. Ambos os grupos são submetidos a um tratamento e depois de 3 meses do início do tratamento eles são reavaliados. O objetivo é verificar se o tratamento foi eficiente para reduzir o número de cães sintomáticos.

Observe que nesse caso, a variável de interesse é categórica com duas categorias, sendo medida duas vezes. O objetivo é verificar se houve diferença significativa entre as classificações nas duas medições.

Pode-se notar que o objetivo do teste é semelhante ao do teste Qui-Quadrado, porém, a diferença é que no teste Qui-Quadrado as amostras são independentes e no teste de McNemar as amostras são dependentes.

Testes utilizados para comparar três ou mais amostras pareadas

ANOVA para medidas repetidas

Suponha um estudo onde os indivíduos foram submetidos a uma dieta e deseja-se verificar se houve diferença entre o peso antes da dieta, 1 mês depois do início da dieta e 3 meses depois do início da dieta.

Nesse caso, a variável de interesse é numérica e o objetivo é verificar se existe diferença significativa dessa variável entre 3 ou mais grupos de interesse. Note que o objetivo é o mesmo que o da ANOVA, porém, a diferença é que na ANOVA as amostras são independentes e na ANOVA para medidas repetidas as amostras são dependentes.

Assim como a ANOVA, a ANOVA para medidas repetidas é um teste paramétrico e existe a suposição de que a variável de interesse tem distribuição normal.

Teste de Friedman

Tomemos o mesmo exemplo anterior: um estudo onde os indivíduos foram submetidos a uma dieta e deseja-se verificar se houve diferença entre o peso antes da dieta, 1 mês depois do início da dieta e 3 meses depois do início da dieta.

Como vimos anteriormente, a variável de interesse é numérica e o objetivo é verificar se existe diferença significativa dessa variável entre 3 ou mais grupos de interesse.

O que então diferencia o teste de Friedman do teste ANOVA para medidas repetidas? Ele se apresenta como uma alternativa para os casos em que a variável de interesse não possui distribuição normal, pois é um teste não-paramétrico.

O teste de Friedman possui o mesmo objetivo do teste de Kruskal-Wallis, porém, a diferença é que no teste de Kruskal-Wallis as amostras são independentes e no teste de Friedman pareado as amostras são dependentes.

Outras técnicas

Existem estudos que, apesar de serem feitos com amostras pareadas, não podem ser resolvidos com esses testes, uma vez que suas estruturas de dependência apresentam um maior nível de complexidade.

Por exemplo, suponha um estudo em que se deseja verificar a eficiência de um tratamento contra catarata em que os dois olhos do mesmo paciente são medidos ao longo de 3 consultas: uma antes do tratamento, outra durante o tratamento e a última após a finalização do tratamento.

Veja que nesse exemplo existem duas estruturas de dependência, sendo uma temporal (consultas) e outra do indivíduo (os dois olhos das mesmas pessoas).

Existem outros tipos de análises mais complexas que levam em consideração as medidas repetidas, como o modelo GEE (Generalized Estimating Equation) e o Modelo de Efeitos Mistos. Cabe ressaltar ainda que essas técnicas também podem ser utilizadas para resolver os problemas mais simples descritos nesse artigo.

Esperamos abordar técnicas de amostras pareadas em futuros artigos. Sendo assim, não deixe de se inscrever no campo abaixo para receber em seu e-mail notificações sobre nossas publicações.

Artigo desenvolvido com a colaboração de Luana Sílvia dos Santos

Nesta secção, faremos uma breve reflexão a respeito da escolha do teste t para amostras pareadas, teste t para amostras independentes, teste de Wilcoxon, teste de Mann-Whitney, teste Qui-quadrado e de McNemar.

Na dica anterior, abordamos o tópico sobre inferência estatística e esta pode ser entendida como um método de análise que permite tirar conclusões a respeito das características de uma população. Para isso, é necessário selecionar um modelo estatístico para posteriormente deduzir as proposições a partir do modelo.

Na área da saúde, é muito comum a utilização de comparações entre dois momentos diferentes ou entre dois grupos. Quando estamos diante dessa situação, iremos utilizar o teste t pareado ou o teste t para amostras independentes. Na presença de amostras dependentes, os estudos consistem em realizar mais de uma medida em uma mesma unidade amostral e verificar se houve diferença entre essas medidas, onde a primeira informação será pareada com a segunda informação, com a terceira e assim por diante.

Suponha um estudo onde um grupo de indivíduos foi submetido a uma dieta e deseja-se verificar se houve diferença entre o peso antes e depois da dieta. Nesse caso, como a variável peso é numérica e na presença de distribuição normal dos dados, como o objetivo é verificar se existe diferença significativa dessa variável entre dois grupos de interesse, deve-se utilizar o teste t para amostras pareadas. Agora, caso o estudo tenha utilizado indivíduos com perfis de saúde distintos e aplicado uma mesma dieta para verificar quem se beneficiou mais (exemplo: indivíduos eutróficos e com obesidade), reparem que continuaríamos com dois momentos/ grupos de análise, porém com amostras diferentes. Neste caso, deve-se utilizar o teste t para amostras independentes.

Resumindo, o teste t deve ser utilizado na presença de distribuição normal dos dados, quando se objetiva comparar dois momentos/ grupos para uma variável numérica. De forma que ambos os testes são considerados paramétricos. Dentre os principais testes disponíveis para se testar a normalidade dos dados na maioria dos softwares estatísticos, podemos citar o teste de Shapiro-Wilk e o de Kolmogorov-Smirnov. Já os testes de Wilcoxon e Mann-Whitney se apresentam como alternativas ao teste t pareado e o teste t para amostras independentes, respectivamente. Estes são utilizados nas mesmas situações descritas anteriormente, porém na presença de distribuição não normal dos dados. De forma que ambos os testes são caracterizados como testes não-paramétricos.

Por fim, quando a variável de interesse não é numérica (exemplo: variáveis categóricas do tipo sim e não), deve-se utilizar o teste Qui-Quadrado para amostras independentes e o de McNemar para amostras dependentes. Para melhor entender, suponha agora um estudo onde cães diagnosticados com leishmaniose foram divididos em dois grupos: sintomáticos e assintomáticos. Ambos os grupos são submetidos a um tratamento e depois de 3 meses do início do tratamento eles são reavaliados. Nesse caso, temos que a variável de interesse é categórica com duas categorias, sendo medida duas vezes. O objetivo é verificar se houve diferença significativa entre as classificações nas duas medições em cada um dos grupos separadamente. Como são os mesmos grupos (cães) a serem avaliados em dois momentos diferentes, deve-se optar pelo teste de McNemar. Reparem que por se tratar de uma variável categórica, não há a verificação de normalidade dos dados, devendo só se ater se as amostras são ou não dependentes entre si!

Referência

Oliveira, Bruno. Testes estatísticos para amostras pareadas. 23 de outubro de 2019. Disponível em: <//operdata.com.br/blog/testes-estatisticos-para-amostras-pareadas/>. Acesso em: 09 de janeiro de 2020.

Por Tainah de Paula
Consultora – CAPCS-UERJ

Última postagem

Tag