Vous êtes sur la page 1sur 18

O GUIA DEFINITIVO para uma análise fácil e rápida

OS SEGREDOS DO

TESTE T

PASSO A PASSO

ILUSTRADO

“VERSÃO REDUZIDA”

BÔNUS: indicação de um dos melhores softwares estatísticos gratuitos
BÔNUS:
indicação de um dos
melhores softwares
estatísticos gratuitos

APRENDER ESTATÍSTICA FÁCIL

APRENDER ESTATÍSTICA FÁCIL SOBRE ESTE LIVRO Após a leitura deste livro, garanto que você será

APRENDER ESTATÍSTICA FÁCIL

SOBRE ESTE LIVRO

Após a leitura deste livro, garanto que você será capaz de executar um teste t inquestionável de forma fácil e rápida para o seu TCC, dissertação de mestrado, tese de doutorado, ou qualquer outro trabalho, seja ele acadêmico ou não.

Dividi o livro em duas partes:

-Na primeira parte apresento as características básicas e essenciais que você precisa saber para conseguir aplicar o teste t de forma adequada e inquestionável.

-Já na segunda parte, apresento o passo a passo, de forma prática e rápida, de como aplicar o teste t, considerando todas as características da primeira parte.

Como bônus, indico um dos melhores softwares estatísticos gratuitos disponíveis atualmente!

“VERSÃO REDUZIDA”

Essa versão contêm a primeira parte do eBook.

Baixe GRATUITAMENTE a versão COMPLETA em:

aprenderestatisticafacil.org

DIREITOS AUTORAIS

Todos os direitos reservados. Este eBook ou qualquer parte dele não pode ser reproduzido ou usado de forma alguma sem autorização expressa, por escrito, do autor ou editor, exceto pelo uso de citações breves em uma resenha do eBook.

APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Sejam pesquisadores ainda em formação ou mesmo os já

APRENDER ESTATÍSTICA FÁCIL

APRENDER ESTATÍSTICA FÁCIL

Sejam pesquisadores ainda em formação ou mesmo os já formados, o problema é sempre o mesmo: estatística!

Criei o blog Aprender Estatística Fácil no intuito de auxiliar pesquisadores, principalmente das áreas das ciências naturais e da saúde.

Prazer, meu nome é Gustavo, sou Bacharel, Mestre e PhD em Ciências e tenho especialização em estatística e matemática. Como professor de universidade federal, onde coordeno e ministro a disciplina de bioestatística em dois programas de pós-graduação, já tive a oportunidade de lecioná-la para centenas de alunos, dentre eles, alguns colegas professores.

A minha intenção em ajudar os colegas se dá por uma razão muito simples:

A dificuldade que pesquisadores da área das ciências naturais e da saúde têm com a estatística é muito evidente, e isso afeta profundamente a qualidade do resultado final de suas pesquisas, e consequentemente afeta negativamente descobertas que poderiam tornar nossa vida mais fácil e mais agradável.

Esse é o meu propósito!

APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística
APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística
APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística

APRENDER ESTATÍSTICA FÁCIL

APRENDER ESTATÍSTICA FÁCIL

Não se esqueça de visitar o blog Aprender Estatística Fácil e cadastrar seu e-mail para receber notificações de novos artigos que vão facilitar sua vida acadêmica e como pesquisador.

Lá são publicados artigos periodicamente sobre temas importantes e que mais geram dúvidas na estatística, além de artigos com indicações de softwares e análises estatísticas.

Teste-t de Student: Guia definitivo para uma análise fácil e rápida

APRENDER ESTATÍSTICA FÁCIL ÍNDICE PARTE I: entendendo o teste t , facilmente! Por que utilizar

APRENDER ESTATÍSTICA FÁCIL

ÍNDICE

PARTE I: entendendo o teste t, facilmente!

Por que utilizar o teste t de forma adequada? Cerveja com teste t, o que tem a ver? Mas o que é o teste t? O que ele testa?

 

06

07

08

Os cinco “segredos” do teste t revelados

1. Qual tipo de teste t utilizar?

09

2. Quantas amostras coletar?

10

3. Como coletar as amostras para evitar problemas?

11

4. Por que os dados devem seguir a distribuição normal?

12

5. Homocedasticidade? Oi?

13

PARTE II: executando o teste t, finalmente!

Software estatístico Download e instalação do software Então vamos lá!

 

16

17

18

Exemplo #01: teste t para duas amostras independentes Passo #01: calculando o tamanho amostral Passo #02: entrando com os dados no software Passo #03: testando a premissa de normalidade dos dados Passo #04: testando a premissa de igualdade das variâncias Passo #05: executando a análise teste t

18

19

21

23

24

25

Exemplo #02: teste t para duas amostras pareadas Passo #01: calculando o tamanho amostral Passo #02: entrando com os dados no software Passo #03: testando a premissa de normalidade dos dados Passo #04: testando a premissa de igualdade das variâncias Passo #05: executando a análise teste t

26

27

27

27

27

28

Sobre a transformação de dados 29 Concluindo 30

APRENDER ESTATÍSTICA FÁCIL PARTE I Entendendo o teste t , facilmente! Teste-t de Student: Guia
APRENDER ESTATÍSTICA FÁCIL PARTE I Entendendo o teste t , facilmente! Teste-t de Student: Guia
APRENDER ESTATÍSTICA FÁCIL PARTE I Entendendo o teste t , facilmente! Teste-t de Student: Guia

APRENDER ESTATÍSTICA FÁCIL

PARTE I

Entendendo o teste t, facilmente!

APRENDER ESTATÍSTICA FÁCIL Por que é tão importante que você saiba utilizar o teste t

APRENDER ESTATÍSTICA FÁCIL

Por que é tão importante que você saiba utilizar o teste t de forma adequada?

A ampla disponibilidade e simplicidade do teste t de Student, aliadas à facilidade de entendimento e de uso, o tornaram um dos testes estatísticos inferenciais mais comumente utilizados no mundo.

Essa “popularização”, no entanto, acabou trazendo alguns problemas, como o uso incorreto da análise.

A popularização do teste t acabou trazendo alguns problemas, como seu uso incorreto

Este fato é tão preocupante, que vários artigos de revisão sistemática recentes têm sido feitos — em determinados tipos de estudo, até quase 80% dos artigos publicados apresentam erros na análise estatística!

Como a solução para os problemas da humanidade dependem destes estudos, é bastante inquietante pensar que uma proporção tão grande deles foi analisada de forma incorreta e podem como consequência ter levado a conclusões erradas.

Apesar de tudo isso, os “segredos” para se conduzir um teste t de forma correta não é algo complicado ou difícil.

Basta entender as características básicas da análise, abordadas aqui!

APRENDER ESTATÍSTICA FÁCIL Cerveja com teste t , o que tem a ver? William Sealy

APRENDER ESTATÍSTICA FÁCIL

Cerveja com teste t, o que tem a ver?

William Sealy Gosset (1876–1937) foi um químico e matemático inglês que desenvolveu a distribuição t de Student.

Gosset trabalhou como bioquímico na Cervejaria Guinness em Dublin na Irlanda, onde aplicou seus conhecimentos estatísticos para melhorar a qualidade e produção da cerveja.

O artigo sobre a distribuição t foi publicado na revista

Biometrika em 1908, mas Gosset utilizou seu pseudônimo Student, pois os donos da cervejaria haviam proibido o vazamento de qualquer informação sobre a produção da indústria.

Por isso conhecemos o teste como teste t de Student

e não teste t de Gosset!

APRENDER ESTATÍSTICA FÁCIL Mas o que é o teste t ? O que ele testa?

APRENDER ESTATÍSTICA FÁCIL

Mas o que é o teste t? O que ele testa?

O teste t basicamente infere se as médias de alguma característica mensurável de duas populações são iguais ou não.

Então, para aplicar o teste t, você sempre precisa de uma característica quantitativa (ex peso, altura, distância) que deve ser medida em dois determinados grupos (ex homens e mulheres, espécie x e espécie y, floresta e cidade), para verificar se há diferença entre eles, quanto a esta variável.

Exemplos de aplicação do teste t:

O teste t infere se as médias de duas populações são iguais ou não

[1] Verificar se as médias do tamanho dos indivíduos de determinada espécie são iguais entre os que vivem em floresta conservada e os que vivem em floresta degradada.

[2] Verificar se as médias do peso ao nascer são iguais entre crianças brasileiras e crianças mexicanas.

[3] Verificar se as médias de diminuição da pressão arterial são iguais entre idosos que usaram o medicamento x e os que usaram o medicamento y.

APRENDER ESTATÍSTICA FÁCIL Os cinco “segredos” do teste t revelados 1. Qual tipo de teste

APRENDER ESTATÍSTICA FÁCIL

Os cinco “segredos” do teste t revelados

1. Qual tipo de teste t devo utilizar?

O primeiro desafio é selecionar, de forma correta, qual dos três tipos

de teste t você deve utilizar.

O tipo de teste t tem relação primária com a pergunta que quer

responder e com a forma que os dados foram coletados.

Teste t para duas amostras independentes, é o tipo mais comumente utilizado, que verifica se as médias das amostras coletadas de duas populações são iguais.

-Por exemplo, quero verificar se as médias da massa muscular entre homens e mulheres de uma determinada empresa são iguais.

Teste t para duas amostras relacionadas/pareadas, verifica se a

média de uma amostra, coletada antes de uma intervenção, é igual à média da amostra coletada — nas mesmas unidades amostrais — após

a intervenção.

-Por exemplo, quero verificar se as médias da pressão arterial de mulheres idosas de um município são iguais antes e após o uso de um determinado medicamento.

- Sendo assim, como a pressão arterial de cada mulher idosa é aferida

duas vezes, uma antes e outra após a intervenção, há o pareamento de cada unidade amostral.

Teste t para uma amostra, é o tipo menos utilizado, que verifica se a média da amostra coletada de uma população é igual a uma média já conhecida.

de uma população é igual a uma média já conhecida. -Por exemplo, quero verificar se a

-Por exemplo, quero verificar se a média do peso ao nascer de bebês de uma tribo indígena sul-americana, que estou estudando, é igual à média mundial de peso ao nascer de bebês, já amplamente conhecida.

APRENDER ESTATÍSTICA FÁCIL Os cinco “segredos” do teste t revelados 2. Quantas amostras devo coletar?

APRENDER ESTATÍSTICA FÁCIL

Os cinco “segredos” do teste t revelados

2. Quantas amostras devo coletar?

Após a definição de qual tipo de teste t você vai utilizar, vem o segundo passo: precisamos determinar quantas amostras devemos coletar!

Um tamanho amostral consistente é normalmente a solução de vários dos problemas da estatística.

De forma geral, a melhor maneira de se encontrar o tamanho amostral adequado para nosso teste é por meio de uma análise específica — para cada teste estatístico há uma diferente.

Para o teste t, precisamos da média e do desvio padrão aproximado ou estimado de cada uma das duas populações estudadas.

a melhor maneira de se encontrar o tamanho amostral adequado para nosso teste é por meio de uma análise específica

Com esses dados em mãos, basta entrar com os valores na análise de cálculo de tamanho amostral para teste t no programa estatístico que ele retorna o número adequado de amostras que devem ser coletadas.

Mas onde consigo estes dados de média e desvio padrão das populações estudadas?

Normalmente a partir de outros estudos semelhantes ou coletas piloto!

partir de outros estudos semelhantes ou coletas piloto ! Teste-t de Student: Guia definitivo para uma
APRENDER ESTATÍSTICA FÁCIL Os cinco “segredos” do teste t revelados 3. Como devo coletar as

APRENDER ESTATÍSTICA FÁCIL

Os cinco “segredos” do teste t revelados

3. Como devo coletar as amostras para evitar problemas?

Na verdade, a independência das observações é uma das premissas mais importantes, e ao mesmo tempo mais ignoradas na estatística.

Não só o teste t, mas TODOS os testes estatísticos dependem desta premissa, que quando violada tende a enviesar a análise e gerar resultados enganosos.

Para que não seja violada, as observações em seu conjunto de dados devem ser independentes, ou seja, cada uma das repetições (ou réplicas) da amostragem não deve apresentar dependência com as outras.

O conceito de aleatoriedade é muito importante aqui, e uma ótima forma de evitar a violação da premissa de independência das observações é coletar seus dados em um universo adequado ao seu estudo e de forma completamente aleatória.

Para entender melhor este conceito, proponho o exemplo a seguir:

- Suponha que queremos identificar o perfil genético dos

habitantes de um município para responder uma pergunta qualquer.

- Após definição do tamanho amostral, uma amostragem aleatória dos

indivíduos no município deve ser feita a fim de evitar que a premissa de independência das observações seja violada!

- Neste mesmo exemplo, uma forma de amostragem que violaria essa

premissa, de forma clara, seria se, para representar um município, amostrássemos somente indivíduos de uma mesma família.

amostrássemos somente indivíduos de uma mesma família. Assim, as observações seriam totalmente dependentes umas

Assim, as observações seriam totalmente dependentes umas das

-

outras, visto que o perfil genético é herdável e apresenta grande semelhança entre familiares.

Pseudo-replicação, que significa “repetição falsa”, é o termo utilizado para definir amostragens que violaram esta premissa.

APRENDER ESTATÍSTICA FÁCIL Os cinco “segredos” do teste t revelados 4. Mas por que raios

APRENDER ESTATÍSTICA FÁCIL

Os cinco “segredos” do teste t revelados

4. Mas por que raios meus dados devem seguir a tal distribuição normal?

A normalidade dos dados representa uma premissa aplicável a todas

as análises inferenciais ditas paramétricas.

Esta premissa significa que, para utilização do teste t, seus dados devem seguir a famosa distribuição normal, também conhecida como distribuição gaussiana — que apresenta-se como uma curva em formato de sino, simétrica em torno do seu ponto médio, unimodal.

Mas como faço para saber se meus dados se aproximam da distribuição

normal?

A boa notícia é que há análises estatísticas denominadas testes de

normalidade que identificam esse padrão — há vários, mas dentre os principais estão Shapiro-Wilk, Anderson-Darling e Kolmogorov- Smirnov.

Sempre tome bastante cuidado com a interpretação dos resultados destes testes para não inverter o que ele está realmente indicando.

Caso as análises acima estejam indicando que a premissa de normalidade está sendo violada, há três possibilidades:

1. utilizar o teste t mesmo com a premissa violada, alegando que é um

teste robusto para estes desvios e que seu tamanho amostral é suficientemente adequado;

2. tentar uma transformação dos dados para então uma nova

verificação da normalidade; e

3.

chamada Teste U de Mann-Whitney.

por fim, o uso de uma análise não paramétrica análoga ao teste t,

de uma análise não paramétrica análoga ao teste t , Das três possibilidades, confesso que da

Das três possibilidades, confesso que da primeira não gosto muito e ainda acho a justificativa apelativa — afinal de contas, se vai usar o teste t independente do resultado dos testes de normalidade, por qual motivo então estaria fazendo estas análises? Normalmente faço o segundo passo, e caso o problema não seja resolvido, vou para o terceiro.

APRENDER ESTATÍSTICA FÁCIL Os cinco “segredos” do teste t revelados 5. Homocedasticidade? Oi? Caso os

APRENDER ESTATÍSTICA FÁCIL

Os cinco “segredos” do teste t revelados

5. Homocedasticidade? Oi?

Caso os dados não tenham violado a premissa de normalidade, este é o próximo passo.

Apesar do nome grande e estranho, o significado desta premissa é simples de entender.

Homocedasticidade significa nada mais que “variâncias semelhantes”.

Para aplicação do teste t, em sua forma padrão, as variâncias das duas populações amostradas a serem testadas devem ser semelhantes.

Sendo assim, para verificação se essa premissa, de que as variâncias sejam semelhantes, está sendo violada ou não, existem testes inferenciais nos programas estatísticos!

Dentre os testes mais usados para verificação da igualdade das variâncias estão o teste F, teste de Bartlett e o teste de Levene.

Repito aqui, só faz sentido sua aplicação caso os dados não tenham violado premissa de normalidade.

Essa premissa, no entanto, normalmente não representa grande problema, pois se ela estiver sendo violada, ou seja, caso os dados estejam apresentando “variâncias desiguais” (heterocedasticidade), uma pequena correção no teste t resolve todo o problema.

“Para nossa alegria”, o valor do teste t corrigido para dados com heterocedasticidade, é retornado automaticamente no relatório de resultados da análise na grande maioria dos programas estatísticos.

da análise na grande maioria dos programas estatísticos. Só é necessário fazer uma leitura cuidadosa ,

Só é necessário fazer uma leitura cuidadosa, tanto dos resultados do teste de homocedasticidade dos dados, quanto dos resultados do teste t, com ou sem a correção, para interpretação correta.

Por isso atente-se!

A partir deste ponto, vamos para a parte prática do livro! Para efetivamente aplicarmos o teste t.

APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística
APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística
APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística

APRENDER ESTATÍSTICA FÁCIL

APRENDER ESTATÍSTICA FÁCIL

Não se esqueça de visitar o blog Aprender Estatística Fácil e cadastrar seu e-mail para receber notificações de novos artigos que vão facilitar sua vida acadêmica e como pesquisador.

Lá são publicados artigos periodicamente sobre temas importantes e que mais geram dúvidas na estatística, além de artigos com indicações de softwares e análises estatísticas.

Teste-t de Student: Guia definitivo para uma análise fácil e rápida

APRENDER ESTATÍSTICA FÁCIL PARTE II Executando o teste t , finalmente! Teste-t de Student: Guia
APRENDER ESTATÍSTICA FÁCIL PARTE II Executando o teste t , finalmente! Teste-t de Student: Guia
APRENDER ESTATÍSTICA FÁCIL PARTE II Executando o teste t , finalmente! Teste-t de Student: Guia

APRENDER ESTATÍSTICA FÁCIL

PARTE II

Executando o teste t, finalmente!

APRENDER ESTATÍSTICA FÁCIL “VERSÃO REDUZIDA” Essa versão contêm a primeira parte do eBook. Baixe

APRENDER ESTATÍSTICA FÁCIL

“VERSÃO REDUZIDA”

Essa versão contêm a primeira parte do eBook.

Baixe GRATUITAMENTE a versão COMPLETA em:

aprenderestatisticafacil.org

Software estatístico

Depois de quase 20 anos trabalhando com estatística,

tenho a propriedade em recomendar os softwares mais adequados para quem está aprendendo.

Nessa jornada tive a oportunidade de testar grande

parte dos softwares estatísticos pagos e também, é

claro, os gratuitos.

Posso afirmar que temos softwares estatísticos gratuitos de qualidade incrível e que em muitos aspectos não deixam nada a desejar quando comparados com os pagos.

Minha última revisão sobre os softwares estatísticos gratuitos disponíveis foi feita no final do ano de 2018, pouco antes de terminar de escrever este livro.

Sendo assim, para a análise que estamos tratando neste livro — e também várias outras — não há sombra de dúvidas que o software gratuito que recomendo aqui é um dos melhores, se não o melhor, para nossa proposta, devido à sua simplicidade, completude e intuitividade.

O software MaxStat em sua versão gratuita, MaxStat Lite, apresenta várias ferramentas estatísticas básicas disponíveis, dentre elas: estatística descritiva, cálculo de tamanho amostral, testes de normalidade, testes de variância, testes de hipóteses como teste t e anova, além de seus análogos não paramétricos, etc.

APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística
APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística
APRENDER ESTATÍSTICA FÁCIL APRENDER ESTATÍSTICA FÁCIL Não se esqueça de visitar o blog Aprender Estatística

APRENDER ESTATÍSTICA FÁCIL

APRENDER ESTATÍSTICA FÁCIL

Não se esqueça de visitar o blog Aprender Estatística Fácil e cadastrar seu e-mail para receber notificações de novos artigos que vão facilitar sua vida acadêmica e como pesquisador.

Lá são publicados artigos periodicamente sobre temas importantes e que mais geram dúvidas na estatística, além de artigos com indicações de softwares e análises estatísticas.

Teste-t de Student: Guia definitivo para uma análise fácil e rápida