Vous êtes sur la page 1sur 50

2.

6 Testes de hipóteses: síntese teórica com enfoque prático


Na especificação dos elementos do texto de um documento técnico-científico, após a
definição do problema como ponto inicial da pesquisa, tem-se a formulação e teste de hipótese
como uma fase essencial do método científico. Nesta fase são considerados conceitos, ilustrações
e exemplos descritivos, alguns expressos em termos simbólicos, de hipóteses, destacando-se a
estreita e direta relação (inter-relação) entre o problema, as hipóteses, os objetivos e a metodologia:
trata-se de um processo que auxilia o pesquisador a tomar decisões.
O pesquisador, na prática e com frequência, deve tomar decisões acerca de atributos ou
parâmetros (estimativas) de uma população com base em amostra; tais decisões ou afirmações são
denominadas estatísticas (inferências ou generalizações sobre a população), sendo de interesse
saber se os resultados experimentais provenientes de uma amostra – um subconjunto retirado ao
acaso da população, contrariam, ou não, a afirmação ou relação (...) contida na hipótese.
Para se ter essa afirmação ou relação probabilística se faz um teste de hipótese 1 (hipo =
debaixo; thesis = colocação, proposição; do gr. hypothesis, suposição) para concluir sobre o todo
ou o conjunto de todos os elementos ou resultados da população com base numa série de passos2.
Hipótese entendida como o intento ou suposição de explicação a una resposta ou de relação
provisória de um atributo ou fenómeno da população. Eventualmente o pesquisador poderia fazer
conjecturas a respeito da distribuição de uma variável aleatória. A função da conjectura consiste
em delimitar o problema objeto de pesquisa segundo alguns elementos, tais como tempo, lugar ou
magnitude de um atributo do sujeito.
O teste examina duas hipóteses opostas sobre uma população: a hipótese nula (HO) – se a
hipótese estabelecida pode ser rejeitada ou não, como uma declaração de "nenhum efeito" ou

1 Para formular uma hipótese é preciso ter em consideração diversos aspectos, entre outros, os seguintes:
 Os termos devem ser claros e concretos para dar o sentido operacional ao especificar as variáveis;
 Ter uma referência empírica, pois sem ela é apenas um juízo de valor e a hipótese não poderá ser submetida
a verificação;
 Devem ser específicas não apenas quanto ao problema, mas, em termos de indicadores para medir as
variáveis e manter a consistência entre fatos e as hipóteses;
 Devem estar relacionadas com os recursos, as técnicas disponíveis e com o marco teórico da investigação.
2No procedimento geral de formulação e teste de uma hipótese são seguidos os seguintes passos:
 Definir um problema no contexto de um sistema e, nesse contexto, identificar o parâmetro de interesse.
 Especificar as hipóteses nula e alternativa apropriadas ao caso.
 Escolher um nível de significância consistente com o problema e os objetivos da pesquisa.
 Selecionar a estatística de teste adequada ou consistente com a realidade.
 Fixar a região crítica do teste.
 Escolher uma amostra e calcular o valor da estatística de teste.
 Decidir, com base nos resultados do teste e o critério de decisão adotado, sobre a rejeição ou não de H0.
"nenhuma diferença" entre os grupos – formulada com o intuito de ser rejeitada, e a hipótese
alternativa (HA) qualquer hipótese que contrarie a HO, com a declaração desejada para concluir
como verdadeira ao rejeitar a hipótese nula. A ideia de se estabelecer uma hipótese nula é frequente
no raciocínio não-estatístico, como no caso de um processo criminal, onde o réu é suposto inocente
(Ho: o réu é inocente) até que se prove o contrário (HA: o réu é culpado).
Os exemplos que seguem ilustram a parte formal, e de maneira geral, relativa a formulação
de uma hipótese científica, isto é, de uma afirmação sobre a característica de um parâmetro da
população alvo de investigação, destacando-se a escolha da medida de comprimentos de uma peça,
em cada ação possível, de condições de aceitação com base na medida escolhida.
HO : 𝛼 = 6,0 𝑐𝑚
HA: 𝛼 ≠ 6,0 𝑐𝑚
É possível definir outras hipóteses:
HO : 𝛼 = 6,0 𝑐𝑚
1
HA : 𝛼 ≠ 6,0 𝑐𝑚
HO : 𝛼 = 6,0 𝑐𝑚
2
HA: 𝛼 > 6,0 𝑐𝑚
HO : 𝛼 = 6,0 𝑐𝑚
3
HA: 𝛼 < 6,0 𝑐𝑚
HO : 𝛼 = 6,0 cm
4
HO : 𝛼 = 6,5 𝑐𝑚
Em todos casos a HO é simples, enquanto as HA são compostas, 1, 2, e 3; casos como os das
situações 2 e 3 são chamados testes unilaterais.
Exemplo 1. Em um experimento se tem o interesse de adquirir um novo equipamento. Seja
𝜇𝑂 a média do desempenho do equipamento novo que poderá ser adquirido se for mais eficaz que
o equipamento em uso.
A formulação de hipótese nula 𝜇 = 𝜇𝑂 e a hipótese alternativa 𝜇 > 𝜇𝑂
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 > 𝜇𝑂
O pesquisador, auxiliado pela regra de decisão, poderá distinguir entre as duas hipóteses, com
apoio no estimador de máxima verossimilhança do parâmetro, como, por exemplo, a média
aritmética 𝑋̅, e sempre baseado na hipótese alternativa HA.
Para tal propósito, define a região de rejeição ou região crítica (RC) cujo complemento é a
região de aceitação (RA). Se a média amostral for maior que o valor crítico XC há evidência para
assumir que a média da população é maior que 𝜇𝑂 . A figura que segue delimita a RC > XC que leva
a rejeitar a hipótese HO na região de rejeição.
Para cada tipo de hipótese se determina uma região de rejeição, sempre conforme a hipótese
HA.
A região crítica RC = {𝑋̅>XC2 ou 𝑋̅<XC1}, sendo XC1 e XC2 os valores críticos para o teste
bilateral:
Independente dos valores críticos utilizados para
Região de
aceitação determinar a região crítica, as decisões tomadas estão
sujeitas a erros; erros que podem ser de dois tipos
Região de
rejeição conforme se sintetizam no quadro que segue, ao rejeitar a
HO, quando ela é verdadeira (Erro tipo 1 ou ) e não
rejeitar a HO quando ela é falsa (Erro tipo II ou ):
XC1 𝜇𝑂 XC2

Aceitar HO Rejeitar HO

HO verdadeira Decisão correta Erro do tipo I ()

HO falsa Erro do tipo II () Decisão correta

Se a hipótese HO for verdadeira e não rejeitada ou falsa e rejeitada, a decisão estará correta.
No entanto, se a hipótese HO for rejeitada sendo verdadeira (Erro tipo I), ou se não for rejeitada
sendo falsa (Erro tipo II), a decisão estará errada; a probabilidade de cometer o erro tipo I é denotada
pela letra  (alfa); o segundo é chamado de Erro do Tipo II e a probabilidade de cometê-lo é
denotada pela letra grega . Tem-se:

 = P(Erro Tipo I) = P(rejeitar HO dado HO verdadeira);


 = P(Erro Tipo II) = P(aceitar HO quando HO é falso).

Onde P é a probabilidade de que a estatística, como variável aleatória, tenha valor extremo
em relação ao observado (estatística) quando a hipótese HO é verdadeira. Ao considerar o teste
unilateral expresso pelas hipóteses:
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 < 𝜇𝑂
A região de rejeição é determinada pelos seguintes valores críticos RC={𝑋̅ > XC2 ou 𝑋̅ < XC1},
sendo a interpretação dos erros expressa por:
 = P(𝑋̅ < XC|  = O
 = P(𝑋̅ > XC|  = O
O ideal seria que ambas probabilidades de  e  sejam próximas de zero; no entanto, o que
se registra é que a medida que se diminui o valor de , o valor de  aumenta. Essa relação inversa
é ilustrada na seguinte figura:

 Erro tipo I  Erro tipo II

Rejeição HO XC  Não rejeição HO

No teste de hipótese, onde é de interesse testar a média da população, utiliza-se a seguinte


expressão que é a estatística do teste de hipótese:
Z = (𝑋̅ - 𝜇𝑂 ) / /n
Com base na teoria central do limite se calcula, desde que se tenha um tamanho da amostra
suficientemente grande, uma estatística com distribuição normal, isto é:
Z ≅ 𝑁(0, 1)
A partir dos valores de Z e da especificação do erro cometido, define-se a região crítica do
teste. Considerando que o erro cometido mais importante seja o erro tipo I () denominado nível
de significância; o complementar do nível de significância (1-) é denominado nível de confiança.
Suposto o nível de significância conhecido, têm-se as condições para determinar o (s) valor (es)
crítico (s). Seja o teste bilateral:
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 𝜇𝑂
Rejeição HO Rejeição HO
Sua expressão gráfica, para o teste bilateral,
é como segue: Não Rejeição HO

-Z/2 0 Z/2
Os valores -Z/2 e Z/2 são as áreas à
esquerda e à direita, respectivamente, sob a curva normal padrão, com valor de /2
Considerando o teste unilateral à direita
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 > 𝜇𝑂 Rejeição HO
Não Rejeição HO

0 Z

Para o caso do teste unilateral à esquerda


HO : 𝜇 = 𝜇𝑂 Rejeição HO
Não Rejeição HO
HA : 𝜇 < 𝜇𝑂
- Z 0
Os valores -Z e Z nas figuras acima são as áreas à esquerda e à direita respectivamente,
sob a curva normal padrão, com valor de , nível de significância.
O objetivo do teste de hipótese é determinar, mediante uma estatística, se a hipótese nula é
aceitável ou não, dado certo nível de significância; decisão que é tomada considerando a região de
rejeição ou região crítica (RC). Caso o valor observado da estatística pertença à região de rejeição,
rejeita-se H0; caso contrário, não se rejeita H0. Analogamente, define-se a região de aceitação
(complementar da região de rejeição): caso o valor observado pertença à região de aceitação, não
se rejeita H0; se não pertencer, portanto, rejeita-se HO.
Se, por exemplo, o nível de significância for 0,05, então os valores críticos serão -1,645 ou
1,645 para as alternativas unilaterais e -1,96 e 1,96 para a alternativa bilateral; para o caso do nível
de significância de 0,01, os valores críticos serão -2,33 ou 2,33 para as alternativas unilaterais e-
2,575 e 2,575 para a alternativa bilateral; são valores obtidos na tabela da distribuição normal. A
tabela que segue sintetiza critérios para o teste de hipótese:

Hipótese alternativa Rejeita-se HO se Aceita-se HO se

𝜇 < 𝜇𝑂 Z < - Z Z  Z

𝜇 > 𝜇𝑂 Z > Z Z  Z

𝜇  𝜇𝑂 Z,-Z/2 ou Z>Z/2 -Z/2  Z  Z/2


Exemplo 2. Deseja-se testar, com base numa amostra aleatória de tamanho n=35 e para um
nível de significância  = 0,05, se a largura média é de 72,4 mm. Que se pode concluir com base
numa média amostral 𝑥̅ =73,3 mm e um desvio padrão  =2 mm?
As hipóteses do problema são:
HO :  = 72,4
HA :   72,4
Com o valor de  = 0,05 se registra na tabela da curva normal padrão:
Z/2 = Z0,025 = 1,96
O critério de rejeição é H0 se Zobs < -1,96 ou se
Zobs > 1,96: 𝑥̅ = 73,2; 𝜇𝑂 = 72,4; n=52 e  = 2,1 Rejeição 0,025 Região de Rejeição 0,025
𝑥̅ − 𝜇𝑂
⁄ = 73,2 – 72,4 / 2.1/35 = 2,25
Zobs = aceitação de
0,95
𝑛

A conclusão: como Zobs = 2,25 > 1,96, a hipótese -1,96 0 1,96


nula deve ser rejeitada, isto é, não se pode assumir que
a média da população  seja igual a 72,4; portanto, a diferença entre 73,2 e 72,4 é significativa.
A probabilidade P de que a estatística do teste tenha valor extremo em relação ao valor
observado quando HO é verdadeira é ilustrada, para o caso de um teste bilateral, na figura que segue:

Região de P valor
Região de Não rejeição de HO Rejeição
Não rejeição de HO P valor
Rejeição

Região de
Rejeição Região de
P valor P valor Rejeição

-Zobs - Z/2 0 Zobs Z/2 -Zobs -Z/2 0 Zobs Z/2

A ilustração da probabilidade P, no caso de um teste unilateral, é ilustrada na figura que segue:


Região de Não rejeição
Não rejeição Rejeição de HO
de HO P valor

Região de
P valor Rejeição

0 Z Zobs 0 Zobs Z

Se o valor P for menor que o nível de significância considerado (), então Zobs está na região
crítica e, por tanto, será rejeitada a HO. Em outros sentido, se o valor de P for maior que o nível de
significância, não se rejeitará a HO. Além disso, quanto menor for o P valor, mais distante se estará
da hipótese nula. Dessa forma, o P – valor tem mais informações sobre a evidência contra HO e,
dessa forma, o experimento terá mais informações para decidir com o apropriado nível de
significância ().
O P valor pode ser interpretado como o menor valor do nível de significância para o qual se
rejeita HO; dessa forma, se o nível de significância () que se propõe para o teste for menor que o
P valor não se rejeitará a HO.
Por vezes, a região de rejeição de um teste com nível de significância  apresenta a seguinte
forma:
Rejeitar HO se e somente se W(X)  c
em que W(X) é a estatística do teste e c é a constante escolhida de modo que o teste tenha
nível de significância . O valor P para o ponto amostral x é definido:
𝑠𝑢𝑝
P(x) =  P[W(X)W(X)  C
em que  é um parâmetro pertencente ao espaço paramétrico  sob a hipótese nula HO.
No exemplo que segue se calcula o P valor do teste de médias; teste bilateral, no corpo da
tabela de distribuição normal:
P-valor = P[Z >|Zobs|] + P[Z< - |Zobs|] = P[Z>2,25] + P[Z < - 2.25]=0,0122+0,0122=0,0244
Região de
Aceitação 0,95

0,025 0,025
P|Z < - 2,25| P|Z < - 2,25|

- 2,25 -1,96 0 1,96 2,25

Pode-se concluir que, para qualquer nível de significância maior que 0,0244, há evidências
para rejeitar a HO.
Exemplo 3. Um setor utiliza determinada peça importada que deve satisfazer certas
exigências técnicas. Uma delas é a resistência à tração; um atributo variável conforme cada país
que fabrica essa peça. Para determinados países se especifica (grupo A) a resistência é de 44,0 kg
com o desvio padrão de 1,2 kg. Para outros países (grupo B) a média é de 48,0 kg com desvio
padrão de 1,6 kg. Um lote de peças é oferecido com a resistência média calculada em 45,0 de uma
amostra de 25 peças. Qual é a previsão para tomar a decisão de origem das peças? O pais produtor
será aquele para o qual a média da amostra mais se aproxime da média da população, com a seguinte
regra de decisão:
Se 𝑥̅  46,0 (o ponto médio entre 44,0 e 48,0 ), então, pode-se concluir que as peças tem
origem no grupo de países A; caso contrário, para 𝑥̅ > 46,0, as peças são do grupo B. A regra de
decisão é ilustrada como segue:
Países A B
𝑥̅ = 45,0
44,0 46,0 48,0 X
É possível errar na decisão com a média de 45,0 kg calculada de uma amostra de 25 peças ao
decidir que as peças são dos países A, podendo-se cometer dois tipos de erros:
Erro de tipo I: decidir as peças são de A quando na realidade são de B o que ocorre quando
uma amostra de 25 peças de B apresentar média inferior ou igual a 46,0 kg.
Erro de tipo II: decidir que as peças são de B, quando na realidade eles são de A. Isso ocorre
quando uma amostra de 25 peças de A apresenta média superior a 46,0 kg.
São definidas, para auxiliar a decisão, duas hipóteses:
HO: As peças são de origem B, isto é, a resistência de cada peça segue uma distribuição com
média  = 44,0 e desvio padrão  = 1,2.
H1: As peças são de origem A, isto é, a resistência das peças apresentam média  = 48,0 e
desvio padrão  = 1,6
Define-se a região crítica (RC) correspondente aos valores menores de 46,0 expressa pela
seguinte expressão:
RC = {y  IR| y  46,0}
Expressão que permite calcular a probabilidade de se cometer cada um dos tipos de erros:
P (erro I) = P(𝑋̅  RC| HO é verdadeira) = .
P (erro II) = P(𝑋̅ ≠ RC| H1 é verdadeira) = .
Se HO for verdadeira, ou seja, as peças têm procedência de B, a média terá distribuição
aproximadamente normal, com média 48,0 e desvio padrão igual a 1,6⁄ = 0,32.
√25
𝑋̅ ≅ N (48,0 1,6), denotando por Z a variável:
P (erro I) = P(𝑋̅  RC| HO é verdadeira).
= P(𝑋̅  46 || X ≅ N(48 1,6).

= P ( Z  46,0 − 48,0⁄0,24).

= P (Z  - 2 / 0,24 = -8,33.
= P (Z  - 8,33) =
De modo análogo, quando HA for a alternativa verdadeira, tem-se:
𝑋̅ ≅ N (44,0 1,2), denotando por Z a variável:
P (erro II) = P(𝑋̅  RC| H1 é verdadeira)
= P(𝑋̅ > 46
Exemplo 4. Um setor de uma indústria, como um dos componentes das máquinas que
produzem, utiliza uma peça importada que satisfaz determinadas exigências; uma delas é a
resistência à tração. As especificações do país A afirma que a resistência média à tração é de 145
kg, com desvio padrão de 12 kg; para o país B é de 155 kg e desvio padrão de 20 kg. É de interesse
conhecer a origem de peças misturadas a partir de uma amostra de 25 peças. Qual regra de decisão
deve ser usada para especificar se as peças são de pais A ou B? A possível regra de decisão seria:
Se 𝑥̅ ≤ 150 – o ponto médio entre 145 e155, então as peças são do país A, caso contrário,
isto é 𝑥̅ > 150, as peça são do pais B; esta regra de decisão (RD) é ilustrada na seguinte figura:

145 150 155

Foi obtida uma amostra de 25 peças com média de ̅𝑥 = 148 para escolher o pais de origem
das peças; nessa decisão é possível cometer dois tipos de erros, assim:
Erro de tipo I: dizer que as peças são de A quando na realidade são de B. Isso ocorre quando
uma amostra de 25 peças de B apresenta média 𝑥̅ inferior ou igual a 150 kg.
Erro de tipo II: dizer que as peças são de B, quando na realidade eles são de A. Isso ocorre
quando uma amostra de 25 peças de A apresenta média 𝑥̅ superior a 150 kg.
A definição das hipóteses:
HO: as peças são de origem B o que equivale a dizer que a resistência de cada peça segue uma
distribuição com média  = 155 e desvio padrão  = 20.
HA: as peças são de A, com média  = 145 e desvio padrão  = 12
A região crítica RC corresponde aos valores menores que 150, isto é:
RC = [y  IR| y  150]
A probabilidade de se cometer cada um dos erros pode ser expressa por:
P(erro I) = P(𝑋̅  RC | HO é verdadeira = 
P(erro II) = P(𝑋̅  RC | HA é verdadeira = 
Se HO for verdadeira quando as peças forem de B, a vaiável 𝑋̅ terá distribuição
aproximadamente normal, com média 155 e desvio padrão igual a 20⁄ = 4, o que equivale:
√25
X  N(155, 16)
Denotando por Z a vaiável aleatória com distribuição N(0, 1), tem-se:
P(erro I) = P (𝑋̅  RC| H0 é verdadeira
= P (𝑋̅  RC| 𝑋̅  N(155, 16)
= P ( Z  150 − 155⁄4 ) = P (Z  - 1,24) = 0,10565 = 10,56% = 
De forma similar, quando HA for a alternativa verdadeira, tem-se para a variável 𝑋̅
𝑋̅ N (145; 5,76)
P(erro II) = P(𝑋̅  RC| é verdadeira
= P(𝑋̅ > 150| 𝑋̅  N (145; 5,76)
= P ( Z  150 − 145⁄2,4 ) = P (Z > 2,08) = 0,01876 = 1,88%= .
As estimativas dos erros mostram, com a regra de decisão adotada, que se estará cometendo
o erro tipo I com maior probabilidade do que o erro tipo II; assim se estará privilegiando a afirmativa
de que as peças são de A. O resumo do teste H0:  = 155, HA:  = 145, com RC = [− ∞, 150].
Decisão
RC
Origem das peças 𝑋̅
150
A B
Erro tipo II
A Sem erro
 = 1,88%
Erro tipo I
B Sem erro
 = 10,56%
Se as peças forem de B e a amostra tiver média superior a 150 não se cometera erro; mas, se
média for inferior a 150, então as peças serão de A e se estará cometendo um erro de 10,56%
Em cada regra de decisão se for escolhido um valor 𝑥̅ c inferir a 150 as probabilidades de  e
 mudarão; se 𝑥̅ c for menor do que 150, observar-se-á diminuição de  e aumento de , devendo
existir um ponto em que  e  sejam iguais; esse ponto é 𝑥̅ c = 148,75, em que  =  = 5,94.
Escolhido um valor de 𝑥̅ c se pode encontrar as probabilidades  e  de cometer cada tipo de
erro; mas, pode-se proceder de modo inverso: fixar um dos erros, como por exemplo, de , e
encontrar a regra de decisão correspondente à probabilidade de erro tipo I igual a . Assim, ao fixar
 em 5%, a regra de decisão correspondente:
5% = P(erro I) = P(𝑋̅  𝑥̅ c|𝑋̅  N(155, 16)
= P(Z  1,645)
Com a transformação para a normal padrão, tem-se:
𝑥̅ c−155
- 1,645 = -1,645 x 4 = 𝑥̅ c – 155; 𝑥̅ c = 148,42
4

Dessa forma, a regra de decisão será: se 𝑥̅ for inferior a 148,42, então o lote de peças é de A;
caso contrário é de B. Com essa regra de decisão, a probabilidade do erro tipo II será:
 = P(erro II) = P(𝑋̅ > 148,42|𝑋̅  (145; 5,76)
P(Z > 1,435) = 7,93%, com a seguinte expressão gráfica dos erros de tipo I e II:

A
B

 = 0,05  = 0,0793
𝑥̅ c
=145 -148,42 =155

RC
A decisão a tomar não é apenas entre duas possíveis populações, ainda que frequente, mas
com foco em uma população, conforme se ilustra com o mesmo exemplo 4, para o caso de peças
do país B. A hipótese que interessa é:
HO: as peças são de origem B ( = 155 e  = 20)
Se não for verdadeira, a alternativa pode ser expressa como:
HA: as peças não são de origem B ( e  desconhecidos)
Nessas condições não se pode especificar os parâmetros sob a hipótese alternativa HA; as
peças se não forem de origem B, poderão ser de outros países. A especificação da hipótese
alternativa depende do nível de informação que se tem do problema. Por exemplo, admite-se que a
indústria do país B seja a mais seja a mais desenvolvida. Neste caso, a hipótese alternativa seria:
HA: as peças não são de origem B ( < 155 e  qualquer).
A melhor alternativa, diante as muitas hipótese, alternativas, é fixar , a probabilidade do
erro de tipo I (rejeitar H0 quando ela for verdadeira). Ao fixar  = 0,5, e nesse caso a regra de
decisão depende da informação de H0:
Se 𝑥̅ for superior a 148,42, então o lote de peças é de origem B; caso contrário, não é de
origem B.
É possível reescrever as hipóteses, nessa situação, como segue:
H0:  = 155
HA:  < 155
O cálculo de β depende do valor de μ, que não é especificado; mas, é possível considerar a
seguinte e importante função.
A função característica de operação (função CO) do teste acima é definida como:
β(μ) = P(aceitar H0|μ) = P⎯(X > 148,42|μ).
Onde β(μ) é a probabilidade de aceitar H0 considerada como uma função de 
Com frequência considera-se a função π (μ) = 1 – β (μ) – chamada função poder do teste, que
é a probabilidade de se rejeitar H0 como uma função de .
Admitindo-se como hipótese alternativa (não há razão para acreditar que a resistência média
das peças de B seja maior ou menor do que a de outros países).
HA: as peças não são de origem B (μ  155).
Agora, a regra de decisão deverá indicar dois pontos 𝑥̅ c1 e 𝑥̅ c2, tais que:
Se 𝑥̅ estiver entre esses dois pontos 𝑥̅ c1 e 𝑥̅ c2, se terão peças de origem B; se 𝑥̅ estiver fora do
intervalo, então não são de origem B.
Ao fixar , a probabilidade do erro I, existirão muitos valores que satisfazem a essa condição,
dando-se preferência às 𝑠𝑜𝑙𝑢çõ𝑒𝑠 𝑥̅ c1 e 𝑥̅ c2 simétricas em relação à média.
Ao fixar  em 5%, tem-se:
0,05 = P(erro I) = P(𝑋̅ < 𝑥̅ c1 ou 𝑋̅ > 𝑥̅ c2| 𝑋̅  N(155, 16).
= P(Z < - 196 ou Z > 1,96.
- 1,96 = (𝑥̅ c1 – 155 / 4  e 𝑥̅ c1 = 147,16.
1,96 = (𝑥̅ c2 – 155 / 4  e 𝑥̅ c2 = 162,84.
Portanto, nesse caso, a região de rejeição da hipótese H0 está definida por:
RC = {𝑥̅  IR | 𝑥̅ < 147,16 ou 𝑥̅ > 162,84}.
Conforme apresentado acima, tem-se que, dependendo do nível de informação que se tem
do problema, podem-se ter regras de decisão unilaterais ou bilaterais.
Seja o caso de determinar qual de dois procedimentos ou meios, representados por Ci, é o
mais eficaz para atender o objetivo (O) de, por exemplo, aumento da produção (Q) proposto para
ser alcançado em determinado período de tempo.
Exemplo: Um experimento com o interesse em decidir se, por exemplo, o atributo tem, por
exemplo, o comprimento de 46 kg ou diferente de 35 kg. Os casos são ilustrados ( = média da
população):
HO:  = 46 (teste simples)
HA:   38; (teste composto)
ou, ainda: HA:   46; HA:  < 46: testes compostos unilaterais.
HA :  = 50; teste simples.
A regra de decisão permite distinguir entre as duas hipóteses a partir do estimador de máxima
verossimilhança, isto é, do estimador com base em uma amostra que fornece a melhor informação
possível sobre um parâmetro desconhecido de interesse na população, do parâmetro sempre baseada
na hipótese HA.
O objetivo do teste estatístico de hipóteses é fornecer uma metodologia que permita constatar
se os dados amostrais trazem evidências que apoiem ou não a formulação da hipótese estatística.
Um exemplo hipotético, a partir de uma situação simples, permite ter uma ideia de teste de uma
hipótese.

H0:  = 38,0

HA:   38,0
Seleção do teste; o teste é de média 3 da população [E(x) = ] com distribuição normal
[xN(, 2], variância conhecida e fixa [var(x) = 2]. 4

3
Trata-se do teste de t (Student). É um dos testes de hipótese mais frequente na pesquisa, utilizado para
fazer comparações de duas estimativas (comparações independentes ou ortogonais, isto é, quando cada
média aparece apenas em uma comparação) e obter inferências dos parâmetros da população (médias de
tratamentos, p. ex.), com base na análise de estimativas amostrais com são a média e o desvio-padrão.
4
Para estas condições (pressupostos) e quando H0 é verdadeiro, tem-se:

x  N ( , 
2
)
n
Distribuição do teste; baseado no conhecimento acerca da média da população que se
supõe tem distribuição normal com variância conhecida, bem como na
representatividade da amostra dessa população, sabe-se, também, que a distribuição do
teste tem distribuição normal com média 0 e variância 1.
Em teoria existem muitos valores para o teste de t, um para cada amostra de 50
elementos. Na prática se obteve uma amostra para o teste e tomada de decisão.
Regra de decisão. O critério indica rejeitar a hipótese se o valor estimado da estatística
do teste se encontra na região de rejeição; será aceita a hipótese se o valor estiver na
região de aceitação, conforme mostra a Figura 25 e o Gráfico 38 para o caso ilustrado
no exemplo.

=1
=0

/2 /2
-2,01 2,01

Região de aceitação
Região (1 - ) Região
Rejeição Rejeição

Figura 25 Regiões de aceitação e rejeição (região crítica,


neste caso, bilateral porque HA é bilateral) do teste.

Decide-se com base em estimativa da x , aceitando H0 se a média estiver próxima de 38,0;


rejeitá-la se a x estiver muito afastada. Essa decisão se baseia no conceito de região crítica
definida como: x <(38,0–c) ou x >(38,0+c), em que c é uma margem de erro e determinada

Em sua forma estandardizada a estatística de teste é:


x  
Z 
x   ou t 
 s
n n
Quando H0 é verdadeira ZN (0, 1).
probabilidade de acerto. Os pontos de fronteira dessa região crítica são conhecidos como
valores críticos, ilustrados no Gráfico 38.

Região Região crítica


Crítica Região de aceitação Aceitar HA
Aceitar HA Aceitar H0 Rejeitar H0
Rejeitar H0 Não rejeitar H0

(38,0 – c ) 38,0 (38,0 + c)

Gráfico 38 Definição de áreas de decisão (aceitação e


rejeição) e pontos de fronteira no teste de hipótese.

A rejeição da H0 pode ser devida ao fato da concentração de enzima na população ser


diferente a 38, maior ou menor que esse valor, para um dado nível de significância ().
Se o nível é de 5,0% ( = 0,05; o caso de um teste bilateral, /2 = 0,025), os valores de
referências são: pequenos a esquerda de -2,01 e grande, a direita de 2,01; Figura 25).
A tabela que mostra o valor da distribuição normal reduzida (ou da tabela t) para 49
graus de liberdade e 95% na região de aceitação indica um valor de 2,0086 (2,01).
A regra de decisão, após calcular o valor da estatística do teste utilizando os dados de
amostras, diz: rejeitar a hipótese nula se for obtido um valor maior ou igual a 2,01 ou
menor ou igual a – 2,01. Com estes valores se estima a margem ( c ) do intervalo. 5
No exemplo, para x = 36,8 e s = 59,2 =7,69 o termo c = 15,46 sendo, portanto, a
região crítica x < 21,34 e x > 52,26. Nesse intervalo, para 95% das vezes, encontra-
se a média da população ( = 38,0). Este resultado é confirmado pelo teste da hipótese.
Calculo da estatística do teste; o valor dessa estatística aplicada no teste de hipótese
para o problema exemplificado é:

36,8  38,0
t   1,10
59,2
50

Decisão estatística; com base na regra de decisão não se pode rejeitar a hipótese nula,
uma vez que a estimativa – 1,10 não se encontra na região de rejeição.
O valor estimado não é significativo ao nível de 5%, conclui-se, portanto, que o valor
médio de enzima de 36,80 se encontra dentro do padrão de concentração normal que
essa amostra apresenta.

2 Problema. Alta concentração de amilose no soro de uma amostra de 22 animais


submetidos a experimentação selecionados de uma amostra aleatória em condições de
saúde satisfatória.

5
As linhas de fronteiras ou os valores críticos compreendem conceitos importantes na decisão com o teste
de hipótese. Parte desses conceitos se refere ao nível de significância () e aos dois tipos de erros (ver
Quadro 34), relacionados com informações teóricas como segue:
= P(erro Tipo I) = P (Rejeitar H0| H0 é verdadeira)
 = P(erro Tipo II) = P (Aceitar H0| H0 é falsa).
Supondo-se que x N(, 1), então x  N(, 1 ) e
50
  P( x  21,34) ou x  52,26 |   38 )
21,34  38,00 52,26  38,00
 ( )  1  ( )
59,2 59,2
50 50
Com relação ao erro Tipo II, não se terá um único valor, mas, uma função; para cada valor da HA se calcula
um . Conhecer a probabilidade indicada por  é importante para determinar a potência do teste, isto é, a
probabilidade de rejeitar H0 quando HA é verdadeira; essa probabilidade é dada pela expressão: 1- .
2.1 Propósito. Saber se é possível concluir que a estimativa da média da população da
qual se obteve a amostra é diferente de 120 unidades, valor indicado como referência
pela literatura pertinente para as condições “normais” desse tipo de experimento.
2.2 Procedimento. As hipóteses são definidas como (introdução dos conceitos de
hipótese nula, H0 e de hipótese alternativa, HA):

H0:  = 120 9a

HA:   120 9b

2.3 Pressuposto: a estatística do teste segue a distribuição t de Student, com n-1 graus
de liberdade. A regra de decisão pode ser definida para um nível de significância de 5%
(; teste bilateral, portanto /2 = 2,50%).
2.4 Obtenção de dados. O procedimento para a coleta dos dados, com a sua
justificativa técnico-científica e operacional indicada no projeto.
A fundamentação do processo de decisão, no teste de hipótese (Figura 25 e Gráfico
37), é ilustrada com os seguintes exemplos.
Um pesquisador quer comparar a produtividade média de uma nova variedade de milho
( x NOVA ) com a produtividade média de uma variedade tradicional ( xTRAD ). Para esse fim,
define a seguinte hipótese de nulidade:

x NOVA  xTRAD
H0:
x NOVA  xTRAD  0 11

Isto é, a igualdade entre as produtividades médias das duas variedades consideradas no


estudo, o que pressupõe nenhum efeito positivo da pesquisa nessa nova variedade com
a inovação tecnológica. A hipótese alternativa é que a nova variedade tem maior
produtividade:

HA: x NOVA  xTRAD


12

Numa pesquisa propõe-se testar uma nova droga (ND) para o tratamento de
determinado tipo de câncer. A referência se ilustra com base em pesquisa documental
de experiências anteriores. Nestas, os pacientes com esse tipo de câncer sobreviviam,
em média ( y ND ) 24,8 meses, com um desvio padrões de 28,2 meses.
Para testar se a nova droga aumenta a sobrevivência, o produto será testado numa
amostra de 80 pacientes com diagnósticos recentes; esses pacientes são monitorados
até o óbito e registrada a sobrevivência média, expressa por y ND .
A hipótese nula é:

y ND  28,20
H0: y 13
ND  28,20  0

A hipótese alternativa, para o exemplo anterior, é dada por:

HA: y ND  28,2 14

Isto é, a nova droga tem a capacidade de prolongar a sobrevivência de pacientes com


este tipo de câncer, se comparada com o tratamento de referência.
Para decidir se utiliza o teste t de Student, prévia a definição de certo nível de
significância (), variável de caso a caso, isto é, certa probabilidade de cometer um erro
nessa decisão.
Os erros, ao tomar a decisão a favor (aceitar) ou contra (rejeitar) a hipótese, podem ser
considerados sob duas perspectivas, assim: a probabilidade de rejeitar H0 se esta for
verdadeira e a probabilidade de aceitar H0, quando a hipótese for falsa.
Existe certo balanço entre esses dois tipos de erros, representado por  e , no sentido
de que ao tentar minimizar a probabilidade de um tipo de erro, aumenta-se a
probabilidade do outro.

Na prática é frequente utilizar, conforme seja a natureza do problema e as implicações de um


e outro tipo de erro na decisão, vários níveis de significância, p. ex., menor importância com o erro
para o caso do experimento de uma nova variedade de milho que em experimentos com
medicamentos para humanos, conforme se ilustra a seguir:
a) Menor que 1% ( < 0,01), para uma conclusão de diferença altamente significativa
desejável em experimentos com implicações mais graves como seriam as que
compreendem decisões vitais ou de grande investimento, de um erro de decisão; o
pesquisador deve buscar o maior poder do teste, isto é, a maior probabilidade de rejeitar a
H0 quando ela seja falsa; esse nível de probabilidade é dado por 1 - . Em geral, quanto
maior o tamanho da amostra (n) , maior será o poder do teste.
É desejável que o pesquisador decida sobre um tamanho de amostra conveniente antes de
realizar a pesquisa de forma que o resultado do teste de hipótese possa ter poder suficiente
para se ter inferências científicas de interesse.
b) Entre 1% a 5% (0,01   < 0,05), para uma conclusão significativa na maioria dos
experimentos em áreas como as de pesquisa para o agronegócio.
 Entre 5% a 10%, (0,05   < 0,10), para uma conclusão provavelmente significativa. Este
critério pode ser adotado em pesquisas em ciências sociais com implicações menos graves
sem, contudo, comprometer o rigor da investigação.
 Maior de 10% (  0,10), para uma diferença, na maioria dos casos, não significativa; em
algumas pesquisas é necessário adotar esse critério de decisão para se ter informações
preliminares descritivas.
Qual é a lógica 6 do processo de tomada de decisão baseada no resultado de um teste de
hipótese científica? Tanto o teste como a inferência estatística que possibilita obter informações
para o suporte à decisão é baseada no método científico – inferência que permite fazer
generalizações sobre uma população, com base nos dados de uma amostra. Com esse método, gera-
se e comunica a informação do conhecimento científico que descreve mediante causas e explica
(HEMPEL, 1988: A lógica das explicações) os fatos e fenômenos objeto de estudo, sem empirismo
(BOYD, 1993).

6 Ao tratar da lógica, o pesquisador deve-se lembrar que o conceito se refere às formas de argumentação
válidas, ao interesse de uma classe especial de inferência que, para o caso considerado no texto corresponde
à inferência estatística -coleta, síntese, análise e modelagem para uma população, a partir de uma amostra,
de uma hipótese científica. Nesse contexto é oportuno e necessário ter alguns cuidados para não chegar a
conclusões pseudocientíficas baseadas em falácias de “lógicas”, tais como as que incluem, entre outros
procedimentos:
 Basear uma conclusão para a tomada de decisão em resultados gerados de amostras não representativas
da população objeto de estudo; o argumento que pretende justificar o valor de uma verdade de uma
asserção ou frase para afirmar ou negar algo contida na hipótese, não é consistente.
 Omitir ou distorcer fatos que poderiam gerar outras conclusões.
 Defender resultados e conclusões pela tentativa de “provar” que as outras estão erradas.
 Pretender defender conclusões que não podem ser testadas com base em dados de uma realidade.
Em sentido estrito, essa lógica pode ser representada na formulação do problema de decisão,
em que a escolha racional, baseada na teoria de decisões, em geral, maximiza um valor esperado
de uma função de utilidade associada aos possíveis resultados dessa tomada.
Em sentido prático, a lógica se insere no contexto do problema geral e nos objetivos, conforme
se ilustra com o seguinte exemplo:

Um produtor é remunerado com certo (a ser especificado na formulação da hipótese)


índice de rentabilidade baixo (indicar o valor e a referência para defini-lo como sendo
baixo) e equivalente ao da poupança, porém de maneira relativamente segura, ao
produzir com a tecnologia tradicional. Poderá produzir mais e seu negócio passar a ser
mais lucrativo adotando novas tecnologias na hipótese de que o mercado possa absorver
o excedente de produção de 50% esperado como essa nova tecnologia, sem redução do
preço do bem tecnologicamente beneficiado nem aumento no custo de produção com
novos insumos.
Adotar a nova tecnologia pressupõe um investimento de R$100.000, realizável às custas
da aplicação “segura” que é a da poupança.
H0: comercializar no mercado um excedente de pelo menos 50% de produção sem
afetar o preço recebido (poderia se especificar em termos de custos de produção: sem
aumento no preço pago pelos insumos).
Aceitar H0 de que o mercado possa ter esse comportamento implica em despoupar e
investir em tecnologia, assumindo o risco de que a H0 seja fala.
Aceitar H0 quando é verdadeiro é uma decisão correta, o que implica adotar a nova
tecnologia e ter uma condição inalterada de preço no mercado para esse bem.
Rejeitar a H0 sendo falsa, também é uma decisão correta que, no caso ilustrado, é a não-
adoção de tecnologia, continuar produzindo com a tecnologia tradicional e manter a
poupança, com retornos equivalentes seguros.
Neste tipo de decisão há dois tipos de erros; o primeiro é rejeitar H0 quando ela é
verdadeira, chamado erro tipo I: deixar de investir na nova tecnologia sendo ela
rentável e o excedente que gera não afetar os preços no mercado.
O segundo tipo de erro é aceitar a H0 quando ela é falsa, chamado erro tipo II; significa
adotar a tecnologia quando o mercado não pode absorver esse excedente em condições
normais ou os preços seriam alterados com a entrada desse excedente de produção.
Uma síntese de alternativas de decisão, com suas correspondentes implicações para o
caso exemplificado, é apresentada no Quadro 37.

A teoria estatística fornece meios para minimizar o erro na tomada de decisão, (pré)-definido,
conforme seja a natureza do problema sintetizado pelo nível de significância ou . Esse nível
corresponde ao erro tipo I ( é a probabilidade de rejeitar H0 sendo tal hipótese verdadeira,
conforme ilustrado nos Quadro 34 e 37).

Quadro 37 Possíveis decisões da hipótese de nulidade para o exemplo apresentado no texto


H0: Mercado absorve pelos menos um excedente de 50% e não se alteram os preços
A hipótese nula (H0) é verdadeira A hipótese nula (H0) é falsa
H0:   x  50% H0:   x  50%
Rejeitar H0

Decisão correta
Erro do tipo I (  ): Continua com a
tecnologia tradicional e com a poupança Continua com a tecnologia tradicional e
com a poupança
DECISÃO

Aceitar H0

Decisão correta Erro do tipo II (  ):


Adota a tecnologia Adota a tecnologia
Decide despoupar. Decide despoupar.

No projeto de pesquisa ou no relatório da investigação concluída, deve-se observar que a


determinação da natureza dos atributos da população objeto de estudo e o modo de amostragem
condicionam o método estatístico; neste, para cada teste estatístico se tem técnicas, modelos e
condições de mensuração, com suas respectivas características.
Deve-se observar que o teste é válido sob certas condições especificadas pelo modelo e pelo
nível de escala de mensuração. Neste sentido, o pesquisador, no documento técnico-científico,
deverá apresentar os argumentos da validação e da apropriabilidade ou consistência do teste com a
situação que é considerada na pesquisa.
Um aspecto importante e, com frequência, omitido em textos, é o relativo a um critério para
decidir com formular as hipóteses alternativas: unilateral, bilateral ou simplesmente diferente. A
resposta está, em parte, na natureza do problema e nos objetivos do estudo. Para ilustrar o caso,
propõe-se o seguinte exemplo:

Exemplo 1.
A especificação do peso médio padrão do produto (...) é de 8,0g, com um valor de
variação (c) de 0,5g para o nível crítico. Admite-se que a amostra de 10 elementos
provém de uma distribuição normal com variância fixa e conhecida [em sua forma
reduzida é N(0, 1)].
Portanto, a região crítica, com este pressuposto, é x < 7,5 (8,0 – 0,5) e x > 8,5 (8,0 +
0,5).
O nível de significância  é definido por:
P( x < 7,5 ou x > 8,5 | =8,0)
7,5  8,0 8,5  8,0
= ( )  ( )  0,114  11,4%
1 0,1
10

As hipóteses alternativas poderão ser especificadas conforme se ilustra a seguir:


H0:  = 8,0
HA:  > 8; a região crítica unilateral, no lado direito, é definida por:
x > (8,0 + c).
Esta situação, ilustrada na Figura 26, poderá favorecer o fabricante quando rejeitar H0
significa ajustar o processo de produção.
Em geral, aplica-se quando o objetivo do estudo seja saber si o valor de um parâmetro
é igual ou maior ou apenas maior que determinado valor como, p. ex., o valor R da
média ( x + c). Nestes casos, as especificações são:

H0:  = R, com a HA:  > R.


H0:  > R, com a HA:   R.
H0:   R, com a HA:  < R.
Uma segunda alternativa é:
H0:  = 8,0
HA:  < 8; neste caso a região crítica unilateral, no lado esquerdo, é definida por:
x < (8,0 - c) (Figura 27).

Região de aceitação Região


(1 - ) Rejeição
>(8,0+c)

Figura 26 Região de aceitação e região de rejeição unilateral


superior (esquerda) do teste.

Região Região de aceitação


Rejeição (1 - )
<(8,0-c)
Figura 27 Região de aceitação e região de
rejeição unilateral inferir (direita) do teste.
Esta situação poderá favorecer o consumidor quando rejeita H0 e isto significa não
aceitar o produto.
Em geral, aplica-se quando o objetivo do estudo seja o de saber si o valor de um
parâmetro é igual ou menor ou apenas menor que determinado valor como, p. ex.,
o valor R’ da média ( x - c). Nestes casos, as especificações das hipóteses são:

H0:  = R’, com a HA:  < R’.

H0:  < R’, com a HA:   R’.

H0:   R’, com a HA:  > R’.


Uma terceira alternativa é:

H0:  = 8,0

HA:   8.
Neste caso a região crítica bilateral, em que o nível de significância se divide em dois,
é definida por: x < (8,0 – c) ou x < (8,0 + c).
Esta situação poderá indicar certo equilíbrio ou compromisso entre consumidor e
fabricante desse produto (Figura 25).

Como o pesquisador se orienta para definir suas hipóteses nula e alternativa? As seguintes
regras empíricas ou procedimentos práticos sintetizam parte dessa orientação (DANIEL 1999; p.
247; adequado ao texto):
a) Sempre, as referências de orientação são: o problema de pesquisa, os objetivos e as conclusões
que se espera gerar como resultado do teste de hipótese. Neste sentido, se o que interessa na
pesquisa não é a diferença (  R), mas, se é menor ( < R) ou maior ( < R), então, esse
interesse será a orientação a seguir na definição da hipótese.
b) As hipóteses nulas (H0) devem conter proposições de igualdade ou desigualdade (=,  ou );
no caso das desigualdades, implica que consta de um número infinito de hipóteses.
O teste de hipótese se faz no ponto da igualdade, uma vez que se for possível mostrar a rejeição
de H0 em um ponto do limite, em qualquer outro se mantém o resultado.
c) A H0 é a proposição que deve ser testada a partir da definição de uma hipótese alternativa
(HA); essa definição é feita com base em dados da realidade objeto de estudo.
d) As H0 e HA são complementares contendo, com detalhes, todos os possíveis valores que os
parâmetros – funções de valores da população e suas estimativas ou estatísticas-funções de
valores amostrais, possam assumir.
Conforme apresentado nestas Orientações (...), o resultado de um teste de hipótese não é
definitivo nem absoluto. Assim aceitar H0 indica que esta é apoiada nos dados, sem a interpretação
de ser “verdadeira”, mas, que pode ser aceita (pode ser verdadeira) dado um conjunto de condições
da realidade, do processo (p. ex., erros e probabilidades admitidas) e dos objetivos do estudo. Dessa
forma, aceitar H0 implica ter presente esse conjunto de limitações ou de circunstâncias, sem que tal
aceitação implique demonstração (DANIEL, op. cit.; p. 248).
A parte que segue apresenta outros exemplos e discussões de aspectos teóricos aplicados nesses
exemplos.

Exemplo 2.
Numa pesquisa de mercado a variável x representa o peso de um pacote de (...), suposta com
a distribuição normal [(N(, 1)]. O processo está definido para  = 500g. Numa amostra
aleatória de 25 pacotes se registrou x = 528g. Quer-se saber, ao nível de significância de 5%,
se o processo está afinado (está sob o controle da qualidade).

H0: x0 = 500g.

HA: x0  500g.
Nível de significância () = 5%. Número de elementos da amostra (n) = 25.
A estatística de teste é:

x  x0 528  500
Zˆ    140
1 1
n 25
Para  = 0,05 (teste bilateral:  = 0,025), no corpo da tabela normal reduzida Z se
2
tem o valor 1,96; portanto a região de rejeição será Z < -1,96 ou Z > 1,96. Sendo o valor
estimado Z ( Ẑ ) de 140, maior que a referência na tabela normal reduzida (1,96), então,
rejeita-se H0, contra HA: x0  500g ao nível de 5%; significa que, com base nessa
amostra e o nível de significância, há evidência de que o processo de empacotamento
não está conforme o critério de qualidade que se segue ao defini-lo pelo valor de x0.
Em termos gerais, não seria rejeitada H0 se qualquer valor calculado no teste estiver
contido no intervalo definido entre 527,61 e 528,39. Esse intervalo de confiança 7 não
compreende o valor (critério de qualidade) especificado para o peso médio dos pacotes
de 500g.
Um dos pressuposto do teste aplicado acima é em relação à variância: conhecida e fixa.
Entretanto, a aplicação do teste pode ser feita nos casos de não se conhecer a variância
da população, mas esta pode ser estimada desde que a amostra seja grande (n > 30
elementos).

Exemplo 3
Em um experimento foram coletados dados de dois tratamentos. Deseja-se saber se as
médias dessas duas populações amostradas para esses tratamentos são diferentes.
Admite-se (são os pressupostos da técnic) que as populações da qual foram obtidas as
amostras (amostragem aleatória) têm distribuições normais e são independentes:

População 1: E(x1) = 1 e V(x1) = 2.

População 2: E(x2) = 1 e V(x2) = 2.

As estimativas amostrais são:

x 1 = 118 unidades / ml; s1 = 32 unidades/ml.


n1 = 16.

7
Não se rejeita a H0 se, e somente se:
 
x0  a  x  x0  a
n n
 
xa  x0  x  a
n n
em que x0 é o critério de referência da população (no exemplo, o valor 500g) e a é o valor da tabela Z para
o nível de significância pré-estabelecido na pesquisa.
x2 = 99 unidades / ml; s2 = 29 unidades / ml.

n2 = 21.
O critério de decisão é de 5%.
As hipóteses são:

H0: 1 = 2 ou 1 - 2 = 0.
HA: 1  2.
A estatística que o pesquisador poderá utilizar para este teste, 8 com uma amostra
considerada grande, tem distribuição t de Student com (n1 + n2 – 2) graus de liberdade.
Para 35 graus de liberdade (16 + 21 – 2) e  = 0,05 (teste bilateral), o valor de referência
na tabela t é de  2,0301. Receitar-se-á H0 a menos que: - 2,0301 < t calculado < 2,0301.
Neste exemplo não se conhecem as variâncias das populações, porém se assume que
sejam iguais; isto, apesar das estimativas, a partir de amostras diferentes, apresentar
resultados diferentes. Dessa forma é necessário determinar uma variância “ajustada”,
sp assim:
15 (32) 2  20 (29) 2
s 
2
 919,43
15  20
Com a estimativa sp se calcula a estatística t :
(118,00  99,00)  0
t  1,89
919,43 919,43

16 21
A estimativa do teste t não permite rejeitar a H0 porque seu valor se encontra na região
de aceitação: - 2,0301 < 1,89 < 2,0301. Isto significa que estatisticamente as médias
desses experimentos são iguais.

8
A estatística para comparação de médias de duas populações independentes e distribuição normal é
definida por:
( x 1  x 2 )  ( 1   2 ) x1  x 2
t  
2 2
s s 1 1
 sp 
n1 n2 n1 n

( n 1  1)s 12  ( n 2  1)s 22
em que : s p
n1  n 2  2
Exemplo 4
No exemplo que segue não é possível assumir que as variâncias sejam iguais, além de
elas não serem conhecidas.
O pesquisador está interessado em saber se duas populações amostráveis diferem com
respeito ao valor médio de (...).
Para tal propósito são obtidas duas amostras com as seguintes estimativas:
x 1 = 56,5 (...). s1 = 16,7 (...). n1 = 20.
x 2 = 42,9 (...). s2 = 11,6 (...).n2 = 14.
As hipóteses nula e alternativa são:

H0: 1 = 2 ou 1 - 2 = 0. HA: 1  2.

A regra de decisão é rejeitar H0 se:

- 2,438 < t calculado < 2,438


para o critério de decisão de 1%.
A estimativa da estatística t é:
(56,5  42,9)  0
t  2,80
(16,7) 2 (11,6) 2

20 14
Com este resultado não se pode concluir que as médias dos tratamentos são iguais.

Em pesquisa biológica é freqüente o teste 9 para comparações de pares, ao definir as


diferenças de duas populações que se supõem sejam independentes. O propósito é eliminar fatores

9
O teste de hipótese para diferenças entre pares é definido:
d  d
t
sd
em que, d é a diferença entre os pares e s d  s d n é o erro padrão da diferença. Aceitar H0 significa
admitir que a variável tem distribuição t de Student, com n - 1 graus de liberdade.
que possam acusar diferenças estranhas (ao experimento, à pesquisa) na comparação de duas séries
de dados dispostas em pares homogêneos (p. ex., por sexo, por idade, por origem, por estado etc.)
apenas evidenciado a causa de variação, em lugar de fazer a análise com os dados individuais.

Exemplo 5
Numa amostra de 14 pessoas foi registrada a concentração de colesterol antes e depois de
um programa de exercícios e dietas (...) com os resultados apresentados na Tabela 10.

Tabela 10 Concentrações de colesterol em soro de 14 pessoas (homens, adultos...) submetidos a


um programa de exercícios e dietas (...)
COLESTROL EM SORO
PESSOA DIFERENÇA
ANTES (X1) DEPOIS (X2)
1 201 200 -1
2 231 236 5
3 221 216 -5
4 260 233 - 27
5 228 224 -4
6 237 216 - 21
7 326 296 - 30
8 235 199 36
9 240 207 - 33
10 267 247 - 20
11 284 210 - 74
12 201 209 8
13 231 230 1
14 218 205 13
Média x d - 10,86

Variância s 2d 690,90

Com esses dados se pode concluir que o programa de exercício e dietas é eficiente (para
o cliente)?

 (d  d ) 2 n 11 d i2  (i 1 d i ) 2
n n n
i
s 2
 
d
n 1 n (n  1)
Em termos de hipótese se pode inferir que o programa oferece suficiente evidência se
for possível rejeitar a H0; esta mostra que a mudança na concentração é zero ou positiva,
portanto, especificada como:

H0: d  0
Com a hipótese alternativa:

HA: d < 0
A regra de decisão para  = 5% e 13 graus de liberdade tem como referência o valor
crítico de t = 1,7709 (teste unilateral). Portanto, rejeita-se H0 se o valor calculado de t
for menor que o valor crítico (Figura 28).

-0,41

=5%

-1,77 Região de aceitação t

Figura 28 Região de aceitação e região de rejeição


unilateral inferir (direita) do teste.

A estimativa do teste de t é:
 10,86  0
t   0,41
690,90
A decisão estatística é de aceitar a H0 uma vez que o valor estimado de t se encontra na
região de aceitação. Isto significa que o programa, com seus exercícios e dietas, não
tem efeito significativo, ao nível de 95% de confiança, na redução da concentração de
colesterol.

Em muitos trabalhos científicos experimentais é de interesse:


a) as frequências observadas em determinada variável nominal em relação às frequências
esperadas; ou
b) quando se quer determinar se o nível de proximidade (aderência) de uma distribuição teórica
como a normal, binomial etc., se ajusta à distribuição obtida por meio dos dados amostrais;
neste caso, o objetivo é testar a hipótese de que as observações amostrais seguem determinada
distribuição, discreta ou contínua, com os sem parâmetros conhecidos;
c) em alguns experimentos a análise de variância não é apropriado ou apresenta restrições
Em todos essesa casos o pesquisador utiliza o teste e análise do Qui-quadrado ( 2 ).
Trata-se de um teste não-paramétrico muito eficiente para avaliar a associação entre variáveis
qualitativas tendo como princípio básico comparar as divergências entre as frequências observadas
e as esperadas ou para avaliar a aderência de distribuições.
Em geral, pode-se dizer que dois grupos se comportam de forma semelhante se as diferenças
entre as frequências observadas (Oi) (portanto, obtidas diretamente dos dados) e as frequências
esperadas (Ei) (aquelas calculadas a partir dos dados) em cada categoria forem muito próximas.
Com frequência, o pesquisador, ao utilizar este teste, estará trabalhando com duas hipóteses:
H0: não há associação entre os grupos.
HA: há associação entre os grupos.
Para ilustrar a aplicação e interpretação de resultados do teste 2 10 se apresentam os exemplos
6 a 10, numa sequência de passos.

Exemplo 6
Um pesquisador deseja verificar se há aassociação entre três grupos (A, p. ex. classe
alta; B, classe média e C, classe pobre) de jovens (...) com relação ao uso de drogas.
Para tal proposito entrevistou 160 pessoas, sendo 41 do grupo A, 44 do grupo B e 75

10
O teste qui-quadrado é definido pela seguinte expressão:
(O i  E i ) 2
 2  i 1
n

Ei
do grupo C, admitindo-se apenas duas respostas: sim (é dependente) ou não (não é
dependente do uso de drogas).
Os resultados dessa entrevista são apresentados na Tabela 11. Na pesquisa há um
número diferente de entrevistados nos três grupos sociais, bem como proporções
diferentes dos dependêntes e não-dependentes do uso de droga.
Os dados são do tipo categórico pois, cada jovem entrevistado é classificado em apenas
uma categoria.
Neste exemplo, pode-se usar o teste do 2 com duas hipóteses:
H0: não há associação entre o nível social representado por esses três grupos e a
dependência do uso de droga.
HA: há associação entre o nivel social e a dependência do uso de droga.

Tabela 11 Resultados da entrevista de três gupos sociais com relação a dependência do


uso de drogas (...)
GRUPO A GRUPO B GRUPO C TOTAL
SIM 18 16 20 54
NÃO 23 28 55 106
TOTAL 41 44 75 160

O processo de decisão está baseado no estimativa do valor do teste: se o 2 for maior


ou igual ao 2 crítico deve ser rejeitada a H0.
Para estimar 2 se recomendam os passos a seguir:
a) Calcular as freqüências esperadas (Ei) anotadas nas correspondentes células da
tabela, conforme se ilustra em Tabela 12.

Tabela 12 Resultados da entrevista de três gupos sociais com relação a dependência do uso de
drogas.
GRUPO A GRUPO B GRUPO C TOTAL
Oi 18 16 20
SIM 54
Ei 13,84 14,85 25,31
Oi 23 28 55
NÃO 106
Ei 27,16 29,15 49,69
TOTAL 41 44 75 160
A estimativa da freqüência esperada (Ei) de cada célula é o resultado da multiplicação
do total de sua coluna (Tc) pelo total de sua linha (Tl), dividido pelo total geral (N).
b) Calcular a estaística do 2 conforme se indica a seguir (ver nota de rodapé 10; a
fórmula para este cálculo):

2 = [(18–13,84)2/13,84]+[(16–14,85)2/14,85] . . . + [(55 – 49,69)2 / 49,69]


= 3,70

c) Determinar os graus de liberdade (n’). Em geral, estes se obtém multiplicando-se o


número de linhas menos um pelo número de colunas menos um da tabela. No exemplo
esse número é: n’ = (3 – 1) x (2 – 1) = 2.
d) Compara-se o valor estimado de 2 (3,70) com o 2 crítico considerando os graus de
liberdade (n’) e o nível de significância pré-escolhido ( = 5%). Este valor, no corpo
da tebela do 2, é 5,99. 11

11
Ilustração da distribuição e síntese da Tabela do2:

P(2 n’,   a) = 1 -  
n 2 2
2 2 2
’ 0,90 0,95
0,975
0,99
0,995
1 2,706 3,841 5,024 6,635 7,879
2 4,605 5,991 7,378 9,210 10,597
3 6,241 7,815 9,348 11,345 12,838
4 7,779 9,488 11,143 13,277 14,860
5 9,236 11,070 12,832 15,086 16,750
6 10,645 12,592 14,449 16,812 18,549
7 12,017 14,067 16,013 18,475 20,278
8 13,362 15,507 17,535 20,090 21,955
9 14,684 16,919 19,023 21,666 23,589
10 15,987 18,307 20,483 23,209 25,188
... ... ... ... ... ...
20 28,412 31,410 34,170 37,566 39,997
... ... ... ... ...
40 51,805 55,758 59,342 63,691 66,766
O valor estimado do 2 está na aréa de acietação, portanto não se rejeita a H0,
concluindo-se que nas populações representadas pelos grupos estudados não há
associação entre o nível social e a dependência do uso de droga.
Deve-se observar que caso 20% ou mais das células apresentem freqüências esperadas
menores que 5 ou se tenha uma ou mais freqüências esperadas com valores menores ou
igual a um (1), não se dve usar o teste do 2.
Uma possível solução é o agrupamento de linhas e colunas, desde que tal processo tenha
sentido.
A parte que segue ilustra a aplicação do teste do 2 para algumas situações especiais
como tabelas 2 x 2, n x 2 e m x n, em que o procedimento é simplificado.
Quando os dados são apresentados em tabelas de duas linhas por duas colunas podem
ser utilizadas fórmulas simplificadas em que apenas se requerem das freqüências
observadas.
Neste caso há duas possibilidades: quando N > 40 e para 20  N  40. 12
Exemplo 7
A tabela de contingência que segue (Tabela 13) sintetiza os dados de experimento
com (...).

Tabela 13 Proporção de (...) acometidas pela doença (...).


Grupo A Grupo B Toatal
7 8 15
Sadio
(a) (b) (T1)

12
Para facilitar o entendimento das fórmulas do 2 se apresenta o quadro com os seguintes símbolos:
Grupo A Grupo B Total
Grupo C a b T1
Grupo D C D T2
Total T3 T4 N

2 (ad  bc)2 N
χN 40  T 1.T 2.T 3.T 4

[| a.d  b.c |  N ]
χ220N 40  2
T 1.T 2.T 3.T 4
6 10 16
Doente
(c) (d) (T2)
13 18 31
Total
(T3) (T4) (N)

As hipóteses são:
H0: a proporção de animais (...) acometidospela doença (...) é igual entre entre os dois
grupos;
HA: essa proporção é diferente.
A estimativa do teste de 2, de acordo com a fórmula indicada na npota de rodapé 11,
é

[ | (7 x10) (8 x 6) |  31 ]2 x 31
2
χ  2  0,023
15 x16 x13 x18

Na tabela do 2 (ver nota de rodapé 12), para 1 grau de liberdade e 5% de nível de


significância se tem o valor crítico 3,841. Sendo o valor estimado menor que o valor de
referência.
Nas tabelas de contingência 2 x 2, quando n é menorr que 20, as fórmulas indicadas na nota de
rodapé 12 não podem ser usadas. Outros testes como o de fisher poderão ser usados.

Exemplo 8
O lançamento de um dado 1000 vezes gerou a seguinte tabela de freqüência (Tabela
11). Deseja-se saber se o dado utilizado nesse experimento é um “dado perfeito”, isto
é, cada lado tem a mesma probabilidade de ocorrência.
As hipóteses são:
H0: P (x = i) = 1 6 , para i = 1, 2... 6.

HA: P (x = i)  1 6 , para i = 1, 2... 6.

Tabela 11 Resultado do lançamento 1000 vezes de um dado


Xi Oi
1 176
2 174
3 168
4 171
5 151
6 160
Total 1000

Para o caso de H0 ser aceita a probabilidade de cada valor ou classe é representada por
pi e o valor esperado para o número da observação em cada classe é Ei = n pi (n é o
tamanho da amostra, neste exemplo, 1000). Com estas informações se elabora a Tabela
12:
Tabela 12 Resultado do lançamento de um dado 1000 vezes e valores esperados.
Xi Oi pi Ei=npi
1 176 1 166,67
6

2 174 1 166,67
6

3 168 1 166,67
6

4 171 1 166,67
6

5 151 1 166,67
6

6 160 1 166,67
6

Total 1000 1 1000,02

Em geral os valores das colunas 2a (Oi) e 4a. (Ei), mesmo quando se aceita H0 não serão
os mesmos. É necessário medir o afastamento entre essas duas colunas e saber até que
ponto é razoável para se aceitar H0.
Isto significa que Xi  2k--1, em que k é o número de classes (neste caso 6) e  é o
número de parâmetros estimados (no exemplo 0).
A região de rejeição é definida para 2 > a, em que a é dado por: P(2 > a) = .
Deve-se rejeitar H0 se o valor observado de 2 for muito alto, dentro da região crítica.
A Tabela 13 sintetiza as operações para estimar o 2

Tabela 13 Resultado do lançamento de um dado 1000 vezes, valores esperados e teste de 2.
Xi Oi pi Ei=npi (Oi-Ei)2/Ei
1 176 1
6
166,67 0,416
2 174 1
6
166,67 0,322
3 168 1 166,67 0,011
6

4 171 1 166,67 0,112


6

5 151 1 166,67 1,473


6

6 160 1 166,67 0,267


6

Total 1000 1 1000,02 2,601

O valor calculado de 2 é 2,601.


Ao fixar o nível de significância de 5% ( = 0,05), com k -  - 1 graus de liberdade de
5, obtém-se, da correspondente tabela de 2, 13 o valor a = 11,07.
Uma vez que 2,60 é menor que 11,07, conclui-se por não rejeitar a H0, considerando o
“dado perfeito” no experimento de lançamento.

Exemplo 7

P(2 n’=5 e 5%  11,07) = 95%

n’ 2 0,90 2 0,95 2 0,975 2 0,99 2 0,995

3 6,241 7,815 9,348 11,345 12,838


4 7,779 9,488 11,143 13,277 14,860
5 9,236 11,070 12,832 15,086 16,750
6 10,645 12,592 14,449 16,812 18,549
7 12,017 14,067 16,013 18,475 20,278
8 13,362 15,507 17,535 20,090 21,955
9 14,684 16,919 19,023 21,666 23,589
10 15,987 18,307 20,483 23,209 25,188
... ... ... ... ... ...
20 28,412 31,410 34,170 37,566 39,997
... ... ... ... ...
13
Pela experiência se sabe que o número de defeitos por circuito, num sistema, segue a
distribuição de Poisson. De uma amostra escolhida de maneira aleatória de 82 circuitos
se obtiveram os seguintes resultados (Tabela 14)

Tabela 14 Número de defeitos na inspeção de 82 circuitos


Número de Defeitos (Xi) Oi
0 42
1 21
2 12
3 7
Total 82

As hipóteses são:

H0: X  Poisson ()

HA: outra distribuição


O parâmetro da distribuição de Poisson () não é conhecido, mas, pode ser estimado
com base nos dados registrado na inspeção dos circuitos:
42x 0  21x1  12x 2  7 x3
ˆ  x   0,805
82
onde:

P(x = 0) = [e-0,805 0,8050] / 0! = 0,447

P(x = 1) = [e-0,805 0,8051] / 1! = 0,360

P(x = 2) = [e-0,805 0,8052] / 2! =0,144

P(x  0) = 1 - [P(x = 0)+ P(x = 1)+ P(x = 2)]= 0,048


Outro aspecto importante que deve ser tratado quando se definem os testes de hipótese é o
relativo ao nível de significância (), um valor pré-estabelecido conforme seja o problema, os
objetivos da pesquisa e as informações disponíveis para realizá-la, entre outros fatores.
Em alguns casos, frequentes em estudos sociais, não é possível especificar certas condições
sobre os parâmetros da população da qual foi obtida a amostra para o propósito da investigação.
Nestes, os testes que se aplicam nas hipóteses são definidos na estatística não-paramétrica em
que, p. ex., dispensa-se a exigência da normalidade na distribuição dos dados, têm-se
probabilidades mais exatas nas afirmativas ou inferências da análise de dados, aplicam-se em
variáveis com valores (escalas) quantitativos e são, em geral, de mais fácil aplicação. As
considerações desta parte são omitidas neste documento.

2.3.2.6.9 Comparações de médias


O documento técnico-científico deve conter a especificação de procedimentos, técnicas e
métodos que utilizará na análise de dados a serem obtidos no planejamento experimental, se for o
caso, ou de observações e registros dos atributos a obter por outros meios (projeto de pesquisa).
Um tratamento inicial desses dados poderá ser a análise de variância. Para este propósito, a estimativa
do valor do teste é a estatística Fˆn2 , comparada com uma referência teórica Fn2 ( ) , para determinado
n1 n1

nível de significância () e graus de liberdade do numerador (n’1) e denominador (n’2), aceitando-
se a hipótese nula: não há diferença entre as médias, quando F̂ for inferior a F .
O documento deve trazer a informação necessária das implicações de aceitar a hipótese de
nulidade.
Se o valor da estimativa do teste for maior que o da tabela de referência, ao nível de significância
estabelecido (), existe evidência contra (rejeição) a hipótese de nulidade.
O pesquisador deve indicar quais são as médias que apresentarão diferenças, utilizando testes
específicos.

Entre os testes de hipóteses que, conforme seja a natureza do problema de pesquisa, poderão ser
utilizados na pesquisa, têm-se:
a) Antes de fazer o teste, o pesquisador estabelece qual é o nível de significância.
b) Teste de Tukey baseado na amplitude total estudentizada.
Esta classe de teste deve ser utilizada na pesquisa quando se pretende fazer comparações
múltiplas de todo e qualquer contraste entre duas médias.
Deve ser utilizado quando o número de observações for o mesmo em todos os “tratamentos”
ou estimativas de médias.
c) Teste de Duncan, baseado na amplitude múltipla.
Este teste se aplica quando se requer fazer comparações múltiplas com amostras e número de
tratamentos consideráveis (p. ex., maior que 6) e em que o teste de análise de variância não é
significativo, em termos estatísticos.
d) Comparações ortogonais. Semelhante ao teste de comparações independentes, porém com
comparações planejadas e com uma forma especial de aplicação da análise de variância.
e) Tabela de contingência utilizada quando é prevista no projeto a coleta simultânea de duas
(ou mais variáveis) variáveis e se deseja testar a hipótese que as frequências de ocorrências
nas várias categorias de uma variável são independentes das frequências na segunda (outra)
variável.
Os exemplos que seguem ilustram o conceito de hipótese, a técnica de teste e aspectos gerais
de interpretação com as técnicas auxiliares na tomada de discussão.
Apresentam-se vários casos ilustrativos de como obter inferências acerca dos parâmetros da
população mediante o exame das estimativas amostrais desses parâmetros.

Exemplo 1
De um experimento foram registrados os seguintes valores de mudança de peso (kg):
xi: -1,8, -1,8, -1,4, -0,4, -1,2, -0,9, 0,2, 0,7, 0,9, 1,7;
n = 10;  = 10.
As hipóteses são:
H0:  = 0 kg; ( é o parâmetro)
HA:  0 kg.
Solução:
10

x
i 1
i
n = - 0,40
10
s   ( xi  x ) 2 /( n  1)
2

i 1

s = 1,22

= sx  1,22 0,39
10
n´= n – 1 = 10 – 1 = 9

A referência para decidir é a tabela t (Student); para 9 graus de liberdade ( n´ ) e o nível


de significância de 10%corresponde o valor de 1,83. Sendo a estimativa de t (1,026)
inferior à referência (t=0,1; n´=9) = 1,83 não há evidências para rejeitar a hipótese nula.
Portanto, essa estimativa poderá conter o zero, o que se demonstra quando se calcula o
intervalo de confiança para a estimativa desse parâmetro.
O Intervalo de confiança (IC) é dado pela seguinte expressão:

IC  x  t n´, s x
- 0,401,83 (0,39) = -0,400,714
Linf.= -1,114 (limite inferior)
Lsup.=0,314 (limite superior)

Exemplo 2
Um comerciante deseja decidir se deve aceitar ou não um determinado produto. Está
disposto a aceitá-lo se pelos menos 80% deles satisfazem certas características do
“controle de qualidade” que se aplica ao mesmo.
Para tomar tal decisão com base em critérios científicos, extrai uma amostra de 10
exemplares que são submetidos ao teste (medições) e sobre tais resultados decide. Esse
processo pode ser visto como um experimento binomial com n = 10 provas
independentes, em que determinado exemplar selecionado ao acaso e que compõem o
lote da amostra satisfaz ou não as especificações desejadas.
A hipótese nula a ser testada, neste cenário, é:

H0: p = 0,80
A regra de decisão é aceitar H0, desde que o número de exemplares aceitáveis pelo
controle da qualidade seja pelo menos 7. Neste caso, qual é a probabilidade de rejeitar
H0 quando for verdadeira? Qual é, qual é a probabilidade ( p ) de cometer um erro do
tipo I ou a probabilidade de que x seja menor do que 7, dado que p = 0,8 numa amostra
de 10 elementos.
Em termos simbólicos o problema pode ser sintetizado como segue:

p(x < 7| p = 0,80; n = 10) = 0,1209


= p (x > 3 |p = 0,20)

Isto é, se 80% dos itens são aceitáveis, a probabilidade de se obter menos de 7 da


amostra satisfazerem às especificações é de 12,09% (0,1209).
O comerciante poderia reduzir a probabilidade de cometer um erro tipo I ao aceitar seis
itens sem defeitos, com a seguinte regra de decisão:

Aceitar H0 se x  6 itens sem defeitos


Rejeitar H0 se x < 6

Neste caso, a probabilidade de um erro do tipo I para o novo critério de decisão, é dada pela
expressão:

p(x<6|p = 0,80; n = 10) = 0,0328 = p(x>4|p = 0,20)

Exemplo 3
Uma pesquisa deve considerar certa população, com 85% de famílias. Selecionar uma
amostra de 12 famílias para fazer uma entrevista por telefono, com três possibilidades:
a) encontrar a alguém em caso de entre 7 famílias selecionadas;
b) encontrar a alguém em casa de entre 5 famílias ou menos selecionadas;
c) encontrar a alguém em caso de 8 ou mais famílias selecionadas para o estudo.
Solução:
Se em 15% das famílias não se encontra a ninguém em casa, qual é a probabilidade de
que a entrevista não obtenha resposta em cinco de 12 chamadas? Em termos simbólicos
e para o primeiro caso, o problema se reduz a:

p(x = 5| p = 0,15; n = 12) =

p(x  5) - p(x  4)

= 0,9954 – 0,9761 = 0.0193


No segundo caso, o problema é dado por:

p(x  5|p = 0,85; n = 12) =

p(x  12 – 5|p = 0,15; n = 12)

= p(x  7|p = 0,15; n = 12)

= 1 - p(x  6|p = 0,15; n = 12)

1 – 0,9993 = 0,0007

No terceiro e último caso, o problema é:

p(x  8|p = 0,85; n = 12) =


p(x  4|p = 0,15; n = 12)
= 0,9761

Exemplo 4
Hipótese para duas amostras com o critério bi-caudal. Os pesos registrados em dois processos
produtivos. O interesse da pesquisa é verificar se há diferenças entre os dois processos,
definidos pelas seguintes séries de dados:

xi: 41, 34, 36, 40, 25, 31, 37, 34, 30, 38

n = 11; n´ = 10.
yi: 52, 57, 62, 55, 64, 57, 56, 55;

n = 8; n´ = 7.

A hipótese é formulada nos seguintes termos:

H0: x - y = 0 ou x = y

HA: x  y

As estimativas das médias são:

mx = 34,45
my = 57,25

mx  m y
t
s x y

t  34,45  57,25  11,40
2

A referência, na tabela t, para n´x + n´y graus de liverdade (17) e o nível de significância
de 5% () é 2,11; portanto, rejeita-se H0.

Exemplo 4
Ilustra e a aplicação de outro teste estatístico, com novos conceitos da inferência. Trata-se
da estatística de Tukey. A técnica consiste em situar as médias em ordem decrescente e
calcular todas as diferenças, conforme se ilustra com o exemplo da Tabela 10.

Tabela 10 Disposição dos dados ordenados para estimar as diferenças entre medias pelo teste de
Tukey.

TRAT.
MÉDIA
x A  xi xC  x j xD  xB
(n=10)
A 3,71 0,07 NS 0,23* 0,27*
C 3,67 0,27* 0,50*
D 3,44 0,54*
W=0,13
B 3,17
NS = diferença que não é significativa ao nível . * é significativa.
Na Tabela de referência do teste de Tukey para o nível de significância de 5%, p. ex., e
4 tratamentos e 36 graus de liberdade do resíduo (n-1=9; 9 x 4 = 36), encontra-se o
valor 3,79 (q) que será utilizado na seguinte fórmula do teste Tukey:

= W  q ( tratamentos ,n ) s x 3,79

0,18 = 0,134
10

em que s x é o erro padrão da média dos tratamentos;


O critério de decisão é: se a diferença (Di) entre médias for maior ou igual a W, então
se deve considerar significativa ao nível . Em caso contrário, não há diferenças ou as
médias são iguais. No caso ilustrado, essas diferenças são apresentadas na Tabela 2.4.
Para a apresentação dos resultados, além da síntese da Tabela 2.4, o pesquisador
poderá classificar e agrupar as médias como segue:

Tratamento A C D B
Médias 3,71 3,67 3,44 3,17
Relativo 117,03 115,77 108,52 100,00

Mostrando que as médias de respostas aos tratamentos A (17,03%) e C (15,77% maior


que a média do tratamento B) são, estatisticamente iguais, enquanto que diferem das
médias D e B.

A amostra está composta (n) por 10 elementos, o teste é o de Student ( t ) para uma
hipótese bicaudal, concernente à média aritmética, com os seguintes dados de variação de
peso registrados num experimento da pesquisa:

H0:  = 0 (hipótese nula);

HA:   0 (hipótese alternativa; tabela de t bicaudal);

n = 10 (tamanho da amostra; graus de liberdade: 9);


 = 0,05 (nível de significância; na tabela unicaudal o valor da tabela é t0,975);

x = 0,40 (estimativa da média).


s = 1,18 (estimativa do desvio-padrão).

s x  1,18 
10 0,37 (estimativa do erro da média).
A estimativa de t, dada pela seguinte expressão, é:

t  x  0,40  1,08 (Estimativa de t)


sx 0,37

Para n – 1 = 9 graus de liberdade e com 5% de significância se observa na tabela de t


14 o valor 2,26. Logo, sendo a estimativa menor que o valor de referência dado por essa

tabela, aceita-se a hipótese nula (H0), admitindo-se que a média é zero. Se a estimativa
da média é zero não faz sentido calcular um intervalo para essa medida. Contudo, se
for feito esse cálculo, a média estará num intervalo em torno de zero, conforme se
constata a seguir:
O intervalo de confiança ( IC ) para a estimativa da média é dados pela seguinte
expressão:

14
A ilustração que segue apresenta uma síntese da tabela de valores unicaudais dos percentis da distribuição t de Student
n´ = GL t80 t90 t95 t99
2 1,061 1,886 2,920 6,965
4 0,914 1,533 2,132 3,747
6 0,906 1,440 1,943 3,143
8 0,889 1,397 1,859 2,896
10 0,879 1,372 1,812 2,764
15 0,866 1,341 1,753 2,602
20 0,860 1,325 1,724 2,528
30 0,854 1,310 1,697 2,457
40 0,854 1,303 1,684 2,423
50 0,849 1,290 1,676 2,403
100 0,845 1,290 1,660 2,364
 0,842 1,282 1,655 2,326
IC  x  t ( 2) s x
Esta expressão define dois limites: um limite inferior ( LI ) e outro superior ( LS ) para
determinado nível de significância, com os seguintes valores:

IC = 0,40  2,26 x 0,37 =

0,40  0,84

LI = - 0,44 (limite inferior)

LS = 1,24 (limite superior), isto é:


IC = (- 0, 44 < 0,40 < 0,84)
Em determinadas pesquisas o interesse pode ser direcionado de maneira diferente,
conforme se indica pelas hipóteses seguintes:

H0:   0 (hipótese nula; a média não é negativa)

HA:   0 (hipótese alternativa; a média é negativa)

Os dados, para este segundo exemplo, são de uma amostra de ganho de peso, com as
seguintes estimativas:

n = 12; x = 0,78; s = 0,56

s x  0,56
12 = 0,16

t  x  0,78
sx 0,16 = 4,87**

t 0,05(1), 11 = 1,79

Para este resultado do teste se rejeita a hipótese nula, sendo o intervalo definido por:

LI = 0,50
LS = 1,06