Vous êtes sur la page 1sur 40

Teste t e Teste f

Estatstica Computacional
Prof. Karine Sato da Silva

Introduo
comum o interesse em comparar dois ou mais

tratamentos, como por exemplo, dois sistemas


computacionais para informatizao de um processo,
trs tipos de cimento-e-cola para fixar azulejos.
Para realizar as comparaes, podemos planejar

experimentos com amostras submetidas a cada


tratamento.

Introduo (2)
Na comparao dos tratamentos, natural o interesse

em verificar se h evidncia de diferenas entre os


efeitos dos tratamentos, o que pode ser feito atravs de
testes estatsticos.
Testes paramtricos se caracterizam por suporem

certa distribuio de probabilidades para a varivel


resposta.
Em consequncia, a comparao entre os efeitos dos

tratamentos pode ser feita em termos dos parmetros da


distribuio de probabilidades suposta.

O que ser estudado


Vamos nos restringir comparao de parmetros de

distribuies normais, com nfase em testes de


mdias.

Amostras independentes e em blocos


Projeto de experimento completamente aleatorizado.
Muitas vezes o experimento pode ser conduzido
dividindo-se aleatoriamente as unidades experimentais
em g grupos, sendo cada grupo submetido a um
tratamento. Como resultado, temos g amostras
independentes.
Projeto de experimento em blocos aleatorizados.
Podemos construir h blocos de unidades experimentais
relativamente similares. Se em cada bloco temos g
unidades experimentais, alocamos, por sorteio, todos os
g tratamentos em cada bloco. No caso de g = 2, o
resultado da aplicao desse projeto, leva a dados
pareados.

Exemplo 1
Considere o problema de comparar dois materiais (A e

B), para sola de tnis, em termos do grau de desgaste


aps certo perodo de uso. Seguem dois projetos de
experimentos alternativos:
Projeto I;
Projeto II.

Projeto I
Um grupo de indivduos usa tnis com solas feitas com

o material A; e outro grupo usa tnis com solas feitas


com o material B, conforme ilustra a figura.

Projeto II
Fabricam-se, para realizao do experimento, pares de

tnis com os dois tipos de sola, isto , um dos ps com


o material A e o outro p com o material B. Em cada
par, o material usado em cada p (direito ou esquerdo)
decidido por sorteio.

Anlise dos resultados


Para a anlise dos resultados:

Ao olharmos os dados de forma pareada, temos mais

informao sobre uma possvel diferena entre os dois


materiais.
Observando as amostras de forma independente, as

diferenas entre os dois materiais ficaram ofuscadas


pelas diferenas entre os indivduos.

Em resumo, para o particular problema, o Projeto II

destaca melhor uma possvel diferena entre os


materiais.
Em geral, quando possvel formar blocos de unidades

relativamente similares,
experimento melhor.

temos

um

projeto

de

Teste t para duas amostras pareadas


O chamado teste t apropriado para comparar dois

conjuntos de dados quantitativos, em termos de seus


valores mdios. Mais especificamente:
Ho: 1 = 2 e H1: 1 2
Onde: 1 o valor esperado da resposta sob o tratamento

1, e 2 o valor esperado da resposta sob o tratamento 2.


Na abordagem unilateral, a hiptese alternativa do
tipo:

H1: 1 > 2 ou H1: 1 < 2

Exemplo 2
Seja o problema de verificar se um novo algoritmo de

busca em um banco de dados mais rpido que o


algoritmo atualmente usado. Para fazer a comparao
de dois algoritmos, planeja-se realizar uma amostra
aleatria de dez buscas experimentais (ensaios). Em
cada ensaio, uma dada busca realizada pelos dois
algoritmos e o tempo de resposta de cada algoritmo
anotado.
Observamos que em cada ensaio os dois algoritmos so
usados em condies idnticas, caracterizando dez
pares de observaes.

Continuao - Exemplo 2
As hipteses podem ser formuladas da seguinte

maneira:
H0: em mdia, os dois algoritmos so igualmente

rpidos, e
H1: em mdia, o algoritmo novo mais rpido do que o
algoritmo em uso.

Ou:
Ho: 1 = 2
H1: 1 < 2

1: o tempo esperado de resposta do algoritmo novo


2: o tempo esperado de resposta do algoritmo atualmente
usado.

Continuao Exemplo 2
Suponha que o experimento tenha sido realizado,

gerando os dados apresentados na tabela abaixo:


Ensaio

Tempo de resposta (s)


Novo X1

Antigo X2

Diferena D = X2 X1

22

25

21

28

28

26

-2

30

36

33

32

-1

33

39

26

28

24

33

31

30

-1

10

22

27

Continuao Exemplo 2
Como os dados so pareados, podemos verificar em

cada ensaio o quanto um tratamento (algoritmo) foi


melhor do que o outro, ou seja, analisar a varivel:
D = X2 X1
Em termos da varivel diferena D, as hipteses so

descritas como:

H0: D = 0
H1: D > 0
Onde D o valor esperado de D.

Continuao Exemplo 2
Assim, dada uma amostra, calculamos a estatstica do

teste por:

Onde:

n o tamanho da amostra (nmero de pares);


sd o desvio padro das diferenas observadas;
a mdia das diferenas observadas;

Supondo que os valores de D provenham de distribuio

aproximadamente normal, o teste pode ser realizado com a


distribuio t de Student com gl = n - 1 graus de liberdade.
Valores de D:
3; 7; -2; 6; -1; 6; 2; 9; -1; 5

Donde:
n = 10;

= 3,4; e
sd = 3,81.

E portanto:

Como n = 10, temos gl = 9 graus de liberdade.

Utilizando a tabela, obtemos a rea associada a um


valor maior ou igual a t = 2,82. Como o teste
unilateral, essa rea corresponde ao valor p.

Concluso do Exemplo 2
Observando a linha correspondente a gl = 9,

verificamos, na tabela, que o valor t = 2,82 est


prximo do valor tabulado 2,821. Logo, temos p
0,010.
Considerando o nvel de significncia de 5%, o teste

leva a concluso de que os dados mostram evidncia


suficiente de que H0 falsa (pois p < = 0,05),
detectando, ento, que o algoritmo novo , em mdia,
mais rpido do que o algoritmo atualmente em uso.

Teste t para duas amostras independentes


Tambm temos o teste t quando as amostras so

independentes.
EXEMPLO 3: Desejamos verificar se os catalisadores A
e B tm efeitos diferentes no rendimento de certa
reao qumica. As hipteses so:
H0: em mdia, os dois catalisadores so iguais em

termos de rendimento; e
H1: em mdia, os dois catalisadores so diferentes em
termos de rendimento.

Continuao Exemplo 3
Ou ainda:
Ho: 1 = 2 e H1: 1 2
1: rendimento esperado com o catalisador A;
2: rendimento esperado com o catalisador B.
Para testar essas hipteses, realizamos dez ensaios com

cada catalisador, em ordem aleatria.


A

aleatorizao dos grupos fundamental para


resguardar a validade de um teste de significncia.

Continuao Exemplo 3

Continuao Exemplo 3
A anlise descritiva das amostras sugere que o

catalisador A melhor, mas precisamos fazer um teste


estatstico apropriado para verificar se essa diferena
no pode ser explicada por mero acaso do particular
experimento realizado.
Estatstica do teste para amostras de tamanhos iguais
Estatstica

diferentes

do teste para amostras de tamanhos

Amostras de tamanhos iguais


Dadas as duas amostras, a estatstica do teste toma

como base a diferena entre as mdias,


, mas leva
tambm em considerao o nmero de elementos em
cada amostra e variabilidade interna das amostras.
Quanto maior as amostras, maior a evidncia de uma

possvel diferena real. Por outro lado, se h muita


variabilidade entre os elementos de cada amostra,
diferenas reais podem ficar nebulosas.

Considerando o mesmo nmero de elementos, n, em

cada amostra, a chamada varincia agregada obtida


pela mdia aritmtica das varincias de grupo, ou seja:

E a estatstica do teste calculada por:

Onde:
n: tamanho da amostra em cada grupo;
x1: mdia da amostra 1;
x2: mdia da amostra 2;
s12 : varincia da amostra 1;
s22: varincia da amostra 2;
sa2: varincia agregada das duas amostras

Amostras de tamanhos diferentes


No caso de amostras terem tamanhos diferentes (n1

n2), os clculos devem ser feitos por:

Suposies bsica para a aplicao do teste:


As observaes devem ser independentes;
2. As varincias populacionais devem ser iguais nos
dois grupos;
3. Os dois conjuntos de dados devem provir de
distribuies normais.
1.

suposio (1) refere-se ao planejamento do


experimento, enquanto as suposies (2) e (3)
varivel e s populaes em estudo.

Distribuio de referncia
Se as suposies bsicas puderem ser admitidas, ento

usaremos a distribuio t de Student, com:


gl = n1 + n2 2 graus de liberdade, para a realizao do

teste.

Continuao Exemplo 3

Continuao Exemplo 3
O esquema seguinte ilustra como obter o valor p

associado ao t calculado.

Concluso Exemplo 3
Os dados observados levaram ao valor t = 1,86,

apontando para uma rea na cauda superior da curva


entre 0,025 e 0,05. Mas, como o teste bilateral, (H1: 1
2), a rea deve ser dobrada para se ter o valor p
correto.

Portanto, 0,05 < p < 0,10, o que leva a aceitao de H0

ao nvel de significncia de 5%.

Teste f para duas varincias


Suponha que queremos comparar se duas populaes,

supostamente com distribuies normais, tm a


mesma varincia. Formulamos as hipteses por:

A hiptese alternativa tambm pode ser unilateral.


Com as amostras da populao 1 e da populao 2, a

estatstica do teste calculada por:

A distribuio de referncia para este teste chamada

distribuio F com gl = n1 1 no numerador e gl = n2 1


no denominador.
Assim, estabelecido o nvel de significncia ,

podemos obter o valor fc, que deixa rea igual a /2 na


cauda superior da distribuio (teste bilateral) ou, no
caso de teste unilateral, rea igual a .

A regra de deciso dada por:


Se f < fc ento aceita H0
Se f > fc ento rejeita H0

Exemplo (mesmo experimento do exemplo 3)


Verificamos que no h evidncias de que os

catalisadores A e B tenham efeitos mdios diferentes


no rendimento de certa reao qumica. Vamos
verificar, agora, se eles produzem efeitos diferentes nas
varincias. As hipteses podem ser:
H0: as varincias do rendimento so iguais para os dois

catalisadores; e
H1: as varincias do rendimento so diferentes para os
dois catalisadores.

Continuao - Exemplo
Dados os resultados no experimento:

Concluso - Exemplo
Para obter o valor crtico fc, ao nvel de significncia de

5%, devemos obter rea igual a 2,5% na cauda superior


da distribuio F com gl = 9 no numerador e gl = 9 no
denominador, o que acarreta fc = 4,03.
Como f < fc, o teste aceita Ho.

Vous aimerez peut-être aussi