Vous êtes sur la page 1sur 26

SRIE: Estatstica Bsica

Texto 3: ESTIMAO

SUMRIO
1. INTRODUO ...........................................................................................................................................................3
2. ESTIMAO POR PONTO.......................................................................................................................................4
2.1. NOTAO ..............................................................................................................................................................4
2.2. PROPRIEDADES DOS ESTIMADORES..........................................................................................................................5
2.2.1. No-tendenciosidade.....................................................................................................................................5
2.2.2. Preciso ou eficincia...................................................................................................................................7
2.2.3. Validade (ou Acurcia) .................................................................................................................................8
2.2.4. Coerncia ou consistncia.............................................................................................................................8
2.3. MTODOS DE ESTIMAO .......................................................................................................................................9
2.3.1. Mtodos dos momentos .................................................................................................................................9
2.3.2. Mtodos da mxima verossimilhana (maximum likelihood) ..........................................................................9
2.3.3. Mtodos dos mnimos quadrados................................................................................................................. 11
3. ESTIMAO POR INTERVALO ........................................................................................................................... 13
3.1. DA MDIA POPULACIONAL (
)............................................................................................................................... 13
3.1.1. Desvio padro populacional () conhecido ................................................................................................. 13
3.1.2. Desvio padro populacional () desconhecido ............................................................................................ 15
3.1.3. A distribuio T (de Student)....................................................................................................................... 15
3.1.4. O intervalo.................................................................................................................................................. 15
3.2. DA PROPORO POPULACIONAL (
) ...................................................................................................................... 17
3.3. DA VARINCIA POPULACIONAL (
2) ...................................................................................................................... 19
3.3.1. Tabelas....................................................................................................................................................... 20
3.3.2. O intervalo.................................................................................................................................................. 20
3.4. DO DESVIO PADRO POPULACIONAL ()................................................................................................................ 20
4. EXERCCIOS ........................................................................................................................................................... 22
5. RESPOSTAS DOS EXERCCIOS............................................................................................................................ 24
6. BIBLIOGRAFIA....................................................................................................................................................... 26

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO
INTRODUO

A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao com base
em valores amostrais. A inferncia pode ser feita estimando os parmetros:
(a) Por ponto e
(b) Por intervalo.
A estimao por ponto feita atravs de um nico valor, enquanto que a estimao por
intervalo fornece um intervalo de valores em torno do valor da estimativa pontual. Na estimao por
ponto o objetivo utilizar a informao amostral e apriorstica para se calcular um valor que seria, em
certo sentido, nossa melhor avaliao quanto ao valor, de fato, do parmetro em questo.
Na estimativa por intervalo, usa-se a mesma informao com o propsito de se produzir um
intervalo que contenha o valor verdadeiro do parmetro com algum nvel de probabilidade.

Exe mplo:
Uma amostra aleatria simples de 400 pessoas de uma cidade extrada e 300 respondem que
acham a administrao municipal boa ou tima. Ento o valor p = 300/400 = 75% uma estimativa
por ponto do percentual de pessoas da cidade que acham a administrao boa ou tima. Esta mesma
estimativa poderia ser enunciado como de: 70% a 80% das pessoas da cidade acham a administrao
boa ou tima. Neste caso, teramos uma estimativa por intervalo da proporo. Note-se que o centro do
intervalo o valor 75% da estimativa pontual.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

11.. E
ESST
TIIM
MA
A

O
O PPO
OR
R PPO
ON
NT
TO
O
O problema da estimao por ponto o de produzir uma estimativa que realmente represente a
melhor avaliao do valor do parmetro. Deve-se especificar em primeiro lugar o que se entende por
"melhor avaliao" e em segundo os estimadores que satisfaam estas especificaes. Como um
estimador uma varivel aleatria cujo valor varia de amostra para amostra, suas propriedades so, de
fato, as propriedades da distribuio amostral.

1.1. NOTAO
Vai-se considerar uma varivel aleatria X (populao) cuja distribuio caracterizada, entre
outras coisas, por um parmetro , que gostaramos de estimar.
Um estimador do parmetro , que obtido atravs de uma frmula dos valores amostrais:
)

X1, X2, ..., Xn, anotado por . As caractersticas bsicas da distribuio de so sua mdia
)
)
)
2
2 2
) = E( ) e sua varincia 2) = Var( ) = E( - ) ) = E( ) .

O desvio padro de , representado por ) = Var() denominado de "erro padro de ".

Figura 1.1 - Relao entre EQM e varincia de um estimador

x x
x x x x
x x E( )
x x x
x
V( )

Alm destes, os seguintes conceitos so de importncia:


)

Erro amostral = - , que a diferena entre o valor do estimador e o verdadeiro valor a


ser estimado . O tamanho do erro amostral varia de amostra para amostra.
)

Vis ou tendenciosidade Vis( ) = E( ) - como sendo a diferena entre a mdia da


)

distribuio amostral de e o valor do parmetro . Este valor , para cada estimador, fixo, podendo
ou no ser zero.
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www.mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO
)

Erro quadrado (quadrtico) mdio EQM( ) = E = () = E( - )2 uma varincia que mede a


disperso do estimador em torno do verdadeiro parmetro, ao invs de em torno de sua mdia.
)

Existe uma relao entre o EQM( ) e a Var( ), conforme, mostrado abaixo:


)

EQM( ) = E( - )2 = E( - E( ) + E( ) - )2 = E{[ - E( )] + [E( ) - ]}2 = E[ - E( )]2


)

+ 2.[E( - E( )][E( ) - ] + E[E( ) - ]2 = E[ - E( )]2 + E[E( ) - ] = E[ - E( )]2 + [E( ) - ]2


)

= Var( ) + Vis( )2, pois


)

2.[E( - E( )][E( ) - ] = 2.[ E( ) - ][E( ) - E( )] = 0.


Desta forma:
)

EQM( ) = Var( ) + Vis( )2, isto , o EQM a soma da varincia do estimador com sua
tendenciosidade elevada ao quadrado.

1.2. PROPRIEDADES DOS ESTIMADORES


As propriedades desejveis para um estimador so: no-tendenciosidade, preciso ou
eficincia, validade ou acurcia e consistncia.
1.2.1. N O - TENDENCIOSIDADE
)

Um estimador dito no-tendencioso (Imparcial, justo, no-viciado, no-viezado,


)

unbiased) de um parmetro se E( ) = .
)

Se E( ) , ento dito "viciado" e E( ) - dito "vis" do estimador (bias of the


estimate).

Exe mplos:
(1) X um estimador no-tendencioso de .

Prova:
X
1
1
1
E( X ) = E = E( X ) = E( X) = = (n.)/n = .

(X X)
um estimador tendencioso de 2.
(2) ) 2 =
2

Prova:
Considere a soma (X X )2 e observe que ela poder ser escrita da seguinte maneira:

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

XX

)2 = ( X + X)2 = ( X )2 + 2 (X )( X) + ( X)2 .

Como - X constante e ( X ) = X n. = n. X n. = n( X ) , segue:

XX

)2 = ( X )2 n. ( X )2 , pois

2 ( X )( X ) = 2( X ).n(X ) = 2 n( X ) e
2

2 X ) + ( X ) = 2 n ( X ) + n ( X ) = n ( X )

Portanto:
E( ) 2 ) = E(

)2

XX
1
1
1
) = E( X X 2 ) = E( (X )2 n. (X )2 ) = { E (X )2 nE (X )2 }
n
n
n
n

1
{ Var( X ) nVar(X )}
n

1
2
{n 2 n }
n
n

1
(n2 - 2} = 2 - 2/n = (n2 - 2)/n =
n

= (n-1)2/n
(3) S2 =

X X
n 1

)2

um estimador no-viciado de 2.

Prova:
XX

E(S ) = E
n1

)2

2
2
1
1

= n 1 E X X = n 1 E X E( X ) + E( X) X =

2
2
1
1
1 2
2
2

2
E ( X E( X)) n X E( X) =
E ( X E( X)) nE X E( X ) =
n n. =

n1
n 1
n 1
n

n. 2 2
(n 1). 2
=
= 2.
n1
n1
2

(4) S =

XX
n 1

um estimador tendencioso de 2, se a amostragem for realizada sem

reposio de uma populao finita.

Prova:
(5) T = n. X , total amostral, um estimador tendencioso de = X, total populacional.

Prova:
E(T) = E(n. X ) = n. E( X ) = n. N. = .
(6) T = N. X um estimador no-tendencioso de = X.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

Prova:
E( T ) = E(N. X ) = N. E( X ) = N. = N. = .
(7) P um estimador no-tendencioso de .

Prova:
0, com probabilidade 1 -
1, com prababilidade

um caso particular de X , onde X =

2
2
(8) ) 2X = S um estimador no-tendencioso de 2X =

Prova:
2

E( ) 2X ) = E( S ) =
n

E(S2)
n

= 2/n.

Se a amostragem for sem reposio de populao finita ento:


2
2
)
S$ N n um estimador no tendencioso de 2 = N n , onde $ 2 = N 1 2
2X =
X
S
S
n N1
n N1
N

A no-tendenciosidade ou ausncia de vis uma qualidade desejvel para os estimadores.


Entretanto, essa qualidade insuficiente como critrio para selecionar um estimador, pois, por
exemplo, toda mdia ponderada dos valores amostrais um estimador no-tendencioso da mdia
populacional.

Prova:
Seja M = i.Xi, onde i = 1, um estimador de . Ento:
E(M) = E(i.Xi) = E(i.Xi) = i.E(Xi) = .i = .
Outra propriedade desejvel para um estimador a da preciso ou eficincia.
1.2.2. P RECISO OU EFICINCIA
A preciso ou eficincia a proximidade das observaes (estimativas) do seu valor esperado.

Definio:
Dados dois estimadores no-tendenciosos )1 e ) 2 de um mesmo parmetro , diremos que )1
mais eficiente que ) 2 se Var( )1 ) < Var( ) 2 ). A eficincia relativa de )1 em relao a ) 2 definida
como sendo V( )1 )/V( ) 2 ).

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

Exe mplo:
Qual dos dois estimadores abaixo mais eficiente para estimar a mdia da populao?
X1 = 0,3X1 + 0,7X2 ou X 2 = 0,2X1 + 0,8X2

Soluo
Como so ambos no-tendenciosos temos:
Var( X1 ) = Var(0,3X1 + 0,7X2) = 0,32Var(X1) + 0,72Var(X2) = (0,09 + 0,49)2 = 0,582.
Var( X 2 ) = Var(0,2X1 + 0,8X2) = 0,22Var(X1) + 0,82Var(X2) = (0,04 + 0,64)2 = 0,682.
Portanto
X1 mais eficiente que X 2

Em igualdade de circunstncias, obvio, que um estimador no-tendencioso prefervel a um


estimador tendencioso. Mas se tivermos que escolher entre um estimador tendencioso, cuja
distribuio concentrada na vizinhana do verdadeiro valor do parmetro e um no-tendencioso com
grande varincia, o estimador tendencioso pode ser prefervel, principalmente se possvel determinar
a grandeza e a direo da tendenciosidade.
Para julgar situaes como esta definida a propriedade da validade (ou acurcia).
1.2.3. VALIDADE ( OU A CU RCIA )
Proximidade das observaes (estimativas) ao parmetro desejado. Dados dois estimadores )1
e ) 2 de um mesmo parmetro , diremos que )1 mais acurado que ) 2 se EQM( )1 ) < EQM( ) 2 ). A
eficincia relativa de )1 em relao a ) 2 definida como sendo EQM( )1 )/EQM( ) 2 ).
1.2.4. C OERNCIA OU CONSISTNCIA
Um estimador dito coerente (consistente) para qualquer quantidade muita pequena > 0 se a
)

probabilidade de que o desvio absoluto entre e seja menor que tende para 1 quando o nmero de
observaes "n" tende ao infinito, isto :
)

P(| - | < ) 1, quando n


A propriedade acima equivalente a

)
lim EQM()

= 0 ou ento, as duas seguintes,

)
lim E() = 0 , a tendenciosidade tende a zero e

consideradas em conjunto: n
)
lim Var() = 0 , a varincia tende a zero.
n
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

Exe mplo:
Verificar que S2 um estimador coerente de 2.
Tem-se que E(S2) = , para qualquer "n" e
2 4
2 4
Var(S2) = . Ento, como lim = 0, S2 consistente.
n1

n1

1.3. MTODOS DE ESTIMAO


Os estimadores considerados at agora foram sugeridos por intuio. Seria desejvel,
entretanto, um mtodo ou princpio que levasse sempre a bons estimadores. Infelizmente no existe um
mtodo geral aplicvel a todas as situaes. Os principais mtodos de estimao so o dos momentos,
o da mxima verossimilhana e o dos mnimos quadrados.
1.3.1. M TODOS DOS MOMENTOS
o mais antigo dos mtodos para determinar estimadores (determinado por K. Pearson em
1894). Se existem "k" parmetros para serem estimados, o mtodo consiste em expressar os primeiros
"k" momentos da populao em termos dos "k" parmetros atravs de "k" equaes. A soluo do
sistema formado por estas equaes leva a determinao dos estimadores.
As estimativas obtidas desta forma so claramente funes dos momentos da amostra. Uma
vez que os momentos da amostra so estimativas consistentes dos momentos da populao, os
parmetros estimados sero geralmente coerentes.
1.3.2. M TODOS DA MX IMA VEROSSIMILHAN A ( MAX IMU M LIKELIHOOD )

Funo de verossimilhana
Seja f(x: ) a funo de probabilidade X (discreta ou contnua) calculada no ponto X = x. O
valor de est includo na notao para lembrar que a distribuio da varivel X depende do
parmetro . Sejam X1, X2, ..., Xn uma amostra aleatria da varivel aleatria X e sejam x1, x2, ...., xn
seus valores amostrais. Define-se a funo de verossimilhana L, como sendo a seguinte funo da
amostra e do parmetro :
L(X1, X2, ..., Xn; ) = f(X1; ).f(X2; ). ... . f(Xn; )

Equao 1.1

Se a amostra (X1, X2, ..., Xn) tiver sido obtida, os valores amostrais (x1, x2, ...., xn) sero
conhecidos. J que desconhecido pode-se propor a seguinte questo? Para qual valor de L(x1, x2,
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

...., xn; ) ter o valor mximo? Colocando de outra forma. Suponha que existam dois valores
diferentes de , digamos 1 e 2, e que L(x1, x2, ...., xn; 1) < L(x1, x2, ...., xn; 2). Neste caso 2 seria
prefervel, pois para a amostra obtida o evento dado mais provvel de ocorrer com 2 do que com 1.
Este raciocnio pode ser resumido por:
Definio: A estimativa de mxima verossimilhana de , baseada numa amostra aleatria
obtida da populao X aquele valor de torna mxima L(X1, X2, ..., Xn; ), para uma dada amostra
X1, X2, ..., Xn onde L definida pela equao 1.1.
Observaes:
(i) uma varivel aleatria, pois seu valor depende da amostra X1, X2, ..., Xn.
(ii) Na maioria das situaes representa um valor isolado, mas se a distribuio depender de
mais de um parmetro (dois como no caso da normal), representar um vetor, por exemplo,
= (, ).
(iii) Para determinar a estimativa de MV, deve-se determinar o valor mximo de uma funo.
No entanto em muitas situaes mais fcil determinar o mximo da funo
ln L(X1, X2, ..., Xn; )
que possui o ponto de mximo idntico ao da funo L.
As estimativas de MV apresentam algumas propriedades importantes:
(i) A estimativa de MV pode ser tendenciosa. Normalmente esta tendenciosidade pode ser
eliminada pela multiplicao de uma constante apropriada.
(ii) Sob condies gerais as estimativas de MV so coerentes. Isto , se o tamanho da amostra
aumentar a estimativa se aproximar do valor a ser estimado.
Exemplo:
Suponha que uma varivel aleatria X tenha uma distribuio normal de mdia e desvio
padro , isto a fdp de X seja:
f(x) =

1 x
1
e 2

Se X1, X2, ..., Xn for uma amostra aleatria de X, sua funo de verossimilhana ser dada
por:
1 n
2
L(X1, X2, ..., Xn; , ) = (2 2 ) n 2 exp Xi
2 i =1

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

10

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

Portanto:

n
1 n
lnL(X1, X2, ..., Xn; , ) = ln (2 2 ) X i
2

2 i = 1

Deve-se resolver simultaneamente:


ln L
=0

ln L
= 0 . Tem-se:

ln L n (X i )2
=
= 0 , que fornece = X , a mdia amostral e

2
i =1
1 n
1 n
ln L
n n (X )2
2
)
= + i
= 0 , o que fornece 2 = . (X i )2 = . X i X .
3

i =1
n i =1
n i =1

Observe que a estimativa de mxima verossimilhana de 2 tendenciosa, pois j foi visto


que a no-tendenciosa precisa ser dividida por "n-1", isto , 2 ao invs de S2.
1.3.3. M TODOS DOS MNIMOS QUADRADOS
Este mtodo til para estimar momentos em torno de zero de uma distribuio populacional.
O princpio envolvido um pouco mais complicado do que o do mtodo dos momentos. Considere-se
uma varivel aleatria X e se r-simo momento em torno de zero:
E(Xr) = 'r onde r = 0, 1, 2, ...
A amostra a ser utilizada X1, X2, ..., Xn . Para se obter o estimador dos mnimos quadrados
de 'r formada a seguinte soma:
n

2
X ri 'r .
i =1

Deve-se escolher o valor 'r que torna a soma acima to pequena quanto possvel. Por
exemplo, para se achar o estimador dos mnimos quadrados para a mdia populacional (= 'r ),
determina-se para qual valor de a soma acima ser mnima, isto , deve-se minimizar a equao:
n

2
X ri .
i =1

Para isto necessrio derivar esta equao em relao e igualar esta derivada a zero,
obtendo-se:
n

2 (Xi )

=0

i =1

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

11

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

Que resolvido em funo de =

1 n
Xi = X .
n i =1

Desta forma, verifica-se pelo mtodo dos mnimos quadrados que a estimativa da mdia
populacional dada pela mdia da amostra, que coincide com o estimador obtido pelo mtodo dos
momentos.
As propriedades dos estimadores dos mnimos quadrados devem ser estabelecidas caso a caso.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

12

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

22.. E
ESST
TIIM
MA
A

O
O PPO
OR
R IIN
NT
TE
ER
RV
VA
AL
LO
O
O estimador por ponto no permite ter uma idia do erro cometido ao se fazer a estimativa do
parmetro. Para que se possa associar uma confiana (probabilidade) a uma estimativa necessrio
construir um intervalo em torno da estimativa por ponto. Este intervalo construdo baseado na
distribuio amostral do estimador.
Para construir intervalos de confiana necessrio inicialmente fixar-se uma probabilidade 1
- de que o intervalo construdo contenha o parmetro populacional. Esta probabilidade
denominada de confiana do intervalo. Desta forma, ser a probabilidade de que o intervalo obtido
no contenha o valor do parmetro, isto , ser a probabilidade de erro.

2.1. DA MDIA POPULACIONAL ()


A construo de um intervalo de confiana para a mdia populacional () envolve duas
situaes tpicas. (1) Quando o desvio padro populacional () for conhecido e (2) Quando o desvio
padro populacional () for desconhecido. A segunda situao a mais comum, pois pouco provvel
que no se conhea a mdia de uma populao, por isto a necessidade de estim-la, mas, no entanto, se
conhece o desvio padro. Entretanto por razes histricas e didticas vamos manter as duas situaes.
2.1.1. D ESVIO PADRO PO PULACION AL (
) CONHECIDO
O intervalo de confiana para a mdia () de uma populao construdo em torno da
estimativa pontual X . Sabe-se que a mdia da amostra tem distribuio normal de mdia e desvio
padro

se a populao de onde for extrada a amostra for normal (ou se a amostra for superior a

30 e retirada de qualquer populao ) de mdia e de desvio padro , pode-se ento utilizar a curva
normal para estabelecer os limites para o intervalo de confiana.
Lembrando que o que se quer um intervalo que contenha o parmetro populacional com
probabilidade 1 - tem-se ento:
P(-z/2 < Z < z/2) = 1 - , onde z/2 o valor da normal padro com rea direita igual a
/2.
Mas Z = ( X - ) /

Prof. Lor Viali, Dr.

substituindo na expresso acima vem:

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

13

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

P(-z/2 < ( X - ) /
P( X - z/2

< z/2 ) = 1 - . Trabalhando esta desigualdade, segue que:

< < X + z/2

) = 1 - . Que o intervalo procurado. Assim o intervalo

de confiana (probabilidade) de 1 - para a mdia de uma populao, quando for conhecido,


dado por:
[ X - z/2

; X + z/2

] onde:

X a estimativa por ponto da mdia da populao.

o desvio padro da populao e


z/2 o valor da distribuio normal padro cuja rea direita igual a /2, isto , o valor
de Z tal que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.

Exe mplo:
Uma populao tem um desvio padro igual a 10 e mdia desconhecida. Uma amostra de
tamanho n = 100 retirada e fornece uma mdia x = 50. Qual o intervalo de 95% de confiana para a
mdia desta populao?

Soluo:
Tm-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5% -z/2 = -1(2,5%) = -1,96.
Ento o intervalo de confiana de 95% para a mdia desta populao ser:
[ X - z/2

; X + z/2

] = [50 - 1,96.10/10; 50 + 1,96.10/10] = [50 - 1,96; 50 + 1,96] =

= [48,04; 51,96], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a
mdia desta populao.
Obs.: O valor = z/2
valor

denominado de erro padro da estimao. No confundir com o

que o erro padro da amostragem. O erro padro da estimao a semi-amplitude do

intervalo de confiana. A amplitude do intervalo de confiana (IC) ser; 2.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

14

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

2.1.2. D ESVIO PADRO PO PULACION AL (


) DESCONHECIDO
Quando o desvio padro da populao () desconhecido necessrio utilizar sua estimativa
. S que ao substituir-se o desvio padro populacional pela sua estimativa no quociente:
( X - ) /

no se ter mais uma normal padro. De fato, conforme demonstrado pelo

estatstico ingls W. S. Gosset1, conhecido por Student o comportamento do quociente:


( X - ) /

segue uma distribuio simtrica em torno de zero, porm com uma

variabilidade maior do que a da normal padro. A distribuio do quociente acima conhecida como
distribuio T de Student.
2.1.3. A DISTRIBUIO T ( DE S TUDENT )

Na realidade existem infinitas distribuies T, uma para cada tamanho de amostra. Estas
distribuies a exemplo da normal padro encontram-se tabeladas.
A tabela para a distribuio T segue uma metodologia um pouco diferente daquela da
normal padro. De fato, como as distribuies de Student no podem ser padronizadas, isto , sofrer
uma transformao de varivel, a exemplo do ocorre na normal, no possvel construir uma nica
tabela. Assim, neste caso, cada linha de uma tabela representa uma distribuio diferente e cada coluna
representa um valor de confiana que poder ser ou /2, isto , a tabela poder ser unilateral ou
bilateral. A linha de cada tabela fornece a distribuio T" com parmetro n - 1 denominado de graus
de liberdade, isto , o grau de liberdade = = n - 1 = linha da tabela. (Rever na Apostila de
Probabilidade)
2.1.4. O INTERVALO

Neste caso, o intervalo de confiana com probabilidade 1 - para a mdia ser:


[ X - t/2

; X + t/2

] onde:

X a estimativa por ponto da mdia da populao;

William S. Gosset: Estatstico ingls que trabalhava na cervejaria Guiness.


Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

15

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

o desvio padro da amostra, calculado com "n-1" no denominador e uma estimativa do

desvio padro da populao e t/2 o valor da distribuio T cuja rea direita igual a /2, isto ,
o valor de T tal que:
P(T > t/2) = /2, ou ento: P(- t/2 < T < t/2) = 1 - .
Na realidade as tabelas fornecem os valores de "T" em funo do parmetro = n - 1 = grau
de liberdade e da confiana desejada (dada em funo de uma ou duas caudas). Assim dado uma
confiana unicaudal de /2, o valor tabelada : T-1(n - 1, /2) = -t/2.

Exe mplo:
Uma amostra de tamanho 25 foi retirada de uma populao com o objetivo de estimar a sua
mdia e forneceu os valores x = 50 e = 10. Qual o intervalo de 95% de confiana para a mdia
desta populao?

Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na distribuio t com = n - 1 = 25 - 1 = 24 (linha da tabela). A coluna dever ser o valor
= 5% (tabelas bilaterais) ou ento o valor / 2 = 2,5% (tabelas unilaterais). Em qualquer caso o que
se procura o valor T com grau de liberdade igual a 24, isto , o valor T24 tal que:
P(- t/2 < T24 < t/2) = 95%.
Este valor vale 2,064. (note-se que na normal este mesmo valor valia 1,96). Ento o intervalo
de confiana de 95% para a mdia desta populao ser:
[ X - t/2

; X + t/2

] = [50 - 2,064.10/5; 50 + 2,064.10/5] = [50 - 4,13; 50 + 4,13] =

[45,87; 54,13], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a mdia
desta populao.
Convm notar que a ltima linha da tabela da distribuio T apresenta valores coincidentes
com aqueles que seriam obtidos se fosse utilizada a distribuio normal padro. Isto ocorre porque a
distribuio T tende a distribuio normal medida que o tamanho da amostra aumenta, isto , a
distribuio normal o limite da distribuio T quando o tamanho da amostra tende ao infinito. Esta
aproximao j ser bastante boa para amostras de tamanho n > 30. No entanto, para evitar confuses
sobre quando utilizar um ou outro modelo, no se recomenda a substituio de T por Z, a exemplo, do

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

16

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

que fazem outros textos. Quando o valor do grau de liberdade no for encontrado na tabela, toma-se o
valor imediatamente inferior.

2.2. DA PROPORO POPULACIONAL ()


Seja P = proporo amostral. Sabe-se que para n > 50 a distribuio amostral de P
aproximadamente normal com mdia P = e desvio padro (erro padro) P =

(1 )
. Pode-se
n

ento utilizar a curva normal para estabelecer os limites para o intervalo de confiana.
Lembrando que o que se quer um intervalo que contenha o parmetro populacional com
probabilidade 1 - ento tem-se:
P(-z/2 < Z < z/2) = 1 - , onde z/2 o valor da normal padro com rea direita igual a
/2.
Mas Z = (P- P) / P ento substituindo na expresso acima vem:
P(-z/2 < (P - P) / P < z/2 ) = 1 - . Trabalhando esta desigualdade, segue que:
P(P - z/2P < P <P + z/2P) = P(P - z/2P < <P + z/2P) = 1 - . Que o intervalo
procurado. Assim o intervalo de confiana (probabilidade) de 1 - para a proporo P de uma
populao dado por:
[P- z/2

(1 )
n

; P + z/2

(1 )
].
n

Observando-se a expresso acima pode-se perceber que o intervalo de confiana para a


proporo populacional , depende dele mesmo, isto , necessrio calcular o erro amostral que est
expresso em funo de . Como o objetivo estimar este valor, evidentemente ele no conhecido.
Assim necessrio utilizar, sua estimativa P , isto , necessrio substituir por P na expresso
P =

(1 )
. Desta forma o intervalo acima ficar:
n

[P- z/2

P (1 P )
P (1 P )
; P + z/2
], onde:
n
n

P a estimativa por ponto da proporo populacional .

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

17

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

P =

P( 1 P )
n

uma estimativa do erro padro, isto , do desvio padro amostral e

z/2 o valor da distribuio normal padro cuja rea direita igual a /2. o valor de Z tal
que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.

Exe mplo 1:
Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferncia por
determinado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um intervalo de
confiana de 95% de probabilidade para o percentual de preferncia dos consumidores em geral para
este produto.

Soluo:
Tm-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5%.
Este valor vale 1,96. A estimativa por ponto para a proporo populacional ser: p = f/n =
240/400 = 0,60 = 60%.
Ento o intervalo de confiana de 95% para a proporo populacional ser:
[P- z/2

P(1 P)
P(1 P)
0,60(1 0,60)
0,60(1 0,60)
; P + z/2
] = [0,60 - 1,96
.; 0,60 + 1,96
]
n
n
400
400

= [60% - 4,80% ; 60% + 4,80%] = [55,20%; 64,80%], ou seja, pode-se afirmar com uma certeza de
95% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos
consumidores que preferem o produto pesquisado.

Exe mplo 2:
Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em relao
ao consumo de um determinado produto, colheu-se uma amostra aleatria de 300 consumidores da
cidade e observou-se que 180 consumiam o produto. Determinar um IC de 99% para a proporo
populacional de consumidores do produto.

Soluo:
Tm-se 1 - = 99%, ento = 1% e / 2 = 0,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

18

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

P(Z > z/2) = 0,5%, ou ento: (-z/2) = 0,5%.


Este valor vale 2,575. A estimativa por ponto para a proporo populacional ser: p = f/n =
180/300 = 0,60 = 60%.
Ento o intervalo de confiana de 99% para a proporo populacional ser:
[P- z/2

P(1 P)
P(1 P)
0,60(1 0,60)
0,60(1 0,60)
; P + z/2
] = [0,60 - 2,58
.; 0,60 + 2,58
]
n
n
300
300

= [60% - 7,28% ; 60% + 7,28%] = [52,72%; 67,28%], ou seja, pode-se afirmar com uma certeza de
99% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos
consumidores que preferem o produto pesquisado.

2.3. DA VARINCIA POPULACIONAL ( 2 )


Sabe-se que o estimador no-tendencioso de 2 S2 e que E(S2) = 2, enquanto
V (S2) = 2
2/(n -1). No entanto, para se construir um intervalo de confiana para 2 necessrio, ainda
conhecer qual o comportamento de S2 , isto , qual o modelo terico (probabilstico) seguido pelo

estimador. Assim antes de se construir um intervalo de confiana para a varincia populacional


necessrio se conhecer um novo modelo probabilstico denominado de qui-quadrado e representado
por 2 (c grego).
A distribuio ou modelo qui-quadrado pode ser obtida de uma soma de variveis normais
n

padronizadas, isto , 2n = Zi2 .


i =1
A distribuio 2 assimtrica positiva (possu uma cauda direita) e de depende do
parmetro . Sabe-se tambm que:
E(2) = e que V(2) = 2.
A figura 2.1 mostra alguns exemplos de modelos qui-quadrado. A comportamento,
distribuio de probabilidade, apresentado pela varincia amostral (S2) est relacionado com a
distribuio (modelo) 2 atravs do seguinte resultado:
2n 1 =

( n 1) S 2

, isto , a varincia segue uma distribuio 2 com "n - 1" graus de liberdade a

menos de uma constante. Neste caso = n -1.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

19

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

2.3.1. TABELAS

A distribuio 2 est tabelada em funo do grau de liberdade n - 1 = (linha da tabela) e


rea sua direita, isto , P(2 > c) = . Na realidade o que est tabelado a funo inversa da 2, isto
, entrando com o valor do parmetro (graus de liberdade) e uma determinada probabilidade (rea), a
tabela fornece um valor da varivel (abscissa) tal que a probabilidade direita (rea) deste valor seja
igual a rea especificada. (Ver Apostila de Probabilidade para mais detalhes).
2.3.2. O INTERVALO

Suponha que seja fixado um nvel de confiana de 1 - e que 12 e 22 sejam dois valores
da distribuio 2 tais que P( 12 < 2 < 22 ) = 1 - .
P( 12 < 2 < 22 ) = 1 -
P( 12 <
P(

P(

22

<

(n 1) S2
2

1
2
< 2)=1-
2
(n 1) S
1

(n 1) S2
2

< 22 ) = 1 -

< 2 <

(n 1) S2
2

)=1-

Assim o intervalo de confiana (probabilidade) de 1 - para a varincia da populao


dado por:
(n 1) S2 (n 1) S2
;

2
12
2

2.4. DO DESVIO PADRO POPULACIONAL (


)
Para determinar um intervalo de confiana de "1 - " de probabilidade para o desvio padro
populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a varincia
populacional. Assim o intervalo ser:
(n 1) S2 (n 1) S2
;

2
2
2
1

O significado deste intervalo :


Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

20

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

(n 1) S2
P
<<
2

(n 1) S2
= 1 .
2

Exe mplo:
Uma amostra extrada de uma populao normal forneceu uma varincia de s2 = 8,38.
Determinar um intervalo de confiana de 90% para a varincia da populao e um intervalo de mesma
confiabilidade para o desvio padro da populao.

Soluo
Neste caso necessrio inicialmente determinar os valores da distribuio 2, de modo, que
2
2
1 tenha uma rea (probabilidade) direita igual a 95% e 2 tenha uma rea (probabilidade) direita

igual a 5%. Estes valores so: 12 = 3,940 e 22 = 18,307.


O intervalo de confiana, para a varincia, ser:
(n 1) S2 (n 1) S2
;

2
12
2
(11 1).8,38 (11 1).8,38
18,307 ; 3,940

[4,58; 21,27]
O intervalo de confiana, para o desvio padro, ser:
(n 1) S2 (n 1) S2
;

2
2
2
1

(11 1).8,38 (11 1).8,38


;

18
,
307
3,940

4,58;

21,27; ]

[2,14; 4,61].

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

21

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

33.. E
EX
XE
ER
RC
CC
CIIO
OSS
(01) Seja X uma varivel aleatria normal com mdia e desvio padro . Sejam:
n

Xi

1 =

i =1

, 2 =

Xi

i =1

n+1

Xi

1
2

e 3 = + i =2 , trs estimadores de . Determinar as propriedades dos trs


2n

estimadores, isto , suas expectncias e variabilidades.


(02) Com base na amostra aleatria (X1, X2), considerar dois estimadores de .
X=

1
2
X1 + X 2
e W = X1 + X2
3
3
2

(02.1) Verificar se so no tendenciosos.


(02.2) Qual a eficincia de W em relao a X ? Qual o melhor?
(02.3) Provar que X mais eficiente que qualquer outra combinao linear no-tendenciosa.

(Sugesto: determinar a varincia de cX1 + (1 -c)X2 em funo de "c" e achar o seu mnimo,
derivando-a e igualando-a a zero.)
(03) De uma distribuio normal com varincia 2,25, obteve-se a seguinte amostra:
27,5; 25,6; 28,2; 26,1 e 25,0

Determinar um intervalo de confiana para a mdia desta populao com confianas de:
(03.1) 95% (03.2) 99%
(04) Utilizando-se de uma aas de 145 profissionais de certa regio, verificou-se que o salrio mdio

de 8 salrios mnimos (s.m.) com um desvio padro de 1,8 s.m. A amostra tambm forneceu a
informao de que 70% dos profissionais eram casados.
(04.1) Determine e interprete o intervalo de confiana de 95% para o salrio mdio de todos os

profissionais desta regio.


(04.2) Determine e interprete o intervalo de confiana de 99% para a proporo de profissionais

casados desta regio?


(04.3) Determine e interprete um Intervalo de Confiana de 90% para 2.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www. mat.ufrgs.br/~viali/

22

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

(05) A amostra apresenta os valores da varivel tamanho da famlia

coletados atravs de uma aas em uma vila popular.

10

(05.1) Determine e interprete o intervalo de confiana de 95% para o

14

19

15

07

parmetro tamanho familiar mdio por domiclio da vila.


(05.2) Determine e interprete o intervalo de confiana de 90% para o

parmetro proporo de domiclios da vila com tamanho igual ou


superior a cinco.

(06) A varincia de uma populao 150. Deseja-se obter um intervalo de confiana para a mdia da

populao com uma confiabilidade de 95% e um erro mximo de 2. Quantos valores desta
populao devem ser retirados aleatoriamente?
(07) Quer-se estimar a mdia de uma populao de varincia desconhecida atravs de um intervalo de

confiana de 95% e com erro de estimao mximo de 5 unidades. Atravs de uma amostra piloto
de 100 valores a varincia foi estimada em 400 unidades. Que tamanho deve ter a amostra final?
(08) Uma amostra preliminar de pessoas de uma determinada comunidade apresentou 18% de

analfabetos. Com este resultado quer-se estimar a proporo de analfabetos da populao com
uma confiabilidade de 95% e com um erro de estimao mximo de 2,5%. Qual o tamanho da
amostra a ser utilizada?
(09) De uma populao normalmente distribuda foi extrada uma aas de n = 10 que apresentou os

valores abaixo:
4

12

10

11

(09.1) Determine uma estimativa da varincia populacional.


(09.2) Determine uma estimativa da mdia populacional e do correspondente erro amostral?
(09.3) Determine um intervalo de confiana de 95% para a mdia desta populao.
(10) A tabela apresenta os valores de uma amostra retirada de uma populao

normal. Determine:

04 |-- 08

(10.1) Um intervalo de confiana de 95% para a mdia desta populao.

08 |-- 12

(10.2) Um intervalo de confiana de 99% para a mdia desta populao.

12 |-- 16

16 |-- 20

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www.mat.ufrgs.br/~viali/

23

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

44.. R
RE
ESSPPO
OSST
TA
ASS D
DO
OSS E
EX
XE
ER
RC
CC
CIIO
OSS
(01) Quantos a expectncia tem-se:

E( 1) = E(X) =
E( 2) =
E( 1) =

n
n +1

( n 1) (2 n 1)
.
+
=
2
2n
2n

Como 2 e 3 so tendenciosos s 1 = X candidato eficincia.


Quanto acurcia, tem-se: EQM( ) = Var( ) + (Tend )2
2
V( 1) = V (X) =
n
V( 2 ) = V(

Xi
)
n +1

n2
(n + 1)2

Xi

V( 3)

1
2(n 1)
( n 1)
= V( + i = 2 ) = +
=
2
2n
2n
2
2n

+
(02) E(X) = E( X1 X 2 ) = .
2

1
3

2
3

E( W ) = E( X1 + X 2 ) =

1
2
E( X 1) + E( X 2 )
3
3

2
+
3
3

= .

2
+
V (X ) = V( X1 X 2 ) =

1
2
1
4
5 2
2 4 2
V( W) = V( X 1 + X 2 ) = V( X 1 ) + V( X 2 ) =
+
=
3
3
9
9
9
9
9

A eficincia de X em relao a W dada por:


(03) (03.1) [25,17; 27,79]

V( X )
V( W )

= 90%. Assim X melhor.

(03,2) [24,75; 28,21]

(04) (04.1) [7,71; 8,29] Tem-se 95% de certeza de que o salrio mdio de todos os profissionais da

rea est entre 7,71 s.m. e 8,29 s.m.

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www.mat.ufrgs.br/~viali/

24

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

(04.2) [60,20%; 79,80%] Tem-se 99% de confiana de que a percentagem de profissionais da

rea que so casados esteja entre 60,20% e 79,80%.


(04.3) [2,70; 3,98]. Tem-se 90% de confiana de que o valor da varincia populacional pertena

a este intervalo.
(05) (05.1) [4,62; 5,22] Tem-se 95% de confiana de que o valor mdio do tamanho familiar da vila

esteja entre 4,62 e 5,22 membros.


(05.2) [53,23%; 72,93%] H 90 de certeza de que o percentual de famlias com 5 ou mais

membros esteja entre 53,23% e 72,93%.


(06) n = 145
(07) n = 62, como a amostra piloto utilizada foi de n = 100 mais confivel ficar com a amostra piloto.
(08) n = 908
(09) (09.1) 6,67

(09.2) 8 e 0,82

(10) (10.1) [9,19; 12,65]

(10.2) [8,58; 13,26]

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

(09.3) [6,15; 9,85]

htt p://www.mat.ufrgs.br/~viali/

25

SRIE: Estatstica Bsica


Texto 3: ESTIMAO

55.. BBIIBBLLIIOOGGRRAAFFIIAA
KACHIGAN, Sam Kash.

Statistical Analysis: An Interdisciplinary Introduction to Univariate &

Multivariate Methods. New York: Radius Press, 1986, 589 p.


KMENTA, Jan. Elementos de Econometria. Traduo: Carlos Roberto Vieira Arajo. So Paulo:
Atlas, 1978, 686 p.
MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Economics. IRWIN,
Boston, 1990.
STEVENS, James. Applied Multivariate Statistics For The Social Sciences. Mahwah, New Jersey:
LEA Lawrence Erbaum Associates, Publishers

Prof. Lor Viali, Dr.

viali@mat.ufrgs.br

htt p://www.mat.ufrgs.br/~viali/

26

Vous aimerez peut-être aussi