Vous êtes sur la page 1sur 10

Universidade Federal do Rio de Janeiro

Professora: Samara Alvarez Alves


Mdulo Inferncia - Reviso dos Conceitos
06/2016

Teorema Central do Limite

Theorem 1. Seja X1 , X2 , ..., Xn uma sequncia de variveis aleatrias independentes e identicamente distribudas com mdia e varincia 2 . Dessa forma,

Sn = X1 + X2 + ... + Xn
= X1 + X2 + ... + Xn
X
n
ento para n suficientemente grande, qualquer que seja a distribuio de probabilidade
dos Xi , temos

'N
Sn ' N (n, n ) e X
2

2
,
n


Sn n
X

' N (0, 1) e
' N (0, 1)

n
n

1.1

(1)

(2)

Aproximao Normal Binomial

Se X1 , X2 , ..., Xn uma sequncia de variveis aleatrias independentes de Bernoulli com parmetro p, ento Sn = X1 +X2 +...+Xn B(n; p). Assim, pelo Teorema Central do Limite,
para n suficientemente grande Sn pode ser aproximada por uma distribuio normal
Sn np
Sn ' N (np, np(1 p)) ou p
' N (0, 1)
np(1 p)

(3)

2
2.1

Distribuio Amostral
Distribuio Amostral da Mdia

Theorem 2. Seja X uma V.A. com mdia e varincia 2 , e sejam X1 , X2 , ..., Xn uma
amostra aleatria simples. Ento, se
= X1 + X2 + ... + Xn
X
n
= e V ar(X)
=
temos que E(X)

2
.
n

Demonstrao.
E(X1 ) + E(X2 ) + ... + E(Xn )
n
+ + ... +
n
=
=
=
n
n

=
E(X)

= V ar(X1 ) + V ar(X2 ) + ... + V ar(Xn ) (independncia das variveis)


V ar(X)
n
2
2
2
n 2
2
+ + ... +
=
=
=
n2
n2
n

Theorem 3. Sejam X1 , X2 , ..., Xn uma amostra aleatria simples de uma populao com
segue uma distribuio normal com mdia
com mdia e varincia 2 a distribuio de X
2
e varincia n quando n , pelo Teorema Central do Limite.
Corollary 3.1. Sejam X1 , X2 , ..., Xn uma amostra aleatria simples de uma populao com
= X1 +X2 +...+Xn , ento
com mdia e varincia 2 e X
n

X
Z= q
N (0, 1)
2
n

2.2

Distribuio Amostral da Proporo

Theorem 4. Suponha que p seja


a proporo dos elementos da populao que possuem um
PN
i=1 Xi
certo atributo em estudo, p = N , onde a varivel aleatria X = 0 se i-simo elemento
da populao no tem o atributo e X = 1 se o i-simo elemento da populao tem o atributo.
Ento, se
Pn
Xi
X
p = i=1
= , onde X o no de sucessos na amostra
n
n
a proporo de indivduos na q
amostra, com reposio, com a caracterstica de interesse,
temos que E(
p) = p e V ar(
p) =

p(1p)
.
n

Demonstrao. Se a amostra retirada da populao com reposio ento


distribuio Binomial com parmetros n e p. Logo,
 Pn

i=1

E(
p) = E
=


=

E(

Pn

i=1

Xi )

i=1

Xi tem

(mdia da Binomial np)

np
=p
n

Pn
V ar(
p) = V ar

Xi

Pn

i=1

Xi


=

V ar(

n
np(1 p)
p(1 p)
=
2
n
n

Pn

i=1
n2

Xi )

(varincia da Binomial np(1-p))

ter distribuio aproximadaVimos, ainda, que pelo Teorema Central do Limite que X

mente normal quando n , com mdia E(X) e V ar(X). Logo no caso de distribuio
= p e V ar(X)
= p(1p) . Contudo, note que X
nesse contexto
amostral da proporo E(X)
n
o prprio p. Assim, para n suficientemente grande consideramos que
p ' N (p, p(1 p)/n)
. Quando isso ocorre, tem-se que Z =

2.3

q pp

p(1p)
n

' N (0, 1).

Distribuio Amostral da Varincia

Ao contrrio da mdia amostral e proporo amostral, a varincia amostral segue a distribuio qui-quadrado.
Theorem 5. Sejam X1 , X2 , ..., Xn uma amostra aleatria simples de uma populao com
com mdia e varincia 2 , ento
(n 1)S 2
n1
2

(4)

Essa distribuio definida nos valores reais no-negativos e assimtrica, sendo tambm
tabelada de acordo com os graus de liberdade e os nveis de significncia desejados.

Estimao

O problema principal em Inferncia consiste em estimar os parmetros populacionais por


meio de informaes obtidas na amostra da populao. Para tanto, precisamos de uma
estimador conveniente que "acerte"em mdia o valor do parmetro.
Nas figuras abaixo, suponha que o alvo seja o parmetro populacional que desejamos
estimar. Diremos que o nosso estimador no viesado (ou no-viciado, ou ainda notendencioso) se a mdia dos "tiros"estiver prxima do valor central (do alvo). Contudo,
alm de acurado, precisamos que o estimador seja preciso, ou seja, de que o desvio em
relao mdia dos "tiros"tenda a zero quando o nmero de tiros aumenta.

Figura 1: Estiradores A, B, C e D.
Dessa forma, podemos classificar os estimadores da Figura 1, como:
(A) No viesado e impreciso
(B) Viesado e impreciso
(C) Viesado e preciso
(D) No viesado e preciso
Para os principais parmetros populacionais estudados temos os seguintes estimadores
pontuais no-viesados:
Tabela 1: Parmetros e seus estimadores.
Parmetro
Estimador
Mdia
Proporo
Varincia

p
2

Desvio Padro

Pn

i=1

p =

X
,
n

Xi

X=no dePsucessos na amostra


n
2
(x X)
S 2 = i=1n1i
q Pn
2
i=1 (xi X)
S=
n1

Uma vez que se tem os estimadores (variveis aleatrias) possvel obter as distribuies
de probabilidade deles com o objetivo de construir um intervalo de confiana para o parmetro em estudo. Para isso, define-se um nvel de confiana 1 , no qual a probabilidade
de que o intervalo construdo no conter o valor do parmetro.
4

Ateno.: o nvel de confiana, 1 , a probabilidade de que a estimativa intervalar


contenha o parmetro populacional em estudo.

3.1

Propriedade dos estimadores:


Definio 1: O estimador no tendencioso (ou no-viesado, ou no-viciado) para
se a esperana coincide com o valor do parmetro,
=
E()

(5)

Definio 2: Sejam dois estimadores no-tendenciosos 1 e 2 para um parmetro .


Diremos que 1 mais eficiente que 2 se:
V ar(1 ) < V ar(2 )

(6)

Definio 3: Um estimador considerado consistente se:


0 quando n
V ar()

3.2
3.2.1

(7)

Estimao Intervalar de Parmetros:


Intervalo de Confiana para a mdia populacional () quando a varincia
populacional ( 2 ) conhecida:

Quando a populao normalmente distribuda e 2 conhecida, a mdia amostral tem


distribuio normal com mdia e varincia 2 /n, e portanto,
Z=


X
N (0, 1)
/ n

(8)

Suponha que desejemos formar um intervalo de confiana para com um nvel de confiana 1 . Assim:

P (z/2 Z z/2 )


X
z/2
P z/2
/ n



z/2
P z/2 X
n
n



P X z/2 X + z/2
n
n
h
i

= X z/2 n X + z/2 n

= 1

Assim, IC(1),

= 1
= 1
= 1

Ateno.: Nesse mesmo caso, se desconhecemos o valor da varincia populacional, podemos substituir 2 por S 2 , quando n grande. Portanto, o contexto estudado aqui vale
tanto para 2 conhecida, quanto para 2 desconhecida, com amostras grandes. Isso porqu,
pelo Teorema Central do Limite, temos a aproximao em distribuio:
Z=
3.2.2


X
' N (0, 1)
/ n

(9)

Intervalo de Confiana para a mdia populacional () quando a varincia


populacional ( 2 ) desconhecida:

Quando a amostra pequena se utilizarmos a varincia da amostra no lugar da varincia populacional iremos incorporamos mais incerteza aos intervalos. Por esse motivo a distribuio
amostral tem caudas mais "pesadas"de maneira a gerar valores mais atpicos.
Nesse caso, deve-se utilizar a distribuio t Student, onde

X
tn1
(10)
S/ n
onde S o devio padro amostral e tn1 a distribuio t Student com n 1 graus
de liberdade. Essa distribuio centrada no zero. A Figura 3.2.2 ilustra o formato dessa
distribuio.
Suponha que desejemos formar um intervalo de confiana para com um nvel de confiana 1 . Assim:
T =

P (t(n1),/2 T t(n1),/2 )



X
t(n1),/2
P t(n1),/2
S/ n


S
S

P t(n1),/2 X t(n1),/2
n
n


S
S

P X t(n1),/2 X + t(n1),/2
n
n
6

= 1
= 1
= 1
= 1

Assim, IC(1),
3.2.3

+ t(n1),/2 S
t(n1),/2 S X
= X
n
n

Intervalo de Confiana para a proporo populacional (p):

Suponha que p seja a proporo dos elementos da populao que possuem um certo atributo
em estudo.
PN
Xi
(11)
p = i=1
N
onde a varivel aleatria X = 0 se i-simo elemento da populao no tem o atributo e
X = 1 se o i-simo elemento da populao tem o atributo.
Pn
Xi
X
p = i=1
= , onde X o no de sucessos na amostra
(12)
n
n
Se n suficientemente grande, pelo Teorema Central do Limite:
p p
' N (0, 1)
Z=q

(13)

p(1p)
n

Suponha que desejemos formar um intervalo de confiana para p com um nvel de confiana 1 . Assim:
P (z/2 Z z/2 ) = 1
Logo,

p p
P z/2 q
z/2 = 1
p(1
p)
n

Assim, IC(1),p



q
q
p(1
p)
p(1
p)
p p + z/2
= p z/2
n
n

Teste de Hipteses

Uma hiptese estatstica uma alegao sobre um parmetro da populao. partir de uma
amostra dessa populao deseja-se decidir se aceitamos uma hiptese inicial (chamada de
hiptese nula, H0) por no haver evidncias suficientes contra ela, ou se rejeitamos em favor
de uma hiptese alternativa (chamada de hiptese alternativa, H1), pelo fato de o resultado
amostral ser atpico dentro do contexto afirmado pela hiptese nula.

4.1

Tipos de Erros

Em testes de hipteses ao tomar decises estamos sujeitos a dois tipos de erros: o erro tipo
I e o erro tipo II, descritos na Tabela 4.1.
Ao decidir em prol ou contra uma hiptese, pode-se perpetrar dois tipos de erros: rejeitar
a hiptese H0 , quando ela verdadeira ou no rejeitar a hiptese H0 , quando ela falsa.
Deciso
No rejeitar H0
Rejeitar H0

H0 verdadeira
Deciso Correta
Erro Tipo I

H0 falsa
Erro Tipo II
Deciso Correta

Se a hiptese H0 for verdadeira e no rejeitada ou falsa e rejeitada, a deciso estar


correta. No entanto, se a hiptese H0 for rejeitada sendo verdadeira, ou se no for rejeitada
sendo falsa, a deciso estar errada. O primeiro destes erros chamado de Erro do Tipo
I e a probabilidade de comet-lo denotada pela letra grega ; o segundo chamado de
Erro do Tipo II e a probabilidade de comet-lo denotada pela letra grega . Rescrevendo
tem-se:

= P(Erro tipo I) = P (Rejeitar H0 |H0 verdadeira)


= P(Erro tipo II) = P (Aceitar H0 | H0 falsa)

(14)
(15)

O nvel de significncia dado por e representa a confiana de se rejeitar a hiptese


nula (H0 ) quando na verdade esta verdadeira. O poder do teste a probabilidade de se
rejeitar a hiptese nula (H0 ) quando a mesma falsa e quantificada por 1 . O nvel de
confiana do teste a probabilidade de aceitao da hiptese nula (H0 ) quando a mesma
verdadeira e mensurada por 1 .

4.2

Tipos de Testes

No tocante aos testes de hipteses pode-se ter testes unilaterais ou bilaterais em concordncia
com o definida na hiptese alternativa (H1 ). Dessa forma, seja um parmetro qualquer de
uma populao em estudo temos os seguintes cenrios de testes de hipteses:
1. Teste Bilateral

H0 : = 0
H1 : 6= 0
8

Figura 2: Teste de Hipteses Bilateral


Assim, devemos distribuir o nvel de significncia nas duas caudas da distribuio
amostral, isto /2 esquerda e /2 direita da distribuio, conforme a Figura 2:
Se a estatstica do teste se situar na regio cinza, ento h evidncias para se rejeitar
H0 : = 0 ao nvel de significncia estabelecido.
2. Monocaudal (ou Unilateral) Esquerda

H0 : 0
H1 : < 0
Assim, devemos distribuir o nvel de significncia esquerda da distribuio, conforme a Figura 3:

Figura 3: Teste de Hipteses Unilateral Esquerda


Se a estatstica do teste se situar na regio cinza, ento h evidncias para se rejeitar
0 ao nvel de significncia estabelecido.

Monocaudal (ou Unilateral) Direita




H0 : 0
H1 : > 0

Assim, devemos distribuir o nvel de significncia esquerda da distribuio, conforme


a Figura 4:

Figura 4: Teste de Hipteses Unilateral Direita


Se a estatstica do teste se situar na regio cinza, ento h evidncias para se rejeitar
0 ao nvel de significncia estabelecido.

4.3

P-valor

O p-valor considerado o menor nvel de significncia a partir do qual rejeita-se a hiptese


nula.
A tomada de deciso com base no p-valor dada por:

se p valor rejeitamos a hiptese nula
se p valor > no rejeitamos a hiptese nula

4.4

Etapas do Teste

(1) Defina as hipteses nula e alternativa como afirmativas matemticas. Lembre que H0
sempre contm o smbolo =.
(2) Estabelea o nvel de significncia: probabilidade de cometer o erro tipo I.
(3) Identifique a distribuio amostral (distribuio sob a hiptese nula).
(4) Determine a estatstica teste e padronize-a.
(5) Calcule o p-valor da estatstica teste.
(6) Tome sua deciso de rejeio ou no da hiptese nula.
(7) Interprete a sua deciso!
10

Vous aimerez peut-être aussi