Vous êtes sur la page 1sur 29

INFERNCIA ESTATSTICA

1. AMOSTRAGEM E DISTRIBUIES AMOSTRAIS


1.1. Introduo

A amostragem e em particular os processos de amostragem


aplicam-se

em variadssimas reas

do

conhecimento

constituem, muitas vezes, a nica forma de obter informaes


sobre uma determinada realidade que importa conhecer., Reis
et al. (1997), Estatstica Aplicada, Volume II.

A Inferncia Estatstica uma metodologia assente num conjunto de tcnicas


capazes de produzir informao sobre determinada realidade atravs de uma
anlise conduzida numa amostra, ou seja, num subconjunto de elementos
seleccionados da populao atravs dos mtodos de amostragem disponveis,
que sero brevemente caracterizados neste texto. Antes de explicar o papel da
amostragem e das distribuies amostrais no mbito da Inferncia Estatstica ou
Estatstica Indutiva, vamos introduzir alguns conceitos bsicos que sero
utilizados com muita frequncia ao longo do presente texto.

1.1.1. Conceitos importantes


Populao: o conjunto de todos os indivduos (universo), sobre os quais se
pretende estudar uma ou mais caractersticas;

Parmetro: uma caracterstica da populao, que pode tomar um valor


desconhecido mas fixo, isto , se tivermos acesso a todos os
elementos da populao conseguimos determinar o valor
assumido por cada um dos parmetros dessa populao;
Amostra: um subconjunto da populao obtido utilizando mtodos
adequados ao que se pretende estudar e deve ser representativa da
populao;

ISEL DEETC

INFERNCIA ESTATSTICA

Obtida uma amostra pode-se proceder sua caracterizao, por recurso s


tcnicas de Estatstica Descritiva, utilizando-se seguidamente a inferncia
estatstica com o intuito de:
1. inferir acerca dos valores dos parmetros da populao terica de onde
foi obtida a amostra, ou seja, estimar o valor dos parmetros da
populao terica a partir das estimativas amostrais teoria da
estimao;
2. testar a validade de hipteses formuladas relativamente aos referidos
parmetros, ou seja, fundamentar decises, por recurso a testes de
hipteses sobre os parmetros da populao. Neste caso est inerente
um certo grau de incerteza respeitante deciso tomada.

Este procedimento que se designa por Inferncia Estatstica assenta num


conjunto de processos de raciocnio indutivo, com os quais se procura tirar
concluses indo do particular para o geral. Com base na anlise de um conjunto
limitado de dados, uma amostra, pretende-se caracterizar o universo de onde
tais dados tiveram origem, a populao.

1.1.2. Objectivos a atingir com a utilizao da Inferncia


Estatstica
Normalmente pretende-se conhecer o comportamento duma caracterstica da
populao, sendo essa caracterstica representada pela varivel aleatria X.
Conhecer esse comportamento, conhecer a distribuio da varivel aleatria
X, ou seja, os valores dos parmetros dessa distribuio. Por exemplo, numa
populao normal os valores de e representam respectivamente a mdia
e o desvio padro da caracterstica em estudo. Por diversas razes quase
sempre impossvel chegar aos valores reais dos parmetros duma populao,
que apenas se podem obter atravs do estudo de todos os elementos que a ela
pertencem. A amostragem surge assim, como uma tcnica que permite obter

ISEL DEETC

INFERNCIA ESTATSTICA

conhecimento sobre o todo, a partir do estudo de um nmero de indivduos


limitado.

bvia a importncia atribuda ao mtodo utilizado para fazer a seleco dos


elementos que integram a amostra. Se a amostra no representar correctamente
a variabilidade e a diversidade que existe na populao, as concluses finais do
estudo podero ser enviesadas, estanto portanto comprometida a sua
fiabilidade.

1.1.3. Vantagens em utilizar Amostragem em vez de Censo ou

Enumerao Completa
Custo de obteno dos dados mais reduzido;
Boa preciso nos resultados com menor custo, menor tempo,
menor necessidade de recursos humanos e computacionais;
Nomeadamente em controlo de qualidade a utilizao duma
amostra evita a destruio dos objectos a serem estudados.

Exemplos onde usual a utilizao de amostragem:

Estudos sociais, demogrficos utilizados em departamentos


governamentais como auxlio ao planeamento;
Sondagens de opinio (marketing, economia, gesto e
eleitorais).

Exemplo 1
O controle de qualidade uma actividade inerente a gesto de qualquer
unidade industrial, e portanto trata-se de uma rea muito importante que pode
ser estudada no mbito da Engenharia. Neste contexto, suponha-se que a
populao em estudo constituda pelo total de unidades produzidas (25000)
de um determinado componente electrnico numa unidade industrial sediada
em certa regio, ao longo do 3 trimestre do ano de 2009. A caracterstica em

ISEL DEETC

INFERNCIA ESTATSTICA

estudo a proporo, p, de componentes com pelo menos um defeito.


Definimos a varivel aleatria

1,
X
0,

o componente apresenta pelo menos um defeito


o componenteno apresenta defeitos

sendo p = P[X=1].
Escolhem-se ao acaso 1000 componentes e pretende-se determinar a
probabilidade de, no conjunto dos 1000 componentes, se encontrarem, 900 sem
nenhum defeito, e portanto 100 com um ou mais defeitos.
Vamos distinguir dois casos:

1. A proporo de componentes com pelo menos um defeito, p,


conhecida, sendo por exemplo igual a 0,12. Neste caso a probabilidade
de numa amostra de 1000 componentes, encontrar 100 com pelo menos
um defeito, facilmente calculada utilizando o modelo terico
adequado: sendo os 1000 componentes seleccionados sem reposio ( o
que faz sentido dado que um componente no deve ser seleccionado
duas ou mais vezes), trata-se de uma distribuio hipergeomtrica.
A probabilidade pedida assim calculada por
3000

C100 . 22000 C900


;
25000
C1000

2. A proporo de componentes com pelo menos um defeito, p,


desconhecida, sendo este o caso mais prximo da realidade. O objectivo
agora distinto: pretende-se com a amostra dos 1000 componentes tirar
concluses sobre a verdadeira proporo de componentes com pelo
menos um defeito na populao (25000 componentes produzidas no 3
trimestre).
As concluses que se obtm deste estudo so certamente sujeitas a um
determinado risco de estarem incorrectas, no entanto se ao longo de todo
o estudo se proceder respeitando determinadas regras e condies, o
grau de incerteza das concluses pode ser controlado e at medido. A
nica forma de saber se tais concluses so verdadeiras ou falsas por
proceder ao clculo da proporo p para toda a populao (25000

ISEL DEETC

INFERNCIA ESTATSTICA

componentes). Geralmente a observao de todos os elementos da


populao tem um custo demasiado elevado, ou seja, a obteno de uma
concluso seguramente correcta pressupe custos que as empresas no
esto dispostas a pagar. Noutros casos o processo de amostragem pode
ser destrutivo, no fazendo qualquer sentido analisar todo o universo.
Designa-se por Plano de amostragem ao conjunto das vrias etapas para obter
uma amostra:
Definio da populao alvo / populao a inquirir;
Definio do processo utilizado para escolher os elementos da
populao a incluir na amostra Processo de Amostragem;
Definio da dimenso da amostra.

Considera-se que uma amostra deve possuir algumas caractersticas desejveis:


Imparcialidade
Representatividade
Dimenso

1.2. Conceitos e mtodos de amostragem aleatria


1.2.1. Processos de amostragem
O processo de amostragem a adoptar depende, entre outros factores, das
caractersticas da populao e dos objectivos do estudo. Distinguem-se dois
processos de obter a amostra:
Aleatrio: qualquer dos elementos da populao pode entrar na amostra
com uma probabilidade conhecida;
Determinstico: a opinio de quem faz o estudo e a sua experincia
determinante na seleco dos indivduos a incluir na amostra;

ISEL DEETC

INFERNCIA ESTATSTICA

AMOSTRAGEM ALEATRIA

permite efectuar uma anlise estatstica mais

rigorosa do que a amostragem determinstica. Possibilita estimar as margens de


erro dos resultados devidos amostragem, evitando o enviesamento das
amostras (facto que surge sempre que se usam mtodos empricos para
seleccionar os indivduos que integram a amostra).
Na AMOSTRAGEM DETERMINSTICA ou emprica os elementos da populao so
escolhidos por especialistas, com base na sua opinio e experincias passadas. A
noo de representatividade da populao muda mediante o analista, sendo
portanto impossvel estimar a probabilidade dum elemento ser seleccionado
para a amostra.
TIPOS DE AMOSTRAGEM ALEATRIA
Amostragem aleatria simples com e sem reposio;
Amostragem aleatria estratificada;
Amostragem aleatria por clusters;
Amostragem sistemtica.
TIPOS DE AMOSTRAGEM DETERMINSTICA
Amostragem por quotas;
Amostragem por itinerrios.

BREVE DESCRIO DOS MTODOS DE AMOSTRAGEM ALEATRIA


Amostragem aleatria simples com e sem reposio
O processo de amostragem aleatria simples garante que todos os elementos da
populao tm a mesma probabilidade de ser includos na amostra. Todas as
possveis amostras de n elementos, retiradas de uma populao de dimenso M,
tm a mesma probabilidade de serem seleccionadas.

ISEL DEETC

INFERNCIA ESTATSTICA

Na amostragem aleatria simples com reposio: cada elemento da populao


pode entrar mais do que uma vez na amostra e qualquer amostra tem uma
probabilidade de

1
de ser escolhida.
Mn

Na amostragem aleatria simples sem reposio: cada elemento da populao


pode entrar apenas uma vez na amostra e qualquer amostra tem uma
probabilidade de

1
de ser escolhida.
Cn

Nota: Quando, M grande comparado com a dimenso da amostra n,


esbatem-se as diferenas entre escolher com reposio e sem reposio.
Amostragem Estratificada
Para a recolha de uma amostra estratificada h que previamente
proceder estratificao da populao, ou seja dividi-la em grupos
(estratos) de tal modo que dentro de cada estrato haja a maior
uniformidade possvel e, em que as diferenas entre os vrios estratos
sejam to grandes quanto possvel. Estando a populao classificada em
estratos, a amostra recolhida atravs de amostragens aleatrias simples
dentro de cada estrato.
Amostragem por clusters
Este tipo de amostragem til quando a populao se encontra dividida
num reduzido nmero de grupos (clusters) onde, as diferenas entre os
elementos dentro de cada cluster devem ser as maiores possveis (os
grupos devero tanto quanto possvel ser microcosmos da populao a
estudar). A amostra recolhida escolhendo por amostragem aleatria
simples um ou mais clusters.
Amostragem multi-etapas
O primeiro passo neste tipo de amostragem idntico ao anterior. Aps a
seleco aleatria de alguns dos clusters, tambm os elementos de cada

ISEL DEETC

INFERNCIA ESTATSTICA

grupo so aleatoriamente escolhidos. Este processo pode multiplicar-se por


mais de duas etapas.

Diferentes processos de amostragem aleatria do origem a amostras aleatrias


com caractersticas diversas, que implicam a utilizao de metodologias
diferentes na inferncia estatstica. Vamos caracterizar mais detalhadamente as
amostras aleatrias simples.

1.2.2. Amostras aleatrias simples


Considere-se uma populao da qual se pretende estudar a caracterstica X e
seja f x

a funo de probabilidade ou a funo de densidade de

probabilidade, da varivel X. Com X1, X 2,... X n uma amostra obtida por um


processo aleatrio, os seus elementos X1, X 2,... X n so variveis aleatrias.
Podemos retirar da populao sucessivas amostras de dimenso n:

POPULAO X

Amostra 1

Amostra 2

x11, x12,..., x1n

x21, x22,..., x2n

...

Amostra k

xk 1, xk 2,..., xkn

As amostras x11, x12 ,..., x1n , x 21, x 22 ,..., x 2 n , , x k1 , x k 2 ,..., x kn so amostras


observadas da varivel aleatria n-dimensional X1, X 2,... X n com funo de
probabilidade ou de densidade conjunta f x1, x2,..., xn .

No nosso estudo vamos limitar-nos a considerar amostras aleatrias, para as


quais as n variveis aleatrias

X1, X 2,... X n

so independentes e

identicamente distribudas, (i.i.d), seguindo a mesma funo de probabilidade


ou funo de densidade de probabilidade da populao, isto :

ISEL DEETC

INFERNCIA ESTATSTICA

f x1 f x2 ... f xn f x
Como as variveis aleatrias so independentes temos ainda:

f ( x1, x2,..., xn ) f ( x1).f x2 ....f xn .


nota 1: Uma amostra aleatria simples (recolhida de uma populao finita com reposio ou de uma
populao infinita sem reposio) verifica estas condies. Uma amostra (retirada de uma populao finita
sem reposio) no verifica a condio de independncia entre variveis aleatrias X1, X 2,... X n , pelo que
se designa por amostra aleatria mas no por amostra aleatria simples.
nota 2: Em termos prticos, costuma considerar-se que se tem uma populao infinita quando a fraco de
amostragem

n
, inferior a 5%, isto , quando M > 20 N.
M

nota 3: no que se segue, sempre que fizermos referncia a uma amostra aleatria estaremos a referir-nos a
uma amostra aleatria nas condies anteriormente descritas.

1.3. Distribuies Amostrais das estatsticas mais importantes


1.3.1. Algumas estatsticas amostrais
Identificada a populao e o parmetro ou parmetros da populao sobre os
quais incide o estudo estatstico, segue-se a obteno duma amostra aleatria.
Chama-se estatstica amostral a uma caracterstica da amostra, ou seja, uma
funo da amostra, que no envolve nenhum parmetro desconhecido e que
deve ser cuidadosamente obtida, por forma a fornecer a melhor estimativa
possvel para o parmetro da populao sobre o qual incide o estudo. Sendo a
Estatstica uma caracterstica da amostra, depende desta e portanto assume
valores diferentes para diferentes amostras, sendo assim uma varivel aleatria.
Utilizam-se estatsticas para estimar os valores dos parmetros da populao
que se pretendem estudar;

ISEL DEETC

INFERNCIA ESTATSTICA

Seja X1, X 2 ,..., X n , uma amostra aleatria i.i.d. de dimenso n, as estatsticas


amostrais mais comuns so:

Mdia Amostral X

X
i 1

Varincia e Desvio Padro Amostral

o Corrigida (utiliza-se se n 30)


n

S 2

( X
i 1

n 1

S S
'

X )2
S 2'

i 1

nX 2

2
i

n 1

2'

o No corrigida (utiliza-se se n> 30)

S2

( X
i 1

S S

X )2

S2

X
i 1

2
i

nX 2

Proporo Amostral
Quando a amostra obtida a partir duma populao de Bernoulli com
parmetro p, a mdia amostral ou proporo amostral o nmero de
elementos em n, que possuem determinado atributo. Tendo-se para

i 1,.., n
1 , sucesso
Xi
,
0 , insucesso
n

X
i 1

representa o nmero total de sucessos na amostra, logo

proporo de sucessos na amostra dada por:


n

ISEL DEETC

X
i 1

10

INFERNCIA ESTATSTICA

A utilizao das estatsticas amostrais pressupe o conhecimento das


distribuies de probabilidade (ou tambm distribuies amostrais) das
mesmas, j que se trata de variveis aleatrias. Para obter a distribuio
amostral duma estatstica podemos proceder de dois modos:
1. Utilizar a distribuio conjunta da amostra;
2. Obter sucessivas amostras e calcular, para cada uma delas, o valor
concreto da estatstica que se pretende. Deste modo possvel obter a
distribuio amostral com base na distribuio de frequncias dos
valores concretos obtidos para a estatstica nas vrias amostras.

Exemplo 2
Considere-se uma populao constituda por 5 indivduos com as seguintes
alturas (expressas em metros):
Indivduo
Altura

1
1,7

2
1,72

3
1.75

4
1,75

5
1,82

Seja X a altura de um indivduo seleccionado ao acaso da populao.A mdia


da caracterstica em estudo na populao X 1,748 metros.
Objectivo: definir a distribuio amostral da estatstica X , a mdia amostral
calculada com base em amostras de dimenso 2 X1 , X 2 , obtidas por um
processo aleatrio com reposio (25 amostras possveis).

Metodologia: Obter todas as amostras de dimenso 2 (com reposio), calcular


o valor da estatstica X para cada uma delas e depois representar a distribuio
de frequncias dos valores obtidos.
Amostras Indivduos
1
2
3
4
5
6
7
8
9
10

ISEL DEETC

1,1
1,2
1,3
1,4
1,5
2,1
2,2
2,3
2,4
2,5

X1
1,7
1,7
1,7
1,7
1,7
1,72
1,72
1,72
1,72
1,72

X2
1,7
1,72
1,75
1,75
1,82
1,7
1,72
1,75
1,75
1,82

Mdia
Amostral

Valor particular da
estatstica x ;
Estimativa de

1,700
1,710
1,725
1,725
1,760
1,710
1,720
1,735
1,735
1,770

11

INFERNCIA ESTATSTICA

11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

3,1
3,2
3,3
3,4
3,5
4,1
4,2
4,3
4,4
4,5
5,1
5,2
5,3
5,4
5,5

1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,75
1,82
1,82
1,82
1,82
1,82

1,7
1,72
1,75
1,75
1,82
1,7
1,72
1,75
1,75
1,82
1,7
1,72
1,75
1,75
1,82

1,725
1,735
1,750
1,750
1,785
1,725
1,735
1,750
1,750
1,785
1,760
1,770
1,785
1,785
1,820

Apresenta-se na tabela seguinte a distribuio de frequncias da mdia


amostral (observaes obtidas na ltima coluna da tabela anterior).

X2

1,7

1,71 1,72 1,725 1,735 1,75 1,76 1,77 1,785 1,82

Probabilidade 0,04 0,08 0,04 0,16

0,16 0,16 0,08 0,08 0,16 0,04

X 2 1,748
X 2 0,028775

Histogram

10

Frequency

0
1,700

1,725

1,750

1,775

1,800

1,825

Mdia2

Se repetirmos a metodologia utilizada anteriormente, considerando agora


amostras de dimenso 3 (125 amostras possveis), obtm-se os seguintes
resultados:

X3

1,7

1,707

1,713

1,717

1,72

1,723

1,73

1,733

1,74

1,747

1,75

1,753

1,757

Probab.

0,008

0,024

0,024

0,048

0,008

0,096

0,048

0,096

0,12

0,048

0,064

0,024

0,096

ISEL DEETC

12

INFERNCIA ESTATSTICA

X3

1,763 1,773

1,78

1,787 1,797

1,82

Probab. 0,096 0,096 0,024 0,024 0,048 0,008

X3 1,748
X3 0,023495

Histogram

25

Frequency

20

15

10

0
1,700

1,725

1,750

1,775

1,800

1,825

Mdia3

Podemos observar que:


1. E(X) X
2. Quando a dimenso da amostra aumenta, diminui a variabilidade
apresentada pela distribuio de amostragem.
3. Quando a dimenso da amostra aumenta, a distribuio de X tende para
uma distribuio normal.
4. O processo utilizado para obter a distribuio de amostragem
impraticvel, mesmo para populaes razoavelmente pequenas.

1.3.2. A Lei dos Grandes Nmeros e o Teorema do Limite


Central
Os resultados obtidos com estas duas leis da Estatstica tm uma importncia
fundamental na Inferncia Estatstica. Assim, antes de apresentarmos as
distribuies amostrais das estatsticas, vamos apresentar os resultados dos
referidos teoremas.
A Lei dos Grandes Nmeros
A Lei dos grandes nmeros baseia-se na desigualdade de Chebychev:

ISEL DEETC

13

INFERNCIA ESTATSTICA

Sendo X uma varivel aleatria com mdia e varincia 2 e um qualquer


valor real positivo, ento:
P[ X ]

Var(X)

Com base nesta desigualdade define-se a Lei dos grandes nmeros:

Seja

X1, X 2 ,... X n

uma

amostra

aleatria

de

E( X i ) , Var ( X i ) 2, i 1,..., n e seja T X1 X 2

dimenso

n,

com

X n . Verifica-se que

para qualquer 0

lim P n
n

1.

medida que n aumenta, a probabilidade de os desvios entre a mdia amostral


e a mdia populacional se tornarem mais pequenos que um valor qualquer

0 tende para 1.
O Teorema do Limite Central

O teorema do limite central um dos desenvolvimentos tericos mais


importantes no domnio da estatstica, tendo assim inmeras aplicaes, em
particular no mbito das distribuies amostrais. A sua demonstrao no
aqui fornecida devido ao seu elevado nvel de complexidade.
Como sabemos as distribuies Binomial, Poisson ou Normal gozam da
propriedade reprodutiva (so sob certas condies fechadas para somas), no
entanto, nem todas as distribuies gozam desta caracterstica, pelo que se
torna

importante

obter

formas

de

calcular

valores

aproximados

de

probabilidades relativas a acontecimentos que envolvem, somas ou mdias de


variveis aleatrias independentes e identicamente distribudas (i.i.d.). A
soluo para estas situaes est precisamente no teorema do limite central.

Teorema do limite central

ISEL DEETC

14

INFERNCIA ESTATSTICA

Seja X1, X 2 ,..., X n , uma amostra aleatria de variveis i.i.d., de dimenso n, com
E( X i ) , Var ( X i ) 2, i 1,..., n .

As

estatsticas

(variveis

aleatrias)

T X1 X 2

Xn e X

X
i 1

, para valores de n grandes (n> 30), seguem

distribuio aproximadamente normal, tal que:

N( T ,T ) , com

T n
T n

N( X , X ) , com

X
X / n

ou seja, a varivel

T n

. n

N (0,1)

segue aproximadamente ( ) uma distribuio normal reduzida. Dividindo o


numerador e o denominador por n obtm-se tambm:

N (0,1)

CASO

PARTICULAR: Quando a populao donde retirada a amostra segue

distribuio normal tem-se, para qualquer dimenso amostral, resultados que


deixam de ser aproximados e passam a ser exactos:

N( T ,T ) , com

T n
T n

N( X , X ) , com

ISEL DEETC

X
X / n

15

INFERNCIA ESTATSTICA

Note-se que este teorema de tal modo abrangente que no impe nenhuma
condio no que respeita distribuio da populao. Qualquer que ela seja, as
variveis T (que representa o total da amostra) e X (a mdia amostral) tm uma
distribuio aproximadamente normal, exigindo-se apenas que a amostra seja
constituda por variveis i.i.d, com dimenso suficientemente elevada,
geralmente n> 30. Neste caso a aproximao tanto melhor quanto maior for a
dimenso amostral.

Exemplos de aplicao do Teorema de limite central ao clculo de


probabilidades sobre as variveis aleatrias T e X .
Exemplo 1: Considere que a voltagem de rudo num canal de transmisso
uma varivel aleatria X que segue uma distribuio normal com parmetros

3 e 2 . Obteve-se uma amostra aleatria de dimenso 20 de observaes


independentes desta mesma varivel. Determine a distribuio seguida pela
mdia dessa amostra, e a P( X 2,5) ?
Resoluo:

Por aplicao do teorema do limite central, a mdia da amostra segue


exactamente uma distribuio normal porque a amostra provm de uma
populao normal. Assim tem-se:

E( X i ) 3
2 Var ( X i ) 4, i 1,...,20
Xi

N( 3, 2), i 1,...,20

N X 3, X
e
20

X 2,5 3
P ( X 2,5) P

(1,12) 1 0,8686 0,1314 .


/ n 2 / 20

Exemplo 2: Considere agora que X uniformemente distribuda no intervalo


[0,10]. Diga qual a dimenso mnima aconselhvel da amostra a seleccionar,
para poder utilizar o T.L.C. no clculo da probabilidade de que a mdia das

ISEL DEETC

16

INFERNCIA ESTATSTICA

voltagens, na amostra, seja inferior a 4? Determine a referida probabilidade


para n=50.
Resoluo:

Neste caso como a populao no tem distribuio normal, pelo que s se deve
utilizar o T.L.C. caso a amostra tenha no mnimo dimenso 30.
Com n=50, e a populao com distribuio uniforme tem-se:

E ( X i ) (0 10) / 2 5
2 Var ( X i ) 102 /12 100 /12, i 1,...,50
N( , / n ) , ou seja X

Pelo T.L.C. X

N( X 5, X 1/ 6) , logo

X 45
P

P (Z 6) ( 2,45) 0,0071 .
/ n 1/ 6

O teorema do limite central vlido para somas e mdias aritmticas de v.a.


quer discretas quer contnuas. Assim, este teorema justifica tambm as
aproximaes distribuio normal da distribuio Binomial e de Poisson.

Aproximaes de distribuies:
varivel aleatria original

v. a. aproximativa

condies para aproximar

X ~ Hipergeomtrica (N, n, p)

X ~ Binomial(n, p)

n < 0,1 N

X ~ Binomial (n, p)

X ~ Poisson (np)

n > 20 e p < 0,1

X ~ Binomial (n , p)

X ~ Normal (np, np(1-p))

np > 5 e n(1-p) > 5

X ~ Poisson ()

X ~ Normal (,

> 20

Correco de continuidade
A correco de continuidade deve efectuar-se pois permite melhorar a qualidade da
aproximao de uma varivel discreta (com distribuio Binomial ou Poisson) por uma varivel
contnua com distribuio normal.Com X a varivel aleatria discreta e X a varivel aleatria
aproximativa contnua, tem-se:
P( X x)

P( x 12 X x 12 )

P(a X b)

P(a 12 X b 12 )

P( X x) P( X x 1)

ISEL DEETC

P X ( x 1) 12

17

INFERNCIA ESTATSTICA

1.4. Distribuies Amostrais Tericas


Estas distribuies tm o nome de distribuies amostrais tericas porque
so distribuies amostrais seguidas pelas estatsticas mais importantes, ou
seja, que mais se utilizam na inferncia estatstica (matria que vamos
estudar nos prximos dois captulos). Alm da distribuio normal, existem
outras distribuies que se utilizam com muita frequncia na inferncia
estatstica, entre elas: a distribuio do qui-quadrado, a t-student e a FSnedcor.

1.4.1.Distribuio do Qui-quadrado
Esta

distribuio

de

probabilidade

de

varivel

contnua,

utiliza-se

particularmente na inferncia estatstica, e est muito relacionada com a


distribuio normal. Assim, considere-se um conjunto de n variveis aleatrias
com distribuio normal reduzida, Zi ~ N 0,1 , i 1,..., n , independentes e
identicamente distribudas.
n

A varivel aleatria X , definida por X Zi2 , segue uma distribuio quii 1

quadrado com n graus de liberdade e escreve-se X ~ (2n ) .


A funo densidade de probabilidade de X ~ (2n ) dada por:

f x

onde

se

1
x
n 1
e 2 x 2 com n 0, x 0 ,
n
n
2 2
2

designa

por

funo

gama

representa

integral

e x dx com 0 .

Propriedades e resultados importantes


1.

Se X ~ (2n ) ento demonstra-se que E X n e VAR X 2n ;

ISEL DEETC

18

INFERNCIA ESTATSTICA

2. Aditividade: se as variveis aleatrias X i , i 1,..., n , so independentes tais


que X i ~ (2n ) , i 1,..., n , ento
i

i 1

i 1

X i ~ 2m , sendo m ni .

3. O aspecto grfico da funo de densidade de probabilidade de X ~ (2n ) ,


depende de n (que o parmetro que caracteriza a distribuio). A funo
densidade de probabilidade de X ~ (2n ) uma funo positiva e assimtrica,
tornando-se mais simtrica medida que o nmero de graus de liberdade
aumenta.

Aspecto grfico da funo de densidade

Por aplicao do teorema do limite central, a distribuio do qui-quadrado


tende para a normal medida que o nmero de graus de liberdade aumenta.
Com X ~ (2n ) , quando n , tem-se X

N n, 2n

ou

X n
2n

N 0,1 .

4 . Com X i , i 1,..., n , variveis normais com valor mdio i e desvio padro


X i
i , a varivel Q i

i
i 1
n

2 (n ) , ou seja, a soma dos quadrados de n

variveis aleatrias com distribuio normal padro, uma varivel com


distribuio do qui-quadrado com n graus de liberdade.

ISEL DEETC

19

INFERNCIA ESTATSTICA

O clculo de probabilidades pode ser feito recorrendo a:

- tabela da funo de distribuio acumulada da distribuio qui-quadrado;


- mquina de calcular;
- Excel (menu principal ferramentas inserir funo funo estatstica quiquadrado)

Notao:
Com X

n2 , n2,p representa o quantil (valor da varivel x) para o qual a

probabilidade acumulada p, ou seja: P( X n2,p ) p .

Exemplo: Considere as variveis aleatrias independentes com distribuio


normal

estandardizada,

Y X12 X 22

X , X ,..., X .
1

Defina-se

outra

varivel

X n2 .

(a) Identifique a distribuio de Y, e calcule a sua mdia e varincia.


(b) Determine os percentis 0.5, 1, 2.5, 5 e10 de Y, para n=12.
(c) Suponha n=15 e determine: P(Y 11.0) e P(Y 7.26) .
Resoluo:

(a) Y

n2 , sendo E(Y ) n e Var (Y ) 2n .

(b) Com n=12, temos Y

122

O percentil 0.5 o valor da varivel Y para o qual a funo de distribuio


2
2
) 0.005 12,0.005
3,07 .
igual a 0.5/100=0.005, ou seja P(Y 12,0.005
2
2
) 0.01 12,0.01
3,57
Percentil 1: P(Y 12,0.01
2
2
) 0.025 12,0.025
4,40
Percentil 2.5: P(Y 12,0.025
2
2
) 0.05 12,0.05
5,23
Percentil 5: P(Y 12,0.05

2
2
) 0.1 12,0.1
6,30
Percentil 10: P(Y 12,0.1

(c) Com n=15, temos Y

ISEL DEETC

152

20

INFERNCIA ESTATSTICA
2
P (Y 11.0) 1 P (Y 11.0), por consulta da tabela, 15,0.25
11.0,ento

P (Y 11.0) 1 0,25 0,75


2
Como 15,0.05
7.26 ento P(Y 7.26) 0,05 .

1.4.2. Distribuio t-Student


A distribuio t-student uma distribuio de probabilidade de uma varivel
contnua, e como no caso da distribuio qui-quadrado, tambm s tem um
parmetro que a caracteriza, o nmero de graus de liberdade. muito utilizada
para fazer inferncia sobre a mdia de uma populao normal, no caso em que
a varincia populacional desconhecida. Est relacionada com as distribuies
normal e qui-quadrado do modo que se segue:
considerem-se as variveis aleatrias independentes, Z ~ N 0,1 e Y ~ (2n ) .
A distribuio da varivel aleatria X

Z
Y

designa-se por distribuio t de

Student com n graus de liberdade e escreve-se X ~ t n .


A funo densidade de probabilidade de X ~ t n dada por:

n 1
n 1

2 2

x
2 1
f x
com n 0 , x

n
n
n
2

Propriedades e resultados importantes


1. Se X ~ t n ento demonstra-se que

E X 0 para n 1 ; VAR X

n
n2

n 2

2. O aspecto grfico da funo de densidade de probabilidade de X ~ t n ,


depende de n. A funo de densidade de probabilidade de X ~ t
n

simtrica em relao ao eixo OY.

ISEL DEETC

21

INFERNCIA ESTATSTICA

Aspecto grfico da funo de densidade

3. Por aplicao do teorema do limite central,


quando n , X

n
N 0,

n 2

ou

X
n
n2

N 0,1

O clculo de probabilidades pode ser feito recorrendo a:


- tabela da funo de distribuio acumulada da t-student;
- mquina de calcular;
- Excel (menu principal ferramentas inserir funo funo estatstica
t-student)

Notao: Com X

t( n ) , t n,p representa o quantil (valor da varivel x) para o qual

a probabilidade acumulada p, ou seja: P( X tn,p ) p .


Devido simetria da funo de densidade, demonstra-se que:
tn,p tn,1 p

Exemplo: Com T

t12 , determine P(3,055 T 1,782) .

Resoluo:

Como t12,0.995 3,055 e t12,0,95 1,782 ento P( 3,055 T 1,782) 0,95 (1 0,995) 0,945.

ISEL DEETC

22

INFERNCIA ESTATSTICA

1.4.3.Distribuio F-Snedcor
A distribuio F-Snedcor uma distribuio de probabilidade de uma varivel
contnua, com dois parmetros, geralmente m e n, que so inteiros positivos,
designados por graus de liberdade. Esta distribuio particularmente til para
proceder comparao da variabilidade de populaes (permite fazer
inferncia sobre as varincias de duas populaes), utilizando-se o quociente
das varincias amostrais.
Assim, considerem-se as variveis aleatrias, independentes,

X 2 ~ . A varivel aleatria X
2
( n)

X1
X2

X1 ~ 2m e

m , segue uma distribuio F-Snedcor


n

com m (nmero de graus de liberdade do numerador) e n (nmero graus de


liberdade do denominador), escrevendo-se: X

F(m, n) .

A funo densidade de probabilidade de X ~ F(m, n) dada por:

mn
m 2
m

2
x
2 m

f x
, x 0 , com m, n >0

mn
m n n
2
m

1 n x
2 2

Propriedades e resultados importantes


1. Se X ~ F(m, n) ento demonstra-se que,

EX

2n 2 .(m n 2)
n
, n4
para n 2 ; VAR X
2
n2
m n 2 (n 4)

2. A distribuio de X no simtrica. O aspecto grfico da funo de


densidade de probabilidade de X ~ F(m, n) , depende de m e n.

ISEL DEETC

23

INFERNCIA ESTATSTICA

Aspecto grfico da funo de densidade

3. Se a varivel aleatria X

F(m, n) , ento

1
X

F(n, m) .

4. O quadrado de uma varivel aleatria com distribuio t-student com n


graus de liberdade tem uma distribuio F com 1 e n graus de liberdade,
ou seja, T

t( n ) ento T 2

F(1, n ) .

O clculo de probabilidades pode ser feito recorrendo a:


- tabela da funo de distribuio acumulada da F-Snedcor;
- mquina de calcular;
- Excel (menu principal ferramentas inserir funo funo estatstica
F-Snedcor)

Notao:
Com X

F(m, n) , F(m, n; p) representa o quantil (valor da varivel x) para o

qual a probabilidade acumulada p, ou seja: P[ X F(m, n; p)] p .

O quantil F(m, n; p) pode ser obtido atravs do quantil F(n, m;1- p) a partir da
relao:

F(m, n; p)

ISEL DEETC

1
F(n, m;1 p)

24

INFERNCIA ESTATSTICA

Exemplo: Considere a v.a. X

F(m 15, n 20) . Determine os valores de x0

tais:
(a) P( X x0 ) 0,05 ;
(b) P( X x0 ) 0,01.

Resoluo:

(a)

P ( X x0 ) 0,05 P ( X x0 ) 0,95
Como F(15, 20, 0.95) 2,20 ento x0 2,20
(b) P( X x0 ) 0,01

F(15,20;0,01)

1
1

0,297
F(20, 15; 0,99) 3,37

Como F(15, 20, 0.01) 0,297 ento x0 0,297 .

1.5. Distribuies Amostrais das estatsticas mais importantes


Vamos apresentar as distribuies das estatsticas amostrais de forma sucinta e
no fazendo as respectivas demonstraes. Estas distribuies podem ser
exactas ou aproximadas, dependendo da dimenso da amostra e da distribuio
da populao (que pode ou no ser conhecida).

No que se segue vamos considerar X1, X 2,... X n , uma amostra de variveis


aleatrias i.i.d. proveniente de uma populao cuja distribuio, caso seja
conhecida, se especifica para cada um dos casos. Quando se tiverem duas
populaes, vamos considerar duas amostras aleatrias independentes,

X1, X 2,... X n e Y1,Y2,...Yn , ambas compostas por variveis aleatrias i.i.d.


obtidas a partir dessas duas populaes cuja distribuio pode ou no ser
conhecida.

ISEL DEETC

25

INFERNCIA ESTATSTICA

1.5.1.Distribuio da mdia amostral ( X )


Quando se pretende obter a distribuio da mdia amostral e a amostra

X1, X 2,... X n tem provenincia numa populao com distribuio normal com
varincia 2 conhecida o teorema da aditividade da distribuio normal
permite-nos concluir que:

N , / n

e portanto pela estandardizao obtemos

N (0,1) .

/ n

No caso da populao no ter distribuio conhecida, desde que se conhea a


mdia e o desvio padro populacionais e a dimenso da amostra seja grande
(usualmente considera-se razovel n> 30) a aplicao do teorema do limite
central permite-nos concluir que a mdia amostral tem distribuio
aproximadamente normal:
X

N( , / n )

obtendo-se uma vez mais pela estandardizao

/ n

N (0,1) .

Noutro caso, bastante mais prximo da realidade, considera-se uma amostra


proveniente de uma populao com varincia 2 desconhecida.
Nesta situao demonstra-se que:

X
S / n

Se a populao for normal e n

Se n > 30 para qualquer tipo de populao:

30:

t n 1
X
S/ n

N (0,1)

1.5.2.Distribuio da varincia amostral


Com X1, X 2,... X n uma amostra aleatria obtida a partir de uma populao
normal de parmetros e 2 , sendo as variveis X e S 2 (ou S 2 )
independentes, e desconhecido tem-se as seguintes distribuies:

ISEL DEETC

26

INFERNCIA ESTATSTICA

nS 2

n21 ou

(n 1).S2

n21 .

Deve-se utilizar a varincia amostral corrigida, S 2 , quando n 30.

1.5.3. Distribuio da proporo amostral ( p )


Com X1, X 2,... X n uma amostra aleatria obtida a partir de uma
populao de Bernoulli, tendo-se para i 1,.., n

1 , sucesso
,
Xi
0 , insucesso
n

X
i 1

representa o nmero total de sucessos na amostra, logo

proporo de sucessos na amostra dada por:


n

X
i 1

quando a dimenso da amostra grande (n > 30) tem-se:

p X

N ( p, p(1 p ) / n )

logo

X p
p(1 p) / n

N (0,1) .

1.5.4.Distribuio da diferena entre duas propores ( p1 p2 )


Com duas amostras aleatrias independentes, X1, X 2,... X n1 e Y1,Y2,...Yn 2 ,
obtidas a partir de duas populaes de Bernoulli, com n1 30 e n2 30 temse:

p1 p 2

N p1 p2 ,

p1(1 p1 ) p2 (1 p2 )

n1
n2

logo

( p1 p 2 ) ( p1 p2 )
p1(1 p1 ) p2 (1 p2 )

n1
n2

N (0,1)

nota : X1 X 2 p1 p 2 .

S12
1.5.5. Distribuio do quociente de varincias amostrais 2
S2

ISEL DEETC

27

INFERNCIA ESTATSTICA

Com duas amostras aleatrias independentes, X1, X 2,... X n1 e Y1,Y2,...Yn 2 ,


obtidas, respectivamente a partir de duas populaes normais tais que

N( 1 , 1 ) e Y

N(2 , 2 ) , tem-se:

S12 22
2. 2
S2 1

F(n1 -1, n2 1) .

1.5.6.Distribuio da diferena entre mdias amostrais ( X1 X 2 )

Para duas populaes normais com 12 e 22 conhecidas:

( X1 X 2 ) ( 1 2 )

12
n1

22

N (0,1)

n2

Para duas populaes com qualquer distribuio, com 12 e 22


conhecidas, desde que n1 30 e n2 30 :

( X1 X 2 ) ( 1 2 )

12
n1

22

N (0,1)

n2

Para duas populaes com qualquer distribuio, 12 e 22


desconhecidas, desde que n1 30 e n2 30 :

( X1 X 2 ) ( 1 2 )
S12 S22

n1 n2

N (0,1)

Para duas populaes normais, 12 e 22 desconhecidas mas iguais


( 12 22 ), com n1 30 e n2 30 :

( X1 X 2 ) ( 1 2 )
(n1 1).S12 (n2 1)S22 1 1
.
n1 n2 2
n1 n2

t n1 n2 2

Apresenta-se seguidamente um quadro resumo com as distribuies amostrais


mais importantes. Na ltima coluna do quadro encontra-se a distribuio de
ISEL DEETC

28

INFERNCIA ESTATSTICA

cada uma das estatsticas consideradas. O ttulo dessa coluna varivel fulcral
por ser este o nome que usualmente utilizado quando se faz referncia a estas
estatsticas na estimao de parmetros (matria que ser estudada no prximo
captulo).
Quadro resumo das distribuies das estatsticas mais importantes
Parmetro

2
conhecido?

Tipo de
populao

Dimenso
da amostra

Normal

Qualquer

N 0,1

Sim
Qualquer

n 30

Normal

n 30

Normal
ou outra

n 30

Normal

Qualquer

No

Distrbuio amostral da Varivel fulcral

N 0,1

n
X
t n 1
S
n
X
N 0,1
S
n
S2
n 1 2 2n 1

p p

1 2

1 2

12 e 22
conhecidas

12 e 22
desconhecidas

Bernoulli

n 30

Normais

Quaisquer

desconhecidas
( 1

22 )

p1 p2

12
22

22
n2

( X1 X 2 ) ( 1 2 )

Normais
ou outras

n1 30 e n2 30

Normais

n1 30 e
n2 30

Bernoulli

n1 30 e n2 30

Normais

ISEL DEETC

12
n1

12 e 22

1 2

N 0,1
p 1 p
n
( X1 X 2 ) ( 1 2 )
N (0,1)

Quaisquer

S12 S22

n1 n2

N (0,1)

( X1 X 2 ) ( 1 2 )
(n1 1).S12 (n2 1)S22 1 1
.
n1 n2 2
n1 n2
( p1 p 2 ) ( p1 p2 )
N (0,1)
p1(1 p1 ) p2 (1 p2 )

n1
n2

S12 22
2. 2
S2 1

F(n1 -1, n2 1)

29

t n1 n2 2