Vous êtes sur la page 1sur 137

UNIVERSIDADE FEDERAL DE VIOSA

CAMPUS DE RIO PARANABA


















APOSTILA DA DISCIPLINA
CRP 192 INICIAO ESTATSTICA




Prof. Carlos Eduardo Magalhes dos Santos
Prof. Pedro Ivo Vieira God Good






Rio Paranaba, MG
2010/II
UNIVERSIDADE FEDERAL DE VIOSA
Campus de Rio Paranaba
CRP 192 Iniciao Estatstica 2010/II Turma 4

Prof. Carlos Eduardo Magalhes dos Santos
Prof. Pedro Ivo Vieira God Good

1. CONTEDO

Captulo 1 Introduo a Estatstica
Captulo 2 Estatstica descritiva
Captulo 3 - Amostragem
Captulo 4 Teoria da probabilidade
Captulo 5 Variveis aleatrias discretas e contnuas
Captulo 6 Esperana matemtica, varincia e covarincia
Captulo 7 Distribuies de variveis aleatrias discretas e contnuas
Captulo 8 Testes de significncia: qui-quadrado, Z, F e t
Captulo 9 Correlaes e Regresso linear simples

2. AVALIAES

Prova Data Horrio Local
1 10/09 (Sex) 08:00 CRP 212
2 29/10 (Sex) 08:00 CRP 212
3 03/12 (Sex) 08:00 CRP 212
4 10/12 (Sex) 08:00 CRP 212

O sistema de avaliao constar de:

Avaliaes Peso
Prova 1 30%
Prova 2 30%
Prova 3 30%
Avaliao (Assiduidade, participao e sabatinas espontneas) 10%

Ser aplicada uma quarta prova escrita com peso de 30%, que abordar todo o
assunto do semestre, para o estudante que perder pelo menos umas das trs provas por
qualquer motivo ou deseje melhor a nota final. O clculo do rendimento acadmico ser
realizado tomando-se os trs maiores valores das provas realizadas mais o valor da
avaliao do aluno.
Levar tabelas dos testes de hipteses e calculadora para as provas, pois so de
uso individual.
As listas de exerccios sugeridos devero ser entregues, impreterivelmente, no
dia da realizao da prova daquele contedo.
No momento das provas no ser permitida qualquer comunicao entre os alunos
e utilizao de meios ilcitos (cola), provocando cancelamento da prova do(s) aluno(s)
interceptado(s).
O professor marcar um nico perodo de reviso para cada uma das provas que
dever ser respeitado, dando que no sero abertas excees para revises de provas
fora do perodo estabelecido. O perodo de reviso de prova ser divulgado no quadro de
avisos do Campus.
A data da prova final ser marcada pelo Registro Escolar.
3. BIBLIOGRAFIA

BANZATTO, D. A.; KRONKA, S. N. Experimentao agrcola. FUNESP, Jaboticabal,
1989. 249 p.
GOMES, F. P. Curso de estatstica experimental. 12 edio, Livraria Nobel S.A., So
Paulo, 1987. 467 p.
MONTGOMERY, D. C. e RUNGER, G. C. Estatstica aplicada e probabilidade para
engenheiros. 2 edio, LCT Editora, Rio de Janeiro, 2003. 463 p.
RIBEIRO JNIOR, J. I. Anlises estatsticas no Excel guia prtico. Editora UFV,
Viosa, 2004. 249 p.
VIEIRA, S.; HOFFMANN, R. Estatstica experimental. Editora Atlas, So Paulo, 1989,
179 p.

4. PLANEJAMENTO

Aula Dia Assunto
01 10/08 Apresentao da disciplina
02 13/08 Conceitos introdutrios
03 17/08 Estatstica descritiva
04 20/08 Apresentao grfica e tabular
05 24/08 Medidas de posio e disperso
06 27/08 Aplicaes da estatstica descritiva
07 31/08 Amostragem: conceitos
08 03/09 Exerccios
09 07/09 Feriado (Independncia do Brasil)
10 10/09 Prova 1
11 14/09 Teoria e Conceitos de probabilidade
12 17/09 Teoremas para clculo de probabilidades
13 21/09 Teorema de Bayes
14 24/09 Variveis aleatrias: conceitos
15 28/09 Variveis aleatrias contnuas
16 05/10 Variveis aleatrias discretas
17 08/10 Feriado (Nossa Senhora Aparecida)
18 12/10 Funes de variveis aleatrias
19 15/10 Funo probabilidade e densidade
20 19/10 Esperana matemtica, varincia e covarincia
21 22/10 Propriedades e aplicaes
22 26/10 Distribuies de variveis aleatrias discretas
23 29/10 Prova 2
24 02/11 Feriado (Finados)
25 05/11 Distribuio binomial e Poisson
26 09/11 Distribuio de variveis aleatrias contnuas
27 12/11 Aplicaes da distribuio normal
28 16/11 Testes de significncia
29 19/11 Teste Z e t
30 23/11 Teste F e Qui-quadrado
31 26/11 Correlaes
32 30/11 Regresso linear simples
33 03/12 Prova 3
34 07/12 Resoluo de exerccios
35 10/12 Prova 4

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

1

1.0 - INTRODUO ESTATSTICA

Estatstica uma rea da cincia ligada com a extrao de informao de
dados numricos e a sua utilizao na tomada de decises (estabelecimento de
inferncias) sobre uma populao da qual os dados foram obtidos. Corresponde ao
campo da cincia que trata da coleo, apresentao, anlise e uso de dados
numricos para a tomada de decises e soluo de problemas.
Ao iniciarmos o estudo da estatstica nos deparamos com dvidas de assuntos
de ordem prtica e que esto intimamente ligados teoria. Um das perguntas mais
freqentes : que tipo de anlise pode ser feita para os dados que se dispe? A dvida
muitas vezes surge depois que os dados j esto disponveis. Na verdade a pergunta
inicial deveria ser: qual o tipo de dado preciso levantar na pesquisa?
Podemos definir populao como sendo o conjunto de elementos que tm, em
comum, determinada caracterstica. As populaes podem ser finitas ou infinitas. Alm
disso existem populaes que, embora finitas, so consideradas infinitas para
qualquer finalidade prtica.
Entende-se por amostra qualquer conjunto de elementos retirado da populao,
desde que esse conjunto seja no-vazio e tenha menor nmero de elementos do que a
populao.
Por exemplo, na predio da frao de agricultores que preferem a marca de
tratores Forto ns assumimos que aqueles que forem entrevistados constituem uma
amostra representativa da populao de todos os agricultores (que apesar de
numericamente ser uma populao finita, pode ser considerada infinita para efeitos
prticos).
Como outro exemplo considere o problema de determinar a efetividade de
proteo contra a ferrugem de um certo tipo de tinta. Para simplificar suponhamos que
20 mquinas que trabalham nas mesmas condies foram pintadas e aps um certo
perodo de tempo verificou-se que 16 delas conservam-se intactas (ainda protegidas).
Quer-se saber se essa tinta protege realmente as mquinas. Nesse caso a amostra
consiste de 20 mquinas. Qual seria a populao.
O que seria, ento, de interesse primrio? A amostra ou a populao?
Nos exemplos citados acima ns estamos primordialmente interessados na
populao. Na maioria dos casos seria impossvel obtermos todos os dados de
interesse da populao. Portanto, a amostra pode ser de interesse imediato, mas
Captulo 1 Introduo Estatstica
_____________________________________________________________________
___________________________________________________________________________________


2
estamos primordialmente interessados em descrever a populao da qual a amostra
foi extrada.
Como coletar os dados? Em toda a populao ou em amostra? Realizar
amostragem probabilstica ou no probabilstica? Dados secundrios ou dados
primrios? Que tipo de anlise? Estatstica descritiva? Inferncia estatstica? Como
apresentar? Graficamente? Tabela? Que tipo de grfico? Quais interpretaes a partir
das anlises feitas?
Para efeitos prticos e de estudo divide-se a estatstica em trs partes:
estatstica descritiva; probabilidade; inferncia estatstica. Podemos adiantar que o
nmero de metodologias de anlises que podem ser feitas enorme e entra no que
chamamos de auxlio tomada de decises.

Por que estudar estatstica?
Qualquer um, tanto na carreira profissional quanto na vida diria atravs do
contato com jornais, televiso, e outros meios de divulgao de informaes se
deparam com informaes na forma de dados numricos.
Possveis razes para o estudo da Estatstica:
Atualizao
Para facilitar o entendimento de artigos em revistas especializadas, que
utilizam muito a estatstica para a apresentao e interpretao dos
resultados.
Desenvolvimento de trabalhos
de fundamental importncia para o auxlio no desenvolvimento de
trabalhos cientficos e posteriores concluses.

J que engenheiros e demais cientistas frequentemente se vem obtendo e
analisando dados, o conhecimento de estatstica especialmente importante nesses
campos da cincia. Poderamos dizer que o conhecimento de estatstica e
probabilidade pode ser uma ferramenta poderosa para ajudar esses profissionais na
idealizao de novos produtos e sistemas, melhorando idias j existentes e
idealizando, desenvolvendo e melhorando processos de produo.



CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

3

1.1 Somatrio

Muitos dos processos estatsticos exigem o clculo da soma. Para simplificar a
representao da operao de adio nas expresses algbricas, utiliza-se a notao

, letra grega sigma maisculo.


As principais representaes so:
1)
n 2 1
n
1 i
i
X ... X X X + + + =

=
, soma simples
L-se

=
n
1 i
i
X como: somatrio de X ndice i, com i variando de 1 at n, onde:
n, a ordem da ltima parcela ou limite superior (LS) do somatrio;
i = 1, a ordem da primeira parcela da soma ou limite inferior do somatrio (L
I
i, o ndice que est indexado os valores da varivel X (outras letras como j, l, k
podem ser utilizadas).
);
2)
2
n
2
2
2
1
n
1 i
2
i
X ... X X X + + + =

=
, soma de quadrados (SQ)
3) ( )
2
n 2 1
2
n
1 i
i
X ... X X X + + + = |
.
|

\
|

=
, quadrado da soma
4)
n n 2 2 1 1 i
n
1 i
i
Y X ... Y X Y X Y X + + + =

=
, soma de produtos (SP)
5) ( ) ( )
m 2 1 n 2 1
m
1 j
j
n
1 i
i
Y ... Y Y x X ... X X Y X + + + + + + =

= =
, produto das somas.

Exemplo:

Considera as variveis X e Y que representam, respectivamente, as notas de
duas disciplinas, para um grupo de 6 alunos.
X = { } 60 , 100 , 98 , 97 , 95 , 90
Y = { } 75 , 90 , 60 , 80 , 70 , 60
Calcule:

=
=
6
1 i
i
540 X a)

=
=
6
1 i
2
i
49738 X b) 291600 X c)
2
6
1 i
i
= |
.
|

\
|

=

Captulo 1 Introduo Estatstica
_____________________________________________________________________
___________________________________________________________________________________


4

=
=
6
1 i
i i
39190 Y X d) 234900 Y X e)
6
1 i
i
6
1 i
i
= |
.
|

\
|
|
.
|

\
|

= =

1.1.1 Nmero de termos (parcelas) do somatrio (NT)

O nmero de termos ou parcelas de um somatrio (NT) pode ser obtido por:
NT = (LS LI) + 1
Se o somatrio est sujeito a r restries basta fazer:
NT = (LS LI) + 1 r

Exemplos: Obter o nmero de termos para os seguintes somatrios:

( )

=
= + =
8
3 i
i
6 1 3 8 NT , X a) ( )

=
= + =
15
9,11 k
1 k
k
13 2 1 1 15 NT , Y b)
( ) | | ( ) | |

= =
= + + =
9
1 k
8
5 l
kl
36 1 5 8 x 1 1 9 NT , Z c)


Obs:

= =

+ + + +
+ +
+ + + + +
+ + + +
=
9
1 k
98 97 96 95
28 27 26 25
18 17 16 15
8
5 l
kl
Z Z Z Z
...
Z Z Z
Z Z Z Z
NT , Z 9x4 = 36 termos

1.1.2 Propriedades de somatrio

As propriedades facilitam o desenvolvimento das expresses algbricas com a
notao do somatrio. O objetivo desenvolver as expresses at chegar s somas
simples e/ou somas de quadrados.

P.1. Somatrio de uma constante k
O somatrio de uma constante igual ao produto do nmero de termos pela
constante.
nk k ... k k k
n
1 i
= + + + =

=

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

5
Exemplos:
( ) | |( ) ( ) 50 5 10 5 1 1 10 5 a)
10
1 i
= = + =

=
( ) | |
j j
12
3 i
j
10Y Y 1 3 12 Y b) = + =

=


P.2. Somatrio do produto de uma constante por uma varivel
O somatrio do produto de uma constante por uma varivel igual ao produto
da constante pelo somatrio da varivel.

( )

= =
= + + + = + + + =
n
1 i
n
1 i
i n 2 1 n 2 1 i
X k X ... X X k kX ... kX kX kX
Exemplos:


= =
= =
n
1 i
i
n
1 i
i
2
1
k , X
2
1
2
X
a)

= = = =
=
m
1 j
j
n
1 i
i
m
1 j
j i
n
1 i
Y X Y X , pois X uma constante para o somatrio em relao a j.
Verifique para X = { } 6 , 4 , 2 e Y = { } 5 , 3 , que 96 Y X Y X
2
1 j
j
2
1 j
3
1 i
i j i
3
1 i
= =

= = = =

P.3. Somatrio de uma soma ou subtrao de variveis
O somatrio de uma soma ou subtrao de variveis igual soma ou
subtrao dos somatrios dessas variveis.

Sem perda de generalidade, para trs variveis X, Y, e W, tem-se:
( )

= = = =
+ = +
n
1 i
n
1 i
n
1 i
i i i
n
1 i
i i i
W Y X W Y X










Captulo 1 Introduo Estatstica
_____________________________________________________________________
___________________________________________________________________________________


6
1.1.3 Somatrio duplo

Considere a Tabela a seguir:

















G = total geral

X
ij


j = 1, 2, ...., r (ndice de coluna).
i = 1, 2, ..., r (ndice de linha)



= = = =
+ + + + + =
r
1 i
is
r
1 i
ij
r
1 i
i2
r
1 i
i1
X ... X ... X X G
( )

=
+ + + + + =
r
1 i
is ij i2 i1
X ... X ... X X
X.. X X
r
1 i
s
1 j
s r,
1 j 1, i
ij ij
= =

= = = =
, ou ainda

= = = =
= = =
s
1 j
r
1 i
r s,
1 i 1, j
ij ij
X.. X X G

Total da i-sima linha: . X X
s
1 j
i ij
=
=
Total da j-sima coluna:

=
=
r
1 i
j ij
X. X

1.1.4 Exerccios propostos

1) Considerando os seguintes valores:

X
1
= 2 X
2
= 6 X
3
= 7 X
4
Y
= 9
1
= 1 Y
2
= 4 Y
3
= 5 Y
4

= 11
Calcular:

1 2 ... j ... s
1 X X
11
...
12
X ...
1j
X

=
s
1 j
j 1
X
1s


2 X X
21
...
22
X ...
2j
X

=
s
1 j
j 2
X
2s


... ... ... ... ... ... ... ...
I X X
i1
...
i2
X ...
ij
X

=
s
1 j
ij
X
is


... ... ... ... ... ... ... ...
R X X
r1
...
r2
X ...
rj
X

=
s
1 j
n
X
rs


=
r
1 i
1 i
X

=
r
1 i
2 i
X
...

=
r
1 i
ij
X
...

=
r
1 i
is
X
G
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

7
( )

=

3
1 i
2
i
2 Y a) ( )

=

4
1 i
i i
4Y X b)

( )

= =
+
3
1 i
4
2 j
i
2 X c) ( )

= =

4
2 i
3
2 j
j i
Y X 3 d)


R: a) 14; b) - 60; c) 63 e d) 51

2) Efetuar

=
|
|
.
|

\
|
+
3
1 i
2
j
1
i a) ( ) ( )

= =
|
.
|

\
|
+
6
3 i
2
0 j
i
3 i
. j i opcional b)

R: a) 5(3 + 1/j); b) 429/20


3) Calcule X
1
e X
3

, dado que:

=
=
6
1 i
i
42 X

=
=
6
1 i
2
i
364 X

=
=
6
1,3 i
1 i
i
34 X

=
=
6
1,3 i
1 i
2
i
324 X

1.2 Produtrio

O smbolo produtrio utilizado para facilitar a representao dos produtos.
Utiliza-se a notao

, letra grega pi maisculo.



Representao:
n 2 1
n
1 i
i
X ..... X . X X =

=

Fatos:

1) b
1
. b
2
. ... . b
n

=
n
1 i
i
b =
2) b. b. b. ... b =

=
=
n
1 i
n
b b
3)

= =
= = =
n
1 i
i
n
n 2 1
n
n 2 i
n
1 i
i
X c X . ... . X . X . c cX . ... . cX . cX cX
4) ( )( )
|
|
.
|

\
|
|
|
.
|

\
|
= = =

= = =
n
1 i
i
n
1 i
i n 2 1 n 2 1 n n 2 2
n
1 i
1 1 i i
Y X Y . ... . Y . Y X . ... . X . X Y X . ... . Y X . Y X Y X
5) ! n n . ... . 3 . 2 . 1 i
n
1 i
= =

=

6) ( )

= =
= + + + = =
n
1 i
i n 2 1 n 2 1
n
1 i
i
X log X log ... X log X log X . ... . X . X log X log



n fatores
Captulo 1 Introduo Estatstica
_____________________________________________________________________
___________________________________________________________________________________


8
1.2.1 Exemplo:
Sabendo-se que:


X
1
= 2 X
2
= 3 X
3
Y
= 5
1
= 3 Y
2
= 5 Y
3

= 7
Calcular:
a) 30 5 . 3 . 2 X . X . X x
3
3
1 i
2 1 i
= = =

=

b) 105 7 . 5 . 3 Y . Y . Y Y
3
3
1 i
2 1 i
= = =

=

c) ( )

= =
= = =
3
1 i
3
1 i
i
3
i
810 30 27 X 3 X . 3
d) ( )( ) 3150 105 30 Y X Y X
3
1 i
i
3
1 i
3
1 i
i i i
= =
|
|
.
|

\
|
|
|
.
|

\
|
=

= = =


1.2.2 - Exerccios propostos

1) Seja uma varivel X, assumindo os seguintes valores:

{ } 10 n 8 , 4 , 9 , 6 , 2 , 1 , 0 , 3 , 2 , 5 X = =

Calcule:

a)

=
10
1 i
i
X b)

=
10
1 i
2
i
X c)
2
10
1 i
i
X |
.
|

\
|

=
d)
1 10
10
X
X
2
10
1 i
i
10
1 i
i

|
.
|

\
|

=
=


e) ( )

=

10
1 i
i
4 X f) ( )

=

10
1 i
2
i
4 X g)
( )
1 10
4 X
10
1 i
2
i

=
h)
10
X
10
1 i
i
=


2) Sabendo-se que 12 X e 6 X
5
1 i
5
1 i
2
i i
= =

= =
, calcule:
a) ( )

=
+
5
1 i
i
5 X 4 b) ( )

=

5
1 i
i i
2 X X c) ( )

=

5
1 i
2
i
3 X

3) Utilizando os dados da Tabela abaixo, calcule:


i
j 1 2 3 4

1 8 7 5 9
2 4 0 10 2

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

9
a)

=
2
1 i
1 i
X b)

=
4
1 j
j 1
X c) (opcional)

= =
2
1 i
4
1 j
ij
X d)

=
4
3 j
1 j
j 2
X
e)

=
3
2 j
j 2
X f)

=
4
2 j
1 j j 2
X
1
g)

=
4
3 j
1 j
j 1
X 6 h)

=
4
2 j
1 j
j 2
X

4) Desenvolver:

=
|
|
.
|

\
|
+
3
1 i
2
j
1
i a)
( )

= =
+

5
4 j
1 j
4
2 i
2 2
j i
j j i
b) ( )
2
5
1 i
8 i c)
(

=
( )

=
+
5
1 i
8 i d)
5) Se

=
=
3
1 i
i
12 X

=
=
3
1 i
2
i
56 X e Y
1
= 3, Y
2
= 5, Y
3

=
3
1 i
9 a)
= 6, calcule:

i
3
1 i
X 12 b)

=
( )

=

3
1 i
2
i
2 X c) ( )

=

3
1 i
i i
Y X d)

6) Se 2 X
1
= , 4 X
2
= , 6 X
3
= e 3 Y
1
= , 5 Y
2
= , 6 Y
31
= , calcule:

( )

=

3
1 i
i i
Y X a) ( ) ( )

=

3
1 i
i i
5 Y 2 X b)

7) Calcule X
9
e X
21

=
=
50
1 i
i
200 X
, sabendo que:

=
=
50
1 i
2
i
1206 X

=
=
50
21 e 9 i
1 i
i
190 X

=
=
50
21 e 9 i
1 i
2
i
1154 X

8) Dados:
i Y X
i

i

1 3 3
2 8 4
3 2 8
4 5 7
5 6 6



Calcule:

Captulo 1 Introduo Estatstica
_____________________________________________________________________
___________________________________________________________________________________


10

=
5
2 i
1 i
i
X a)

=
5
1 i
i
4X b) ( )

=
+
5
3 i
i
6 X c) ( )

=

4
2 i
i
3 2X d)
i
5
1 i
i
Y X e)

=
( )

=
+
5
1 i
i i
Y X f)

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
11

2.0 ESTATSTICA DESCRITIVA

Diversas reas da investigao cientfica tm a necessidade da coleta de dados
de um fenmeno a ser estudado. Entretanto, esses dados possuem uma caracterstica
comum a inmeros conjuntos extrados das mais diferentes reas da investigao
cientfica que a variabilidade. Assim, o cientista necessita de mtodos que
possibilitem que os dados coletados sejam sumariados e analisados para que o
fenmeno sob estudo possa ser caracterizado ou que suas origens possam ser
conhecidas parcial ou integralmente.
Podemos dividir a Estatstica em duas reas: estatstica indutiva (inferncia
estatstica) e estatstica descritiva.

2.1 Estatstica indutiva (Inferncia estatstica)

Se uma amostra representativa de uma populao, concluses importantes
sobre a populao podem ser inferidas de sua anlise.
A parte da estatstica que trata das condies sob as quais essas inferncias
so vlidas chama-se estatstica indutiva ou inferncia estatstica. Este assunto iremos
tratar apenas no final desse curso. Neste captulo, estudaremos a outra rea da
estatstica, que a Estatstica Descritiva.

2.2 Estatstica Descritiva
o ramo da estatstica que lida com a organizao, o resumo e a apresentao
dos dados, procurando somente descrever e avaliar um certo grupo, sem tirar
quaisquer concluses ou inferncias sobre um grupo maior.

A Estatstica Descritiva pode ser resumida nas seguintes etapas:
Definio do problema;
Planejamento (idia experimento);
Coleta dos dados (varivel resposta);
Crtica dos dados
Apresentao dos dados;
tabelas
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


12
grficos
Descrio dos dados.

Em estatstica descritiva teremos portanto dois mtodos que podem ser usados
para a apresentao dos dados: mtodos grficos (envolvendo apresentao grfica
e/ou tabular) e mtodos numricos (envolvendo apresentaes de medidas de
posio e/ou disperso).

2.3 Tipos de dados
Os dados podem ser classificados como qualitativos e quantitativos. As
variveis qualitativas podem ser classificadas ainda como nominais, para as quais no
existe nenhuma ordenao nas suas possveis realizaes, ou como ordinais, para as
quais os seus possveis resultados podem ser ordenados por algum critrio especfico.
Exemplos: dados qualitativos nominais colorao; dados qualitativos o rdinais
altura (alta, mdia e baixa).
As variveis quantitativas, ao contrrio das qualitativas que apresentam as
qualidades (ou atributos) de um elemento pesquisado, representam as possveis
realizaes como nmeros, resultantes de uma contagem ou mensurao. Essas
variveis podem ser divididas em dois tipos: (a) variveis quantitativas discretas, cujas
possveis realizaes formam um conjunto finito ou enumervel de nmeros, o qual
resultante, geralmente, de contagem. Pode se exemplificar esse tipo de varivel pelo
salrio dos trabalhadores em uma determinada empresa (1, 2, 3, 4, ..., K salrios
mnimos); (b) variveis quantitativas contnuas, cujos possveis valores formam um
intervalo de nmeros reais resultantes em geral de mensuraes. Como exemplos de
dados quantitativos contnuos temos: peso de animais, altura de plantas, entre outros.

2.4 Populao e amostra

Populao: do ponto de vista estatstico, o conjunto de todos os elementos
sobre os quais desejamos desenvolver determinado estudo, constitui uma populao.
Os elementos podem ser seres humanos, rvores, domiclios, animais, reas e
objetos. Quando consideramos apenas uma parte deles, ou seja, um subconjunto da
populao, temos uma amostra.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
13
As medidas calculadas na amostra (estimativas) passam a ser as informaes
disponveis para os valores populacionais desconhecidos (parmetros). Quando
trabalhamos com todos os dados de uma populao, procedemos a um censo, ,
quando trabalhamos com parte da populao procedemos a uma amostragem.





Populao Amostra

2.5 Coleta, organizao e apresentao dos dados

Numa fase inicial dos levantamentos amostrais necessrio formular o
problema e aventar sobre o objeto de estudo ou expectativas sobre os possveis
resultados. Ainda nesta fase inicial, o investigador deve definir a populao de estudo,
parte identificvel e acessvel da populao objeto, os objetivos e as variveis
observadas. Numa segunda etapa realizado o planejamento, elaborando o plano de
amostragem ou determinando o caminho a ser percorrido para atingir os objetivos
propostos. O plano de amostragem compreende a definio do tamanho e do desenho
da amostra, e ainda, a escolha de procedimentos para a obteno de estimativas.
Finalmente, os dados so coletados, conferidos e processados. Anlises estatsticas
so, ento, realizadas nessa fase e os resultados interpretados retornando-se ao plano
das hipteses e das expectativas, a fim de que os objetivos sejam efetivamente
cumpridos e que sejam obtidas as respostas para as questes em estudo.
Uma populao pode ser finita ou infinita. Exemplos de populao finita: Alunos
de um determinado curso no CRP, os produtos do Supermercado Rainha, n de livros
na biblioteca nacional, dentre outros. Exemplos de populao infinita: produo futura
de uma mquina, extraes com reposio de bolas de uma urna, dentre outros.
Do ponto de vista prtico a populao infinita se a remoo de um item ou de
um pequeno n de itens no ter influencia discernvel nas probabilidades relativas.
Para fins de amostragens, certas populaes, embora finita podem ser
consideradas infinitas. Isto ocorre sempre que a amostra constitui-se de no mximo
5% dos elementos de uma populao. Assim, por exemplo, se tomarmos uma amostra
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


14
de 100 habitantes de uma cidade com 70000 habitantes (5% de 70000 = 3500
habitantes, portanto 100 < 5%), est populao embora finita, considerada como se
fosse infinita.

2.6 - Apresentao grfica e tabular

Os grficos constituem uma das formas mais eficientes de apresentao de
dados. Um grfico , essencialmente, uma figura constituda partir de uma tabela,
pois quase sempre possvel locar um dado tabulado num grfico.
Enquanto as tabelas fornecem uma idia mais precisa e possibilitam uma
inspeo mais rigorosa aos dados, os grficos so mais indicados em situaes que
objetivam dar uma viso mais rpida e fcil a respeito das variveis s quais se
referem os dados.
Embora a confeco de grficos dependa muito da habilidade individual,
algumas regras gerais so importantes. O leitor deve ficar atento e procurar saber
sobre tais regras antes de se envolver na confeco de grficos.

Exemplo: Dados brutos obtidos numa amostra de 14 plantas da gerao F2 do
cruzamento de uma planta de ervilha com sementes amarelas e lisas (AL) com outra
de sementes verdes e rugosas (VR).
AL AL VL AL AR VL VR AL VL AL AL AR AR AL

Para melhorar a apresentao possvel ordenar os dados em uma sequncia
crescente ou descrescente, ou agrup-los quanto as suas categorias ou atributos.

Exemplo: Dados elaborados obtidos numa amostra de 14 plantas da gerao F2 do
cruzamento de uma planta de ervilha com sementes amarelas e lisas (AL) com outra
de sementes verdes e rugosas (VR).
AL AL AL AL AL AL AL AR AR AR VL VL VL VR

A evidente necessidade de resumir os dados, sem perda de muita informao
contida neles, eles poderiam ser resumidos agrupando suas categorias e
apresentando-os em tabelas ou grficos.

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
15
Exemplo: Classes fenotpicas e suas respectivas freqncias obtidas numa amostra de
14 plantas da gerao F2 do cruzamento de uma planta de ervilha com sementes
amarelas e lisas (AL) com outra de sementes verdes e rugosas (VR).
Classe fenotpica Frequncias (F
i
)
AL 7
AR 3
VL 3
VR 1


Grfico de setores (a) e grfico de colunas (b) mostrando formas alternativas para
representar as classes fenotpicas da segregao F2 do cruzamento.

Existem vrios tipos de grficos que podem ser utilizados com o objetivo de
descrever um conjunto de dados resumidamente. Alguns deles sero aqui
exemplificados. Vejamos, primeiro, uma forma tabular de apresentao de dados e, a
seguir, veremos 3 tipos de apresentao grfica.

Distribuio de frequncia
Organizao tabular dos dados em classes de ocorrncia, ou no, segundo
suas respectivas frequncias absolutas. Em alguns casos h tambm o interesse de
se apresentar os dados em frequncias relativas ou acumuladas. Para dados
quantitativos no possvel efetuar o mesmo tipo de tratamento que para os dados
qualitativos nominais, sendo estes representados ento em classe de intervalos.
A apresentao dos dados em tabelas obedecem a certas normas e
recomendaes. Essas normas so teis para que as tabelas sejam feitas de modo
que simplicidade, clareza e veracidade perdurem. Diferentes revistas costumam usar
pequenas variaes na confeco de suas tabelas. Uma observao importante que
as tabelas devem ter significado prprio, ou seja, devem ser entendidas mesmo
quando no se l o texto em que esto apresentadas. O mesmo vlido para as
tabelas de distribuio de frequncias.
a
b
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


16

Exemplo:
Foram anotados os pontos finais dos alunos de CRP 192, referentes ao
segundo semestre de 2009. Foi feita a contagem e depois a organizao dos dados na
seguinte tabela:
Conceitos (Notas) Nmero de alunos Porcentagem
A (90 a 100) 14 7,07
B (75 a 89) 32 16,16
C (60 a 74) 50 25,25
R (<60) 63 31,82
L (Reprovao por falta) 39 19,70
198 100,00
FONTE: Professores de CRP 192 Iniciao Estatstica.

O grande problema definir o nmero de classes ideais. A primeira pergunta
qual o nmero de classes, um critrio emprico utilizar entre 5 e 20 classes em
funo do conhecimento do investigador.

Diagrama de pontos (dot diagram)
Este tipo de diagrama muito til para apresentar um pequeno conjunto de
dados (at cerca de 20 observaes). Assim podemos ver, de uma maneira rpida e
fcil, a tendncia central dos dados, alm da sua distribuio ou variabilidade.

Exemplo:
Considere o seguinte resultado de um experimento no qual o engenheiro testa
adio de uma substncia em cimento de construo para determinar seu efeito na
fora da tenso de aderncia (em determinada unidade/cm
2
):

Para esse conjunto de dados o diagrama de pontos seria:


CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
17
Observe que os dados esto centrados num valor prximo de 16,8 e que os
valores da tenso de aderncia caem no intervalo de cerca de 16,3 at 17,2 ud/cm
2
Este tipo de diagrama pode tambm ser usado para se comparar dois ou mais
.
conjuntos de dados. Por exemplo suponha ter sido verificado a tenso de aderncia
em cimentos no modificados. Os resultados so apresentados abaixo.


Faa voc mesmo o diagrama de pontos para os dois conjuntos de dados, ou
seja, colocando ambos os conjuntos de dados no mesmo diagrama. Observe que o
diagrama revela imediatamente que o cimento modificado parece ter uma menor fora
de tenso de aderncia, mas que a variabilidade das medidas dentro de ambos os
conjuntos de dados parece ser a mesma.
Testes estatsticos para verificar essas duas afirmativas podem ser realizados
com esses dados apresentados, e sero discutidos no momento oportuno.
Quando o nmero de observaes pequeno, geralmente se torna difcil
identificar algum padro especfico de variao. No entanto este tipo de diagrama
pode ser til em mostrar alguma caracterstica incomum no conjunto de dados.

Diagrama de ramos e folhas (stem-and-leaf diagram)
Quando o nmero de observaes relativamente grande, este diagrama pode
ser de boa utilidade.

Exemplo: Barulho medido em decibis, representado por dB. Um decibel
corresponde ao nvel do som mais fraco que pode ser ouvido em um local silencioso
por algum com boa audio. Um sussurro corresponde a cerca de 30 dB; a voz
humana em conversao normal corresponde a cerca de 70dB; um rdio em volume
alto cerca de 100 dB; Desconforto para os ouvidos geralmente ocorre a cerca de 120
dB. Os dados abaixo correspondem aos nveis de barulho medidos em 36 horrios
diferentes em um determinado local.


o grfico de ramos e folhas para o conjunto acima :
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


18
Ramo Folha


O inconveniente desta representao quando aos dados com vrias casas
decimais.

Histograma
Para alguns conjuntos de dados o nmero de valores distintos da varivel em
estudo muito grande para serem considerados os tipos de apresentao grfica
apresentados acima. Em tais casos seria til dividir os valores em grupos, ou intervalos
de classe, e ento plotar o nmero de valores dos dados correspondentes a cada
intervalo de classe. Existem vrias frmulas para se estabelecer o nmero de classes,
porm qualquer nmero de classes poderia ser utilizado, baseando-se nas seguintes
observaes:
(a) no escolher muito poucas classes, para evitar perda de informao sobre os
dados;
(b) no escolher muitas classes, o que poderia fazer com que as frequncias
referentes a cada classe fossem to pequenas a ponto de atrapalhar o discernimento
de algum padro de distribuio para a varivel em estudo.
O que se faz na prtica tentar variados nmeros de classes e verificar, com a
ajuda de um computador, o nmero ideal para os dados em questo. Alm disso,
comumente usamos intervalos de classe de iguais amplitudes.

Exemplo: (envolvendo distribuio de frequncia e histograma, com algumas
variaes)
Suponhamos que uma empresa deseja avaliar a distribuio dos salrios pagos
por hora a seus funcionrios. O estatstico da empresa possui os seguintes dados:

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
19

Temos ai o que chamamos dados brutos.
Dados como estes poderiam ser agrupados em classes. Uma maneira de
escolher o nmero de classes poderia ser usarmos um valor prximo raiz quadrada
do nmero de observaes. Poderamos usar, ento, 5 classes. Tomando-se a
diferena entre o maior e o menor valor do conjunto de dados, e dividindo pelo nmero
de classes escolhido teramos: (15,8 8,3)/5 = 1,5. Esse seria o valor para amplitude
da classe, ou intervalo da classe. A seguinte tabela pode ser construda (com intervalo
fechado esquerda):
Classes freqncias
8,3 9,8 5
9,8 11,3 7
11,3 12,8 9
12,8 14,3 6
14,3 15,8 3
30

Agora podemos ter uma idia da distribuio dos salrios. Apenas com essas
informaes poderamos concluir que a classe de salrios predominante na empresa
a terceira, ou seja, com salrios de 11,3 a 12,8 salrios mnimos.
Se quisssemos obter maiores informaes sobre os dados, poderamos
montar uma nova tabela, incluindo outros tipos de frequncia, como: frequncia
acumulada (f
a
), frequncia relativa (f
r
), e frequncia acumulada relativa (f
ar
Classes
).
f f
i
f
ai
f
ri

ari

8,3 9,8 5 5 0,17 0,17
9,8 11,3 7 12 0,23 0,40
11,3 12,8 9 21 0,30 0,70
12,8 14,3 6 27 0,20 0,90
14,3 15,8 3 30 0,10 1,00
30 1,00

Discusso: exemplos
na terceira coluna, a frequncia acumulada 21 indica que, nessa
empresa, 21 funcionrios recebem salrios/hora abaixo de 12,8 unidades;
podemos constatar, tambm, uma certa predominncia de salrios mais
baixos. Realmente cerca de 70% da distribuio de salrios concentra-se at o
salrio de 12,8 unidades;
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


20
os maiores salrios serve a apenas 10% dos funcionrios da empresa;
40% dos funcionrios (12 funcionrios) recebem at 11,3 unidades, sendo 23%
(ou seja, 7 funcionrios) recebendo entre 9,8 e 11,3 unidades.
Essas informaes preliminares, bem como outras, seriam impossveis de
serem obtidas se a populao de funcionrios fosse muito maior e os dados
correspondentes no estivessem tabelados.
O histograma pode ser feito a partir das frequncias simples de cada classe ou
a partir das frequncias relativas. Bastaria informar corretamente o que seria usado no
eixo vertical.

Algumas vezes h o interesse em plotar as frequncias acumuladas, ou
frequncias acumuladas relativas. Nesse caso teramos a chamada Ogiva, ou ogiva
percentual, respectivamente (veja abaixo).


2.7 - Medidas de posio e de disperso
Nesse tpico sero apresentadas algumas estatsticas teis para resumir, de
modo bastante conciso, as informaes contidas em um conjunto dos dados.
Estatstica, nesse contexto, significa alguma quantidade numrica cujo valor
determinado pelos dados.

2.7.1 - Medidas de Posio ou tendncia central
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
21
Sero apresentadas algumas estatsticas usadas para descrever o centro de um
conjunto de dados.

Mdia Aritmtica
a medida de posio mais comum, intensa e extensivamente utilizada.
Suponha termos um conjunto de n valores numricos x
1
, x
2
, , x
n

. A mdia aritmtica
desses valores ser dada por:
n
x
x
n
1 i
i
=
=
exemplo:

Considere o seguinte conjunto de dados:
284, 280, 277, 282, 279, 285, 281, 283, 278, 277
encontre a mdia desses valores?

soluo: uma soluo a seguinte, ao invs de adicionar esses valores diretamente,
fica mais fcil se subtrairmos 280 de cada um para obter os novos valores y
i
= x
i
4, 0, -3, 2, -1, 5, 1, 3, -2, -3.

280:
A mdia dos valores transformados ser:
0,6
10
6
y = =

Desse modo,
286 280 y x = + =

Algumas vezes queremos determinar a mdia de um conjunto de dados
organizados em uma tabela de distribuio de frequncias onde os k valores distintos
de X (x
1
, x
2
, , x
k
) ocorrem nas respectivas frequncias f
1
, f
2
, , f
k
n
x
x
k
1 i
i
=
=
i
f
. Nesse caso a
mdia aritmtica ser dada por:
, onde

=
=
k
1 i
n
i
f
Escrevendo a frmula anterior como
a soma das observaes dividida pelo nmero de observaes.
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


22

k 2 1
x
n
x
n
x
n
x
i i i
f f f
+ + + =
pode ser observado que a mdia amostral corresponde mdia ponderada dos
valores distintos de X na amostra, onde o peso dado a cada valor x
i
nesse caso
corresponde proporo dos n valores iguais a x
i

, com i = 1 a k.
exemplo:
Idade
a seguinte distribuio de frequncia d as idades de jovens em
determinado local de ocorrncia do vestibular para os cursos do UFV/CRP.
Frequncia
15 2
16 5
17 11
18 9
19 14
20 13

Encontre a mdia aritmtica da idade dos indivduos acima.
soluo:
x = (2 x 15 + 5 x 16 + 11 x 17 + 9 x18 + 14 x19 + 13 x20)/54 = 18,24

OBS.: se a tabela for organizada em classes de valores da varivel, para o clculo da
mdia devemos substituir cada classe pelo seu ponto mdio (mdia aritmtica do limite
superior e inferior da classe em questo) e calcular a mdia conforme discutido acima.

Propriedades

i) A soma dos desvios em relao mdia igual a zero para qualquer amostra.
( )

=
=
n
1 i
i
0 X X
ii) A soma ou subtrao de uma constante (k) aos dados altera a mdia de tal
forma que a nova mdia fica adicionada ou subtrada pela constante.
n
X
X e k X Y
n
1 i
i
i i

=
= =
ento
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
23
( )
k X
n
nk
X
n
k
n
X
n
k X
Y
n
1 i
n
1 i
i
n
1 i
i
= = =

=

= = =

iii) A multiplicao dos dados ou diviso por uma constante (k) aos dados altera a
mdia de tal forma que a nova mdia fica multiplicada ou dividida pela
constante.
,
n
X
X e k com , X k Y
n
1 i
i
i i

=
= =
ento
( )
X k
n
X
k
n
X k
n
Y
Y
n
1 i
i
n
1 i
i
n
1 i
i
= =

= =

= = =


iv) A mdia influenciada por valores extremos. A mdia tender a ser grande, se
existirem alguns poucos valores que so maiores que a maioria das
mensuraes realizadas, ou a ser pequena, se existirem na amostra alguns
poucos valores menores que a maioria das mensuraes.

Mediana amostral

Outra estatstica usada para indicar o centro de um conjunto de dados a
mediana amostral, que pode ser definida, em um conjunto de dados ordenados como
o valor central, ou seja, o valor para o qual h tantas mensuraes que o superem
quanto so superados por ele, cujos n valores so dispostos em ordem crescente.
Se n for mpar, a mediana ser o valor que ocupa a posio (n + 1)/2; se n for
par, a mediana ser a mdia aritmtica dos valores ocupando as posies n/2 e n/2
+1.
Exemplo: encontre a mediana para os dados apresentados acima.
soluo: j que temos 54 observaes, segue que a mediana amostral ser a
mdia dos valores ocupando as posies 27 e 28, quando essas 54 observaes so
organizadas em ordem crescente. Portanto a mediana ser o valor 18,5.

OBS.: a escolha entre mdia e mediana depende do tipo de informao o pesquisador
tenta obter dos dados. A mdia afetada por valores extremos ocorrendo na
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


24
distribuio, enquanto a mediana faz uso de apenas um ou dois valores centrais, no
sendo, portanto, afetada por valores extremos.

Propriedades

i) A soma ou subtrao de uma constante (k) aos dados altera a mediana de tal
forma que a nova mediana fica adicionada ou subtrada pela constante.
Sejam k X Y
i i
=

ento k m m
dX dY
=

ii) A multiplicao dos dados ou diviso por uma constante (k) aos dados altera a
mediana de tal forma que a nova mediana fica multiplicada ou dividida pela
constante.
Sejam = k com , X k Y
i i


ento
dX dY
m k m =

iii) A mediana no influenciada por valores extremos. Desta forma, considerada
uma estimativa menos informativa que a mdia. No entanto, a mediana pode,
em algumas ocasies, ser mais vantajosa que a mdia pelo fato de no ser
afetada pelos extremos. Assim, se as distribuies so assimtricas, a mediana
pode ser uma melhor medida de tendncia central.

Moda amostral
Outra estatstica que tem sido usada para indicar a tendncia central de um
conjunto de observaes a moda amostral. Ela definida como o valor que ocorre
com maior frequncia. Podemos ter sries unimodais, bimodais ou multimodais,
dependendo do nmero de valores modais ocorrendo na amostra.
Exemplo: encontre a moda para o mesmo exemplo acima.
soluo: a moda ser o valor 19, pois esse valor ocorre com maior frequncia
na distribuio. Essa uma distribuio unimodal.

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
25
Propriedades

i) A soma ou subtrao de uma constante (k) aos dados altera a moda de tal
forma que a nova moda fica adicionada ou subtrada pela constante.
Sejam k X Y
i i
=

ento k m m
oX oY
=

ii) A multiplicao dos dados ou diviso por uma constante (k) aos dados altera a
moda de tal forma que a nova moda fica multiplicada ou dividida pela constante.
Sejam = k com , X k Y
i i


ento
oX oY
m k m =

2.7.2 - Medidas de Disperso ou Variabilidade

Essas medidas so teis para complementar as informaes fornecidas pelas
medidas de posio. Descrevem a variabilidade ocorrendo no conjunto de dados
sendo analisados.

Exemplo: Produtividade de 3 variedades de milho em t/ha. O conjunto A relativo a
um hbrido simples, o B, a um hbrido triplo e o C, a uma variedade de polinizao
aberta.
A B C
4,27 3,44 1,27
4,60 3,76 3,30
4,72 4,55 3,50
4,95 4,86 5,25
4,99 5,30 5,44
5,17 5,42 5,51
5,21 5,81 5,72
5,42 5,89 6,04
5,63 5,94 6,39
6,00 5,99 8,54
5,096 x
A
= 5,096 x
B
= 5,096 x
C
=

Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


26
Os 3 tipos apresentam a mesma mdia. fcil para o leitor perceber, com uma
inspeo mais criteriosa, que os conjuntos diferem razoavelmente um do outro.
Se os conjuntos numricos fossem representados apenas pelas respectivas
mdias, elas seriam consideradas iguais.

Varincia amostral

Para contornar o problema de a soma dos desvios, em relao mdia
aritmtica, ser sempre igual a zero usar a soma de quadrados de desvios. Essa
propriedade relaciona-se a um dos principais mtodos usados na estatstica,
conhecido como mtodo dos quadrados mnimos.
( )

=
=
n
1 i
2
X X SQ
A varincia definida dividindo-se a soma de quadrados de desvios pelo
tamanho da amostra. Ela pode ser considerada como um valor mdio dos desvios ao
quadrado, portanto, sendo conhecida, tambm, por quadrado mdio. O smbolo usado
para sua representao, consagrado na literatura estatstica, a letra grega minscula
sigma, tomada ao quadrado (
2
).
( )

= =
n
1 i
2
i 2
n
X X
n
SQ

Entretanto esta frmula apresentada anteriormente possui associada a ela um
erro que denominamos vis. A soma de quadrados ser dividida por n 1 ao invs de
usar o n. A quantidade n 1, usada como divisor conhecida como graus de
liberdade.
( )
1 n
n
X
X
1 n
X X
1 n
SQ
s
n
1 i
2
n
1 i
i
2
i
n
1 i
2
i
2 2

= =

=
=
=



Se a cada valor de X
i

tivermos associado sua freqncia de ocorrncia, ento:
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
27

=
=
=
=

= =
k
1 i
k
1 i
k
1 i
2
k
1 i
i
2
i
2 2
1
X
X
s
i
i
i
i
f
f
f
f



A varincia extremamente til como medida de variabilidade, sendo igual a
zero quando todas as mensuraes so iguais entre si e crescendo medida que se
aumentam as diferenas (disperso) entre os elementos do conjunto mensurado.
Desta forma, no h varincia negativa.

Exemplo: encontre a varincia amostral para os dois conjuntos de dados abaixo:
A: 3, 4, 6, 7, 10 B: -20, 5, 15, 24
soluo:

=
=
5
1 i
i
30 A ,

=
=
5
1 i
2
i
210 A e 6
5
30
A = =
( )
7,5
4
30
4
180 210
1 5
5
30
210
1 n
n
A
A
s
2 n
1 i
2
n
1 i
i
2
i
2
A
2
A
= =

= =


=
=

=
=
4
1 i
i
24 B ,

=
=
4
1 i
2
i
1226 B e 6
4
24
B = =
( )
360,667
3
1082
3
144 1226
1 4
4
24
1226
1 n
n
B
B
s
2 n
1 i
2
n
1 i
i
2
i
2
B
2
B
= =

= =


=
=



Portanto, apesar dos dois conjuntos terem a mesma mdia, h maior
variabilidade nos valores do conjunto B do que nos do conjunto A.

A varincia tem a propriedade de no se alterar quando os dados so
adicionados ou subtrados de uma constante, mas, quando esses dados so
multiplicados ou divididos por essa constante, a varincia do novo conjunto igual
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


28
varincia do novo conjunto igual varincia do conjunto, original multiplicada ou
dividida pela constante ao quadrado.

Exemplo: Dado o conjunto de dados abaixo, calcule a nova varincia aps a
multiplicao dos dados por uma constante igual a 2.
{ } 20 14; 12; 8; 6; X
0
=
soluo:

=
=
5
1 i
i
60 X ,

=
=
5
1 i
2
i
840 X e 12
5
60
X
0
= =
( )
30
4
120
4
720 840
1 5
5
60
840
1 n
n
X
X
s
2 n
1 i
2
n
1 i
i
2
i
2
X
2
X
0 0
= =

= =


=
=


Multiplicando o conjunto por 2:
{ } 40 28; 24; 16; 12; X
1
=

=
=
5
1 i
i
120 X ,

=
=
5
1 i
2
i
3360 X e 24
5
120
X
1
= =
( )
120
4
480
4
2880 3360
1 5
5
120
3360
1 n
n
X
X
s
2 n
1 i
2
n
1 i
i
2
i
2
X
2
X
1 1
= =

= =


=
=

, ou
120 30 2 s
2 2
X
2 2
X
2
X
0 1 1
= = = =

k

Desvio padro

definido tomando-se a raiz quadrada da varincia. representado por sigma
chapu ( )

ou pela letra minscula s.


1 n
n
X
X
s
n
1 i
2
n
1 i
i
2
i

= =


=
=





CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
29
Para dados agrupados, o desvio padro estimado por:

=
=
=
=

= =
k
1 i
i
k
1 i
k
1 i
i
2
k
1 i
i i
2
i i
1 f
f
X f
X f
s



O desvio padro no afetado pela soma ou subtrao de uma constante (k)
aos dados. No entanto, ele se altera quando os dados so multiplicados ou divididos
por uma constante. Nesse caso, o novo desvio padro ser igual ao desvio padro
original multiplicado ou dividido pela constante.
Quando o desvio padro pequeno, prximo de zero, existir uma grande
concentrao dos dados em torno da mdia. Por outro lado, se o desvio padro for
grande os valores no se concentraro com tal intensidade em torno da mdia.

Amplitude total

A amplitude total a diferena entre o maior e o menor valor da srie. Tem a
vantagem de ser rpido e fcil de ser calculada, porm fornece um nmero ndice
grosseiro da variabilidade de uma distribuio, por levar em conta apenas 2 valores de
um conjunto.

A = X
k
X
1
X
, onde:
k
X
= ltimo valor da srie de dados ordenados;
1

= primeiro valor da srie de dados ordenados.
Erro-padro da mdia

Ao retira-se vrias amostras da populao estas apresentam um desvio padro
em relao a mdia populacional. O erro-padro da mdia mede a preciso da mdia.
uma medida da disperso das mdias amostrais em torno da mdia da populao.
Sua frmula dada por:
( )
n

x s s

= =
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


30
Coeficiente de Variao

O coeficiente de variao uma medida de disperso relativa. uma medida til
para comparao, em termos relativos, do grau de concentrao, em torno da mdia,
de sries distintas. Por ser um nmero adimensional permite a comparao de sries
de variveis com unidades diferentes. Sua frmula dada por:

100
X

= C.V.(%)



OBS.: se existem duas amostras distintas A e B, e se desejamos saber qual delas a
mais homognea, ou seja, de menor variabilidade, basta fazermos o seguinte:
calculamos as mdias e os desvios padres de A e B, e:

Se
B A
X X = , ento o prprio desvio padro informar qual a mais homognea.
Se
B A
X X , ento a mais homognea ser a que tiver menor C.V.

OBS.: valores muito altos de C.V. indicam pequena representatividade da mdia.
Exemplo:Supor duas amostras:
A = {1, 3, 5} B = {53, 55, 57}
Qual das duas a mais homognea?
soluo:
C.V.
A
C.V.
= 2/3(100) = 66,7%
B

= 2/55(100) = 3,6%
Portanto a amostra B a mais homognea.

2.8 - Exerccios Propostos

1) Considerando os dados amostrais abaixo, calcular: mdia aritmtica, varincia,
desvio padro, erro padro da mdia e coeficiente de variao
Dados: 2, 3, 5, 1, 2, 1, 4, 3, 3, 4, 3.

R.: 2,81; 1,56; 1,24; 0,37; 44,12%
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
31

2) Em certa regio a temperatura mdia 20 C e a precipitao mdia 700 mm. O
desvio padro para temperatura 3 C, enquanto que a varincia para a precipitao
1225 mm
2

. Qual dos dois fenmenos apresenta maior variabilidade? Justifique?
R.: a temperatura apresenta maior variabilidade relativa. Voc justifica

3) Um artigo retirado da revista Technometrics (Vol. 19, 1977, p. 425) apresenta os
seguintes dados sobre a taxa de octanagem de vrias misturas de gasolina:

88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3 96,5 93,3 94,7
91,1 91,0 94,2 87,8 89,9 88,3 87,6 84,3 86,7 84,3 86,7
88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,1 93,4 88,5
90,1 89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8
92,3 90,4 90,1 93,0 88,7 89,9 89,8 89,6 87,4 88,4 88,9
91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6
91,1 90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2
91,2 91,0 92,2 90,0 90,7

(a) Construa o diagrama de folhas-e-ramos para esses dados?
(b) Construa a distribuio de frequncia e o histograma. Use 8 intervalos de classe?
(c) Construa a distribuio de frequncia e o histograma, agora com 16 intervalos de
classe?
(d) Compare a forma dos dois histogramas em b e c. Ambos os histogramas mostram
informaes similares?

4) O seguinte conjunto de dados representa as vidas de 40 baterias de carro da
mesma marca e mesmas caractersticas com aproximao at dcimos do ano. As
baterias tinham garantia para 3 anos.

2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1
3,3 3,8 3,1 4,7 3,7 2,5 4,3 3,4 3,6 2,9 3,3
3,9 3,1 3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4 4,7
3,8 3,2 2,6 3,9 3,0 4,2 3,5

(a) Construa a distribuio de frequncia e o histograma;
(b) Faa o grfico da distribuio de frequncias relativas acumuladas.
Captulo 2 Estatstica Descritiva
_____________________________________________________________________
___________________________________________________________________________________


32
6 0 5 5 8 9
7 2 4 4 5 7 8
8 2 3 3 5 7 8
9 0 0 1 4 4 5
10 0 2 7 8
11 0 2 4 5
12 2 4 5

(c) Calcule a mdia aritmtica dos dados originais
(d) Usando a distribuio de frequncia conforme obtido em (a) calcule a mdia
novamente. Para tal, considere os pontos mdios de cada classe (mdia entre os dois
limites de cada classe) para serem os valores da varivel no clculo da mdia.
(e) Obtenha a varincia para os dados originais conforme feito para a mdia em (c).
(f) Obtenha a varincia a partir da distribuio de frequncia conforme feito para a
mdia no tem d.
obs.: use 7 intervalos de classe. Amplitude da classe igual a 0,5. E o incio do intervalo
mais baixo em 1,5.

5) Calcule a mdia, mediana, e amplitude total dos valores dispostos no seguinte
diagrama de ramos e folhas.










CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
________________________________________________________________________________


33

3.0 - AMOSTRAGEM

3.1 Introduo

A realizao de pesquisas calcada em questes relativas s tomadas de
observaes da realidade, ou seja, obter uma amostra da realidade. Os levantamentos
por amostragem tm a finalidade de reproduzir a realidade estudada. Estes se aplicam
ao conjunto real composto de elementos, denominado de populao de estudo.
Populao: do ponto de vista estatstico, o conjunto de todos os elementos sobre os
quais desejamos desenvolver determinado estudo, constitui uma populao. Os
elementos podem ser seres humanos, rvores, domiclios, animais, reas e objetos.
Quando consideramos apenas uma parte deles, ou seja, um subconjunto da
populao, temos uma amostra. As medidas calculadas na amostra (estimativas)
passam a ser as informaes disponveis para os valores populacionais
desconhecidos (parmetros). Quando trabalhamos com todos os dados de uma
populao, procedemos a um censo, , quando trabalhamos com parte da populao
procedemos a uma amostragem.




Populao Amostra

Numa fase inicial dos levantamentos amostrais necessrio formular o
problema e aventar sobre o objeto de estudo ou expectativas sobre os possveis
resultados. Ainda nesta fase inicial, o investigador deve definir a populao de estudo,
parte identificvel e acessvel da populao objeto, os objetivos e as variveis
observadas. Numa segunda etapa realizado o planejamento, elaborando o plano de
amostragem ou determinando o caminho a ser percorrido para atingir os objetivos
propostos. O plano de amostragem compreende a definio do tamanho e do desenho
da amostra, e ainda, a escolha de procedimentos para a obteno de estimativas.
Finalmente, os dados so coletados, conferidos e processados. Anlises estatsticas
so, ento, realizadas nessa fase e os resultados interpretados retornando-se ao plano
Captulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________


34
das hipteses e das expectativas, a fim de que os objetivos sejam efetivamente
cumpridos e que sejam obtidas as respostas para as questes em estudo.
Uma populao pode ser finita ou infinita. Exemplos de populao finita: Alunos
de um determinado curso no CRP, os produtos do Supermercado Rainha, n de livros
na biblioteca nacional, dentre outros. Exemplos de populao infinita: produo futura
de uma mquina, extraes com reposio de bolas de uma urna, dentre outros.
Do ponto de vista prtico a populao infinita se a remoo de um item ou de
um pequeno n de itens no ter influencia discernvel nas probabilidades relativas.
Para fins de amostragens, certas populaes, embora finita podem ser
consideradas infinitas. Isto ocorre sempre que a amostra constitui-se de no mximo
5% dos elementos de uma populao. Assim, por exemplo, se tomarmos uma amostra
de 100 habitantes de uma cidade com 70000 habitantes (5% de 70000 = 3500
habitantes, portanto 100 < 5%), est populao embora finita, considerada como se
fosse infinita.
Assim, definimos a amostragem como a parte da estatstica que estuda as
populaes atravs de amostras representativas. A dimenso de uma amostra
varivel conforme o grau de preciso que se deseja no estudo, , principalmente, com
a homogeneidade dos elementos na populao. Desta forma, em um laboratrio
possvel fazer um diagnstico com base em uma gota de sangue, apenas, em virtude
do grau de homogeneidade deste material. Por outro lado, para se ter uma estimativa
da renda per capita de uma cidade necessrio coletar dados de diversos indivduos.

3.2 Questionrio

A construo de um questionrio uma etapa longa, que deve ser executada com
muita cautela e planejamento. Para tanto, alguns procedimentos devem ser levados
em considerao.

a) Definir as caractersticas a serem avaliadas

A deciso de escolha das caractersticas depende de vrios aspectos, mas o
mais importante verificar se os resultados das mesmas levam aos objetivos da
pesquisa e se so viveis de serem aplicadas. Portanto, o questionrio deve ser
completo, no sentido de abranger somente perguntas sobre as caractersticas
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
________________________________________________________________________________


35
necessrias para atingir aos objetivos da pesquisa, pois quanto maior o questionrio,
menor tende a ser a qualidade e a confiabilidade das respostas. Exemplo: Pesquisa
sobre a sade do indivduo, no necessita pergunt-lo sobre qual o sabor de sorvete
favorito.

b) Estabelecer a forma de mensurao das caractersticas

Para as variveis quantitativas, devem estar bem definidas as unidades de
medidas (meses, m, kg, etc), que devem acompanhar as respostas. Para as variveis
qualitativas, deve haver uma lista completa de alternativas, mesmo que seja
necessrio incluir categorias como outros, no tem opinio, etc, com o objetivo de
evitar alguma resposta estranha. Se uma varivel puder ser adequadamente medida
sob forma quantitativa, deve-se usar este tipo de mensurao, porque as medidas
quantitativas so, em geral, mais informativas do que as qualitativas. Por exemplo,
dizer que um funcionrio trabalha h 30 anos na empresa mais informativo do que
dizer que ele trabalha h muito tempo na empresa. Porm, em alguns casos, quando
se tenta mensurar uma caracterstica atribuindo-lhe uma escala de 1 a 5, pode haver
alguma distoro, pois uma nota 3 para um indivduo pode no significar exatamente o
mesmo para outro, j que a escala pode ser entendida de forma diferenciada entre os
indivduos entrevistados. Neste caso, poderiam ser criadas cinco respostas
categorizadas, sendo 1 = pssimo, 2 = ruim, 3 = regular, 4 = bom e 5 = timo. Caso
uma caracterstica seja de difcil medio ou que os indivduos, por algum motivo,
tenham receio de responder, uma opo seria avaliar a mesma indiretamente, atravs
de vrias outras que medem esta caracterstica, conforme alguma teoria sobre o
assunto.

c) Elaborar uma ou mais perguntas para cada caracterstica

Ao efetuar uma ou mais perguntas, ter para cada pergunta, uma e apenas uma
resposta, sendo que cada pergunta ser uma varivel. A caracterstica grau de
satisfao com o trabalho pode ser avaliada com base em vrias perguntas, como por
exemplo, satisfao com o salrio, segurana no emprego, autonomia de trabalho, etc.


Captulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________


36
d) Verificar se a pergunta est suficientemente clara

As perguntas devem ser formuladas numa linguagem que seja compreensvel
para todos os indivduos e, alm disso, no devem deixar dvidas de interpretao.

e) Verificar se a forma da pergunta no est induzindo alguma resposta ou se a
resposta da pergunta bvia

Dependendo da forma como se realiza a pergunta, a resposta poder ser
sempre a mesma. Isto pode ocorrer quando os tipos de respostas no so capazes de
detectar as diferenas entre os indivduos entrevistados.

f) Verificar se o questionrio est bom

importante realizar um teste, aplicando o questionrio em alguns indivduos
com caractersticas similares aos da populao em estudo. Neste teste, pode-se
detectar falhas que passaram despercebidas na elaborao do questionrio, como por
exemplo, duplicidade de alguma pergunta, respostas que no haviam sido previstas,
variabilidade no adequada de respostas em alguma pergunta e outras. O teste
tambm serve para estimar o tempo de aplicao do questionrio.

3.3 Amostragem probabilstica e no-probabilstica

Dentre os vrios processos existentes para a obteno de amostras, a
amostragem probabilstica caracteriza-se por garantir, a priori, que todo elemento
pertencente ao universo de estudo possua probabilidade, conhecida e diferente de
zero, de pertencer amostra sorteada. A identificao, direta ou indireta, dos
elementos e o uso de sorteio fundamentam as propriedades matemticas desse tipo
de processo. Se por qualquer razo, alguns elementos da populao no puderem
pertencer amostra sorteada, a amostragem dita no-probabilstica. Alguns tipos de
amostragem no-probabilsticos podem ser empregados quando a populao de
estudo no totalmente acessvel, quando a amostragem realizada a esmo, ou seja,
sem sorteio, e quando a populao formada de material contnuo (lquido ou gs),
em que o uso de sorteio no possvel.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
________________________________________________________________________________


37

3.4 - Vantagens dos mtodos de amostragem

As principais vantagens da amostragem em relao ao censo so: custo, pois
em decorrncia do menor nmero de dados coletados, a amostragem mais
econmica em relao ao censo; maior rapidez, os dados podem ser coletados e
tabulados mais rapidamente na amostragem, possibilitando a obteno dos resultados
ou informaes em um espao de tempo menor; maior facilidade de execuo, para
determinada pesquisas h necessidade de utilizao de uma equipe bem treinada e
equipamentos especializados para obteno dos dados. Neste caso, o censo se torna
inexeqvel em se tratando de grandes populaes; maior preciso, a amostragem
envolve menor nmero de observaes consequentemente, menor n de coletores
de dados, possibilitando trabalhar com uma equipe de melhor nvel e bem treinada.
A amostragem pode ainda revelar maior uniformidade nos mtodos de coleta de
dados, contribuindo para maior preciso dos resultados.
Testes destrutivos os testes podem apresentar carter destrutivo, ou seja, os
itens examinados so destrudos no prprio ato do experimento. Itens como lmpadas,
munio e dispositivo de segurana frequentemente so destrudos como parte do
processo. Ento o censo nos proporcionaria um panorama preciso de uma populao
que no mais existe.
No entanto, a certas situaes em que mais vantajoso examinar todos os itens
de uma populao (ou seja fazendo um censo). Entre essas situaes temos:
1 A populao pode ser to pequena que o custo e o tempo de um censo
sejam pouco maiores que para uma amostragem.
2 Se o tamanho da amostra grande em relao a populao, o esforo
adicional requerido por um censo pode ser pequeno. Por exemplo, se h grande
variabilidade entre os itens de uma populao, uma amostra dever ser
suficientemente grande para ser representativa. Se a populao no muito maior do
que a amostra, o censo pode ser prefervel.
3 Se exigem preciso completa, ento o censo o nico mtodo aceitvel.
Em face da variabilidade amostral, nunca podemos ter certeza de quais sejam os
verdadeiros parmetros da populao.


Captulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________


38
3.5 - Planejamento de um levantamento por amostragem

O sucesso de um levantamento por amostragem est na dependncia direta do
seu planejamento, pois em funo de detalhes de ordem prtica chega-se ao ponto de
que, problemas complexos em alguns casos tornarem-se simples e at mesmo
inexistentes em outros casos. No planejamento de qualquer levantamento, deve-se
considerar os seguintes tpicos:

Objetivos finalidade do levantamento, e a diretriz para a sua perfeita
execuo.

Populao de onde sero extradas as amostras com as informaes a
respeito da populao que se procuram determinar e sempre que possvel devem ser
coincidentes.

Dados a serem coletados: Observar-se todos os dados levantados so
essenciais para a pesquisa em questo. importante lembrar que um questionrio
deve ter no mximo 30 perguntas, para no prejudicar a qualidade das respostas.

3.6 Tipos de Amostragem

Amostragem simples ao acaso (ASA)

uma amostragem probabilstica, onde todos os elementos da populao tem a
mesma probabilidade de pertencerem a amostra ou de serem escolhidos. Para a
composio de uma amostra de n elementos dentre os N elementos da populao,
procedemos ao sorteio at que se complete o tamanho da amostra. Geralmente o
sorteio procedido sem reposio dos elementos j sorteados.
Em uma populao constituda de N, o nmero possvel de amostras de
tamanho n que podem ser retiradas, dada por:
( )
( )! n N n!
N!
C
N
n
n
N

= =

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
________________________________________________________________________________


39
Nesse tipo de amostragem cada uma dessas combinaes tem chance de
n
N
C
1
de ser retirada. Na prtica, cada elemento amostrado por um processo
aleatrio que confere igual chance de ser sorteado a cada elemento da populao.
Sorteia-se um elemento e repete-se o processo para se selecionar o prximo
elemento, dando sempre chances iguais para todos aqueles remanescentes na
populao. Repete-se tantas vezes esse procedimento at que a amostra de n
elementos seja composta.

Ex: Seja uma populao constituda dos elementos A, B, C, D e E. Neste caso N = 5, o
nmero de amostras possveis com as 3 primeiras letras, dado por:
( ) ( )( )
10
1 . 2 1 . 2 . 3
1 . 2 . 3 . 4 . 5
! 3 5 3!
5!
C
3
5
= =

=

ABC BCD CDE
ABD BCE CDA
ABE BDE CDB
ACE

Quando fazemos uma amostragem, geralmente estamos interessados em:
a) estimar o valor mdio da populao;
b) estimar o seu valor total;
c) estimar a porcentagem ou proporo de ocorrncia ou incidncia de um
determinado fator;
d) estimar a varincia dos dados;
e) construir intervalos de confiana para o valor mdio e para o valor total da
populao.

Neste sistema de amostragem estabelecemos 2 importantes fatores:
1 -
N
n
frao de amostragem = probabilidade de cada elemento da populao
participar da amostra.
2 -
n
N
fator de expanso ou de crescimento.

A partir do momento em que os elementos amostrados da populao so
removidos para as sucessivas retiradas subseqentes, esse mtodo denominado de
Captulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________


40
amostragem simples ao acaso sem reposio. Se por outro lado os elementos
populacionais so repostos aps uma retirada, a amostragem dita com reposio e
perfeitamente possvel de ser feita. primeira vista, e intuitivamente, pode-se deduzir
que no muito vantajoso que um mesmo elemento aparea duas, trs ou mais vezes
na amostra. Se a populao muito grande os tipos de amostragem, com ou sem
reposio, no apresentam grandes diferenas. Isso porque a chance de um elemento
ser sorteado duas ou mais vezes para a amostra muito pequena.
O processo de sorteio de uma amostra aleatria simples pode ser feito por meio
de tabelas de nmeros aleatrios, sorteio por funes de geradores de nmeros
aleatrios em programas de computadores, por uso de bolas enumeradas em urnas ou
papis enumerados em algum tipo de recipiente.

Amostragem aleatria estratificada (AAE)

O sistema de obteno de amostras em que a populao de N elementos
previamente dividida em grupos mutuamente exclusivos, denominados de estratos, e
dentro dos quais so sorteadas amostras casuais simples de tamanho n
h
, chama-se
amostragem aleatria estratificada, ou simplesmente amostragem estratificada. As
subpopulaes ou estratos so subdivididos previamente em grupos de tamanhos N
1
,
N
2
, N
3
, ..., N
L

=
=
L
1 h
h
N N unidades, mutuamente exclusivos, de tal sorte que . Aps os
estratos terem sido identificados, uma amostra casual simples retirada de cada
estrato, cujos tamanhos so n
1
, n
2
, n
3
, ..., n
L

=
=
L
1 h
h
n n , considerando .
Uma das principais razes para se usar a estratificao fundamenta-se na
premissa de que esse processo leva a um ganho de preciso na estimao de
parmetros da populao. Isso realmente ocorre, pois possvel subdividir uma
populao heterognea em subpopulaes internamente homogneas. Desta forma,
um estrato considerado homogneo internamente se, de elemento para elemento, h
apenas uma pequena variao. Por essa razo, uma estimativa precisa para um
parmetro de um estrato populacional pode ser obtida com apenas uma pequena
amostra desse estrato. Essas estimativas dos diferentes estratos so combinadas para
a obteno de uma estimativa de um determinado parmetro da populao como um
todo.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
________________________________________________________________________________


41
Exemplo: Ser admitida uma amostra aleatria estratificada (n = 25) sorteada de uma
populao (N = 194) composta por cinco diferentes fornecedores (estratos) de aos
utilizados na fabricao de molas, sendo a varivel medida, a dureza (HB) de molas de
aos produzidas por uma indstria de autopeas (tabela 1).

Tabela 1. Medidas de dureza de molas estratificadas por fornecedor
Estrato N
h n
h Amostra X
h

s
2
h
1 60 5 1,6 1,0 3,7 2,4 1,8 2,10 1,05
2 49 6 8,9 7,3 8,2 4,5 5,9 7,6 7,07 2,59
3 35 6 12,2 17,8 15,0 11,4 14,0 14,6 14,17 5,13
4 30 4 35,3 29,7 27,0 22,0 28,50 30,73
5 20 4 82,0 62,0 75,0 54,0 68,25 158,92
194 25 16,43

Neste exemplo, fica claro que a estratificao permitiu o reconhecimento de uma
importante caracterstica do problema vivenciado pela indstria e o direcionamento do
estudo das medidas corretivas que devero ser adotados para a sua soluo. Na
etapa de identificao do problema, foi definido o seguinte problema: aumento do
nmero de molas devolvidas por apresentarem dureza fora das especificaes. Alm
das diferenas de mdias, percebe-se tambm a grande diferena de variabilidade
entre os estratos.
A estimativa da mdia da populao obtida por:
16,43
194
68,25 20 28,50 30 14,17 35 7,07 49 2,10 60
X
est
=
+ + + +
=

Amostragem aleatria sistemtica (AAS)

A amostragem sistemtica um tipo de amostragem em que o plano de
amostragem obtido por um critrio pelo qual intervalos regulares de mesmo tamanho
entre unidades da amostra so tomados at se compor uma amostra de tamanho n e
toda a extenso da localizao fsica da populao alvo. Para implementar esse
sorteio os N elementos populacionais so tomados a cada k = N/n elementos. O
primeiro elemento deve ser sorteado entre os k primeiros. Se, por exemplo, uma
populao de N = 10000 elementos considerada e deseja-se extrair uma amostra de
tamanho n = 500, ento k ser de 10000/500 = 20. Assim, se o elemento 11 for o
Captulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________


42
primeiro a ser sorteado entre os 20 primeiros, a amostra fica determinada da seguinte
forma: 11, 31, 51, e assim por diante. A seleo da primeira unidade define a amostra
toda.
Esse tipo de amostragem fcil de ser executada e provavelmente mais
precisa que a amostra casual simples. A razo disso, segundo Cochran (1977), a
subdiviso da populao em k estratos e a obteno de um elemento por estrato. A
diferena dessa amostragem para a amostragem estratificada original que o
elemento sorteado est na mesma posio relativa dos estratos. Por outro lado, devido
a esse tipo de amostragem cobrir de forma mais regular a populao em toda sua
extenso que a amostragem estratificada aleatria, essa considerada mais precisa.

Amostragem por conglomerado (AAC)

Quando os elementos da populao so reunidos em grupos que so sorteados
para compor a amostra, o processo denominado de amostragem por conglomerado.
A razo de se usar um tipo de amostragem como esse principalmente motivada por
critrios de ordem prtica. Dentre esses critrios destaca-se a ausncia de uma
listagem de todos os elementos populacionais.
Em geral, o sorteio feito em estgios sucessivos. Assim, por exemplo, se for
considerado o sorteio de uma amostra de 500 propriedades rurais em um dos Estados
da federao, poder-se-ia considerar o sorteio de 50 municpios e 10 propriedades
cada, ou de sorteio de 25 municpios e 20 propriedades em cada, e assim por diante.
A economia nesse tipo de amostragem evidente, pois mtodo dispensa a listagem
de referncia ou cadastro de toda a populao. Somente os conglomerados sorteados
so identificados e listados. Dessa forma, apenas um nmero reduzido de elementos
populacionais deve ser listado.
Outro aspecto o custo para locao e acesso aos elementos populacionais
para a produo na realizao do estudo proposto. O custo total da pesquisa
reduzido, uma vez que ao se sortear um municpio, vrias de suas propriedades so
amostradas, o que no ocorre com o procedimento adotado em uma amostragem
aleatria simples.

3.7 Exerccio

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
________________________________________________________________________________


43
3.7.1 - Considerar uma populao de 35 rvores de uma determinada espcie,
pertencentes a um parque ecolgico, cujos elementos possuem os seguintes
comprimentos em cm para o dimetro altura do peito (DAP).
rvore DAP rvore DAP rvore DAP rvore DAP rvore DAP
1 25 8 25 15 20 22 24 29 22
2 20 9 30 16 19 23 24 30 27
3 35 10 38 17 25 24 22 31 25
4 21 11 24 18 23 25 28 32 23
5 22 12 20 19 20 26 26 33 28
6 22 13 20 20 24 27 23 34 27
7 24 14 25 21 28 28 25 35 22

Com o objetivo de estimar o comprimento mdio como voc extrairia uma
amostra simples ao acaso, de tamanho n = 10, dessa populao? Dar todos os
detalhes, estimar a mdia e confrontar os resultados com o valor do parmetro
populacional. Quantas amostras de tamanho 10 so possveis de serem sorteadas
nessa populao?
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


44

4.0 PROBABILIDADE

4.1 Introduo

O conhecimento de probabilidade constri a base que nos permite entender
como a inferncia estatstica e as tcnicas de auxlio de deciso so desenvolvidas,
porque elas funcionam, e como as concluses obtidas a partir desses procedimentos
podem ser apresentadas e interpretadas corretamente. Para o perfeito entendimento de
probabilidade, alguns conceitos so importantes.

4.2 - Conceitos

4.2.1 - Experimentos probabilsticos ou aleatrios

Um experimento que pode resultar em diferentes resultados, mesmo que seja
repetido sempre da mesma maneira vrias vezes, chamado experimento
aleatrio. Vale observar que experimento se refere a um ensaio cientfico
destinado certificao de um fenmeno.

Caractersticas de um experimento aleatrio:
a) Cada experimento poder ser repetido indefinidamente sob condies
essencialmente inalteradas.
b) Muito embora no se possa afirmar que resultado particular ocorrer, sempre
possvel descrever o conjunto de todos os possveis resultados de um
experimento.
c) Quando o experimento for realizado repetidamente os resultados individuais
parecem ocorrer de forma acidental. Contudo, se o experimento for repetido um
grande nmero de vezes, uma certa regularidade surgir. Isto , ser observada
uma estabilizao na frequncia dos distintos resultados do experimento. esta
regularidade que torna possvel construir um modelo matemtico preciso, com o
qual se analisar o experimento.

Exemplos:
(i) E
1
(ii) E
: Ensaiar uma lmpada quanto a durao da vida at queimar;
2
(iii) E
: Escolher, ao acaso, um ponto de um crculo de raio unitrio;
3
(iv) E
: Registrar as vazes num certo rio, no mesmo ms, dia e hora em
anos sucessivos;
4
(v) E
: Jogar um dado ao ar e observar a sua face superior; e
5

: Seleo de trs itens ao acaso de uma linha de fabricao. Cada item
inspecionado e classificado com defeituoso ou no defeituoso.



CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

45
4.2.2. Espao amostral

O conjunto de todos os possveis resultados de um experimento aleatrio
chamado espao amostral do experimento. Sua representao dada pela letra S.

Exemplo: Aos experimentos aleatrios exemplificados anteriormente esto
associados os seguintes espaos amostrais, respectivamente:

(i) S
1
(ii) S
= {t | t 0}, onde t o tempo
2
= {(x,y); x
2
+ y
2
(iii) S
1}
3
= {q | 0 q q
max
(iv) S
} , onde q a vazo
4
(v) S
= {1, 2, 3, 4, 5, 6}
5

= {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN} sendo D =
defeituoso e N= no defeituoso.
4.2.3 - Eventos

Um evento um subconjunto do espao amostral de um experimento aleatrio.
Temos, ento, que o prprio S (evento certo) e o conjunto vazio (evento impossvel),
constituem eventos. Qualquer resultado individual pode ser tomado como um evento.

Exemplos: se tomarmos o espao amostral S
4

apresentado acima poderamos ter
como eventos: A = {sair nmero par} = {2,4,6}; ou B = {sair nmero maior que 4} =
{5,6}, etc.
OBS.: Novos eventos podem ser originados da combinao de eventos existentes.
A unio de dois eventos o evento que consiste de todos os resultados que esto
contidos em qualquer um dos dois eventos originais. Simbolicamente usamos E
1
U E
2
A interseo de dois eventos o evento que consiste de todos os resultados que
esto contidos em ambos os eventos originais (ou seja, esto em comum).
Simbolicamente usamos E
.
1
E
2
O complemento de um evento em um espao amostral corresponde ao conjunto
de resultados que no fazem parte do evento original. Simbolicamente usamos
.
c
E ou E para representar o complemento do evento E.

4.2.4 - Eventos Mutuamente Exclusivos

Dois eventos so ditos mutuamente exclusivos quando a ocorrncia de um impede
a ocorrncia do outro, ou seja, se eles no puderem ocorrer simultaneamente, isto , A
B = . Equivalem aos conjuntos disjuntos na teoria dos conjuntos.

Exemplo: Considere o espao amostral S
4
definido anteriormente. Considere tambm
os eventos associados a S
4
A e B so mutuamente exclusivos pois A B = .
: A = {1}; B = {5, 6}; C = {nmero par}. Temos, ento, que:
A e C so mutuamente exclusivos pois A C = .
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


46
B e C no so mutuamente exclusivos pois B C = {6}.


4.3 - Noes Fundamentais de Probabilidade - Conceitos

Independentemente do experimento aleatrio em questo, uma vez definidos
alguns eventos de interesse, importante se faz atribuir valores de probabilidade a tais
eventos. Vejamos alguns conceitos teis.

Conceito 1 - Seja E um experimento aleatrio. Seja S um espao amostral associado
ao experimento E. Podemos entender a probabilidade como sendo em nmero real
associado a um evento A qualquer, que satisfaz as seguintes propriedades:
(1) 0 P(A)
(2) P(S) = 1
(3) Se A e B so eventos mutuamente exclusivos, ento P(A U B) = P(A) + P(B)
Generalizando para o caso de um nmero finito de eventos mutuamente exclusivos,
tem-se:

( ) ( ) ( ) ( ) ( ) ( )

=
= + + + + =
n
1 i
i n 3 2 1 n 3 2 1
A P A P A P A P A P A A A A P
Todas essas propriedades parecem concordar com nosso conceito intuitivo de
probabilidade, e essas poucas propriedades so suficientes para permitir toda a
estrutura matemtica a ser desenvolvida. Deve-se notar que as propriedades (ou
axiomas, conforme citado em algumas referncias) acima no fornecem uma maneira
objetiva de se atribuir valores probabilidade de um evento.
Este seria o conceito subjetivo, moderno ou axiomtico de probabilidade.
Enfim, este conceito no fornece formas e sim condies para o clculo de
probabilidades, ou seja, qualquer processo de clculo de probabilidade vlido desde
que satisfaa os axiomas.

Conceito 2 - Uma regra mais prtica que nos fornece uma maneira mais objetiva para
a atribuio numrica da probabilidade de um evento dado pelo chamado conceito
clssico ou probabilidade a priori. Este conceito est ligado aos jogos de azar, que
deram origem teoria de probabilidade nos idos do sculo XVI.
Entretanto, o mtodo clssico para a obteno de probabilidades se aplica a
situaes em que temos espaos amostrais finitos equiprovveis e enumerveis.

Definio: Espao amostral finito equiprovvel: Seja S um espao amostral formado
por um nmero finito de elementos. Se cada ponto a
i
S = {a
de S tem a mesma probabilidade
de ocorrer, ento a espao amostral chama-se equiprovvel ou uniforme. Em
particular, se S contm n pontos amostrais ento a probabilidade de cada ponto ser
1/n.
1
, a
2
, , a
n
P(a
}
i
) = Probabilidade de a
i

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

47
( ) ( )

=
= =
n
1 i
i i
1 a P e n , 2, 1, i 0, a P
Desse modo, a probabilidade do evento A, associado a um espao amostral
finito equiprovvel, dada por:
( )
NCP
NCF
A P =
sendo: NCF = Nmero de casos favorveis ao evento A
NCP = nmero de casos possveis pelos quais E pode ocorrer

Exemplos:
i) Seja E o experimento relativo ao lanamento de um dado honesto. Seja A
o evento ocorrncia da face 6. Portanto, S = { 1, 2, 3, 4, 5, 6} e P(A) = 1/6

ii) Considerando ainda o mesmo experimento, seja B o evento ocorrncia
de uma face par. Logo, B = {2, 4, 6}; ento: P(B) = 3/6 =

iii) Seja o espao amostral referente ao nmero de caras obtidas em dois lances
de uma moeda. Seja A o evento ocorrncia de uma cara. Ento, S = {0, 1, 2} e A = {1}.
Aqui (Exemplo iii) o conceito clssico no pode ser imediatamente aplicado,
pois os pontos de S no so equiprovveis, ou seja, P(A) 1/3.
Observando o espao amostral original: S' = {cc, ck, kc, kk}, sendo c = cara e k
= coroa, v-se que A = {ck, kc} e, portanto, P(A) = 2/4 = 1/2.
Poderamos empregar corretamente o espao S da seguinte maneira: os
resultados 0 e 2 so igualmente provveis, enquanto o resultado 1 duas vezes mais
provvel que qualquer um dos outros.

Conceito 3 - Por outro lado, a maneira terica mais objetiva de se atriburem
probabilidades seria em casos onde o experimento pode ser repetido indefinidas
vezes. A probabilidade seria o limite para o qual tenderia a proporo de vezes em que
o evento ocorre, medida que se aumenta o nmero de repeties do experimento,
sob as mesmas condies. Ou seja, seria atravs da frequncia relativa do evento
considerado. Este seria o terceiro conceito de probabilidade: frequncia relativa ou
probabilidade a posteriori ou probabilidade emprica.
Esta definio tem por base o princpio estatstico da estabilidade, ou seja,
medida que o nmero de repeties do experimento aumenta, a frequncia relativa se
aproxima da probabilidade P(A).
Exemplo: Em 660 lanamentos de uma moeda foram observadas 310 caras. Qual a
probabilidade de, num lanamento dessa moeda obter-se coroa?
Como foram obtidas 310 caras, ocorreram 350 coroas, logo: f = 350/660 =
0,5303.

Mas no absolutamente essencial realizar um experimento para obter dados
amostrais. Em muitos casos dispomos de informao histrica precisa, que pode ser
usada da mesma maneira. Por exemplo, se quisermos a estimativa da probabilidade
de certo jogador acertar um pnalti, no precisamos montar um experimento, caso j
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


48
tenhamos os resultados anotados de vrios treinamentos. Ou seja, no precisamos
mandar ele bater vrios pnaltis e contar os acertos.

Exemplo: Em Sobral, no Cear, observaram-se seis anos de seca no perodo 1901-66
(66 anos).
Qual a probabilidade do prximo ano ser seco?
Aqui, a estimativa f da probabilidade p ser: f = 6/66 = 1/11.

Importante: Ao adotarmos o mtodo emprico, importante atentarmos para os
seguintes aspectos:
a) A probabilidade assim determinada apenas uma estimativa do
verdadeiro valor.
b) Quanto maior a amostra, mais confivel a estimativa da probabilidade
(desde que os princpios tericos de amostragem sejam considerados).
c) A probabilidade s vlida para um conjunto de condies idnticas
quelas sob as quais se originaram os dados.

Exemplo: Se jogarmos um dado honesto 90 vezes e obtivermos o resultado do
quadro a seguir, teremos, na freqncia relativa, a probabilidade "a posteriori" e na
freqncia esperada relativa, a probabilidade "a priori". Quando o nmero de
tentativas aumenta consideravelmente, as duas se aproximam.

Resultado hipottico do lanamento de um dado 90 vezes consecutivas
Face n Freqncia Freqncia relativa Freqncia Freqncia
observada esperada esperada relativa

1

12

12/90 = 0,133

15

1/6 = 0,167
2 17 17/90 = 0,189 15 1/6 = 0,167
3 15 15/90 = 0,167 15 1/6 = 0,167
4 18 18/90 = 0,200 15 1/6 = 0,167
5 10 10/90 = 0,111 15 1/6 = 0,167
6 18 18/90 = 0,200 15 1/6 = 0,167


90 1,000


Probabilidade Geomtrica

Suponhamos que um segmento l seja parte de um outro segmento L e que se
tenha escolhido ao acaso um ponto de L. Se admitirmos que a probabilidade de este
ponto pertencer a l proporcional ao comprimento de l e no depende do lugar que l
ocupa em L, ento a probabilidade de que o ponto selecionado esteja em l ser:




l

L

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

49
L de o compriment
l de o compriment
P =

Exemplo: Sejam AB um segmento de reta e E um evento que se caracteriza pela
escolha, ao acaso, de um ponto do segmento AB, que pertena tambm ao segmento
menor ab, contido em AB. Se os comprimentos de AB e ab so, respectivamente, 5 e
2 unidades, qual a probabilidade da ocorrncia de E?
Soluo:
( )
5
2
= =
AB de o compriment
ab de o compriment
E P

Analogamente, suponhamos que uma figura plana g seja parte de uma outra
figura plana G e que se tenha escolhido ao acaso um ponto de G.





Se admitirmos que a probabilidade de este ponto pertencer a g proporcional
rea de g e no depende do lugar que g ocupa em G, ento a probabilidade de que o
ponto selecionado esteja em g ser:
G de rea
g de rea
P =

Exemplo: Seja um experimento referente escolha de um ponto ao acaso de um
crculo de raio r centrado na origem. Tem-se ento:

S = {(x, y): x
2
+ y
2
r
2

}
ou seja, os pares de valores (x, y) que satisfazem a condio x
2
+ y
2
r
2

, so os
pontos amostrais que compe S.
Supondo um crculo de raio igual a 2 e os eventos A = {(x, y): x
2
+ y
2
2} e B =
{(x, y): x
2
+ y
2

}, pede-se calcular P(A) e P(B).
Soluo:
( )
( )
( ) 2
1
2
2
2
2
2
2
= = =

de crculo do rea
raio de crculo do rea
A P

( )
( ) 8
1
2
2
1
2
2
1
2
2
=

= =

de crculo do rea
raio de crculo do rea
A P

g
G
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


50
4.4 - Espao Amostral Finito
Seja S um espao amostral finito:
S = {a
1
, a
2
, ..., a
n

}
Um espao de probabilidade finito obtido associando-se a cada ponto a
i
S,
um nmero real p
i
(i) p
, chamado de probabilidade de ai, satisfazendo s seguintes
condies:
i
(ii) p
0, para i = 1, 2, ..., n
1
+ p
2
+... + p
n

=
=
n
1 i
i
1 p =
A probabilidade de qualquer evento A, que denotaremos por P(A), dada pela
soma das probabilidades dos pontos de A.

4.5 - Principais Teoremas para o Clculo de Probabilidades

O clculo de probabilidades, alm dos axiomas apresentados na pgina 46, se
baseia em cinco teoremas auxiliares. Os diagramas de Venn so teis na
compreenso, tanto dos teoremas, quanto dos processos de demonstrao.

I) Se for o conjunto vazio, ento P() = 0
Prova:
A = A
P(A) = P(A ) = P(A) + P() (propriedade 2)
logo, P() = P(A) - P(A) = 0 P() = 0

Fato: A recproca deste teorema no verdadeira, isto , P(A) = 0 no implica que A
seja um conjunto vazio.

II) Se A o complemento de A, ento P( A ) = 1 - P(A)



P(S) = 1

Prova:
S = A A 1 = P(A) + P( A ) (propriedades 2 e 3)
logo, P( A ) = 1 - P(A).

III) Se A e B so ditos eventos quaisquer e B o complemento de B, ento P(A B )
= P(A) P(A B).




S
A
A
A

S
A B
A B
A B
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

51

Prova:
A = (A B ) + (A B)
P(A) = P(A B ) + P(A B), pois (A B ) e (A B) so mutuamente exclusivos, logo:
P(A B ) = P(A) - P(A B)

Fato: Do mesmo modo P( A B) = P(B) P(A B)

IV) Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) - P(A B)
(Teorema da Soma das probabilidades)





Prova:
A idia desta demonstrao decompor AB e B em dois eventos mutuamente
exclusivos.
Logo, podemos escrever:
AB = A (B A ) ......(1)
B = (A B) (B A) .....(2) consequentemente,
P(A B) = P(A) + P(B A) .....(1)
P(B) = P(A B) + P(B A) .....(2)

Subtrando-se a primeira igualdade da segunda, tem-se:
P(A B) - P(B) = P(A) - P(A B) e, ento:
P(A B) = P(A) + P(B) - P(A B)

FATO: Para trs eventos quaisquer A, B e C, temos que:
P(A B C) = P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B C)

V) Se A B, ento P(A) P(B), = contido




Prova:
B = A (B A )
P(B) = P[A (B A )]
P(B) = P(A) + P(B A )
logo P(B) P(A) pois P(B A ) 0 pelo axioma enunciado em 4.



S
A B
A B
A B
S
A B
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


52
4.6 - Probabilidade Condicional

A noo de probabilidade condicional uma ferramenta bsica da teoria das
probabilidades. Sejam A e B dois eventos associados ao experimento E. A
probabilidade do evento B condicionada ocorrncia do evento A, ou seja, a
probabilidade condicional de B dado A, dada por:
( )
( )
( )
( ) 0 A P para ,
A P
B A P
B/A P >

=
Analogamente: ( )
( )
( )
( ) 0 B P para ,
B P
B A P
A/B P >

=
Pode-se verificar que P(B/A) satisfaz aos vrios postulados de probabilidade.
Isto :
i) 0 P(B/ A) 1
ii) P(S/A) = 1
iii) [ ] [ ] / A ) B (B P - /A) P(B /A) P(B / A ) B (B P
2 1 2 1 2 1
+ =
ou P(B
1
/A) + P(B
2
/A) se B
1
B
2
obs: Se A e B so eventos mutuamente exclusivos, ento: P(B/A) = P(A/B) = 0
=

Exemplo: Os dados abaixo se referem a 200 alunos matriculados em determinado
curso de Matemtica, de acordo com o sexo e a disciplina:
Masculino Feminino Total
Matemtica Pura 60 50 110
Estatstica 80 10 90
Total 140 60 200

Qual seria a probabilidade de uma pessoa aleatoriamente escolhida:
a) Estar matriculada em matemtica pura?
b) Estar matriculada em matemtica pura, dado ser homem?
c) Ser homem?
d) Ser homem dado que esta matriculado em estatstica?
e) Estar matriculada em matemtica pura, sabendo-se que mulher ?

Soluo:
sejam os eventos: A = {aluno faz matemtica pura}
E = {aluno faz estatstica}

M = {aluno do sexo masculino}
F = {aluno do sexo feminino}
a)
200
110
NCP
NCF
P(A) = =
b) ( )
( )
( ) 140
60
140
200
200
60
200
140
200
60
M P
M A P
A/M P = = =

=
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

53
c)
200
140
P(M) =
d)
90
80
200
90
200
80
P(E)
E) P(M
P(M/E) = =

=
e)
60
50
200
60
200
50
P(F)
F) P(M
P(M/F) = =

=

Podemos verificar que podemos calcular a probabilidade condicional [P(B/A)] de
dois eventos A e B quaisquer de duas maneiras:
i) Empregando a definio, onde P(A B) e P(A) so calculados em relao ao
espao amostral original S;
ii) Diretamente, pela considerao da probabilidade de B em relao ao espao
amostral reduzido determinado pela ocorrncia do evento A.

4.7 - Teorema do Produto das Probabilidades

Vimos que a probabilidade condicional de A na hiptese H (ou dado H)
( ) 1
P(H)
H) P(A
P(A/H)

=
A frmula (1) frequentemente usada na forma

P(A H) = P(A/H) * P(H) (2)

Esse resultado conhecido pelo nome de teorema do produto.
A generalizao desse resultado para trs eventos A, B, C, obtida por:

( ) [ ]
( )
( )
( )
( ) ( ) B/A P A P
C B A P
B A P
C B A P
B A C/ P


=
ento:

P(A B C) = P[C/(A B)]
.
P(B/A)
.

P(A)
As generalizaes para quatro ou mais eventos saem diretamente pelo mesmo
processo.

4.8 - Independncia Estocstica (ou Probabilstica)

Dois eventos A e B, pertencentes a um mesmo espao amostral (S), so
independentes se as seguintes condies so vlidas:

P(A/B) = P(A) e P(B/A) = P(B), ento:

Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


54
P(AB) = P(A)
.

P(B)
4.9 - Partio do Espao Amostral e o Teorema de BAYES

4.9.1 - Teorema da Probabilidade Total

Inicialmente, enunciaremos um teorema til que relaciona a probabilidade de
um evento com probabilidades condicionais, o qual chamado Teorema da
Probabilidade Total.
Sejam B
1
, B
2
, ..., B
n

eventos mutuamente exclusivos e exaustivos.
Definio: {B
1
, B
2
, ..., B
n
} um conjunto de eventos mutuamente exclusivos e
exaustivos se quaisquer dois eventos B
i
e B
j
no podem ocorrer ao mesmo tempo e
um deles deve ocorrer. Simbolicamente, B
i
B
j
= , para i j, e B
1
B
2
... B
n

= S.
B
1
, B
2
, ..., B
n

so eventos que formam uma partio do espao amostral S.
Ento, para um evento arbitrrio A, tem-se:
P(A) = P(A/B
1
) P(B
1
) + P(A/B
2
) P(B
2
) +
...
+ P(A/B
n
) P(B
n

=

n
1 i
i i
) P(B ) P(A/B ) =
Prova:
Seja o diagrama de Venn a seguir:





claro que podemos escrever A como a unio de eventos mutuamente
exclusivos, isto :

A = (A B
1
) (A B
2
) ... P(A B
n
Logo:
)
P(A) = P(A B
1
) + P(A B
2
) + ... + P(A B
n

)
Mediante aplicao da probabilidade condicional, onde:
) P(B ) P(A/B ) B P(A
) P(B
) B P(A
) P(A/B
i i i
i
i
i
=

=
teremos
) P(B ) P(A/B ) P(B ) P(A/B ) P(B ) P(A/B P(A)
n n 2 2 1 1
+ + + =

=
=
n
1 i
i i
) P(B ) P(A/B P(A)
obs: Esta relao til quando desejamos calcular P(A) e esta difcil de ser
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

55
calculada diretamente, e sabemos da(s) ocorrncia(s) do(s) B
i

. O fato que mais
fcil calcular os termos que compem o somatrio do que a prpria P(A).
4.9.2 - Teorema de Bayes

Com base na definio de probabilidade condicional e na partio do espao
amostral considerada anteriormente, pode-se estabelecer um resultado bastante til,
geralmente conhecido como Teorema de Bayes, o qual apresentaremos agora:
Sejam A e B dois eventos arbitrrios com P(A) > 0 e P(B) > 0. Ento:
P(A)
P(B) P(A/B)
P(A)
A) P(B
P(B/A)

=

=

Combinando este resultado com o teorema da probabilidade total, temos, como
consequncia,

=
n
1 i
i i
j j
j
) P(B ) P(A/B
) P(B ) P(A/B
/A) P(B

Para a aplicao do teorema, as probabilidades P(B
j
) devem ser conhecidas e
convenientemente consideradas, e os B
i
Sua utilidade consiste em permitir-nos calcular a probabilidade a posteriori
[P(B/A)] em termos das informaes a priori P(B) e P(A).
representam um conjunto de eventos
mutuamente exclusivos e exaustivos.

Exemplo: Em uma escola, as turmas A, B e C tm 40, 50 e 10 % do total de alunos de
determinada srie, respectivamente. Dos alunos de cada turma, 3, 5 e 2 %,
respectivamente, sero reprovados. Escolhido ao acaso um aluno dessa srie, pede-
se:
a) Qual a probabilidade de o aluno ser reprovado?
b) Seleciona-se ao acaso um aluno dessa escola. Sabendo-se que o aluno ser
reprovado, qual a probabilidade de que ele seja da turma B?

Soluo:
Sejam os eventos: A = {aluno da turma A}
B = {aluno da turma B}
C = {aluno da turma C}
R = {aluno reprovado}

Mtodo 1:
P(A) = 0,40 P(B) = 0,50 P(C) = 0,10
P(R/A) = 0,03 P(R/B) = 0,05 P(R/C) = 0,02
a) R = {(R A) (R B) (R C)}
P(R) = P(R A) + P(R B) + P(R C)
P(R) = P(A)
.
P(R/A) + P(B)
.
P(R/B) + P(C)
.
P(R) = 0,40
P(R/C)
.
0,03 + 0,50
.
0,05 + 0,10
.
0,02
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


56

P(R) = 0,012 + 0,025 + 0,002 = 0,039

b) 0,641
39
25
0,039
0,025
0,039
0,05 0,50
P(R)
P(R/B) P(B)
P(R)
R) P(B
P(B/R) = = =

=

Mtodo 2:

R
R

A 0,012 0,388 0,40
B 0,025 0,475 0,50
C 0,002 0,098 0,10
0,039 0,961 1,00

a) P(R) = 0,039
b) 0,641
0,039
0,025
P(B/R) = =

Mtodo 3: (Diagrama em rvore)
R 0,03
A 0,40

R
0,97
R 0,05
B 0,50

R
0,95
R 0,02
C 0,10

R
0,98

a) P(R) = P(A R) + P(B R) + P(C R) = 0,40
.
0,03 + 0,50
.
0,05 + 0,10
.

0,02 =
0,039
b) 0,641
0,039
0,05 0,50
P(R)
R) P(B
P(B/R) =

=

4.10 - Exerccios propostos

1. Numa prova h 7 questes do tipo verdadeiro-falso ( V ou F ). Calcule a
probabilidade de acertarmos todas as 7 questes se:
a) Escolhermos aleatoriamente as 7 respostas. (R: 1/128)
b) Escolhermos aleatoriamente as respostas, mas, sabendo que ha mais respostas V
do F. (R: 1/64)

2. Num exame de mltipla escolha h 3 alternativas para cada questo e apenas uma
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

57
delas correta. Portanto, para cada questo, um aluno tem probabilidade 1/3 de
escolher a resposta correta se ele esta assinalando aleatoriamente e 1 se sabe a
resposta. Um estudante sabe 30% das respostas do exame. Se ele assinalou
corretamente uma das questes, qual a probabilidade de que ele tenha a assinalado
ao acaso? (R: 7/16)

3. Certa firma utiliza um teste para classificar os funcionrios em categorias; ao final
eles so classificados em: 25% bons (B); 50% mdios (M) e 25% fracos (F). Um novo
teste proposto, de tal forma a classificar os funcionrios como aprovado (A) ou
reprovado (R). Com base em informaes do antigo teste, foram obtidas as seguintes
probabilidades com o novo teste.
CATEGORIAS % de APROVADOS
B 80
M 50
F 20

Deseja-se saber qual a probabilidade de um funcionrio aprovado no novo
teste, ser classificado como fraco pelo antigo teste ? (R: 0,10)

4. Considere a escolha aleatria de um nmero entre os 10 primeiros nmeros inteiros
positivos (a partir de 1), e os eventos:
A = {1, 2, 3, 4, 5}; B = {4, 5, 6, 7} e C = {5, 9}. Pede-se: Os eventos so Mutuamente
Independentes? Mostre porqu. (R: No)

5. Uma urna contm 5 bolas vermelhas e 3 brancas. Uma bola selecionada,
aleatoriamente, dessa urna e no reposta. Em seguida, duas bolas de cor diferente
da bola extrada anteriormente (branca ou vermelha) so colocadas na urna. Se uma
segunda bola extrada aleatoriamente, qual a probabilidade de:
a) A segunda bola ser vermelha? (R: 41/72)
b) A segunda bola ser da mesma cor da primeira? (R: 13/36)

Lista de Exerccios: Probabilidade

1) Considerando o espao amostral de um experimento constitudo do lanamento de
dois dados perfeitamente simtricos, pede-se:
a) Qual a probabilidade de que o primeiro dado mostre a face 2 e o segundo a face 3?
(R: 1/36)
b) Qual a probabilidade de que ambos os dados mostrem a mesma face? (R: 1/6)
c) Qual a probabilidade de que o segundo dado mostre um nmero par? (R: )

2) Uma moeda perfeita lanada 3 vezes e observado o nmero de caras. Qual a
probabilidade de ocorrer?
a) Pelo menos uma cara? (R: 7/8)
b) S cara ou s coroa? (R: )
c) Exatamente uma cara? (R: 3/8)
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


58

3) Dos 10 alunos de uma classe, 3 tm olhos azuis. Se duas delas so escolhidas
aleatoriamente, qual a probabilidade de:
a) Ambas terem olhos azuis? (R: 1/15)
b) Nenhuma ter olhos azuis? (R: 7/15)
c) Pelo menos uma ter olhos azuis? (R: 8/15)

4) Em um certo colgio, 25% dos estudantes foram reprovados em matemtica, 15%
em qumica e 10% em matemtica e qumica ao mesmo tempo. Um estudante
selecionado aleatoriamente.
Pede-se:
a) Se ele foi reprovado em qumica, qual a probabilidade de ter sido reprovado em
matemtica? (R: 2/3)
b) Se ele foi reprovado em matemtica, qual a probabilidade de ter sido reprovado em
qumica? (R: 2/5)
c) Qual a probabilidade de ter sido reprovado em matemtica ou qumica? (R: 0,30)

5) Um dado viciado de tal forma que a probabilidade de sair um certo nmero
proporcional ao seu valor. Pede-se:
a) Qual a probabilidade de sair o 3, sabendo-se que o ponto que saiu mpar? (R:
1/3)
b) Qual a probabilidade de sair um nmero par, sabendo-se que saiu um nmero
maior que 3? (R: 2/3)

6) Sejam A, B e C trs eventos de um mesmo espao amostral S . Sabendo-se que:
3
1
P(B) P(A) = =
4
1
P(A) =
8
1
B) P(A =
9
1
C) P(B C) P(A = =
20
1
C) B P(A =
Calcular as probabilidades:
a) De ocorrer pelo menos um dos eventos A, B ou C? (R: 223/360)
b) De que no se realize nenhum dos eventos A, B ou C? (R: 137/360)
c) De que o evento A se realize, sabendo-se que j ocorreu B ou C? (R: 67/170)

7) Sendo S = {1, 2, 3, 4} um Espao amostral Equiprovvel e os eventos A = {1, 2}, B =
{1, 3} e C = {1, 4}. Verifique se os eventos A, B e C so mutuamente independentes.
(R: No so independentes)

8) Dois homens H
1
e H
2
e trs mulheres M
1
, M
2
e M
3
a) Qual a probabilidade de que uma mulher vena o torneio? (R: )
esto num torneio de xadrez. Os
do mesmo sexo tem igual probabilidade de vencer, mas cada mulher tem duas vezes
mais probabilidade de vencer o torneio do que qualquer um dos homens. Pede-se:
b) Se H
1
e M
1
so casados, qual a probabilidade de que um deles vena o torneio?
(R: 3/8)
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________

59



9) Um homem possui duas moedas, uma comum e a outra cunhada com duas caras.
Ele apanhou uma moeda aleatoriamente e a lanou, se ocorreu a face cara, qual a
probabilidade de que a moeda lanada tenha sido a de duas caras? (R: 2/3)

10) Jogam-se dois dados. Se as duas faces mostram nmeros diferentes, qual a
probabilidade de que uma das faces seja o 4? (R: 1/3)

11) Considere dois tipos de caixas de bombons, B e C. O tipo B contm 65% de
bombons doces e 35% de bombons amargos, enquanto no tipo C essas percentagens
de sabor so inversas. Alm disso, 45% de todas as caixas de bombons so do tipo B,
e as restantes do tipo C. Escolhe-se, aleatoriamente, uma caixa e um bombom dessa
caixa; se for constatado que ele do tipo doce, qual a probabilidade de ter vindo de
uma caixa do tipo C? (R: 0.3969)

12) Definir e dar exemplos de:
a) Eventos Mutuamente Exclusivos?
b) Eventos Independentes?

13) Numa placa de petri 20%, 40%, 25% e 15% do total das colnias bacterianas so
dos tipos A, B, C e D, respectivamente. Sabe-se que 3%, 5%. 6% e 20% de cada
colnia, respectivamente, so patognicas.
a) Se for retirada uma amostra aleatria de uma nica colnia bacteriana, qual a
probabilidade de que esta amostra contenha somente bactrias patognicas? (R:
0,071)
b) Se for constatado que a amostra do item a possui somente bactrias patognicas,
qual a probabilidade de que as bactrias sejam do tipo D? (R: 0.4225)

14) Quatro equipes A, B, C e D participam de um torneio que premiar uma nica
equipe campe. Quanto s probabilidades de cada equipe vencer o torneio, as
equipes C e D so equiprovveis, a equipe A duas vezes mais provvel do que B, e
B duas vezes mais do que as equipes C e D. Pede-se: Qual a probabilidade de que
as equipes C ou D sejam campes? (R: 0,25)

15) Uma caixa contm 8 peas, das quais 3 so defeituosas e uma caixa B contm 5
peas, das quais 2 so defeituosas. Uma pea retirada aleatoriamente de cada
caixa:
a) Qual a probabilidade p de que ambas as peas no sejam defeituosas? (R: 3/8)
b) Qual a probabilidade p de que uma pea seja defeituosa e a outra no? (R: 19/40)
c) Se uma pea defeituosa e a outra no, qual a probabilidade p de que a pea
defeituosa venha da caixa A? (R: 9/19)

16) A e B so eventos mutuamente exclusivos. Determine quais das relaes abaixo
Captulo 4 Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


60
so verdadeiras e quais so falsas. JUSTIFIQUE.
a) P(A/B) = P(A)
b) P(A B/C) = P(A/C) + P(B/C)
c) P(A) = 0, P(B) = 0, ou ambas
d)
P(B)
P(A/B)
P(A)
P(B/A)
=
e) P(A B) = P(A)
.

P(B)
Repita o problema supondo A e B independentes.

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
61

5.0 VARIVEIS ALEATRIAS E DISTRIBUIES DE PROBABILIDADE

5.1 Conceito de varivel aleatria

toda e qualquer varivel associada a uma probabilidade, isto , seus valores
esto relacionados a um experimento aleatrios. Uma funo cujo valor um nmero
real determinado por cada elemento em um espao amostral chamado uma varivel
aleatria (v.a.)
Isso equivale a descrever os resultados de um experimento aleatrio por meio de
nmeros ao invs de palavras, o que uma grande vantagem, pois possibilita melhor
tratamento matemtico, inclusive atravs de parmetros que veremos a seguir.

obs.: Utilizaremos letras maisculas (X, Y, Z, etc.) para representar a v.a. e a
correspondente letra minscula (x, y, z, etc.) para um dos seus valores.

obs.: cada possvel valor x de X representa um evento que um subconjunto do espao
amostral.

Exemplo: Duas peas so retiradas sucessivamente, sem reposio, de uma caixa que
contm quatro peas boas (B) e 3 defeituosas (D). Para esse experimento teramos o
seguinte espao amostral
S = {BB, BD, DB, DD}.
Se considerarmos a v.a. Y = nmero de peas boas retiradas teramos:
S* = {0, 1, 2}.
Fazendo uma correspondncia entre S e S* teramos:
Evento Simples Y = y
BB 2
BD 1
DB 1
DD 0

Outro exemplo:
Considere o lanamento de duas moedas e seja X = no de caras obtidas, c = cara e k =
coroa

S = {cc, ck, kc, kk}
X = {0, 1, 2}, Isto , X(kk) = 0, X(ck) = X(kc) = 1 e X(cc) = 2.

Se um espao amostral contm um numero finito de pontos como no exemplo
anterior, ou uma sequncia infinita enumervel de pontos amostrais, ele chamado
espao amostral discreto. A v.a. definida sobre esse espao chamada varivel
aleatria discreta (v.a.d.).

Por outro lado, se um espao amostral contm pontos amostrais que formam
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


62
uma continuidade como todas as possveis alturas de pessoas, pesos de animais,
tempos de vida de um componente mecnico ou eletrnico, temperaturas, etc. Ento ele
chamado espao amostral contnuo. A varivel definida sobre esse espao
chamada varivel aleatria contnua (v.a.c.).

obs.: na maior parte dos problemas prticos as v.a.c. representam dados medidos e as
v.a.d. representam dados contados, tais como o nmero de defeituosos em uma
amostra de n peas ou o nmero de acidentes em determinada rodovia.

exemplo:
- n de acidentes ocorridos em uma semana;
- n de defeitos por pea produzida por um fabricante;
- n de vitrias obtidas por um atleta;
- n de filhos do sexo masculino por casal.

obs.: No caso das v.a.c. somente tero interesse as probabilidades de que a v.a.
assuma valores em dados intervalos. As probabilidades de interesse podero ser
determinadas com o conhecimento da distribuio de probabilidade da v.a.

5.2 - Distribuio de probabilidade

De acordo com o tipo de varivel aleatria, ou seja se v.a.d. ou v.a.c., teremos:

a) X uma v.a.d.

Nesse caso precisamos saber os valores da v.a.d. X e de sua funo de
probabilidade. Chama-se funo de probabilidade (f.p.) da varivel aleatria discreta
X, a funo

i i i
p ) P(x ) x P(X = = =

que a cada valor de X (ou seja, a cada x
i

) associa sua probabilidade de ocorrncia.
obs.: essa funo muitas vezes est reduzida a um valor numrico e, em outros casos,
pode ser representada por uma frmula.

A funo P(x
i

) ser uma funo de probabilidade se satisfizer s seguintes
condies:
i) P(x
i
) 0, para todo x
ii)
i

=
i
i
1 ) P(x

coleo de pares [x
i
, P(x
i
)], i = 1, 2, ..., n, denominaremos distribuio de
probabilidade da v.a.d. X, que pode ser representada por meio de tabelas e grficos.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
63

Exemplo: Seja E: lanamento de um dado viciado de tal forma que a probabilidade
proporcional ao valor obtido no lanamento.
Considere: S = {1, 2, 3, 4, 5, 6}
Vamos supor que estamos interessado na avaliao da varivel aleatria X, onde
X = {n de pontos obtidos num lanamento}, ou X = {resultado num lanamento}

Assim os possveis valores que a varivel aleatria X pode assumir so:

X = {1, 2, 3, 4, 5, 6}, com as respectivas probabilidades:
p + 2p + 3p + 4p + 5p + 6p = 1 21p = 1 p = 1/21

Para o nosso exemplo temos que a distribuio de probabilidades da v.a. X ser:

i) Grfico



ii) Tabela
x 1
i
2 3 4 5 6
P(x
i
1/21 ) 2/21 3/21 4/21 5/21 6/21

Observe que as duas condies apresentadas acima so satisfeitas.

As tabelas e grficos so utilizados para mostrar como a probabilidade total
atribuda a um espao amostral distribuda pelos diversos resultados daquele espao.

Nesse exemplo, a funo de probabilidade poderia tambm ser representada
como:

=
=
i
i
i
i
x de valores outros para 0,
6 5, 4, 3, 2, 1, x para ,
21
x
) P(x

Este exemplo trata-se de uma varivel aleatria X = {n de pontos obtidos}, que
no uniformemente distribuda.


Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


64
Problema proposto: Uma urna contm 4 bolas azuis e 6 brancas. Duas bolas so
retiradas sucessivamente I) com reposio e II) sem reposio. Determinar, em cada
caso, a distribuio de probabilidade e a funo de probabilidade do n de bolas brancas
retiradas.

b) X uma v.a.c.

No caso de v.a.c. somente tero interesse as probabilidades de que a v.a.
assuma valores em dados intervalos. Tais probabilidades podero ser determinadas
com o conhecimento da funo densidade de probabilidade da v.a..
Chama-se funo densidade de probabilidade (f.d.p.) da varivel aleatria
discreta X, a funo f(x) que atenda s seguintes condies:

i) f(x) 0, para a < x < b
ii)

=
b
a
1 f(x)dx ,

onde a e b podem ser, respectivamente, - e .
A f.d.p. assim definida determina a distribuio de probabilidades da v.a.c. X. Sua
representao dada em forma grfica.

obs.:

1) Para c < d , P(c < X < d) =

d
c
f(x)dx

2) Para um valor fixo de X, por exemplo, X = x
0
, temos que P(X = x
0

=
0
0
x
x
0 f(x)dx ) = ;
sendo assim, as probabilidades abaixo so todas iguais, se X for uma v.a.c.:

P(c X d) = P(c X < d) = P(c < X d) = P(c < X < d)

3) A funo densidade de probabilidade f(x), no representa probabilidade. Somente
quando a funo for integrada entre dois limites, ela produzir uma probabilidade, que
ser a rea sob a curva da funo entre os valores considerados.

Exemplo: Uma v.a.c. X possui a seguinte funo:

<
<
=
x de valores outros para 0,
2 x 1 para x), k(2
1 x 0 para k,
f(x)
Pede-se:
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
65
a) A constante k para que f(x) seja uma f.d.p.
b) Grfico da f(x).
c) P(1/2 X 1); d) P(X = 1); e) P(1/2 X 3/2); f) P(X > 2)

Respostas: a) 2/3 ; c) 1/3; d) 0; e) 7/12; f) 0.

Problemas propostos:

1. Seja uma v.a.c. X definida pela seguinte f.d.p.:

>

<
=
2 x para 0,
2 x 0 para kx,
0 x para 0,
f(x)

a) Determinar o valor de k?
b) Traar o grfico da f.d.p.?
c) Calcular P(X 1).

Respostas: a) 1/2; c) 1/4

2. Uma v.a.c. X tem a seguinte f.d.p.

>


<
=
10 x para 0,
10 x 5 para x), k(10
5 x 0 para kx,
0 x para 0,
f(x)

a) Determinar o valor de k?
b) Traar o grfico da f.d.p.?
c) Calcular P(X 3)

Respostas: a) 1/25; b) 41/50

Existem muitos problemas nos quais de interesse conhecer a probabilidade que
a v.a. X assumisse valores menores que um particular valor x. Nesse caso precisamos
definir a funo de distribuio acumulada de X.

5.3 - Funo de distribuio acumulada

Dada a varivel aleatria X, chamaremos de funo de distribuio acumulada
ou, simplesmente, funo de distribuio F(x) a funo F(x) = P(X x).
Observe que o domnio de F todo o conjunto real.

obs.:
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


66
a) 0 F(x) 1 para todo x.
b) Se x
1
x
2
, ento F(x
1
) F(x
2

), isto , F(x) no-decrescente.
a) F(x) para X v.a.d.

Para X uma v.a.d. temos que:

x t
P(t) x) P(X F(x)

= =



Exemplo: Seja X uma v.a.d. com a seguinte distribuio de probabilidade

x 0
i
1 2 3 4 Total
P(x
i
1/16 ) 4/16 6/16 4/16 1/16 1,00
F(x)

Pede-se:

a) Traar o grfico da distribuio de probabilidade de X?
b) Obter a funo de distribuio acumulada e traar seu grfico?

b) F(x) para X v.a.c.

Para X uma v.a.c. temos que:


= < < = =
X
f(t)dt x) X P( x) P(X F(x)
Temos ainda que,

= = <
d
f(x)dx F(c) - F(d) d) X P(c
c


V-se tambm que
dx
F(x) d
f(x) = em todos os pontos de continuidade de f(x), isto
, a derivada da funo de distribuio a funo densidade de probabilidade.

Exemplos:

1. Seja X uma v.a.c. com a seguinte f.d.p.:


=
contrrio caso 0,
2 x 0 para x,
2
1
f(x)
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
67

Pede-se:
a) Traar o grfico da f.d.p.?
b) Obter F(x) e traar seu grfico?
c) Calcular P(X1)?
d) Calcular P(1 X 3/2)
e) Qual o valor de X abaixo do qual existem 50% dos dados?

Respostas: c) 1/4; d) 5/16; e) 2

2. Seja X uma v.a.c. com funo dada por:

+
<
<
=
contrrio caso 0,
3 x 2 se 3a, ax -
2 x 1 se a,
1 x 0 se ax,
f(x)

Pede-se:
a) Determine a constante a para que f(x) seja uma f.d.p.?
b) Traar o grfico da f.d.p.?
c) Obter F(x) e traar seu grfico?
d) ?
2
3
X 0 P
|
.
|

\
|
< <
e) Qual valor de X abaixo do qual existem 50% dos dados?

Resposta: a) 1/2; d) 1/2; e) 1,5.

5.4 - Distribuies empricas

Geralmente quando temos um experimento envolvendo uma v.a.c. a verdadeira
funo densidade (f(x)) nos desconhecida. Para que adotemos uma f(x) razovel uma
boa anlise sobre todas as informaes disponveis se faz necessria. Essa anlise
pode ser feita com o uso de distribuies de frequncias relativas, em forma de tabelas
ou grficos, conforme descrito no capitulo 2. Distribuies assim obtidas permitem
supor acerca da verdadeira distribuio de probabilidades associada quela varivel
aleatria. Supondo-se ento uma determinada distribuio de probabilidades v.a. em
questo, outras anlises mais avanadas podem ser realizadas (como os testes de
hipteses para se testar tais suposies). Exemplos desse tipo sero citados
oportunamente.





Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


68

5.5 - Distribuies de probabilidades conjuntas

Vimos, anteriormente o caso de distribuies de probabilidades para o caso de
uma nica varivel aleatria. H casos, contudo, nos quais estamos interessados no
estudo de duas ou mais variveis aleatrias simultaneamente. Por exemplo, algum
poderia estar interessado na dureza (D) e na tenso de ruptura (T) de uma liga de cobre
fornecendo assim o resultado (d,t).
Se X e Y so duas v.a., a distribuio de probabilidade para a sua ocorrncia
simultnea pode ser representada por f(x,y) para o caso em que (X,Y) uma v.a.
bidimensional contnua, e p(x,y) para o caso em que (X,Y) uma v.a. bidimensional
discreta.

Definio

Sejam E um experimento e S um espao amostral associado a E. Sejam X = X(s)
e Y = Y(s), duas funes, cada uma associando um nmero real a cada resultado s S.
Denominaremos (X,Y) uma varivel aleatria bidimensional.
Em determinadas situaes, X e Y no esto necessariamente ligadas a um
mesmo experimento, mas existe uma razo bastante definida para considerar X e Y
conjuntamente. Para o nosso estudo vamos considerar que X e Y so ambas discretas
ou contnuas.
Do mesmo modo que no caso unidimensional (X,Y) deve ter associada, a cada
valor que pode assumir, uma probabilidade de sua ocorrncia. Assim precisamos definir
a distribuio de probabilidade da v.a. bidimensional (X,Y).

5.6 - Distribuio conjunta de duas variveis aleatrias, distribuies marginais e
condicionais

a) (X, Y) v.a.d. bidimensional

(X,Y) ser uma v.a.d. bidimensional se os valores possveis de X e Y forem finitos
ou infinitos enumerveis. Isto , se os valores possveis de (X,Y) podem ser
representados por (x
i
, y
j

) i = 1, 2,..., r e j = 1, 2,..., s.
a.1) Funo de probabilidade conjunta de X e Y

Chama-se de funo de probabilidade conjunta da v.a.d. bidimensional (X, Y) a
funo:
P(X = x
i
; Y = y
j
) = P(x
i
; y
j
) = p

ij

que a cada valor de (x
i
; y
j
Para que P(x
) associa sua probabilidade de ocorrncia.
i
; y
j

) seja uma funo de probabilidade conjunta necessrio que
satisfaa s seguintes condies:
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
69
a) P(x
i
, y
j
) 0, para todo par (x
i
, y
j
b)
)
( )

=
i j
j i
1 y , x P


Distribuio de probabilidade conjunta

o conjunto {(x
i
; y
j
), P(x
i
; y
j

)} para i = 1, 2,..., r e j = 1, 2,..., s
a.2) Distribuies marginais

Dada uma distribuio conjunta de duas variveis aleatrias X e Y, podemos
determinar a distribuio de X sem considerar Y e a de Y sem considerar X. So as
chamadas distribuies marginais.
A distribuio marginal constituda pelos valores da varivel aleatria e suas
respectivas probabilidades marginais, que sero apresentadas na forma grfica ou
tabular conforme visto para v.a. unidimensionais. A probabilidade marginal para cada
valor obtida da seguinte forma:

para X: P(X = x
i
) = P(x
i
( )

=
s
1 j
j i
y , x P ) =
para Y: P (Y = y
j
) = P(y
j
( )

=
r
1 i
j i
y , x P ) =

a.3) Distribuies condicionais

Seja x
i
um valor de X, tal que P(X = x
i
) = P(x
i
A probabilidade
) > 0

( )
( )
( )
i
j i
i j
x X P
y Y , x X P
x /X y Y P
=
= =
= = =

denominada probabilidade condicional de Y = y
j
, dado que X = x
i

.
Assim, para x
i
fixado, os pares [ y
j
, P(Y = y
j
/X = x
i
)] definem a distribuio
condicional de Y, dado que X = x
i

.
Analogamente para o X:

( )
( )
( )
j
j i
j i
y Y P
y Y , x X P
y /Y x X P
=
= =
= = =



Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


70
b) (X, Y) v.a.c. bidimensional

A varivel (X, Y) ser uma v.a.c. bidimensional se (X, Y) puder assumir todos os
valores em algum conjunto no enumervel.

b.1) Funo densidade de probabilidade conjunta

Seja (X, Y) uma v.a.c. bidimensional. Dizemos que f(x, y) uma funo
densidade de probabilidade conjunta de X e Y, se satisfizer s seguintes condies:

a) ( ) ( ) y x, todo para 0, y x, f
b) ( )


=1 dy dx y x, f
f(x, y) = 0 para (x, y) aos intervalos de x e y.

Temos ainda que:

P(a X b, c Y d) = ( )


dy dx y x, f

b.2) distribuies marginais

As f.d.p. marginais de X e Y so dadas por:

( ) ( )


= dy y x, f x g e ( ) ( )


= dx y x, f y h respectivamente.
Temos ainda que:

( ) ( ) ( ) ( )

= =
d
c
b
a
dy y h d X c P e dx x g b X a P

b.3) Distribuies condicionais

Sejam X e Y v.a.c. com f.d.p. conjunta f(x, y) e f.d.p. marginais dadas por g(x) e
h(y).
A f.d.p. condicional de X, dado que Y = y definida por:

( )
( )
( ) 0 y h ,
h(y)
y x, f
x/y f > =

Analogamente, a f.d.p. condicional de Y, dado que X = x definida por:

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
71
( )
( )
( ) 0 x g ,
g(x)
y x, f
y/x f > =

As f.d.p. condicionais acima, satisfazem a todas as condies impostas para uma
f.d.p. unidimensional.
Deste modo para y fixado, teremos:
a) f(x/y) 0
b) ( )
( )
( ) ( )
( )
( )
( )



= = = = 1
y h
y h
dx x/y f
y h
1
dx
y h
y x, f
dx x/y f

5.7 - Variveis aleatrias independentes

a) (X, Y) uma v.a.d. bidimensional.

Definio 1 - Seja (X, Y) v.a.d. bidimensional. Dizemos que X e Y so
independentes se, e somente se, para todo par de valores (x
i
, y
j

) de X e Y, tem-se:
P(X = x
i
, Y = y
j
) = P(X = x
i
)
.
P(Y = y
j

)
Basta que esta condio no se verifique para um par (x
i
, y
j
sejam independentes. Neste caso diremos que X e Y so dependentes.
) para que X e Y no

Definio 2 - Seja (X, Y) uma v.a.d. bidimensional. Neste caso X e Y sero
independentes se, e somente se,
P(X = x
i
/Y = y
j
) = P(X = x
i

), para todo i e j.
ou equivalente se e somente se
P(Y = y
j
/X = x
i
) = P(Y = y
j

), para todo i e j.
b) (X, Y) uma v.a.c. bidimensional.

Definio 1 - Seja (X, Y) v.a.c. bidimensional. Diremos que X e Y so
independentes se, e somente se:
f(x, y) = g(x)
.

h(y), para todo x e todo y
Definio 2 - Seja (X, Y) uma v.a.c. bidimensional. Neste caso X e Y sero
independentes se, e somente se:
f(x/y) = g(x). Nesse caso, evidente que f(y/x) = h(y).

OBS.: Todas as definies concernentes a duas v.a. podem ser generalizadas para o
caso de n v.a.

Exemplos:
1. Dada a distribuio de probabilidade conjunta de (X, Y) na Tabela abaixo:
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


72
X Y 0 1 2
0 0,10 0,20 0,20
1 0,04 0,08 0,08
2 0,06 0,12 0,12

Pede-se:
a) Distribuio marginal de X e Y, distribuio de (X + Y) e de XY?
b) X e Y so independentes?
c) As distribuies condicionais de X dado que Y = 0 e Y dado que X = 1?
d) P(X 1,Y 1)?
e) P(X 1/Y = 0)?
f) Construir a distribuio conjunta a partir das distribuies marginais de X e de Y?

Resposta: d) 0,30; e) 0,70

2. Sejam X e Y v.a.c. com f.d.p. conjunta dada por:
( )
( )

+
=
y e x de valores outros para 0,
5 y 0 6, x 2 , y 2x k
y x, f
Pede-se:
a) O valor de k?
b) P(X 3, 2 Y 4)?
c) P(Y < 2)?
d) P(X > 4)?
e) X e Y so v.a. independentes? Justifique?
f) f(x/y)?
g) f(x/Y = 1)?

Resposta: a) 1/210; b) 16/210; c) 72/210; d) 125/210; e) No

Problemas propostos:
1) A funo de probabilidade conjunta da v.a. X e Y dada por:
( )
( )
y x 10 y x
36
10
36
25
36
1
y x 10 y! x!
10!
y x, p

|
.
|

\
|
|
.
|

\
|
|
.
|

\
|

=
para x = 0,1,2, , 10 e y = 0,1,2, , 10
0 x + y 10

Calcule:
a) P(X 2, Y 2)?
b) P(X + Y = 4)?

Resposta: a) 0,00157; b) 0,0262



CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
73
5.8 - Conceitos e Propriedades de esperana matemtica e varincia de variveis
aleatrias

a) Esperana matemtica (mdia ou valor esperado de uma v. a.)

Neste item vamos aprender a quantificar o parmetro mdia de uma populao.
A esperana matemtica de uma populao tambm denominada uma medida da
tendncia central.
Parmetro uma medida utilizada para descrever uma caracterstica de uma
populao e caracteriza a distribuio de probabilidade de uma varivel aleatria.
Sob o ponto de vista cientfico, a esperana matemtica corresponde ao que se
espera que acontea em mdia.

a.1) Caso em que X uma v.a.d.

Seja X uma v.a.d. com a seguinte distribuio de probabilidade:
x x
i
x
1

2
x Total
n

P(x
i
P(x )
1
P(x )
2
) P(x
n
1 )

Define-se a esperana matemtica de X por:
( ) ( ) ( ) ( )
n n 2 2 1 1 x
x P x x P x x P x X E + + + = = =

( ) ( )

=
=
n
1 i
i i
x P x X E

Exemplo: Um fabricante produz peas tais que 10% delas so defeituosas e 90% no
so defeituosas. Se uma pea defeituosa for produzida, o fabricante perde R$ 1,00;
enquanto uma pea no defeituosa lhe d um lucro de R$ 5,00. Seja a varivel aleatria
X = {lucro lquido por pea}. Calcular a mdia do lucro lquido por pea.

Resposta: () = 4,40

a.2) Caso em que X uma v.a.c.

A esperana matemtica de uma v.a.c. X definida por:
( ) ( )


= dx x f x X E

Exemplo: Uma v.a.c. X apresenta a seguinte f.d.p.:
( )

>

<
=
0 x para 0,
2 x 0 para ,
2
x
0 x para 0,
x f
Calcular E(X)? (R: 4/3)
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


74

a.3) Propriedades da esperana matemtica

As propriedades a seguir apesar de estarem apenas demonstradas para quando
X uma v.a.c., valem tambm para quando X uma v.a.d..
P
1
linguagem mais simples mas menos rigorosa, pode-se dizer que a mdia de uma
constante a prpria constante).
) Se X uma v.a. com P(X = k) = 1, ento E(X) = k, sendo k uma constante (ou numa
Prova: ( ) ( ) ( ) ( ) k X E k dx x f k dx x f k X E = = = =





P
2

) A esperana matemtica do produto de uma constante por uma varivel igual ao
produto da constante pela esperana matemtica da varivel, ou seja, multiplicando se
uma varivel aleatria por uma constante, sua mdia fica multiplicada por essa
constante.
Prova: ( ) ( ) ( ) ( ) X E k dx x f x k dx x f x k X E = = =





P
3

) A esperana matemtica do produto de duas variveis aleatrias independentes
igual ao produto das esperanas matemticas das variveis, ou seja, a mdia do
produto de duas variveis aleatrias independentes o produto das mdias.
Prova: ( ) ( )


= dy dx y x, f y x XY E
Se X e Y so v.a. independentes, a f.d.p. conjunta pode ser fatorada no produto
das f.d.p. marginais de X e Y. Assim:

( ) ( ) ( ) ( ) ( ) dy y h y dx x g x dy dx y h x g y x XY E



= =

E(XY) = E(X)
.

E(Y)
obs: E(XY) = E(X)
.

E(Y) no implica que X e Y sejam variveis aleatrias independentes.
P
4

) A esperana matemtica da soma ou da subtrao de duas v.a. quaisquer igual a
soma ou a subtrao das esperanas matemticas das duas v.a., ou seja, a mdia da
soma ou da subtrao de duas v.a. igual a soma ou subtrao das mdias.
Prova:
( ) ( ) ( ) ( ) ( ) dy dx y x, f y dy dx y x, f x dy dx y x, f y x Y X E



= =
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
75

( ) ( ) ( ) ( ) ( )


= = Y E X E dy y h y dx x g x Y X E

P
5
Prova:
) A esperana matemtica da soma ou subtrao de uma v.a. com uma constante
igual a soma ou subtrao da esperana matemtica com a constante, ou seja,
somando-se ou subtraindo-se uma constante a uma v.a., a sua mdia fica somada ou
subtrada da mesma constante.
( ) ( ) ( ) ( ) ( ) ( )



= + = = k X E dx x f k dx x f x dx x f k x k X E

P
6

) A mdia de uma v.a. centrada zero, ou seja, a mdia dos desvios dos valores da
v.a. em relao a sua mdia zero.
Obs: Dizemos que a v.a. est centrada quando todos os valores so expressos como
desvios em relao respectiva mdia, (X
x

).
Assim: | | ( ) | | 0 E X E X E
x x x x
= = =

b) Varincia

a medida que quantifica a disperso dos valores em torno da mdia. A
varincia de uma v.a. X definida por:
( ) ( ) | | | |
2
x
2 2
x
X E X E X E X V = = =

b.1.) Para X v.a.d.: ( ) ( ) ( )

=
i
i
2
x i
x P x X V

b.2.) Para X v.a.c.: ( ) ( ) ( )


=
i
2
x
x P x X V

Uma frmula mais prtica para calcular a varincia :

V(X) = E(X
2
) [E(X)]
2
pois,
,
( ) ( ) | |
( ) ( ) | | { }
( ) ( ) ( ) ( ) | |
( ) ( ) | |
2 2
2 2
2 2
2
X E X E
X E X E X 2E X E
X E X 2XE X
X E X E X V
=
+ =
+ =
=

em que:

Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


76
- para X v.a.d.: ( ) ( )

=
i
i
2
i
2
x P x X E

- para X v.a.c.: ( ) ( ) dx x f x X E
-
2 2

=

b.3.) Propriedades da varincia:

Valem tanto para X v.a.d. quanto para X v.a.c.

P
1

) A varincia de uma constante igual a zero.
Prova: V(k) = E[K E(K)]
2
= E(k k)
2

= 0
P
2

) Somando-se ou subtraindo-se uma constante uma v.a., sua varincia no se
altera.
Prova:

( ) ( ) ( ) | |
( ) ( ) ( ) | |
( ) | | ( )
( ) ( ) X V k X V
X V X E X E
k k X E X E
k X E k X E k X V
2
2
2
=
= =
=
=


P
3

) Multiplicando-se uma v.a. por uma constante, sua varincia fica multiplicada pelo
quadrado da constante.
Prova:
( ) ( ) | |
( ) | |
( ) | |
( ) ( ) X V k kX V
X E X E k
X kE kX E
kX E kX E kX V
2
2 2
2
2
=
=
=
=


P
4

) A varincia da soma de duas v.a. independentes igual a soma das varincias das
duas variveis.
Prova:
( ) | | ( ) | |
( ) ( ) ( ) | |
( ) ( ) ( ) ( ) | | ( ) ( ) ( ) | | { }
( ) ( ) ( ) ( ) | | ( ) ( ) ( ) | |
2 2 2 2
2 2 2 2
2 2 2
2 2
Y E Y E X 2E X E Y E XY 2E X E
Y E Y E X 2E X E Y E XY 2E X E
Y E X E Y 2XY X E
Y X E Y X E Y X V
+ + =
+ + + + =
+ + + =
+ + = +


CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
77
Se X e Y so independentes; E(XY) = E(X)
.
( ) ( ) ( ) | | { } ( ) ( ) | | { }
V(Y) V(X) Y) V(X
Y E Y E X E X E Y X V
2 2 2 2
+ = +
+ = +
E(Y), assim


Do mesmo modo:
V(X - Y) = V(X) + V(Y)

OBS.1: Desvio padro da varivel X a raiz quadrada positiva da varincia de X.
( ) X V
x
=

OBS.2: Sejam X e Y duas v.a.. A covarincia entre X e Y, denotada por Cov(X,Y)
definida por:

Cov(X,Y) = E{[X E(X)][Y E(Y)]}, ou, de forma alternativa,
Cov(X,Y) = E(X,Y) E(X)E(Y)
( ) ( )

=
i
i i i i
y , x P y x Y X, E

A covarincia nos d uma idia da relao de dependncia entre duas ou mais
v.a.
Proposies teis:
a) Cov(X,Y) = Cov(Y,X)
b) Se V(X) = 0 ou V(Y) = 0 ento a Cov(X,Y) = 0
c) Cov(X,k) = Cov(k,Y) = 0
d) Cov(aX,bY) = abCov(X,Y), sendo a e b constantes
e) Cov(X + Z,Y) = Cov(X,Y) + Cov(Z,Y)

Resultado til: Se X e Y so duas variveis quaisquer
V(aX bY) = a
2
V(X) + b
2

V(Y) 2abCov(X,Y)
Exerccios propostos:

1. Sabendo-se que Y = 3X-5 e que E(X) = 2 e V(X) = 1, calcule:

a)E(Y); b)V(Y); c)E(X+3Y); d)E(X2 + Y2 ); e)V(3X+2Y);

Resp.: 1; 9; 5; 15; 81

2. Uma urna contm 5 bolas brancas e 7 bolas pretas. Trs bolas so retiradas
simultaneamente dessa urna. Se ganharmos R$ 200,00 por bola branca retirada e
perdermos R$ 100,00 por bola preta retirada, qual seria o nosso lucro esperado? Resp.:
75

3. Uma moeda honesta lanada sucessivamente at sair cara ou at serem feitos 3
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


78
lanamentos. Obtenha a distribuio de X = nmero de lanamentos, e calcule sua
mdia e varincia. Resp.: E(X)=1,75; Moda=1; V(X)=11/16

4. Uma mquina de apostar tem 2 discos independentes. Cada disco tem 10 figuras: 4
mas, 3 bananas, 2 pras e 1 laranja. Paga-se 80 para acionar a mquina. Se
aparecerem 2 mas ganha-se 40; 2 bananas 80; 2 pras 140 e 2 laranjas 180. Qual
o resultado esperado aps inmeras jogadas? Resp.: E(X) = 59

5. Um determinado artigo vendido em caixas a preo de 8 U.M. por caixa. Sabe-se
que 20% dos artigos vendidos apresentam algum defeito de fabricao. Um comprador
faz a seguinte proposta: Pede para poder amostrar, ao acaso, 10 artigos por caixa e
pagar por caixa 10 U.M. se nenhum dos artigos amostrados for defeituoso; 5 U.M. se
um ou dois artigos forem defeituosos e 4 U.M. se trs ou mais forem defeituosos. O que
melhor para o vendedor; manter o seu preo de 8 U.M. por caixa ou aceitar a proposta
do comprador? Mostre por qu.
Considere X = nmero de artigos defeituosos, com a seguinte distribuio de
probabilidade: (sugesto: utilize a varivel Y = valor pago por caixa)
x 0
i
1 2 3 Total
P(x
i
0,1074 ) 0,2684 0,3019 0,3223 1,00

Resp.: O vendedor deve manter o seu preo [E(Y) 5,21]

6. (X, Y) uma varivel aleatria bidimensional discreta com a seguinte distribuio
conjunta:
X Y -3 2 4 P(x
i
)
1 0,10 0,20 0,20 0,5
3 0,30 0,10 0,10 0,5
P(y
j
0,4 ) 0,3 0,3 1

Pede-se calcular:
a) E(X), V(X) e
b) E(Y), V(Y) e
x

c) E(X + Y)
y

d) X e Y so independentes?

Resp.: a) 2; 1 e 1 b) 0,6; 9,24 e 3,04 c) 2,6 d) no so

7. Seja X uma v.a.c. com a seguinte f.d.p.:
( )
| |
( ) | |

=
contrrio caso 0,
1,2 x , x 2
3
2
0,1 x ,
3
2
x f
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
79
Calcule:
a) A esperana matemtica de (X-1)
b) O desvio padro de X
2


Resp.: a) 0,278 b) 0,478

8. Mostre que E{[X E(X)][Y E(Y)]}= E(X,Y) E(X)E(Y)


Lista de Exerccios
1. Uma v.a.c. X possui f.d.p. dada por:
( )
( )


=
x de valores outros para 0,
1 x 0 , x x 6
x f
2


Calcular :
a) P[E(X) 2 X E(X) + 2], dado E(X
2
) = 3/10? (R: 0,9855)
b) F(x), a Funo de distribuio acumulada? (R: 0 se x < 0; x
2

(3 -2x) se 0 x 1; 1 se
x 1)
2. Suponha que X e Y tenham a seguinte distribuio conjunta:
Y X -1 1 2
-2 0,10 0,10 0
0 0,10 0,20 0,30
3 0,10 0,10 0


Sabendo-se que V(X) = 1,41 e E(Y) = 0,2 ; pede-se:
a) X e Y so v. a. independentes? Mostre. (R: No)
b)
|
.
|

\
|
+ 8 3Y X
2
1
E
2
(R: 0,55)
c)
|
.
|

\
|
+ 8 3Y X
2
1
V
2
(R: 119,57)

3. Dada a funo densidade de probabilidade abaixo:
( ) ( )



=
x de valores outros para 0,
3 x 1 se , 3 x
4
1
1 x 0 se ,
2
1
x f

Calcule :
a) V(12X - 8), dado E(X
2
) = 127/6 (R: 2879)
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


80
b) A funo de distribuio acumulada (R: 0 se x < 0; x/2 se 0 x < 1; 1/8 (x
2
c) P(-0,5 < X < 1,5) (R:15/32)
6x +
1) se 1 x < 3; 1 se x 3)

4. Uma v. a. c. X possui a seguinte f. d. p.:
( ) ( )

<
<
<
=
3
4
x 0 se ,
2
1
0 x 1 se , x 1
2
1
3
4
x ou 1 x se 0,
x f
2


Determinar:
a) F(x), a funo de distribuio acumulada? (R: 0 se x < 1; 1/6(x
3
b) P(0,5 x 0,5) (R: 23/48)
+ 3x + 2) se 1
x < 0; 1/6(2 + 3x) se 0 x < 4/3; 1 se x 4/3)

5. Dada a distribuio conjunta abaixo, parcialmente indicada:
Y X -3 -2 -1
-2 1/15 1/15 ? 7/30
0 8/30 ? 2/15 ?
1 ? 1/30 ? 7/30
P(X) 6/15 7/30 ?


Pede-se:
a) Verifique se X e Y so v. a. independentes? (R: no)
b)
|
|
.
|

\
|
10
5
2Y
2
X
E
3
(R: -3723/450)
c)V(8 15X) (R: 689/4)

6.Cite as propriedades de:
a) Esperana Matemtica.
b) Varincia.

7. Conceitue:
a) Varivel aleatria discreta
b) Varivel aleatria contnua

8.Uma v. a. c. dada por:
( ) ( )

<
<
=
x de valores outros para 0,
8 x 5 se , x 8 k
5 x 2 se , kx
x f
2

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________
81

Determinar:
a) O valor da constante k para que f(x) seja uma f. d. p.? (R: 2/87)
b)
|
.
|

\
|

2
27
X
2
8
P (R: 149/261)

9. Suponha que X e Y tenham a seguinte distribuio conjunta:
Y X 1 2 4 5 P(Y)
2 0,2 0,1 0,1 0,2
3 0,1 0,1 0,1 0,1
P(X)

Pede-se:
a)
|
.
|

\
|
X
3
1
E ? (R: -1)
b)V(5X 3Y)? (R: 72,16)
c) X e Y so v. a. independentes? Mostre por que? (R: no)

10. Sabendo-se que X e Y so variveis aleatrias independentes e que E(X) = 5, V(X)
= 2, E(Y) = 8 e V(Y) = 3, calcule:

a) E(X - Y + 3)? (R: 0)
b) E[(X - Y)
2
c)
]? (R: 14)
|
.
|

\
|
Y
3
1
X V ? (R: 7/3)
d)V(3Y + 2)? (R: 27)

11. Seja (X, Y) uma varivel aleatria bidimensional discreta, com a seguinte funo
de probabilidade:
( )

= =
+
=
contrrio caso 0,
3 2, 1, 0, y e 2 1, 0, x para ,
42
y 2x
y , x P
j i
j i
j i


Pede-se:
a) Dar a tabela da distribuio de probabilidade conjunta?
b) Dar a tabela da distribuio marginal de X e tambm a de Y?
c) E(X 2Y + 4)? (R: 70/42)

12. Dada a seguinte funo:
( )
( )


<
=
x de valores outros para 0,
2 x 1 se k,
1 x 0 se , x - 2 k
x f
Determinar:
Captulo 5 Variveis Aleatrias e Distribuies de Probabilidade
_____________________________________________________________________
___________________________________________________________________________________


82
a) O valor de K para que f(x) seja uma f.d.p.? (R: 2/5)
b) E(X
3
c)
)? (R: 81/50)
|
.
|

\
|

2
3
X P ? (R: 0,2)
d) P(X = 1)? (R: 0)

13. Sejam X e Y v. a. c. com funo densidade de probabilidade conjunta dada por:
( )
( )

+
=
contrrio caso 0,
5 y 0 e 6 x 2 se , y 2x k
y x, f

Pede-se:
a) O valor de K para que f (x, y) seja uma f. d. p.? (R: 1/210)
b) P(Y 2)? (R: 72/210)
c) P(X > 3 / 0 Y 2)? (R: 60/72)
d) X e Y so v. a. independentes? Mostre? (R: no)
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


83

6.0 DISTRIBUIES DE VARIVEIS ALEATRIAS DISCRETAS E CONTNUAS

6.1 Introduo

Algumas variveis aleatrias adaptam-se muito bem a uma sria de problemas
prticos e aparecem com bastante freqncia. Assim, um estudo pormenorizado das
mesmas facilita a construo dos correspondentes modelos de probabilidades, bem
como a determinao dos seus principais parmetros. Desta forma, para um dado
problema, tentamos verificar se ele satisfaz as condies de algum modelo conhecido,
facilitando a determinao dos parmetros.

6.2 Distribuies de variveis aleatrias discretas

Ser feita uma discusso sobre algumas distribuies de probabilidades
discretas. Tais distribuies partem da pressuposio de certas hipteses bem
definidas. Como diversas situaes reais muitas vezes se aproximam dessas hipteses,
esses modelos so teis no estudo de tais situaes, da a sua importncia. Um cuidado
muito grande deve ser tomado ao se escolher uma distribuio de probabilidade que
descreve corretamente as observaes geradas por um experimento.

6.2.1 Uniforme

a mais simples de todas as distribuies discretas de probabilidade. aquela
na qual a v.a. assume todos os seus valores com a mesma probabilidade. Uma tal
distribuio chamada distribuio uniforme.
A distribuio discreta uniforme dada por:
P(x,k) = 1/k = P(X = x)
onde x um dos possveis valores da v.a. X.
Utilizamos aqui P(x,k) ao invs de p(x) para indicar que a distribuio uniforme
depende do parmetro k.
Este o caso mais simples de v.a. discreta, onde cada possvel valor ocorre com
a mesma probabilidade.
Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


84

Definio: A varivel aleatria discreta X, assumindo os valores x
1
, x
2
, , x
n
( ) ( )
n
1
p x P x X P
i i
= = = =
, tem
distribuio uniforme, se e s se,
n, para todo i = 1, 2, ..., n.

i) Grfico


ii) Tabela
x x
i
x
1
x
2
x
3
...
4
x
n

P(x
i
1/n ) 1/n 1/n 1/n ... 1/n

Exemplos:
1) Seja E: lanamento de um dado no-viciado.
O espao amostral : S = {1, 2, 3, 4, 5, 6)
Cada ponto de S tem probabilidade do ocorrer igual a 1/6.

Tabela:
x 1
i
2 3 4 5 6
P(x
i
1/6 ) 1/6 1/6 1/6 1/6 1/6

6.2.2 Bernoulli

Seja um experimento no qual s pode ocorrer sucesso ou fracasso.
Associaremos uma v.a. X aos possveis resultados, da seguinte forma:

=
=
=
fracasso um ocorrer se 0, x
sucesso um ocorrer se 1, x
X
2
1

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


85
Diremos que a varivel aleatria assim definida tem distribuio de Bernoulli. Se p
a probabilidade de ocorrer sucesso, logicamente a probabilidade de ocorrer um
fracasso 1 p = q. Logo, a funo de probabilidade de X com distribuio de Bernoulli
dado por:
x 1 x
q p x) P(X

= = , se x = 0 ou 1, caso contrrio = 0
A mdia da v.a.d. X : ( ) p x =
A varincia da v.a.d. X : ( ) q p x V =

Aplicao Em ensaios em que os resultados podem ser classificados como sucesso
ou fracasso, ou seja, respostas do tipo sim ou no, tpico de ensaios biolgicos. Ex:
Resistncia de plantas a doenas se for resistente o resultado sim, se no for ser
no.

6.2.3 - Binomial (uma extenso da distribuio de Bernoulli)

Suponha um experimento cujos resultados podem ser classificados em
sucessos e fracassos. Se fizermos X = 1 quando obtivermos um sucesso e X = 0
quando um fracasso, ento a funo de probabilidade de X ser dada por: P(X = 1) = p
e P(X = 0) = 1-p (sendo p a probabilidade de sucesso). Nesse caso, dizemos que a
v.a. X tem distribuio de Bernoulli.
A distribuio Binomial advm da distribuio de Bernoulli quando repetimos um
ensaio (algumas vezes referido como provas) de Bernoulli n vezes.
Em resumo, teramos o seguinte:
a) So realizados n ensaios independentes e do mesmo tipo;
b) Cada ensaio admite dois resultados: sucesso ou fracasso;
c) A probabilidade de sucesso em cada prova p (valor constante) e, por
conseguinte, a probabilidade de fracasso ser q = 1 p, tambm constante.

IMPORTANTE: O modelo binomial exige que as provas sejam independentes e com p
constante.

Ao associarmos uma v.a. X igual ao nmero de sucessos nessas n provas
(ensaios), X poder assumir os valores 0, 1, 2, , n.
Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


86
A distribuio de probabilidades de uma v.a. que tem distribuio binomial dada
por:
( )

= =
=

contrrio caso 0,
1 p 1 q 0 n; , 2, 1, 0, x q p C
p n, x; P
x n x x
n


Se X~B(n; p) ento E(X) = np, e V(X) = npq.

Exemplos:

1. Se 20% dos parafusos produzidos por uma mquina so defeituosos, determinar a
probabilidade de, entre 4 parafusos escolhidos ao acaso, no mximo 2 deles serem
defeituosos. (R: 0,9728)

2. Um fabricante de certas peas de automveis garante que uma caixa de suas peas
conter no mximo 2 itens defeituosos. Se a caixa contm 20 peas e a experincia tem
demonstrado que esse processo de fabricao produz 2 por cento de itens defeituosos,
qual a probabilidade de que uma caixa de suas peas no v satisfazer a garantia? (R:
0,0071)

3. Sabe-se que os discos produzidos por certa companhia sero defeituosos com
probabilidade de 1% independentemente de outros discos. A companhia vende os
discos em pacotes de 10 unidades e oferece uma garantia (de retorno em dinheiro) de
que no mximo 1 de cada 10 discos defeituoso.
a) Qual a proporo de pacotes retornados? R.: 0,5%
b) Se algum compra 3 pacotes, qual a probabilidade de exatamente um deles
ser retornado? R.: 0,015

4. Entre 2.000 famlias com 4 crianas cada uma, quantas se esperaria que tivessem:
a) Pelo menos um menino? (R: 1875)
b) Exatamente dois meninos? (R: 750).




CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


87
obs.:
a) quando o nmero de ensaios n for grande (n 50 e np < 5) pode-se usar a
aproximao pela distribuio de Poisson (a ser apresentada posteriormente) com
mdia = = np;

b) de forma similar podemos usar a aproximao pela distribuio normal (a ser
apresentada posteriormente) com = np e
2
= npq, no caso em que np e nq so
maiores que 5;

c) a distribuio Hypergeomtrica (a ser apresentada posteriormente) se reduz
distribuio Binomial se N, o nmero de elementos na
populao Hipergeomtrica, tende ao infinito ou grande comparado com n, o tamanho
da amostra. Nesse caso, a ocorrncia de reposio ou no torna-se indistinguvel.

6.2.4 - Multinomial

Essa distribuio uma extenso da distribuio Binomial. O experimento
binomial se transforma em um experimento multinomial se em cada tentativa (prova ou
ensaio) tivermos mais de dois possveis resultados de interesse. Como exemplo
considere o caso de termos 3 possveis resultados: classificao de um produto em
defeituoso, aceitvel e recupervel; ou de acidentes de trnsito em leves, graves ou
fatais.
Se numa dada tentativa podem ocorrer k resultados, A
1
, A
2
, , A
k
, com
probabilidades p
1
, p
2
, , p
k
, ento a distribuio de probabilidades das v.a.d. X
1
, X
2
, ,
X
k
nmero de ocorrncias para A
1
, A
2
, , A
k

em n tentativas independentes :
( )
k 2 1
x
k
x
2
x
1
k 2 1
k 2 1 n 2 1
p p p
! x ! x ! x
n!
n ; p , , p , p ; x , , x , x P =


onde

= =
= =
k
1 i
k
1 i
i i
1 p e n x


Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


88
Exemplo: Uma pea considerada boa (tipo 1) se uma de suas dimenses L est
entre l
1
e l
2
; recupervel (tipo 2) se L > l
2
e perdida (tipo 3) se L < l
1

. Numa caixa
temos 5 peas do tipo 1, 4 do tipo 2 e 3 do tipo 3. Retira-se, aleatoriamente, uma pea
dessa caixa e mede-se sua dimenso com o auxlio de um aparelho de preciso, aps o
que devolve-se a pea dentro da caixa. Seis operaes dessa natureza so realizadas.
Qual a probabilidade de entre as seis peas observadas obtermos o seguinte
resultado: 3 peas do tipo 1, 2 do tipo 2, e 1 do tipo 3?
soluo:
p1 = 5/12; p2 = 4/12; p3 = 3/12

( ) 0,1206
5184
625
12
3
12
4
12
5
3!2!1!
6!
x , x , x P
1 2 3
3 2 1
= =
|
.
|

\
|

|
.
|

\
|

|
.
|

\
|
=

obs.:
a) quando k = 2 temos a distribuio binomial
b) E(X
i
) = np
i
; V(X
i
) = np
i
q

i

6.2.5 Poisson (Lei dos fenmenos raros)

Em muitos casos conhecemos o nmero de sucessos, porm o nmero de
fracassos ou o nmero total de provas seria difcil de ser determinado, ou muitas vezes,
no faria nenhum sentido prtico. Por exemplo, o nmero de descargas eltricas num
dia de chuva normal. Podemos, num determinado espao de tempo determinar o
nmero de descargas eltricas ocorridas, porm, o nmero de descargas eltricas que
deixaram de ocorrer no poder ser determinado. Da mesma forma, o nmero de trincas
por unidade de rea numa pea de concreto. Podemos determinar quantas trincas
ocorreram, porm no saberemos contar quantas trincas no ocorreram.
Este tipo de distribuio til para descrever as probabilidades do n de
ocorrncias num campo ou intervalo contnuo (em geral tempo ou espao). Eis alguns
exemplos de variveis que podem ter como modelo a distribuio de Poisson:


CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


89
- n de defeitos por cm
- n de acidentes por dia
2

- n anual de suicdios
- n de chamadas erradas por hora, num circuito telefnico, etc.
Note-se que a unidade de medida (tempo, rea, etc) contnua mas a varivel
aleatria (n de ocorrncias) discreta.
A distribuio de Poisson utilizada quando o n de observaes de um
experimento aleatrio muito grande (ex: N 50) e a probabilidade de sucesso muito
pequena (ex: p 0,1) e o termo Np permanece constante. Da ser conhecida,
classicamente, como a lei dos fenmenos raros.
A distribuio de Poisson fica completamente caracterizada por um nico
parmetro, a mdia do processo, pois na distribuio de Poisson a mdia igual a
varincia, ou seja, E(X) = V(X) = (ou algumas vezes representado por , ou m).
Sabendo-se que uma v.a. tem resultados distribudos segundo Poisson e
conhecendo o n mdio de ocorrncias por unidade de medida, podemos determinar a
probabilidade de qualquer dos resultados possveis nos intervalos para os quais
desejamos.
A distribuio de Poisson uma forma limite da distribuio binomial, quando N
tende a infinito e p tende a zero.

i) Funo de probabilidade:

( )
! x
e
x


= = x X P , em que:
X = v.a.d. representando o nmero de sucessos;
x = um particular valor de X;
e = base do logartmo neperiano (e 2,718)
= mdia da distribuio no intervalo de tempo ou medida considerado. Mdia esta
sempre positiva.

E(X) = V(X) = = Np


Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


90
Exemplos:
1. Num livro de 800 pginas h 800 erros de impresso.
a) Qual a probabilidade de que uma pgina contenha pelo menos 3 erros de impresso?
(R: 0,0803).

b) Estime o nmero provvel de pginas por livro que no contm erros de impresso.
(R: 294)

2. Numa indstria, h uma mdia de 3 acidentes por ms.
a) Qual a probabilidade de ocorrerem 2 acidentes no prximo ms? (R: 22,4%).
b) Qual a probabilidade de ocorrerem 10 acidentes nos prximos 6 meses? (R: 0,015)

6.2.6 - Geomtrica

O nome distribuio geomtrica ocorre porque os termos de sua funo de
probabilidade, para cada valor da varivel aleatria, seguem um srie geomtrica. Numa
sequncia de provas de Bernoulli independentes, o nmero de falhas antes do
acontecimento do primeiro sucesso tem um distribuio Geomtrica com parmetro p.
Ao invs de ser formulada como P(x; p) = pq
x
, x = 0, 1, 2, , onde X o nmero
de falhas antes de um sucesso , a distribuio Geomtrica pode ser expressa
como P(x; p) = pq
x-1

, x = 1, 2, , quando, nesse caso, X ser o nmero de realizaes
at o primeiro sucesso (inclusive).
( )
2
2
p
q
e
p
1
X E = =

Exemplos:
1) Suponha-se que o custo de realizao de um experimento seja R$ 1000. Se o
experimento falhar, ocorrer um custo adicional de R$ 300 em virtude de serem
necessrias algumas alteraes antes que a prxima tentativa seja executada. Se a
probabilidade de sucesso em uma tentativa qualquer for 0,2 (se as provas forem
independentes), e se os experimentos continuarem at que o primeiro resultado frutuoso
seja alcanado, qual ser o custo esperado do procedimento completo? R.: R$ 6200.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


91

2) Em determinada localidade, a probabilidade da ocorrncia de uma tormenta em
algum dia durante o vero (nos meses de dezembro a janeiro) igual a 0,1. Admitindo
independncia de um dia para outro, qual a probabilidade da ocorrncia da primeira
tormenta da estao de vero no dia 3 de janeiro? R.:0,003.

3) Se a probabilidade de que um certo ensaio de reao positiva for igual a 0,4, qual
ser a probabilidade de que menos de 5 reaes negativas ocorram antes da primeira
positiva? R.: 0,92

obs.:
a) Suponha que exista uma longa sequncia de falhas numa srie de provas de
Bernoulli independentes com p=0,5. Contrrio ao pensamento intuitivo de alguns
jogadores, isto no tem efeito algum nos resultados futuros. Essa propriedade
chamada de falta de memria da distribuio.
b) As frequncias dessa distribuio sempre diminuem numa progresso geomtrica
medida que o valor de X aumenta.

c) Essa distribuio frequentemente usada em modelos meteorolgicos de ciclos do
tempo.

6.2.7 - Binomial negativa

Essa distribuio de probabilidade uma generalizao da geomtrica, ou seja, a
geomtrica um caso particular da binomial negativa. tambm conhecida como
distribuio de Pascal. Se ensaios de Bernoulli independentes (p constante) so
repetidos X vezes at um nmero fixo de sucessos (digamos r) tenha ocorrido, X ter
distribuio Binomial Negativa. Essa distribuio pode ser considerada como a soma de
v.a. X
1
+ X
2
+ + X
r
Consideremos um experimento no qual as propriedades so as mesmas que
aquelas enumeradas para o experimento binomial, com exceo de que as tentativas
sero repetidas at que um nmero fixo de sucessos venha a ocorrer. Portanto em vez
de achar a probabilidade de x sucessos em n tentativas, onde n fixo, estamos
cada uma com a mesma distribuio Geomtrica.
Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


92
interessados na probabilidade de que o k-simo sucesso ocorra na x-sima tentativa.
Esse tipo de experimento chamado experimento binomial negativo. O nmero de
tentativas X para produzir k sucessos em um experimento binomial negativo chamado
uma v.a.d. binomial negativa.
Sua funo de probabilidade :

( )

= + + =
=

contrrio caso 0,
1 p 1 q 0 ; 2, k 1, k k, x q p C
p k, x; P
k x k 1 - k
1 - x



( )
( ) ( )
2
2
p
p 1 k
e
p
p 1 k
X E

=

=

Exemplos:
1) No arremesso de uma moeda honesta, qual seria a probabilidade de ocorrer a
segunda cara no quarto arremesso? R.: 0,1875

2) A probabilidade de que um experimento seja bem sucedido 0,8. Se o experimento
for repetido at que quatro resultados bem sucedidos tenham ocorrido, qual ser o
nmero esperado de repeties necessrias? R.: 5.

obs.:
a) Essa distribuio encontra aplicao em estudos de acidentes, como uma substituta
para a distribuio de Poisson quando requerimentos de independncia no so
satisfeitos.

b) Tambm usada para descrever gastos e demanda de consumidores por produtos
adquiridos com certa frequncia.

c) Comparando as distribuies Binomial e Binomial Negativa temos: em ambos os
casos estamos tratando com provas repetidas de Bernoulli. A distribuio Binomial
surge quando lidamos com nmeros fixados (digamos n) dessas provas e estaremos
interessados no nmero de sucessos que venha a ocorrer. A distribuio Binomial
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


93
Negativa encontrada quando ns pr-fixamos o nmero de sucessos a ser obtido e
ento registramos o nmero de provas de Bernoulli necessrias.

6.2.8 - Hipergeomtrica

Em geral podemos estar interessados na probabilidade de selecionar x sucessos
de k elementos rotulados como sucessos e n-x falhas de N-k elementos rotulados como
falhas ou defeitos quando uma amostra aleatria de tamanho n retirada de uma
populao de N elementos. Esse chamado um experimento hipergeomtrico.
Propriedades:
a) uma amostra aleatria de tamanho n tirada de uma populao de tamanho N sem
reposio;

b) k dos N elementos podem ser classificados como sucessos e N-k so classificados
como fracasso (ou falhas).

O nmero x de sucessos em um experimento hipergeomtrico chamada v.a.
hipergeomtrica.
A distribuio de probabilidade de uma v.a. hipergeomtrica X, nmero de
sucessos em uma v.a. de tamanho n selecionada de N elementos sem reposio entre
os quais k so rotulados sucessos e N-k rotulados como fracasso, :
( ) ( )
( )( )
( )
N
n
k N
x n
k
x
k n, N, x; h x X P

= = = , onde x = 0, 1, 2, ..., n
( )
N
k
p que em
1 N
n N
npq e np X E
2
=
|
.
|

\
|

= =
Exemplos:
1) Uma firma comprou vrias caixas contendo cada caixa 15 lmpadas. A mesma
decidiu fazer uma inspeo por amostragem sem reposio analisando 5 lmpadas de
cada caixa e aceitando a caixa caso se encontre duas ou menos defeituosas. Calcule a
probabilidade de se aceitar uma caixa sabendo que a qualidade do produto definida
por 20% de defeituosos. R.: 0,978.

Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


94
2) Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que uma
remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se
nenhum dos motores inspecionados for defeituoso, o lote aprovado. Se um ou mais
forem verificados defeituosos, todos os motores da remessa so inspecionados.
Suponha que existam, de fato, trs motores defeituosos no lote. Qual a probabilidade
de que a inspeo de todos os motores desse lote seja necessria? R.: 0,28.

obs.:
a) uma extenso da distribuio hipergeomtrica: se N elementos podem ser repartidos
em k grupos A
1
, A
2
, , A
k
com a
1
, a
2
, , ak elementos respectivamente, ento a
distribuio de probabilidade das v.a.d. X
1
, X
2
, , X
k
representando o nmero de
elementos selecionados de A
1
, A
2
, , A
k

em uma amostra aleatria de tamanho n
(retirada sem reposio de elementos) :
( )
( )( ) ( )
( )
N
n
a
x
a
x
a
x
k 2 1 k 2 1
k
k
2
2
1
1
n N, , a , , a , a ; x , , x , x p

=

com

= =
= =
k
1 i
i
k
1 i
i
N a e n x

b) uma caracterstica importante dessa distribuio que ela se refere a amostragem de
uma populao sem reposio do elemento selecionado;

c) essa distribuio pode ser aproximada pela Binomial com parmetros n e p, onde p
calculado por k/N, se k/N 0,1;

d) j que a distribuio binomial pode ser aproximada pelas distribuies de Poisson e
Normal, tambm existe a correspondente aproximao pela Poisson e Normal para a
distribuio Hipergeomtrica, quando n grande, 50, e k/N pequeno, < 0,1, no caso
da Poisson; e quando n grande e k/N no pequeno, 0,5, no caso da Normal.

e) Admita-se que X tenha distribuio Hipergeomtrica. Se fizermos p = k/N, q = 1- p.
Assim, E(X) = np; V(X) = npq[(N-n)/N-1)].
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


95

f) Aplicaes em controle de qualidade industrial

g) Aplicaes na estimao do tamanho de populaes de animais a partir de dados de
captura-recaptura.

6.3 - Distribuies de variveis aleatrias contnuas

6.3.1 - Uniforme

Tambm conhecida como distribuio Retangular. Uma v.a. X dita
uniformemente distribuida no intervalo [a, b] se sua fdp for dada por
f(x) = 1/(b-a) se x [a, b], e f(x) = 0 se x [a, b].

Exemplos:
1) Trens urbanos chegam a uma estao em intervalos de 15 minutos comeando s 7
da manh. Se o horrio de chegada de um passageiro nessa estao est
uniformemente distribuda entre 7 e 7:30, encontre a probabilidade que ele espere:
a) menos que 5 minutos por um trem? R.: 1/3
b) pelo menos 12 minutos por um trem? R.: 1/5

2) Prove que, se X uniformemente distribuda em [a, b], ento E(X)=(a+b)/2 e
V(X)=[(b-a)2]/12.

3) Uma mquina de encher copos de de refrigerante sempre despeja nos copos uma
quantidade de bebida entre 270 e 300 ml. Assumindo que X = volume de refrigerante
seja uma v.a. uniformemente distribuida, determinar:
a) A probabilidade de que em um copo sejam despejados mais de 290 ml de
refrigerante?
b) A probabilidade de ocorrer um copo com menos de 275 ml de refrigerante?
c) O volume esperado em um copo qualquer?
d) A varincia do volume esperado em um copo qualquer?

Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


96
obs.:
a) Um valor de uma distribuio uniforme (0, 1) chamado um nmero aleatrio. Tem
inmeras aplicaes em simulaes e montagem de experimentos.

6.3.2 - Normal

uma das mais importantes distribuies de probabilidades, sendo aplicada em
inmeros fenmenos e constantemente utilizada para o desenvolvimento terico da
inferncia estatstica. tambm conhecida como distribuio de Gauss, Laplace ou
Laplace-Gauss.
Seja X uma v.a.c.. Dizemos que X tem distribuio normal se possuir a seguinte
f.d.p.:
( )
( )
2
2

x
2
1
2
1
x f

= e , para 0 e x , > < < < <



Notao: XN(;
2
): X tem distribuio normal com mdia e varincia
2

.
i) Representao grfica:


68,27%, 2 95,45% 3. 99,73%

um grfico em forma de sino. O seu posicionamento em relao ao eixo das
ordenadas e seu achatamento vai ser determinado pelos parmetros e
2

,
respectivamente.

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


97
A funo de distribuio acumulada dada por:
( ) ( ) ( )
( )
dx
2
1
dx x f x X P x F
x

x
2
1 x
2
2


= = = e

ii ) Propriedades:
P
1
P
) f(x) possui um ponto de mximo para x = .
2
P
) f(x) tem dois pontos de inflexo cujas abscissas valem + e .
3
P
) f(x) simtrica em relao a x = . E ainda, = Mo = Md.
4

) f(x) tende a zero quando x tende para (assinttica em relao ao eixo x).
iii) Clculo de probabilidades:

Para o clculo da probabilidade da v.a.c. assumir um valor em determinado
intervalo, surgem dois problemas:
1) Integrao de f(x), pois para o seu clculo necessrio o
desenvolvimento em sries.
2) Elaborao de tabelas se torna invivel, pois a f.d.p. depende de dois
parmetros, o que acarretaria a necessidade do estabelecimento de todas
as possveis combinaes de valores desses parmetros.

Estes problemas so resolvidos pela padronizao dos valores, obtendo-se assim
a distribuio normal padronizada ou reduzida.

6.3.2.1 - Varivel Normal Padronizada (Z)

obtida por meio de uma transformao linear da varivel normal X, obtendo-se
assim uma escala relativa de valores na qual a mdia tomada como ponto de
referncia e o desvio padro como medida de afastamento da mdia:

X
Z

=
onde:
z = valor da varivel normal padronizada Z
Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


98
x = valor de X
= mdia de X
= desvio padro de X

Mdia e Varincia da Varivel Normal Padronizada

i) Mdia:

( ) ( ) | | ( ) ( ) | | ( ) 0

1
E X E

1
X E

X
E Z E = = = =
|
.
|

\
|
=

E(Z) = 0

ii) Varincia:
( ) ( ) | | ( ) ( ) | | ( ) 1 0

1
V X V

1
X V

X
V Z V
2
2 2 2
= + = + = =
|
.
|

\
|
=

V(Z) = 1
Concluso: Se X ~ N (,
2

X
Z

= ), e , ento Z N (0,1), para quaisquer valores de
e
2
A f.d.p. da varivel Z dada por:
. Portanto, ser possvel tabelar as probabilidades, P(X x) = P(Z z), em funo
dos valores de Z.
( )
2
z
2
1
e
2
1
z

= , para < z <

Tabela da Distribuio Normal Padro

H vrios tipos de tabelas que nos fornecem as probabilidades sob a curva
normal. A tabela que vamos utilizar aquela que fornece a probabilidade da varivel Z
assumir um valor entre zero e um particular z
0
, ou seja:
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


99


( ) ( )


= =
0 0 2
z
0
z
0
z
2
1
0
dz e
2
1
dz z z Z 0 P
a rea rachurada sob a curva normal [ (z)].

Exemplos:
1) Calcule:
a) P(Z < 1,82)?
b) P (Z -2,03)?
c) P (-2,55 Z 1,20)?
d) P (Z 1,93)?

R: a) 0,9656 b) 0,0212 c) 0,8795 d) 0,0268

2) Se XN (100, 25), calcule:
a) P (X > 110)?
b) P (95 X 105)?
c) Encontre x tal que P (X x) = 0,3446

R: a) 0,0228 b) 0,6826 c) 98

Obs.: Teorema da Combinao Linear

A combinao linear de variveis normais independentes tambm uma varivel
normal. Assim se X e Y so variveis normais independentes, ento W = aX + bY + c
Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


100
tambm uma varivel normal com mdia c b a
Y X W
+ + = e varincia
2
Y
2 2
X
2 2
W
b a + = , onde a, b e c so constantes.
Em particular, devemos notar que a soma ou subtrao de duas ou mais variveis
aleatrias normais, tambm uma varivel normal.

Exerccios

1. Um pesquisador decidiu que, para facilitar a classificao das aves em experimentos
de nutrio, deve-se dividir as poedeiras, no incio da postura, em trs grupos de peso
equiprovveis, a saber: poedeiras pesadas, poedeiras mdias e poedeiras leves.
Encontre os pesos correspondentes cada classe, sabendo-se que o peso mdio das
aves nessa idade 1,5 kg, com desvio padro de 0,170 kg (supor distribuio normal).

(R: Leves: peso < 1,43 kg; mdias: 1,43 peso 1,57 kg; pesadas: peso > 1,57 kg)

2. O dimetro de um cabo eltrico normalmente distribudo com mdia 0,8 mm e
varincia 0,0004 mm
2
a) maior ou igual a 0,81 mm? (R: 308,5)
. Dentre uma amostra de 1000 cabos, quantos esperamos que
tenha dimetro:
b) entre 0,73 e 0,86 mm? (R: 998,7)
c) menor que 0,78 mm? (R: 158,7)

3. Em uma distribuio normal 28% dos elementos so superiores a 34 e 12% dos
elementos so inferiores a 19. Encontrar a mdia e a varincia da distribuio.
(R: 29,03 e
2

73,4)
4. X uma v.a.c. tal que XN (12, 25). Qual a probabilidade de uma observao ao
acaso ser menor do que -2,5? (R: 0,0019).





CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


101
Outras distribuies de variveis aleatrias contnuas

6.3.3 - Exponencial

A v.a.c. X ter distribuio exponencial se sua f.d.p., para algum parmetro > 0,
for dada por:
( )


=

contrrio caso 0
0 x para e
x f
x


Essa distribuio desempenha importante papel na descrio de uma grande
classe de fenmenos, particularmente nos assuntos da teoria de confiabilidade. Tem
como principal caracterstica a propriedade de no possuir memria. Isso significa que o
tempo de vida futuro (t) de algum objeto tem a mesma distribuio, independente do
tempo de vida passada (s) desse objeto, ou seja, para quaisquer s, t > 0, P(X > s + t | X
> s) = P(X > t).

Exemplos:
1) Mostre que F(x) = P(X x) = 1 e
-x

, para x > 0
2) A vida mdia de um satlite 4 anos, seguindo o modelo exponencial. Seja T a
varivel definindo o tempo de vida do satlite. Calcule:
a) P(T > 4). R.: 0,3678
b) P(5 T 6). R.: 0,0634
c) Se 4 desses satlites forem lanados no mesmo instante, qual a probabilidade que
aps 5 anos todos estejam funcionando? R.: 0,00674
d) Se 4 desses satlites forem lanados no mesmo instante, qual a probabilidade que
aps 5 anos exatamente dois estejam funcionando? R.: 0,2507

obs.:
a) Apresenta inmeras aplicaes nas reas da teoria da confiabilidade.
b) E(X) = 1/ e V(X) = 1/
2

.

Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


102
6.3.4 - Lognormal

Essa distribuio ocorre na prtica sempre que se encontrar uma v.a. tal que seu
logartmo tenha uma distribuio normal. Em outras palavras, se uma v.a. X tem
distribuio Normal e se os valores de uma v.a. Y esto relacionados a X pela equao
y = e
x

, Y ter distribuio Lognormal.
Exemplo:
1) Encontrou-se, num certo processo de triturao de pedras que os dimetros, D, das
pedras quebradas seguem aproximadamente uma lei lognormal com mdia 1,5 cm e
desvio padro 0,3 cm. Qual a porcentagem das pedras:
a) que excede 2 cm? (R.: 6,2%)
b) menor do que 1 cm? (R.: 2,6 %)

obs.:
a) Exemplos de aplicao: doses crticas em aplicaes de drogas; durao de
consultas mdicas; distribuio de tamanhos de unidades econmicas.

6.3.5 - Gamma

A v.a. dita ter uma distribuio Gamma com parmetros ( , ), > 0, > 0, se
sua f.d.p. dada por:
( ) ( )

=

contrrio caso 0
0 x para e x

x f
x 1 -


onde
( )


=
0
1 x
dx x e , chamada de funo gamma.

Resultados importantes so:
a) (n) = (n 1) (n 1) = ... = (n 1)!
b) (1/2) =

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


103
Exemplo: O tempo de vida de uma bateria tem distribuio exponencial com taxa . Se
um aparelho eletrnico requer uma bateria para funcionar, ento o tempo total de
funcionamento que podemos obter de um total de n baterias uma v.a. gamma com
parmetros (n, ). Como proceder para obter a probabilidade do aparelho funcionar por
um tempo maior que t?

obs.:
a) Uma relao pode ser feita entre as distribuies Gama e Poisson. Na de Poisson
estamos interessados no nmero de ocorrncias de algum evento durante um perodo
de tempo fixado. A Distribuio Gama, por outro lado, surge quando indagamos a
distribuio do tempo necessrio para obter um nmero especificado de ocorrncias do
evento.

b) Fornece uma representao til de muitos fenmenos fsicos. Fornece um melhor
ajuste distribuio Exponencial na modelagem de tempo de vida de peas. Tem
tambm aplicao em processos meteorolgicos, teoria de riscos de seguros e teoria
econmica.

c) quando = 1 a distribui o gamma se reduz distribuio exponencial com mdia
1/.

d) essa distribuio surge quando indagamos a distribuio do tempo necessrio para
obter um nmero especificado de ocorrncias do evento.

6.3.6 - Weibull

Essa distribuio prov mais flexibilidade quando a distribuio exponencial
parece ser adequada, especialmente quando condies de estrita casualizao no so
satisfeitas. Ela descreve dados de teste de tempo de durao (vida) e fadiga. Portanto
essa distribuio frequentemente usada para representar a distribuio da fora de
quebra de materiais em testes de controle de qualidade e confiabilidade.


Captulo 6 Distribuies de variveis aleatrias discretas e contnuas
_____________________________________________________________________
___________________________________________________________________________________


104
obs.:
a) A distribuio de Weibull representa um modelo adequado para uma lei de falhas,
sempre que o sistema for composto de vrios componentes e a falha seja
essencialmente devida mais grave imperfeio ou irregularidade dentre um grande
nmero de imperfeies do sistema;
b) Empregando uma distribuio de Weibull, poderemos obter tanto uma taxa de falhas
crescente como uma decrescente, pela simples escolha apropriada do parmetro.

6.3.7 - Beta

O grfico representativo dessa distribuio revela muitas das suas propriedades
medida que os parmetros variam.

obs.:
a) Essa distribuio amplamente utilizada para ajustar distribuies tericas cujas
amplitudes de variao so conhecidas. O ajuste realizado aps equacionar o primeiro
e segundo momentos (esperana e varincia, respectivamente) das curvas terica e
ajustada.

6.3.8 -
2

(Qui-quadrado)
A distribuio de Qui-quadrado possui numerosas aplicaes importantes em
inferncia estatstica. Essa distribuio aparece naturalmente na teoria associada com a
distribuio da soma dos quadrados de variveis normais-padro independentes. Dada
a sua importncia, tal distribuio est tabulada para diferentes valores do parmetro v.

Exemplo: aplicao em testes de hipteses e como aproximao para distribuies de
algumas funes de variveis aleatrias

obs.:
a) Essa distribuio usada primariamente como uma aproximao para a estatstica
2

(a ser vista oportunamente) sendo esta muito importante para vrios testes de
significncia.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


105

6.3.9 - F

Essa distribuio tem importncia na teoria estatstica principalmente pela sua
aplicao na distribuio de razes de varincias. Sua aplicao mais comum ,
portanto, em testes associados com a anlise de varincia (ANOVA, a ser discutido em
Estatstica Experimental), quando a homogeneidade de um conjunto de mdias
testado. No nosso curso utilizaremos essa distribuio para testar a igualdade de
varincias advindas de duas populaes normais.

Exemplo: aplicao em testes de hipteses.
Captulo 7 Testes de Significncia
_____________________________________________________________________
___________________________________________________________________________________


106

7.0 TESTES DE SIGNIFICNCIA

7.1 Introduo

Testes de significncia (tambm conhecidos como Testes de Hipteses)
correspondem a uma regra decisria que nos permite rejeitar ou no rejeitar uma
hiptese estatstica com base nos resultados de uma amostra.

Obs.: essas hipteses so, em geral, sobre parmetros populacionais e a realizao do
teste se baseia na distribuio amostral dos respectivos estimadores.

7.2 - Hiptese Estatstica

uma suposio quanto ao valor de um parmetro populacional, ou uma
afirmao quanto natureza da populao. As hipteses estatsticas devem ser
formuladas de modo a minimizar os erros de deciso.

7.2.1 - Hiptese de Nulidade e Hiptese Alternativa

- Hiptese de Nulidade (H
0
) - a hiptese a ser testada. formulada com o
propsito de ser rejeitada e os testes so construdos sobre a pressuposio de H
0
ser
verdadeira. O teste de hipteses consiste em verificar se a amostra observada difere
significativamente do resultado esperado sobre H
0

.
- Hiptese Alternativa (H
a
) - uma hiptese que contraria H
0

. formulada com
base no conhecimento prvio do problema, informaes de pesquisa, etc.
Exemplo:
H
0
H
: = 6.000 horas (durabilidade de lmpadas)
a
: > 6000; ou H
a
: < 6000; ou H
a

: 6000
hipteses unilaterais hiptese bilateral
CRP 192 Iniciao Estatstica 2010/I
_____________________________________________________________________________
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhes dos Santos

107
Aps a realizao do teste conclumos por uma das hipteses dadas acima.

7.2.2 - Regies crticas


Teste unilateral direita < X

Teste unilateral esquerda > X


Teste bilateral X

7.2.3 - Erros de deciso

Qualquer deciso tomada implica na possibilidade de cometer basicamente dois
tipos de erros: Erro tipo I e Erro tipo II.

Erro tipo I o erro caracterizado pelo fato de rejeitarmos o H
0

quando esta
verdadeira. Designaremos por a probabilidade de se cometer o erro tipo I (nvel de
significncia do teste).
Erro tipo II o erro caracterizado pelo fato de aceitarmos H
0

quando esta
falsa. Designaremos por a probabilidade de se cometer o erro tipo II.
Poder do teste a probabilidade de rejeitar H
0
Poder = 1 .
quando esta falsa.

RRH
0

RAH
0

RRH
0

RAH
0

RRH
0

RAH
0

RRH
0

Captulo 7 Testes de Significncia
_____________________________________________________________________
___________________________________________________________________________________


108
O quadro abaixo facilita o entendimento.
Realidade
Deciso H
0
H verdadeira
0
falsa
Rejeitar H
0
1 -
Aceitar H 1 -
0


ento:
= P(rej.H
0
/H
0
= P(aceitar H
verdadeira)
0
/H
0

falsa)
7.3 - Procedimentos para a realizao de um Teste de Hiptese (Passos)

1 - Enunciar as hipteses H
0
e H
a
2 - Fixar o nvel de significncia e identificar a estatstica do teste;
;
3 - Determinar a regio crtica (faixa de valores que nos levam rejeio da hiptese
H
0
4 - Baseado na amostra, calcular o valor da estatstica do teste;
) e a regio de aceitao em funo do nvel pelas tabelas estatsticas apropriadas;
5 - Concluir: Se estatstica do teste regio crtica rej. H
0
caso contrrio no rejeita
H
0

.
7.4 - Testes de Hipteses

7.4.1 - Teste z
Teste z (veremos apenas o teste para uma mdia populacional)

Obs: assume-se que a varivel em estudo tenha distribuio normal com varincia
populacional conhecida.

7.4.1.1 - Teste z para 1 mdia

A estatstica do teste baseada na mdia amostral X. Pode ser demonstrado
que a mdia amostral tem distribuio aproximadamente normal com mdia e
varincia
n

2
, onde n o tamanho da amostra.
CRP 192 Iniciao Estatstica 2010/I
_____________________________________________________________________________
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhes dos Santos

109
Testamos as hipteses: H
0
: =
0

versus Ha: uma alternativa conveniente.
A estatstica do teste z para 1 mdia :
n

X
z
calc

=

De acordo com o nvel de significncia e a hiptese alternativa definidas obtemos
o valor tabelado de z na tabela apropriada.

A regra de deciso ser:
Se
tab calc
z z rejeitamos H
0
caso contrrio no rejeitamos H
;
0

.
Exerccios:
1) Uma mquina automtica de encher pacotes de caf enche-os segundo uma
distribuio normal, com mdia e varincia 400 g
2
x
. O valor de pode ser fixado num
mostrador situado numa posio um pouco inacessvel dessa mquina. A mquina foi
regulada para = 500 g. Desejamos, de meia em meia hora, colher uma amostra de 16
pacotes e verificar se a produo est sob controle, isto , se = 500 g ou no. Se uma
dessas amostra apresentasse uma mdia = 492 g, voc pararia ou no a produo
para verificar se o mostrador est na posio correta? Usar = 1%.

2) Uma companhia de cigarros anuncia que o ndice mdio de nicotina dos cigarros que
fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratrio realiza 6 anlises
desse ndice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o ndice de nicotina se
distribui normalmente, com varincia igual a 4,86 mg
2

. Pode-se considerar a afirmativa
do fabricante verdadeira, ao nvel de 10% de probabilidade?
7.4.2 - Teste t

Obs: assume-se que a varivel em estudo tenha distribuio normal com varincia
populacional desconhecida.

Captulo 7 Testes de Significncia
_____________________________________________________________________
___________________________________________________________________________________


110
7.4.2.1 - Teste t para 1 mdia
Testamos as hipteses: H
0
: =
0

versus Ha: uma alternativa conveniente.
A estatstica do teste t para 1 mdia :
n

X
t
calc

= , onde:
s ou

= desvio padro amostral.



De acordo com o nvel de significncia e a hiptese alternativa definidas obtemos
o valor tabelado de t


(n 1) na tabela apropriada.
CUIDADO
Tabela bilateral
Teste bilateral entrar com
Teste unilateral entrar com 2

Tabela unilateral
Teste unilateral entrar com
Teste bilateral entrar com /2

A regra de deciso ser:
Se
tab calc
t t rejeitamos H
0
caso contrrio no rejeitamos H
;
0

.
Exemplo: Determinada firma desejava comprar cabos tendo recebido do fabricante a
informao de que a tenso mdia de ruptura 8000 kgf. Para analisar se a afirmao
do fabricante verdadeira, efetuou-se um teste de hiptese unilateral. Se um ensaio
com 6 cabos forneceu uma tenso mdia de ruptura de 7750 kgf, com desvio padro de
145 kgf, a qual concluso chegar, usando um nvel de significncia de 5%?

7.4.2.2 - Teste t para duas mdias (2 amostras independentes)

Muitos problemas aparecem quando deseja testar hipteses sobre mdias de
diferentes populaes. Por exemplo, um pesquisador pode estar investigando um novo
CRP 192 Iniciao Estatstica 2010/I
_____________________________________________________________________________
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhes dos Santos

111
tipo de mquina, comparando a produo mdia de perodos em que foi usada a
mquina antiga e a nova.
Quando as varincias das populaes so substitudas pelas varincias
amostrais, isto ,
2 2 2
lugar em s ou

, o teste z passa ateste t, onde em funo das


varincias das populaes serem ou no iguais entre si.

Obs: Pressupe-se normalidade dos dados.

Sejam X e Y normalmente distribudos com varincias desconhecidas.
Desejamos testar:
H
0
:
X
=
Y

<
>
Y X
Y X
Y X
a

ou
ou
: H
contra


Exemplo: dois mtodos de execuo de determinada tarefa. X e Y seriam os tempos
gastos com cada mtodo.

Outra pressuposio (apenas para efeito de nosso curso de CRP 192) seria a
homogeneidade das varincias populacionais
2
Y
2
X
e (desconhecidas).
Portanto assumimos:
2 2
Y
2
X
= = , isso quer dizer que
2
Y
2
X
e

so estimativas de
um mesmo valor
2
Portanto podemos combinar
.
2
Y
2
X
e

a fim de obter um melhor estimador para
2
Ento:
.
( ) ( )
( ) ( )
2 n n
1 n 1 n
1 n 1 n
SQD SQD

Y X
2
Y Y
2
X X
Y X
Y X 2
+
+
=
+
+
=



Utilizamos para o teste, a varivel aleatria:
|
|
.
|

\
|
+

=
Y X
2
n
1
n
1

Y X
t



que tem distribuio t de Student com n
X
+ n
Y
2 graus de liberdade.
Captulo 7 Testes de Significncia
_____________________________________________________________________
___________________________________________________________________________________


112

Deciso:
Se
tab calc
t t rejeita H

0

Exerccio: Suponhamos que duas tcnicas de memorizao X e Y devero ser
comparadas medindo-se a eficincia pelo tempo exigido para decorar certo tipo de
material. O mesmo material foi apresentado a n
X
= 18 e n
Y
min 20 X =
= 13 pessoas que o
decoraram usando as tcnicas X e Y respectivamente. Verificar se h diferena
significativa entre as duas tcnicas de memorizao, adotando = 5%. Os resultados
foram:
min 17 Y =
2 2
X
min 12 =


2 2
Y
min 15 =


18 n
X
=
13 n
Y
=

Os dois ltimos testes a serem apresentados a seguir (Teste
2

e Teste F) so
usados para testar hipteses referentes a um parmetro populacional ou mesmo
comparao de dois parmetros.
7.4.3 - Teste de Qui-quadrado (
2

)
O teste de Qui-quadrado faz parte dos chamados testes no-paramtricos, ou
seja, que no dependem dos parmetros populacionais, nem de suas respectivas
estimativas.
O teste de Qui-quadrado pode ser usado principalmente como:
i) Teste de aderncia
ii) Teste de independncia
iii) Teste de homogeneidade

Veremos, a princpio, apenas o teste de aderncia, sendo os demais testes
filosoficamente (e at mesmo mecanicamente) similares, mas aplicveis quando
queremos estudar a relao entre duas ou mais variveis de classificao. Se o tempo
CRP 192 Iniciao Estatstica 2010/I
_____________________________________________________________________________
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhes dos Santos

113
permitir ser apresentado tambm pelo menos mais um dos outros testes de qui-
quadrado.

7.4.3.1 - Teste de Aderncia

Existe apenas uma varivel e o que se testa o padro hipottico de frequncias
ou a distribuio da varivel.
A estatstica do teste dada por:
( )


=
i
2
i i 2
E
E O
, onde
O
i
E
= frequncia observada da categoria (evento) i;
i

= frequncia esperada da categoria (evento) i.
Obs: A expresso acima nos d um valor sempre positivo e tanto menor quanto maior
for o acordo entre as frequncias observadas e as frequncias esperadas, calculadas
com base em H
0

.
Obs: A hiptese H
0
as frequncias esperadas, ou H
afirmar no haver discrepncias entre as frequncias observadas e
0

ser colocada em termos de distribuio de
probabilidade que vamos por prova.
O valor de calc
2
comparado com o tabelado
2
.
Se calc
2
tabelado
2
rejeita-se H
0

.
Obs: Para obter o tabelado
2
precisamos conhecer o nvel de significncia () do teste e o
nmero de graus de liberdade v, onde v = k 1 r, onde k o nmero de categorias em
que foi dividida a amostra; e r o nmero de parmetros estimados para o clculo das
E
i

.
Exemplo: Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a
hiptese da moeda ser honesta, adotando-se = 5%.


Captulo 7 Testes de Significncia
_____________________________________________________________________
___________________________________________________________________________________


114
7.4.4 - Teste F

O teste F um teste de hipteses utilizado para verificar se as varincias de duas
populaes com distribuio normal so diferentes.

Exemplo: Na aplicao de dois mtodos A e B, obteve-se os resultados abaixo. Testar
a hiptese de igualdade das varincias ao nvel de 5% de probabilidade.
Mtodo
2

n
A 40 11
B 16 19


7.5 - Lista de exerccios

1) Sabe-se que o consumo mensal per capita de um determinado produto tem
distribuio normal, com desvio padro 2 kg. A diretoria de uma firma que fabrica esse
produto resolveu que retiraria o produto da linha de produo se a mdia de consumo
per capita fosse menor que 8 kg. Caso contrrio, continuaria a fabric-lo. Foi realizada
uma pesquisa de mercado, tomando-se uma amostra de 25 indivduos, e verificou-se
que a soma dos valores coletados foi de 180 kg.
a) Utilizando um nvel de significncia de 5%, e com base na amostra colhida determine
a deciso a ser tomada pela diretoria? (R: Rejeita-se H
0
b) Utilizando um nvel de significncia de 1 %, a deciso seria a mesma? (Justifique a
sua resposta) (R: No se rejeita-se H
)
0

)
2) Estamos desconfiados de que a mdia das receitas municipais per capita das cidades
pequenas (0 - 20.000 habitantes) maior do que a das receitas do estado, que de
1229 unidades monetrias. Para comprovar ou no esta hiptese, sorteamos dez
cidades pequenas, e obtivemos os seguintes resultados: 1230; 582; 576; 2093; 2621;
1045; 1439; 717; 1838; 1359. A que concluso chegar a um nvel de 5% de
probabilidade? (R: No se rejeita-se H
0

)
CRP 192 Iniciao Estatstica 2010/I
_____________________________________________________________________________
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhes dos Santos

115
3) Uma fbrica de embalagens para produtos qumicos est estudando dois processos
para combater a corroso de suas latas especiais. Para verificar o efeito dos
tratamentos, foram usadas amostras cujos resultados esto no quadro abaixo. Qual
seria a concluso sobre os dois tratamentos, ao nvel de 5% de significncia?
Mtodo Amostra Mdia Desvio padro
A 15 48 10
B 12 52 15
(R: No se rejeita-se H
0

)
4) Suponhamos que um pesquisador, desejando colocar prova a hiptese de que a
idade da me tem certa influncia sobre o nascimento de criana prematura, verificou
que, dentre 90 casos de prematuridade, 40 envolviam mes com idade inferior a 18
anos; 15 envolviam mes de 18 a 35 anos e 35 mes com idade acima de 35 anos. Isto
leva o pesquisador a manter sua hiptese? Use nvel de significncia de 0,01. (R:
Rejeita-se H
0

)
5) No decurso de um ano, determinada firma teve 50 acidentes. Um dos aspectos de
uma investigao levada a efeito pelo engenheiro de segurana diz respeito ao dia de
ocorrncia do acidente. Pelos dados que seguem abaixo, pode-se dizer que o dia da
semana tenha alguma influncia? Teste a hiptese nula, de que os dias so igualmente
provveis, ao nvel de 10% de probabilidade. (R: Rejeita-se H
0
Dia
)
Segunda Tera Quarta Quinta Sexta
N de acidentes 15 6 4 9 16


6) A associao dos proprietrios de indstrias metalrgicas est muito preocupada com
o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos, tem sido
da ordem de 60 horas/homem por ano e desvio padro de 20 horas/homem. Tentou-se
um programa de preveno de acidentes, aps o mesmo, tomou-se uma amostra de 9
indstrias e mediu-se o nmero mdio de horas/homem perdidas por acidente, que foi
50 horas. Voc diria, ao nvel de 5%, que h evidncia de melhoria? (R: No se rejeita-
se H
0

)
7) Uma firma de produtos farmacuticos afirma que o tempo mdio para certo remdio
fazer efeito de 24 minutos. Numa amostra de 19 casos, o tempo mdio foi de 25
Captulo 7 Testes de Significncia
_____________________________________________________________________
___________________________________________________________________________________


116
minutos, com desvio padro de 2 minutos. Teste a alegao, contra a alternativa de que
o tempo mdio superior a 24 minutos, a um nvel de significncia de 1%. (R: No se
rejeita-se H
0

)
8) Num estudo comparativo do tempo mdio de adaptao, uma amostra aleatria, de
50 homens e 50 mulheres de um grande complexo industrial, produziu os seguintes
resultados:
Estatsticas Homens Mulheres
Mdias 3,2 anos 3,7 anos
Desvios padres 0,8 anos 0,9 anos

Que concluses voc poderia tirar para a populao de homens e mulheres desta
indstria, ao nvel de 5% de significncia? (R: Rejeita-se H
0

)
9) Uma das maneiras de medir o grau de satisfao dos empregados de uma mesma
categoria quanto poltica salarial atravs do desvio padro de seus salrios. A
fbrica A diz ser mais coerente na poltica salarial do que a fbrica B. Para verificar essa
afirmao, sorteou-se uma amostra de 10 funcionrios no especializados de A, e 15 de
B, obtendo-se os desvios padres s
A
= 1,0 SM e s
B
= 1,6 SM. Qual seria a sua
concluso, ao nvel de 1%? (R: No se rejeita-se H
0
)
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


117

8.0 INTERVALOS DE CONFIANA

8.1 Introduo

uma maneira de calcularmos uma estimativa de um parmetro desconhecido.
Muitas vezes tambm funciona como um teste de hipteses. A idia construir um
intervalo de confiana para o parmetro com uma probabilidade de 1 - (nvel de
confiana) de que o intervalo contenha o verdadeiro parmetro.

Obs: o nvel de significncia, isto , o erro que estaremos cometendo ao afirmar-
mos que, por exemplo, 95% das vezes o intervalo
2 1


< < contm . Nesse caso, o
erro seria de 5%.
Se considerarmos o intervalo L l , onde l o limite inferior do intervalo, L o
limite superior do intervalo, e o parmetro desconhecido, ento o comprimento L l
do intervalo de confiana observado uma medida importante da qualidade da
informao obtida da amostra. A metade do intervalo, ou seja, l ou L - , chamado
de preciso do estimador.
Assim, quanto maior o intervalo de confiana, mais confiante ns estaremos de
que realmente o intervalo calculado contenha o verdadeiro valor de . Por outro lado,
quanto maior o intervalo, menos informao teremos sobre o verdadeiro valor de .
Numa situao ideal, obtemos um intervalo relativamente curto com alta confiana.
Nesse captulo veremos apenas a expresso final para se obter um intervalo de
confiana. No entanto, pode-se demonstrar, facilmente, que intervalos de confiana so
obtidos com base na teoria discutida no captulo sobre testes de hipteses.

A estimao de parmetros pode ser feita de duas maneiras:
i) Estimao por ponto quando a partir da amostra procuramos obter um nico
valor de certo parmetro populacional. Ex: X uma estatstica que produz uma
estimativa por ponto do parmetro populacional .
Captulo 8 Intervalos de confiana
_____________________________________________________________________
___________________________________________________________________________________


118
ii) Estimao por intervalo quando a partir da amostra procuramos construir um
intervalo
2 1


< < com certa probabilidade de que este intervalo contenha o
verdadeiro parmetro populacional .

8.2 - Intervalos de confiana para mdia e varincia.

8.2.1 - Intervalo de confiana para a mdia, quando a varincia conhecida.

Se X a mdia de uma amostra aleatria de tamanho n de uma populao com
varincia conhecida
2
n

z X
n

z X
2

+
, o I.C. 100 (1 - )% da mdia dado por:

onde
2

z obtido da distribuio normal reduzida.


Sabemos que no uma varivel aleatria, mas sim um parmetro, desta forma
a expresso acima deve ser interpretada do seguinte modo: Construdos todos os
intervalos de forma especificada acima, um menos deles contero o parmetro .

Exemplo: Um artigo no Journal of Heat Transfer (1974) apresenta os dados abaixo
referentes condutividade trmica (em Btu/hr.ft.F) de uma amostra de 10 peas
metlicas (ferro).
41,60 41,48 42,34 41,95 41,86 42,18 41,72 42,26 41,81 42,04
Obtenha o I.C. (95%) da mdia da condutividade trmica nessas peas metlicas.
Soluo:
mdia = 41,924
desvio-padro populacional (fornecido) = 0,30
2

z =
2
0,05
z =
0,025
z = 1,96
Assim
I.C. (95%): 41,738 < 42,110

Concluso: Este intervalo bem pequeno. Se repetirmos este experimento um n muito
grande de vezes, 95% dos intervalos assim construdos contero no seu interior.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


119
Obs.1: pelo fato de se um par metro e no uma v.a., o intervalo acima deve ser
interpretado da seguinte maneira: 95% dos intervalos assim construdos contero a
verdadeira mdia.

Obs.2: A frmula apresentada acima apresenta bons resultados para amostras oriundas
da populao normal, ou para amostras com n 30 de populao no normal. O nvel
de confiana (1 ) no ser exato para amostras pequenas de populao no normais.

Obs.3: Desde que o comprimento do I.C. mede a preciso da estimao, podemos
observar que a preciso inversamente relacionada com o nvel de confiana. O
desejvel seria obter um I.C. que fosse curto o suficiente para o propsito de tomada de
deciso, e que tambm tivesse uma confiana adequada. Uma maneira de conseguir
isso seria pela escolha do tamanho da amostra n para ser grande o suficiente para dar
um I.C. de um determinado comprimento com uma confiana definida.

8.2.2 - Intervalo de confiana para mdia, quando a varincia populacional
desconhecida

Se X e

so, respectivamente, a mdia e o desvio padro de uma amostra


aleatria de uma populao com distribuio normal e varincia
2
n

t X
n

t X
2


+
desconhecida, ento
o I.C. de 100 (1- )% da mdia dado por:
,
onde
2

t obtido da distribuio t de Student.


Exemplo: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma
populao normal. Construir o intervalo de confiana, de 95%, para .

Soluo:
X= 7,8
( )
2,0 4,0
1 10
10
87
793
1 n
n
X
X

2
2
i
2
i
i
2
i
2
=




Captulo 8 Intervalos de confiana
_____________________________________________________________________
___________________________________________________________________________________


120
( ) 10,13 7,27
10
2
2,262 8,7
10
2
2,262 8,7 : 95% I.C. = +
Concluso: Se repetirmos este experimento um n muito grande de vezes em 95% dos
intervalos assim construdos contero no seu interior.

Exerccio: Considere os 20 dados abaixo correspondentes ao tempo de resistncia ao
fogo (em segundos) de determinada vestimenta aps tratamento com uma tintura
especial:
9,85 9,93 9,75 9,77 9,67 9,87 9,67 9,94 9,85 9,75
9,83 9,92 9,74 9,99 9,88 9,95 9,95 9,93 9,92 9,89

Assuma que o tempo de resistncia ao fogo segue uma distribuio normal. Obter o I.C.
(95%) do tempo mdio de resistncia ao fogo.

R.: 9,8073 9,8977. Dizemos estar 95% confiantes de que a mdia do tempo de
resistncia ao fogo est entre 9,8073 e 9,8977 segundos.

8.2.3 - Intervalo de confiana para a varincia de uma populao normal

Seja X uma populao normal com distribuio normal com mdia e varincia

2 ( )
( )
2
1 n 2
2

1 n

. Sabe-se que , onde n o tamanho da amostra e


2

a varincia
amostral. Ento:
( )
( ) ( )
2
menor
2
2
2
maior
2

1 n

1 n
: 1 I.C.



onde
2
maior
e
2
menor
so obtidos na tabela de
2
, com n 1 graus de liberdade e nvel de
significncia de acordo com a figura abaixo:

Grfico:




CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


121
Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para
2


ao nvel de 90% de confiana (ou seja, =10%).
Soluo:
Temos: n = 10,
2

= 4, g.l. = v = 9; = 10%.

Grfico:




8.3 - Intervalo de confiana para a proporo

Obs: O mtodo apresentado abaixo apropriado quando n for maior que 30.

( )
( ) ( )
n
f 1 f
Z f p
n
f 1 f
Z f : ser 1 I.C.
2



onde f a estimativa da proporo p.

Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferncias eleitorais, 260
mostraram-se favorveis ao candidato B. Calcular o intervalo de confiana ao nvel de
90% para a porcentagem (ou proporo) dos eleitores favorveis a B.


8.4 - Determinao do tamanho da amostra

Uma questo que aparece frequentemente no planejamento de experimentos
qual deve ser o tamanho da amostra para se ter determinada preciso na estimao da
mdia populacional. Aumentos no tamanho da amostra melhoram a preciso da
estimativa e diminui o comprimento do intervalo de confiana.


Captulo 8 Intervalos de confiana
_____________________________________________________________________
___________________________________________________________________________________


122
8.4.1 - Baseado no I.C. para a mdia, quando
2
A preciso do I.C.
conhecida
n

z
2

. Isto significa que em usar X para estimar , o erro


E = [ X- ] menor ou igual a
n

z
2

com confiana 100 (1 ). Isso poderia ser


mostrado graficamente. Se o tamanho da amostra pode ser controlado, podemos
escolher n de modo que ns estaremos 100 (1 )% confiantes de que o erro na
estimao do ser menor do que um erro especfico E . Assim, o tamanho amostral
apropriado ser aquele de n tal que
2
2

E
z
n seja, ou E,
n


= =
Obs.1: Se n no for inteiro, este deve ser aproximado para cima para garantir que o
nvel de confiana no fique menor que 100(1 )%.
Obs.2: Observe que 2E o comprimento do I.C. de interesse.

Exemplo: Considerando os dados do exerccio anterior, suponha que queremos que o
erro na estimao da condutividade mdia naquela pea metlica seja menor do que
0,10 Btu/hr.ft.F, com 95% de confiana.
Soluo:
J que = 0,30 e z
0,025

= 1,96
35 34,57
0,10
0,30 1,96
n
2
=


=

Observemos a relao geral entre tamanho da amostra, comprimento desejado
do I.C. (2E), nvel de confiana 100(1 )% e desvio padro :
Se 2E diminui, o tamanho amostral n aumenta, para e nvel de confiana constantes;
Se aumenta, n aumenta, para 2E fixo e 100(1 )% fixo.
Se o nvel de confiana aumenta, n aumenta, para 2E fixo e fixo.




CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


123
8.4.2 - Baseado no I.C. para a mdia, quando no conhecemos a

2

Quando no conhecemos a varincia
2
1 n ,
2

t e
n
1

, a determinao do tamanho amostral n


necessrio para fornecer o I.C. com o comprimento de interesse no fcil, j que o
comprimento do I.C. depende de e do valor de n . Al m disso n entra no I.C. de duas
maneiras: .

Dessa forma, a obteno de n ocorre por meio de tentativas e erros, usando uma
estimativa de baseada, talvez, em experincia passada.
Outra possibilidade seria tomar uma amostra preliminar (amostra piloto) de n
observaes para estimar . Ento, usando o desvio padro amostral s como uma
aproximao para usamos a equao
2
2

E
z
n


=
para calcular o valor requerido de n para fornecer a acurcia e o nvel de confiana
desejados.

8.5 - Exerccios Propostos

1) Em uma fbrica, colhida uma amostra de 30 peas para avaliao, obtiveram-se as
seguintes informaes sobre o dimetro das peas: 2,05 e 13,13 X
2
= =

. Construir
um intervalo de confiana para a mdia sendo = 5%? (R.: 12,60 13,66)

2) Sendo X uma populao tal que ( )
2
, N ~ X em que e
2

= = 27,3 x e 8,7 x
2
i i
so desconhecidos. Uma
amostra de tamanho 15 forneceu os valores . Determinar um
intervalo de confiana de 95% para
2
. (R.: 0,85
2

3,95).
3) Uma centena de componentes foi ensaiada e 93 deles funcionaram mais de 500
horas. Determinar um intervalo de confiana de 95% para a proporo. (R.: 0,88 p
0,98).

Captulo 8 Intervalos de confiana
_____________________________________________________________________
___________________________________________________________________________________


124
4) A fora de compresso de concreto est sendo testada por um engenheiro civil. Ele
testa 12 amostras e obtm os seguintes dados:
2216 2237 2249 2204 2225 2301
2281 2263 2318 2255 2275 2295

Assumindo-se distribuio normal pede-se:
a) Construa o I.C. (95%) para a fora mdia?
b) Construa o I.C. (99%) para a fora mdia?
c) Ao nvel de 5% de significncia verificar se a verdadeira mdia da fora de
compresso difere de 2280. Realizar o teste t para uma mdia?
d) Repetir o item c, porm usando = 1%?
e) Repetir o item c, porm verificando se a verdadeira fora mdia difere de 2300?
f) Compare as concluses obtidas usando-se I.C. e teste de hiptese?

5)Tintas para marcao em asfalto de rodovias so oferecidas em duas cores, branca e
amarela. O tempo de secagem dessas tintas de muito interesse, e especificamente,
suspeita-se que a tinta amarela seca mais rpido do que a branca. Amostras foram
obtidas para a medio dos tempos de secagem (em minutos), em condies reais das
duas tintas:
Tinta branca 120 132 123 122 140 110 120 107
Tinta amarela 126 124 116 125 109 130 125 117 129 120

Assumindo distribuio normal pede-se:
a) Obtenha o I.C. (95%) para o tempo mdio de secagem de cada tipo de tinta?
b) Realize um teste de hiptese para responder s questes apresentadas no enunciado
do problema? Use = 5%.
c) Obtenha o I.C. (95%) para a varincia do tempo de secagem de cada tipo de tinta?
d) Realize um teste F para verificar se ambas s tintas apresentam a mesma
variabilidade no tempo de secagem. Use = 5%.

CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


125

9.0 CORRELAES E REGRESO LINEAR

9.1 Introduo

A relao entre variveis mensuradas nos estudos de determinados fenmenos
uma importante informao a ser obtida na investigao cientfica de muitas reas. Sem
conhecer como uma varivel varia com a ocorrncia de mudanas nos valores das
outras, praticamente impossvel fazer previses ou controlar uma das variveis pela
manipulao da outra.
Nesse captulo veremos duas maneiras distintas de verificar a relao entre duas
variveis, pela correlao e a regresso linear.

9.2 - Correlao

Serve para estudar o comportamento conjunto de duas variveis quantitativas
distintas. Ou, em outras palavras, mede o grau de associao entre duas variveis
aleatrias X e Y.
OBS.: no h, nesse caso, preocupao em apresentar alguma forma funcional entre as
variveis, se houver.

Exemplos: (apresentados em aula)

Para o estudo do comportamento conjunto de duas variveis poderiam ser usados:

9.2.1 - Diagrama de disperso

Representao grfica do conjunto de dados. Nada mais do que a
representao dos pares de valores num sistema cartesiano. Veja exemplos
apresentados em aula.
Dependendo do grfico obtido, trs situaes marcantes poderiam acontecer:
Captulo 9 Correlaes e Regresso Linear
_____________________________________________________________________
___________________________________________________________________________________


126
a) Se, quando uma das variveis cresce, a outra, em mdia, tambm cresce,
dizemos que entre as duas variveis existe correlao positiva, tanto mais forte quanto
mais perto de uma reta imaginria os pontos estiverem;

b) Se, quando uma das variveis cresce, a outra, em mdia, tambm
decresce, dizemos que entre as duas variveis existe correlao negativa, tanto mais
forte quanto mais perto de uma reta imaginria os pontos estiverem;

c) Se os pontos estiverem dispersos, sem definio de direo, dizemos que a
correlao muito baixa, ou mesmo nula. As variveis nesse caso so ditas no
correlacionadas.

9.2.2 - Coeficiente de correlao

um valor numrico, uma medida, para o grau de associao entre duas
variveis.
Se for observada uma associao entre as variveis quantitativas (a partir de um
diagrama de disperso, por exemplo), muito til quantificar essa associabilidade.
Existem muitos tipos de associao possveis, e aqui iremos apresentar o tipo de
relao mais simples, que o linear. Iremos julgar o quanto a nuvem de pontos do
diagrama de disperso se aproxima de uma reta.

Sejam duas amostras relativas s variveis X e Y, dadas a seguir:
X X
i
X
1

2
X
n

Y Y
i
Y
1

2
Y
n

O coeficiente de correlao entre os valores de X e Y dado por:
( )
( ) ( ) Y X
XY
Y X
XY
XY
SQD SQD
SPD
1 n
SQD
1 n
SQD
1 n
SPD
Y V X V
Y X, CV

=

r ,
-1 r
XY
em que:
1
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


127
n
Y X
Y X SPD
n
1 i
i
n
1 i
i
n
1 i
i i XY

= =
=

n
X
X SQD
2
n
1 i
i
n
1 i
2
i X

=
=

n
Y
Y SQD
2
n
1 i
i
n
1 i
2
i Y

=
=


Exemplo:
Amostra A 4 8 3 9 7 5
Amostra B 1 5 2 14 3 11

( )( )
36
6
36 36
252
n
B A
B A SPD
n
1 i
i
n
1 i
i
n
1 i
i i AB
= =

= =
=

( )
28
6
36
244
n
A
A SQD
2
2
n
1 i
i
n
1 i
2
i A
= =

=
=

( )
140
6
36
356
n
B
B SQD
2
2
n
1 i
i
n
1 i
2
i B
= =

=
=

( )( )
0,575
140 28
36
SQD SQD
SPD
r
B A
AB
XY
= =

=

9.3 - Regresso linear

A anlise de regresso consiste na realizao de uma anlise estatstica com o
objetivo de verificar a existncia de uma relao funcional entre uma varivel
dependente com uma ou mais variveis independentes. Em outras palavras consiste na
obteno de uma equao que tenta explicar a variao da varivel dependente pela
variao do(s) nvel(is) da(s) varivel(is) independente(s).
Para tentar estabelecer uma equao que representa o fenmeno em estudo
pode-se fazer um grfico, chamado de diagrama de disperso, para verificar como se
Captulo 9 Correlaes e Regresso Linear
_____________________________________________________________________
___________________________________________________________________________________


128
comportam os valores da varivel dependente (Y) em funo da variao da varivel
independente (X).
O comportamento de Y em relao a X pode se apresentar de diversas maneiras:
linear, quadrtico, cbico, exponencial, logartmico, dentre outros. Para se estabelecer o
modelo para explicar o fenmeno, deve-se verificar qual tipo de curva e equao de um
modelo matemtico que mais se aproxime dos pontos representados no diagrama de
disperso.
Contudo, pode-se verificar que os pontos do diagrama de disperso, no vo se
ajustar perfeitamente curva do modelo matemtico proposto. Haver na maior parte
dos pontos, uma distncia entre os pontos do diagrama e a curva do modelo
matemtico. Isto acontece, devido ao fato do fenmeno que est em estudo, no ser um
fenmeno matemtico e sim um fenmeno que est sujeito a influncias que acontecem
ao acaso. Assim, o objetivo da regresso obter um modelo matemtico que melhor se
ajuste aos valores observados de Y em funo da variao dos nveis da varivel X.
No entanto o modelo escolhido deve ser coerente com o que acontece na prtica.
Para isto, deve-se levar em conta as seguintes consideraes no momento de se
escolher o modelo:
a) o modelo selecionado deve ser condizente tanto no grau como no aspecto da
curva, para representar em termos prticos, o fenmeno em estudo;
b) o modelo deve conter apenas as variveis que so relevantes para explicar o
fenmeno;
Como foi dito anteriormente, os pontos do diagrama de disperso ficam um pouco
distantes da curva do modelo matemtico escolhido. Um dos mtodos que se pode
utilizar para obter a relao funcional, se baseia na obteno de uma equao estimada
de tal forma que as distncias entre os pontos do diagrama e os pontos da curva do
modelo matemtico, no todo, sejam as menores possveis. Este mtodo denominado
de Mtodo dos Mnimos Quadrados (MMQ). Em resumo por este mtodo a soma de
quadrados das distncias entre os pontos do diagrama e os respectivos pontos na curva
da equao estimada minimizada, obtendo-se, desta forma, uma relao funcional
entre X e Y, para o modelo escolhido, com um mnimo de erro possvel.



CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


129
9.3.1 - Modelo linear de 1 grau (REGRESSO LINEAR SIMPLES)

O modelo estatstico para esta situao seria:
i i 1 0 i
X Y e + + =
em que:
Y
i

= valor observado para a varivel dependente Y no i-simo nvel da varivel


independente X.
0

= constante de regresso. Representa o intercepto da reta com o eixo dos Y.


1
X
= coeficiente de regresso. Representa a variao de Y em funo da variao de
uma unidade da varivel X.
i
e
= i-simo nvel da varivel independente X (i = 1, 2,..., n)
i

= o erro que est associado distncia entre o valor observado Yi e o
correspondente ponto na curva, do modelo proposto, para o mesmo nvel i de X.
Para se obter a equao estimada, vamos utilizar o MMQ (Mtodo dos Mnimos
Quadrados), visando a minimizao dos erros. Assim, tem-se que:
i 1 0 i i
X Y + = e
elevando ambos os membros da equao ao quadrado,
[ ]
2 2
i 1 0 i
X Y + =
i
e
aplicando o somatrio,
[ ]

= =
+ =
n
i
n
i
i
e
1
2
1
2
i 1 0 i
X Y (1)
Por meio da obteno de estimadores de
0
e
1
Para se encontrar o mnimo para uma equao, deve-se deriv-la em relao
varivel de interesse e igual-la a zero. A sua derivada segunda dever, obviamente,
ser positiva, o que no caso sempre ocorrer, por se tratar de uma soma de quadrados.
Derivando ento a expresso (1) em relao a
, que minimizem o valor obtido
na expresso anterior (1), possvel alcanar a minimizao da soma de quadrados dos
erros.
0
e
1
, e igualando-as a zero,
poderemos obter duas equaes que, juntas, vo compor o chamado sistemas de
equaes normais. A soluo desse sistema fornecer:
Captulo 9 Correlaes e Regresso Linear
_____________________________________________________________________
___________________________________________________________________________________


130
X
XY
2
n
1 i
i
n
1 i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
1
SQD
SPD
n
X
X
n
Y X
Y X
=

=
=
= =
=
e X Y
1 0

=
Uma vez obtidas estas estimativas, podemos escrever a equao estimada:
i 1 0 i
X Y

+ =

Exemplos:

1) Para verificar se existe relao linear de primeiro grau entre umidade relativa (UR) do
ar de secagem de sementes e a germinao das mesmas, um pesquisador realizou um
experimento com 4 valores diferentes para a %UR do ar, obtendo-se os seguintes dados
(dados hipotticos)
% UR 20 30 40 50
% Germinao 94 96 95 97

a) Obter as estimativas do
0
e do
1
b) Qual seria a equao ajustada?
considerando o modelo proposto?
c) Qual seria a % de germinao esperada quando UR = 45 %?

OBS.: veremos, mais tarde, como verificar a significncia da regresso.
R.: a)
0

= 92,7;
1

= 0,08 b) 95,5 %

2) Foi realizado uma anlise de regresso para investigar a existncia de relao linear
simples entre a temperatura superficial de uma estrada (X) medida em graus F e a
deformao da pavimentao (Y) medida segundo uma tcnica especial. Baseado nas
seguintes informaes pede-se:
n = 20;
i
y = 12,75;

2
i
y = 8,86;
i
x = 1478;

2
i
x =143215,8; e
i i
y x = 1083,67
a) Calcule as estimativas dos parmetros da regresso. Apresente a equao ajustada
num grfico?
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


131
b) Use a equao para estimar qual deformao haveria na pavimentao quando a
temperatura superficial fosse de 85 F?
c) Qual seria a mudana esperada na deformao da pavimentao para uma mudana
de 1 F na temperatura superficial?
d) Suponha que a temperatura seja medida em graus C ao invs de graus F. Qual seria
a nova equao ajustada resultante? Lembre-se: C = 5(F 32)/9.
e) Qual seria a mudana esperada na deformao da pavimentao para uma mudana
de 1 C na temperatura superficial?

9.4 - Teste de hiptese na regresso linear simples

Aps ajustar uma equao de regresso devemos verificar sua adequabilidade,
por meio de testes de hipteses para os parmetros do modelo e/ou a construo de
intervalos de confiana. Para tal intento precisamos da pressuposio adicional de que
os erros tenham distribuio normal.
Em outras palavras, a equao estimada obtida, apenas estabelece uma relao
funcional, entre a varivel dependente e a varivel independente, para representar o
fenmeno em estudo. Portanto a simples obteno da equao estimada no responde
ao pesquisador se a variao da varivel independente influencia significativamente na
variao da varivel dependente.
Para se responder a esta pergunta, necessrio realizar um teste estatstico para
as estimativas dos coeficientes da equao de regresso estimada. Um teste que pode
ser realizado para verificar tal fato o teste F da anlise de varincia. Portanto,
necessrio realizar uma anlise de varincia dos dados observados, em funo do
modelo proposto.
A anlise de varincia uma forma de dividir a varincia total em componentes
devidos regresso linear e ao resduo (erro). Essa partio obtida para atender ao
objetivo de verificar se a parte da variao total explicada pelo modelo
significativamente diferente de zero. Esse teste, todavia, para o modelo de regresso
linear simples, equivalente ao teste da igualdade do coeficiente de regresso a zero.
No caso especifico da anlise de varincia, as varincias so denominadas
especialmente por quadrados mdios (QM). A estatstica F da anlise de varincia
usada para testar se o modelo linear ajusta-se ou no aos dados.
Captulo 9 Correlaes e Regresso Linear
_____________________________________________________________________
___________________________________________________________________________________


132
As hipteses: H
0
:
1
= 0 versus H
a
:
1
0; esto relacionadas com a significncia
da regresso. No rejeitar H
0
equivalente a concluir que no h relao linear entre X
e Y. Por outro lado, se H
0
De maneira alternativa poderamos testar a significncia da regresso pelo
mtodo da Anlise de Varincia (ANOVA). Assim a seguinte identidade pode ser
verificada:
: 1 = 0 for rejeitado indicaria que X importante para explicar
a variabilidade em Y.
( ) ( ) ( )

+ =
2
i
2
i
2
i
Y Y Y Y Y Y


ou, em outra palavras,
SQTotal = SQRegresso + SQResduo,
onde
SQTotal = variao total em Y = SQDY
SQRegresso = variao em Y explicada pela regresso ajustada =
1

SPD
XY
SQResduo = SQRes = variao no explicada pela regresso = SQD
, de modo
que
Y
1

- SPD
XY
Baseado nessa identidade o seguinte quadro pode ser montado:
.
F.V. GL SQ QM F
Regresso p SQReg
QMReg =
SQReg
QMRes
QMReg

Resduo, ou Independente da
Regresso
p - n -
1
SQRes
1 n p
SQRes



Total n - 1 SQTotal

( )


=
n
Y
Y SQTotal
2
i 2
i

( )
n
Y
X Y Y SQReg
2
i
i i 1 i 0


+ =



A estatstica F obtida no quadro acima serve para testar a significncia da
regresso, ou seja, testar H
0
:
1
= 0 versus H
a
:
1
- regra de deciso: Se F
0.
calc
F(, 1, n-2) rejeita H

0

OBS.: Se regresso linear simples, e para H
0
:
1
= 0 temos que (t
calc
)
2
= F
calc

.
CRP 192 Iniciao Estatstica 2010/II
_____________________________________________________________________________
___________________________________________________________________________________


133
Exemplo: (Exemplo anterior) Para verificar se existe relao linear de primeiro grau
entre umidade relativa (UR) do ar de secagem de sementes e a germinao das
mesmas, um pesquisador realizou um experimento com 4 valores diferentes para a
%UR do ar, obtendo-se os seguintes dados (dados hipotticos)
% UR 20 30 40 50
% Germinao 94 96 95 97
a) Obter o quadro da ANOVA para checar a significncia da regresso, ou seja, se
existe efeito da UR do ar de secagem na % de germinao? Se necessrio use = 5%.

9.5 - Coeficiente de determinao

O coeficiente de determinao, tambm conhecido como R
2
, ou simplesmente r
2
O R

para o caso de regresso linear simples, fornece uma informao auxiliar ao resultado
da anlise de varincia da regresso, como uma maneira de se verificar se o modelo
proposto adequado ou no para descrever o fenmeno.
2
SQTotal
SQReg
R
2
=
obtido por:

O valor de R
2
O R
varia no intervalo de 0 a 1. Valores prximos de 1 indicam que o
modelo proposto adequado para descrever o fenmeno.
2

indica a proporo (ou porcentagem) da variao de Y que explicada
pela regresso, ou quanto da variao na varivel dependente Y est sendo explicada
pela varivel independente X.
9.6 - Lista de exerccios

1) Para estudar a relao entre Y (nmero total de horas necessrias montagem da
parte de uma estrutura) e X (nmero total de operaes de furar e rebitar), registraram-
se os dados da tabela abaixo.
Estudo A B C D E F G H I
X 236 80 127 445 180 343 305 488 170
Y 5,1 1,7 3,3 6,0 2,9 5,9 7,0 9,4 4,8


Captulo 9 Correlaes e Regresso Linear
_____________________________________________________________________
___________________________________________________________________________________


134
Para facilitar seus clculos considere as seguintes informaes:
i
y = 46,1;

2
i
y = 279,41;
i
x = 2374;

2
i
x = 786368; e
i i
y x = 14512,6

Pede-se:
a) Obter a equao de regresso ajustada para o modelo Y
i
=
0
+
1
x
i
+
i
b) Interpretar as estimativas obtidas dos parmetros da regresso?
?
c) A anlise de varincia (ANOVA) da regresso? [Apresente a hiptese a ser testada
pela ANOVA e realize o teste apropriado (use = 5%) para testar essa hiptese].
d) Calcular o coeficiente de determinao para o modelo ajustado. Faa a interpretao
apropriada para esse resultado? (R.: 79,9%)

2) Para o exemplo 2 dado no incio sobre regresso linear simples (aquele da
temperatura superficial de uma estrada (X) medida em graus F e a deformao da
pavimentao (Y), verifique se realmente existe uma relao linear significativa (use =
5%) entre X e Y, e reavalie as concluses obtidas para os itens daquele exerccio.

3) Adaptado dos dados existentes em algumas calculadoras de bolso. Um engenheiro
est interessado em avaliar o efeito da temperatura sobre o comprimento de certa pea
metlica. Para isso obteve cinco corpos de prova de mesmo comprimento inicial (certa
unidade de medida) e os submeteu a 5 temperaturas (C) diferentes. Os dados esto
apresentados abaixo.
Temperatura 10 15 20 25 30
Comprimento 1003 1005 1010 1011 1014

Pede-se: (use = 5% se necessrio)
a) Obter o diagrama de disperso dos dados;
b) Ajustar a equao de regresso baseado no modelo de uma regresso linear simples
e traar a reta no diagrama obtido em a;
c) Interpretar as estimativas dos parmetros obtidas;
d) Checar a significncia da regresso por meio da ANOVA;
e) Qual seria o comprimento esperado da pea quando a temperatura for igual a 40C?
f) (Calibrao) Qual deve ser a temperatura a ser usada para que o comprimento da
barra atinja 1009 unidades de medida?

Vous aimerez peut-être aussi