Académique Documents
Professionnel Documents
Culture Documents
Instituto de Matemática
Departamento de Estatística
PROBABILIDADE E ESTATÍSTICA
MAT02219
www.mat.ufrgs.br/~giacomo/
2
Exemplo 1: projeção da percentagem de votos para um candidato numa eleição.
Os três canteiros são expostos à mesma incidência de luz, tipo de solo, mas recebem adubos
diferentes. No final do experimento será medida a altura das plantas.
3
2 - ESTATÍSTICA DESCRITIVA
2.1. Definições
4
2.2. Escalas de mensuração
Exemplo 6: (Contra-exemplo):
X “Marca da tinta”,
Y “Cor da tinta”
1 branca; 2 preta; 3 prata ; 4 vermelha
As médias na tabela acima foram obtidas pelo EXCEL. Observe que as variáveis Y e Z não
são quantitativas, portanto não se poderia calcular média para estas. A média de 2,4 para Y
não tem interpretação, pois não faz sentido “cor média”!
5
Variáveis Quantitativas: expressam uma quantidade numérica, subdividem-se em:
Exemplo 7: número de defeitos num lote de 100 peças, números de falhas diárias numa
máquina, etc.
Regras:
(1a ) quando o primeiro algarismo a ser descartado for 0,1,2,3 ou 4 deverá ser
sumariamente abandonado (arredondamento por falta) e o último algarismo a permanecer
fica inalterado.
Exemplo 9:
6
Exemplo 10: arredondamentos em divisões podem causar grandes diferenças
5 5
(A) 263157,894737 (B) 250000
0,000019 0,00002
5
(C) 500000 diferença de 90% em relação a (A)
0,00001
Exemplo 11:
8
( A) 2,825 4056,4639174
8
( B) 2,83 4114,25763921
(C ) 2,82 3999,38180577
8
n
1 n2 n
1 3
5 5,37824
20 6,72749
50 7,1066833
100 7,244646
1000 7,37431
10000 7,387578
100000 7,388908
1E6 7,38904
1E8 7,389005595
1E11 7,38905609
1E12 1
7
2
Para n=1E12 1 n2 n 1 , pois a calculadora arredondou a fração soma para zero.
n
Considerações:
(1ª) Recomenda-se utilizar toda a precisão de sua calculadora, ou seja, utilizar o modo
standard (padrão). Arredondamentos somente para resultados finais. Resultados
intermediários devem ser armazenados nas memórias secundárias (variáveis).
A tecla 2ndf aciona a segunda função correspondente a uma tecla . Por exemplo,
pressionando-se a tecla ln o resultado será o logaritmo natural. Se for necessário calcular
a exponencial, deve-se pressionar a tecla 2ndf e depois ln.
8
2.4.1. Medidas de posição (tendência central)
Média aritmética
n
x x 2 xn
x
i 1
i
Na amostra: X 1
n n
x1 x 2 x N
xi
i 1
Na população:
N N
Exemplo 14: realize a soma dos seguintes quocientes, truncando-os em duas casas
decimais:
1 3 4 6 7 8 2 3 2
9 9 9 9 9 9 9 9 9
0,11 0,33 0,44 0,66 0,77 0,88 0, 22 0,33 0,22 3,96
Observe que o truncamento em cada fração resultou em erro na resposta final É mais
1 3 4 6 7 8 2 3 2 36
eficiente realizar uma única divisão, ou seja: 4.
9 9
Média geométrica
Na amostra: m g n x1 x 2 x n , xi 0 para i
Na população: g N x1 x2 x N , xi 0 para i
9
Média harmônica
n
Na amostra: mh n
, xi 0 para i
1
i 1 x i
N
Na população: h N
, xi 0 para i
1
i 1 x i
Observação: em uma seqüência harmônica o termo central entre dois termos é obtido
1
pela média harmônica. Por exemplo: a n , isto é, {1 1/2 1/3 .......}. Então,
n
2 1
a2
1 3 2
Observações:
(1ª) A média mais conhecida e utilizada é a aritmética, pois sua fórmula é mais simples,
além de não ficar restrita a valores positivos.
(2ª) Na expressão do cálculo da média harmônica, pode-se verificar que ela é definida
como sendo o inverso da média aritmética dos inversos.
(4ª) As três médias mantém a seguinte relação entre elas, desde que os valores sejam
positivos: X m g mh
10
mi xi é o momento de massa da i-ésima partícula
n n
i 1
mi é a massa total; i 1
mi xi é o momento de massa do sistema
n
X
i 1
mi x i
é o centro de massa do sistema
n
i 1
mi
11
mh 95,5663
1 1 1
27,614 44,073 719,519
11
Exemplo 17: um concurso público, para um certo cargo, consiste em uma prova, dividida
em quatro áreas. Cada área contém 20 questões. Para aprovação é preciso que o candidato
obtenha média harmônica ponderada no mínimo igual a 13. Um candidato apresentou o
seguinte desempenho:
3 17 3 7 2 16 1 14 118
X 13,11111
3 3 2 1 9
9
m g 9 17 3 7 3 16 2 141 12,21177 , mh 11,22935
3 3 2 1
17 7 16 14
Como a média harmônica do candidato foi inferior a 13, então ele não foi aprovado no
concurso. Note que se o critério de aprovação fosse pela média aritmética, então ele seria
aprovado!
x n 1 , se n é ímpar
2
Med =
(x n2 x n2 1 )
, se n é par
2
12
Exemplo 18:
(b) alturas em cm de seis pessoas: {180; 165; 175; 182; 177; 160}
A moda
Exemplo 19:
(a) dado o conjunto {1; 2; 2; 3; 3; 4; 4; 4; 7; 9; 15} a moda é Mo=4, pois este valor é o
mais freqüente.
Mo (1) =2 e Mo ( 2) =4
13
Observações: a mediana exige ordenação das categorias e, por sua vez, é indicada nas
seguintes situações:
(1ª) quando se deseja obter o ponto que divide o conjunto em duas partes de mesmo
tamanho.
Med=560; x 934,60
O peso de 2500 kg é dito uma observação estranha (outlier), e por isso elevou
consideravelmente o peso médio.
Nominal: moda
Ordinal: moda, mediana
Quantitativa discreta e contínua: moda, mediana e média
14
2.4.2. Medidas de dispersão (variabilidade):
h = xmax – xmin 0
As medidas mais utilizadas são a variância e o desvio padrão. Estas medidas têm
como ponto de referência a média aritmética.
Na amostra:
2 2 2 n 2
x
1 X x
2 X x
n X
i 1
x i X
S2 é a variância.
n 1 n 1
A variância é a soma dos quadrados das distâncias em relação à X :
15
Comparação de três amostras com mesma média aritmética:
n 2
2
x n X
i
Observação: Uma expressão alternativa é S 2 i 1 .
n 1
A variância, por ser um quadrado, não permite comparações com a unidade que
estamos trabalhando. Para se ter uma medida de variabilidade com a mesma unidade da
variável utiliza-se a raiz quadrada da variância, denominado de desvio padrão:
S S2 .
N
2
x i
Na população: 2 i 1
2 é a variância e 2 é o desvio padrão.
N
16
Observações:
(2ª) Em Mecânica a variância tem como interpretação o momento de inércia de uma massa,
em relação a um eixo perpendicular que passe pelo centro de gravidade (que é a média)
(3ª) o desvio padrão mede o grau de dispersão dos valores em torno da média, ou seja, é
variabilidade média (em unidades de medida) em torno da média aritmética.
h = xmax - xmin = 7-2=5 ; X 3,71435
S 2
5 2
6 2 7 2 4 2 14 3,71435
2
2,0659 ; S 1,4373
13
Cada observação pode ser escrita em função da média e do desvio padrão, por exemplo:
Solução:
2
n 10 , xf 63,5 , x f 403, 2628 ;
X 6,35 ; S 2 0,0042 ; S 0,064807 ; CV 1,020589%
17
2
2 403,3 10 6,35
S 0,00833333 ; S 0,09128709 ; CV 1,437592% , que é
9
S2
VR 100% , se X 0 .
2
X
S
CV
100% .
X
1,4373
Exemplo 23: em relação ao exemplo 21, CV 100% 38,6963%
3,7143
18
Propriedades das medidas
(i) y i xi c i , c R Y X c e S Y2 S X2
(ii) y i cxi i , c 0 Y c X e S Y2 c 2 S X2
(iii) y i cxi b i , c 0 , b R Y c X b e S Y2 c 2 S X2
x X
(iv) y i i i Y 0 e S Y2 1
SX
19
Distribuição de freqüências por ponto do número de irmãos dos alunos
No. de irmãos ( x ) No. de alunos ( f ) xf x2 f
0 7 0 0
1 21 21 21
2 8 16 32
3 5 15 45
4 4 16 64
5 3 15 75
6 2 12 72
Total 50 95 309
k k k 2
xi f i xi f i xi2 f i n X
X i 1
k
i 1
, S 2 i 1
n n 1
fi 1
i
sendo f i a freqüência absoluta (ou simples), que é o número de vezes que ocorre o valor
xi , e k o número de valores distintos no conjunto.
95
Exemplo 25: em relação ao exemplo acima, X 1,9 ; Mo=1; Med=1
50
2
2 309 50 1,9
S 2,6224 ; S 1,6194 ; CV=85%.
49
20
2.5.2. Distribuições de freqüências por classes (ou intervalos)
30 34 35 35,8 36,2 37,1 37,5 37,9 38 38,3 39 39,3 42,5 43,3 44,5
40 40,1 40,2 40,2 40,3 40,4 40,7 40,8 41 41,1 41,4 42 44,7 44,8 44,9
49,4 49 45,6 49,7 49,4 46 48 46,5 45,4 47,6 46,3 45,9 47,6 49,8 49,6
49,8 49,7 49,7 45,7 48,5 49,7 49,8 49,6 45,5 47,3 48,9 48,9 46,4 45,6 45
47 45,5 49,4 48,1 48,8 49,3 49,7 47,4 48,2 48,9 45,1 46,7 49,1 46 49,5
48,3 48,3 46,9 48,7 48,6 53,6 52,3 51,9 52 53,2 50,8 50,8 51,4 53,4 53,9
50,1 51,5 51,3 54,2 50,2 50,7 50,4 54,8 54 54 53,4 50,6 51,5 53,7 54,6
52,4 50,1 53,2 52,1 50,6 51,8 51 53,7 50,2 53,8 50,1 50,9 52 52,3 52,2
52,1 52,3 57,7 57,5 55,3 56,9 55,2 56,7 57,6 57,9 58,8 56,7 59,5 59,7 55,6
55,5 57,7 56,9 57,3 56,8 55 58 56 56,6 56,9 55,7 59,5 58,8 57,1 56,5
59,2 57,5 60,8 60,5 62,9 62,3 61,2 61,6 63,2 62,5 63,3 63,5 63,6 64,8 62,2
63,5 60,4 64,4 61 62,4 66 68
Por exemplo, com 5 classes e com amplitudes iguais a oito a tabela fica:
21
Algoritmo para a construção de uma tabela de distribuição freqüências por intervalos
(3º) Determinar a amplitude de cada classe. Sempre que possível manter todas as
amplitudes iguais. Para tanto, deve-se dividir a amplitude dos dados “h” pelo número de
h
classes “k”, arredondando para mais, ou seja, hi .
k
(4º) Contar o número de valores pertencentes a cada classe. As classes devem ser disjuntas
(sem intersecção). Em geral, utiliza-se a notação (|--- ), para indicar um intervalo fechado à
esquerda e aberto à direita. Também poderia ser utilizado o intervalo aberto à esquerda e
fechado à direita (---|), aberto de ambos os lados ( --- ) ou ainda fechado de ambos os lados
(|---|).
l k |------- Lk xk fk n frk 1 xk f k x k2 f k
Total ---- n ---- 1 ---- x i fi x 2
i fi
k é o número de classes
22
l i Li
xi é o ponto médio de classe
2
hi Li l i é a amplitude de classe
F1 f1 ; F2 f 1 f 2 ; ......; Fk f 1 f 2 f k n
fi
fri é a frequência relativa de classe, isto é, fri
n
Fr1 fr1 ; Fr2 fr1 fr2 ; ......; Frk fr1 fr2 frk 1
n
2 Fm 1
Med = l m hm
fm
23
lm o limite inferior da classe mediana
Moda pelo processo de King: O primeiro passo é localizar a classe modal, aquela
com maior freqüência absoluta.
f m 1
Mo = l m hm .
f
m1 f m 1
Exemplo 27: com relação ao exemplo 26, para a tabela com 5 classes:
2
8776 457840 172 51,02325
X 51,02325 ; S 2 58,82986 ; S 7,67006 ,
172 171
7,670101 n
CV 100 15,0325% . Uma vez que 117 86 então a classe mediana é
51,02325 2
86 39
46|-------54. Aplicando a fórmula: Med 46 8 50,82051 . A classe modal
78
24
Medidas descritivas para os dados não agrupados:
X 50,87034 ; Med= 50,5 ; Mo=49,7; S 2 52,6735 ; S 7,2576 CV 14,2668% .
N de Amplitude Med Mo S CV
classes X
5 8 51,02325 50,8205 50,55555 7,67006 15,0325%
8 5 50,98837 50,7143 48,5 7,13569 13,99478%
13 3,10 51,91234 49,2870 50 7,18284 13,83653%
Dados Não ----------- 50,87034 50,5 49,7 7,2576 14,2668%
agrupados
25
3 - FUNDAMENTOS DA PROBABILIDADE
Modelos Determinísticos:
Exemplo 3: leitura da tensão, em volts, em diferentes instantes: {124 126 127 120 127}.
26
3.2. Modelos Probabilísticos
EX6: lance uma moeda até que ocorra a face cara pela primeira vez
Notação: , .
1 {1,2,3,4,5,6}
2 {0,1,2,3}
4 {0,1,2,...., N }
5 t R : 0 t T
27
Tipos de espaços amostrais
Finito: 1 , 2 , 3 , 4
Infinito enumerável: 6
Não-enumerável: 5
Notação: A, B, C
A , B , C ,
Tipos de eventos:
A: “ocorre a face 6”
B: “ocorre face par”
C: “ocorre face superior a 6 ”
D: “ocorre face menor ou igual a 6”
28
(1º ) Evento união:
A B : “ocorre A e B simultaneamente”
29
3.4. Alguns resultados sobre a teoria dos conjuntos
(1º) A A A A A A
(2º) A B C A B A C
A B C A B A C
(3º) A A A
A Ø A A Ø Ø
(4º) A B
c
Ac B c A B
c
Ac B c A
c c
A
A: “ocorre pelo menos uma coroa”
B: “ocorre coroa no primeiro lançamento”
C: “ocorre cara no segundo lançamento”
A c , B c , B C , B C
Assim,
{CCC, KKK, CCK,CKC, KCC,KKC, KCK, CKK}
O experimento de lançar 3 moedas também tem o mesmo espaço amostral , sendo que cada
elemento é da forma : ( ________ _________ ________)
1ª moeda 2ª moeda 3ª moeda
30
A = { KKK, KKC, KCK, CKK,CCK,CKC,KCC}; B= { KKK, KCC, KKC, KCK}
1
são igualmente prováveis. P ( ) , , N # .
N
1
{1,2,3,4,5,6} , P (1) P (2) ..... P (6)
6
Observações:
(2ª) Uma probabilidade não tem unidade de medida. É um grau entre 0 e 1 (ou 0% e 100%).
31
rn ( A)
f r( n ) ( A) ,
n
Exemplo 9: Defina A como sendo a face resultante no lançamento da moeda foi cara.
n Resultado rn ( A) f r( n ) ( A)
1 C 1 1
2 C 2 1
3 K 2 2/3
4 C 3 3/4
.
.
.
32
Exemplo 9: axiomática de Kolmogorov
(1) P( A) 0, A
(2) P 1
(3) P A1 A2 P( 1 ) P( A2 ) , se A1 , A2 , , estiverem contidos em e
forem disjuntos dois a dois.
(1ª) P A C 1 P ( A) :
A A c P () P ( A) P ( A c ) P ( A c ) 1 P ( A)
(2ª) P 0 : P ( ) P ( c ) 1 P ( ) 1 1 0
(3ª) Se A B , então P( A) P( B) e P( B A) P( B) P( A) :
P A B C P A P B P C P A B P A C P B C P A B C
33
1
Exemplo 10: suponha que A,B,C sejam eventos tais que P(A) = P(B) = P(C) = ,
4
1
A B C B e P ( A C ) . Qual a probabilidade de que ao menos um dos
8
1 1 5
Solução: pela propriedade (6ª) , P ( A B C ) 3 , pois A B C
4 8 8
34
(1º) o número de amostras com reposição, considerando a ordenação, é N n . Amostras
diferem pela ordenação.
ANn
(3º) o número de amostras sem reposição, desconsiderando a ordenação é C Nn .
n!
N!
Também vale que C Nn ; n≤N
( N n)!n!
Exemplo 11: seja um conjunto 1, 2 , 3 e considere uma amostra de tamanho dois.
Então: N=3 e n=2.
( 1 , 1 ) ( 1, 2 ) ( 1, 3 ) ( 2 , 1 ) ( 2 , 2 ) ( 2 , 3 ) ( 3 , 1 ) ( 3 , 2 ) ( 3 , 3 ) ,
1 1 1
portanto:
P i , j 2
3 3 3
1 1 1 1
P i , j 2
3 2 6 A3
Note que no caso em que a ordem é desconsiderada, algumas pessoas respondem que
1 1 1
P i , j , que está errado, pois a soma de todas as probabilidades não será
3 2 6
1. Quando a ordem não é considerada, P i , j é multiplicada por n! , que é o número
de réplicas da amostra, isto é:
1 1 1 1
P i , j 2 2
3 2 3 C3
35
Isto acontece porque as réplicas, que eram do caso com ordenação, serão consideradas
iguais, como mostra a figura abaixo:
Solução:
35 34 33 32 31 25 24 23 15 14
5 3 2
C C C
35 25 15 120 6 2 0,094577978
10
C 75
75 74 73 72 71 70 69 68 67 66
3628800
10 10
C 35 C 25 C1510
10
10 10 0,0002254
C 75 C 75 C 75
36
3.9. Probabilidade condicional
P( A B)
, P( B) 0
P( A | B) P( B)
0, c.c.
37
Exemplo 13: extrair sem reposição, considerando a ordem das cores, duas bolas de uma
urna com 5 azuis e 3 brancas.
Para facilitar, faremos distinção apenas nas cores das bolinhas. Assim,
A31 A51 15
P ( B A) .
A82 56
Exemplo 14: outra maneira de resolver o Exemplo 12 (a). Note que algumas pessoas
responderiam que a solução é
35 34 31 25 23 15 14
, que está errada!, pois a ordem em que os
75 74 71 70 68 67 66
membros são formados não está fixada, ou seja, é preciso levar em conta todas as posições
dos membros dentro da comissão! A resposta correta é:
C 355 C 25
3
C152 10! 35 34 31 25 23 15 14
10
C 75 5!3!2! 75 74 71 70 68 67 66
0,094577978
38
10!
Note que é dito coeficiente trinomial.
5!3!2!
(1ª) 0 P( A | B) 1 :
(2ª) P ( A B ) P ( B ) P ( A | B )
P ( A B ) P ( A) P ( B | A)
P ( A B C ) P ( B C ) P A | B C P (C ) P ( B | C ) P ( A | ( B C ))
Exemplo 15: considere uma urna contendo 5 bolas brancas, 4 verdes e 3 pretas. Uma
pessoa retira, sem reposição, 3 bolas. Qual a probabilidade:
Solução: se fizermos distinção entre bolas de mesma cor, então a cardinalidade do espaço
amostral será A123 1320 . Logo, será um trabalho árduo escrever todo . Fazendo
distinção apenas das cores, {bbb, bbv, bvb, vbb, vpb, , ppp} , # 33 27 .
4 3 5
(a)
12 11 10
(b) Defina A o evento “ocorrem três cores diferentes”. Note que algumas pessoas
#A 6 2
responderiam que P( A) , que está errado! Este raciocínio somente valeria
# 27 9
se houvesse mesmo número de bolas para as três cores e, além disso, se o processo fosse
C 51 C 41 C 31 5 4 3 3
com reposição! O correto é 3
3! .
C12 12 11 10 11
39
C 51 C 72 C 52 C 71 C 53 5 7 6 5 4 7 5 4 3 37
(c) 3
3
3 3 3
C12 C12 C12 12 11 10 12 11 10 12 11 10 44
7 6 5 37
ou 1
12 11 10 44
P(vvv) 3 2
(d) Pvv | v
P (v ) 11 10
(1º ) B i B j Ø , i j
k
(2º) B i
i 1
(3ª) P ( Bi ) 0 , i {1,2,...., k}
k
P( A) i 1 P( Bi ) P( A | Bi )
40
Prova:
A A B1 A B A B . Assim,
2 k
P ( B1 ) P ( A | B1 ) P ( B2 ) P ( A | B2 ) P ( B k ) P ( A | B k )
P( A | B j ) P( B j )
P( B j | A) k
, j 1,2,....., k .
P( A | B ) P( B )
i 1
i i
Prova: P( B j | A)
P A B j P( A | B j ) P( B j )
k
P( A)
P( A | B ) P( B )
i 1
i i
Exemplo 16: Numa fábrica de parafusos, as máquinas A,B,C produzem 25, 35 e 40 por
cento do total produzido, respectivamente. Da produção de cada máquina, 5, 4 e 2 por
cento, respectivamente, são defeituosos. Escolhe-se ao acaso um parafuso e verifica-se
que ele é defeituoso. Qual a probabilidade de que o parafuso seja oriundo das máquinas:
41
Solução:
P ( D) P ( A D) P ( B D) P (C D)
P ( A) P ( D | A) P ( B ) P ( D | B ) P (C ) P ( D | C )
0,25 0,05 0,35 0,04 0,40 0,02 ,0345
P( A) P( D | A) 0,25 0,05
P ( A | D) 0,3623
P( D ) 0,0345
P( B) P( D | B) 0,35 0,04
P ( B | D) 0,4058
P( D ) 0,0345
42
P (C ) P ( D C ) 0,40 0,02
P (C D ) 0,2319
P ( D) 0,0345
(2º) P ( A B C ) P ( A) P ( B ) P (C ) .
Observação: eventos mutuamente disjuntos não têm nenhuma relação com eventos
mutuamente independentes.
Exemplo 17: A finalidade deste exemplo é mostrar que extração de amostras com
reposição possui a propriedade de independência probabilística, mas se o processo for sem
reposição não haverá independência. Suponha uma urna contendo 7 bolas vermelhas e 5
bolas pretas. Considere o experimento aleatório de extrair 4 bolas ao acaso. Descreva o
espaço amostral com as respectivas probabilidades, nos casos com e sem reposição. Na
extração sem reposição considere a ordenação interna da amostra.
43
Solução:
(1ª) com reposição: se fizermos distinção entre bolas de mesma cor então a cardinalidade
do espaço amostral será # 12 4 20736 . Logo, será um trabalho árduo escrever todo
. Se não fizermos distinção entre bolas de mesma cor então
{vvvv, vvvp, vvpv,....., pppp} , ou seja, # 2 4 16 .
4
7 7 7 7 7
P (vvvv) P (v ) P (v | v) P (v | vv ) P (v | vvv)
12 12 12 12 12
P (v ) P (v ) P ( v ) P (v )
3
7 7 7 5 7 5
P (vvvp) P (v ) P (v | v) P (v | vv ) P ( p | vvv)
12 12 12 12 12 12
P (v ) P (v ) P ( v ) P ( p )
3
7 5
P (vvpv ) P (vpvv) P ( pvvv) P (vvvp)
12 12
4
5 5 5 5 5
P ( pppp ) P ( p) P ( p | p ) P ( p | pp) P ( p | ppp )
12 12 12 12 12
P ( p) P ( p ) P ( p) P ( p )
(2ª) sem reposição: agora neste tipo de extração a mesma bola não pode aparecer mais que
uma vez.
4
7 6 5 4 A7
P (vvvv) P (v ) P (v | v) P (v | vv) P (v | vvv) 4
12 11 10 9 A12
4
7
P (v ) P (v ) P (v ) P (v )
12
44
P(vvpp ) P(vppv ) P( pvvp) P(vpvp) P( pvvp ) P( pvpv)
E “o sistema funciona”
A probabilidade de Ai funcionar é p
P ( E ) P A1 A2 P A1 P A2 p p p 2
P ( E ) P A1 A2 P A1 P A2 P A1 A2 p p p p 2 p p 2
45
(c) três componentes em sistema misto
P ( E ) P A1 A2 P A1 A3 P A1 A2 A1 A3 p 2 p 2 p 3 2 p 2 p 3
46
4 - VARIÁVEIS ALEATÓRIAS DISCRETAS
Definição: uma v.a X é dita discreta quando o conjunto dos valores possíveis de X é
finito ou infinito enumerável.
47
4.2. Função massa de probabilidade (fmp)
f : X [0,1] ; xi f ( xi ) P( X xi )
(1ª) 0 f ( xi ) 1 , x i X
(2ª) x i X
f ( x i ) 1 ,
(3ª) f ( x i ) 0 se x i X
Exemplo 2: seja X o número de faces cara em 3 lançamentos de uma moeda tal que
3 1
P (C ) e P( K ) .
4 4
xi 0 1 2 3
f ( xi ) 1/64 9/64 27/64 27/64 1
1 1 1 1
f (0) P ( X 0) P ( KKK )
4 4 4 64
f (1) P ( X 1) P (CKK ) ( KCK ) ( KKC )
3 3 3 9
P (CKK ) P ( KCK ) P ( KKC )
64 64 64 64
f (2) P ( X 2) P (CCK ) ( KCC ) (CKC )
9 9 9 27
P (CCK ) P ( KCC ) P (CKC )
64 64 64 64
3 3 3 27
f (3) P ( X 3) P (CCC )
4 4 4 64
48
Representação gráfica da fmp do exemplo 2
notações: E ( X ), , EX
Observações:
(1ª) A esperança matemática é a média da população, enquanto X é a média da amostra,
ou seja, uma estimativa de EX.
49
Marca A Marca B Marca C
Propriedades da Esperança:
(3ª) E (aX b) aE ( X ) b, a, b R
(4ª) E ( X Y ) E ( X ) E (Y )
n n
(5ª) E (i 1 X i ) i 1 E ( X i )
Definição: Seja X v.a discreta com f.m.p f e espaço amostral X {x1 , x 2 ,......} .
Definimos a variância de X por
2
Var ( X ) x x i EX f ( xi ) .
i X
50
Observações:
(2ª) Var ( X ) 0 .
(4ª) o DP (desvio padrão) tem mesma unidade de medida que a v.a. X , e mede o grau de
dispersão dos valores de X em torno de EX .
Exemplo 4:
xi 0 1 2 3
f ( xi ) 1/8 3/8 3/8 1/8 1
2
24 3 3
E ( X ) 1,5 , Var ( X ) ,
8 2 4
3
DP( X ) e CV 57,735% .
4
Propriedades da variância
51
4.5. Modelos probabilísticos discretos
={cara, coroa}
P X 1 0,5 e P X 0 0,5 .
52
Sendo X 1 , X 2 ,...., X n v.a’s. independentes e identicamente distribuídas segundo
n
uma Bernoulli de parâmetro p , então X i 1 X i é dita binomial de parâmetros n e p .
fmp: f ( x, n, p ) C nx p x q n x , x 0,1,2....., n
n
n n
EX E i 1 X i i 1 E ( X i ) i 1 p np
VarX np(1 p )
53
P ( X 2) P ( X 0) P ( X 1) P ( X 2)
(b)
C 50 0,40 0 0,60 5 C 51 0,401 0,60 4 C 52 0,40 2 0,60 3 0,68256
P (2 X 5) P ( X 2) P ( X 3) P ( X 4)
(d)
C 52 0,40 2 0,60 3 C 53 0,40 3 0,60 2 C 54 0,40 4 0,601 0,6528
1
fmp: f ( xi ) , i {1,2....., N } .
N
xi i X {1,2,....., N }
caso particular: 1
f (i ) N
Notação: X ~ Unif ( N )
54
N 1 ( N 2 1)
Esperança e variância de uma Uniforme discreta: EX ; Var ( X ) .
2 12
x 1 2 3 4 5 6
f (x ) 1/6 1/6 1/6 1/6 1/6 1/6 1
6 1
E( X ) 3,5
2
Face 1 2 3 4 5 6 Total
No. ocorrências 4 4 5 4 3 4 24
1 4 2 4 3 5 4 4 5 3 6 4 82
X 3, 416666
24 24
C rx C Nnxr
f.m.p: f ( x , N , n, r ) P ( X x ) , x {0,1,...., min( n, r )} .
C Nn
Notação: X ~ H ( N , n, r )
55
Esperança e variância de uma Hipergeométrica:
N n r
E ( X ) np , Var ( X ) np (1 p) , p
N 1 N
r
Observação: para N e mantendo p constante, a fmp de uma hipergeométrica
N
converge para a binomial . Logo, para uma população grande, os processos com e sem
reposição ficam muito próximos.
X {0,1,2,3,4} ; N 25 , n 5 e r4
40
Usando a aproximação pela binomial, com p 0,16 :
250
56
4.5.4. Modelo de Poisson
(1º) no. de chamadas telefônicas recebidas por um PBX durante um período de tempo.
e t (t ) x
fmp: f ( x, t ) , x 0,1,2,.......
x!
Notação: X ~ Pois(; t )
57
Gráfico da fmp de uma Poisson
Exemplo 13: Numa central telefônica chegam 300 chamadas por hora. Qual a
probabilidade de que:
300
5 é o número esperado de chamadas em 1 minuto ( t 1 )
60
(a) P( X 0) e
0 e 5 0,00673
0!
8
2 2
8
10 10
(b) P( X 8) e e 0,1126
8! 8!
P ( X 2) 1 P ( X 2) 1 P ( X 1) 1 P ( X 0) P ( X 1)
(c) 2,50 2,51
1 e 2 ,5 1 3,5 e
2 ,5
1 0,2873 0,7127
0! 1!
58
5 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS
(1º) f ( x ) 0 , x R
(2º) f ( x)dx 1
b
(3º) para a b , P (a X b) f ( x )dx
a
Observações:
59
Exemplo 1: : um cano cilíndrico para escoamento de água tem raio 2 cm e comprimento
10 cm.
O volume de água que escoa pelo cano é dado por V 2 2 10. A taxa de
água que passa pelo cano no intervalo [0, x] , 0< x<10, é a derivada do volume, ou
seja, g ( x ) 2 2. A função g não é densidade de probabilidade, pois
. Mas, é f.d.p.
A percentagem de volume de água que passa pelo cano, no intervalo [0, x],
0< x<10, é .
x
F : R [0,1] F ( x) f ( y)dy P X x ,
onde f é f.d.p
Propriedades:
d
(3ª) f ( x) F ( x) se F for derivável em x
dx
0 se F não for derivável em x
60
Exemplo 2: seja a função a seguir
Solução:
1
2 1
(a) 2 xdx x 0 1
0
(b)
x x
x 0: F ( x) f ( y )dy 0dy 0
x 0 x
2 x
0 x 1: F ( x) f ( y)dy 0dy 2 ydy y 0 x2
0
x 0 1 x
2 1
x 1 : F ( x) f ( y)dy 0dy 2 ydy 0dy y
0 1
0 1
Nota: em x 1 ,
F ( x ) F (1) 1 1 0
lim x 1 lim x 1 lim x 1 0
x 1 x 1 x 1
,
F ( x ) F (1) x 2 1
lim x 1 lim x 1 lim x 1 ( x 1) 2
x 1 x 1
61
(c) P ( X 0,6) F (0,6) 0,6 2 0,36 , P ( X 0,4) 1 F (0,4) 1 0,4 2 0,84
P (0,2 X 0,5) F (0,5) F (0,2) 0,5 2 0,2 2 0,21
Esperança: EX xf ( x)dx
condição de existência: E | X | | x | f ( x)dx
Variância: Var ( X ) ( x EX ) 2 f ( x)dx E ( X 2 ) ( EX ) 2 , onde E ( X 2 ) x
2
f ( x)dx
condição de existência: E | X | 2
Exemplo 3: o conteúdo de cinzas (em percentagem) no carvão pode ser considerado uma
variável aleatória contínua com f.d.p :
1
x 2 ;10 x 25
f ( x ) 4875
0; c.c.
62
O conteúdo de cinzas esperado em um particular espécime de carvão é:
25
1
E( X ) x 2 f ( x)dx 19,5 por cento.
4875 10
1
x2 1 x3 1
Solução: f ( x )dx 6 0 0 1
0 2 3
1
x3 1 x4 1 1 1
EX xf ( x )dx 6 0 0 6 ;
0 3 4 12 2
1
x4 x5 6 1
E ( X 2 ) x 2 f ( x )dx 6 1
0 1
0 ; Var ( X )
0 4 5 20 20
63
5.4. Modelos probabilísticos contínuos
Notação: X ~ U [a, b]
64
Esperança e variância
b
1 x2 b b 2 a 2 (b a)(b a ) a b
EX x dx a
a
ba 2(b a ) 2(b a) 2(b a ) 2
(b a) 2
V ar ( X )
12
ALEATORIO( )
Exemplo 6: considere um relógio circular de ponteiros. O relógio pode parar, por falta de
bateria, em qualquer quadrante. Defina X o ângulo formado pelo ponteiro maior quando
o relógio parar. Determinar:
(a) fdp (b) fda (c) probabilidade do ponteiro parar entre -90 e 0 graus
Solução:
0, x 360
1 x 360
, 360 x 0
(a) f ( x ) 360 (b) F ( x ) ,360 x 0
0, c.c. 360
1, x 0
65
5.4.2. Modelo Exponencial
0, x 0
Função densidade de probabilidade: f ( x, ) x ; 0
e , x 0
Notação: X ~ Expon( )
66
0, x 0
Função de distribuição acumulada: F ( x, ) x
1 e , x 0
1 1
Esperança e variância da exponencial: EX , Var ( X ) 2 .
(a)
P (300 X 600) F (600) F (300) 1 e 600 1 e 300 e 0, 6 e 1, 2 0,247617
1
(b) A media de X é 500 . Assim,
P ( X 500) 1 F (500) 1 1 e 500 e 1 0,367879
67
5.4.3. A distribuição Normal (Gaussiana)
1 1 x 2
Função densidade: f ( x, , ) exp , x ;
2 2 2
; (0,)
Notação: X ~ N ( , ) .
(1ª) f ( x ) 0 .
(2ª) A área sob a densidade f é igual a 1. Para mostrar isto faz-se mudança para
coordenadas polares.
68
(3ª) Para três distribuições normais X 1 , X 2 , X 3 de mesmo parâmetro , se 1 2 3 ,
então a v.a X 3 é mais leptocúrtica (afinada) que X 2 e por sua vez X 2 é mais leptocúrtica
que X 1 .
(5ª)
(6ª) EX Md Mo ; Var ( X ) 2 .
69
X
(7ª) Se X ~ N ( , ) então Y a bX ~ N (a b ; | b | ) e Z ~ N (0;1) .
z
1 v2
( z ) exp dv .
2 2
Propriedades de
70
a X b a b b a
P(a X b) P P Z
71
Exemplo 10: Seja Z ~ N (0;1)
Exemplo 11: os depósitos efetuados por clientes de um banco têm distribuição normal
com média 100,00 e desvio padrão 15,00 unidades monetárias. Um cliente é selecionado
ao acaso. Qual a probabilidade de que o depósito efetuado por ele seja:
(b)
X 100,00 110,00 100,00 2
P X 110,00 P P Z
15,00 15,00 3
1 (0,67) 1 0.7486 0, 2514
(c)
120,00 100,00 X 100,00 150,00 100,00
P 120,00 X 150,00 P
15,00 15,00 15,00
P 1,33 Z 3,33 (3,33) (1,33) 0.9996 - 0.9082 0,0914
(d)
X 100,00 140,00 100,00
P X 140,00 P P Z 2,67 1 (2,67)
15,00 15,00
1 0.9962 0,0038
72
Tabela da Normal Padrão Inversa: 1 : fornece as coordenadas tais que z 1 ( ) ,
ou seja:
P( Z z ) (áreas unilaterais superiores)
2
Solução:
(a)
z 1,96
73
Também poderá utilizar a tabela da normal inversa, com a área unilateral de 0,025, como
mostra a figura abaixo:
(b) Neste caso não encontraremos a área 0,95 na tabela da normal padrão. Isto acontece
porque a tabela é limitada em duas decimais para as coordenadas. O valor exato, usando
o computador, é z 1,64485362695 .
1,64 1,65
z 1,645 . Também poderá utilizar a tabela inversa da normal padrão, cujo
2
valor da coordenada é z=1,6445.
74
(c) Neste caso, a área deseja é a cauda inferior. Pela tabela da normal inversa, obtemos
z = 2,3263, e portanto - z = -2,3263.
Exemplo 13: as alturas de 10000 alunos de uma escola têm distribuição normal de média
170 cm e desvio padrão 5cm.
(a) qual o número esperado de alunos com altura superior a 165 cm?
(b) qual o intervalo simétrico em torno da média que conterá 75% das alturas dos alunos?
75
(b) Temos que encontrar k tal que
Pela Tabela Inversa da Normal Padrão, para área bilateral de 0,25, obtêm-se que
k 1,15 . Portanto, o intervalo em torno de é
76
6 - AMOSTRAGEM E ESTIMAÇÃO DE PARÂMETROS
Definição: um parâmetro é uma medida usada para descrever uma característica numérica
da população.
Definição: uma estatística (ou estimador) é uma característica numérica da amostra, isto é,
uma estatística T é uma função de T f X 1 , X 2 , , X n .
n
X
i 1
i
Exemplo 4: P , onde X i 1, se for RH+
n
= 0, se for RH-
Nota: uma vez que T é função de v’as, então também será aleatória.
25
Exemplo 5: numa amostra de 30 pessoas, 25 tem RH+. Assim, p 0,83 .
30
77
Notações usuais:
Amplitude H h
Proporção P p
Correlação R r
2
Exemplo 8: como E ( X ) e lim n 0 , então X é consistente.
n
78
Exemplificação de quatro estimadores onde foram feitas 18 observações
Estimação por intervalo: a estimação por ponto não permite julgar a magnitude do erro
que estamos cometendo. Daí surge a idéia de construir os intervalos de confiança, que são
fundamentados na distribuição amostral do estimador.
P I .C .
79
Construção de intervalos de confiança: o teorema a seguir é o alicerce dos Intervalos de
Confiança.
Tn E (Tn )
n
Zn N (0,1)
Var (Tn )
X E X
P z tab z tab 1 P X z tab X z tab 1 ,
n n
Var X
80
Assim, o intervalo de confiança para , de grau (1 ) 100% , é dado por
IC X , onde z tab
é dito erro de estimação (ou erro amostral).
n
Exemplo 9: suponha que se esteja estudando a altura de pessoas numa certa população.
Sabe-se que =15. A amostra de 100 indivíduos resultou em x =170 . Construa
intervalos de confiança para a média populacional com:
solução:
15 15
(a) 170 1,645 ;170 1,645 167,54;172,46
100 100
15 15
(b) 170 1,96 ;170 1,96 167,06;172,94
100 100
15 15
(c) 170 2,575 ;170 2,575 166,14;173,85
100 100
81
Interpretação do Intervalo de Confiança: espera-se que (1 ) 100% dos
intervalos originados de amostras de mesmo tamanho contenham o parâmetro .
Observações:
(1ª) Não se utiliza grau de confiança igual a 100%, pois neste caso o intervalo fica a
própria reta real! De fato, para que P z tab Z z tab 1 , então é preciso que
z tab .
(3ª) Não existe um valor ideal para o grau de confiança. Nunca se deve utilizar os
extremos 0% e 100%. Os valores mais usuais são 0,99; 0,95 e 0,90, mas não há uma
justificativa formal para usá-los, são apenas valores de referência mais encontrados em
artigos e livros.
82
6.4.2. IC para a média populacional quando o desvio padrão é
desconhecido
A distribuição t-student:
Foi introduzida por William Gosset, que utilizou o pseudônimo “um estudante”.
Essa distribuição aparece quando substituímos o desvio padrão pelo respectivo
estimador S . A t-student é similar à normal padrão, isto é, e simétrica em torno do zero e
tem a forma de um sino, sendo mais baixa (achatada) que a normal. Além disso, a t-student
converge à normal padrão.
83
Em inferência estatística esse parâmetro assume valores inteiros positivos e tem a
denominação de “graus de liberdade”. O conceito de graus de liberdade (GL) é o número de
valores que poderemos atribuir de maneira arbitrária. Por exemplo, suponha que temos três
parcelas, cujos valores devem ser não negativos e somarem 14:
4 + 7 + = 14
Então, teremos a “liberdade” de atribuir apenas dois valores, pois o último ficará
“amarrado” (determinado).
A tabela da t-student é tal que se você entrar com GL=n-1 e a área, você obterá a
coordenada. Para GL maior que 120, utiliza-se a normal padrão.
84
Modelo de Tabela t-student
S
IC X t tab , onde t tab é tal que P (| T | t tab ) , T ~ t (n 1)
n
100 100
Solução: IC = 800 2,7564 ;800 2,7564 749,68;850,31
30 30
85
6.4.3. IC para a variância populacional 2
86
Modelo de Tabela Qui-Quadrado
(n 1) S 2 (n 1) S 2
O intervalo de confiança para a variância é: IC , , onde
qsup qinf
(n 1) S 2 (n 1) S 2
O intervalo de confiança para o desvio padrão é: IC ,
qsup qinf
Exemplo 11: O setor de qualidade de uma indústria de parafusos deseja estimar a variação
dos comprimentos de parafusos produzidos. Obtenha intervalo de confiança de grau 95%
para . A amostra foi a seguinte: 12,2 12,4 12,1 12,0 12,7 12,4 14,0 13,7 13,9 14,1
13,9 13,7 13,5 12,2 12,5 13,6.
Solução: x 13,05625 s 2 0,634624 s 0,796633
15 0,634624 15 0,634624
IC ; 0,58848;1,23295
27,4884 6,2621
87
6.4.4. IC para a proporção populacional
P (1 P )
IC P z tab onde P é a proporção amostral e z tab é tal que
n ,
21 ( z tab ) .
{1; 0; 1; 1; 1; 1; 0; 0; 1; 1; 0; 0; 0; 0; 0; 1; 0; 0; 1; 0}
1 “a favor”; 0 “contra”
9
Solução: p 0, 45
20
Estimação da média
Vimos que para a média populacional, I .C. X , X , onde
z tab é o erro de estimação absoluto. Isolando n nesta última equação obtemos
n
o tamanho da amostra:
2
2
população infinita: n z tab 2 , onde z tab é tal que 21 ( z tab ) .
n N
população finita: m .
Nn
88
Observações:
(1ª) se for desconhecido então utiliza-se algum valor já utilizado em uma pesquisa
semelhante que já foi realizada, ou realiza-se uma pesquisa incial (amostra piloto) para
obter uma estimativa.
(2ª) O tamanho da amostra n e o erro de estimação tem relação inversa, como mostra
a figura:
Exemplo 13: deseja-se estimar a renda dos moradores do bairro da Gávea , no Rio de
Janeiro, sabendo-se que o desvio padrão da renda é de 300,00. Exige-se um erro absoluto
máximo de 20,00 e um grau de confiança de 95%. Qual deve ser o tamanho da amostra?
1,96 2 300 2
Solução: n 864,36 865
20 2
5000 864,36
Supondo N=5000, m 736,96 737
5000 864,36
89
Estimação da proporção
2 (1 )
população infinita: n z tab , onde z tab é tal que 21 ( z tab ) .
r2
n N
população finita: m .
Nn
Observações:
(1ª) o erro de estimação para a proporção está em termos relativos, visto que uma
proporção é uma medida relativa (sem unidade de medida).
(2ª) Se for desconhecida, pode-se utilizar alguma estimativa de uma pesquisa anterior.
Também pode-se assumir o maior valor possível (1 ) 0,25 . Desta forma,
ztab 2 0,25
n .
r2
Exemplo 14: Uma amostra preliminar de 50 famílias foi selecionada de N=4000 famílias.
Constatou-se que na amostra 30 famílias possuíam renda superior a 1000,00. Qual deve ser
o tamanho da amostra, com grau de confiança de 99% e erro de estimação máximo de 5%?
Solução:
30
p 0,6 ; z tab 2,575
50
2
n
2,575 0,6 0, 4
636,54 637 ; m
4000 636,54
549,15 550
2
0,05 4000 636,54
2
Se usarmos (1 ) 0,5 0,5 0,25 , n
2,575 0,25
663,06 663 e m 569
0,05 2
90
7 – TESTES DE HIPÓTESES
7.1. Definições
Hipóteses : B = C e B < C
Hipóteses estatísticas
91
Exemplo 2: suponha um julgamento num tribunal
Observações:
(2ª) Fisher, um dos precursores da Teoria Estatística, usou o valor de 5% para facilitar o
ensino da Teoria, e por isso ficou como um valor “consagrado”.
H0 : 0 H1 : 0 (bilateral)
0 (unilateral à esquerda)
0 (unilateral à direita).
92
(2ª) Fixar o nível de significância do teste.
Observações:
(a) conhecido
H 0 : 0
X 0
estatística do teste: z c n
93
Observações:
(1ª) se for grande, a estatística z c não será sensível o bastante para detectar diferença
significante entre X e 0 .
(2ª) aumentando a amostra, o teste ficará mais sensível para detectar diferenças
significativas.
(3ª) O teste unilateral é mais rigoroso que o bilateral. Na figura abaixo, o valor tabelado do
(u ) (b )
teste unilateral é menor que no bilateral. Se z tab z c z tab , então o teste unilateral irá
rejeitar a hipótese nula, mas o bilateral não.
94
(4ª) Para ∝ fixado, z tab também ficará fixado. Variando os valores de 0 , pode-se
“manipular” z c de maneira que leve à aceitação ou rejeição de H 0 .
95
Exemplo 3: uma linha de produção fabrica parafusos cujo diâmetro tem desvio padrão
1,22716 . Tomou-se uma amostra de tamanho 20, cujas estatísticas foram x 3,735 e
s 3,8756 . Com 0,05 , teste H 0 : 5 contra
(a) H 1 : 5 (b) H 1 : 5
Solução:
3,735 5
zc 20 4,61
1,22716
(c) Temos que encontrar um - z tab tal que z c z tab . Note que z tab 4,65 leva-nos à
aceitação! Mas, P ( Z z tab ) 0,000001659 , que é um absurdo!
96
Mês X1 X2 X3 X4 X5 Média
1 0,65 0,7 0,65 0,65 0,85 0,7
2 0,75 0,85 0,75 0,7 0,65 0,74
3 0,75 0,72 0,8 0,7 0,75 0,744
4 0,6 0,7 0,7 0,75 0,65 0,68
5 0,7 0,75 0,65 0,8 0,8 0,74
6 0,6 0,75 0,75 0,85 0,7 0,73
7 0,75 0,8 0,65 0,75 0,7 0,73
8 0,6 0,7 0,8 0,75 0,75 0,72
9 0,65 0,8 0,85 0,74 0,75 0,758
10 0,6 0,7 0,6 0,8 0,65 0,67
11 0,8 0,75 0,7 0,76 0,7 0,742
12 0,85 0,75 0,79 0,65 0,7 0,748
13 0,7 0,7 0,75 0,75 0,7 0,72
14 0,65 0,7 0,85 0,75 0,6 0,71
15 0,74 0,75 0,74 0,75 0,79 0,754
16 0,75 0,9 0,92 0,8 0,65 0,804
17 0,69 0,9 0,8 0,93 0,88 0,84
18 0,78 0,88 1,02 0,98 1,03 0,938
19 1 1 1,02 0,98 1,04 1,008
20 0,99 1,01 1,02 0,99 1,04 1,01
21 1,03 1,05 1,06 0,99 1,03 1,032
22 1,06 1,07 1,09 1,1 1,1 1,084
23 1,08 1,08 1,1 1,12 1,14 1,104
24 1,1 1,12 1,15 1,13 1,14 1,128
25 1,12 1,14 1,16 1,18 1,2 1,16
97
Xi ; i=1,2,3,4,5 são as cinco medidas observadas para cada mês
0,07 0,07
0,70 1,96 0,64 e 0,70 1,96 0,76
5 5
Como se pode observar pelo gráfico, a partir do 16º mês as médias amostrais
começam a “cair” fora da “banda” de segurança (confiança) evidenciando claros
indícios de que o processo está fora da especificação.
(b) desconhecido
H 0 : 0
X 0
Estatística do teste: t c n
S
98
Exemplo 5: em relação ao Exemplo 3, vamos supor que era desconhecido. Use
0,05 .
3,735 5
Solução: t c 20 1,4597
3,8756
3,8756
Nota: como CV 100% 103,76% é elevado, o teste não foi sensível o
3,735
bastante para detectar diferença significativa!
99
7.3.2.Teste de hipóteses para a proporção de uma população
H 0 : 0
P 0
Estatística do teste: z c n , sendo P a proporção amostral.
(1 )
0 0
Exemplo 6: uma estação de TV afirma que 60% dos televisores estavam ligados no seu
programa especial de sábado. Uma rede concorrente deseja contestar essa afirmação, e
decide entrevistar 200 domicílios. Desses 200, 104 deram respostas afirmativas. Teste a
hipóteses H 0 : 0,6 e H 1 : 0,6 , com : (a) 0,01 (b) 0,05 .
0,52 0,6
Solução: z c 2,31
0,24
200
100
7.3.3. Teste de hipóteses para a igualdade de médias de duas populações
H 0 : X Y
XY
Estatística do teste: z c , n é o tamanho da amostra para X e m para Y
2 2
X Y
n m
Exemplo 7: deseja-se verificar se duas máquinas de empacotar café são homogêneas com
relação ao peso neto. Sabe-se, pelo manual das máquinas, que o desvio padrão de ambas é
X Y 20 gramas. Foram obtidas amostras de 60 unidades para cada máquina.
Teste se a média da máquina X é significativamente maior que a de Y, utilizando
0,10 .
Estatísticas X Y
Média 500,01 g 497 g
Amostra 60 60
Solução: H 0 : X Y contra H 1 : X Y
500,01 497,00
zc
2 2 0,8243 ; z tab 1,2816
20 20
60 60
101
(b) desvios padrões populacionais desconhecidos
H 0 : X Y
X Y (n 1) S X2 (m 1) S Y2
Estatística do teste: t c , S
1 1 nm2
S
n m
Exemplo 8: duas técnicas de vendas são aplicadas por duas equipes de vendedores: a
técnica A por 12 vendedores e a B por 15. No final de um mês obtiveram-se os seguintes
resultados:
Estatísticas A B
Média 68 76
Variância 50 50,8
Amostra 12 15
Solução: H 0 : B A contra H1 : B A .
14 50,8 11 50 76 68
s 7,1026 ; t c 2,908 ; t tab 1,7081
25 1 1
7,1026
15 12
102
7.3.4.Teste de hipóteses para a igualdade de proporções de populações
H 0 : X Y
PX PY
Estatística do teste: z c , PX , PY são as proporções amostrais
PX (1 PX ) PY (1 PY )
)
n m
Solução:
0,05 0,052
zc 0,092
0,05 (1 0,05 ) 0,052(1 0,052)
200 210
(a) Para teste unilateral à esquerda, com 0,05 , aceita-se H 0 , pois z tab 1,645 .
(b) Mas, qual valor de levaria à rejeição de H 0 ? Temos que encontrar um z tab tal que
z c z tab . Note que z tab 0,09 leva-nos à rejeição. Mas,
P( Z 0,09) 0,4641 0,4641 , que é um absurdo!
103
7.4 – Significância amostral
104
Exemplo 10: teste a hipótese de que o diâmetro médio de parafusos seja de 57 mm.
Diâmetro 56,5 56,6 56,7 56,8 56,9 57 57,1 57,2 57,3 Total
Freqüência 1 2 2 4 10 5 4 2 1 31
Solução: H 0 : 57 contra H 1 : 57
x 56,9161 s 0,18275 ;
105
8 – CORRELAÇÃO E REGRESSÃO LINEAR
O diagrama de dispersão nos fornece uma idéia do tipo de relacionamento entre duas
variáveis quantitativas X e Y. Uma forma de quantificar a relação entre duas variáveis
quantitativas é através do coeficiente de correlação linear de Pearson.
Exemplo 1:
Alongamento da mola, em cm (Y): 0,5 1,0 2,0 2,5 4,0 5,0 5,3 6,2 6,8 7,2
R
XYi i i nXY
2 2
X i2 n X Yi 2 n Y
i i
106
Exemplo 2: para o exemplo anterior,
Planilha do Excel
O Excel também tem o comando que calcula diretamente a correlação linear: Correl( )
Resultados:
(1º) 1 R 1
107
(3º) se Y e X tiverem uma relação linear perfeita inversamente proporcional ( Y a bX )
então R 1
(5º)
108
Teste de hipóteses para o coeficiente de correlação
H0 : 0 contra H1 : 0
R n2
Estatística do teste : t c
1 R2
Regra de decisão: rejeita-se H 0 se t c t tab , onde P (| T | t tab ) , T ~ t (n 2) .
0,992 10 2
Exemplo 3: para o exemplo anterior, t c 22,2263 e p 1,7748 10 8 ,
2
1 (0,992)
que é altamente significante.
109
O método que usaremos para estimar os parâmetros do modelo é o dos Mínimos
Quadrados. Neste método, minimiza-se a soma dos quadrados das distâncias d i (ver
figura). Os estimadores de 0 e 1 são, respectivamente:
n
X Y
i 1
i i nXY
b1 2
, b0 Y b1 X .
n
2
i 1
X i n X
n 2
2
i 1
Yi n Y
Observação: da relação b1 R segue que b1 e R têm o mesmo
n 2
2
X
i 1
i n X
sinal.
^
O modelo ajustado ficou Y 0,326667 0,795758 X . Para x=7,5 kg, o valor estimado
para y será 5,6415 cm. Pelo EXECEL os comandos são: inclinação() e intercepção().
x
Modelo Hiperbólico: Y , x
x
exp{ x }
Modelo Logístico: Y , x R
1 exp{ x }
110